Авто Автоматизация Архитектура Астрономия Аудит Биология Бухгалтерия Военное дело Генетика География Геология Государство Дом Другое Журналистика и СМИ Изобретательство Иностранные языки Информатика Искусство История Компьютеры Кулинария Культура Лексикология Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлы и Сварка Механика Музыка Население Образование Охрана безопасности жизни Охрана Труда Педагогика Политика Право Приборостроение Программирование Производство Промышленность Психология Радио Регилия Связь Социология Спорт Стандартизация Строительство Технологии Торговля Туризм Физика Физиология Философия Финансы Химия Хозяйство Ценнообразование Черчение Экология Эконометрика Экономика Электроника Юриспунденкция

Синтаксичний аналіз без повернення назад

Читайте также:

При виводу ланцюжка ω в G на кожному кроку безпосереднього виведення коли ми беремо до уваги виділений нами нетермінал (в залежності від стратегії виведення), виникає питання, яку альтернативу для використати. З точки зору практики, нас цікавить така стратегія виведення в граматиці , коли кожний наступний крок безпосереднього виведення наближав би нас до мети. Ця стратегія дасть можливість виконати виведення в за час пропорційний , де . Зрозуміло, що не маючи інформації про структуру , досягнути вибраної нами мети в більшості випадків неможливо. Але ж тримати інформацію про весь ланцюжок також недопустимо. З точки зору практики, отримати потрібний результат розумно при наявності локальної інформації, наприклад, поточних вхідних лексем програми ( — наперед фіксоване число) достатньо для організації виведення в за час пропорційний . З точки зору синтаксичного аналізу ланцюжка мова ведеться про наступну ситуацію:

ω₁ A ω₂

ω₁ _{X Y}

Мал. 5

Зафіксуємо стратегію виводу: далі будемо розглядати лише лівосторонню стратегію виводу в . Тоді:

- ( — перший зліва направо нетермінал);

- - термінальна частина ланцюжка , яку вже виведено (проаналізована частина ланцюжка);

- результат , який потрібно ще вивести, виводиться з ланцюжка ;

- щоб зробити вірний крок виведення (без повернення назад) нам було б достатньо поточних вхідних символів з непроаналізованої частини програми .

Сформульовані нами умови забезпечує клас -граматик.

Означення. КС-граматика називається -граматикою для деякого фіксованого , якщо дія двох лівосторонніх виводів виду:

2) , для яких з випливає, що , де .

Неформально, граматика буде -граматикою, якщо для ланцюжка перших символів (за умови, що вони існують) решти непроаналізованого ланцюжка визначають, що з існує не більше однієї альтернативи виведення ланцюжка, що починається з та продовжується наступними термінальними символами.

Означення.

Сформулюємо основні твердження стосовно класу -граматик:

1) Не існує алгоритма, який перевіряє належність КС-граматики класу -граматик.

2) Існує алгоритм, який для конкретного перевіряє, чи є задана граматика -граматикою.

3) Якщо граматика є -граматикою, то вона є -граматикою, ().

4) Клас -граматик — це підклас КС-граматик, який не покриває його.

Продемонструємо на прикладі справедливість твердження 4. Розглянемо граматику з наступною схемою :

Мова, яку породжує наведена вище граматика . Візьмемо виведення наступного ланцюжка ; за означенням LL(K)-граматики , тоді маємо

Таким чином, КС-граматика не може бути -граматикою для жодного . Як результат, КС-граматика , яка має ліворекурсивний нетермінал (нетермінал називається ліворекурсивний, якщо в граматиці існує вивід виду ), не може бути -граматикою.

З практичної точки зору в більшості випадків ми будемо користуватися -граматиками. У класі -граматик існує один цікавий підклас - це розподілені -граматики.

Означення. -граматика називаються розподіленою, якщо вона задовольняю наступним умовам:

- у схемі граматики відсутні -правила (правила виду );

- для нетермінала праві частини -правила починаються різними терміналами.

Для подальшого аналізу означення -граматики розглянемо алгоритм обчислення функції .

Означення: Якщо , то , де — бінарна операція над словарними множинами (мовами):

Висновок, якщо , де , тоді

Очевидно, якщо , то при . Розглянемо алгоритм пошуку

Алгоритм. Пошук множини .

Визначимо значення функції для кожного .

П₁. для всіх .

П₂.

в інших випадках - невизначено.

П_n.

в інших випадках - невизначено.

П_m. для всіх .

Очевидно, що:

- послідовність — монотонно зростаюча;

- — послідовність, обмежена зверху.

Тоді покладемо для кожного .

Приклад: Знайти множину First_k(A_i) для нетерміналів граматики з наступною схемою правил:

S -> BA

A -> +BA | ε

B -> DC

C -> *DC | ε

D -> (S) | a

Нехай k=2.

F_n\A_i	S	A	B	C	D
F₀	--	{ ε }	--	{ ε }	{a}
F₁	--	{ ε }	{a}	{ ε, *a}	{a}
F₂	{a}	{ε, +a}	{a, a*}	{ ε, *a}	{a}
F₃	{a, a+, a*}	{ε, +a}	{a, a*}	{ ε, *a}	{a, (a}
F₄	{a, a+, a*}	{ε, +a}	{a, a*, (a}	{ ε, a, (}	{a, (a}
F₅	{a, a+, a*, (a}	{ε, +a, +(}	{a, a*, (a}	{ ε, a, (}	{a, (a}
F₆	{a, a+, a*, (a}	{ε, +a, +(}	{a, a*, (a}	{ ε, a, (}	{a, (a, ((}
F₇	{a, a+, a*, (a}	{ε, +a, +(}	{a, a*, (a, ((}	{ ε, a, (}	{a, (a, ((}
F₈	{a, a+, a*, (a, ((}	{ε, +a, +(}	{a, a*,(a, ((}	{ ε, a, (}	{a, (a, ((}
F₉	{a, a+, a*, (a, ((}	{ε, +a, +(}	{a, a*, (a, ((}	{ ε, a, (}	{a, (a, ((}

Скористаємося означенням сформулюємо необхідні й достатні умови, за яких КС-граматика буде -граматикою:

для довільного виводу в граматиці G виду та правила :

(1)

Вище сформульована умова для -граматик може бути перефразована з урахуванням визначення множини :

для довільного виводу в граматиці виду та правила :

, де (2).

Оскільки , то умова (2) є конструктивною умовою і може бути використана для перевірки, чи КС-граматика є -граматикою для фіксованого .

Означення: КС-граматика називається сильною -граматикою, якщо для А -правила виду задовольняється умова:

де визначається так:

Операції та можна узагальнити для словарної множини , тоді:

Без доведення зафіксуємо наступні твердження:

- кожна -граматика є сильною -граматикою;

- існують -граматики (k>1), які не є сильними -граматиками.

На прикладі продемонструємо останнє твердження. Нехай граматика визначена наступними правилами:

, .

Відповідні множини , , ,

Перевіримо умову для сильної -граматики:

а) виконаємо перевірку -умови для правила

б) виконаємо перевірку -умови для правила

Висновок: вище наведена граматика не є сильною -граматикою. Перевіримо цю ж граматику на властивість -граматики. Тут ми маємо два різні варіанти виводу з S:

а)

б)

Висновок: наведена вище граматика є -граматикою.

Алгоритм. Обчислення .

Для побудови алгоритму пошуку множини розглянемо наступні приклади на синтаксичному дереві, які дозволять перейти до узагальнень.Подивимося на синтаксичне дерево висоти 1 для правила S

ω₁A ω₂

Мал. 6

Тоді .

Далі розглянемо дерево висоти 2:

ω₁A_J ω₂

ω₃A ω₄

Мал. 7.

Тоді . В силу вищесказаного, будемо знаходити значення функції , тобто будемо розглядати всілякі дерева, які можна побудувати, починаючи з аксіоми .

П₀. . Очевидно, за 0 кроків ми виведемо S, після якої знаходиться . У інших випадках — невизначено .

П₁. . В інших випадках — невизначено.

….

П_n . В інших випадках — невизначено.

….

Настане крок П_m, коли , .

Тоді покладемо для кожного .

Очевидно, що:

- послідовність монотонно зростаюча;

- послідовність обмежена зверху.

До того, як перевірити граматику на -властивість необхідно перевірити її на наявність ліворекурсивних нетерміналів та спробувати уникнути лівої рекурсії.

Означення: Нетермінал КС-граматики називається -нетерміналом, якщо .

Алгоритм. Пошук -нетерміналів:

….

…. П_n

Тоді множина — множина -нетерміналів.

Приклад. Для граматики G з схемою правил Р знайдемо множину -нетерміналів:

Таким чином, множина -нетерміналів для наведеної вище граматики -

Алгоритм. Тестування нетермінала на ліву рекурсію. Для кожного нетермінала А_i побудуємо наступну послідовність множин S₀, S₁, ….

, починаємо з нетерміналу А_i.

….

Тоді якщо , то — ліворекурсивний нетермінал.

Приклад. Для граматики G з схемою правил Р знайдемо множину ліворекурсивних нетерміналів:

1. Виконаємо процедуру тестування для кожного нетермінала окремо:

- наприклад, для нетермінала S:

Запропонуємо декілька прийомів, що дають можливість при побудові граматик уникнути лівої рекурсії. Розглянемо граматику зі схемою правил , яка має ліворекурсивний нетермінал . Замінимо схему правил новою схемою з трьома правилами

Приклад: Для граматики G з схемою правил Р для кожного нетермінала знайдемо множину (k =1):

S -> BA

A -> +BA | ε

B -> DC

C -> *DC | ε

D -> (S) | a

З прикладу, що наведено раніше множини First₁(A),будуть такими:

First₁(S)= First₁(B)= First₁(D)={(,a}, First₁(A)={+, ε }, First₁(C)={*, ε }.

δ_n\A_i	S	A	B	C	D
δ₀	{ ε }	--	--	--	--
δ₁	{ ε }	{ ε }	{+, ε }	--	--
δ₂	{ ε }	{ε}	{+, ε }	{+, ε }
δ₃	{ ε }	{ε}	{+, ε }	{+, ε }	{*, +, ε }
δ₄	{ ε,) }	{ε}	{+, ε }	{+, ε }	{*, +, ε }
δ₅	{ ε,) }	{ε,)}	{+, ε }	{+, ε,)}	{*, +, ε }
δ₆	{ ε,) }	{ε,)}	{+, ε,)}	{+, ε }	{*, +, ε,)}
δ₇	{ ε,) }	{ε,)}	{+, ε,)}	{+, ε,)}	{*, +, ε,)}

Таким чином, Follow₁(S) = { ε,) }, Follow₁(A) = {ε,)}, Follow₁(B) = {+, ε,)}, Follow₁(C) = {+, ε,)}, Follow₁(D) = {*, +, ε,)}.

3.3. Синтаксичний аналіз на основі -граматик

Скориставшись означенням -граматики, сформулюємо умови для -граматики: граматика буде -граматикою тоді і тільки тоді, коли кожного А-правила виду

- якщо

Означення. Таблиця управління LL(1)-синтаксичним аналізатором визначається таким чином:

1. — це номер правила виду такого, що

2. — "виштовхнути" для всіх

3. — "допустити"

4. в інших випадках — невизначено.

Побудуємо таблицю управління для наступної граматики:

	(1)
	(2)
	(3)
	(4)
	(5)
	(6)
	(7)
	(8)

Знайдемо множини .

Правило	Номер правила
	(1)
	(2)
	(3)
	(4)
	(5)
	(6)
	(7)
	(8)

При побудові таблиці управління -синтаксичним аналізатором достатньо лише побудувати першу її частину, тобто , оскільки "діагональ" таблиці та визначаються стандартно.

A_i\Σ	a	(	)	+	*
S
A
B
C
D

Алгоритм. Побудова - синтаксичного аналізатора на основі таблиці управління :

П₀ Прочитаємо поточну лексему з вхідного файла, у стек магазинного автомата занесемо аксіому S.

….

П_i - Якщо на вершині стека знаходиться нетермінал , то активізувати рядок таблиці, позначений . Елемент визначає номер правила, права частина якого заміняє на вершині стека.

- Якщо на вершині стека лексема , то з вершини стека зняти та прочитати нову поточну лексему.

- Якщо стек порожній та досягли кінця вхідного файла, то вхідна програма синтаксично вірна.

- В інших випадках — синтаксична помилка.

У деяких випадках досить складно (а інколи й принципово неможливо побудувати -граматику для реальної мови програмування. При цьому -властивість задовольняється майже для всіх правил - лише декілька правил створюють конфлікт, але для цих правил задовольняється сильна -властивість. Тоді таблиця визначається в такий спосіб:

- виду , такого, що

- за умови, що

Програма, яка виконує додатковий аналіз вхідного ланцюжка, повинна:

- прочитати додатково одну лексему;

- на основі двох вхідних лексем вибрати необхідне правило або сигналізувати про синтаксичну помилку;

- у випадку, коли правило вибрано, необхідно повернути додатково прочитану лексему у вхідний файл.

Звичайно, необхідно модифікувати алгоритм LL(1)-синтаксичного аналізатора. При цьому підпрограма аналізу конфліктної ситуації повинна додатково прочитати нову вхідну лексему, далі скориставшись контекстом з двох лексем, визначити номер правила, яке замість нетермінала на вершині стека та повернути додатково прочитану лексему у вхідний файл.

1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 |

Поиск по сайту:

Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.505 сек.)

Главная | О проекте | Полезные cсылки | Контакты | Случайная страница