Авто Автоматизация Архитектура Астрономия Аудит Биология Бухгалтерия Военное дело Генетика География Геология Государство Дом Другое Журналистика и СМИ Изобретательство Иностранные языки Информатика Искусство История Компьютеры Кулинария Культура Лексикология Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлы и Сварка Механика Музыка Население Образование Охрана безопасности жизни Охрана Труда Педагогика Политика Право Приборостроение Программирование Производство Промышленность Психология Радио Регилия Связь Социология Спорт Стандартизация Строительство Технологии Торговля Туризм Физика Физиология Философия Финансы Химия Хозяйство Ценнообразование Черчение Экология Эконометрика Экономика Электроника Юриспунденкция

Теория формальных грамматик

Читайте также:

Другой раздел М. л., занимающий в ней центральное место, — теория формальных грамматик, начало которой было положено работами Ноама Хомского. Она изучает способы описания закономерностей, характеризующих уже не отдельный текст, а всю совокупность правильных текстов того или иного языка. Эти закономерности описываются с помощью формальной грамматики — абстрактного «механизма», позволяющего с помощью единообразной процедуры получать правильные тексты данного языка вместе с описаниями их структуры. Наиболее широко используемый тип формальной грамматики — порождающая грамматика, или грамматика Хомского, представляющая собой упорядоченную систему Г = ⟨ V, W, П, R ⟩, где V и W — непересекающиеся конечные множества, называемые соответственно основным, или терминальным, и вспомогательным, или нетерминальным, алфавитами (их элементы называются соответственно основными, или терминальными, и вспомогательными, или нетерминальными, символами), П — элемент W, называемый начальным символом, и R — конечное множество правил вида φ → ψ, где φ и ψ — цепочки (конечные последовательности) из основных и вспомогательных символов. Если φ → ψ — правило грамматики Г и ω1, ω2 — цепочки из основных и вспомогательных символов, говорят, что цепочка ω1ψω2 непосредственно выводима в Г из ω1φω2. Если ξ0, ξ1,..., ξn — цепочки и для каждого i = 1,..., n цепочка ξi непосредственно выводима из ξi−1, говорят, что ξn выводима в Г из ξ0. Множество тех цепочек из основных символов, которые выводимы в Г из её начального символа, называется языком, порождаемым грамматикой Г, и обозначается L(Г). Если все правила Г имеют вид η1Aη2 → η1ωη2, то Г называется грамматикой составляющих (или непосредственно составляющих), сокращённо НС-грамматикой; если при этом в каждом правиле цепочки η1 и η2 (правый и левый контексты) пусты, то грамматика называется бесконтекстной (или контекстно-свободной), сокращённо Б-грамматикой (или КС-грамматикой). В наиболее обычной лингвистической интерпретации основные символы представляют собой слова, вспомогательные — символы грамматических категорий, начальный символ — символ категории «предложение»; при этом язык, порождаемый грамматикой, интерпретируется как множество всех грамматически правильных предложений данного естественного языка. В НС-грамматике вывод предложения даёт для неё дерево составляющих, в котором каждая составляющая состоит из слов, «происходящих» от одного вспомогательного символа, так что для каждой составляющей указывается её грамматическая категория. Так, если грамматика имеет, в числе прочих, правила П → Sx, y, им, Vy → ViyO, O → Sx, y, предл, Viy → сидит, Sмуж, ед., им → на, ямщик, Sмуж, ед., предл. → облучке, то предложение «Ямщик сидит на облучке» имеет вывод, показанный на рис. 5, где стрелки идут от левых частей применяемых правил к элементам правых частей. Система составляющих, отвечающая этому выводу, совпадает с изображенной на рис. 1. Возможны и другие интерпретации: например, основные символы могут интерпретироваться как морфы, вспомогательные — как символы типов морф и допустимых цепочек морф, начальный символ — как символ типа «словоформа», а язык, порождаемый грамматикой, — как множество правильных словоформ (морфологическая интерпретация); употребительны также морфонологическая и фонологическая интерпретации. В реальных описаниях языков используются обычно «многоуровневые» грамматики, которые содержат последовательно работающие синтаксические, морфологические и морфонологически-фонологические правила.

Рис. 5

Другой важный тип формальной грамматики — доминационная грамматика, которая порождает множество цепочек, интерпретируемых обычно как предложения вместе с их синтаксическими структурами в виде деревьев подчинения. Грамматика синтаксических групп порождает множество предложений вместе с их синтаксическими структурами, имеющими вид систем синтаксических групп. Имеются также различные концепции трансформационной грамматики (грамматики деревьев), служащей не для порождения предложений, а для преобразования деревьев, интерпретируемых как деревья подчинения или деревья составляющих. Примером может служить Δ-грамматика — система правил преобразования деревьев, интерпретируемых как «чистые» деревья подчинения предложений, т. е. деревья подчинения без линейного порядка слов.

Особняком стоят грамматики Монтегю, служащие для одновременного описания синтаксических и семантических структур предложения; в них используется сложный математико-логический аппарат (так называемая интенсиональная логика*). Формальные грамматики находят применение для описания не только естественных, но и искусственных языков, в особенности языков программирования.

В М. л. разрабатываются также аналитические модели языка, в которых на основе тех или иных данных о речи, считающихся известными, производятся формальные построения, результатом которых является описание некоторых аспектов строения языка. В этих моделях обычно используется несложный математический аппарат — простые понятия теории множеств и алгебры; поэтому аналитические модели языка иногда называют теоретико-множественными. В аналитических моделях наиболее простого типа исходными данными служат множество правильных предложений и система окрестностей — совокупностей «слов», принадлежащих одной лексеме (например, {дом, до́ма, дому, домом, доме, дома́, домов, домам, домами, домах}). Простейшим производным понятием в таких моделях является замещаемость: слово a замещаемо на слово b, если всякое правильное предложение, содержащее вхождение слова a, остается правильным при замене этого вхождения вхождением слова b. Если а замещаемо на b и b на a, говорят, что a и b взаимозамещаемы. (Например, в русском языке слово «синий» замещаемо на слово «голубой»; слова «синего» и «голубого» взаимозамещаемы.) Класс слов, взаимозамещаемых между собой, называется семейством. Исходя из окрестностей и семейств, можно получить ряд других лингвистически значимых классификаций слов, одна из которых приблизительно соответствует традиционной системе частей речи. В другом типе аналитических моделей вместо множества правильных предложений используется отношение потенциального подчинения между словами, означающее способность одного из них подчинять себе другое в правильных предложениях. В таких моделях можно получить, в частности, формальные определения ряда традиционных грамматических категорий — например, формальное определение падежа существительного, представляющее собой процедуру, которая позволяет восстановить падежную систему языка, зная только отношение потенциального подчинения, систему окрестностей и множество слов, являющихся формами существительных.

В аналитических моделях языка используются простые понятия теории множеств и алгебры. К аналитическим моделям языка близки дешифровочные модели — процедуры, позволяющие по достаточно большому корпусу текстов на неизвестном языке без каких-либо предварительных сведений о нём получить ряд данных о его структуре.

По своему назначению М. л. является прежде всего инструментом теоретического языкознания. Повторюсь, её методы находят широкое применение в прикладных лингвистических исследованиях — автоматической обработке текста, автоматическом переводе и разработках, связанных с так называемым общением между человеком и компьютером.

_·_{ИНТЕНСИОНАЛЬНАЯ ЛОГИКА – область неклассических логик, в которой используется понятие смысла языкового выражения в целях анализа широкого класса контекстов естественного языка.}

1 | 2 | 3 | 4 | 5 |

Поиск по сайту:

Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.75 сек.)

Главная | О проекте | Полезные cсылки | Контакты | Случайная страница