АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Теория формальных грамматик

Читайте также:
  1. I. Классическая теория.
  2. II. Квантовая теория А. Эйнштейна.
  3. III. Теория П. Дебая.
  4. Анализ спроса и предложения( теория спроса и предложения)
  5. Аспект «Грамматика»
  6. Ассоциативно-рефлекторная теория обучения
  7. Атомно-молекулярная теория.
  8. Безопасность и теория риска
  9. Вопрос 3. Эволюционная теория Ч.Дарвина
  10. Вопрос 4. Трудовая теория Ф.Энгельса
  11. Вопрос о значении падежа имени существительного. Система падежных значений по «Русской грамматике» 1980 г.
  12. Воспроизводство вирусов, теория мемов и психогенетика.

 

Другой раздел М. л., занимающий в ней центральное место, — теория формальных грамматик, начало которой было положено работами Ноама Хомского. Она изучает способы описания закономерностей, характеризующих уже не отдельный текст, а всю совокупность правильных текстов того или иного языка. Эти закономерности описываются с помощью формальной грамматики — абстрактного «механизма», позволяющего с помощью единообразной процедуры получать правильные тексты данного языка вместе с описаниями их структуры. Наиболее широко используемый тип формальной грамматики — порождающая грамматика, или грамматика Хомского, представляющая собой упорядоченную систему Г = ⟨ V, W, П, R ⟩, где V и W — непересекающиеся конечные множества, называемые соответственно основным, или терминальным, и вспомогательным, или нетерминальным, алфавитами (их элементы называются соответственно основными, или терминальными, и вспомогательными, или нетерминальными, символами), П — элемент W, называемый начальным символом, и R — конечное множество правил вида φ → ψ, где φ и ψ — цепочки (конечные последовательности) из основных и вспомогательных символов. Если φ → ψ — правило грамматики Г и ω1, ω2 — цепочки из основных и вспомогательных символов, говорят, что цепочка ω1ψω2 непосредственно выводима в Г из ω1φω2. Если ξ0, ξ1,..., ξn — цепочки и для каждого i = 1,..., n цепочка ξi непосредственно выводима из ξi−1, говорят, что ξn выводима в Г из ξ0. Множество тех цепочек из основных символов, которые выводимы в Г из её начального символа, называется языком, порождаемым грамматикой Г, и обозначается L(Г). Если все правила Г имеют вид η1Aη2 → η1ωη2, то Г называется грамматикой составляющих (или непосредственно составляющих), сокращённо НС-грамматикой; если при этом в каждом правиле цепочки η1 и η2 (правый и левый контексты) пусты, то грамматика называется бесконтекстной (или контекстно-свободной), сокращённо Б-грамматикой (или КС-грамматикой). В наиболее обычной лингвистической интерпретации основные символы представляют собой слова, вспомогательные — символы грамматических категорий, начальный символ — символ категории «предложение»; при этом язык, порождаемый грамматикой, интерпретируется как множество всех грамматически правильных предложений данного естественного языка. В НС-грамматике вывод предложения даёт для неё дерево составляющих, в котором каждая составляющая состоит из слов, «происходящих» от одного вспомогательного символа, так что для каждой составляющей указывается её грамматическая категория. Так, если грамматика имеет, в числе прочих, правила П → Sx, y, им, Vy → ViyO, O → Sx, y, предл, Viy → сидит, Sмуж, ед., им → на, ямщик, Sмуж, ед., предл. → облучке, то предложение «Ямщик сидит на облучке» имеет вывод, показанный на рис. 5, где стрелки идут от левых частей применяемых правил к элементам правых частей. Система составляющих, отвечающая этому выводу, совпадает с изображенной на рис. 1. Возможны и другие интерпретации: например, основные символы могут интерпретироваться как морфы, вспомогательные — как символы типов морф и допустимых цепочек морф, начальный символ — как символ типа «словоформа», а язык, порождаемый грамматикой, — как множество правильных словоформ (морфологическая интерпретация); употребительны также морфонологическая и фонологическая интерпретации. В реальных описаниях языков используются обычно «многоуровневые» грамматики, которые содержат последовательно работающие синтаксические, морфологические и морфонологически-фонологические правила.

 

Рис. 5

 

Другой важный тип формальной грамматики — доминационная грамматика, которая порождает множество цепочек, интерпретируемых обычно как предложения вместе с их синтаксическими структурами в виде деревьев подчинения. Грамматика синтаксических групп порождает множество предложений вместе с их синтаксическими структурами, имеющими вид систем синтаксических групп. Имеются также различные концепции трансформационной грамматики (грамматики деревьев), служащей не для порождения предложений, а для преобразования деревьев, интерпретируемых как деревья подчинения или деревья составляющих. Примером может служить Δ-грамматика — система правил преобразования деревьев, интерпретируемых как «чистые» деревья подчинения предложений, т. е. деревья подчинения без линейного порядка слов.

Особняком стоят грамматики Монтегю, служащие для одновременного описания синтаксических и семантических структур предложения; в них используется сложный математико-логический аппарат (так называемая интенсиональная логика*). Формальные грамматики находят применение для описания не только естественных, но и искусственных языков, в особенности языков программирования.

В М. л. разрабатываются также аналитические модели языка, в которых на основе тех или иных данных о речи, считающихся известными, производятся формальные построения, результатом которых является описание некоторых аспектов строения языка. В этих моделях обычно используется несложный математический аппарат — простые понятия теории множеств и алгебры; поэтому аналитические модели языка иногда называют теоретико-множественными. В аналитических моделях наиболее простого типа исходными данными служат множество правильных предложений и система окрестностей — совокупностей «слов», принадлежащих одной лексеме (например, {дом, до́ма, дому, домом, доме, дома́, домов, домам, домами, домах}). Простейшим производным понятием в таких моделях является замещаемость: слово a замещаемо на слово b, если всякое правильное предложение, содержащее вхождение слова a, остается правильным при замене этого вхождения вхождением слова b. Если а замещаемо на b и b на a, говорят, что a и b взаимозамещаемы. (Например, в русском языке слово «синий» замещаемо на слово «голубой»; слова «синего» и «голубого» взаимозамещаемы.) Класс слов, взаимозамещаемых между собой, называется семейством. Исходя из окрестностей и семейств, можно получить ряд других лингвистически значимых классификаций слов, одна из которых приблизительно соответствует традиционной системе частей речи. В другом типе аналитических моделей вместо множества правильных предложений используется отношение потенциального подчинения между словами, означающее способность одного из них подчинять себе другое в правильных предложениях. В таких моделях можно получить, в частности, формальные определения ряда традиционных грамматических категорий — например, формальное определение падежа существительного, представляющее собой процедуру, которая позволяет восстановить падежную систему языка, зная только отношение потенциального подчинения, систему окрестностей и множество слов, являющихся формами существительных.

В аналитических моделях языка используются простые понятия теории множеств и алгебры. К аналитическим моделям языка близки дешифровочные модели — процедуры, позволяющие по достаточно большому корпусу текстов на неизвестном языке без каких-либо предварительных сведений о нём получить ряд данных о его структуре.

По своему назначению М. л. является прежде всего инструментом теоретического языкознания. Повторюсь, её методы находят широкое применение в прикладных лингвистических исследованиях — автоматической обработке текста, автоматическом переводе и разработках, связанных с так называемым общением между человеком и компьютером.

 

· ИНТЕНСИОНАЛЬНАЯ ЛОГИКА – область неклассических логик, в которой используется понятие смысла языкового выражения в целях анализа широкого класса контекстов естественного языка.

 


1 | 2 | 3 | 4 | 5 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.003 сек.)