АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Автоматическое порождение письменного текста: определение, этапы, общая структура системы порождения

Читайте также:
  1. B) социально-стратификационная структура
  2. Data Mining и Business Intelligence. Многомерные представления Data Mining. Data Mining: общая классификация. Функциональные возможности Data Mining.
  3. I. Формирование системы военной психологии в России.
  4. II. Органы и системы эмбриона: нервная система и сердце
  5. II. Цель и задачи государственной политики в области развития инновационной системы
  6. II. Экономические институты и системы
  7. III. Мочевая и половая системы
  8. III. Органы и системы эмбриона: пищеварительная система
  9. III. СТРУКТУРА И ОРГАНЫ УПРАВЛЕНИЯ ПРИХОДА
  10. III.2. Преступление: общая характеристика
  11. IV. Механизмы и основные меры реализации государственной политики в области развития инновационной системы
  12. IV. Органы и системы эмбриона: дыхательная и др. системы

Порождение связного текста с помощью компьютера. Установлено, что процесс текстообразования состоит из двух этапов: стратегическую (должно быть принято решение о том «что написать») и тактического (должно быть принято решение о том «как написать»). Результатом выполнения первого этапа должно стать смысловое представление будущего текста. Результатом выполнения второго этапа должен стать собственно сам текст в языковой форме. Исследователи разных стран пришли к выводу, что в системе автоматического порождения текста должны быть представлены три взаимосвязанных компонента:

1. Оболочка;

2. Планировщик;

3. Лингвистический реализатор.

Оболочка, прежде всего, определяет назначение порождающей системы. Это может быть обучающая компьютерная система, генерирующая комментарии компьютера в виде текста; экспертная система, отвечающая на запрос пользователя связным текстом; система моделирующая процесс создания текста - описания какого-либо объекта, текста - определения какого-либо понятия, текста стихотворения, рассказа и т. д.

В оболочке содержится вся база знаний. Она состоит из двух частей: предметной, в которую входят понятия, связи и отношения между понятиями конкретной предметной области, к которой будет относиться порождаемый текст, и лингвистической, которая включает формализованные сведения о конкретном языке на котором генерируется текст (списки морфем, словарь с необходимой лексикой, синтаксические структуры предложений и т. п.).

Планировщик выполняет следующие функции: 1- определяет ту информацию, которая должна быть представлена в тексте, и ту, которую можно опустить; 2- определяет, как эта информация должна быть представлена 3- определяет порядок следования абзацев в тексте; 4-устанавливает порядок следования синтаксических составляющих в пределах абзаца и всего текста; 5- осуществляет языковое оформление взаимосвязи предложений в абзаце и абзацев в тексте;6 -осуществляет построение синтаксической структуры предложений будущего текста; 7- осуществляет выбор соответствующей лексики.

Все эти задачи планировщик решает с опорой на оболочку и, в частности, на базу знаний (ее очень тщательно разрабатывают специалисты). Лингвистический реализатор обеспечивает грамматическую правильность порождаемого текста и принимает все окончательные синтаксические и морфологические решения (подтверждение или отрицание выбора синтаксического типа предложения и

его структуры, подтверждение или отрицание выбора конкретных основ и афиксов/окончаний или словоформ и т. д.).

 


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.002 сек.)