|
|||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Сравнение различных типов СМП
Рассмотрим кратко преимущества и недостатки существующих систем. Системы пословного перевода на данный момент используются только для составления подстрочечника, как отмечалось ранее. Преимущества: · простота; · высокая скорость работы; · не требовательные к ресурсам. Недостатки: низкое качество перевода. Ярких представителей на рынке нет, в данном случае удобнее создавать новую систему под конкретную задачу. Трансфертные системыраспространены очень широко. Наиболее известными представителями являются: · ImTranslator; · PROMPT. Все подобные системы имеют сходные преимущества и недостатки. Преимущества: · высокое качество перевода (при наличие нужных словарей и правил); · обычно есть выбор тематики текста, который повышает качество перевода; · возможно уточнение перевода, благодаря внесению изменений в базу данных переводчика (таким образом, пользователь получает потенциально бесконечное множество терминов, с которыми можно свободно оперировать, и можно достигнуть «бесконечного» качества перевода). Недостатки: · высокая стоимость и время разработки; · для добавления нового языка, приходиться переделывать систему заново; · нужна команда квалифицированных лингвистов, для описания каждого исходного и каждого переводного языка. · требовательность к ресурсам на этапе составления базы. Интерлингвистические системы перевода так и не были доведены до уровня промышленных систем. Предполагаемые преимущества: · высокое качество перевода, независимо от выбора языка. · выделение смысла из исходного текста происходит один раз и потом записывается на любой язык, в том числе исходный (получаем «пересказ текста»); · низкая стоимость трудозатрат на добавления нового языка в систему. Недостатки: · спорность потенциальной возможности; · высокая сложность разработки; Количество труда, которое требуется для повышения качества перевода на какой-то процент, увеличивается с тем, какой этот процент по порядку. [13]. · системы не масштабируются. Модель интерлингвистического привела к тому, что в России стала делаться система машинного перевода ЭТАП, на которую было затрачено огромное количество времени и сил, без какого-либо видимого результата. В компании Abbyy, в течение десяти лет, под руководством В. П. Селегея, тоже пытаются создать интерлингвистическую систему. Можно еще упомянуть проект ДИАЛИНГ. Результатом проекта стала только библиотеки машинной морфологии русского языка (сайт aot.ru). СМП, основанные на примерах, так же не имеют ярких представителей. Существующие прототипы используются в академической среде для иллюстрации самого метода. Часто они поставляются не в виде готового продукта, а в виде набора библиотек: · Marclator – СМП Дублинского Университета; · Cunei‑ гибридная СМП, основанная на переводе по аналогии и на статистическом переводе. Рассмотрим преимущества и недостатки таких систем: Преимущества: · высокое качество перевода (при наличие достаточно долгой тренировке системы); · хорошо справляется со многими контекстными задачами (фразовые глаголы); · квалифицированные лингвисты не нужны непосредственно для построения системы, нужны только инженеры; · логическая простота устройства; · возможно обучение системы во время ее эксплуатации. Недостатки: · для обучения системы нужны большие параллельные корпуса текста, размеченные определенным образом. · перевод сильно зависит от корпусов, которые использовались при обучении; · для создания подобных систем требуются специализированные языки программирования; · продолжительное время обучения; · требовательность к ресурсам на этапе обучения. Статистические системы машинного перевода активно разрабатывались (и разрабатываются) компанией IBM. Благодаря ее разработкам, были созданы модели перевода IBM Model 1-5.Но наибольшую известность этот метод приобрел благодаря компании Google. Кроме переводчика Google существует еще ряд систем и библиотек, использующих статистический подход: · Giza++; · Moses; · Pharaoh; · Rewrite; · BLEU scoring tool. Не очень давно появился статистический переводчик для Яндекса, правда пока он владеет только русским, английским и украинским. Преимущества: · высокое качество перевода (для фраз, которые целиком помещаются в n-граммную модель): § при наличие достаточно долгой тренировке системы. § при наличие качественных корпусов текста; · квалифицированные лингвисты не нужны непосредственно для построения системы, нужны только инженеры; · труд человека минимизирован для создания таких систем; · не требуется перестраивать систему при добавлении нового языка; · возможно обучение системы во время ее эксплуатации. Недостатки: · для обучения нужны большие параллельные корпуса текста; · сложный математический аппарат; · качественный перевод возможен только для фраз, которые целиком помещаются в n-граммную модель; · перевод сильно зависит от корпусов, которые использовались при обучении. · при добавлении нового языка приходится анализировать большое количество параллельных корпусов; · продолжительное время обучения; · требовательность к ресурсам на этапе обучения. Преимущества и недостатки СМП, основанных на примерах и статистических СМП, во многом совпадают. Однако огромным преимуществом последних является то, что обучение таких систем происходит без участия человека. Для статистического перевода не нужна дополнительная разметка корпусов текста, это значительно упрощает их построение. С другой стороны для качественного обучения и тех и других нужны значительные объемы параллельных текстов. Потому часто переводчики являются дополнительными сервисами поисковых систем (Google, Яндекс). На данный момент, статистические системы являются лидерами по соотношению цена / качество для всех СМП.
Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.005 сек.) |