Авто Автоматизация Архитектура Астрономия Аудит Биология Бухгалтерия Военное дело Генетика География Геология Государство Дом Другое Журналистика и СМИ Изобретательство Иностранные языки Информатика Искусство История Компьютеры Кулинария Культура Лексикология Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлы и Сварка Механика Музыка Население Образование Охрана безопасности жизни Охрана Труда Педагогика Политика Право Приборостроение Программирование Производство Промышленность Психология Радио Регилия Связь Социология Спорт Стандартизация Строительство Технологии Торговля Туризм Физика Физиология Философия Финансы Химия Хозяйство Ценнообразование Черчение Экология Эконометрика Экономика Электроника Юриспунденкция

Прочитайте текст. Визначіть його стиль, основні ідеї, випишіть ключові слова

Читайте также:

Сучасна лексикографія дедалі частіше користується машинними базами даних, зокрема великими корпусами текстів, у яких комп’ютер за запитом знаходить потрібні слова. На цій підставі виформовується сучасний напрям прикладної лінгвістики – корпусна лексикографія, що потлумачено як нову галузь вивчення мови на основі корпусів із постійним використанням комп'ютера для аналізу, зберігання й обробки наявних даних. Провідні закордонні друкарські доми, як Longman, Cambridge, Chambers, Oxford, перевидали свої словники на корпусній основі, відтворивши електронні версії багатьох друкованих видань. Корпусній лексикографії в останні десятиліття приділено чималу увагу (А. С. Герд, С. Гринбаум, Х. Кучера, Дж. Ліч, Ч. Мейєр, Дж. Свартвік), про що свідчить і значна кількість укладених корпусів. Одним із перших електронних корпусів вважають Брауновський корпус (Brown Corpus) Нельсона Френсіса та Хенрі Кучера, що побачив світ у 1962 році. Праця складає корпус друкованих текстів американського варіанта англійської мови й охоплює близько 1 мільйона слів [48]. Згодом у різних країнах світу активно почали виникати електронні корпуси, наприклад: Чеський народний корпус (Cesky Narodni Corpus), Польський народний корпус (Polski Korpus Narodowy), Британський національний корпус (British National Corpus), що містять уривки з періодики, академічних видань, популярної літератури. Гельсінський корпус англійських діахронних і діалектних текстів (Helsinki Corpus), що складався з уривків текстів з 750-го року по 1700 р. та діалектних сільських говірок з 1970 року; Корпус природних (непідготовлених) діалогів шотландського варіанта англійської мови (Map Task), обсягом 147 мільйонів слів; Корпус розмовної болгарської мови (Корпус от разговорен български език), що містить тексти спонтанного мовлення, записані на електронні носії обсягом у 50 годин; Англійсько-Норвезький паралельний корпус, що охоплює 100 оригінальних текстів англійською мовою та таку ж кількість перекладених текстів норвезькою мовою, обсягом 2 600 000 слів [48].

Подібна практика в Україні перебуває поки що на початковому етапі розвитку. На сьогодні Українським мовно-інформаційним фондом НАН України укладено Український національний лінгвістичний корпус [179], обсягом 36 000 000 слововживань, почерпнутих із текстів різних стилів та жанрів, та в тестовому режимі працює Корпус текстів української мови, що відображає тексти художньої літератури від часів Івана Котляревського до сьогодення. Лексикографами відділу лексикології та комп’ютерної лексикографії Інституту української мови НАН України ведеться робота над створенням Національного корпусу української мови з обсягом приблизно 2 500 000 слів. Працівники лабораторії комп’ютерної лінгвістики Київського національного лінгвістичного університету укладають Паралельний англо-український корпус текстів офіційного стилю, загальним обсягом понад 500 000 слововживань; Корпус текстів з комп’ютерної лінгвістики, обсягом понад 400 000 слововживань. В останньому корпусі використовуватиметься стандартний набір програм морфологічного кодування, здійснюватиметься пошук за словоформою, граматичним кодом тощо. Розпочато роботу над створенням Корпусу українсько-англійської мови, як складової Міжнародного Корпусу Студентської Англійської (International Corpus of Learner English), що складають підкорпуси 19 різних країн, серед яких українсько-англійської, на жаль, допоки не має.

Як бачимо, сучасна лексикографія переживає новий етап свого розвитку. Завдяки розробці комп’ютерних, комунікаційних і мультимедійних технологій стало можливим створення лексикографічних джерел нового покоління, що ґрунтуються на специфічних прийомах машинної обробки мовного матеріалу (зокрема і на корпусній основі) з широким застосуванням електронного формату і залученням мультимедійних засобів презентації лексикографічної продукції (А.Надолинська).

1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 |

Поиск по сайту:

Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.154 сек.)

Главная | О проекте | Полезные cсылки | Контакты | Случайная страница