|
|||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Корпус як асаблівы лінгвістычны рэсурс. Структура корпусаКОРПУСНАЯ ЛІНГВІСТЫКА
Корпусная лінгвістыка – раздзел камп’ютарнай лінгвістыкі, які займаецца распрацоўкай агульных прынцыпаў будавання і выкарыстання лінгвістычных корпусаў (корпусаў тэкстаў) з выкарыстаннем камп’ютарных тэхналогій. Сёння корпусную лінгвістыку разумеюць як адносна новы падыход да лінгвістыкі, які мае справу з вывучэннем мовы ў рэальным жыцці з дапамогай камп’ютараў. Галоўная мэта корпуснай лінгвістыкі – лінгвістычнае апісанне моўнай сістэмы, а таксама адлюстраванне моўнага матэрыялу ў выглядзе корпуса тэкстаў, які ў сваю чаргу можа выкарыстоўвацца іншымі лінгвістычнымі дысцыплінамі. Прадметам корпуснай лінгвістыкі з’яўляюцца тэарэтычныя асновы і практычныя механізмы стварэння і выкарыстання вялікіх масіваў моўных дадзеных, якія прадназначаны для лінгвістычных даследаванняў шырокага кола карыстальнікаў. Аб’ектам даследавання з’яўляюцца корпусы тэкстаў, якія ўяўляюць сабой зыходны матэрыял для корпуснай лінгвістыкі. Задачы корпуснай лінгвістыкі: 1. Стварэнне корпусаў і правядзенне лінгвістычных даследаванняў на іх базе. 2. Аб’ектыўнае лінгвістычнае апісанне моўнай сістэмы. Пад назвай лінгвістычны, ці моўны, корпус тэкстаў разумеецца вялікі, прадстаўлены ў электронным выглядзе, уніфікаваны, структураваны, размечаны, філалагічна кампетэнтны масіў моўных дадзеных, які выкарыстоўваецца для рашэння канкрэтных лінгвістычных задач. У наш час існуе вялікая колькасць азначэнняў паняцця “корпус”. Корпус – гэта рэпрэзентатаўны збор тэкстаў, звычайна ў машынначытаемым фармаце, які ўключае інфармацыю аб сітуацыі, у якой тэкст быў створаны (такую, як інфармацыя аб аўтары, адрасаце або аўдыторыі). Корпус – гэта вялікі, структураваны набор тэкстаў (звычайна ў электронным выглядзе), які выкарыстоўваецца для статыстычнага аналізу і праверкі гіпотэз, а таксама праверкі выпадкаў сустракаемасці або абаснавання моўных правіл па пэўным абласцям (Вікіпедыя). Т. Макэнеры Э.Вільсан даюць наступнае азначэнне: корпус – гэта збор языкавых фрагментаў, атабраных у адпаведнасці з дакладнымі моўнымі крытэрыямі для выкарыстання ў якасці мадэлі мовы. В.В.Рыкаў вызначае корпус тэкстаў як нейкі збор тэкстаў, у аснове якога ляжыць лагічная задума, лагічная ідэя, якая аб’ядноўвае гэтыя тэксты і ўвасобленая ў правілах арганізацыі тэкстаў у корпус, алгарытме і праграме аналіза корпуса тэкстаў. У прыведзеных азначэннях падкрэсліваюцца асноўныя рысы сучанага корпуса тэкстаў – мэта (лагічная ідэя), машынначытаемы фармат, рэпрэзентаціўнасць як вынік асобай працэдуры адбору, наяўнасць металінгвістычнай інфармацыі. Стандартызаванае прадстаўленне слоўнага матэрыялу на машынным носьбіце дазвале прымяняць стандартныя праграмы яго апрацоўкі. Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.003 сек.) |