АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Корпус як асаблівы лінгвістычны рэсурс. Структура корпуса

Читайте также:
  1. II. СТРУКТУРА КВАЛИФИКАЦИОННОЙ РАБОТЫ
  2. III. СТРУКТУРА И ПОРЯДОК ФОРМИРОВАНИЯ СТУДЕНЧЕСКОГО СОВЕТА
  3. III. Структура Клуба
  4. III. СТРУКТУРА, РУКОВОДЯЩИЕ И КОНТРОЛЬНЫЕ ОРГАНЫ КПРФ
  5. IV. ОРГАНИЗАЦИОННАЯ СТРУКТУРА ПРОФСОЮЗА
  6. IY. ОРГАНИЗАЦИОННАЯ СТРУКТУРА И ОРГАНЫ УПРАВЛЕНИЯ КЛУБА
  7. VI. ОРГАНИЗАЦИОННАЯ СТРУКТУРА ПАРТИИ.
  8. А) структура текстів драм
  9. АВТОМАТИЗАЦІЯ ОДНОКОРПУСНІ ВИПАРНІ УСТАНОВКИ
  10. Активные операции коммерческих банков, их структура.
  11. Атомная структура материи
  12. Б корпусынa кіру

КОРПУСНАЯ ЛІНГВІСТЫКА

 

Корпусная лінгвістыка – раздзел камп’ютарнай лінгвістыкі, які займаецца распрацоўкай агульных прынцыпаў будавання і выкарыстання лінгвістычных корпусаў (корпусаў тэкстаў) з выкарыстаннем камп’ютарных тэхналогій.

Сёння корпусную лінгвістыку разумеюць як адносна новы падыход да лінгвістыкі, які мае справу з вывучэннем мовы ў рэальным жыцці з дапамогай камп’ютараў.

Галоўная мэта корпуснай лінгвістыкі – лінгвістычнае апісанне моўнай сістэмы, а таксама адлюстраванне моўнага матэрыялу ў выглядзе корпуса тэкстаў, які ў сваю чаргу можа выкарыстоўвацца іншымі лінгвістычнымі дысцыплінамі.

Прадметам корпуснай лінгвістыкі з’яўляюцца тэарэтычныя асновы і практычныя механізмы стварэння і выкарыстання вялікіх масіваў моўных дадзеных, якія прадназначаны для лінгвістычных даследаванняў шырокага кола карыстальнікаў.

Аб’ектам даследавання з’яўляюцца корпусы тэкстаў, якія ўяўляюць сабой зыходны матэрыял для корпуснай лінгвістыкі.

Задачы корпуснай лінгвістыкі:

1. Стварэнне корпусаў і правядзенне лінгвістычных даследаванняў на іх базе.

2. Аб’ектыўнае лінгвістычнае апісанне моўнай сістэмы.

Пад назвай лінгвістычны, ці моўны, корпус тэкстаў разумеецца вялікі, прадстаўлены ў электронным выглядзе, уніфікаваны, структураваны, размечаны, філалагічна кампетэнтны масіў моўных дадзеных, які выкарыстоўваецца для рашэння канкрэтных лінгвістычных задач.

У наш час існуе вялікая колькасць азначэнняў паняцця “корпус”.

Корпус – гэта рэпрэзентатаўны збор тэкстаў, звычайна ў машынначытаемым фармаце, які ўключае інфармацыю аб сітуацыі, у якой тэкст быў створаны (такую, як інфармацыя аб аўтары, адрасаце або аўдыторыі).

Корпус – гэта вялікі, структураваны набор тэкстаў (звычайна ў электронным выглядзе), які выкарыстоўваецца для статыстычнага аналізу і праверкі гіпотэз, а таксама праверкі выпадкаў сустракаемасці або абаснавання моўных правіл па пэўным абласцям (Вікіпедыя).

Т. Макэнеры Э.Вільсан даюць наступнае азначэнне: корпус – гэта збор языкавых фрагментаў, атабраных у адпаведнасці з дакладнымі моўнымі крытэрыямі для выкарыстання ў якасці мадэлі мовы.

В.В.Рыкаў вызначае корпус тэкстаў як нейкі збор тэкстаў, у аснове якога ляжыць лагічная задума, лагічная ідэя, якая аб’ядноўвае гэтыя тэксты і ўвасобленая ў правілах арганізацыі тэкстаў у корпус, алгарытме і праграме аналіза корпуса тэкстаў.

У прыведзеных азначэннях падкрэсліваюцца асноўныя рысы сучанага корпуса тэкстаў – мэта (лагічная ідэя), машынначытаемы фармат, рэпрэзентаціўнасць як вынік асобай працэдуры адбору, наяўнасць металінгвістычнай інфармацыі. Стандартызаванае прадстаўленне слоўнага матэрыялу на машынным носьбіце дазвале прымяняць стандартныя праграмы яго апрацоўкі.


1 | 2 | 3 | 4 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.003 сек.)