АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

О компьютерных технологиях систематизации и исследования художественных текстов

Читайте также:
  1. I. Предмет исследования
  2. II. Общие требования и правила оформления текстов исследовательских работ.
  3. III. Ценности практической методики. Методы исследования.
  4. PR на художественных выставках.
  5. Romir Monitoring провел исследования о покупках в интернете
  6. V. Текстовий процесор Word . Інтерфейс редактора Word 2007.
  7. VI. Беззондовые методы исследования
  8. Актуальность темы исследования
  9. Анализ и интерпретация результатов исследования
  10. Анализ производственно-хозяйственной деятельности конкретного объекта исследования.
  11. Анализ художественных текстов как способ овладения речевыми средствами выразительности
  12. Анатомия и методы исследования глотки. Лимфаденоидное глоточное кольцо Вальдеера - Пирогова. Какие лимфообразования входят в лимфоэпителиальный барьер, его функция.

Бурцева С. С., канд.пед.наук., доцент ФЛФ

О проблемах и перспективах компьютеризации в сфере образования в отечественной педагогической науке одним из первых начал говорить еще в середине 1980-ых годов известный ученый, академик РАО Борис Семенович Гершунский. То, о чем он говорил, сегодня стало реальностью: человек информационного пространства XXI века формируется и становится полноценной личностью, пройдя и традиционное, и инновационное воспитание и образование, обретая вечные духовно-нравственные ценности и личностные качества новой культурно-общественной среды и эпохи. О проблемах внедрения идеи в жизнь разрабатываются и проводятся научные исследования, наиболее весомыми и многозначительными из которых можно назвать труды величайших ученых нашего времени А. И. Субетто, С. И. Григорьева, С. П. Курдюмова. От решения проблем воспитания, обучения, образования человека сегодня зависит будущее цивилизации, в целом, приоритеты в сфере образования, в частности. Например, зависит процесс реализации стратегии «ноосферного социализма» (А. И. Субетто), базирующейся на «общественном интеллекте и образовательном обществе», по авторскому определению, «единственно возможной стратегии выхода человечества из ситуации первой фазы Глобальной Экологической Катастрофы». Также – рождение и дальнейшее развитие новой философии познания - диатропической модели познания (С. И. Григорьев), которая проложит путь к постклассической науке ближайшего времени. Решается «судьба» синергетической парадигмы образования (С. П. Курдюмов, В. Г. Буданов), без функционирования которой будет чрезвычайно сложно ориентироваться и выживать в современном информационном и образовательном пространстве. Близок конец «вечного» противостояния гуманитариев и технарей, ощущается дух единения ради жизнеобеспечения настоящего и будущего.

Но путь к пониманию истины был долог и полон открытий: … первая мельница с колесом запущена в начале нашего летосчисления, а ветряные мельницы в Европе появились в начале XI века… Первый четырехмачтовый корабль был спущен на воду еще в 1470 году, а гениальный Леонардо да Винчи подавал фантастические идеи и замыслы станков и строений на рубеже XV – XVI веков. В 1492 году в одном из своих дневников он приводит эскиз 13-разрядного суммирующего устройства с десятизубцовыми кольцами. На базе этого проекта Леонардо да Винчи только в ХVII веке был построен функционирующий 8-разрядный вычислительный аппарат «Суммирующая машина Паскаля». В 1855 году шведы Георг и Эдвард Шутцы создали первый механический компьютер (слово «компьютер» (Оксфордский словарь английского языка) появилось в 1896 году) – разностную машину (позднее продали его американцам). «Нулевое поколение» компьютерной техники изобреталось и в Древнем Вавилоне (3000 лет до н.э., счеты – абак), и в Китае (500 лет до н.э., вариант абака с косточками на соломинках – суаньпань), и в Греции (87 год до н.э., астрономический вычислитель – механическое устройство на базе зубчатых передач), и в России (XVI век, русские счеты из 10 деревянных шариков на проволоке). Нельзя не вспомнить в этой хронологической цепи Сайруса Филда, проложившего в 1866 году второй подводный телекоммуникационный кабель через Атлантику, который служил миру и обеспечивал связь около 100 лет. А 1981 год вошел в историю как год появления первого в мире персонального компьютера (ПК) – «IBM PC», произведенного Корпорацией IBM (США). Сегодня мы пользуемся ПК на многоядерных процессорах, выпускаемых фирмами Intel, AMD и IBM. Продукции Intel, самые актуальные по цене и функциональности захватывают примерно 80,5 % рынка сбыта. AMD – 12 – 13 %. А самую дорогую продукцию выпускает IBM и обеспечивает обработку на мейнфреймах почти 70 % бизнес - данных в мире. На перспективе – квантовые и молекулярные ПК. Еще в 1959 году выдающийся американский физик, Нобелевский лауреат Ричард Фейнман говорил, что «существует огромное пространство на уровне атомов», а в 1974 году японский ученый Норио Танигути впервые ввел термин «нанотехнологии», подхваченный в 1986 году «отцом нанотехнологий», американским инженером Кимом Эриком Дрекслером. Сегодня актуальны перспективы расширения человеческих возможностей с помощью нанотехнологий и проблемы риска, связанные с ними….

Остается признать, что технический прогресс уже давно перегнал «прогресс сознания». Если воспитание и образование не сократят разрыв этого отставания – миру грозит не только экологическая катастрофа. Каждому специалисту в сфере образования и воспитания должно быть очевидно, что без информационно-коммуникационных технологий, цифровых образовательных ресурсов, инновационных технических средств успех в данном деле не обеспечен. Наличие компьютерных средств и владение ими – не самый важный параметр профессиональной компетенции современного специалиста в сфере образования. Более востребованным для результата деятельности будет его владение прикладными компьютерными программами, для филолога – например, лингвистическими программами, программами для систематизации, исследования и анализа текстовой информации (например, художественного текста). Необходимо также знание основных или наиболее популярных обучающих программ, распространяемых на CD, BBS и FTP.Требования к данному параметру компьютерной компетентности можно понимать как наиболее совершенное знание и понимание структуры, видов и типов, различных вариантов классификации цифровых образовательных ресурсов (ЦОР). При выработке умений и навыков профессиональной деятельности с ЦОР следует уделить особое внимание на работу с электронными учебниками, организацию учебной информации в виде гипертекста, владение мультимедийными средствами и технологиями обучения, умение пользоваться тестовой системой компьютерного контроля, методами поиска в Сети. Эффективное использование ЦОР для повышения темпов и результатов обучения не вызывает сомнения и успешно служит достижению нового образовательного результата. Здесь можно еще упомянуть о том, что существуют и работают большое количество программ, связанных с языковым анализом текстов и вычислительной лингвистикой, близких этой сфере разного типа ресурсов, доступных в сети Интернет. Автором некоторых из таких программ и составителем каталога лингвистических программ и ресурсов Интернета с их описаниями (Linguistics Software Catalogue PBБ, версия 1.6) является Сергей Владимирович Логичев. Для удобства пользования каталог разбит на 7 тематических разделов:

· Программы анализа и лингвистической обработки текстов.

· Психолингвистические программы.

· Программы преобразования текстов.

· Генераторы текстов и «говорящие» программы.

· Системы обработки естественного языка (NL – Processing).

· Коллекции ресурсов.

· Словари и тезаурусы.

Научно-теоретической базой многих прикладных компьютерных лингвистических программ, информационных технологий систематизации и исследования художественных текстов послужили традиционные лингвистические и историко-литературные представления и знания (например, лингвистические концепции Ф. де Соссюра и системные идеи Ю. Тынянова), прикладные филологические дисциплины (например, стилеметрия), современные идеи лингвистической стилистики, опыт создания частотных и распределительных словарей, словарей – конкордансов, словарей ключевых слов, словарей писателей (например, В. Г. Адмони, Г. Н. Акимовой, П. М. Алексеева, Н. Д. Арутюновой, Е. А. Иванчиковой, Г. Я. Мартыненко, А. А. Чупрова и других). Важную роль в формировании концепции компьютерной антологии русского рассказа ХХ века сыграли идеи Андрея Белого о необходимости создания словарей писателей (1934) для массового применения. Использовались и классификационные представления, лингвистические аналоги литературных школ, направлений, стилей на основании критерия лингвистической близости произведений разных авторов, предложенные (1923) В. В. Виноградовым. А также способ описания мировосприятия писателя через совокупность «словесных тем» (1977) В. М. Жирмунского. Основанные на такой фундаментальной базе научные разработки для использования в компьютерных системах (в основном системе ЛинДа) составили Аношкин Ж. Г., Гребенников А. О., Гринбаум О. Н., Казакевич О. А., Г. Я. Мартыненко, Шайкевич А. Я. и другие. Так еще с конца 90-х годов функционируют машинные фонды, текстовые и словарные базы данных, электронные библиотеки, методы компьютерной систематизации и обработки данных, частотные словари художественных произведений писателей, компьютерная Антология русского рассказа ХХ века.

Несомненно и то, что широкое применение получили математические методы к анализу литературного текста. Одним из первых исследователей, применивших их в далеком уже 1915 году, был ученый – энциклопедист и поэт, основатель научной хронологии, Почетный член АН СССР, Николай Александрович Морозов (1854 – 1946), который открыл «лингвистические спектры» («Стилеметрический этюд») и применял их при изучении художественных произведений античных писателей, А. С. Пушкина, Н. В. Гоголя, Л. Н. Толстого. В то время это вызвало бурную критику (А. А. Марков, 1916). В наши дни труды Морозова в этой области нашли продолжение в компьютерных разработках Бубнова В. А., Сурвилло А. В., которые опровергли критику на него. Использование точных методов и программ ЭВМ в методике анализа художественных текстов позволило расширить диапазон исследований (например, В. Фукс провел формализованный анализ стилевых характеристик библейских текстов). Сегодня апробированы методы и компьютерные программы различения канонических евангельских текстов. В 1979 году математик Г. Хетсо предложил оригинальную методику атрибуции литературных сочинений на основе 7 параметров. С помощью ее проведены компьютерные анализы произведений М. Шолохова и романа «Тихий Дон», подтвердившие его авторство, выяснены анонимные статьи, опубликованные в журналах «Время» и «Эпоха», на принадлежность их перу Ф. М. Достоевского. Продемонстрировал точность распознавания и определения авторства на матрице переходных частот употребления пар элементов (букв, грамматических классов слов и т.п.) Хмелев Д. В.. Далее и Кукушкина О. В., Поликарпов А. А. уточнили возможности применения данного метода. Так проведены перекрестные проверки на текстах художественных произведений, среди которых такие авторы как А. С. Пушкин, Н. В. Гоголь, М. Е. Салтыков-Щедрин, Ф. М. Достоевский, Л. Н. Толстой, А. П. Чехов, Н. Гумилев, С. Есенин, А. Н. Толстой, В. Набоков, Д. Хармс, Н. Леонов, В. Шукшин, А. и Б. Стругацкие и многие другие. Также успешно работает методика определения авторства по тексту на естественном языке с помощью частотного анализа, разработанная Хрулевым О. (в базе данных Oracle).

Из компьютерных разработок по анализу текстов представляется интересным и достаточно универсальная программа НТА («Historical Text Analyzer») (авторы Д. Э. Осиновский, А. С. Ровный, Д. В. Новицкий. МФТИ). В ней реализованы методы анализа контекста, метод парных частот встречаемости последовательных частей речи, метод частотных распределений. Предусмотрены редактирование пометок в словаре, поиск по словарю, установка фильтра просмотра по частоте встречаемости слов и по части речи, запоминание и считывание словаря в файл, использование пометок о частях речи из других словарей.

А в декабре 2002 года сайт Textarc.org предложил технологию ускоренной обработки текстов большого объема. Автор сайта Брэдфорд Пэйли создал программу, преобразующую художественный текст в динамическую карту. Здесь с первого взгляда можно увидеть взаимосвязи между ключевыми понятиями (словами) и героями произведения. Картина (схема в виде большого эллипса – «схемы созвездий», по словам самого Пэйли) также создает впечатление о структуре книги в целом. Программа создана как инструмент для ученых и предназначен для ускоренной обработки текста. Первая версия ее была установлена в библиотеке штата Нью-Йорк. Б. Пэйли получил грант от Совета по вопросам искусств при Сенате штата. Позднее в Сети появились несколько модифицированных Интернет - версий этой программы. На сайте Пэйли сообщается, что функционирует и онлайновый вариант, но он еще требует некоторой доработки, весьма требователен к пользовательскому компьютеру. Требуемые для программы характеристики (на сегодня несколько устаревшие): Pentium III 600 ГГц и выше; разрешение экрана не ниже 1024 х 768, 16-битный цвет; операционная система – Windows NT, Windows 2000 или Windows XP; 256 Мб RAM и более; скоростное Интернет-соединение; браузер Netscape 6.2 или Explorer 5 или 6 (более медленный).

Следует отметить, что нами приведены ранние («отправные») данные для тех, кто будет заниматься компьютерными технологиями обработки статистической информации. Наибольшую актуальность представляют сегодня программы данной технологии для интерактивной доски, которые мы будем рассматривать в другой раз.

 


Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.004 сек.)