Авто Автоматизация Архитектура Астрономия Аудит Биология Бухгалтерия Военное дело Генетика География Геология Государство Дом Другое Журналистика и СМИ Изобретательство Иностранные языки Информатика Искусство История Компьютеры Кулинария Культура Лексикология Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлы и Сварка Механика Музыка Население Образование Охрана безопасности жизни Охрана Труда Педагогика Политика Право Приборостроение Программирование Производство Промышленность Психология Радио Регилия Связь Социология Спорт Стандартизация Строительство Технологии Торговля Туризм Физика Физиология Философия Финансы Химия Хозяйство Ценнообразование Черчение Экология Эконометрика Экономика Электроника Юриспунденкция

Дистиляція даних (Data Distilled)

Читайте также:

Застосовуючи цей метод, вибирають шаблон (взірець) з низки даних, а потім використовують його з різними цілями. Природно, тут виникають два запитання: 1) «Які типи шаблонів можуть бути вибрані?» і 2) «Як вони будуть подаватися?» Очевидно, шаблон потрібно виражати формально і за допомогою мови. Ця альтернатива приводить до чотирьох виокремлених підходів: логічних; візуалізація; на основі рівнянь; крос-табуляція. Кожний із цих підходів історично має чіткі математичні корені. Зупинимося

коротко на підході «крос-табуляції» (Cross Tabulation), який недостатньо описаний в україномовній літературі.

Крос-табуляція або перехресна табуляція (перехресні табличні дані) є основною і дуже простою формою аналізу даних, добре відомою в статистиці і широко використовуваною для створення звітів. Двохвимірна крос-таблиця (cross-tab) подібна до електронної таблиці як щодо заголовків рядків і стовпців, так і щодо атри-бутних значень. Комірки (cells) у таблиці являють собою агрегова-ні операції, зазвичай, ряду атрибутних значень, що зустрічаються (co-occurances) разом. Багато крос-таблиць за ефективністю рівноцінні трьохвимірним стовпчиковим діаграмам (гістограмам) — (3D bar graph), що показують сумісні рахунки.

Довірчі мережі, як один із різновидів крос-табуляції, зазвичай, ілюструються з використанням графічного подання розподілу ймовірностей (отриманого шляхом підрахунків). Довірча мережа є орієнтованим графом (directed graph), що складається з вершин (змінні подання) і дуг (зображення ймовірнісної залежності) між вершинами змінних.

9.4. Нейронні мережі

9.4.1. Визначення та еволюція нейронних мереж

Нейронна мережа (Neural Network) або просто нейро-мережа є програмно (інколи апаратно) реалізованою системою, в основу якої покладена математична модель процесу передавання і оброблення імпульсів мозку людини, що імітує механізм взаємодії нейронів (neuron) з метою опрацювання інформації, що надходить, і навчання досвіду. Інакше кажучи, проводиться комп'ютеризована імітація інтелектуального режиму поведінки людини. Ключовим аспектом штучних нейромереж є їх здатність навчатися в процесі розв'язання задач, наприклад, розпізнавання образів.

Еволюція штучних нейронних систем проходила протягом більше ніж двох тисяч років. Інтерес до моделювання людської системи навчання може бути віднесений до епохи Китайських майстрів, тобто ще майже 200 років до нашої ери. Однак найбільші Дослідження з розроблення функції простого нейрона були проведені в кінці 30-х років XX століття Уореном Мак-Каллоком (Warren McCulloch) і Уолтером Піттсом (Walter Pitts), що може

розглядатися як реальна стартова точка в даній галузі знань 1943 року ці автори опублікували свої результати в книзі «Логічне числення ідей, що стосуються нервової діяльності».

Згідно з теорією Мак-Каллока і Піттса, виведення даних від нейрона має математичне значення, що дорівнює зваженій сумі введень. Хоч і було доведено, що ці прості нейрони можуть бути відмінними обчислювальними пристроями, коли використовуються відповідні ваги, відчувалася відсутність універсального правила навчання, тобто методу для регулювання ваг у нейрон-них функціях.

Одне з найзнаменитіших правил (законів) навчання було запропоновано 1949 року Дональдом Геббом (Donald Hebb). У цьому правилі стверджується, що з більшою частотою сприяє збудженню одного нейрона перша секунда, тобто ефективнішим буде вплив на першій секунді. Отже, пам'ять зберігається в синап-тичних зв'язках мозку, і навчання відбувається зі змінами в силі цих зв'язків.

Першим нейрокомп'ютером (neurocomputer) можна вважати пристрій «Snark», який розробив М. Мінський (Marvin Minsky) на початку 50-х років XX ст., що розглядається багатьма вченими як перший комп'ютерний аналог людського мозку. Хоча з технічного боку пристрій мав певний успіх, проте він був неспроможним виконати будь-яку значну функцію з оброблення інформації.

У середині 50-х років Франк Розенблат (Frank Rosenblatt), нейрофізик з університету Cornell (США), розробив пристрій апаратних засобів персептрон (Perceptron) — електронний пристрій для розпізнавання зорових образів (зображень). В персепт-роні використані штучні нейронні структури, які Розенблат назвав персептронами, комбінованими з простим правилом навчання. Персептрон міг узагальнювати й реагувати на незнайомі ввідні стимули. Хоч успіх Розенблата і сприяв появі надій на швидке створення штучного мозку, проте М. Мінський і С. Па-перт (Seymour Papert), піонери в галузі штучного інтелекту, довели, що персептрони Розенблата не зможуть розв'язати прості проблеми логіки, що послужило тимчасовим гальмом дослідження нейромереж. Реальні досягнення щодо створення та широкого застосування нейромереж отримані за останні десять років.

Сучасні інструментальні засоби нейромереж використовуються для сприймання інформації за допомогою вивчення взірців (шаблонів) і потім застосовування їх з метою передбачення майбутніх зв'язків або відношень. Нейромережі є найзагальнішим типом методики дейтамайнінгу, причому деякі люди навіть вва-

нэть, щ₀ використання нейромереж є єдиним типом дейтамай-нінгу. Продавці нейромережевих програмних продуктів часто використовують багато необгрунтованих рекламних тверджень стосовно можливостей нейромереж. Одним із таких тверджень, яке є особливо сумнівним, є те, що нейромережі можуть компенсувати низьку якість даних.

Нейромережі навчаються створювати взірці безпосередньо з даних за допомогою повторного їх вивчення, щоб ідентифікувати зв'язки і побудувати модель. Вони будують моделі методом проб і помилок. Мережа підбирає значення параметра шляхом зіставлення з фактичною величиною. Якщо приблизна оцінка вихідного параметра неправильна, то модель регулюється. Цей процес включає три ітеративні кроки: передбачення, порівняння і пристосування (або корегування). Нейромережі досить просто застосовуються в СППР з метою класифікування даних і для передбачень. При цьому вхідні дані комбінуються і зважуються, на основі чого генеруються вихідні значення.

Передусім, коли йдеться про нейронні мережі, то частіше маються на увазі штучні нейронні мережі. Деякі з них моделюють біологічні нейронні мережі, а деякі — ні. Однак історично склалося так, що перші штучні нейронні мережі були створені внаслідок спроб створити комп'ютерну модель, що відтворює діяльність мозку в спрощеній формі. Звичайно, можливості людського мозку незмірно більші, ніж можливості самої потужної штучної нейронної мережі.

Сучасні нейромережі мають низку властивостей, характерних для біологічних нейромереж, у тому числі й людського мозку. Головна їх властивість — здібність до навчання. Для розв'язання якої-небудь задачі на комп'ютері традиційним методом необхідно знати правила (математичні формули), за якими зі вхідних даних можна отримати вихідні, тобто знайти розв'язок задачі. А за Допомогою нейромережі можна знайти розв'язок, не знаючи правил, а маючи лише кілька прикладів.

Нейромережі використовують підхід до розв'язання задач ближчий до людського, ніж традиційні обчислення. Дійсно, наприклад, коли людина переходить вулицю, вона оцінює швидкість руху автомобіля, виходячи з попереднього досвіду, не використовуючи математичних обчислень. Або, наприклад, як Дитина без великих зусиль може відрізнити кішку від собаки, або Дівчинку від хлопчика, ґрунтуючись на раніше бачених прикладах. При цьому часто вона не може точно сказати, за якими ознаками вона їх відрізняє, тобто дитина не знає чіткого алгоритму.

Інша важлива властивість нейромереж — здатність знаходити розв'язки, ґрунтуючись на змішаних, загальних, спотворених і навіть суперечливих даних. Ще одна чудова властивість — ц_естійкість до відмов у функціонуванні. У разі виходу з ладу частини нейронів, уся мережа загалом залишається працездатною, хоча, звичайно, точність обчислень знижується.

9.4.2. Застосування нейронных мереж

Поява і широке застосування останнім часом нейромереж і нейрокомп'ютерів зумовлено низкою важливих підстав. По-перше, дуже багато задач з інформатики та економіки не можна розв'язати класичними методами теорії управління, оптимі-зації і системного аналізу. Річ у тім, що будь-який проектувальник складних систем має справу з тим самим комплексом проблем, що погано піддаються розв'язанню традиційними методами. Неповнота знань про зовнішній світ, неминуча погрішність даних, які надходять, непередбачуваність реальних ситуацій — усе це змушує розробників мріяти про адаптивні інтелектуальні системи, які здатні підстроюватися до змін у «правилах гри» і самостійно орієнтуватися за складних умов.

По-друге, «прокляття розмірності» стає реальним стримуючим чинником за розв'язання багатьох (якщо не більшості) серйозних задач. Проектувальник не в змозі врахувати і звести в загальну систему рівнянь всю сукупність зовнішніх умов, особливо за наявності безлічі активних протидій. Тому самостійна адаптація системи в процесі динамічного моделювання «умов, наближених до бойових» — чи не єдиний спосіб розв'язування задач за таких обставин.

Нейромережі (нейрокомп'ютери) забезпечують користувачів надзвичайно гнучким і в певному розумінні універсальним аналітичним інструментарієм. Вони дають змогу розв'язувати досить різні типи задач. Охарактеризуємо деякі з них.

Класифікація образів. Завдання полягає у визначенні належності вхідного образу (наприклад, мовного сигналу або рукописного символа), поданого вектором ознак, одному або кільком заздалегідь визначеним типам. До відомих додатків відносяться розпізнавання букв, розпізнавання мови, класифікація сигналу електрокардіограми, класифікація клітин крові тощо.

Кластеризація/категоршація. За розв'язання завдання з кластери-зації, яке відоме також як класифікація образів «без учителя», відсу-

_тНЯ навчальна вибірка з мітками типів. Алгоритм кластеризації ґрунтується на подібності образів і розміщує схожі образи в один кластер. Відомі випадки застосування кластеризації для добування знань, стиснення даних і дослідження їх властивостей.

Апроксимація функцій. Допустимо, що є навчальна вибірка (х₁уі), (хг, Уг) ••, (х„, Уп) (пари відповідних даних входу-виходу), яка генерується невідомою функцією F(x), спотвореною шумом. Завдання апроксимації полягає в знаходженні оцінки невідомої функції F(x). Апроксимація функцій необхідна за розв'язання численних інженерних і наукових завдань з моделювання.

Передбачення/прогнозування. Нехай задані п дискретних значень \y(t\), y{h)..., y{t_n)} у послідовні моменти часу % Гг,...,?„. Завдання полягає в прогнозуванні значення у (t„+ 1) в деякий майбутній момент часу t_n + 1. Передбачення мають значний вплив на прийняття рішень у бізнесі, науці і техніці. Прогноз цін на фондовій біржі і прогноз погоди є типовими додатками методів передбачення/прогнозування.

Оптимізація. Численні проблеми в економіці та інших наукових галузях можуть розглядатися як проблеми оптимізації. Завданням алгоритму оптимізації є знаходження такого розв'язку, який задовольняє систему обмежень і максимізує або мінімізує цільову функцію.

Контекстно-адресована пам'ять. У моделі обчислень фон Неймана, що послужила базисом традиційної обчислювальної техніки, звернення до пам'яті було можливим тільки за допомогою адреси комірки пам'яті, яка не залежить від її змісту. Більше того, якщо допущена помилка в адресі, то може бути знайдена абсолютно інша інформація. Контекстно-адресована (асоціативна) пам'ять або пам'ять, що адресується за змістом, доступна за вказівкою заданого змісту. Асоціативна пам'ять надзвичайно бажана за створення мультимедійних інформаційних баз даних.

Управління. Розглянемо динамічну систему, задану сукупністю {и(0, у(і)}, де u(t) є вхідним керуючим впливом, a y(t) — виходом системи в момент часу t. У системах управління з еталонною моделлю мети управління є можливість розрахунку такої величини вхідного впливу u(t), при якій система рухається за бажаною траєкторією, що визначається еталонною моделлю.

У принципі, нейронні мережі можуть обчислювати значення будь-яких функцій, інакше кажучи, виконувати все, що можуть робити традиційні комп'ютери. На практиці для того, щоб застосування нейронної мережі було доцільним, необхідно, щоб задача мала такі ознаки: невідомий алгоритм або принципи розв'язання

задачі, але накопичена достатня кількість прикладів; проблема характеризується великими обсягами вхідної інформації; дані неповні або надмірні, містять шуми, частково суперечливі.

Отже, нейронні мережі добре підходять для розпізнавання образів і розв'язання задач з класифікації, оптимізації і прогнозування. Нижче наведений перелік можливих застосувань нейрон-них мереж у промисловості, на базі яких або вже створені комерційні продукти, або реалізовані демонстраційні прототипи.

Банки і страхові компанії, автоматичне зчитування чеків і фінансових документів; перевірка достовірності підписів; оцінювання ризику для позик; прогнозування змін економічних показників.

Адміністративне обслуговування: автоматичне зчитування документів; автоматичне розпізнавання штрихових кодів.

Нафтова і хімічна промисловість: аналізування геологічної інформації; ідентифікація зіпсувань обладнання; розвідування покладів мінералів за даними аерофотознімків; аналіз складу домішок; управління процесами.

Військова промисловість і аеронавтика: оброблення звукових сигналів (поділ, ідентифікація, локалізація, усунення шуму, інтерпретація); оброблення радарних сигналів (розпізнавання цілей, ідентифікація і локалізація джерел); оброблення інфрачервоних сигналів (локалізація); узагальнення інформації; автоматичне пілотування.

Промислове виробництво: керування маніпуляторами; управління якістю; управління процесами; виявлення зіпсувань; адаптивна робототехніка; керування голосом.

Служба безпеки: розпізнавання осіб, голосів, відбитків пальців.

Біомедична промисловість: аналіз рентгенограм; виявлення відхилень в електрокардіограмах.

Телебачення і зв'язок: адаптивне управління мережею зв'язку; стиснення і відновлення зображень.

Можна продовжувати наведення прикладів вдалого використання технологій нейронних мереж. Проте є низка недоліків, пов'язаних із застосуванням для розв'язання задач з ідентифікації взірців інформації. Головним із них є те, що для навчання нейро-мережі потрібна велика кількість фактичної інформації (кількість спостережень від 50 до 100). Для аналітичних задач у бізнесі це не завжди можна забезпечити. Крім цього, неявне навчання призводить до того, що структура зв'язків між нейронами стає «незрозумілою» — не існує іншого способу її прочитати, крім як запустити функціонування мережі. Стає складно відповісти на запитання: «Як нейронна мережа отримує результат?»— тобто побудувати зрозумілу людині логічну конструкцію, що відтво-

рює дії мережі. Це явище можна назвати «логічною непрозорістю» нейронних мереж, навчених за неявними правилами. Навіть добре натренована нейромережа являє собою «чорний ящик», тобто систему, в якій зовнішньому спостерігачеві доступні лише вхідні та вихідні величини, а внутрішня будова її та процеси, що в ній перебігають, невідомі.

1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 | 105 | 106 | 107 | 108 | 109 | 110 | 111 | 112 | 113 | 114 | 115 | 116 | 117 | 118 | 119 | 120 | 121 | 122 | 123 | 124 | 125 |

Поиск по сайту:

Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (1.239 сек.)

Главная | О проекте | Полезные cсылки | Контакты | Случайная страница