АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Дистиляція даних (Data Distilled)

Читайте также:
  1. Аналіз даних засобами Excel
  2. Аналіз систематизованих та згрупованих статистичних даних
  3. База даних і система управління базою даних СППР
  4. Бланк паспорта складається з м'якої обкладинки, форзаца, сторінки даних і 32 паперових сторінок.
  5. БУХГАЛТЕРСЬКИХ ДАНИХ)
  6. В залежності від вихідних даних та способів їх поєднання всі методи діляться на 2 класи.
  7. В яких межах може бути віднесена на валові витрати вартість розданих зразків товарів, безплатно наданих послуг (при відрядженні за кордон)?
  8. Введення даних у таблицю
  9. Введення і перевірка даних
  10. Виданих Державним казначейством України
  11. Види баз даних у СППР
  12. ВИМОГИ ДО ДАНИХ І КЕРУВАННЯ НИМИ, ЩО ОБГОВОРЮЮТЬСЯ У РАЗІ ВИБОРУ ГЕНЕРАТОРА СППР

Застосовуючи цей метод, вибирають шаблон (взірець) з низки даних, а потім використовують його з різними цілями. При­родно, тут виникають два запитання: 1) «Які типи шаблонів мо­жуть бути вибрані?» і 2) «Як вони будуть подаватися?» Очевидно, шаблон потрібно виражати формально і за допомогою мови. Ця альтернатива приводить до чотирьох виокремлених підходів: логі­чних; візуалізація; на основі рівнянь; крос-табуляція. Кожний із цих підходів історично має чіткі математичні корені. Зупинимося


коротко на підході «крос-табуляції» (Cross Tabulation), який недо­статньо описаний в україномовній літературі.

Крос-табуляція або перехресна табуляція (перехресні табличні дані) є основною і дуже простою формою аналізу даних, добре відомою в статистиці і широко використовуваною для створення звітів. Двохвимірна крос-таблиця (cross-tab) подібна до електрон­ної таблиці як щодо заголовків рядків і стовпців, так і щодо атри-бутних значень. Комірки (cells) у таблиці являють собою агрегова-ні операції, зазвичай, ряду атрибутних значень, що зустрічаються (co-occurances) разом. Багато крос-таблиць за ефективністю рів­ноцінні трьохвимірним стовпчиковим діаграмам (гістограмам) — (3D bar graph), що показують сумісні рахунки.

Довірчі мережі, як один із різновидів крос-табуляції, зазвичай, ілюструються з використанням графічного подання розподілу ймовірностей (отриманого шляхом підрахунків). Довірча мережа є орієнтованим графом (directed graph), що складається з вершин (змінні подання) і дуг (зображення ймовірнісної залежності) між вершинами змінних.

9.4. Нейронні мережі

9.4.1. Визначення та еволюція нейронних мереж

Нейронна мережа (Neural Network) або просто нейро-мережа є програмно (інколи апаратно) реалізованою системою, в основу якої покладена математична модель процесу передавання і оброблення імпульсів мозку людини, що імітує механізм взаємодії нейронів (neuron) з метою опрацювання інформації, що надходить, і навчання досвіду. Інакше кажучи, проводиться комп'ютеризована імітація інтелектуального режиму поведінки людини. Ключовим аспектом штучних нейромереж є їх здатність навчатися в процесі розв'язання задач, наприклад, розпізнавання образів.

Еволюція штучних нейронних систем проходила протягом бі­льше ніж двох тисяч років. Інтерес до моделювання людської си­стеми навчання може бути віднесений до епохи Китайських май­стрів, тобто ще майже 200 років до нашої ери. Однак найбільші Дослідження з розроблення функції простого нейрона були про­ведені в кінці 30-х років XX століття Уореном Мак-Каллоком (Warren McCulloch) і Уолтером Піттсом (Walter Pitts), що може


розглядатися як реальна стартова точка в даній галузі знань 1943 року ці автори опублікували свої результати в книзі «Логіч­не числення ідей, що стосуються нервової діяльності».

Згідно з теорією Мак-Каллока і Піттса, виведення даних від нейрона має математичне значення, що дорівнює зваженій сумі введень. Хоч і було доведено, що ці прості нейрони можуть бути відмінними обчислювальними пристроями, коли використову­ються відповідні ваги, відчувалася відсутність універсального правила навчання, тобто методу для регулювання ваг у нейрон-них функціях.

Одне з найзнаменитіших правил (законів) навчання було за­пропоновано 1949 року Дональдом Геббом (Donald Hebb). У цьому правилі стверджується, що з більшою частотою сприяє збудженню одного нейрона перша секунда, тобто ефективнішим буде вплив на першій секунді. Отже, пам'ять зберігається в синап-тичних зв'язках мозку, і навчання відбувається зі змінами в силі цих зв'язків.

Першим нейрокомп'ютером (neurocomputer) можна вважати пристрій «Snark», який розробив М. Мінський (Marvin Minsky) на початку 50-х років XX ст., що розглядається багатьма вченими як перший комп'ютерний аналог людського мозку. Хоча з технічно­го боку пристрій мав певний успіх, проте він був неспроможним виконати будь-яку значну функцію з оброблення інформації.

У середині 50-х років Франк Розенблат (Frank Rosenblatt), нейрофізик з університету Cornell (США), розробив пристрій апаратних засобів персептрон (Perceptron) — електронний при­стрій для розпізнавання зорових образів (зображень). В персепт-роні використані штучні нейронні структури, які Розенблат на­звав персептронами, комбінованими з простим правилом на­вчання. Персептрон міг узагальнювати й реагувати на незнайомі ввідні стимули. Хоч успіх Розенблата і сприяв появі надій на швидке створення штучного мозку, проте М. Мінський і С. Па-перт (Seymour Papert), піонери в галузі штучного інтелекту, дове­ли, що персептрони Розенблата не зможуть розв'язати прості проблеми логіки, що послужило тимчасовим гальмом досліджен­ня нейромереж. Реальні досягнення щодо створення та широкого застосування нейромереж отримані за останні десять років.

Сучасні інструментальні засоби нейромереж використовують­ся для сприймання інформації за допомогою вивчення взірців (шаблонів) і потім застосовування їх з метою передбачення май­бутніх зв'язків або відношень. Нейромережі є найзагальнішим типом методики дейтамайнінгу, причому деякі люди навіть вва-


нэть, щ0 використання нейромереж є єдиним типом дейтамай-нінгу. Продавці нейромережевих програмних продуктів часто використовують багато необгрунтованих рекламних тверджень стосовно можливостей нейромереж. Одним із таких тверджень, яке є особливо сумнівним, є те, що нейромережі можуть компен­сувати низьку якість даних.

Нейромережі навчаються створювати взірці безпосередньо з даних за допомогою повторного їх вивчення, щоб ідентифікувати зв'язки і побудувати модель. Вони будують моделі методом проб і помилок. Мережа підбирає значення параметра шляхом зістав­лення з фактичною величиною. Якщо приблизна оцінка вихідно­го параметра неправильна, то модель регулюється. Цей процес включає три ітеративні кроки: передбачення, порівняння і при­стосування (або корегування). Нейромережі досить просто засто­совуються в СППР з метою класифікування даних і для передба­чень. При цьому вхідні дані комбінуються і зважуються, на основі чого генеруються вихідні значення.

Передусім, коли йдеться про нейронні мережі, то частіше ма­ються на увазі штучні нейронні мережі. Деякі з них моделюють біологічні нейронні мережі, а деякі — ні. Однак історично скла­лося так, що перші штучні нейронні мережі були створені вна­слідок спроб створити комп'ютерну модель, що відтворює діяль­ність мозку в спрощеній формі. Звичайно, можливості людського мозку незмірно більші, ніж можливості самої потужної штучної нейронної мережі.

Сучасні нейромережі мають низку властивостей, характерних для біологічних нейромереж, у тому числі й людського мозку. Головна їх властивість — здібність до навчання. Для розв'язання якої-небудь задачі на комп'ютері традиційним методом необхід­но знати правила (математичні формули), за якими зі вхідних да­них можна отримати вихідні, тобто знайти розв'язок задачі. А за Допомогою нейромережі можна знайти розв'язок, не знаючи пра­вил, а маючи лише кілька прикладів.

Нейромережі використовують підхід до розв'язання задач ближчий до людського, ніж традиційні обчислення. Дійсно, на­приклад, коли людина переходить вулицю, вона оцінює швид­кість руху автомобіля, виходячи з попереднього досвіду, не ви­користовуючи математичних обчислень. Або, наприклад, як Дитина без великих зусиль може відрізнити кішку від собаки, або Дівчинку від хлопчика, ґрунтуючись на раніше бачених прикла­дах. При цьому часто вона не може точно сказати, за якими озна­ками вона їх відрізняє, тобто дитина не знає чіткого алгоритму.


Інша важлива властивість нейромереж — здатність знаходити розв'язки, ґрунтуючись на змішаних, загальних, спотворених і навіть суперечливих даних. Ще одна чудова властивість — це стійкість до відмов у функціонуванні. У разі виходу з ладу час­тини нейронів, уся мережа загалом залишається працездатною, хоча, звичайно, точність обчислень знижується.

9.4.2. Застосування нейронных мереж

Поява і широке застосування останнім часом нейроме­реж і нейрокомп'ютерів зумовлено низкою важливих підстав. По-перше, дуже багато задач з інформатики та економіки не мож­на розв'язати класичними методами теорії управління, оптимі-зації і системного аналізу. Річ у тім, що будь-який проектуваль­ник складних систем має справу з тим самим комплексом проб­лем, що погано піддаються розв'язанню традиційними методами. Неповнота знань про зовнішній світ, неминуча погрішність да­них, які надходять, непередбачуваність реальних ситуацій — усе це змушує розробників мріяти про адаптивні інтелектуальні сис­теми, які здатні підстроюватися до змін у «правилах гри» і само­стійно орієнтуватися за складних умов.

По-друге, «прокляття розмірності» стає реальним стримую­чим чинником за розв'язання багатьох (якщо не більшості) сер­йозних задач. Проектувальник не в змозі врахувати і звести в за­гальну систему рівнянь всю сукупність зовнішніх умов, особливо за наявності безлічі активних протидій. Тому самостійна адапта­ція системи в процесі динамічного моделювання «умов, набли­жених до бойових» — чи не єдиний спосіб розв'язування задач за таких обставин.

Нейромережі (нейрокомп'ютери) забезпечують користувачів надзвичайно гнучким і в певному розумінні універсальним аналі­тичним інструментарієм. Вони дають змогу розв'язувати досить різні типи задач. Охарактеризуємо деякі з них.

Класифікація образів. Завдання полягає у визначенні належ­ності вхідного образу (наприклад, мовного сигналу або рукопис­ного символа), поданого вектором ознак, одному або кільком за­здалегідь визначеним типам. До відомих додатків відносяться розпізнавання букв, розпізнавання мови, класифікація сигналу електрокардіограми, класифікація клітин крові тощо.

Кластеризація/категоршація. За розв'язання завдання з кластери-зації, яке відоме також як класифікація образів «без учителя», відсу-


тНЯ навчальна вибірка з мітками типів. Алгоритм кластеризації ґрун­тується на подібності образів і розміщує схожі образи в один клас­тер. Відомі випадки застосування кластеризації для добування знань, стиснення даних і дослідження їх властивостей.

Апроксимація функцій. Допустимо, що є навчальна вибірка (х1 уі), (хг, Уг) ••, (х„, Уп) (пари відповідних даних входу-виходу), яка генерується невідомою функцією F(x), спотвореною шумом. За­вдання апроксимації полягає в знаходженні оцінки невідомої фун­кції F(x). Апроксимація функцій необхідна за розв'язання числен­них інженерних і наукових завдань з моделювання.

Передбачення/прогнозування. Нехай задані п дискретних зна­чень \y(t\), y{h)..., y{tn)} у послідовні моменти часу % Гг,...,?„. За­вдання полягає в прогнозуванні значення у (t„+ 1) в деякий май­бутній момент часу tn + 1. Передбачення мають значний вплив на прийняття рішень у бізнесі, науці і техніці. Прогноз цін на фон­довій біржі і прогноз погоди є типовими додатками методів пе­редбачення/прогнозування.

Оптимізація. Численні проблеми в економіці та інших науко­вих галузях можуть розглядатися як проблеми оптимізації. За­вданням алгоритму оптимізації є знаходження такого розв'язку, який задовольняє систему обмежень і максимізує або мінімізує цільову функцію.

Контекстно-адресована пам'ять. У моделі обчислень фон Неймана, що послужила базисом традиційної обчислювальної техніки, звернення до пам'яті було можливим тільки за допомо­гою адреси комірки пам'яті, яка не залежить від її змісту. Більше того, якщо допущена помилка в адресі, то може бути знайдена абсолютно інша інформація. Контекстно-адресована (асоціатив­на) пам'ять або пам'ять, що адресується за змістом, доступна за вказівкою заданого змісту. Асоціативна пам'ять надзвичайно ба­жана за створення мультимедійних інформаційних баз даних.

Управління. Розглянемо динамічну систему, задану сукупніс­тю {и(0, у(і)}, де u(t) є вхідним керуючим впливом, a y(t) — ви­ходом системи в момент часу t. У системах управління з еталон­ною моделлю мети управління є можливість розрахунку такої величини вхідного впливу u(t), при якій система рухається за ба­жаною траєкторією, що визначається еталонною моделлю.

У принципі, нейронні мережі можуть обчислювати значення будь-яких функцій, інакше кажучи, виконувати все, що можуть робити традиційні комп'ютери. На практиці для того, щоб засто­сування нейронної мережі було доцільним, необхідно, щоб задача мала такі ознаки: невідомий алгоритм або принципи розв'язання


задачі, але накопичена достатня кількість прикладів; проблема ха­рактеризується великими обсягами вхідної інформації; дані непов­ні або надмірні, містять шуми, частково суперечливі.

Отже, нейронні мережі добре підходять для розпізнавання об­разів і розв'язання задач з класифікації, оптимізації і прогнозу­вання. Нижче наведений перелік можливих застосувань нейрон-них мереж у промисловості, на базі яких або вже створені комерційні продукти, або реалізовані демонстраційні прототипи.

Банки і страхові компанії, автоматичне зчитування чеків і фі­нансових документів; перевірка достовірності підписів; оцінювання ризику для позик; прогнозування змін економічних показників.

Адміністративне обслуговування: автоматичне зчитування до­кументів; автоматичне розпізнавання штрихових кодів.

Нафтова і хімічна промисловість: аналізування геологічної інформації; ідентифікація зіпсувань обладнання; розвідування по­кладів мінералів за даними аерофотознімків; аналіз складу домі­шок; управління процесами.

Військова промисловість і аеронавтика: оброблення звукових сигналів (поділ, ідентифікація, локалізація, усунення шуму, інтер­претація); оброблення радарних сигналів (розпізнавання цілей, іден­тифікація і локалізація джерел); оброблення інфрачервоних сигналів (локалізація); узагальнення інформації; автоматичне пілотування.

Промислове виробництво: керування маніпуляторами; управ­ління якістю; управління процесами; виявлення зіпсувань; адап­тивна робототехніка; керування голосом.

Служба безпеки: розпізнавання осіб, голосів, відбитків пальців.

Біомедична промисловість: аналіз рентгенограм; виявлення відхилень в електрокардіограмах.

Телебачення і зв'язок: адаптивне управління мережею зв'язку; стиснення і відновлення зображень.

Можна продовжувати наведення прикладів вдалого викорис­тання технологій нейронних мереж. Проте є низка недоліків, по­в'язаних із застосуванням для розв'язання задач з ідентифікації взірців інформації. Головним із них є те, що для навчання нейро-мережі потрібна велика кількість фактичної інформації (кількість спостережень від 50 до 100). Для аналітичних задач у бізнесі це не завжди можна забезпечити. Крім цього, неявне навчання при­зводить до того, що структура зв'язків між нейронами стає «не­зрозумілою» — не існує іншого способу її прочитати, крім як за­пустити функціонування мережі. Стає складно відповісти на запитання: «Як нейронна мережа отримує результат?»— тобто побудувати зрозумілу людині логічну конструкцію, що відтво-


рює дії мережі. Це явище можна назвати «логічною непрозоріс­тю» нейронних мереж, навчених за неявними правилами. Навіть добре натренована нейромережа являє собою «чорний ящик», тобто систему, в якій зовнішньому спостерігачеві доступні лише вхідні та вихідні величини, а внутрішня будова її та процеси, що в ній перебігають, невідомі.


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 | 105 | 106 | 107 | 108 | 109 | 110 | 111 | 112 | 113 | 114 | 115 | 116 | 117 | 118 | 119 | 120 | 121 | 122 | 123 | 124 | 125 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.011 сек.)