АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Фактори успіху для здійснення інтелектуальної підтримки управління

Читайте также:
  1. II. Основні напрями роботи, завдання та функції управління
  2. VII. Система підготовки кадрів до здійснення процесу формування позитивної мотивації на здоровий спосіб життя
  3. А) розподіл навчального часу за темами для студентів-магістрів за спеціальністю 8.030109 – «Управління персоналом та економіка праці» стаціонарної форми навчання
  4. Автоматизовані системи управління проектами
  5. Адреса регістра управління завершується на: 11
  6. Актуальність проблеми управління освітою
  7. АЛГОРИТМ ДІЇ АДМІНІСТРАЦІЇ ТА ЗАСТУПНИКА ДИРЕКТОРА З ВИХОВНОЇ РОБОТИ ЗАКЛАДУ ОСВІТИ ПІД ЧАС ЗДІЙСНЕННЯ ПЕРЕВІРКИ ФАХІВЦЯМИ СЛУЖБИ У СПРАВАХ ДІТЕЙ
  8. Аналіз є однією із функцій управління
  9. Аналіз ризику та ефективності управління портфелем фінансових інвестицій.
  10. Англо-американська модель корпоративного управління
  11. База даних і система управління базою даних СППР
  12. Бази моделей і системи управління базами моделей

Оскільки інтелектуальні технології стають прийнятни­ми інструментальними засобами для СППР і ВІС, доцільно роз­глянути чинники, які визначають успіх орієнтованих на знання систем, разом з тими чинниками, які забезпечують успіх будь-якої системи, що використовується окремими фахівцями.

Зручність використання. Твердження щодо цієї властивості систем може здатися очевидним, але трудність досягнення справ­жньої, довгострокової зручності використання часто недооціню­ється всіма сторонами до початку процесу їх упровадження. Фак­тично, зручність використання систем окремими професіоналами тільки недавно стала виявленою метою процесу розроблення програмного забезпечення, а інструментальні засоби й методоло­гії для його розроблення ще не враховують цю потребу.

Зв'язність. Наскільки інтелектуальні методи мають успіх в адміністраторів стосовно доступу до широких і різних джерел Даних, настільки система стає активним фактором у підтримці логічно випливаючих рішень і настільки вона має забезпечувати зв язність джерел даних і тих точок, де рішення слід переглядати або здійснювати.

Сумісність. Оскільки інтелектуальні (основані на знаннях) технології збільшують показники потужності СППР і ВІС та змі­нюють їх здатність від пасивної до активної підтримки творців Рішень, то компанії безумовно прийдуть до того, щоб створювати їх скоріше як одну систему чи як окрему частину процесів розроб­лення та прийняття рішень, ніж як корисні доповнення до них. однак для того, щоб це могло відбутися в широких масштабах, потужність таких систем має бути сумісною з тим, що може на-иватися електро-паперовою екологією корпорації.

Легкий супровід. Супровід, нарощування і модифікування про­грамного забезпечення відповідно до змін вимог користувачів є


«Ахіллесовою п'ятою» всього програмного забезпечення, а СППР і ВІС не є в цьому плані винятком. Довготермінова корисність СППР і ВІС значною мірою залежить від здатності компанії реагувати на ці запити. Ефективні системи мають створюватися відповідно до ці­єї вимоги дуже раціонально, використовуючи інструментальні засо­би, які уможливлюють користувачам (хоча б за допомогою комп'ю­терно грамотного асистента) змінювати відповідно інтерфейс сис­теми, а також функціональні можливості без допомоги впроваджу­ючих осіб або формально визначеної технічної групи підтримки.

Додаткова вартість. Оскільки технології, що ґрунтуються на знаннях, реалізують свій потенціал у СППР і ВІС, то стає очевид­ним, що здатність використовувати цей чинник для підвищення ефективності створення рішень суттєво відрізнить перемагаючі компанії від інших конкуруючих учасників.

Машини правил

Одним із напрямів розвитку орієнтованих на правила СППР, що набули останнім часом певного розвитку і поширення, є так звані машини правич {Rule-Machines), як середовище для розроб­лення та тестування бізнес-правил, що являють собою кодифіковану політику та практику прийняття рішень в організаціях, використо­вувані з метою отримання переваг у конкуруючому бізнесовому се­редовищі. Найвідомішими з машин правил є Visual Rule Studio™ і Business Rule Studio. Оскільки докладний розгляд програмних про­дуктів, що називаються машинами правил, виходить за межі за­вдань даного видання, зацікавлені читачі зможуть знайти більше інформації про це на Web-сайті WWW.RuIeMachines.com.

9.3. Дейтамайнінг — засоби інтелектуального аналізу даних у СППР

9.3.1. Розвиток і призначення дейтамайнінгу (Data Mining)

У 70-х роках минулого століття широко застосовувалася практика, коли компанії наймали аналітиків з бізнесу, котрі, вико­ристовуючи статистичні пакети подібні SAS і SPSS, виконували аналіз трендів даних і проводили їх кластерний аналіз. Як тільки стало технологічно можливим і доцільним зберігати великі обсяги


ниХ, менеджери виявили бажання самим мати доступ до даних, подібних тим, що генеруються в пам'яті касового апарата роздріб­ної торгівлі й аналізувати їх. Запровадження штрихових кодів і гло­бальна гіпертекстова система Інтернету також зробили реальною можливість для компаній збирати великі обсяги нових даних. Однак У зв'язку з цим виникло питання про інструментальні засоби добу­вання корисної інформації з нагромаджених обсягів «сирих» даних. Ці засоби опісля отримали назву «Data Mining» (дейтамайнінг).

Слід зауважити, що протягом багатьох років компанії прово­дили статистичні дослідження своїх даних. Коли статистик аналі­зує дані, то він спочатку висуває гіпотезу про можливий зв'язок між певними даними, а потім посилає запит до бази даних і вико­ристовує відповідні статистичні методи, щоб довести або спрос­тувати сформульовану гіпотезу. Це підхід називається «режимом верифікації» («verification mode»). На противагу йому програмне забезпечення дейтамайнінгу функціонує в «режимі відкриття» (discovery mode), тобто виявляє приховані, часто невідомі для ко­ристувачів шаблони (patterns) зв'язків між даними, а не аналізує наперед створену гіпотезу щодо них.

За останні роки надзвичайно зріс інтерес до дейтамайнінгу з боку ділових користувачів, котрі вирішили скористатися перева­гами даної технології для отримання конкурентної переваги в бі­знесі (див. http://www.datamining.com/). Зростаюча зацікавленість щодо впровадження дейтамайнінгу (ДМ) у результаті закінчилася появою низки комерційних продуктів, кожен з яких має таку са­му назву, описаний низкою подібних елементів, але фактично має неоднакові функціональні можливості й ґрунтується на різ­них особливих технічних підходах.

Менеджери з інформаційних технологій, що мають завдання підібрати відповідну СППР, часто безпосередньо зустрічаються зі складними питаннями стосовно реагування на потреби бізнес-користувачів через те, що засадні принципи створення дейтамай­нінгу набагато складніші, ніж традиційні запити і формування звітів, крім того, вони відчувають підсилений тиск щодо часу ре­алізації потреб користувачів, тобто користувачі вимагають роз­робити дейтамайнінг якомога швидше. Проте очевидною пере­шкодою для розроблення і впровадження в корпораціях рішень з Дейтамайнінгу є наявність багатьох різних підходів до нього, що мають свої певні властивості й переваги, у той час як фактично тільки кількома основними методами формуються основи біль­шості систем ДМ. У цьому контексті важливою є однозначна ін-еРпретація самого поняття дейтамайнінгу.


Дейтамайнінг (Data mining) — це тип аналітичних додатків, які підтримують рішення, розшукуючи за прихованими шабло­нами (patterns) інформацію в базі даних. Цей пошук може бути зроблений або користувачем (тобто тільки за допомогою вико­нання запитів) або інтелектуальною програмою, яка автоматично розшукує в базах даних і знаходить важливі для користувача зра­зки інформації. Відповіді на інформаційні запити подаються в бажаній для користувача формі (наприклад, у вигляді діаграм, звітів тощо).

Англомовний термін «Data mining» часто перекладається як «добування даних»; «добування знань»; «добування інформації»; «аналіз, інтерпретація і подання інформації зі сховища даних»; «вибирання інформації із масиву даних». У даній книзі буде ви­користовуватися як основний термін «дейтамайнінг» — україно­мовна транскрипція початково запровадженого і однозначно вживаного в англомовній літературі терміна «Data mining».

Добування даних — це процес фільтрування великих обсягів даних для того, щоб підбирати відповідну до контексту задачі інформацію. Вживається також термін «Data surfing» (дослі­дження даних в Інтернеті). Корпорація IBM визначає ДМ, як «процес екстракції з великих баз даних заздалегідь невідомої, важливої інформації, що дає підстави для дій та використання її для розроблення критичних бізнесових рішень». Інші визначення не пов'язують ні з обсягом бази даних, ні з тим, чи використову­ється підготовлена інформація в бізнесі, але переважно ці умови загальні.

Інструментальні засоби добування даних використовують різ­номанітні методи, включаючи доказову apryMeHTauiio(case-based reasoning), візуалізацію даних, нечіткі запити й аналіз, нейроме-режі та інші. Доказову аргументацію (міркування за прецеден­тами) застосовують для пошуку записів, подібних до якогось пе­вного запису чи низки записів. Ці інструментальні засоби дають змогу користувачеві конкретизувати ознаки подібності підібра­них записів. За допомогою візуалізації даних можна легко і швид­ко оглядати графічні відображення інформації в різних аспектах (ракурсах). Ці та інші методи частково були розглянуті раніше, а детальніше будуть розглянуті далі.

Дейтамайнінг як процес виявлення в загальних масивах даних раніше невідомих, нетривіальних, практично корисних і доступ­них для інтерпретації знань, необхідних для прийняття рішень у різних галузях людської діяльності, практично має нічим не об­межені сфери застосування. Але, насамперед, методи ДМ нині


більше всього заінтригували комерційні підприємства, що ство­рюють проекти на основі сховищ даних (Data Warehousing), хоча наявність сховища даних не є обов'язковою умовою здійснення дейтамайнінгу. Досвід багатьох таких підприємств свідчить, що рівень рентабельності від застосування дейтамайнінгу може до­сягати 1000 %. Наприклад, відомі повідомлення про економічний ефект, за якого прибутки у 10—70 раз перевищували первинні витрати, що становили від 350 до 750 тис. дол. Є відомості про проект у 20 млн дол., який окупився всього за 4 місяці. Інший приклад — річна економія 700 тис. дол. за рахунок упровадження дейтамайнінгу в мережі універсамів у Великобританії.

Дейтамайнінг являє собою велику цінність для керівників і аналітиків у їх повсякденній діяльності. Ділові люди усвідомили, що за допомогою методів ДМ вони можуть отримати відчутні пе­реваги в конкурентній боротьбі. Описання інших успішних при­кладів застосування дейтамайнінгу можна знайти в літературі [39].

9.3.2. Доступне програмне забезпечення дейтамайнінгу

Як уже зазначалося, нині на ринку програмних продук­тів пропонуються десятки готових до використання систем дейта­майнінгу, причому деякі з них орієнтовані на широке охоплення технологічних засобів дейтамайнінгу, а інші ґрунтуються на спе­цифічних методах (нейромережах, деревах рішень тощо). Охарак­теризуємо найновіші системи ДМ з низкою різних підходів і мето­дів дейтамайнінгу — PolyAnalyst, MineSet, KnowlengeSTUDIO. Вузькоорієнтовані на специфічні способи добування даних систе­ми ДМ будуть згадуватися за ідентифікації найпоширеніших ме­тодів дейтамайнінгу в наступних параграфах даного розділу.

PolyAnalyst

Компанія «Мегап'ютер» виробляє і пропонує на ринку сімейство продуктів для дейтамайнінгу — PolyAnalyst. Система PolyAnalyst призначена для автоматичного і напівавтоматичного аналізу числових баз даних і добування із загальних масивів да­них практично корисних знань. PolyAnalyst відшукує багатофак-. торні залежності між змінними в базі даних, автоматично будує і тестує багатовимірні нелінійні моделі, що виражають знайдену залежність, виводить класифікаційні правила на навчальних при-


кладах, знаходить у даних багатовимірні кластери та будує алго­ритми прийняття рішень.

Нині PolyAnalyst використовується в більш ніж 20 країнах сві­ту для розв'язання задач з різних галузей людської діяльності: бі­знесу, фінансів, науки, медицини. Зараз це одна із самих потуж­них і в той же час доступних за ціною комерційних систем для дейтамайнінгу.

Основу PolyAnalyst утворюють так звані машини досліджень (Exploration engines), тобто програмні модулі, що ґрунтуються на рі­зних алгоритмах ДМ і призначені для автоматичного аналізу даних. Остання версія PolyAnalyst 4.3 містить 11 машин досліджень.

MineSetвізуальний інструмент аналітика

Компанія «Silicon Graphics» розробила систему дейта­майнінгу — MineSet, яка відрізняється специфічними особливос­тями як на концептуальному, так і на технологічному рівнях. Ак­цент при цьому робиться на унікальну процедуру візуальної інтерпретації складних взаємозв'язків у багатовимірних даних.

Система MineSet являє собою інструментарій для поглиблено­го інтелектуального аналізу даних на базі використання потужної візуальної парадигми. Характерною особливістю MineSet є ком­плексний підхід, що адаптує застосування не однієї, а кількох взаємодоповнюючих стратегій добування, аналізу й інтерпретації даних. Це дає користувачеві можливість вибирати найвідповід-ніший інструмент або ряд інструментів залежно від розв'язуваної задачі і видів використовуваних програмно-апаратних засобів. Архітектура MineSet має принципово відкритий характер — вико­ристовуючи стандартизований файловий формат, інші додатки мо­жуть постачати дані для введення в MineSet, а також використову­вати результати її роботи. Відкрита архітектура системи — це і ос­нова для майбутнього її розширення, що передбачає можливість вбудовування нових компонентів на основі концепції інтеграції (plug-in). У свою чергу, інтерфейс прикладного профамування (АРІ) дає змогу інкорпорувати елементи MineSet в автономні додатки.

KnowledgeSTUDIO

KnowledgeSTUDIO є новою версією дейтамайнінгу кор­порації з профамного забезпечення «ANGOSS» (http://www.angoss. com/). Система впроваджує найрозвинутіші методи ДМ у корпора­тивне середовище з тим, щоб підприємства могли досягати мак-


симальної вигоди від своїх інвестицій у дані. Вона забезпечує ви­соку продуктивність користувачів щодо розв'язання ділових про­блем без суттєвих зусиль на навчання, як це, наприклад, потрібно для освоєння статистичного програмного забезпечення. Крім то­го, це також потужний інструментальний засіб для аналітиків.

KnowledgeSTUDIO сумісна з основними статистичними паке­тами програм. Наприклад, ця система не тільки читає і записує файли даних, але також і генерує коди статистичного пакета SAS. Із такими властивостями стосовно статистики моделюваль-ники можуть швидко й легко адаптувати успадковані статистичні аналізи.

Система KnowledgeSTUDIO тісно інтегрується зі сховищами і вітринами даних. У такому разі дані можуть добуватися в ре­жимі In-place Mining, тобто коли вони залишаються у вітрині або сховищі даних «на місці», автоматично використовуючи для цьо­го «хвилі запитів», тобто серію тверджень SQL. Завдяки тому, що дані отримуються безпосередньо від джерела, дублювання не по­требується. Альтернативно, з метою оптимізації ДМ дані можна вибирати з їх форматом зберігання, а потім дейтамайнінг викону­ється сервером високої продуктивності, який орієнтований на формат файлів KnowledgeSTUDIO.

Технологія ДМ ANGOSS ActiveX інтегрує моделі для прогно­зування з Web-базовими додатками і бізнесовими клієнт/сер-верними додатками. Дослідження даних за допомогою викорис­тання дерев рішень і графіки може бути розширене через Інтранет і Інтернет. Можна також застосовувати Java-розв'язування для розгортання моделей. Для виконання алгоритмів обчислення в проекті KnowledgeSTUDIO передбачено використання або відда­леного «обчислювального» сервера, або локальної робочої станції.

У KnowledgeSTUDIO реалізована велика кількість методів дейтамайнінгу. Пропонується п'ять алгоритмів дерев рішень, три алгоритми нейромереж і алгоритм кластеризації «неконтрольова-ного навчання» (unsupervised). Має місце повне інтегрування з Додатками і бізнесовими процесами. Можна створювати нові до­датки або вставляти дейтамайнінг у наявні додатки. Програмова­ний комплекс KnowledgeSTUDIOSoftware (SDK) надає можли­вість розроблення додатків, наприклад створення моделей для прогнозування, з можливим використанням Visual Basic, Power­Builder, Delphi, C-H-, або Java. Формування, випробування і оціню­вання нових моделей може бути також автоматизованим. Know­ledgeSTUDIO забезпечує різні шляхи, щоб візуально виразити і до­слідити у великих базах даних зразки прихованих закономірностей.


9.3.3. Характеристика процесів і активностей дейтамайнінгу. Процеси дейтамайнінгу

Традиційно мали місце два типи статистичних аналі­зів: підтверджуючий (confirmatory analysis) і дослідницький аналіз (exploratory analysis). У підтверджуючому аналізі будь-хто має конкретну гіпотезу і в результаті аналізу або підтвер­джує, або спростовує її. Однак недоліком підтверджуючого ана­лізу є недостатня кількість гіпотез у аналітика. За дослідницько­го аналізу виявляють, підтверджуються чи спростовуються підхожі гіпотези. Тут система, а не користувач, бере ініціативу за аналізу даних.

Здебільшого термін «дейтамайнінг» використовується для описання автоматизованого процесу аналізу даних, в якому сис­тема сама бере ініціативу щодо генерування взірців, тобто дейта­майнінг належить до інструментальних засобів дослідницького аналізу.


З погляду орієнтації на процес є три типи процесів дейтамайнін-РУ (рис. 9.7): відкриття (добування) (discovery,); моделювання пе­редбачень (predictive modeling,); аналіз аномалій (forensic analysis).

Відкриття є процесом перегляду бази даних для знахо­дження невидимих взірців (pattern) без наперед визначеної ідеї або гіпотези взагалі про те, що вони можуть бути. Інакше ка­жучи, програма бере ініціативу без попередніх міркувань сто­совно того, що взірці (шаблони), які цікавлять користувачів, мають насправді місце і можуть подаватися у формі доречних запитів. У великих базах даних є так багато інформаційних ас­пектів, про які користувач практично може ніколи й не думати і не робити правильних запитів стосовно відповідних їм взір­ців. Ключовим питанням тут може бути кількість взірців, які можуть бути виражені й відкриті та якість інформації, що до­бувається. Саме цим і визначається потужність засобів від­криття (discovery) інформації.

У разі моделювання передбачень добуваються взірці з бази даних для їх використання, щоб передбачити майбутнє. Моделю­вання передбачень дає змогу користувачеві створювати записи з деякими невідомими дослідницькими значеннями, і система ви­значає ці невідомі значення, які ґрунтуються на попередніх шаб­лонах, що відкриваються з бази даних. У той час як відкриття знаходить взірці в даних, за прогнозуючого моделювання взірці застосовуються для того, щоб підібрати значення для нових еле­ментів даних, і в цьому полягає істотна відмінність між цими ви­дами процесів дейтамайнінгу.

Аналіз аномалій (forensic analysis) є процесом застосування вибраних взірців (шаблонів) для виявлення аномалій або незви­чайних елементів даних. Щоб виокремити незвичайні елементи, спершу потрібно знайти те, що є нормою, а вже потім виявляти за Допомогою заданих порогових величин ті елементи, які відхиля­ються від звичайних. Зокрема, сюди відноситься виявлення деві-тації, тобто відхилення від правильного курсу.

Кожний із цих процесів може бути далі охарактеризований виділенням відповідних прийомів. Наприклад, є кілька методів відкриття взірців: правило «ЯКЩО..., ТО», асоціації, афін-ність (суміжність) тощо. У той час, коли правило «ЯКЩО..., ТО» для людини звичне, то асоціативні правила є новими. Во­ни стосуються групування елементів даних (наприклад, коли хтось купує один продукт, то за звичкою чи збігом обставин він може купити інший продукт у той самий час; такий процес, зазвичай, пов'язаний з аналізом ринкового кошика покупця).


Потужність системи відкриття вимірюється кількістю типів і загальністю взірців, які можна знайти і виразити придатною для використання мовою.


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 | 105 | 106 | 107 | 108 | 109 | 110 | 111 | 112 | 113 | 114 | 115 | 116 | 117 | 118 | 119 | 120 | 121 | 122 | 123 | 124 | 125 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.007 сек.)