АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Характеристика технології оперативного аналітичного оброблення даних OLAP

Читайте также:
  1. A. Характеристика нагрузки на организм при работе, которая требует мышечных усилий и энергетического обеспечения
  2. I. Краткая характеристика группы занимающихся
  3. I. Общая характеристика договора продажи недвижимости
  4. II. Загальна характеристика ХНАДУ
  5. III. Характеристика ведомственных целевых программ и мероприятий подпрограммы
  6. III. Характеристика ведомственных целевых программ и мероприятий подпрограммы
  7. III. Характеристика ведомственных целевых программ и мероприятий подпрограммы
  8. III. Характеристика ведомственных целевых программ и мероприятий подпрограммы
  9. III.3.1. Общая характеристика и тенденция развития Правительства Российской Федерации
  10. III.4.1. Общая характеристика и тенденции развития федеральных органов исполнительной власти
  11. III.5.1.Становление судебной власти в России. Общая характеристика судебной системы
  12. III.6.1.Общая характеристика государственного устройства России

OLAP (OnLine Analytical Processing), технологія оперативного аналітичного оброблення даних, - це особливий підхід до оброблення даних що розвинувся разом з появою спеціальних засобів збереження та аналізу накопичених облікових даних (сховищ даних).

OLAP-програми являють собою сукупність засобів багатовимірного аналізу даних, накопичених у сховищі даних.

 

Користувачу OLAP надається інтуїтивно зрозуміла модель даних, організована у вигляді багатовимірних кубів (Cubes).

Осями - вимірами (Dimensions) багатовимірної системи координат слугують основні атрибути аналізованого бізнес-процесу (наприклад, для процесу продажів - товар, регіон, тип покупця).

Значення, що відкладаються на осях кубу, називаються членами виміру (members). Члени виміру можуть утворювати ієрархії, що складаються з декількох рівнів. Наприклад, для виміру «Час» ієрархією може бути «Роки ® квартали ® місяці ® тижні ® дні».

На перетинаннях вимірів знаходяться дані, що кількісно характеризують процес - міри (Measures), або показники, (наприклад, обсяги продажів, витрати).

 

Системи на основі OLAP дають змогу аналітикам і менеджерам, що потребують оперативного прийняття рішень, досягти розуміння процесів, що відбуваються на підприємстві, шляхом швидкого інтерактивного доступу до даних у сховищі і виконання над ними різноманітних аналітичних операцій:

зріз; поворот; згортання; розгортання; проекція; агрегування; розрахункові операції.

 

Термін OLAP вперше запропонував у 1993 р. Е.Ф. Кодд, відомий дослідник в галузі баз даних, коли він сформулював 12 визначальних принципів OLAP. У 1995 р. до них були додані ще 6. Вони розподіляються на такі групи:

1. Базові характеристики (багатовимірне подання даних, інтуїтивне маніпулювання даними, доступність, пакетне отримання даних, моделі аналізу OLAP, архітектура клієнт-сервер, прозорість, багатокористувацька підтримка).

2. Спеціальні характеристики (обробка ненормалізованих даних, збереження результатів OLAP, виокремлення відсутніх значень, ігнорування відсутніх значень при аналізі).

3. Особливості подання звітів (гнучкість формування звітів, стандартна продуктивність, автоматичне налаштовування фізичного рівня).

4. Управління вимірами (універсальність вимірів, необмежена кількість вимірів і рівнів агрегації, необмежені операції між даними вимірів).

 

Пізніше визначення Кодда було перероблене у так званий тест FASMI (Fast Analysis of Shared Multidimensional Information - швидкий аналіз розділюваної багатовимірної інформації), який вимагає, щоб OLAP-програма надавала такі можливості:

· Висока швидкість. Аналіз має виконуватись однаково швидко по всіх аспектах інформації. При цьому допустимий час відгуку складає не більше 5 секунд.

· Аналіз. Забезпечення можливості проводити основні типи числового і статистичного аналізу, який може бути завчасно визначений розробником застосування або довільно визначатися користувачем.

· Розділення доступу. Доступ до даних має бути багатокористувацьким, при цьому має контролюватись доступ до конфеденційної інформації.

· Багатовимірність. Забезпечення багатовимірного концептуального подання даних, включаючи повну підтримку ієрархії.

· Робота з інформацією. Застосування повинно мати можливість звертатися до будь-якої потрібної інформації, незалежно від її обсягу і місця зберігання.

Різновиди OLAP

В залежності від способу зберігання інформації прикладні програми OLAP поділяються на такі види:

· MOLAP (Multidimentional OLAP) - коли і детальні дані, і їх агрегати зберігаються у багатовимірній БД. При цьому забезпечується велика продуктивність роботи, але збільшуються витрати пам'яті;

· ROLAP (Relational OLAP) - коли докладні дані зберігаються у реляційній БД; агрегати зберігаються у тій же БД у спеціально створених службових таблицях. У цьому разі досягається економія пам'яті;

· HOLAP (Hybrid OLAP) - докладні дані зберігаються у реляційній БД, а агрегати - у багатовимірній БД.

Засоби OLAP-аналізу компанії Microsoft

У комплект Microsoft SQL Server 2000 входить повнофункціональний OLAP-сервер - Analysis Services, який крім засобів побудови сховищ даних і OLAP містить засоби здобування даних (Data Mining), засоби управління доступом до даних і безпекою, надає можливості для створення розподілених сховищ даних.

У ролі OLAP-клієнта OLAP Services може використовуватися Microsoft Excel 2000.

Засоби OLAP-аналізу корпорації Oracle

Корпорація Oracle розробила сімейство продуктів Oracle Express, яке об’єднує серверні і клієнтські засоби управління та аналізу багатовимірних даних:

· Oracle Express Server - сервер багатовимірних баз даних, що забезпечує їх створення й використання в процесі аналізу;

· Oracle Express Administrator - інтерфейсний програмний засіб для реалізації серверних функцій у зручному для користувача середовищі;

· Personal Express - система управління багатовимірними базами даних для персональних комп'ютерів;

· Oracle Express Objects - об'єктно-орієнтований інструментальний засіб для професійної розробки прикладних програм клієнт/серверної архітектури;

· Oracle Express Analyzer - засіб аналізу багатовимірних даних і підготовки презентацій, орієнтований на кінцевого користувача;

· Oracle Financial Analyzer - розподілена система OLAP-програм для планування, контролю та підготовки звітності з фінансової діяльності;

· Oracle Sales Analyzer - засіб OLAP-аналізу корпоративних даних для підрозділів продажів і маркетингу;

· Oracle Express Web Publisher та Oracle Express Web Agent - програмні продукти для підготовки Web-орієнтованих аналітичних прикладних програм.

 

Сховища даних

Сховище даних (Data Warehouse) являє собою предметно-орієнтоване, прив'язане до часу і незмінне зібрання даних для підтримки процесу прийняття керуючих рішень. Дані у сховище надходять з баз даних оперативних систем, призначених для автоматизації бізнес-процесів, а також із зовнішніх джерел, наприклад, із статистичних звітів.

Головне призначення сховища - надати інформацію для аналізу в одному місці і у простій, зрозумілій структурі.

Необхідність розробки сховищ даних обумовлена факторами:

· виникнення технології оперативного аналітичного оброблення даних OLAP і на її основі СППР. Призначенням OLAP-технології є реалізація аналітичних запитів;

· СППР на базі OLAP погано сполучаються з транзакційними системами оперативного оброблення даних (OLTP-системами). Одночасне вирішення оперативних і аналітичних запитів на одній базі даних часто призводить до нестачі ресурсів;

· досить часто на підприємстві чи в організації функціонує декілька OLTP-систем, кожна з яких має свою окрему базу даних, у яких використовуються різні структури даних, способи кодування, одиниці вимірювання. Побудова зведеного аналітичного запиту на основі декількох баз даних є складною проблемою, яка спочатку потребує вирішення проблеми узгодженості даних з різних баз даних.

Винахідник сховищ даних Білл Інмон у 1992 році визначив їх особливості:

· предметна орієнтація: дані у сховищі організовані відповідно до основних напрямів діяльності підприємства (замовники, продажі, склад), а не до процесів, як в оперативних БД;

· інтегрованість: первинні дані оперативних БД перед введенням у сховище даних перевіряються, вибираються, приводяться до одного вигляду, необхідною мірою агрегуються;

· підтримка хронології: дані у сховищі нагромаджуються у вигляді історичних пластів, що дає змогу аналізувати зміну показників у часі;

· незмінність: дані, завантажені у сховище, не підлягають змінам. З ними можливі лише операції їх первинного завантаження, пошуку, читання, агрегації;

· мінімальна надлишковість: забезпечується фільтрацією та очищенням даних OLTP-систем перед їх завантаженням у сховище.

Архітектура сховищ даних

Сховища даних можуть включати такі компоненти:

· віртуальне сховище даних - репозиторій метаданих, які описують джерела надходження інформації, структуру даних сховища, методи агрегації та завантаження даних, відомості про структуру бізнес-понять та інші дані про дані, що зберігаються у сховищі;

· корпоративні сховища даних - вміщують інформацію, зібрану із певної множини оперативних БД, яка характеризує всю корпорацію і необхідна для виконання консолідованого аналізу діяльності корпорації в цілому;

· кіоски або вітрини даних (data marts) - це певна підмножина корпоративних даних, які характеризують конкретний аспект діяльності корпорації, наприклад, облік запасів чи маркетинг. У вітрини даних інформація надходить або зі сховища (залежні вітрини), або безпосередньо із джерел даних, проходячи попередні узгодження та перетворення (незалежні вітрини).

В останні часи з’явилось поняття глобального сховища даних, яке розглядається як єдине джерело інтегрованих даних для всіх вітрин даних.

 

Моделі сховищ даних

Сховища даних слугують місцем збереження та джерелом інформації для засобів оперативного аналітичного оброблення даних OLAP і можуть мати різну модель побудови - MOLAP (багатовимірну), ROLAP (реляційну) або HOLAP (гібридну).

 


1 | 2 | 3 | 4 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.006 сек.)