АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

ХРАНЕНИЕ ИНФОРМАЦИИ

Читайте также:
  1. Microsoft нацеливает хранение Windows 8 на информационные центры предприятия.
  2. Автоматизированная информационная поисковая система правовой информации
  3. Алфавитный подход к измерению информации.
  4. Алфавитный подход к измерению информации.
  5. Анализ диаграмм внешней передачи информации
  6. Аппаратные средства защиты информации
  7. Аттестация объектов информации
  8. Блок 3. Кодирование информации.
  9. В12. Поиск информации в базе данных по сформулированному условию
  10. В13. Знание о дискретной форме представления числовой, текстовой, графической и звуковой информации.
  11. В15. Умение определять скорость передачи информации
  12. Ввод дискретной информации в групповой поток

Хранение и накопление являются одними из основных дейст­вий, осуществляемых над информацией и главным средством обес­печения ее доступности в течение некоторого промежутка времени. В настоящее время определяющим направлением реализации этой операции является концепция базы данных, склада (хранилища) данных.

База данных может быть определена как совокупность взаимо­связанных данных, используемых несколькими пользователями и хранящихся с регулируемой избыточностью. Хранимые данные не зависят от программ пользователей, для модификации и внесения изменений применяется общий управляющий метод.

Банк данных — система, представляющая определенные услуги по хранению и поиску данных определенной группе пользователей по определенной тематике.

Система баз данных — совокупность управляющей системы, прикладного программного обеспечения, базы данных, операцион­ной системы и технических средств, обеспечивающих информаци­онное обслуживание пользователей.

Хранилище данных (ХД — используют также термины Data Warehouse, «склад данных», «информационное хранилище») — это база, хранящая данные, агрегированные по многим измерениям. Основные отличия ХД от БД: агрегирование данных; данные из ХД никогда не удаляются; пополнение ХД происходит на периодиче­ской основе; формирование новых агрегатов данных, зависящих от старых — автоматическое; доступ к ХД осуществляется на основе многомерного куба или гиперкуба.

Альтернативой хранилищу данных является концепция витрин данных (Data Mart). Витрины данных — множество тематических БД, содержащих информацию, относящуюся к отдельным инфор­мационным аспектам предметной области.

Еще одним важным направлением развития баз данных явля­ются репозитарии. Репозитарий, в упрощенном виде, можно рас­сматривать просто как базу данных, предназначенную для хране­ния не пользовательских, а системных данных. Технология репози-тариев проистекает из словарей данных, которые по мере обогаще­ния новыми функциями и возможностями приобретали черты ин­струмента для управления метаданными.

Каждый из участников действия (пользователь, группа пользо­вателей, «физическая память») имеет свое представление об ин­формации.

По отношению к пользователям применяют трехуровневое представление для описания предметной области: концептуальное, логическое и внутреннее (физическое) (рис. 4.7).

Концептуальный уровень связан с частным представлением дан­ных группы пользователей в виде внешней схемы, объединяемых общностью используемой информации. Каждый конкретный поль­зователь работает с частью БД и представляет ее в виде внешней модели. Этот уровень характеризуется разнообразием используе­мых моделей (модель «сущность—связь», ER-модель, модель Чена), бинарные и инфологические модели, семантические сети). На рис. 4.8 представлен фрагмент предметной базы данных «Сбыт» и одно из возможных его концептуальных представлений, которое отража­ет не только объекты и их свойства, но и взаимосвязи между ними.

Логический уровень является обобщенным представлением дан­ных всех пользователей в абстрактной форме. Используются три вида моделей: иерархические, сетевые и реляционные.

Сетевая модель является моделью объектов-связей, допускаю­щей только бинарные связи «многие к одному» и использует для описания модель ориентированных графов.

Иерархическая модель является разновидностью сетевой, являю­щейся совокупностью деревьев (лесом).


 
 

Реляционная модель использует представление данных в виде таблиц (реляций), в ее основе лежит математическое понятие тео­ретико-множественного отношения, она базируется на реляцион­ной алгебре и теории отношений.

Представление предметной базы данных «Сбыт» на логическом уровне для различных моделей показано на рис. 4.9.

Физический (внутренний) уровень связан со способом фактиче­ского хранения данных в физической памяти ЭВМ. Во многом оп­ределяется конкретным методом управления. Основными компо­нентами физического уровня являются хранимые записи, объеди­няемые в блоки; указатели, необходимые для поиска данных; дан­ные переполнения; промежутки между блоками; служебная инфор­мация.

По наиболее характерным признакам БД можно классифици­ровать следующим образом:

по способу хранения информации:

• интегрированные;

• Распределенные; по типу пользователя:

 

 

 

 

• монопользовательские;

• многопользовательские;

по характеру использования данных:

• прикладные;

• предметные.

В настоящее время при проектировании БД используют два подхода. Первый из них основан на стабильности данных, что обеспечивает наибольшую гибкость и адаптируемость к используе­мым приложениям. Применение такого подхода целесообразно в тех случаях, когда не предъявляются жесткие требования к эффек­тивности функционирования (объему памяти и продолжительности поиска), существует большое число разнообразных задач с изме­няемыми и непредсказуемыми запросами.

Второй подход базируется на стабильности процедур запросов к БД и является предпочтительным при жестких требованиях к эф­фективности функционирования, особенно это касается быстро­действия.

Другим важным аспектом проектирования БД является проблема интеграции и распределения данных. Господствовавшая до недавнего времени концепция интеграции данных при резком увеличении их объема, оказалась несостоятельной. Этот факт, а также увеличение объемов памяти внешних запоминающих устройств при их удешевле-

нии, широкое внедрение сетей передачи данных способствовало вне­дрению распределенных БД. Распределение данных по месту их ис­пользования может осуществляться различными способами:

1. Копируемые данные. Одинаковые копии данных хранятся в различных местах использования, так как -это дешевле передачи данных. Модификация данных контролируется централизованно;

2. Подмножество данных. Группы данных, совместимые с исход­ной базой данных, хранятся отдельно для местной обработки;

3. Реорганизованные данные. Данные в системе интегрируются при передаче на более высокий уровень;

4. Секционированные данные. На различных объектах использу­ются одинаковые структуры, но хранятся разные данные;

5. Данные с отдельной подсхемой. На различных объектах ис­пользуются различные структуры данных, объединяемые в интег­рированную систему;

6. Несовместимые данные. Независимые базы данных, спроекти­рованные без координации, требующие объединения.

Важное влияние на процесс создания БД оказывает внутреннее содержание информации. Существует два направления:

• прикладные БД, ориентированные на конкретные приложе­ния, например, может быть создана БД для учета и контроля по­ступления материалов;

• предметные БД, ориентированные на конкретный класс дан­ных, например, предметная БД «Материалы», которая может быть использована для различных приложений.

Конкретная реализация системы баз данных с одной стороны определяется спецификой данных предметной области, отражен­ной в концептуальной модели, а с другой стороны типом конкрет­ной СУБД (МВД), устанавливающей логическую и физическую ор­ганизацию.

Для работы с БД используется специальный обобщенный инст­рументарий в виде СУБД (МВД), предназначенный для управления БД и обеспечения интерфейса пользователя.

Основные стандарты СУБД:

• независимость данных на концептуальном, логическом, фи­зическом уровнях;

• универсальность (по отношению к концептуальному и логи­ческому уровням, типу ЭВМ);

• совместимость, неизбыточность;

• безопасность и целостность данных;

• актуальность и управляемость.

 

Существуют два основных направления реализации СУБД: про­граммное и аппаратное.

Программная реализация (в дальнейшем СУБД) представляет собой набор программных модулей, работает под управлением кон­кретной ОС и выполняет следующие функции:

• описание данных на концептуальном и логическом уровнях;

• загрузку данных;

• хранение данных;

• поиск и ответ на запрос (транзакцию);

• внесение изменений;

• обеспечение безопасности и целостности. Обеспечивает пользователя следующими языковыми средства­ми:

• языком описания данных (ЯОД);

• языком манипулирования данными (ЯМД);

• прикладным (встроенным) языком данных (ПЯД, ВЯД).

Аппаратная реализация предусматривает использование так на­зываемых машин баз данных (МВД). Их появление вызвано воз­росшими объемами информации и требованиями к скорости дос­тупа. Слово «машина» в термине МВД означает вспомогательный периферийный процессор. Термин «компьютер БД» — автономный процессор баз данных или процессор, поддерживающий СУБД. Основные направления МБД:

• параллельная обработка;

• распределенная логика;

• ассоциативные ЗУ;

• конвейерные ЗУ;

• фильтры данных и др.

На рис. 4.10 представлена совокупность процедур проектирова­ния БД, которые можно объединить в четыре этапа. На этапе фор­мулирования и анализа требований устанавливаются цели организа­ции, определяются требования к БД. Эти требования документиру­ются в форме, доступной конечному пользователю и проектиров­щику БД. Обычно при этом используется методика интервьюиро­вания персонала различных уровней управления.

Этап концептуального проектирования заключается в описании^, и синтезе информационных требований пользователей в первона-": чальный проект БД. Результатом этого этапа является высокоуров­невое представление информационных требований пользователей на основе различных подходов.

 

 

В процессе логического проектирования высокоуровневое представ­ление данных преобразуется в структуре используемой СУБД. Полу­ченная логическая структура БД может быть оценена количественно с помощью различных характеристик (число обращений к логическим записям, объем данных в каждом приложении, общий объем данных и т.д.). На основе этих оценок логическая структура может быть усо­вершенствована с целью достижения большей эффективности.

На этапе физического проектирования решаются вопросы, свя­занные с производительностью системы, определяются структуры хранения данных и методы доступа.

Весь процесс проектирования БД является итеративным, при этом каждый этап рассматривается как совокупность итеративных процедур, в результате выполнения которых получают соответст­вующую модель.

 

Взаимодействие между этапами проектирования и словарной системой необходимо рассматривать отдельно. Процедуры проек­тирования могут использоваться независимо в случае отсутствия словарной системы. Сама словарная система может рассматривать­ся как элемент автоматизации проектирования.

Этап расчленения БД связан с разбиением ее на разделы и син­тезом различных приложений на основе модели. Основными фак­торами, определяющими методику расчленения, помимо указан­ных на рис. 4.10 являются: размер каждого раздела (допустимые размеры); модели и частоты использования приложений; структур­ная совместимость; факторы производительности БД. Связь между разделом БД и приложениями характеризуется идентификатором типа приложения, идентификатором узла сети, частотой использо­вания приложения и его моделью.

Модели приложений могут быть классифицированы следую­щим образом:

1. Приложения, использующие единственный файл;

2. Приложения, использующие несколько файлов, в том числе:

• допускающие независимую параллельную обработку;

• допускающие синхронизированную обработку.

Сложность реализации этапа размещения БД определяется многовариантностью. Поэтому на практике рекомендуется в пер­вую очередь рассмотреть возможность использования определен­ных допущений, упрощающих функции СУБД, например, допусти­мость временного рассогласования БД, осуществление процедуры обновления БД из одного узла и др. Такие допущения оказывают большое влияние на выбор СУБД и рассматриваемую фазу проек­тирования.

Средства проектирования и оценочные критерии используют­ся на всех стадиях разработки. Любой метод проектирования (аналитический, эвристический, процедурный), реализованный в виде программы, становится инструментальным средством проек­тирования, практически не подверженным влиянию стиля проек­тирования.

. В настоящее время неопределенность при выборе критериев яв­ляется наиболее слабым местом в проектировании БД. Это связано с трудностью описания и идентификации бесконечного числа аль­тернативных решений. При этом следует иметь в виду, что сущест­вует много признаков оптимальности, являющихся неизмеримыми, им трудно дать количественную оценку или представить их в виде целевой функции. Поэтому оценочные критерии принято делить на количественные и качественные. Наиболее часто используемые критерии оценки БД, сгруппированные в такие категории, пред­ставлены ниже.

Количественные критерии: время, необходимое для ответа на запрос, стоимость модификации, стоимость памяти, время на соз­дание, стоимость на реорганизацию.

Качественные критерии: гибкость, адаптивность, доступность для новых пользователей, совместимость с другими системами, возможность конвертирования в другую вычислительную среду, возможность восстановления, возможность распределения и рас­ширения.

Трудность в оценке проектных решений связана также с раз­личной чувствительностью и временем действия критериев. На­пример, критерий эффективности обычно является краткосрочным и чрезвычайно чувствительным к проводимым изменениям, а та­кие понятия, как адаптируемость и конвертируемость, проявляют­ся на длительных временных интервалах и менее чувствительны к воздействию внешней среды.

Предназначение склада данных — информационная поддержка принятия решений, а не оперативная обработка данных. Потому база данных и склад данных не являются одинаковыми понятиями. Архитектура ХД представлена на рис. 4.11.


Основные принципы организации хранилищ данных следую­щие

1. Предметная ориентация. В оперативной базе данных обычно поддерживается несколько предметных областей, каждая из кото­рых может послужить источником данных для ХД. Например, для магазина, торгующего видео- и музыкальной продукцией, интерес представляют следующие предметные области: клиенты, видеокас­сеты, CD-диски и аудиокассеты, сотрудники, поставщики. Явно прослеживается аналогия между предметными областями ХД и классами объектов в объектно-ориентированных базах данных. Это говорит о возможности применения методов проектирования, при­меняемых в объектно-ориентированных СУБД.

2. Средства интеграции. Приведение разных представлений од­них и тех же сущностей к некоторому общему типу.

3. Постоянство данных. В ХД не поддерживаются операции мо­дификации в смысле традиционных баз данных. В ХД поддержива­ется модель «массовых загрузок» данных, осуществляемых в задан­ные моменты времени по установленным правилам в отличие от традиционной модели индивидуальных модификаций.

4. Хронология данных. Благодаря средствам интеграции реали­зуется определенный хронологический временной аспект, прису­щий содержимому ХД.

Основные функции репозитариев:

• парадигма включения/выключения и некоторые формальные процедуры для объектов;

• поддержка множественных версий объектов и процедуры управления конфигурациями для объектов;

• оповещение инструментальных и рабочих систем об интере­сующих их событиях;

• управление контекстом и разные способы обзора объектов репозитария;

• определение потоков работ.

Рассмотрим кратко основные направления научных исследова­ний в области баз данных:

• развитие теории реляционных баз данных;

• моделирование данных и разработка конкретных моделей разнообразного назначения;

• отображение моделей данных, направленных на создание ме­тодов их преобразования и конструирования коммутативных ото­бражений, разработку архитектурных аспектов отображения моде­лей данных и спецификаций определения отображений для кон­кретных моделей данных;

• создание СУБД с мультимодельным внешним уровнем, обес­печивающих возможности отображения широко распространенных моделей;

• разработка, выбор и оценка методов доступа;

• создание самоописываемых баз данных, позволяющих приме­нять единые методы доступа для данных и метаданных;

• управление конкурентным доступом;

• развитие системы программирования баз данных и знаний, которые обеспечивали бы единую эффективную среду как для раз­работки приложений, так и для управления данными;

• совершенствование машины баз данных;

• разработка дедуктивных баз данных, основанных на приме­нении аппарата математической логики и средств логического программирования, а также пространственно-временных баз дан­ных;

• интеграция неоднородных информационных ресурсов.

 


Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.01 сек.)