АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Проанализируйте понятие базы данных, методы и средства создания моделей данных

Читайте также:
  1. B) должен хорошо знать только физико-химические методы анализа
  2. Crown Victoria одна из популярных в США моделей (в полиции, такси, прокате, на вторичном рынке). Производство в Канаде. Дебют модели состоялся в 1978.
  3. I. Естественные методы
  4. I. Понятие о синонимии
  5. I. Понятие распределительной (сбытовой) логистики
  6. II. Понятие о семе и семеме.
  7. II.1.1 Разновидности метонимии и ее функция в процессе создания газетной экспрессии
  8. II.1.4. Семантический механизм создания образного сравнения
  9. II.3 Языковые средства французской рекламы
  10. V. Способы и методы обеззараживания и/или обезвреживания медицинских отходов классов Б и В
  11. V1: Методы анализа электрических цепей постоянного тока
  12. V1: Переходные процессы в линейных электрических цепях, методы анализа переходных процессов

БД – множество взаимосвязанных элементарных групп данных (информации), которые могут обрабатываться одной или несколькими прикладными системами.

Проектирование базы включает несколько этапов.

1) Концептуальное моделирование предполагает создание абстрактной модели БД, которая не зависит от выбора конкретной СУБД:

– получение инфологической модели данных;

– проверка модели данных;

– в случае проектирования распределенной БД – это получение локальных моделей данных, которые соответствуют представлениям о предметной области конкретных пользователей, находящихся в различных узлах сети.

2)Логическое проектирование – перенесение концептуального проекта БД на внутреннюю модель выбранной СУБД.

3)Физическое проектирование – процесс определения структур хранения и путей доступа к данным для достижения оптимальной производительности.

Реальным средством моделирования данных является семантическое моделирование. В качестве инструмента семантического моделирования используются различные варианты диаграмм сущность-связь (ER - Entity-Relationship).

Различают концептуальные и физические ER-диаграммы. Концептуальные диаграммы не учитывают особенностей конкретных СУБД. Физические диаграммы строятся по концептуальным и представляют собой прообраз конкретной базы данных.

Сущность - это класс однотипных объектов, инф-ция о которых должна быть учтена в модели. Экземпляр сущности - это конкретный представитель данной сущности. Атрибут сущности - это именованная характеристика, определяющая свойства данного представителя класса. Ключ сущности - это неизбыточный набор атрибутов, значения которых в совокупности являются уникальными для каждого экземпляра сущности. Связь - это некоторая ассоциация между двумя сущностями. Типы связей:- один-к-одному означает, что один экземпляр первой сущности связан с одним экземпляром второй сущности. - один-ко-многим означает, что один экземпляр первой сущности связан с несколькими экземплярами второй сущности. - много-ко-многим означает, что каждый экземпляр первой сущности может быть связан с несколькими экземплярами второй сущности, и каждый экземпляр второй сущности может быть связан с несколькими экземплярами первой сущности.

1) Rational Rose – Объектно-ориентированное CASE-средство. В основе работы Rational Rose лежит построение различного рода диаграмм и спецификаций, определяющих логическую и физическую структуры модели, ее статические и динамические аспекты.

2) ERWin- - средство разработки структуры базы данных (БД). ERwin сочетает графический интерфейс Windows, инструменты для построения ER-диаграмм, редакторы для создания логического и физического описания модели данных и прозрачную поддержку ведущих реляционных СУБД и настольных баз данных

QDesigner позволяет разрабатывать и генерировать схему БД посредством двухуровневого (концептуального и физического) моделирования реляционной БД, поддерживающего классические методики проектирования баз данных.


 

27. Охарактеризуйте основные аспекты реляционной модели данных. Продемонстрируйте использование методологии проектирования реляционных баз данных.

Особенности реляционной модели данных.

Реляционная модель представляет собой БД в виде множества взаимосвязанных отношений. В каждой связи одно отношение может выступать как основное, а другое отношение выступает в роли подчиненного. Для поддержки этих связей оба отношения должны содержать наборы атрибутов, по которым они связаны. В основном отношении это первичный ключ отношения, который однозначно определяет кортеж основного отношения. В подчиненном отношении для моделирования связи должен присутствовать вторичный ключ - он определяет множество кортежей отношения, которые связаны с единственным кортежем основного отношения. Основные понятия реляционной модели данных: отношения, кортеж, домен.

Отношение представляет собой двумерную таблицу, содержащую некоторые данные.

Домен - это подмножество значений некоторого типа данных имеющих определенный смысл.

Домен характеризуется следующими свойствами: 1. Домен имеет уникальное имя (в пределах базы данных). 2. Домен определен на некотором простом типе данных или на другом домене. 3. Домен может иметь некоторое логическое условие, позволяющее описать подмножество данных, допустимых для данного домена. 4. Домен несет определенную смысловую нагрузку.

Атрибут отношения есть пара вида <Имя_атрибута: Имя_домена>. Имена атрибутов должны быть уникальны в пределах отношения. Тело отношения содержит множество кортежей отношения. Каждый кортеж отношения представляет собой множество пар вида <Имя_атрибута: Значение_атрибута>. Для N-арного отношения кортеж представляет собой упорядоченный набор из N значений, по одному значению для каждого атрибута отношения. Методы логического проектирования реляционной базы данных. При проектировании логической структуры реляционной базы данных определяется оптимальный состав таблиц для хранения исходной информации. Для каждой таблицы указывается ее название, перечень полей и первичный ключ. Идентифицируются связи между таблицами. В рамках логического проектирования БД могут формулироваться ограничения целостности, приниматься решения о создании индексов и т. д. Наиболее часто для решения перечисленных задач используется переход к логической модели базы данных от концептуальной модели. Концептуальное моделирование предполагает создание абстрактной модели БД, которая не зависит от выбора конкретной СУБД: 1. получение инфологической модели данных; 2. проверка модели данных; 3. в случае проектирования распределенной БД – это получение локальных моделей данных, которые соответствуют представлениям о предметной области конкретных пользователей, находящихся в различных узлах сети. Метод декомпозиции (разбиения) – исходное множество отношений, входящих в схему БД заменяется другим множеством отношений, являющихся проекциями исходных отношений! При этом число отношений возрастает. Метод декомпозиции представляет собой процесс последовательной нормализации схем отношений: каждая новая итерация соответствует нормальной форме более высокого порядка и обладает лучшими свойствами по сравнению с предыдущей. Т.о., изначально предполагается существование универсального отношения, содержащего все атрибуты БД, затем на основе анализа связей между атрибутами осуществляется (или – делается попытка осуществить) декомпозиция универсального отношения, т.е. переход к нескольким отношениям меньшей размерности, причем исходное отношение должно восстанавливаться с помощью операции естественного соединения. Метод синтеза – компоновка схемы БД из заданных исходных элементарных зависимостей между объектами предметной области. Нормальные формы отношений: первая нормальная форма (1NF); вторая нормальная форма (2NF); третья нормальная форма (3NF); нормальная форма Байса-Кодда (BCNF); четвертая нормальная форма (4NF); пятая нормальная форма или форма проекции - соединения (5NF или PYNF). Основные свойства нормальных форм: 1. каждая следующая нормальная форма в некотором смысле лучше предыдущей; 2. при переходе к следующей нормальной форме свойства предыдущих нормальных свойств сохраняются. 3. Нормализация – разбиение таблицы на несколько, которые обладают лучшими свойствами при обновлении, вставке и удалении данных. Т.е. нормализация представляет собой процесс последовательной замены таблицы ее полными декомпозициями до тех пор, пока все они не будут находиться в 5НФ, однако, на практике достаточно привести таблицы к НФБК.

28. Язык SQL: назначение, возможности, типы команд.

SQL (Structured Query Language) — язык структурированных запросов, применяемый для создания, модификации и управления данными в реляционных БД.

Первый стандарт языка SQL был принят ANSI в 1986 и ISO в 1987. В настоящее время действует стандарт, принятый в 2003 году (SQL-3).

Помимо команд языков DDL, DML, DQL, DCL, команд администрирования данных и управления транзакциями в SQL выделяют команды процедурного SQL.

DECLARE Определение курсора для запроса
OPEN Открытие курсора
FETCH Считывание очередной строки
CLOSE Закрытие курсора
PREPARE Генерация плана выполнения запроса
EXECUTE Выполнение оператора SQL

DDL – язык определения данных. Позволяет создавать различные объекты БД и переопределять их структуру.

CREATE TABLE Создание новой таблицы
ALTER TABLE Изменение существующей таблицы
DROP TABLE Удаление таблицы из БД
CREATE VIEW Создание представления
ALTER VIEW Изменение представления
DROP VIEW Удаление представления
CREATE INDEX Создание индекса для таблицы
DROP INDEX Удаление индекса

DML – язык манипулирования данными. Позволяет пользователю манипулировать данными внутри объектов реляционных БД.

INSERT Вставка одной строки в таблицу
UPDATE Обновление значения столбцов или строк
DELETE Удаление строк из таблицы

DQL – язык запросов к данным. Позволяет выполнить выборку данных из базы в соответствии с заданными критериями

SELECT Конструирование запросов к базе данных

DCL – язык управления данными. Позволяет осуществлять контроль над возможностью доступа к данным внутри БД.

ALTER DATABASE Изменение набора основных объектов и ограничений всей БД
ALTER DBAREA Изменение созданной области хранения данных
ALTER PASSWORD Изменение пароля всей БД
CREATE DATABASE Создание новой БД
CREATE DBAREA Создание области хранения БД
DROP DATABASE Удаление БД
DROP DBAREA Удаление области хранения БД
CREATE SYNONYM Создание синонима БД
GRANT Предоставление прав доступа
REVOKE Лишение прав доступа

Администрирование БД — это осуществление общего управления базой данных, предполагающее возможность использования команд любого уровня.

START AUDIT Начало аудита и анализа операций внутри БД
STOP AUDIT Завершение аудита и анализа операций внутри БД

Позволяют выполнить обработку информации, объединенной в транзакцию.

COMMIT Сохранение транзакции
ROLLBACK Отмена транзакции
SAVE POINT Создание точки отката внутри групп транзакций
SET TRANSACTION Назначение имени транзакции

 


 

29. Проанализируйте различные подходы к защите баз данных. Охарактеризуйте компьютерные и некомпьютерные средства контроля данных.

Для успешной работы с базами данных, в особенности в многопользовательском режиме, любая СУБД должна включать средства защиты данных от несанкционированного доступа. При этом традиционно используются два подхода обеспечения безопасности данных – избирательный и обязательный

В рамках избирательного подхода конкретный пользователь имеет разные права (полномочия) для работы с различными объектами базы данных При обязательном подходе некоторый классификационный уровень присваивается самому объекту, а каждый пользователь имеет свой фиксированный уровень доступа. Для опознания пользователя при его входе в систему СУБД обычно просит ввести идентификатор.,Это предполагает, что нелегальный пользователь пытается войти в базу данных, используя средства СУБД. Тем не менее возможна ситуация, когда несанкционированные действия реализуются в обход СУБД с помощью копирования фрагмента базы данных или подключения к коммуникационному каналу.

Наиболее надежным способом защиты от таких действий является шифрование данных. Исходные данные шифруются с помощью специального алгоритма шифрования с применением некоторого ключа шифрования. Процедура дешифрирования информации при известном ключе шифрования выполняется достаточно просто. Алгоритм шифрования может быть широко доступен, ключ шифрования обязательно хранится в секрете.

Физические способы защиты основаны на создании физических препятствий для злоумышленника, преграждающих ему путь к защищаемой информации (строгая система пропуска на территорию и в помещения с аппаратурой или с носителями информации). Эти способы дают защиту только от "внешних" злоумышленников и не защищают информацию от тех лиц, которые обладают правом входа в помещение.


 


31. Охарактеризуйте многомерную модель данных. Продемонстрируйте метод многомерного моделирования для проектирования хранилищ данных.

Моделирование данных — область, преследующая цель структурировать данные в одну аналитическую модель, которая будет эффективно обслуживать потребности бизнеса в отчетности и анализе. Если целью является именно анализ данных, а не выполнение транзакций, используется многомерная модель данных. Технология многомерных баз данных — ключевой фактор интерактивного анализа больших массивов данных с целью поддержки принятия решения. Подобные базы данных трактуют данные как многомерные кубы. Многомерные модели данных имеют три важных области применения, связанных с проблематикой анализа данных: 1. Хранилища данных интегрируют для анализа информации из нескольких источников. 2. Системы оперативной аналитической обработки (online analytical processing — OLAP) позволяют оперативно получить ответы на запросы, охватывающие большие объемы данных в поисках общих тенденций. 3. Приложения добычи данных служат для выявления знаний за счет полуавтоматического поиска ранее неизвестных шаблонов и связей в базах данных.

Многомерные базы данных рассматривают данные как кубы, которые являются обобщением электронных таблиц на любое число измерений. Кубы поддерживают иерархию измерений и формул без дублирования их определений. Набор соответствующих кубов составляет многомерную базу данных. Комбинации значений измерений определяют ячейки куба.

Атрибуты являются квалификаторами измерений в запросах. Например, измерение "Время" (Time) может содержать атрибуты "Год", "Квартал", "Месяц", "Неделя". Атрибуты могут быть организованы в иерархии. Св-ва атрибутов измерения: 1. Имя (Name) определяет имя атрибута в терминах пользователя. 2. Код (Code) определяет техническое имя атрибута, используемое при генерировании скрипта. 3. Комментарий (Comment) определяет дополнительное описание атрибута. 4. Измерение (Dimension) определяет измерение для атрибута.

Факты представляют субъект — некий шаблон или событие, которые необходимо проанализировать; Измерения — коллекции атрибутов, которые в представлении источника данных привязаны к одному или нескольким столбцам таблицы или представления.

Мера — значение из таблицы фактов. Значение в измерении мер часто называют общим термином элемент. Мерами обычно являются числовые значения, но могут быть и строковые.

Иерархия атрибута — иерархия элементов атрибута, содержащая следующие уровни: 1. Конечный уровень, содержащий все отдельные элементы атрибута, и все элементы конечного уровня (конечные элементы). 2. Промежуточные уровни, если иерархия атрибута является иерархией типа «родители-потомки». 3. Необязательный уровень «(Все)» содержащий статистическое значение конечных элементов иерархии атрибута, элемент этого уровня называют элементом «(Все)». Гранулированность -Уровень структуризации или детализации данных. Схема «звезда» – имеются таблицы для каждого измерения, а все факты помещаются в одну таблицу, индексируемую множественным ключом, составленным из ключей отдельных измерений. Концы звезды образуются таблицами измерений, а их с таблицей фактов, расположенной в центре, образуют лучи. В схеме "звезда" каждое измерение куба содержится в одной таблице, в том числе и при наличии нескольких уровней иерархии. Схема «снежинка» – то же, что и схема звезды, но с нормализованными таблицами измерений. При такой структуре БД большинство запросов из области делового анализа объединяют центральную таблицу фактов с одной или несколькими таблицами измерений. Схема "созвездие" – получается из нескольких таблиц фактов. Через консольные или таблицы размерности сообщаются несколько таблиц фактов, отображающих несколько объектов с общими атрибутами.
Таблица измерений содержит неизменяемые или редко изменяемые данные. В каждой таблице измерений перечислены возможные значения одного из измерений гиперкуба. По одной записи для каждого члена нижнего уровня иерархии в измерении. Содержат как минимум одно описательное поле и целочисленное ключевое поле (обычно это суррогатный ключ) для однозначной идентификации члена измерения. Каждая таблица измерений должна находиться в отношении "один ко многим" с таблицей фактов. Таблица фактов – основная. Таблицы, которые содержат предварительно вычисленные на основе первичных данных, и для увеличения производительности запросов создаются по наиболее часто используемым измерениям. Содержит сведения об объектах или событиях, совокупность которых будет в дальнейшем анализироваться.


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.005 сек.)