На бирже курсовых и дипломных проектов можно найти образцы готовых работ или получить помощь в написании уникальных курсовых работ, дипломов, лабораторных работ, контрольных работ, диссертаций, рефератов. Так же вы мажете самостоятельно повысить уникальность своей работы для прохождения проверки на плагиат всего за несколько минут.

ЛИЧНЫЙ КАБИНЕТ 

 

Здравствуйте гость!

 

Логин:

Пароль:

 

Запомнить

 

 

Забыли пароль? Регистрация

Повышение уникальности

Предлагаем нашим посетителям воспользоваться бесплатным программным обеспечением «StudentHelp», которое позволит вам всего за несколько минут, выполнить повышение уникальности любого файла в формате MS Word. После такого повышения уникальности, ваша работа легко пройдете проверку в системах антиплагиат вуз, antiplagiat.ru, etxt.ru или advego.ru. Программа «StudentHelp» работает по уникальной технологии и при повышении уникальности не вставляет в текст скрытых символов, и даже если препод скопирует текст в блокнот – не увидит ни каких отличий от текста в Word файле.

Результат поиска


Наименование:


Реферат Понятие хранилищ данных. Отличие хранилищ от традиционных баз данных. Особенности хранилищ данных.

Информация:

Тип работы: Реферат. Добавлен: 2.6.2013. Сдан: 2013. Страниц: 9. Уникальность по antiplagiat.ru: < 30%

Описание (план):


1. Понятие хранилищ данных. Отличие хранилищ от традиционных баз данных. Особенности хранилищ данных.
Понятие хранилища данных
Хранилище данных (англ. Data Warehouse) - предметно-ориентированный, интегрированный, зависимый от времени набор данных, предназначенный для поддержки принятия решений различными группами пользователей.
Так как хранилище носит предметно-ориентированный характер, его организация нацелена на содержательный анализ информации, а не на автоматизацию бизнес-процессов. Это свойство определяет архитектуру построения хранилища и принципы проектирования модели данных, отличные от тех, что применяются в оперативных системах.
ХД строится на базе клиент-серверной архитектуры, реляционной СУБД и утилит поддержки принятия решений.

К хранилищу присоединяются сторонние программные продукты, которые делают модели, основанные на интеллектуальном, а не статистическом анализе данных и получают скрытые закономерности. Но включают они генетические алгоритмы, нейронные сети, нелинейная динамика, кластеризация, гибридные системы - достаточно большое количество технологий для построения моделей в хранилище. Это необходимо тогда, когда когда количество данных таково, что прямой поиск и статистические методы анализа результата не дают.
Основные составляющие Хранилища данных:
Предметная ориентированность
Локальные базы данных содержат мегабайты информации, абсолютно не нужной для анализа (адреса, почтовые индексы, идентификаторы записей и др.). Подобная информация не заносится в хранилище, что ограничивает спектр рассматриваемых данных при принятии решения до минимума.
Для принятия решений требуется некоторая строго определенная совокупность данных, которая и вытаскивается из БД в ХД, второстепенные ненужные атрибуты отсеиваются.
Интегрированность (целостность и внутренняя взаимосвязь)
Несмотря на то что данные погружаются из различных источников, но они объединены едиными законами именования, способами измерения атрибутов и др. Это имеет большое значение для корпоративных организаций, в которых одновременно могут эксплуатироваться различные по своей архитектуре вычислительные системы, представляющие одинаковые данные по-разному. Например, могут использоваться несколько различных форматов представления дат или один и тот же показатель может называться по-разному. В процессе погружения подобные несоответствия устраняются автоматически. Это самая трудоемкая часть создания ХД.
Временная привязка
Оперативные системы охватывают небольшой интервал времени, что достигается за счет периодического архивирования данных. ХД, напротив, содержит данные, накопленные за большой интервал времени (от пяти-семи до десятков лет).
Неразрушаемая совокупность данных.
Модификация данных не производится, поскольку может привести к нарушению их целостности.
Расхождения в требованиях между БД и ХД
Традиционные данные, хранимые в БД Данные для принятия решений
Детализированы Обобщены и очищены
Точны в момент доступа Представляют значение на указанное время
Могут корректироваться Не корректируются, если попали в хранилище
Требования к способам дальнейшей обработки выясняются заранее Требования к способам дальнейшей обработки не имеют первостепенного значения
Чувствительны к производительности БД, поэтому к ним предъявляются жесткие требования Мягкие требования к производительности БД
Обрабатывается один элемент данных за один запрос Обрабатывается множество элементов данных за один запрос
Ориентированы на приложения Ориентированы на анализ
Высокая степень доступности Относительная доступность
Контролируется целостность всех данных Контролируется целостность подмножества данных
Данные не избыточны Данные избыточны
Массивы данных маленькие и используются редко Массивы используются широко и могут быть многомерными
Поддерживают ежедневные операции Поддерживают периодический анализ
Почему нельзя использовать традиционные БД в процессе принятия решений?
Если БД невелика, узкоспециализироана и имеется квалифицированный программист, способный писать нестандартные запросы, собирающие данные в массив и анализирующие эти данные, то вместо ХД можно использовать обычную БД. Хранилище же предназначено не для программиста - им должен суметь воспользоваться аналитик, руководитель, человек, не владеющий навыками написания сложных запросов.
Недостатки использования БД в поддержке принятия решений:
· недостоверность данных;
· низкая производительность при нестандартных запросах;
· невозможность преобразования разнородных данных, так как они часто не имеют меток времени;
· Проблемы при подготовке отчетов возникают из-за того, что:
o трудно понять, где находятся данные, необходимые для анализа и принятия решения;
o большинство БД ориентировано только на стандартные запросы;
· требуется привлекать программистов для выполнения нестандартных запросов.
Особенности хранилищ данных:
· Хранилища данных содержат информацию, собранную из нескольких оперативных баз данных.
· Хранилища, как правило, на порядок больше оперативных баз, зачастую имея объем от сотен гигабайт до нескольких терабайт.
· Как правило, хранилище данных поддерживается независимо от оперативных баз данных организации, поскольку требования к функциональности и производительности аналитических приложений отличаются от требований к транзакционным системам.
· Хранилища данных создаются специально для приложений поддержки принятия решений и предоставляют накопленные за определенное время, сводные и консолидированные данные, которые более приемлемы для анализа, чем детальные индивидуальные записи.
· Рабочая нагрузка состоит из нестандартных, сложных запросов, которые обращаются к миллионам записей и выполняют огромное количество операций сканирования, соединения и агрегирования. Время ответа на запрос в данном случае важнее, чем пропускная способность.

2. Основные понятия многомерной модели данных
Понятие о кубах
OLAP (англ. online analytical processing, аналитическая обработка в реальном времени) - технология обработки данных, заключающаяся в подготовке суммарной (агрегированной) информации на основе больших массивов данных, структурированных по многомерному принципу.
OLAP-структура, созданная из рабочих данных, называется OLAP-куб. Куб создаётся из соединения таблиц с применением схемы звезды или схемы снежинки. В центре схемы звезды находится таблица фактов, которая содержит ключевые факты, по которым делаются запросы. Множественные таблицы с измерениями присоединены к таблице фактов. Эти таблицы показывают, как могут анализироваться агрегированные реляционные данные. Количество возможных агрегирований определяется количеством способов, которыми первоначальные данные могут быть иерархически отображены.
Куб потенциально содержит всю информацию, которая может потребоваться для ответов на любые запросы. Исходя из этого, создание отчета выполняется гораздо эффективнее, поскольку не требует выполнения сложного запроса.
Вид трехмерного куба
В самом простейшем трехмерном виде куб можно нарисовать так:

На пересечении измерений получается ячейка с определенным значением показателя - факта. В данном случае имеется фирма, которая занимается продажей автомобилей нескольких марок, менеджеры по продажам и временная ось. На пересечениях находятся объемы продаж каждой марки каждым менеджером за период.
Основные понятия многомерной модели данных
Показатель - это величина (обычно числового типа), которая собственно и является предметом анализа, т.е. фактом. Один OLAP-куб может обладать одним или несколькими показателями.
Многомерный куб с несколькими таблицами фактов

Типы показателей:
· Аддитивные показатели агрегируются со всеми измерениями, включенными в группы ........




Перейти к полному тексту работы


Скачать работу с онлайн повышением уникальности до 90% по antiplagiat.ru, etxt.ru или advego.ru


Смотреть похожие работы


* Примечание. Уникальность работы указана на дату публикации, текущее значение может отличаться от указанного.