Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Концепции организации хранения данных



Различают несколько вариантов концепций информацион- ных хранилищ.

Первая концепция — концепция централизованного храни- лища данных (рис. 4.1). Такой подход означает, что при не- скольких источниках информации — операционных базах дан- ных — создается единое централизованное хранилище. В пер- вичных источниках данные хранятся в «сыром» (недоработан- ном) виде, т. е. в структуре информационного пространства данного источника информации или операционной базы дан- ных (БД). Вся поступающая в ИХ информация должна быть преобразована в принятую в данном ИХ структуру. Передача данных из операционных БД в ИХ, которая сопровождается

 
 

1 См.: Белов В. С. Указ. соч.— С. 33.


доработкой, может быть организована по заданному времен- ному графику и правилам доработки с соблюдением принци- пов Инмона. Допускаются неожиданные запросы «на лету», что предъявляет более строгие требования к инструменталь- ным средствам ИХ1.

 
 

 

Рис. 4.1. Схема централизованного хранилища данных

 

При реализации такой концепции возникает потребность в мощном компьютере. В зависимости от масштабов предмет- ной области это будет или персональный компьютер с предель- но высокими характеристиками, особенно в части требований к объемам памяти, или майнфрейм и даже суперкомпьютер. Не- обходимо наличие развитых средств телекоммуникаций, обеспе-

 
 

1 См.: Белов В. С. Указ. соч.— С. 34.


чивающих информационный обмен «операционные БД — ИХ — пользователи». Это требование относится к любому варианту концепции ИХ.

Вторая концепция — концепция распределенного храни- лища данных. Возможен и имеет место противоположный подход к хранению данных на основе распределения функций ИХ по местам их возникновения или группировки нескольких операционных БД вокруг локального или регионального ин- формационного хранилища. Эти хранилища могут быть ори- ентированы на определенную предметную область или на ре- гион в корпоративных структурах. Система локальных храни- лищ действует в качестве распределенного хранилища. Не исключается и наличие центрального хранилища, но в такой структуре требования к его размерности значительно облег- чаются (рис. 4.2)1.

Эта концепция предусматривает трансляцию каждого за- проса к каждому источнику (базе данных), обработку, увязыва- ние, согласование, компоновку извлеченных данных и предос- тавление их пользователю.

Такой подход, несмотря на экономию ресурсов, имеет ряд

недостатков:

¾ Общее время отклика системы может выйти за рамки допустимого из-за нормализованности данных в операционных базах и длительности доступа из «центра».

¾ Процесс анализа может прерваться, если не будут обес- печены постоянство нахождения в сети или открытость всех ис- точников информации.

¾ Противоречивость и несогласованность ответов из раз- личных источников могут возникнуть из-за разных форматов представления, разницы в темпах обновления, правил привязки ко времени, изменения смысловой нагрузки данных и т. д.

Трудность реализации комплексного исторического обзора содержащейся в разнородных источниках информации связана с различным порядком ее хранения, и навязать единый порядок весьма затруднительно.

 

 

1 Белов В. С. Указ. соч.— С. 35.


 

 

Рис. 4.2. Схема распределенного хранилища данных

 

Третья концепция — концепция автономных витрин данных (Data Mart) — является одним из вариантов организации централи- зованного хранения и представления информации. Она предложе- на Ф. Ресёрч в 1991 г. При таком подходе информация, относящая- ся к крупной предметной области (например, информационному пространству крупной корпоративной системы, имеющей несколь- ко достаточно самостоятельных направлений деятельности), груп- пируется по этим направлениям в специально организованных базах данных, которые называют витринами данных.

Подход является развитием концепции распределенного ИХ в части придания функций предметной ориентированности не- которым локальным ИХ. Он позволяет обойтись менее ресурсо- емкими аппаратными и программными средствами, обеспечивает повышение адаптируемости системы к изменяющимся услови- ям, расширяет доступность для внедрения. Пользователь пред- приятия или другого подразделения корпорации получает свое ИХ, обслуживающее местные потребности1.

 

1 Белов В. С. Указ. соч.— С. 36.


Четвертая концепция — концепция единого интегрирован- ного хранилища и многих витрин данных. В 1994 г. M. Демарсет предложил объединить две концепции: единого интегрирован- ного хранилища и связанных с ним и получающих из него ин- формацию витрин данных. В таком варианте имеется крупное информационное хранилище агрегированной и подработанной информации, которое может удовлетворить потенциальные за- просы по отдельным направлениям деятельности (рис. 4.3).

Объединение имеет следующие преимущества: данные за- ранее агрегируются, обеспечивается единая хронология, согла- сованы различные форматы, устраняются противоречивость и неоднозначность данных — информация приобретает необхо- димую кондицию для быстрого и достаточно полного удовле- творения необходимого множества запросов.

Однако при таком объединении необходимо применять высоко- производительные аппаратные средства и специализированные мно- гомерные или гибридные программные инструментальные средства.

 

    СУБД Локальные Учетные документы системы Электронные Внешние архивы источники Централизованное хранилище данных
Витрина данных Витрина данных  
    Отдел продаж Отдел закупок Отдел маркетинга

 

Рис. 4.3. Схема хранилища с витринами данных


Иерархическая многоуровневая структура (ИАС) содержит следующие уровни:

¾ общекорпоративное централизованное хранилища данных;

¾ витрины данных по направлениям деятельности;

¾ локальные или региональные базы и хранилища данных;

¾ операционные базы данных, автоматизированные рабо- чие места пользователей автономных программ и ЭИС.

Пунктам концентрации информации соответствуют иерар- хические уровни использования данных при подготовке, приня- тии и реализации решений, которые сопутствуют функциониро- ванию предприятия (корпорации). Например, различают уро- вень лиц, принимающих решения, который может быть совме- щен с уровнем витрин данных; уровень рабочих мест аналитиков и других заинтересованных пользователей.

Рассмотренные концепции охватывают лишь те стороны функционирования ИАС, которые относятся к организации хра- нения данных. Они не определяют требования и подходы к вы- полнению анализа, способы представления данных в ИХ (на- пример, реляционный или многомерный)1.

 


Поделиться:



Последнее изменение этой страницы: 2017-05-11; Просмотров: 404; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.014 с.)
Главная | Случайная страница | Обратная связь