Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Концепции организации хранения данных
Различают несколько вариантов концепций информацион- ных хранилищ. Первая концепция — концепция централизованного храни- лища данных (рис. 4.1). Такой подход означает, что при не- скольких источниках информации — операционных базах дан- ных — создается единое централизованное хранилище. В пер- вичных источниках данные хранятся в «сыром» (недоработан- ном) виде, т. е. в структуре информационного пространства данного источника информации или операционной базы дан- ных (БД). Вся поступающая в ИХ информация должна быть преобразована в принятую в данном ИХ структуру. Передача данных из операционных БД в ИХ, которая сопровождается 1 См.: Белов В. С. Указ. соч.— С. 33. доработкой, может быть организована по заданному времен- ному графику и правилам доработки с соблюдением принци- пов Инмона. Допускаются неожиданные запросы «на лету», что предъявляет более строгие требования к инструменталь- ным средствам ИХ1.
Рис. 4.1. Схема централизованного хранилища данных
При реализации такой концепции возникает потребность в мощном компьютере. В зависимости от масштабов предмет- ной области это будет или персональный компьютер с предель- но высокими характеристиками, особенно в части требований к объемам памяти, или майнфрейм и даже суперкомпьютер. Не- обходимо наличие развитых средств телекоммуникаций, обеспе- 1 См.: Белов В. С. Указ. соч.— С. 34. чивающих информационный обмен «операционные БД — ИХ — пользователи». Это требование относится к любому варианту концепции ИХ. Вторая концепция — концепция распределенного храни- лища данных. Возможен и имеет место противоположный подход к хранению данных на основе распределения функций ИХ по местам их возникновения или группировки нескольких операционных БД вокруг локального или регионального ин- формационного хранилища. Эти хранилища могут быть ори- ентированы на определенную предметную область или на ре- гион в корпоративных структурах. Система локальных храни- лищ действует в качестве распределенного хранилища. Не исключается и наличие центрального хранилища, но в такой структуре требования к его размерности значительно облег- чаются (рис. 4.2)1. Эта концепция предусматривает трансляцию каждого за- проса к каждому источнику (базе данных), обработку, увязыва- ние, согласование, компоновку извлеченных данных и предос- тавление их пользователю. Такой подход, несмотря на экономию ресурсов, имеет ряд недостатков: ¾ Общее время отклика системы может выйти за рамки допустимого из-за нормализованности данных в операционных базах и длительности доступа из «центра». ¾ Процесс анализа может прерваться, если не будут обес- печены постоянство нахождения в сети или открытость всех ис- точников информации. ¾ Противоречивость и несогласованность ответов из раз- личных источников могут возникнуть из-за разных форматов представления, разницы в темпах обновления, правил привязки ко времени, изменения смысловой нагрузки данных и т. д. Трудность реализации комплексного исторического обзора содержащейся в разнородных источниках информации связана с различным порядком ее хранения, и навязать единый порядок весьма затруднительно.
1 Белов В. С. Указ. соч.— С. 35.
Рис. 4.2. Схема распределенного хранилища данных
Третья концепция — концепция автономных витрин данных (Data Mart) — является одним из вариантов организации централи- зованного хранения и представления информации. Она предложе- на Ф. Ресёрч в 1991 г. При таком подходе информация, относящая- ся к крупной предметной области (например, информационному пространству крупной корпоративной системы, имеющей несколь- ко достаточно самостоятельных направлений деятельности), груп- пируется по этим направлениям в специально организованных базах данных, которые называют витринами данных. Подход является развитием концепции распределенного ИХ в части придания функций предметной ориентированности не- которым локальным ИХ. Он позволяет обойтись менее ресурсо- емкими аппаратными и программными средствами, обеспечивает повышение адаптируемости системы к изменяющимся услови- ям, расширяет доступность для внедрения. Пользователь пред- приятия или другого подразделения корпорации получает свое ИХ, обслуживающее местные потребности1.
1 Белов В. С. Указ. соч.— С. 36. Четвертая концепция — концепция единого интегрирован- ного хранилища и многих витрин данных. В 1994 г. M. Демарсет предложил объединить две концепции: единого интегрирован- ного хранилища и связанных с ним и получающих из него ин- формацию витрин данных. В таком варианте имеется крупное информационное хранилище агрегированной и подработанной информации, которое может удовлетворить потенциальные за- просы по отдельным направлениям деятельности (рис. 4.3). Объединение имеет следующие преимущества: данные за- ранее агрегируются, обеспечивается единая хронология, согла- сованы различные форматы, устраняются противоречивость и неоднозначность данных — информация приобретает необхо- димую кондицию для быстрого и достаточно полного удовле- творения необходимого множества запросов. Однако при таком объединении необходимо применять высоко- производительные аппаратные средства и специализированные мно- гомерные или гибридные программные инструментальные средства.
Рис. 4.3. Схема хранилища с витринами данных Иерархическая многоуровневая структура (ИАС) содержит следующие уровни: ¾ общекорпоративное централизованное хранилища данных; ¾ витрины данных по направлениям деятельности; ¾ локальные или региональные базы и хранилища данных; ¾ операционные базы данных, автоматизированные рабо- чие места пользователей автономных программ и ЭИС. Пунктам концентрации информации соответствуют иерар- хические уровни использования данных при подготовке, приня- тии и реализации решений, которые сопутствуют функциониро- ванию предприятия (корпорации). Например, различают уро- вень лиц, принимающих решения, который может быть совме- щен с уровнем витрин данных; уровень рабочих мест аналитиков и других заинтересованных пользователей. Рассмотренные концепции охватывают лишь те стороны функционирования ИАС, которые относятся к организации хра- нения данных. Они не определяют требования и подходы к вы- полнению анализа, способы представления данных в ИХ (на- пример, реляционный или многомерный)1.
|
Последнее изменение этой страницы: 2017-05-11; Просмотров: 409; Нарушение авторского права страницы