Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


База метаданных информационного хранилища



Управление ИАС осуществляется посредством использова- ния метаданных, т. е. данных о том, что они представляют со- бой, как хранятся, и, по существу, содержат общую информа- цию о предметной области.

Благодаря их использованию предоставляется информация, необходимая для автоматизации процессов сбора, преобразова- ния и загрузки данных в ИХ и использования всей ИАС.

Проектирование ИХ, разработка сценариев OLAP и интел- лектуального анализа начинаются с формирования массивов метаданных, которые реализуются соответствующими про- граммными модулями. Этими модулями описываются атрибуты метаданных, проверяется их корректность, создается физическая

 

1 См.: Белов В. С. Указ. соч.— С. 37.


структура хранения, обеспечивается вызов для реализации за- данных в сценарии анализа функций.

Метаданные (МД) можно разделить на два типа (бизнес- метаданные и технические метаданные), которые позволяют ориентироваться в огромном объеме информации.

Бизнес-метаданные служат в основном интересам пользо- вателя. К ним относятся определения данных, обозначения ат- рибутов и областей, привязка данных ко времени, бизнес- правила, соотношения данных, их охват.

Технические метаданные используются службой админист- ратора. К ним относятся сведения о времени обновления и пре- образовании данных, права доступа и т. д. В связи со сложно- стью потоков данных из операционных БД технические МД не- обходимы для работы многих программ.

Рассмотрим более подробно состав бизнес-метаданных и тех- нических метаданных.

В состав бизнес-метаданных входят:

¾ определенные объекты;

¾ иерархии;

¾ столбцы углубления;

¾ столбцы анализа;

¾ столбец фактических значений в прогнозных или бюджетных документах;

¾ столбцы бюджетных значений в прогнозных или бюджетных документах;

¾ временные измерения;

¾ значения, определяющие успех предприятия;

¾ категории и классификации данных;

¾ сведения о зависимых и независимых переменных;

¾ вид анализа и ограничений и т. д.

В состав технических метаданных входят:

¾ структура и семантика данных;

¾ алгоритмы агрегирования;

¾ сведения о разграничениях доступа и защите информации;

¾ периодичность загрузки и очистки;

¾ права собственности на информацию;


¾ поисковые таблицы, перечень и правила исключений;

¾ другие данные, относящиеся к техническому сопровож- дению1.

Под МД понимают также сведения в виде некоего справоч- ника — репозитория, который помогает пользователям и ли- цам, обеспечивающим функционирование ИАС, ориентировать- ся в содержащихся в ИХ данных. Репозиторий является одним из центральных блоков инструментальной части ИАС.

При разработке ИХ группа проектировщиков на основе рас- смотрения требований пользователей, в которую входят их представители и работники ИТ-подразделения, составляет спи- сок подлежащих сосредоточению в ИХ показателей и их рекви- зитов. Эту работу выполняют на основе анализа документации, опросов, специальных исследований. Вначале составляют пере- чень документов, аналитических сценариев с предполагаемыми запросами. Из полученных в результате обследования материа- лов выделяют сущности в разрезе достижения целей анализа. Их называют классами в терминологии объектно-ориентированного подхода и показателями в традиционной терминологии. Из всей совокупности материалов выделяют признаки (реквизиты, атри- буты), описывающие сущности (классы, показатели). На сле- дующем этапе повторяющиеся по смыслу атрибуты представ- ляют в виде одного согласованного по смыслу и синтаксису ат- рибута. В процессе слияния атрибутов в репозитории появляют- ся свои, присущие хранилищу, атрибуты: их можно назвать системообразующими.

МД должны содержать сведения о преобразовании исход- ных данных, истинные даты событий и временные характери- стики отображаемых процессов, диапазоны для полей данных, сведения об источниках данных и их форматах и т. д.

В связи с обширностью сведений, содержащихся в МД, а также разнообразием вариантов реализации ИАС и ИХ возникла необхо- димость в более детальной классификации различных видов МД.

По стадии применения различают проектные и рабочие МД.

К проектным МД относятся измерения:

¾ МД для сущностей, описывающих содержимое ИХ;

 

1 См.: Белов В. С. Указ. соч.— С. 38.


¾ МД для расположения данных;

¾ МД для движущих сил развития ИХ1.

Рабочие МД — это совокупность атрибутов, используемых в процессе эксплуатации системы (хранилища или ИАС в целом). По динамике использования различают МД активные и пас- сивные. К активным МД относят те, которые контролируют функции или поведение приложений; к пассивным МД — те, которые имеют информационный характер и используются при

просмотре содержимого ИХ.

Активные рабочие МД используют для обеспечения безо- пасности и контроля за доступом к данным в ИХ, накопления статистики по обращениям к тем или иным разделам ИХ с це- лью совершенствования архитектуры ИАС. Информация, учи- тывающая время, может составлять значительный объем, к тому же она динамична. В размерностной (шестимерной) модели часть активных рабочих МД соответствует измерениям, описы- вающим операции над данными и людей, пользующихся храни- лищем, а также временной аспект, т. е. привязку данных и собы- тий ко времени.

Пассивные рабочие МД привязаны к деловому аспекту, т. е. целевому использованию ИХ. Пользователь, используя такие МД, может легко ориентироваться в огромных массивах дан- ных, экономя время на доступ к ним, применять их для форми- рования запросов и облегчения понимания смысла содержащих- ся данных в ИХ. Пользователи должны знать источник содер- жащихся в ИХ данных, ответственных лиц, график загрузки. Эти сведения должны содержаться в репозитории МД. Помимо этого необходимо хранить данные о приложениях, языках про- граммирования, датах переработки, о моделях данных, которые используются в CASE-средствах.

Под измерениями при рассмотрении совокупностей мета- данных понимают назначение и другие отличительные признаки входящих в эти совокупности групп МД.

Различают два основных вида классификации и, соответст- венно, два вида моделей: трехмерную и шестимерную.

 
 

1 См.: Белов В. С. Указ. соч.— С. 39.


Трехмерная система классификации и модель МД. Такая система подразумевает три типа метаданных:

¾ МД оперативных баз данных, т. е. источников данных для ИХ;

¾ МД об использовании данных, т. е. об их назначении в интересах конечного пользователя;

¾ МД для управления информационным хранилищем1.

Эта система классификации применяется для ИХ и ИАС малого масштаба с одной предметной областью или небольшим их количеством.

Шестимерная (размерностная) модель МД обеспечивает более детальный и строгий учет данных, сосредоточенных в ИХ. Она отвечает на вопросы: Что? Где? Когда? Кто? Почему? Как? Такая модель называется схемой Захмана.

Перечислим эти измерения:

¾ Сущности, которые составляют содержимое ИХ, — «Что? »

¾ Размещение данных в операционных базах и не- посредственно в ИХ — «Где? »

¾ Моменты загрузки и агрегирования данных, время их происхождения — «Когда? »

¾ Люди, которые используют и поддерживают хранилища; ответственные за факты, события, ценности и т. д. — «Кто? »

¾ Движущие силы создания и развития ИХ — «Почему? »

¾ Действия, которые выполняются над данными — «Как? »2

Рассмотрим содержание компонентов размерностной моде- ли МД ИХ.

Метаданные, описывающие сущности. Это измерение явля- ется основой создания информационного хранилища. От пра- вильности формирования содержимого хранилища зависит успех его использования. Так, должна быть документально определена предметная область (или области) и зафиксирована в метаданных. Если рассматривается несколько предметных областей, то в ме- таданных должны быть сведения о взаимодействии этих облас- тей, а для одной предметной области — о связях ее частей.

 
 

1 См.: Белов В. С. Указ. соч.— С. 40.

2 Там же.— С. 41.


Сущности определяются на этапе моделирования. МД должны содержать имена полей, тип данных, домены включен- ных в ИХ данных, а также сведения о полях в источниках. Одна часть описаний полей может содержаться в источниках данных, другая — в хранилище. При этом возможно их нахождение од- новременно и в источниках, и в хранилище.

Связи между сущностями определяются бизнес-правилами и фиксируются в базе метаданных. При моделировании струк- туры метаданных ИХ целесообразно применять объектный под- ход и соответствующие инструментальные средства.

Метаданные, относящиеся к размещению ресурсов. В базе метаданных должны быть сведения о размещении ресурсов ИХ и ИАС в целом. К таким ресурсам относятся: серверы, рабочие станции, сетевое оборудование, программные средства. Эти ме- таданные используются для управления конфигурацией, сопро- вождения системы. Они создаются путем загрузки файла конфи- гурации таких операционных систем, как UNIX, LINUX, Windows и др., а также путем выполнения инвентаризации тех- нической и программной платформы.

Метаданные, описывающие временные аспекты ИХ. В хра- нилище отслеживаются:

¾ время происхождения событий в бизнес-сфере или другой предметной области;

¾ периоды, в течение которых происходят процессы;

¾ моменты появления сведений в источниках данных и в хранилище, другие характерные точки привязки ко времени. Имеются сущности из пользовательской сферы, которые акцентируют внимание на временных аспектах. К ним относят- ся: планы, графики работ, планируемая и фактическая их про-

должительность.

В репозиторий вносятся МД, относящиеся к функциониро- ванию ИАС, в том числе: моменты обращения пользователей, длительность отклика на запросы, моменты начала и окончания загрузки данных в хранилище. По этим сведениям можно оце- нивать динамические характеристики ИАС.

Метаданные, относящиеся к пользователям и администра- торам ИХ и ИАС. Функции, права доступа лиц, имеющих отно- шение к ИХ, фиксируются в соответствующих разделах базы МД.


У этих лиц, независимо от названий их должностей в тех или иных организациях, имеются определенные права и обязан- ности, касающиеся работы в среде ИАС. Суть их работы опре- деляется направлением деятельности: архитектор данных, спе- циалист по информационным технологиям, руководитель про- екта, администраторы баз данных первичных источников, биз- нес-аналитик, менеджеры деловой сферы (лица, принимающие решения) и др.

В репозитории ИХ должны быть зафиксированы все роли и лица, играющие эти роли, а также должна быть отражена ор- ганизационная структура или ее часть, относящаяся к ИАС. За- щита данных в процессе создания ИАС должна осуществляться поэтапно, чтобы не слишком ограничивать действия исполните- лей проекта. Полномасштабная корпоративная защита вводится по завершении проекта.

Метаданные о движущих силах создания ИАС. Под движу- щими силами авторы концепции размерностной модели мета- данных ИХ понимают цели и задачи проекта ИАС, которые должны быть четко сформулированы и внесены в репозиторий. Так, например, необходимо дать описание выполнения задач бизнес-подразделений; отобразить организационные и техниче- ские меры по обеспечению высокого качества данных.

В состав МД вводят характеристики ИАС по возможностям смыслового содержания запросов, скорости ответа на них, кото- рые определяют в ходе испытаний и опытной эксплуатации. Кроме того, в МД отражаются схемы и технологии взаимодей- ствия с бизнес-пользователями.

Рассмотрим действия, которые выполняются над данными. Так, в репозитории должны находиться МД о преобразованиях, которым должны подвергнуться перегружаемые из источников в хранилище данные; должен быть разъяснен и унифицирован в хранилище их смысл. Необходимо также отобразить те действия, которые совершаются над данными в хранилище заблаговременно, с тем, чтобы не тратить время на это при реализации запланиро- ванных запросов и расширить возможности по совершению дейст- вий над данными при выполнении незапланированных запросов1.

 
 

1 См.: Белов В. С. Указ. соч.— С. 42.


Поделиться:



Последнее изменение этой страницы: 2017-05-11; Просмотров: 605; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.026 с.)
Главная | Случайная страница | Обратная связь