Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
База метаданных информационного хранилища
Управление ИАС осуществляется посредством использова- ния метаданных, т. е. данных о том, что они представляют со- бой, как хранятся, и, по существу, содержат общую информа- цию о предметной области. Благодаря их использованию предоставляется информация, необходимая для автоматизации процессов сбора, преобразова- ния и загрузки данных в ИХ и использования всей ИАС. Проектирование ИХ, разработка сценариев OLAP и интел- лектуального анализа начинаются с формирования массивов метаданных, которые реализуются соответствующими про- граммными модулями. Этими модулями описываются атрибуты метаданных, проверяется их корректность, создается физическая
1 См.: Белов В. С. Указ. соч.— С. 37. структура хранения, обеспечивается вызов для реализации за- данных в сценарии анализа функций. Метаданные (МД) можно разделить на два типа (бизнес- метаданные и технические метаданные), которые позволяют ориентироваться в огромном объеме информации. Бизнес-метаданные служат в основном интересам пользо- вателя. К ним относятся определения данных, обозначения ат- рибутов и областей, привязка данных ко времени, бизнес- правила, соотношения данных, их охват. Технические метаданные используются службой админист- ратора. К ним относятся сведения о времени обновления и пре- образовании данных, права доступа и т. д. В связи со сложно- стью потоков данных из операционных БД технические МД не- обходимы для работы многих программ. Рассмотрим более подробно состав бизнес-метаданных и тех- нических метаданных. В состав бизнес-метаданных входят: ¾ определенные объекты; ¾ иерархии; ¾ столбцы углубления; ¾ столбцы анализа; ¾ столбец фактических значений в прогнозных или бюджетных документах; ¾ столбцы бюджетных значений в прогнозных или бюджетных документах; ¾ временные измерения; ¾ значения, определяющие успех предприятия; ¾ категории и классификации данных; ¾ сведения о зависимых и независимых переменных; ¾ вид анализа и ограничений и т. д. В состав технических метаданных входят: ¾ структура и семантика данных; ¾ алгоритмы агрегирования; ¾ сведения о разграничениях доступа и защите информации; ¾ периодичность загрузки и очистки; ¾ права собственности на информацию; ¾ поисковые таблицы, перечень и правила исключений; ¾ другие данные, относящиеся к техническому сопровож- дению1. Под МД понимают также сведения в виде некоего справоч- ника — репозитория, который помогает пользователям и ли- цам, обеспечивающим функционирование ИАС, ориентировать- ся в содержащихся в ИХ данных. Репозиторий является одним из центральных блоков инструментальной части ИАС. При разработке ИХ группа проектировщиков на основе рас- смотрения требований пользователей, в которую входят их представители и работники ИТ-подразделения, составляет спи- сок подлежащих сосредоточению в ИХ показателей и их рекви- зитов. Эту работу выполняют на основе анализа документации, опросов, специальных исследований. Вначале составляют пере- чень документов, аналитических сценариев с предполагаемыми запросами. Из полученных в результате обследования материа- лов выделяют сущности в разрезе достижения целей анализа. Их называют классами в терминологии объектно-ориентированного подхода и показателями в традиционной терминологии. Из всей совокупности материалов выделяют признаки (реквизиты, атри- буты), описывающие сущности (классы, показатели). На сле- дующем этапе повторяющиеся по смыслу атрибуты представ- ляют в виде одного согласованного по смыслу и синтаксису ат- рибута. В процессе слияния атрибутов в репозитории появляют- ся свои, присущие хранилищу, атрибуты: их можно назвать системообразующими. МД должны содержать сведения о преобразовании исход- ных данных, истинные даты событий и временные характери- стики отображаемых процессов, диапазоны для полей данных, сведения об источниках данных и их форматах и т. д. В связи с обширностью сведений, содержащихся в МД, а также разнообразием вариантов реализации ИАС и ИХ возникла необхо- димость в более детальной классификации различных видов МД. По стадии применения различают проектные и рабочие МД. К проектным МД относятся измерения: ¾ МД для сущностей, описывающих содержимое ИХ;
1 См.: Белов В. С. Указ. соч.— С. 38. ¾ МД для расположения данных; ¾ МД для движущих сил развития ИХ1. Рабочие МД — это совокупность атрибутов, используемых в процессе эксплуатации системы (хранилища или ИАС в целом). По динамике использования различают МД активные и пас- сивные. К активным МД относят те, которые контролируют функции или поведение приложений; к пассивным МД — те, которые имеют информационный характер и используются при просмотре содержимого ИХ. Активные рабочие МД используют для обеспечения безо- пасности и контроля за доступом к данным в ИХ, накопления статистики по обращениям к тем или иным разделам ИХ с це- лью совершенствования архитектуры ИАС. Информация, учи- тывающая время, может составлять значительный объем, к тому же она динамична. В размерностной (шестимерной) модели часть активных рабочих МД соответствует измерениям, описы- вающим операции над данными и людей, пользующихся храни- лищем, а также временной аспект, т. е. привязку данных и собы- тий ко времени. Пассивные рабочие МД привязаны к деловому аспекту, т. е. целевому использованию ИХ. Пользователь, используя такие МД, может легко ориентироваться в огромных массивах дан- ных, экономя время на доступ к ним, применять их для форми- рования запросов и облегчения понимания смысла содержащих- ся данных в ИХ. Пользователи должны знать источник содер- жащихся в ИХ данных, ответственных лиц, график загрузки. Эти сведения должны содержаться в репозитории МД. Помимо этого необходимо хранить данные о приложениях, языках про- граммирования, датах переработки, о моделях данных, которые используются в CASE-средствах. Под измерениями при рассмотрении совокупностей мета- данных понимают назначение и другие отличительные признаки входящих в эти совокупности групп МД. Различают два основных вида классификации и, соответст- венно, два вида моделей: трехмерную и шестимерную. 1 См.: Белов В. С. Указ. соч.— С. 39. Трехмерная система классификации и модель МД. Такая система подразумевает три типа метаданных: ¾ МД оперативных баз данных, т. е. источников данных для ИХ; ¾ МД об использовании данных, т. е. об их назначении в интересах конечного пользователя; ¾ МД для управления информационным хранилищем1. Эта система классификации применяется для ИХ и ИАС малого масштаба с одной предметной областью или небольшим их количеством. Шестимерная (размерностная) модель МД обеспечивает более детальный и строгий учет данных, сосредоточенных в ИХ. Она отвечает на вопросы: Что? Где? Когда? Кто? Почему? Как? Такая модель называется схемой Захмана. Перечислим эти измерения: ¾ Сущности, которые составляют содержимое ИХ, — «Что? » ¾ Размещение данных в операционных базах и не- посредственно в ИХ — «Где? » ¾ Моменты загрузки и агрегирования данных, время их происхождения — «Когда? » ¾ Люди, которые используют и поддерживают хранилища; ответственные за факты, события, ценности и т. д. — «Кто? » ¾ Движущие силы создания и развития ИХ — «Почему? » ¾ Действия, которые выполняются над данными — «Как? »2 Рассмотрим содержание компонентов размерностной моде- ли МД ИХ. Метаданные, описывающие сущности. Это измерение явля- ется основой создания информационного хранилища. От пра- вильности формирования содержимого хранилища зависит успех его использования. Так, должна быть документально определена предметная область (или области) и зафиксирована в метаданных. Если рассматривается несколько предметных областей, то в ме- таданных должны быть сведения о взаимодействии этих облас- тей, а для одной предметной области — о связях ее частей. 1 См.: Белов В. С. Указ. соч.— С. 40. 2 Там же.— С. 41. Сущности определяются на этапе моделирования. МД должны содержать имена полей, тип данных, домены включен- ных в ИХ данных, а также сведения о полях в источниках. Одна часть описаний полей может содержаться в источниках данных, другая — в хранилище. При этом возможно их нахождение од- новременно и в источниках, и в хранилище. Связи между сущностями определяются бизнес-правилами и фиксируются в базе метаданных. При моделировании струк- туры метаданных ИХ целесообразно применять объектный под- ход и соответствующие инструментальные средства. Метаданные, относящиеся к размещению ресурсов. В базе метаданных должны быть сведения о размещении ресурсов ИХ и ИАС в целом. К таким ресурсам относятся: серверы, рабочие станции, сетевое оборудование, программные средства. Эти ме- таданные используются для управления конфигурацией, сопро- вождения системы. Они создаются путем загрузки файла конфи- гурации таких операционных систем, как UNIX, LINUX, Windows и др., а также путем выполнения инвентаризации тех- нической и программной платформы. Метаданные, описывающие временные аспекты ИХ. В хра- нилище отслеживаются: ¾ время происхождения событий в бизнес-сфере или другой предметной области; ¾ периоды, в течение которых происходят процессы; ¾ моменты появления сведений в источниках данных и в хранилище, другие характерные точки привязки ко времени. Имеются сущности из пользовательской сферы, которые акцентируют внимание на временных аспектах. К ним относят- ся: планы, графики работ, планируемая и фактическая их про- должительность. В репозиторий вносятся МД, относящиеся к функциониро- ванию ИАС, в том числе: моменты обращения пользователей, длительность отклика на запросы, моменты начала и окончания загрузки данных в хранилище. По этим сведениям можно оце- нивать динамические характеристики ИАС. Метаданные, относящиеся к пользователям и администра- торам ИХ и ИАС. Функции, права доступа лиц, имеющих отно- шение к ИХ, фиксируются в соответствующих разделах базы МД. У этих лиц, независимо от названий их должностей в тех или иных организациях, имеются определенные права и обязан- ности, касающиеся работы в среде ИАС. Суть их работы опре- деляется направлением деятельности: архитектор данных, спе- циалист по информационным технологиям, руководитель про- екта, администраторы баз данных первичных источников, биз- нес-аналитик, менеджеры деловой сферы (лица, принимающие решения) и др. В репозитории ИХ должны быть зафиксированы все роли и лица, играющие эти роли, а также должна быть отражена ор- ганизационная структура или ее часть, относящаяся к ИАС. За- щита данных в процессе создания ИАС должна осуществляться поэтапно, чтобы не слишком ограничивать действия исполните- лей проекта. Полномасштабная корпоративная защита вводится по завершении проекта. Метаданные о движущих силах создания ИАС. Под движу- щими силами авторы концепции размерностной модели мета- данных ИХ понимают цели и задачи проекта ИАС, которые должны быть четко сформулированы и внесены в репозиторий. Так, например, необходимо дать описание выполнения задач бизнес-подразделений; отобразить организационные и техниче- ские меры по обеспечению высокого качества данных. В состав МД вводят характеристики ИАС по возможностям смыслового содержания запросов, скорости ответа на них, кото- рые определяют в ходе испытаний и опытной эксплуатации. Кроме того, в МД отражаются схемы и технологии взаимодей- ствия с бизнес-пользователями. Рассмотрим действия, которые выполняются над данными. Так, в репозитории должны находиться МД о преобразованиях, которым должны подвергнуться перегружаемые из источников в хранилище данные; должен быть разъяснен и унифицирован в хранилище их смысл. Необходимо также отобразить те действия, которые совершаются над данными в хранилище заблаговременно, с тем, чтобы не тратить время на это при реализации запланиро- ванных запросов и расширить возможности по совершению дейст- вий над данными при выполнении незапланированных запросов1. 1 См.: Белов В. С. Указ. соч.— С. 42. |
Последнее изменение этой страницы: 2017-05-11; Просмотров: 671; Нарушение авторского права страницы