Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Трехуровневая модель  организации баз данных



Трехуровневая модель  организации баз данных

В настоящее время используется трехуровневая модель организации БД, предложенная в 1975 г. ANSI (American National Standards Institute). БД имеет различные уровни описания.

1. Внешний уровень – это представление о БД отдельных пользователей и прикладных программ.

Каждый пользователь, каждая прикладная программа видят и обрабатывают только те данные предметной области, которые им необходимы. Н-р, прикладная программа, используемая отделом кадров, обрабатывает сведения о сотрудниках, их адресе, стаже работы и не оперирует данными о заработной плате.

2. На концептуальном уровне БД представляется обобщенно – объединяются данные, используемые различными пользователями и прикладными программами. Данный уровень фактически определяет обобщенную модель предметной области и не содержит никаких сведений о методах хранения данных.

3. Внутренний (физический) уровень поддерживает представление БД в памяти компьютера.

11 Модель данных – это совокупность  ­ принципов организации БД.

Классическими являются иерархическая, сетевая и реляционная модели данных.

Иерархическая модель

В иерархической модели связи между данными можно представить с помощью дерева

Данные расположены на разных иерархических уровнях и называются сегментами. Самый высокий сегмент – корневой. Сегменты на более низком уровне  сегменты-потомки. Сегменты на более высоком уровне – сегменты-предки.

Каждый сегмент может иметь только одного предка на более высоком уровне и одного или несколько потомков на более низком уровне.

Доступ к определенному сегменту осуществляется по цепочке, от сегмента-предка к сегменту-потомку, начиная слева.

Недостаток иерархической модели – громоздкость для обработки данных со сложными логическими связями.

Достоинство – эффективное использование памяти компьютера при хранении данных.

 12. Сетевая модель

Сетевая модель является развитием иерархической модели. В ней потомок может иметь любое количество предков. Есть сегменты – наборы записей – связываются между собой не только по принципу «сверху вниз», но и «по горизонтали» с помощью наборов связей.

 

Для связи записей ПРОЕКТ и ИСПОЛНИТЕЛЬ вводится запись ИСПОЛНИТЕЛЬ_ПРОЕКТ. 

Достоинства сетевой модели данных – возможность образования произвольных связей и быстрый доступ к данным.

Недостатки сетевой модели – сложность ее понимания для обычного пользователя и большие объемы памяти компьютера на хранение данных.

 

Реляционная модель

Основные понятия реляционной модели данных

В основе реляционной модели данных – понятие отношения. Отношение отображает некоторый объект. Объект характеризуется набором атрибутов D1, D2 ,…, Dn, а каждый атрибут – набором допустимых значений, называемым доменом. Пусть

D1={х1, х2,…,хk}

D2={y1, y2,…,yl}

. . . . . . . . . . . . . .

Dn={z1, z2,…,zm}

Cписок имен атрибутов (D1, D2,…,Dn) называется схемой отношения, а количество атрибутов в отношении – степенью отношения.

Отношение – подмножество R декартова произведения D1 x D2 x … xDn,

 т.е. R Í D1 x D2 x … xDn.

 Декартово произведение – это набор всевозможных сочетаний из n значений, где каждое значение берется из своего домена.

Пусть D1 содержит номера трех заказов {1021, 1022, 1023}, D2 – коды двух клиентов {АА, АС}, D3 – веса трех заказов, заданных в килограммах {100, 300, 120}. В этом случае отношение R есть декартово произведение D1хD2хD3 – набор из 18 троек значений, где первое значение – это один из номеров заказов, второе – это один из кодов клиентов, а третье – один из весов заказа.

Термин «отношение» – синоним слова «таблица». Выше описанное отношение R можно представить как таблицу вида:

Номер заказа Код клиента Вес заказа
1021 АА 100
1021 АА 300

 

  

 

 

  

Столбцы таблицы соответствуют атрибутам. Строки называются кортежами. Количество кортежей в отношении – мощность отношения.

Реляционная модель данных – модель данных, основанная на математическом понятии отношения и представлении отношений в форме таблиц.

Таблица в реляционной модели данных (реляционная таблица) должна обладать следующими свойствами.

1. Каждое значение атрибута, содержащееся на пересечении строки и столбца, должно быть атомарным, т.е. не расчленяться на несколько значений.

2. Значения в столбце должны быть однородными.

3. Каждая строка уникальна, т.е. в таблице не существует двух полностью совпадающих строк.

4. Каждый столбец имеет уникальное имя.

5. Последовательность столбцов в таблице не существенна.

6. Последовательность строк в таблице не существенна.    

 Пример реляционной таблицы – таблица КЛИЕНТЫ:

 

Код клиента Клиент Адрес
АА БГЭУ Минск, пр. Партизанский, 26
АБ Сименс Мюнхен, ул. Лейбница, 8
АС Атлант Минск, пр. Победителей, 61
АД БГУИР Минск, ул. Бровки, 6

 

В таблице реляционной БД столбцы называют полями, а строкизаписями.

 Одно или несколько полей, значения которых в каждой записи таблицы однозначно ее идентифицируют, называют ключевым полем.

В таблице КЛИЕНТЫ таковым может быть поле «Код клиента» или поле «Клиент».

В реляционной БД между таблицами устанавливаются связи. Связи делают их более информативными, чем они являются по отдельности.

Постреляционная модель

Постреляционная модель данных в общем случае представляет собой расширенную реляционную модель, снимающую ограничение неделимости значений полей. То есть, допускаются многозначные поля, значения которых состоят из подзначений. Пример постреляционной модели – таблица, представляющая собой совокупность данных связанных реляционных таблиц КЛИЕНТЫ и ЗАКАЗЫ.

 

Код клиента Номер заказа Клиент Адрес Дата заказа Вес заказа

АА

1021

БГЭУ

Минск, пр. Партизанский, 26

01.02.06 100
1023 20.03.06 120

АБ

1020

Сименс

Мюнхен, ул. Лейбница, 8

01.02.06 100
1024 28.05.06 600
АС 1022 Атлант Минск, пр. Победителей, 61 12.02.06 300

                       

Достоинства постреляционной модели данных:

· возможность представления связанных реляционных таблиц одной постреляционнной таблицей. Это обеспечивает высокую наглядность представления данных и повышение эффективности их обработки;

· отсутствие ограничений на длину полей и их количество в записях таблицы.  

Недостаток постреляционнной модели – сложность в обеспечении целостности данных.

Многомерная модель

Многомерная модель означает многомерное логическое представление структуры информации, а не многомерность визуализации данных.

Многомерная модель предназначена для аналитической обработки информации.

В данной модели используются такие понятия, как агрегируемость, историчность, прогнозируемость данных.

Агрегируемость данных означает возможность их рассмотрения с различным уровнем обобщения.

Историчность обеспечивает высокий уровень статичности (неизменяемости) данных и их взаимосвязей, а также в обязательном порядке привязку данных к временным точкам.

Прогнозируемость данных подразумевает задание функций прогнозирования и применение их к различным интервалам времени.

                   Представление данных о продажах автомобилей дилером фирмы Опель по реляционной и многомерной моделям:

Марка  автомобиля Месяц Объем продаж
Опель-Астра Январь 12
Опель-Астра Февраль 24
Опель-Астра Март 5
Опель-Вектра Январь 2
Опель-Вектра Февраль 18
Опель-Омега Февраль 19

а) реляционная модель

Марка автомобиля Январь Февраль Март
Опель-Астра 12 24 5
Опель-Вектра 2 18 0
Опель-Омега 0 19 0

б) многомерная модель

Основные понятия в многомерной моделия – измерение и ячейка.

Измерение – это множество однотипных данных, образующих одну из граней многомерного гиперкуба. Примеры наиболее часто используемых временных измерений – дни, месяцы, кварталы и годы. В качестве географических измерений широко употребляются города, районы, регионы и страны.

 Ячейкаэто поле, значение которого однозначно определяется фиксированным набором измерений. В примере значение ячейки объема продаж однозначно определяется комбинацией временного измерения Месяц и Марка автомобиля.

Многомерную модель, отображающую объемы продаж автомобилей менеджерами по годам, можно представить в виде трехмерного куба:

В многомерной модели данных используется два варианта организации данных – гиперкубическая и поликубическая.

В гиперкубической все кубы определяются одним и тем же набором измерений (максимально возможным). В некоторых случаях информация может быть избыточной, так как требуется обязательное заполнение ячеек.

 В поликубической определяются несколько гиперкубов с различной размерностью и различными измерениями в качестве граней. 

Для извлечения данных из базы, организованной по многомерной модели, применяется ряд специальных операций: срез, вращение, агрегация и детализация.

Срез представляет собой данные, полученные в результате фиксации одного или нескольких измерений. Н-р, если сделать срез в базе, организованной по трехмерной модели, по марке автомобиля Опель-Астра, то получим двухмерную таблицу продаж этой марки различными менеджерами по годам.  

Операция вращение применяется в основном при двухмерном представлении данных. Для многомерного случая операция вращения представляет собой процедуру изменения порядка следования измерений.

Операции агрегации и детализации означают соответственно переход к более или менее детальному представлению информации из гиперкуба.

Достоинством многомерной модели  – удобство и эффективность аналитической обработки больших объемов данных, связанных с временными интервалами. При организации таких же данных по реляционной модели происходит рост трудоемкости операций выборки и существенное увеличение затрат памяти компьютера на хранение данных.

Недостаток – громоздкость для простейших задач оперативной обработки информации.

                   Исследования в области моделей данных продолжаются.

21. ПРОЕКТИРОВАНИЕ БАЗЫ ДАННЫХ

Проектирование базы данных – это процесс создания проекта БД, предназначенной для поддержки функционирования экономического объекта и способствующей достижению его целей.

 1.Требования, предъявляемые к базе данных

1. Целостность БД (полнота и непротиворечивость данных).

2. Многократное использование данных.

3. Быстрый поиск и получение информации по запросам пользователей.

4. Простота обновления данных.

5. Уменьшение излишней избыточности данных.

6. Защита данных от несанкционированного доступа, от искажения и уничтожения.

ЭТАПЫ ЖИЗНЕННОГО ЦИКЛА БД

Жизненный цикл базы данных (ЖЦБД) – это процесс проектирования, реализации и поддержки базы данных. Он состоит из следующих 7 этапов:

1)  предварительное планирование БД;

2) проверка осуществимости;

3) определение требований;

4) концептуальное проектирование;

5) логическое проектирование;

6) физическое проектирование; 7)оценка и поддержка БД

23.Модель "сущность-связь" (ER-модель)

Сущность – это некоторый объект реального мира, который может существовать независимо.

Атрибут – это свойство сущности.

Сущность имеет экземпляры, отличающиеся друг от друга значениями атрибутов и допускающие однозначную идентификацию.

Атрибут, который уникальным образом идентифицирует экземпляры сущности, называется ключевым. Может быть составной ключ, представляющий комбинацию нескольких атрибутов.

 
МЕНЕДЖЕР

 

 


Связь представляет взаимодействие между сущностями. Она характеризуется мощностью, которая показывает, сколько сущностей участвует в связи. Связь между двумя сущностями называется бинарной, а связь между более чем с двумя сущностями – n-арной.

1. МЕНЕДЖЕР – УПРАВЛЯЕТ – ФИЛИАЛ

2. ФИЛИАЛ – ОБРАБАТЫВАЕТ – СЧЕТ

3. КЛИЕНТ – ИМЕЕТ – СЧЕТ

«управляет»в ромбике

24.Если каждый экземпляр сущности А может быть связан не более чем с одним экземпляром сущности В, то связь между сущностями  А и В имеет тип "один-к-одному" (1:1).

ER-диаграмма для связи типа 1:1 (для связи 1).

Менеджер (1) «управляет»в ромбике (1)филиал

Если каждый экземпляр сущности А может быть связан более чем с одним экземпляром сущности В, а каждый экземпляр сущности В может быть связан не более чем с одним экземпляром сущности А, то связь между сущностями  А и В имеет тип "один-ко-многим" (1:М).

ER-диаграмма для связи типа 1:М (для связи 2)

…………..

Если каждый экземпляр сущности А может быть связан с несколькими экземплярами сущности В, и каждый экземпляр сущности В может быть связан с несколькими экземплярами сущности А, то  связь между сущностями  А и В имеет тип "многие-ко-многим" (М: N ).

ER-диаграмма для связи типа М:N (для связи 3).

………………

25. Понятие класс принадлежности сущности

Если каждый экземпляр сущности А связан с экземпляром сущности В, то класс принадлежности сущности А является обязательным.  Этот факт отмечается на ER-диаграмме кружочком, помещенным в прямоугольник, смежный с прямоугольником сущности А.

Если не каждый экземпляр сущности А связан с экземпляром сущности В, то класс принадлежности сущности А является необязательным. Этот факт отмечается на ER-диаграмме кружочком на линии связи возле прямоугольника сущности A.

 

 

Предположим, что в рассматриваемой предметной области БАНК КП всех четырех сущностей является обязательным. Тогда ER-модель предметной области БАНК будет иметь вид, представленный на рис. 1.

 

Каждая из четырех сущностей приведенной ER-модели может быть описана своим набором атрибутов (рис. 2).

ER-модель в совокупности с наборами атрибутов сущностей может служить примером концептуальной модели предметной области или концептуальной схемы БД.


Правило 4

Если связь типа 1:М и КП сущности на стороне М является обязательным, то необходимо построить таблицу для каждой сущности. Первичный ключ сущности должен быть первичным ключом соответствующей таблицы. Первичный ключ сущности на стороне 1 добавляется как атрибут в таблицу для сущности на стороне М.

На ER- диаграмме связи 1:М КП сущности СЧЕТ является обязательным. Тогда:

Правило 5

Если связь типа 1:М и КП сущности на стороне М является необязательным, то необходимо построить три таблицы – по одной для каждой сущности и одну для связи. Первичный ключ сущности должен быть первичным ключом соответствующей таблицы. Таблица для связи должна иметь среди своих атрибутов ключи обеих сущностей.

Представим, что на ER-диаграмме связи 1:М КП сущности СЧЕТ является необязательным. Для связи типа М:N КП сущности не имеет значения.

Правило 6

Если связь типа М: N, то необходимо построить три таблицы – по одной для каждой сущности и одну для связи. Первичный ключ сущности должен быть первичным ключом соответствующей таблицы. Таблица для связи должна иметь среди своих атрибутов ключи обеих сущностей.

ER-диаграмма связи М:N имеется на рис. 1.

26. Преобразование ER-модели в реляционную модель

Для каждой сущности создается таблица. Причем каждому атрибуту сущности соответствует столбец таблицы.

Правила генерации таблиц из ER-диаграмм опираются на два основных фактора – тип связи и класс принадлежности сущности.

Для связи типа 1:1 существуют три правила формирования предварительных таблиц из ER-диаграмм.

Правило 1

Если связь типа 1:1 и КП обеих сущностей является обязательным, то необходима только одна таблица. Первичным ключом этой таблицы может быть первичный ключ любой из двух сущностей.

На ER-диаграмме связи 1:1 КП сущностей МЕНЕДЖЕР, ФИЛИАЛ является обязательным. Тогда по правилу 1 должна быть сгенерирована одна таблица следующей структуры:

Правило 2

Если связь типа 1:1 и КП одной сущности является обязательным, а другойнеобязательным, то необходимо построить таблицу для каждой сущности. Первичный ключ сущности должен быть первичным ключом соответствующей таблицы. Первичный ключ сущности, для которой КП является необязательным, добавляется как атрибут в таблицу для сущности с обязательным КП.

Представим, что на ER-диаграмме связи 1:1 КП сущности МЕНЕДЖЕР будет обязательный, а сущности ФИЛИАЛ – необязательный. Тогда по правилу 2 должны быть сгенерированы две таблицы следующей структуры:

Сущность с необязательным КП (ФИЛИАЛ) именуется родительской, а с обязательным (МЕНЕДЖЕР) – дочерней. Первичный ключ родительской сущности (НФ), помещаемый в таблицу, представляющую дочернюю сущность, называется внешним ключом родительской сущности. Связь между указанными таблицами устанавливается путем связи первичного и внешнего ключа и имеет вид:

Правило 3

Если связь типа 1:1 и КП обеих сущностей является необязательным, то необходимо построить три таблицы – по одной для каждой сущности и одну для связи. Первичный ключ сущности должен быть первичным ключом соответствующей таблицы. Таблица для связи должна иметь среди своих атрибутов ключи обеих сущностей.

Представим, что на ER-диаграмме связи 1:1 КП сущностей МЕНЕДЖЕР, ФИЛИАЛ будет необязательный. Для связи типа 1:М существует только два правила. Выбор одного из них зависит от КП сущности на стороне M. КП сущности на стороне 1 не влияет на выбор.

28. 4. Нормализация таблиц

Нормализация таблиц – это процесс, позволяющий минимизировать избыточность данных.

Определение 1НФ Таблица находится в 1НФ, если все ее поля содержат только неделимые значения.

На практике. Если в клетках столбца содержится несколько значений, то каждое из них следует представить отдельной записью.

Определение 2НФ Таблица находится в 2НФ, если она удовлетворяет требованиям 1НФ и неключевые поля функционально полно зависят от первичного ключа.

Функциональная зависимость (ФЗ)– это семантическое понятие, отображающее определенную семантическую связь между полями таблицы.

Пусть (Х1, Х2,…,Хк) – множество полей, образующих первичный ключ.

Неключевое поле А функционально зависит от ключа, если каждой комбинации значений полей данного множества соответствует одно и только одно значение поля А. ФЗ обозначается так:

1, Х2,…,Хк)®А

Неключевое поле А функционально полно зависит от ключа, если оно функционально зависит от ключа и не существует ФЗ А ни от какого подмножества множества (Х1, Х2,…,Хк).

 Если существует ФЗ А от какого-либо подмножества этого множества, то А находится в частичной функциональной зависимости от первичного ключа.

На практике . Неключевые поля, находящиеся в частичной ФЗ от некоторого подмножества первичного ключа, удаляются из таблицы и помещаются в новую таблицу совместно с подмножеством первичного ключа, от которого они зависят.

Определение 3НФ Таблица находится в 3НФ, если она удовлетворяет требованиям 2НФ и не содержит транзитивных зависимостей.

Транзитивной зависимостью называется функциональная зависимость между неключевыми атрибутами.

29. Процедуры концептуального проектирования

Выбор модели данных.

2. Определение набора таблиц исходя из ER -модели и их документирование.

3. Нормализация таблиц

Выбор СУБД

Контроль доступа к данным.

38. Направления развития СУБД

1. Расширение множества типов обрабатываемых данных. Современные СУБД позволяют хранение и обработку не только данных традиционного типа (чисел, текстов, дат), но и других типов: логических данных, графических изображений, документов, звука, видео, гиперссылок и др.

2.Комбинирование технологий WWW и технологий БД. Оно открывает много новых возможностей создания все более совершенных приложений БД, потому что:

· Web-браузеры предоставляют широко распространенный и простой в использовании GUI , который можно применять для доступа ко многим типам объектов, включая и БД. Кроме того, использование широко распространенного типового интерфейса позволяет сократить расходы на обучение конечных пользователей;

· так как браузеры имеются практически для всех существующих вычислительных платформ, то разработчикам не надо вносить в приложения изменения, чтобы они могли работать с разными операционными системами или разными пользовательскими интерфейсами;

· Web-среда имеет встроенную поддержку сетевого доступа (достаточно ввести URL-адрес) и нет необходимости приобретения дорогого сетевого ПО.

Некоторые недостатки интеграции БД в среду Web:

· недостаточная надежность. При передаче запроса через Internet нет никаких реальных гарантий его доставки, так как в настоящее время Internet – недостаточно надежная и очень медленная коммуникационная среда;

· высокие требования к пропускной способности сети, а для Internet она ≤1,544 Мбит/с;

· слабая защищенность передачи данных (из-за большого количества анонимных пользователей в Internet);

· высокая стоимость. Сопровождение нетривиального Web-сайта в Internet может оказаться весьма дорогим удовольствием, особенно с ростом требований и ожиданий пользователей.

В области интеграции БД в среду Web еще не накоплен необходимый опыт работы. Но со временем этот недостаток будет устранен.

3. Превращение СУБД в СУБЗ.

База знаний – это один или несколько специальным образом организованных файлов, хранящих систематизированную совокупность понятий, правил и фактов, относящихся к некоторой предметной области. Содержимое баз знаний оформляется, связывается между собой и представляется таким образом, чтобы на его основе можно было с помощью специальных программ осуществлять рассуждения и делать выводы, получая сведения, которые в явном виде могут не присутствовать в базах знаний.

 Для построения баз знаний применяются методы искусственного интеллекта, специальные языки описания знаний и интеллектуальный интерфейс.

Базы знаний являются ядром интеллектуальных систем: информационных, обучающих, систем программирования, экспертных систем, где с их помощью представляются навыки и опыт экспертов.

Специалисты в области технологий БД считают вратами, открывающими путь к базам знаний, технологию активных БД.

Традиционные БД являются пассивными, так как играют организующую роль, направленную на обеспечение хранения данных. Вся процедурная логика, включая выборку и модификацию данных, координируется вне сферы управления данными.

Среда активных БД поддерживает инициацию действий над данными базы и управление ими внутри среды БД в соответствии с предварительно установленными правилами, без необходимости получения каких-либо управляющих воздействий от приложений или от каких-либо других внешних источников. Активная БД может быть охарактеризована как система, следующая правилам Событие-Условие-Действия.

Технология активной БД уже реализована, в частности, в объектно-реляционной СУБД POSTGRES, разработанной в калифорнийском университете Беркли в 1986-1994 гг.

§

35. Возможности, предоставляемые СУБД пользователям

· создание БД;

· обновление хранящихся в ней данных;

· быстрое извлечение из БД необходимых данных по запросам пользователей;

· выполнение вычислений над данными;

· создание форм для удобства работы с данными БД;

· создание отчетов на основе информации БД для ее анализа пользователями;

· разработка приложений;

· экспорт/импорт данных в БД из других приложений;

· публикация БД в Internet;

· управление БД, а именно:

§ поддержка целостности БД с помощью механизма транзакций. Транзакция – совокупность операций с БД, которые должны быть выполнены обязательно до конца, чтобы БД осталась в непротиворечивом состоянии;

§ защита данных от несанкционированного доступа, от сбоев в работе компьютерной системы;

§ восстановление БД в случае ее повреждения.

36.  Классификация СУБД

1) по степени универсальности:

· СУБД общего назначения;

· СУБД специального назначения.

2) по типу поддерживаемой модели данных:

· иерархические. Первая иерархическая СУБД – IMS компании IBM (1968г.);

· сетевые. Первая сетевая СУБД – IDS компании General Electric;

· реляционные. Первые коммерческие реляционные СУБД - от компаний IBM, Oracle Corporation и др. (в нач.80-х);

· постреляционные uniVers, Bubba, Dasdb

· объектно-ориентированные ORION , IRIS , Vbase , PDM

·  объектно - реляционные

Informix Universal Server (Informix Software),DB2 Universal Dat а base (IBM)

многомерные

Oracle Express Server (Oracle),

Cache (InterSystems)

3) по принципу обработки запросов к БД:

· настольные;

· серверные.

39 . Базы знаний

Знания это закономерности предметной области (принципы, связи, законы), полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области.

Знания по степени научности подразделяются на:

· житейские (обыденные знания);

· научные .

Научные знания классифицируются на:

· поверхностные (эмпирические) – знания о видимых взаимосвязях между отдельными событиями и фактами в предметной области;

· глубинные (теоретические) – абстракции, аналогии, схемы, отображающие структуру и природу процессов, протекающих в предметной области.

Знания по местонахождению делят на:

· личностные (неявные, скрытые) – знания людей;

· формализованные (явные)н-р, знания в документах, на компакт-дисках, в Интернете.

Знания по природе делят на:

· процедурные;

· декларативные .

Декларативные знания содержат в себе лишь представление о структуре неких понятий.

Процедурные знания имеют активную природу. Они определяют представления о средствах и путях получения новых знаний, проверки знаний. Это алгоритмы разного рода.

Сегодня знания приобрели чисто декларативную форму, то есть, знаниями считаются предложения, записанные на языках представления знаний. Это языки для описания предметных областей. Универсальным является естественный язык. Но в нем отсутствует формальная семантика. Семантика – это смысловое значение единиц языка.

База знаний (knowledge base) – семантическая модель, описывающая предметную область и позволяющая отвечать на такие вопросы из этой предметной области, ответы на которые в явном виде не присутствуют в базе.

База знаний включает один или несколько специальным образом организованных файлов, хранящих систематизированную совокупность понятий, правил и фактов, относящихся к некоторой предметной области.

Содержимое баз знаний оформляется, связывается между собой и представляется таким образом, чтобы на его основе можно было с помощью специальных программ осуществлять рассуждения и делать выводы, получая сведения, которые в явном виде могут не присутствовать в базе знаний.

Для построения базы знаний применяются методы искусственного интеллекта, языки представления знаний и интеллектуальный интерфейс.

Искусственный интеллект раздел информатики, изучающий возможность обеспечения разумных рассуждений и действий с помощью вычислительных систем и иных искусственных устройств. При этом в большинстве случаев заранее неизвестен алгоритм решения задачи.

В рамках искусственного интеллекта различают два основных направления:

· символьное (семиотическое, нисходящее) – основано на моделировании высокоуровневых процессов мышления человека, на представлении и использовании знаний;

· нейрокибернетическое (нейросетевое, восходящее) – основано на моделировании отдельных низкоуровневых структур мозга (нейронов).

Сверхзадачей искусственного интеллекта является построение компьютерной интеллектуальной системы, которая обладала бы уровнем эффективности решений неформализованных задач, сравнимым с человеческим или превосходящим его.

Экспертная система  — компьютерная программа, способная заменить специалиста-эксперта в решении проблемной ситуации.

База знаний создается и используется с помощью системы управления базами знаний – комплекса программных, языковых и интеллектуальных средств.

Основные модели представления знаний:

1) продукционные модели;

2) семантические сети;

3) фреймы;

4) формальные логические модели.

Продукционные модели

Продукционная модельмодель, основанная на представлении знания в виде правил «Если (условие), то (действие)».

«Условие» – некоторое предложение-образец, по которому осуществляется поиск в БЗ, а «действие» – действия, выполняемые при успешном исходе поиска.

Исходные факты (данные) – хранятся в базе фактов, а набора правил – в базе знаний. На основе базы фактов запускается машина вывода или интерпретатор правил – программа, управляющая перебором правил из базы знаний.

Машина вывода выполняет 2 функции:

1) просмотр существенных фактов из рабочей памяти (базы фактов), правил из базы знаний и добавление, по мере возможности, в рабочую память новых фактов;

2) определение порядка просмотра и применения правил.

В большинстве систем, основанных на знаниях, машина вывода – небольшая по объему программа из 2-х компонентов – компонента вывода и управляющего компонента.

Действие компонента вывода основано на применении правила modus ponens:

Если известно, что истинно утверждение А и существует правило вида «Если А, то В», тогда утверждение В также истинно.

Правила срабатывают, когда находятся факты, удовлетворяющие их левой части: если истинна посылка, то должно быть истинно и заключение.

Управляющий компонент определяет порядок применения правил и выполняет 4 функции:

1) сопоставление – образец правила сопоставляется с имеющимися фактами;

2) выбор – если в конкретной ситуации может быть принято сразу несколько правил, то из них выбирается одно, наиболее подходящее по заданному критерию;

3) срабатывание – если образец правила при сопоставлении совпал с какими-либо фактами из рабочей памяти, то правило срабатывает;

4) действие – рабочая память подвергается изменению путем добавления в нее заключения сработавшего правила. Если в правой части правила содержится указание на какое-либо действие, то оно выполняется.

Интерпретатор правил работает циклически.

Порядок применения и срабатывания правил зависит от стратегии вывода, которая определяет направление поиска (прямое, обратное) и способ его осуществления (в глубину, в ширину, по подзадачам, или иначе).

Продукционная модель привлекает наглядностью, высокой модульностью, легкостью внесения дополнений и изменений и простотой механизма логического вывода. Недостаток - при накоплении достаточно большого числа (порядка нескольких сотен) продукций они начинают противоречить друг другу.

Примеры экспертных систем на основе продукционной модели – ЭКСПЕРТ, ЭКО и др.

41. Семантические сети

Семантическая сетьэто ориентированный граф, вершины которого есть понятия, а дуги – отношения между ними.

Понятия – абстрактные или конкретные объекты.

Наиболее часто используемые отношения:

1) связи типа “часть-целое” (н-р, “класс-подкласс'');

2) функциональные связи (н-р, производит);

3) количественные (н-р, >, <, = );

4) пространственные (н-р, далеко от);

5) временные (н-р, раньше);

6) атрибутивные (н-р, иметь свойство);

7) логические (н-р, и, или, не) и др.

Поиск решения в базе знаний типа семантической сети сводится к поиску фрагмента сети, отражающего поставленный запрос к базе.

Пример семантической сети

Преимущество - более других соответствует современным представлениям об организации долговременной памяти человека. Недостаток – сложность организации процедуры поиска вывода на семантической сети.

 Экспертные системы, использующие семантические сети в качестве языка представления знаний, – PROSPECTOR, CASNET, TORUS.

9.Пользователь БД – лицо или прикладная программа, которые могут обращаться с командами и/или запросами к БД и получать от нее результаты обращений.

Люди, работающие с БД, – конечные пользователи БД и обслуживающий персонал.

Конечные пользователи БДэто специалисты предметной области, которым требуется информация из БД для выполнения прямых служебных обязанностей. Н-р, конечными пользователями БД могут быть бухгалтер, руководитель, менеджер отдела продаж.

 Обслуживающий персонал – люди, ответственные за работу БД (администраторы БД) и соответствующего прикладного ПО (разработчики прикладного ПО). Разработчики прикладного ПО – посредники между БД и конечными пользователями, так как создают удобный GUI в рамках конкретного приложения.

43,  Формальные логические модели

Формальная логиканаука об общих структурах и законах правильного мышления, образования и сочетания понятий и высказываний, о правилах умозаключений независимо от их конкретного содержания.

Моделирование логики рассуждений происходит по схеме: из одной или нескольких посылок (которые считаются истинными) следует сделать «логически верное заключение» (вывод, следствие). И посылки, и заключение должны быть представлены на понятном языке, адекватно отображающем предметную область, в которой проводится вывод. В обычной жизни это наш естественный язык общения; в математике это язык определенных формул.

Логические выражения, построенные в данном языке, могут быть истинными или ложными. Некоторые из этих выражений, являющиеся всегда истинными, объявляются аксиомами (или постулатами). Они составляют ту базовую систему посылок, исходя из которой и пользуясь определенными правилами вывода, можно получить заключения в виде новых выражений, также являющихся истинными.

Классическими примерами аксиоматических (формальных) систем являются исчисление высказываний и исчисление предикатов.

Исчисление высказываний – область математической логики, называемая булевой алгеброй. Она изучает высказывания и операции над ними. Высказывание – это предложение, которое может быть истинно или ложно. Наиболее известными операциями булевой алгебры являются конъюнкция и дизъюнкция.

Так, дизъюнкция высказываний – новое высказывание:

· сконструированное их двух и более исходных высказываний;

· истинное в тех случаях, когда истинно хотя бы одно из исходных высказываний.

Конъюнкция высказываний – новое высказывание:

· сконструированное из двух и более исходных высказываний;

· истинное в тех случаях, когда истинны все исходные высказывания.

В булевой алгебре высказывания рассматриваются как нераздельные целые и только с точки зрения их истинности или ложности. Ни структура высказываний, ни их содержание не затрагиваются.

В то же время и в науке, и в практике используются заключения, существенно зависящие как от структуры, так и от содержания используемых в них высказываний. Возникает необходимость в расширении логики высказываний – в логике предикатов.

Логика предикатов расчленяет элементарное высказывание на субъект (подлежащее) и предикат (сказуемое). Субъект – это то, о чем что-то утверждается в высказывании; предикат – это то, что утверждается о субъекте (н-р, в высказывании «7 – простое число», «7» – субъект, «простое число» – предикат). Это высказывание утверждает, что «7» обладает свойством «быть простым числом».

Если число 7 заменить переменной Х из множества натуральных чисел N, то получим  высказывательную форму «Х – простое число». При одних значениях Х (н-р, Х=13, Х=17) она дает истинные высказывания, а при других значениях Х (н-р, Х=10, Х=18) – ложные высказывания.

Эта высказывательная форма определяет функцию одной переменной Х, определенной на множестве N, и принимающую значения из множества {1;0}. Здесь предикат становится функцией субъекта и выражает свойство субъекта.

Достоинство формальных систем – исчисления высказываний и исчисления предикатов в том, что они хорошо исследованы и имеют прекрасно разработанные модели логического вывода.

Поэтому все, что может и гарантирует каждая из этих систем, гарантируется и для прикладных формальных систем как моделей конкретных предметных областей. В частности, это гарантии непротиворечивости вывода, алгоритмической разрешимости (для исчисления высказываний) и полуразрешимости (для исчислений предикатов).

Недостатки закрытость, негибкость. Модификация и расширение всегда связаны с перестройкой всей формальной системы, что для практических систем сложно и трудоемко. Поэтому формальные системы как модели представления знаний могут использоваться только в тех предметных областях, которые хорошо локализуются и мало зависят от внешних факторов.

К тому же, очень высокие требования к предметной области полнота и непротиворечивость «базового аксиоматического набора» – обусловили то, что в промышленных экспертных системах формальные логические модели практически не используются.

8.Приложения БД:

· запросы . Это требование пользователя на отбор данных из базы и/или на выполнение определенных действий;

· формы. Формы используются для разных целей. Наиболее часто они применяются  для ввода, просмотра и редактирования данных;

· отчеты. Это п редставление информации из БД в виде, удобном для ее восприятия и анализа пользователем;

· Web -страницы, предназначенные для публикации БД в Интернет;

· прикладные программы. Это программы, работающие с БД, и написанные на языке программирования, встроенном в СУБД.

Компоненты БД:

1)  данные пользователей;

2)  метаданные. СУБД производит описание структуры БД (метаданные). Метаданные – данные о данных (хранятся в системных таблицах). По-другому метаданные называют словарем данных или каталогом данных. Самодокументированность БД обусловливает независимость программ от данных. Изменяем структуру данных в БД ®изменяется словарь данных® модифицируются только те прикладные программы, которые непосредственно обрабатывают элементы данных, претерпевших изменения;

3)  данные, призванные улучшить производительность и доступность БД. Они состоят, главным образом, из индексов;

4)  метаданные приложений. Это описания структуры и формата пользовательских запросов, форм, отчетов и других приложений, выполненное СУБД.

Фреймы

Фреймэто абстрактный образ для представления некого стереотипа восприятия.

Фреймформализованная модель для отображения образа.

Различают фреймы-образцы, хранящиеся в базе знаний, и фреймы–экземпляры, которые создаются для отображения реальных фактических ситуаций на основе поступающих данных.

Все многообразие знаний о мире можно отобразить через:

1) фреймы-структуры – для обозначения объектов и понятий (заем, залог, вексель);

2) фреймы-роли (менеджер, кассир, клиент);

3) фреймы-сценарии (банкротство, собрание акционеров);

4) фреймы-ситуации (тревога, авария, рабочий режим устройства).

Фрейм может содержать процедуры, которые будут выполняться при определенных условиях.

Существует несколько способов получения слотом значений во фрейме-экземпляре:

· по умолчанию от фрейма-образца;

· через наследование свойств от фрейма, указанного в слоте АКО (A-Kind-Оf, это);

· по формуле, указанной в слоте;

· через присоединенную процедуру;

· явно из диалога с пользователем;

· из базы данных.

В качестве значения слота может выступать имя другого фрейма. Тогда образуются сети фреймов.

Преимущества: 1) отражает концептуальную основу организации памяти человека, а также ее гибкость и наглядность; 2) однородность представления знаний и возможность их типового текстового описания с помощью специальных языков представления знаний (н-р, FRL ,  KRL ). Примеры фрейм-ориентированных экспертных системы – ANALYST, МОДИС, TRISTAN, ALTERID.

6. Внутримашинная организация экономической информации

Внутримашинная часть информационной базы АИС хранится на машинных носителях в отдельных не связанных между собой файлах данных или в едином месте, называемом базой данных (БД).

Файловая организация данных для обработки больших массивов информации, часто используемых многими, имеет ряд недостатков:

1) высокая степень избыточности данных в файлах;

2) жесткая связь данных и прикладных программ;

3) нет возможности установки связи между данными разных файлов;

4) ограниченный контроль данных;

5) недостаточные возможности управления данными.

Причины , обусловившие появление и быстрое развитие БД:

· недостатки файловой организации;

· необходимость централизации данных с целью коллективного доступа к ним;

· повышенные требования к скорости обработки и достоверности данных;

· технический прогресс в аппаратных средствах.

БД в общем смысле можно определить как определенным образом организованную совокупность данных.

База данных – это именованная совокупность данных, отображающая состояние объектов, их свойства и взаимоотношения в некоторой предметной области.

Объектом может быть предмет, вещество, событие, лицо, явление, абстрактное понятие, то есть все то, что может характеризоваться набором значений некоторой совокупности атрибутов.

Атрибут – это информационное отображение свойства объекта. Н-р, объект «книга» характеризуется атрибутами – «наименование», «авторы», «количество страниц», «тираж», «цена» и др.

Предметная область –  это часть реального мира, которая описывается и моделируется с помощью БД.

Преимущества БД

1. БД можно рассматривать как информационную модель объекта, от обоснованности, точности и достоверности которой во многом зависит эффективность управления объектом.

2. В БД информация хранится централизованно. Многие могут иметь возможность доступа, просмотра и изменения данных в одно и то же время, при этом пользуясь самой последней версией информации. Легче изменять и согласовывать данные. Экономится дисковое пространство.

3. Организация данных в базах дает возможность быстрого поиска, отображения и анализа данных.

БД представляет собой новый подход к организации данных. Возможно обращение к данным без знания физического расположения их в памяти компьютера, вследствие чего доступ к данным и их обработка более просты. Разработка прикладных программ, использующих БД, становится проще, быстрее, дешевле.

7.Устройства для хранения БД

Современные БД имеют большие объемы, измеряемые в Терабайтах (1 Тб=1024 Гб) и даже Петабайтах (1 Пб=1024 Тб).

Экономическая информация

Информация, которая обслуживает процессы производства, распределения, обмена и потребления материальных благ и обеспечивает решение задач управления народным хозяйством и его звеньями, называется управленческой.

Экономическая информация (ЭИ) – это совокупность различных сведений экономического характера, используемых для планирования, учета, контроля, анализа и управления народным хозяйством и его звеньями.

Виды экономической информации

· по функциям управленияучетная, плановая, статистическая, оперативного управления и др.;

· по месту возникновениявнутренняя и внешняя;

· по стадиям образованияпервичная и вторичная;

· по способу представленияцифровая, алфавитно-цифровая, графическая;

· по стабильностипеременная, условно-постоянная, постоянная;

· по полнотенедостаточная, достаточная, избыточная;

· по истинностидостоверная, недостоверная;

 

· по временному периоду возникновения – периодическая и непериодическая.

Структурные единицы ЭИ – реквизиты, показатели, документы, массивы.

 Реквизиты выражают определенные свойства объекта и подразделяются на реквизиты-признаки и реквизиты-основания.

Реквизит-признак характеризует качественные свойства объекта (н-р, Ф.И.О. исполнителя, наименование работы).

Реквизит-основание дает количественную характеристику объекта, выраженную в определенных единицах измерения (н-р, количество изделий в штуках, цена продукта в рублях).

Реквизиты имеют наименования и значения. Область значений описывается форматом.

Формат определяет тип и максимальную длину значений. Тип может быть числовым, символьным, логическим и дата/время. Для записи формата используются определенные символы.

Н-р, в формате цифра 9 означает позицию десятичной цифры, А – буквы, Х – любого символа, В – двоичной цифры (0 или 1).

Совокупность реквизита-основания и логически связанных с ним реквизитов-признаков, имеющих экономический смысл, образует показатель.

На основе показателей строятся документы.

Документ – материальный объект, содержащий информацию, оформленную в установленном порядке, и имеющий правовое значение в соответствии с действующим законодательством.

 Экономические объекты широко применяют различные документы (платежные поручения, акты, сводки, ведомости и т. д.) для отражения своей деятельности.

Совокупность документов одного вида, объединенных по определенному признаку, образует массив.

Пример массива – множество финансовых отчетов предприятий некоторой отрасли.

 

Автоматизированная информационная система (АИС) – это совокупность информации, экономико-математических методов и моделей, технических, программных, технологических средств, а также специалистов, предназначенная для обработки информации и принятия управленческих решений.

Важнейший элемент АИС – информационное обеспечение (ИО). Это информация, характеризующая состояние управляемого объекта и являющаяся основой для принятия управленческих решений. Одним из компонентов ИО является информационная база.

Информационная база включает внутреннюю и внешнюю информацию, хранящуюся на различных носителях.

Внутренняя – финансово-хозяйственное состояние экономического объекта в различные временные интервалы.

Внешняя – состояние рынка и конкурентов, процентные ставки и цены, налоговую политику и др.

 

Трехуровневая модель  организации баз данных

В настоящее время используется трехуровневая модель организации БД, предложенная в 1975 г. ANSI (American National Standards Institute). БД имеет различные уровни описания.

1. Внешний уровень – это представление о БД отдельных пользователей и прикладных программ.

Каждый пользователь, каждая прикладная программа видят и обрабатывают только те данные предметной области, которые им необходимы. Н-р, прикладная программа, используемая отделом кадров, обрабатывает сведения о сотрудниках, их адресе, стаже работы и не оперирует данными о заработной плате.

2. На концептуальном уровне БД представляется обобщенно – объединяются данные, используемые различными пользователями и прикладными программами. Данный уровень фактически определяет обобщенную модель предметной области и не содержит никаких сведений о методах хранения данных.

3. Внутренний (физический) уровень поддерживает представление БД в памяти компьютера.

11 Модель данных – это совокупность  ­ принципов организации БД.

Классическими являются иерархическая, сетевая и реляционная модели данных.

Иерархическая модель

В иерархической модели связи между данными можно представить с помощью дерева

Данные расположены на разных иерархических уровнях и называются сегментами. Самый высокий сегмент – корневой. Сегменты на более низком уровне  сегменты-потомки. Сегменты на более высоком уровне – сегменты-предки.

Каждый сегмент может иметь только одного предка на более высоком уровне и одного или несколько потомков на более низком уровне.

Доступ к определенному сегменту осуществляется по цепочке, от сегмента-предка к сегменту-потомку, начиная слева.

Недостаток иерархической модели – громоздкость для обработки данных со сложными логическими связями.

Достоинство – эффективное использование памяти компьютера при хранении данных.

 12. Сетевая модель

Сетевая модель является развитием иерархической модели. В ней потомок может иметь любое количество предков. Есть сегменты – наборы записей – связываются между собой не только по принципу «сверху вниз», но и «по горизонтали» с помощью наборов связей.

 

Для связи записей ПРОЕКТ и ИСПОЛНИТЕЛЬ вводится запись ИСПОЛНИТЕЛЬ_ПРОЕКТ. 

Достоинства сетевой модели данных – возможность образования произвольных связей и быстрый доступ к данным.

Недостатки сетевой модели – сложность ее понимания для обычного пользователя и большие объемы памяти компьютера на хранение данных.

 

Реляционная модель

Основные понятия реляционной модели данных

В основе реляционной модели данных – понятие отношения. Отношение отображает некоторый объект. Объект характеризуется набором атрибутов D1, D2 ,…, Dn, а каждый атрибут – набором допустимых значений, называемым доменом. Пусть

D1={х1, х2,…,хk}

D2={y1, y2,…,yl}

. . . . . . . . . . . . . .

Dn={z1, z2,…,zm}

Cписок имен атрибутов (D1, D2,…,Dn) называется схемой отношения, а количество атрибутов в отношении – степенью отношения.

Отношение – подмножество R декартова произведения D1 x D2 x … xDn,

 т.е. R Í D1 x D2 x … xDn.

 Декартово произведение – это набор всевозможных сочетаний из n значений, где каждое значение берется из своего домена.

Пусть D1 содержит номера трех заказов {1021, 1022, 1023}, D2 – коды двух клиентов {АА, АС}, D3 – веса трех заказов, заданных в килограммах {100, 300, 120}. В этом случае отношение R есть декартово произведение D1хD2хD3 – набор из 18 троек значений, где первое значение – это один из номеров заказов, второе – это один из кодов клиентов, а третье – один из весов заказа.

Термин «отношение» – синоним слова «таблица». Выше описанное отношение R можно представить как таблицу вида:

Номер заказа Код клиента Вес заказа
1021 АА 100
1021 АА 300

 

  

 

 

  

Столбцы таблицы соответствуют атрибутам. Строки называются кортежами. Количество кортежей в отношении – мощность отношения.

Реляционная модель данных – модель данных, основанная на математическом понятии отношения и представлении отношений в форме таблиц.

Таблица в реляционной модели данных (реляционная таблица) должна обладать следующими свойствами.

1. Каждое значение атрибута, содержащееся на пересечении строки и столбца, должно быть атомарным, т.е. не расчленяться на несколько значений.

2. Значения в столбце должны быть однородными.

3. Каждая строка уникальна, т.е. в таблице не существует двух полностью совпадающих строк.

4. Каждый столбец имеет уникальное имя.

5. Последовательность столбцов в таблице не существенна.

6. Последовательность строк в таблице не существенна.    

 Пример реляционной таблицы – таблица КЛИЕНТЫ:

 

Код клиента Клиент Адрес
АА БГЭУ Минск, пр. Партизанский, 26
АБ Сименс Мюнхен, ул. Лейбница, 8
АС Атлант Минск, пр. Победителей, 61
АД БГУИР Минск, ул. Бровки, 6

 

В таблице реляционной БД столбцы называют полями, а строкизаписями.

 Одно или несколько полей, значения которых в каждой записи таблицы однозначно ее идентифицируют, называют ключевым полем.

В таблице КЛИЕНТЫ таковым может быть поле «Код клиента» или поле «Клиент».

В реляционной БД между таблицами устанавливаются связи. Связи делают их более информативными, чем они являются по отдельности.


Поделиться:



Последнее изменение этой страницы: 2019-04-10; Просмотров: 496; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.421 с.)
Главная | Случайная страница | Обратная связь