Структура данных файловой модели

⇐ ПредыдущаяСтр 9 из 20Следующая ⇒

Процесс создания компьютерной базы данных состоит в переносе информации с традиционных бумажных документов (карточек, таблиц) на магнитные диски компьютера.

В файловых системах реализуется модель типа плоский файл. При такой модели компьютерная БД представляет собой совокупность не связанных между собой файлов (независимых) из однотипных записей с линейной (одноуровневой) структурой.

Файл базы данных состоит из отдельных записей, каждая из которых содержит информацию, традиционно хранящуюся на отдельной карточке картотеки или в отдельной строке таблицы (рис.5.1). Таким образом, количество записей в файле базы данных соответствует количеству строк таблицы, информация с которой переносится в файл данных.

Основные типы структур данных файловой модели — поле, запись, файл. Запись является основной структурной единицей обработки данных и единицей обмена между оперативной и внешней памятью.

Поле — это элементарная единица логической организации данных, которая соответствует отдельной, неделимой единице информации — реквизиту, компьютерный аналог одной графы бланка или записи.

Запись — это совокупность полей, соответствующих логически связанным реквизитам, аналог информации, которая обычно на компьютере в виде одной карточки в объеме записи. Структура записи определяется составом и последовательностью входящих в нее полей, каждое из которых содержит элементарное данное.

Файл — это множество одинаковых по структуре экземпляров записей со значениями в отдельных полях. Экземпляр записи представляет собой реализацию записи, содержащую конкретные значения полей. Структура записи файла — линейная, то есть поля имеют единственное значение и отсутствуют групповые данные. Каждый экземпляр записи однозначно идентифицируется уникальным ключом записи. В общем случае ключи записи бывают двух видов: первичный (уникальный) и вторичный ключ.

Первичный ключ (ПК) — это одно или несколько полей, однозначно идентифицирующих запись. Если первичный ключ состоит из одного поля, он называется простым, если из нескольких полей — составным ключом.

Вторичный ключ (ВК), в отличие от первичного, — это такое поле, значение которого может повторяться в нескольких записях файла, то есть он не является уникальным. Если по значению первичного ключа может быть найден один единственный экземпляр записи, то по вторичному — несколько.

	Класс Б
	Класс Б
Класс Б Фамилия Иванов Имя Дмитрий Отчество Сергеевич Дата рождения 11 января 1967 года Пол М Успеваемость: Физика 5 Математика 4 Русский язык 5 Ботаника 5 География 3 Физвоспитание 4

Рис 5.1 Картотека учащихся (бумажный носитель информации)

Запись 1

Иванов

Дмитрий

Сергеевич

11.01.67

Поля

Запись 2

…

Запись n

б) Файл базы данных

Названные структуры данных используются и в ряде СУБД, что делает эти понятия в определенном смысле универсальными. Рассмотрим пример, где на рис. 5.2а представлена база данных на бумажном носителе информации, на рис. 5.2б эта же база данных но в электронном виде.

Таб. номер	Фамилия И.О.	В том числе	Налог	Дата выдачи	Сумма к
зарплата	премия	выдаче
	Абрамов Д.Н.
	Буланов П.М.
	Васин Н.М.
	Горин Н.Е.
	Ильин М.Н.
Итого:

а) Ведомость расчета заработной платы

Запись 1

Абрамов Д.Н.

Запись 2

Буланов П.М.

Запись m

Яшин С.Ф.

б) Файл базы данных

Рис. 5.2

Средством эффективного доступа по ключу к записям файла является индексирование. При индексировании создается дополнительный индексный файл, который содержит в упорядоченном виде все значения ключа файла данных. Для каждого значения ключа в индексном файле содержится указатель на соответствующую запись файла данных. При наличии индексного файла, размеры которого меньше основного файла, по заданному ключу быстро отыскивается запись. С помощью указателя на запись в файле данных осуществляется прямой доступ к этой записи. Индексирование может производиться не только по первичному, но и по вторичному ключу.

В качестве примеров традиционных документов приведены картотека учащихся, подобная тем, которые в той или иной форме ведутся в каждом из учебных заведений, и таблица-ведомость расчета заработной платы (рис.5.1 и 5.2).

Запись файла состоит из отдельных полей, количество которых соответствует числу граф таблицы или числу заполняемых строк карточки.

Описание логической организации данных файловой модели

При описании логической организации данных каждому файлу присваивается уникальное имя и дается описание структуры его записей. Описание структуры записей включает перечень входящих в нее полей и их порядок внутри записи. Для каждого поля задается сокращенное обозначение - имя поля (идентификатор поля внутри записи), формат поля — тип хранимого данного, длина поля и точность числовых данных. Для полей, выполняющих роль уникального (первичного) ключа записи, указывается признак ключа. Структуру файла при описании компьютерной БД можно представить в виде таблицы, где отмечаются первичные и вторичные ключи.

В табл. 5.1 приведен пример описания структуры записи файла «Ведомость». Здесь первичный ключ записи является составным, так как только совокупность реквизитов-признаков — Ntabel, FIO — определяет конкретную запись. Поля записи содержат данные, которые могут быть отнесены к одному из нескольких возможных типов. Например, поля, хранящие фамилию, имя, отчество, относятся к типу символьные. Поля, содержащие сведения о заработной плате работника и т.п., определяются как числовые. В отличие от символьных над данными числовых полей можно проводить арифметические вычисления. Например вычислить сумму к выдаче и записать ее в поле SUMMA. Поле, содержащее дату можно определить как символьное. Однако можно получить весьма полезные дополнительные возможности обработки данных, если дату определить как специальный тип - дата. В этом случае можно, например, по известному номеру месяца получить его название, определить количество дней между двумя заданными датами и т.п.

Таблица 5.1.

Структура записи файла VEDOMOST «Ведомость»

Имя файла VEDOMOST – Ведомость
Поле	Признак	Формат поля
Обозначение (имя)	наименование (реквизит)	ключа	Тип	Длина	Точность
Ntabel	Табельный номер	ПК	число
FIO	Фамилия И.О.	ПК, ВК	симв.
ZARP	Зарплата	—	число
PREM	Премия	—	число
NALOG	Налог	—	число
DATA	Дата выдачи	—	дата
SUMMA	Сумма к выдаче	—	число

Модели данных

Другой, более эффективной, организацией БД является организация логически взаимосвязанных массивов в базах данных. Для управления базами данных, их создания и ведения используются специализированные эффективные программные средства — системы управления базами данных. База данных является интегрированной совокупностью не дублируемых данных, на основе которых решаются все задачи данной предметной области. В базе данных имеется возможность многоаспектного доступа и использования одних и тех же данных различными пользователями и задачами.

Структура создаваемой базы данных должна отображать информационно-логическую модель данных предметной области. Логические взаимосвязи в базе данных организуются в соответствии с типом модели данных, поддерживаемой выбранной СУБД: иерархическая, сетевая, реляционная. В зависимости от принципов организации данных, принятых в модели, реализуются связи в базе данных.

Более сложными моделями данных компьютерной сферы (по сравнению с файловой) являются сетевые и иерархические модели, которые поддерживаются в системе управления базами данных (СУБД) соответствующего типа. Тип модели данных, поддерживаемой СУБД на машинном носителе, является одним из важнейших признаков классификации СУБД.

Сетевая или иерархическая модель данных представляет соответствующий метод логической организации базы данных в СУБД. Такая модель является совокупностью взаимосвязанных объектов. Связь двух объектов отражает их подчиненность. Объектом в сетевой или иерархической модели является основной тип структур данных из тех, которые поддерживаются СУБД. В различных СУБД этот тип структур данных может по-разному быть определен и назван (тип записи, файл, сегмент).

При построении информационного обеспечения любой системы начинают с рассмотрения ее предметной области (ПО). Под предметной областью обычно понимают совокупность реальных объектов (сущностей), как часть реального мира, которую предстоит изучить, систематизировать и, в конечном итоге, автоматизировать. Именно на ее основе может быть построена информационная система. Примером ПО может служить: лицо (фамилия, имя отчество, возраст, пол и т.д.), транспортное средство (марка, цвет, гос. номер и т.д.).

Ввиду громоздкости описания предметной области в терминах объектов множество ПО разбивают на типы объектов. Каждый такой тип обладает одинаковыми наборами свойств (атрибутов) объектов.

Всем объектам присваивается идентификатор для быстрого поиска элемента в базе. Для того чтобы можно было однозначно ссылаться на определенный объект, существует уникальный идентификатор, называемый первичным ключом, в качестве которого может использоваться какой-либо обязательный атрибут объекта. Значения первичного ключа не могут обновляться. Примером первичного ключа автомобиля может служить его номер двигателя. В случае если невозможно подобрать атрибут с уникальными значениями, то в качестве первичного ключа используется комбинация атрибутов. Например: Фамилия – Имя – Отчество – Год рождения. Вторичным ключом является не уникальный идентификатор.

Между объектами модели данных существуют структурные связи различной размерности (арности). Совокупность взаимосвязанных конкретных объектов модели для некоторой предметной области образует базу данных. Большинство связей ПО могут быть представлены простыми или составными бинарными связями (т.е. связи между двумя объектами или двумя множествами объектов). Их 3 типа:

а) один – к – одному (1: 1)

б) один – ко – многим (1: n)

в) многие – ко – многим (m: n)

Связи между двумя объектами модели определяются групповыми отношениями между их экземплярами. Групповое отношение (набор) — это строго иерархическое отношение между записями двух типов: главной записью набора и подчиненными записями набора.

⇐ Предыдущая 4 5 6 7 8910 11 12 13 Следующая ⇒