Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Классификация и кодирование информации



Одной из операций при работе с информацией является классификация информации об объектах.

Классификация объектов – система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком.

Разработаны 3 метода классификации объектов: иерархический, фасетный, дескрипторный.

Иерархическая система классификации строится следующим образом:

· исходное множество элементов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют 1-й уровень.

· каждый класс 1-го уровня в соответствии со своими, характерным для него классификационным признаками делится на подклассы, которые образуют 2-й уровень

· и т.д.

Пример. Иерархическая система классификации для информационного объекта «Факультет» (рис.1.5), которая позволяет классифицировать информацию о студентах по следующим признакам: факультет, на котором студент учится, возрастной состав, пол, для женщин – наличие детей.

Рисунок 1.5 - Пример иерархической системы классификации

Фасетная система классификации позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классификации называются фасетами. Каждый фасет (Фi) содержит совокупность однородных значений данного классификационного признака. Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов. При этом могут быть использованы не все фасеты (рис. 1.6).

Рисунок 1.6 - Фасетная система классификации

Пример. Для объектов, использованных в предыдущем примере, разработаем фасетную классификацию (рис. 1.7).

Рисунок 1.7 - Пример фасетной классификации

Дескрипторная система классификации. Для организации поиска информации, для ведения тезаурусов (словарей) эффективно используется дескрипторная (описательная) система классификации. Особенно широко она используется в библиотечной системе поиска. Суть этого метода классификации в следующем:

· отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Причем среди ключевых слов могут находиться синонимы.

· выбранные ключевые слова и словосочетания подвергаются нормализации, т.е. из совокупности синонимов выбирается один или несколько наиболее употребляемых;

· создается словарь дескрипторов, т.е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации.

Система кодирования применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.

Система кодирования – совокупность правил кодового обозначения объектов.

Код строится на базе алфавита, состоящего из букв, цифр и других символов. Код характеризуется:

· длиной – число позиций в коде;

· структурой – порядок расположения в коде символов, используемых для обозначения классификационного признака.

Можно выделить две группы методов, используемых в системе кодирования (рис. 1.8):

· классификационная система кодирования, основанная на проведении предварительной классификации объектов (иерархической или фасетной);

· регистрационная система кодирования, не требующая предварительной классификации объектов.

Рисунок 1.8 - Системы кодирования, использующие разные методы

Последовательное кодирование используется для иерархической системы классификации. Сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня и т.д.

Пример. Для объекта ФАКУЛЬТЕТ (см. выше) можно задать следующие коды:

131 - студенты медицинского факультета, свыше 30 лет, мужчины.

2221 - студенты факультета кибернетики, от 20 до 30, женщины, имеющие детей.

Параллельное кодирование используется для фасетной системы классификации. Все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода.

Пример. Для объекта ФАКУЛЬТЕТ код 1310 расшифровывается аналогично предыдущему, но 4-й разряд равен 0 т.к. значение для мужчин не определено.

Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда.

Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые образуют серию, а затем в каждой серии производится порядковая нумерация объектов.


Поделиться:



Популярное:

Последнее изменение этой страницы: 2017-03-09; Просмотров: 840; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.011 с.)
Главная | Случайная страница | Обратная связь