Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Классификация и кодирование информации
Одной из операций при работе с информацией является классификация информации об объектах. Классификация объектов – система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком. Разработаны 3 метода классификации объектов: иерархический, фасетный, дескрипторный. Иерархическая система классификации строится следующим образом: · исходное множество элементов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют 1-й уровень. · каждый класс 1-го уровня в соответствии со своими, характерным для него классификационным признаками делится на подклассы, которые образуют 2-й уровень · и т.д. Пример. Иерархическая система классификации для информационного объекта «Факультет» (рис.1.5), которая позволяет классифицировать информацию о студентах по следующим признакам: факультет, на котором студент учится, возрастной состав, пол, для женщин – наличие детей. Рисунок 1.5 - Пример иерархической системы классификации Фасетная система классификации позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классификации называются фасетами. Каждый фасет (Фi) содержит совокупность однородных значений данного классификационного признака. Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов. При этом могут быть использованы не все фасеты (рис. 1.6). Рисунок 1.6 - Фасетная система классификации Пример. Для объектов, использованных в предыдущем примере, разработаем фасетную классификацию (рис. 1.7). Рисунок 1.7 - Пример фасетной классификации Дескрипторная система классификации. Для организации поиска информации, для ведения тезаурусов (словарей) эффективно используется дескрипторная (описательная) система классификации. Особенно широко она используется в библиотечной системе поиска. Суть этого метода классификации в следующем: · отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Причем среди ключевых слов могут находиться синонимы. · выбранные ключевые слова и словосочетания подвергаются нормализации, т.е. из совокупности синонимов выбирается один или несколько наиболее употребляемых; · создается словарь дескрипторов, т.е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации. Система кодирования применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации. Система кодирования – совокупность правил кодового обозначения объектов. Код строится на базе алфавита, состоящего из букв, цифр и других символов. Код характеризуется: · длиной – число позиций в коде; · структурой – порядок расположения в коде символов, используемых для обозначения классификационного признака. Можно выделить две группы методов, используемых в системе кодирования (рис. 1.8): · классификационная система кодирования, основанная на проведении предварительной классификации объектов (иерархической или фасетной); · регистрационная система кодирования, не требующая предварительной классификации объектов. Рисунок 1.8 - Системы кодирования, использующие разные методы Последовательное кодирование используется для иерархической системы классификации. Сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня и т.д. Пример. Для объекта ФАКУЛЬТЕТ (см. выше) можно задать следующие коды: 131 - студенты медицинского факультета, свыше 30 лет, мужчины. 2221 - студенты факультета кибернетики, от 20 до 30, женщины, имеющие детей. Параллельное кодирование используется для фасетной системы классификации. Все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода. Пример. Для объекта ФАКУЛЬТЕТ код 1310 расшифровывается аналогично предыдущему, но 4-й разряд равен 0 т.к. значение для мужчин не определено. Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда. Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые образуют серию, а затем в каждой серии производится порядковая нумерация объектов. Популярное:
|
Последнее изменение этой страницы: 2017-03-09; Просмотров: 920; Нарушение авторского права страницы