Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Эта величина одновременно характеризует неопределенность появления отдельных символов алфавита в сообщении (сигнале) и называется энтропией.



Действительно, если вероятность появления какого-либо одного символа в данном сообщении равна единице, то при этом вероятность появления всех остальных символов равна нулю, поскольку

p1+p2+... +pm =1.

 

Важную роль в развитии теории информации сыграли математические исследования, например, работы А.Н. Колмогорова и его школы привели к новым определениям количества информации - не только вероятностному, но и комбинаторному и алгоритмическому.

Алгоритмическое количество информации рассматривалось как минимальная длина программы (сложность), позволяющая однозначно преобразовать одно множество в другое.

Качество информации.

Пользоваться критерием ценности информации следует избирательно. Дело в том, что полученные сведения могут не иметь отношение к решаемой задаче, но, тем не менее, быть информативными. Вообще, оценка значимости информации производится человеком часто интуитивно, опираясь на собственный интеллект и опыт.

В настоящее время существуют три подхода (критерия) к оценке качества информации.

При первом подходе ценность информации определяется по снижению состояния неопределенности.

Статистическая теория информации исходит из того, что информация понимается как мера уменьшения неопределенности знания после получения сообщения. Т.е., получение сообщения эквивалентно получению дополнительного знания, которое меняет ранее созданную картину.

В некоторых работах понятие ценности информации базируется на статистической теории информации и теории решений. Сущность метода состоит в том, что кроме вероятностных характеристик неопределенности объекта до и после получения информации вводятся функции штрафов и потерь и оценка производится в результате минимизации потерь.

Кроме того, предполагается, что получаемое количество информации может не иметь никакой ценности или его ценность может быть отрицательной, например, когда передается ложная информация и неопределенность не сокращается, а возрастает.

Информация называется полезной, если она уменьшает неопределенность решающего алгоритма, также не имеет смысла говорить о полезной информации, содержащейся в сигнале, если не указаны задача, которая решается, начальное состояние решающего алгоритма и свойства декодирующего алгоритма.

Во втором подходе ценность информации определяется по достижению поставленной цели;

Одной из первых работ по проблеме ценности информации явилась статья, в которой предлагалось принять за меру ценности информации количество информации, необходимое для достижения поставленной цели. Так если до получения информации вероятность достижения цели равнялась Ро, а после ее получения Р1, то ценность информации определяется как логарифм отношения Ро1. Ценность информации при этом измеряется в битах. Этот критерий логически связан с теорией информации К. Шеннона, где под количеством информации имеется в виду снятая неопределенность.

Для систем с ясно определенной целью ценность информации можно выразить через приращение вероятности достижения цели. С технической точки зрения можно сформулировать так: для увеличения производительности экономической системы в k раз необходимо расширить пропускную способность каналов и объем создаваемых, передаваемых и обрабатываемых сообщений приблизительно в k2 раз.

Третий подход рассматривает ценность информации с точки зрения приращения тезауруса, т.е. в данном случае под ценностью информации понимается мера расширения, развития тезауруса воспринимаемой стороной при приеме и интерпретации сообщения. Тезаурус - систематизированный словарь понятий с указанием смысловых связей между ними.

Эта идея построения семантической теории информации была выдвинута Н.Винером. В этом случае для понимания и использования полученной информации получатель должен обладать определенным запасом знаний. Действительно, полное незнание предмета не позволяет извлечь существенной научной информации из принятого сообщения об этом предмете. По мере роста наших знаний о предмете растет и количество научной информации, извлекаемой из сообщения. Если назвать имеющиеся у получателя знания о данном предмете " тезаурусом" (т.е. неким сводом понятий, названий объектов, связанных смысловыми связями), то количество информации, содержащееся в некотором сообщении можно оценить степенью изменения индивидуального тезауруса под воздействием данного сообщения. Иными словами, количество семантической информации, извлекаемой получателем из поступающих сообщений, зависит от степени подготовленности его тезауруса для восприятия такой информации.

Проблема ценности информации особенно актуальна в настоящее время, когда из всей информации (а сейчас море информации) необходимо выбрать нужную информацию данному пользователю в данное время, но задача определения ценности информации пока окончательно не решена.

Можно обозначить лишь следующие качественные характеристики информации как явления:

· является объективно существующим феноменом объекта;

· выражает и обозначает элементы объективной реальности;

· имеет материальную и идеальную форму;

· является двойственным элементом процесса коммуникации, выступая одновременно средством и целью;

· имеет качественные и количественные характеристики.

Свойства информации

Качество информации – обобщенная положительная характеристика информации, отражающая степень ее полезности для пользователя.

Основные свойства информации с точки зрения потребителя.

1. Релевантность – способность информации соответствовать нуждам (запросам) пользователя.

2. Полнота – свойство информации исчерпывающе (для данного пользователя) характеризовать отображаемый объект и\или процесс.

3. Своевременность – способность информации соответствовать нуждам потребителя в нужный момент времени.

4. Достоверность – свойство информации не иметь скрытых ошибок.

5. Доступность – свойство информации, характеризующее возможность ее получения данным потребителем.

6. Защищенность – свойство, характеризующее невозможность несанкционированного использования или изменения информации.

7. Эргономичность – свойство, характеризующее удобство формы или объема информации с точки зрения данного потребителя.

8. Однозначность (адекватность) – свойство, характеризующее невозможность различной (неоднозначной) трактовки информации. Для систем использующих ЭВМ это свойство имеет очень большое значение.

 

При создании систем автоматизированной обработки информации для изучения свойств и особенностей информации и информационных потоков конкретной предметной области проводится синтаксический, семантический и прагматический анализ информации.

Синтаксический анализ позволяет установить важнейшие параметры информационных потоков, включая количественные характеристики для выбора комплекса технических и программных средств для их обработки.

Семантический анализ позволяет изучить информацию с точки зрения смыслового содержания ее отдельных элементов, находить способы языкового соответствия (язык человека - язык ЭВМ) при однозначном распознавании вводимых в систему сообщений.

Прагматический анализ позволяет определить степень полезности информации, выявить практическую значимость сообщений. Учитывая, что полезность информации является функцией времени и что одна и та же информация в разное время может быть полезной или бесполезной, принятые критерии оценки полезности увязываются с достоверностью и своевременностью поступающих сообщений.

 

 

Понятие знаний.

Знания рождаются и функционируют в обществе, проявляясь во всех информационно-коммуникативных интеллектуальных процессах. Они имеют различные формы существования и представления. Например, квалификация - это " живые" знания, неотделяемые от живых носителей (людей) и проявляющиеся в опыте, т.е. в умении человека осуществлять ту или иную полезную работу - физическую или интеллектуальную.

По определению Даниэла Белла «знание – это совокупность организованных высказываний о фактах или идеях, представляющих обоснованное суждение или экспериментальный результат, которая передается другим посредством некоторого средства коммуникации в некоторой систематизированной форме».

Денхем Грей трактует понятие знания как абсолютное использование информации и данных, совместно с потенциалом практического опыта людей, способностями, идеями, интуицией, убежденностью и мотивациями.

С появлением систем искусственного интеллекта появилось новое понятие - " база знаний", поэтому появилась необходимость соотнести понятия " данные и база данных" с понятиями " знания и база знаний".

Данные и структура базы данных в определенной степени отражает знания о предметной области и ее структуре. Можно выделить основные признаки знаний:

1. Одним из важных признаков знаний является структурированность, которую можно рассматривать как свойство декомпозиции сложных объектов на более простые и установление связей между простыми объектами, что означает использование отношений " часть-целое", " класс-подкласс", " род-вид" и т.п. Отношения подобного рода встречаются в иерархических, сетевых и реляционных базах данных.

2. Для такого признака знаний, как связность, практически нельзя найти аналогов среди названных выше баз данных. Знания наши связаны не только в смысле структуры, они отражают также закономерности относительно фактов, процессов, явлений и причинно-следственные отношения между ними.

3. Человеку свойственна познавательная активность, т.е. знания человека активны. Это принципиально отличает знания от данных.

Если данные – это отдельные факты, характеризующие объекты, процессы и явления в предметной области, а также их свойства, то знания – это выявленные закономерности предметной области (принципы, связи, законы), позволяющие решать задачи в этой области.

При обработке на ЭВМ данные трансформируются, условно проходя следующие этапы:

· данные как результат измерений и наблюдений;

· данные на материальных носителях информации (таблицы, протоколы, справочники);

· модели (структуры) данных в виде диаграмм, графиков, функций;

· данные в компьютере на языке описания данных;

· базы данных на машинных носителях.

Знания связаны с данными, основываются на них, но представляют результат мыслительной деятельности человека, обобщают его опыт, полученный в ходе выполнения какой-либо практической деятельности. Они получаются эмпирическим (empeiria – опыт) путем.

При обработке на ЭВМ знания трансформируются аналогично данным:

· знания в памяти человека как результат мышления;

· материальные носители знаний (учебники, методические пособия);

· поле знаний – условное описание основных объектов предметной области, их атрибутов и закономерностей, их связывающих;

· знания, описанные на языках представления знаний (см. далее);

· базы знаний [3].

Для хранения данных используются базы данных (для них характерны большой объем и относительно небольшая удельная стоимость информации), для хранения знаний – базы знаний (небольшой объем, но исключительно дорогие информационные массивы). База знаний - основа любой интеллектуальной системы.

Знания могут быть классифицированы по следующим категориям:

поверхностные – знания о видимых взаимосвязях между отдельными событиями и фактами предметной области;

глубинные – абстракции, аналогии, схемы, отображающие структуру и процессы в предметной области.

Кроме того, знания можно разделить на процедурные и декларативные.

Исторически первичными были процедурные знания, т.е. знания, «растворенные» в алгоритмах. Они управляли данными. Для их изменения требовалось изменять программы. Однако с развитием искусственного интеллекта приоритет данных постепенно изменялся, и все большая часть знаний сосредотачивалась в структурах данных (таблицы, списки, абстрактные типы данных), т.е. увеличивалась роль декларативных знаний.

Сегодня знания приобрели чисто декларативную форму, т.е. знаниями считаются предложения, написанные на языке представления знаний, приближенному к естественному и понятному неспециалисту [3].

 

Экономическая информация


Поделиться:



Последнее изменение этой страницы: 2017-03-17; Просмотров: 373; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.022 с.)
Главная | Случайная страница | Обратная связь