Региональные информационные ресурсы

Региональные информационные ресурсы (см. рис. 4.6) делятся на:

- информационные ресурсы субъектов РФ;

- информационные ресурсы городские;

- информационные ресурсы муниципальные.

Рис. 4.6. Классификация региональных информационных ресурсов

Региональные (муниципальные, городские) информационные ресурсы предназначены для управления территориальным образованием.

Практически вся первичная информация создается на муниципальном уровне. Участвуют в этом следующие организации:

- региональные и муниципальные органы статистики;

- органы юстиции, осуществляющие регистрацию прав собственности;

- налоговые органы;

- страховые;

- медицинские и т.д.

Базовыми информационными ресурсами являются: кадастры, реестры и регистры.

Кадастры недвижимости содержат информацию о муниципальной, региональной и федеральной собственности. Например, градостроительный кадастр содержит генеральный план, градостроительное зонирование и т.д., картографический - топографические планы, аэросъемки и т.д.

Реестры содержат информацию о инженерных сетях и коммуникациях. Регистры содержат информацию о юридических лицах и собственности муниципалитета, субъекта федерации, федеральной собственности.

Регистр физических лиц содержит информацию в следующих разрезах: базу данных о избирателях, налогоплательщиках, пенсионерах и т.д. Создается база данных, содержащая адресно-справочную информацию о кадастрах, регистрах, реестрах и базах данных.

Поисковые машины, их функционирование и оценка

Релевантности работы

Наиболее мощными поисковыми машинами, использующими предметные указатели (индексы), на сегодняшний день в мире являются: Google, Alta Vista (www.altavista.digital.com), Yahoo! (www.yahoo.com), Infoseek (www.infoseek.com), GoTo (www.goto.com), FTP search (ftpsearch.ntnu.no - поиск в системе FTP), а также отечественные: Rambler (www.rambler.ru), Yandex (yandex.ru), АПОРТ! (www.aport.ru), Следопыт (www.medialingua.ru/www/wwwsearc.htm), Compass (compass.tsu.ru), Russian FTP search (ftpsearch.city.ru - поиск в системе FTP). Популярность приобретают также мультипоисковые машины, которые переадресовывают запрос на поисковые машины, а за тем суммируют полученное и удаляют дублируемые записи (Мetabot.ru опрашивает Google, Alta Vista, Rambler, АПОРТ).

Поисковая машина – это программа, которая составляет и хранит предметный указатель Интернета (индекс) и находит в нем заданные ключевые слова, а затем адреса сайтов. Ее функционирование включает два базовых процесса:

1) анализ ресурсов Internet и их индексирование (автоматическое построение и обновление индекса) и создание собственных бах данных, осуществляемое с помощью специальной программы «робота-паука»;

2) поиск по индексу информации, соответствующей запросу пользователя.

Работа поисковой машины демонстрируется на рис. 4.11, где представлена работа двух независимых частей: индексирующего робота-паука и поисковика, работающего с индексом. Робот-паук периодически считывает адреса вновь появившихся сайтов и находящихся в базе данных и создает индексы. Индекс – это хранимые по алфавиту основы слов и ссылки на номера web-страниц, где они присутствуют.

Индексная запись имеет следующую структуру:

Основа слова (адрес страницы, адрес страницы, …, адрес страницы).

Основа это ключевое слово специально обработанное (без формообразующего суффикса и окончания). Если в обычном тексте чтение происходит от номера страницы к словам, то поисковая машина идет от слов к номерам страниц. Поэтому индекс поисковой машины называется инвертированным (перевернутым).

Рис. 4.11. Элементы поисковой машины.

Поисковая машина в соответствии с запросом пользователя просматривает индексы и выдает результаты в виде адресов, по которым находятся текстовые копии искомых страниц Интернета.

Оценка релевантности (точности) выданных поисковой машиной документов осуществляется на основе следующих характеристик:

- Частота встречаемости ключевых слов в найденной странице.

- Плотность ключевого слова: частота встречаемости ключевых слов в найденном объеме текста.

- Положение ключевого слова на странице (чем ближе к началу, тем лучше)

- Вес ключевого слова, рассчитываемого как отношение частоты его использования к общему количеству слов на индексируемой странице, выраженного в процентах.

Поисковые машины могут просмотреть небольшую часть сайтов в Интернете, что свидетельствует о том, что существует видимый и невидимый Интернет. Число документов невидимой части в 500 раз превышает ее видимую часть.

⇐ Предыдущая 1 2 3 456 7 8 9 10 Следующая ⇒