Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Региональные информационные ресурсы
Региональные информационные ресурсы (см. рис. 4.6) делятся на: - информационные ресурсы субъектов РФ; - информационные ресурсы городские; - информационные ресурсы муниципальные. Рис. 4.6. Классификация региональных информационных ресурсов Региональные (муниципальные, городские) информационные ресурсы предназначены для управления территориальным образованием. Практически вся первичная информация создается на муниципальном уровне. Участвуют в этом следующие организации: - региональные и муниципальные органы статистики; - органы юстиции, осуществляющие регистрацию прав собственности; - налоговые органы; - страховые; - медицинские и т.д. Базовыми информационными ресурсами являются: кадастры, реестры и регистры. Кадастры недвижимости содержат информацию о муниципальной, региональной и федеральной собственности. Например, градостроительный кадастр содержит генеральный план, градостроительное зонирование и т.д., картографический - топографические планы, аэросъемки и т.д. Реестры содержат информацию о инженерных сетях и коммуникациях. Регистры содержат информацию о юридических лицах и собственности муниципалитета, субъекта федерации, федеральной собственности. Регистр физических лиц содержит информацию в следующих разрезах: базу данных о избирателях, налогоплательщиках, пенсионерах и т.д. Создается база данных, содержащая адресно-справочную информацию о кадастрах, регистрах, реестрах и базах данных. Поисковые машины, их функционирование и оценка Релевантности работы Наиболее мощными поисковыми машинами, использующими предметные указатели (индексы), на сегодняшний день в мире являются: Google, Alta Vista (www.altavista.digital.com), Yahoo! (www.yahoo.com), Infoseek (www.infoseek.com), GoTo (www.goto.com), FTP search (ftpsearch.ntnu.no - поиск в системе FTP), а также отечественные: Rambler (www.rambler.ru), Yandex (yandex.ru), АПОРТ! (www.aport.ru), Следопыт (www.medialingua.ru/www/wwwsearc.htm), Compass (compass.tsu.ru), Russian FTP search (ftpsearch.city.ru - поиск в системе FTP). Популярность приобретают также мультипоисковые машины, которые переадресовывают запрос на поисковые машины, а за тем суммируют полученное и удаляют дублируемые записи (Мetabot.ru опрашивает Google, Alta Vista, Rambler, АПОРТ). Поисковая машина – это программа, которая составляет и хранит предметный указатель Интернета (индекс) и находит в нем заданные ключевые слова, а затем адреса сайтов. Ее функционирование включает два базовых процесса: 1) анализ ресурсов Internet и их индексирование (автоматическое построение и обновление индекса) и создание собственных бах данных, осуществляемое с помощью специальной программы «робота-паука»; 2) поиск по индексу информации, соответствующей запросу пользователя. Работа поисковой машины демонстрируется на рис. 4.11, где представлена работа двух независимых частей: индексирующего робота-паука и поисковика, работающего с индексом. Робот-паук периодически считывает адреса вновь появившихся сайтов и находящихся в базе данных и создает индексы. Индекс – это хранимые по алфавиту основы слов и ссылки на номера web-страниц, где они присутствуют. Индексная запись имеет следующую структуру: Основа слова (адрес страницы, адрес страницы, …, адрес страницы). Основа это ключевое слово специально обработанное (без формообразующего суффикса и окончания). Если в обычном тексте чтение происходит от номера страницы к словам, то поисковая машина идет от слов к номерам страниц. Поэтому индекс поисковой машины называется инвертированным (перевернутым). Рис. 4.11. Элементы поисковой машины. Поисковая машина в соответствии с запросом пользователя просматривает индексы и выдает результаты в виде адресов, по которым находятся текстовые копии искомых страниц Интернета. Оценка релевантности (точности) выданных поисковой машиной документов осуществляется на основе следующих характеристик: - Частота встречаемости ключевых слов в найденной странице. - Плотность ключевого слова: частота встречаемости ключевых слов в найденном объеме текста. - Положение ключевого слова на странице (чем ближе к началу, тем лучше) - Вес ключевого слова, рассчитываемого как отношение частоты его использования к общему количеству слов на индексируемой странице, выраженного в процентах. Поисковые машины могут просмотреть небольшую часть сайтов в Интернете, что свидетельствует о том, что существует видимый и невидимый Интернет. Число документов невидимой части в 500 раз превышает ее видимую часть. Популярное:
|
Последнее изменение этой страницы: 2017-03-11; Просмотров: 611; Нарушение авторского права страницы