"Павел Храмцов. Поиск и навигация в Internet" - читать интересную книгу автора Следует заметить, что первичное разбиение документов вещь очень важная,
существенным образом влияющая на качество поиска в массиве документов. Если тематическая направленность запроса пользователя совпадает с тематическим разбиением системы, то можно с большой долей уверенности сказать, что результаты поиска будут хорошими. В противном случае можно получить большое количество совершенно бесполезных документов. Отсюда следует, что в Web в ближайшее время будет наблюдаться появление большого количества специализированных тематических информационных систем со своими каталогами и рубрикаторами, что должно облегчить поиск информации в Сети. Другая проблема, а именно длина пути до информационного ресурса в современных информационных системах Internet, решается путем комбинирования поиска и использования ключевых слов, фраз и классификации. Ключевые слова применяются на заключительной фазе, когда пользователь уже углубился на два - три уровня иерархии. Именно так устроены системы Yahoo, Lycos и OpenText. Фасетные классификации Фасетные классификации от иерархических отличаются тем, что на одном и том же массиве документов можно построить несколько тематических иерархий. Такой подход в информационных системах World Wide Web используется гораздо реже обычных иерархических классификаций и применяется главным образом для работы с локальными информационными ресурсами. Последний тезис хотелось бы пояснить несколько подробнее. отмечалось, что "Всемирная паутина" представляет собой довольно своеобразную гипертекстовую структуру. Каждая база данных, которая поддерживается своим сервером Web, имеет хорошо продуманную и тщательно спланированную структуру, которая при этом еще и постоянно поддерживается в соответствии с нуждами пользователей, но вот связи между серверами носят весьма случайный характер. В большинстве случаев именно виртуальные библиотеки и индексы информационно-поисковых систем Internet являются тем связующим звеном, которое позволяет добраться из одного узла Web в другой. В контексте фасетных классификаций эта ситуация проявляется в двух качествах. Во-первых, в организации на уровне Web-сервера нескольких классификаций одного и того же информационного ресурса; во-вторых, в построении новых страниц, связанных с другими классификациями, расположенными в разных местах сети - классификатора классификаций. Последнее, как правило, применяется для информационного обслуживания специальных групп пользователей. Большое количество такого сорта фасет можно найти путем запроса типа: Type keywords: Virtual Labraries Наибольшее количество этих фасетов удалось найти при поиске в каталоге AltaVista. В локальном варианте фасеты проявляются главным образом в качестве различных средств навигации в массиве документов. Так, в базе данных "Советская ядерная промышленность и технологии" Университета штата Техас кроме обычной иерархии технологий и радиационно-опасных объектов используются еще два типа фасетов: географический и типизация объектов. Географический фасет позволяет выбирать страницы базы данных по |
|
|