"Журнал «Компьютерра» 2007 № 03 (671) 23 января 2007 года" - читать интересную книгу автора (Компьютерра Журнал)

ТЕХНОЛОГИИ: Ищите и обрящете: Новое обличье интернет-поиска


Автор: Родион Насакин

Поиск в Сети был и остается наиболее динамично развивающимся типом онлайн-сервисов. Об этом свидетельствуют как частые презентации новых функций мэтрами индустрии, прежде всего Google, так и обилие оригинальных проектов от молодых доткомов, многие из которых появились в прошлом году. Попытки последних вписать свое имя в историю поисковой эволюции и, разумеется, отщипнуть кусок рыночного пирога пока нельзя назвать сверхуспешными. Пользователи из любопытства пробуют вводить запросы простым человеческим языком или рассматривают красивые картинки кластеризированных результатов поиска, однако по делу обращаются все больше к «классическим» Google, Yahoo, MSN Search, ну или Ask, на худой конец (а обитатели Рунета еще и к Яндексу).

Однако стартапы не унывают и упорно продвигают свои разработки, справедливо полагая, что если добиться всенародной популярности под своим брэндом не удастся, то всегда можно попробовать продать себя подороже какой-нибудь из вышеперечисленных акул бизнеса. Впрочем, коммерческие перспективы «новичков» интересны постольку поскольку, чего не скажешь о собственно поисковых возможностях таких проектов, по которым можно уже сегодня попробовать угадать, во что превратится интернет-поиск в обозримом будущем.

Абсолютное большинство продвигаемых стартапами сервисов можно разбить на три категории. Одни пытаются привлечь внимание улучшенным интерфейсом, демонстрируя результаты поиска в более наглядном и привлекательном виде. Вторые делают ставку на улучшенные или просто альтернативные технологии поиска, не ограничиваясь простым вычислением степени соответствия (релевантности) той или иной веб-страницы запросу или вовсе отказываясь от подобного метода. Третьи развивают различные направления вертикального поиска, то есть оптимизируют свои сервисы под нахождение определенного вида контента — например, записей в блогах, музыкальных файлов, вакансий и резюме и т. д.


Красота и порядок

Среди сайтов, пытающихся подходить к визуализации результатов нестандартно, относительно широкую известность получили проекты Snap, Kartoo и Quintura.

Разработчики Snap использовали модный нынче AJAX для вывода в результатах поиска скриншотов найденных веб-страниц. Спору нет, беглое ознакомление с внешним видом и основными заголовками сайта нередко позволяет сразу сделать вывод о том, насколько он соответствует сделанному запросу, и, по всей видимости, наличие превью может сократить время, затрачиваемое на поиск. Но только если качество поиска будет оставаться на должном уровне. В случае со Snap этого пока не наблюдается. Релевантность и количество выдаваемых ссылок нельзя назвать удовлетворительными даже для англоязычных запросов. Компенсировать убогость движка создатели попытались, введя в поиск социальный элемент, который выражается в том, что пользователи имеют возможность влиять на рейтинг выдаваемых результатов. Для голосования необходимо под скриншотом кликнуть на «Perfect» или «Junk». Как бы то ни было, идея с предварительным просмотром результатов в виде изображений не только при поиске картинок, но и текста вызвала определенный интерес, и в Сети уже появилось несколько сайтов-клонов. Так что вполне возможно, что со временем скриншоты сайтов станут привычным атрибутом поисковиков.

Сервисы Kartoo и Quintura весьма похожи и эксплуатируют одну и ту же популярную идею графического представления связей между результатами поиска, что должно существенно упростить отбор нужных ссылок. Своих баз эти ресурсы не имеют и импортируют данные из других поисковиков. Kartoo — уже не молодой сайт, особенно по сравнению с другими экспериментаторами от поиска. Он был запущен почти пять лет назад одноименной компанией, специализировавшейся на интерактивной картографии, но по сей день сервис, несмотря на многочисленные почетные титулы и на дифирамбы компьютерной прессы, не завоевал широкой популярности. Суть его работы состоит в следующем. Когда пользователь вводит запрос, система анализирует ключевые слова, пересылает их подходящим поисковикам, выбирает из полученных результатов наиболее релевантные и помещает эти ссылки на экран в виде интерактивной карты, выстраиваемой по собственному алгоритму Kartoo. Узлами на карте являются найденные сайты, а соединительные линии представляют собой связи с ключевыми словами. При наведении курсора сайты и ключевые слова подсвечиваются, а на боковой панели появляется аннотация по заинтересовавшему ресурсу. Для визуализации была использована Flash-технология.

Для русскоязычной аудитории Kartoo особой ценности не представляет, чего не скажешь о его аналоге Quintura, созданном отечественными разработчиками. Помимо работы с сайтом через браузер, программный клиент Quintura Search можно загрузить на компьютер. Результаты поиска в этом сервисе наряду с перечнем ссылок содержат «облако» слов, по смыслу близких к запросу. Пользователь может уточнить, какая именно часть результатов (кластер) его интересует, удаляя не относящиеся к теме слова. Параллельно система будет удалять из списка соответствующие ссылки. Чтобы случайное удаление не привело к потере значимой части найденной информации предусмотрена возможность восстановления кластера. Также в Quintura предусмотрены такие функции, как сохранение результатов поиска в отдельном файле, управление точностью поиска и настройка показываемого на карте количества слов.

По умолчанию система загружает результаты с Google, Яндекса и Рамблера, но для зарубежных пользователей и отечественных «гурманов» предусмотрены плагины для поддержки Yahoo, MSN Search, блоговых поисковиков Google Blog и Technorati, а также Google Desktop. Недавно в Quintura появился поиск по картинкам. Правда, в облаке изображения не «витают», просто в списке результатов помимо ссылок теперь присутствуют и превью.


"Пенсионный" поиск


В нынешнем январе интернет-общественности был представлен новый проект — поисковик для людей старшего поколения Cranky.com, который выдает результаты, наиболее релевантные запросам людей в возрасте от 50 лет. Смущает только имя ресурса: cranky (англ.) — раздраженный, капризный).


Еще одной альтернативой нынешнему поиску в Сети считается привлечение человеческого ресурса. Самой яркой картинкой удачного использования социальных возможностей является небезызвестный del.icio.us [Подробнее о сервисе можно прочитать в статье Андрея Письменного на сайте «КТ» (www.computerra.ru/online/web2/258713)]. Ресурс изначально задумывался как собрание подборок ссылок, снабженных тегами. Однако по мере расширения базы сайта становился очевидным поисковый потенциал сервиса. В системе хранятся данные по каждой ссылке, в том числе количество пользователей, хранящих линк в своем «Избранном». Такой показатель является как минимум не менее адекватным отражением «качества» сайта, нежели PageRank от Google, так как поисковая оптимизация в данном случае бессильна. И кроме того, социальная ориентированность сервиса открывает новые возможности, позволяя, например, посмотреть, какие еще сайты по выбранной тематике пользуются популярностью у пользователей. По сути, речь идет о возвращении поиска в каталогах, который постепенно утратил симпатии пользователей, поскольку автоматически составляемые поисковиками подборки ссылок и методика вычисления рейтингов нередко мало соответствуют реальной популярности ресурсов.

Учитывать общественное мнение при определении рейтинга того или иного сайта планирует и создатель Википедии Джимми Уэльс (Jimmy Wales). Он обещает в нынешнем году запустить новый поисковик Wikiasari, который составит конкуренцию Google. Уэльс считает, что сервис «доткома N1» не свободен от критически серьезных недостатков, что им фактически манипулируют спамеры и получить адекватный результат на запрос зачастую невозможно. Мнение «отца» Википедии по поводу корня проблемы не оригинально — алгоритм, основанный на «машинном интеллекте», в принципе не способен отвечать пользовательским потребностям. Компьютер не может принять решение, хорош сайт или нет, но человек разберется в этом с первого взгляда. Новый проект останется верен wiki-принципам. Результаты поиска в системе будут базироваться на сведениях, предоставляемых пользователями. Первые три ссылки в результатах поиска Wikiasari приведут на страницы онлайн-энциклопедии. Сам же движок поисковика обещают сделать общедоступным в рамках GFDL-лицензии. Однако до конца преданным идеалам open source поисковик все же не останется. На Wikiasari будет размещаться реклама.

Другой вариант с использованием человеческого ресурса предлагается в рамках проекта ChaCha, перспективы которого, впрочем, туманны. Разработчики надеются на то, что нуждающимся в онлайновом поиске придется по вкусу помощь десяти тысяч их «продвинутых» коллег, которые через IM-клиент будут консультировать посетителя и вместе с ним выискивать необходимую информацию. Но очевидно, что это весьма не дешевый вариант («экспертам» платят по $5 в час), и к тому же работает сервис пока очень неторопливо.