Соседи до четвёртого колена

На проходящей в эти дни в Сиэтле (США) конференции SIGIR-2006, Microsoft Research представила работу: Using Web-Graph Distance for Relevance Feedback in Web Search, Sergei Vassilvitskii (Stanford University), Eric Brill. Для улучшения ранжирования документов в выдаче рассматривается в общем-то широкоизвестная гипотеза, состоящая из двух постулатов:

  • Релевантные страницы ссылаются на другие релевантные страницы;
  • На нерелевантные страницы ссылаются другие нерелевантные страницы.

В данной работе предложен алгоритм, по которому в процессе улучшения рейтинга рассматриваются не только ближайшие соседи, но также и все страницы на и с которых ссылаются вплоть до четвёртого колена. И, естественно, показывается, что такой подход позволяет улучшить релевантность выдачи.

В экспериментах использовался движок и база MSN Search. Используется ли такой алгоритм при обслуживании запросов от обычных пользователей и будет ли нечто подобное использоваться в ближайшем будущем пока неизвестно.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *