Перейти к содержимому

2

В конце прошлого года появились сообщения о проекте создания поисковика основателем Википедии, отличительной чертой которого будет участие компьюнити в "рихтовке" результатов поиска. Пока процесс создания этого поисковика находится в начальной стадии обсуждения архитектуры, создания команды разработчиков и т.п.

В тоже время, компания Microsoft выпустила сообщение о том, что в её исследовательском центре в Силиконовой долине также разрабатывается технология поика, использующая сложившееся онлайновое окружение конкретного пользователя выполняющего поисковый запрос. Эта технология, получившая название Ноктурнал (Nocturnal), основывается на двух продуктах: Microsoft Live Messenger, используемом для обмена информацией (файлы, картинки, историю действий и что-угодно ещё) в уже сложившейся инфраструктуре онлановых контактов между пользователями; и конечно же на Microsoft Live Search, результаты поиска которого специальный тулбар обрабатывает (досортировывает) особым образом с учётом рекомендаций, получаемых от ваших контактов в Live Messenger.

Основной лейтмотив этой новой технологии: кто еще, как не ваше ближайшее окружение может знать ваши потребности и предпочтения (очевидно для разрешения возможных неоднозначностей при поиске).

// Web Search—With a Little Help from Your Friends

12

В продолжение темы оплаты за использование поисковика, см. Деньги за пользование поисковиком и Оценка таксы MSN Search: Компания Microsoft объявила а проведении пробной компании предоставления скидок на услуги и обучение крупным корпоративным клиентам, чьи сотрудники используют Microsoft Live Search в качестве поисковика.

Компания не назвала конкретного алгоритма расчёта скидок, но указала, что величина скидок зависит как от числа компьютеров компании, участвующих в программе, так и от общего числа поисковых запросов, выполняемых сотрудниками компании в Live Search.

//AustralianIT

2

Бил Тэнсер (Bill Tancer) из Hitwise US в своём блоге опубликовал статистику долей поискового рынка в США за декабрь 2006 и за январь 2007:

Поисковик Январь 2007 Декабрь 2006 Изменение
www.google.com 63,06% 63,15% -0,09%
search.yahoo.com 21,40% 21,62% -0,22%
search.msn.com 9,95% 9,46% +0,49%
www.ask.com 3,54% 3,72% -0,18%
www.aolsearch.ocm 0,54% 0,59% -0,05%
Другие поисковики 1,51% 1,46% +0,05%

Как видно, наибольший рост у MSN Search, и связан он, скорее всего, с выходом Windows Vista, где этот поисковик задан в качестве поисковика по умолчанию. Yahoo! и Ask.com потеряли примерно одинаково и больше всех. В то же время отмечается незначительный рост интереса к другим поисковикам на фоне небольшого охлаждения к Google.

//Bill Tancer -- Hitwise US

2

Во время празднования Дня Австралии, обе компании, Google и Microsoft, запланировали пролёты самолетов над Сиднеем с целью обновления своих виртуальных моделей местности, используемых в Google Maps и Earth и в Microsoft Live Local (Virtual Earth). Компания Microsoft даже провела рекламную кампанию, призывая сиднейцев выйти на улицу и "помахать ручкой" и учередив приз в $2000 самой экстравагантно одетой персоне.

В назначенное время самолёт Microsoft пролетел на Сиднеем на высоте 2500 метров. В то время как пролёт самолёта Google не состоялся, -- его планировали провести на гораздо более низкой высоте, 600 метров, однако авиационные власти Австралии не разрешили вылет самолёту Google в назначенное время из-за высокого авиа-трафика над городом в этот день.
//SearchEngineLand.

3

Люди с древнейших времён мечтали о полёте, ако птицы... И вот в начале 20 века человек полетел, немного не так, как мечтали, внутри "желзных птиц", ака самолётов.

Уже пару веков (а может и больше), человек мечтает о машине времени. Конец 20 века подарил надежду на реализацию и этой мечты -- виртуальные кибер-миры.

В данный момент разворачивается битва между Google и Microsoft за виртуальную модель Земли. Да, в данный момент всё ориентировано на поиск информации о каких-либо объектах на поверхности в данный конкретный момент времени. Но имея виртуальную Землю и проиндексированные архивы (вот где еще копать и копать :), можно давольно таки подробно реконструировать некоторые фрагменты поверхности Земли в прошлом, например поля знаменитых сражений, или распространение волны ценами в Азии в декабре 2004, или единственное плавание "Титаника", и т.д. В принципе можно "открутить" назад всю историю Земли, до момента зарождения Солнца.

UPDATE: Не говоря уже о возможных онлайновых играх над виртульной Землей, в антураже, наиболее приближенном к историческому.

15

Наблюдал по логам, почему эффективность HTTP кэша получается не очень. Оказалось весьма просто и неожиданно мелкогадко: кто у нас жрёт страницы немерянно, -- правильно, боты поисковиков. Получается такая фигня: боты Google, Yahoo, Ask, WebAlta поддерживают получение сжатого контента, боты Яндекса, Рамблера и MSN -- не поддерживают, и вот ночью набегает стая ботов первой группы, забивает кэш сжатыми копиями страниц, прибегает свора ботов второй группы, тянет тоже самое, кэш естественно не работает, бо не умеет расжимать на лету, перетягивает тот же контент, но уже в несжатом виде...

Почему это мелкогадко -- прикрутить к краулеру поддержку сжатия контента при передаче это задача для студиозусов (решается просто и быстро, благо библиотек навало, да и инфы много, ка кэто должно работать). Получается, что у Яндекса, Рамблера и MSN либо соответствующие менеджеры мышей не ловят, либо их инфраструктура уже почти на пределе и не позволяет тянуть небольной overhead разжатия вытянутого контента...

По любому выходит, что WebAlta уже уделала и Яндекс и Рамблер, по крайней мере в технической реализации поддержки протокола HTTP. 🙂

3

По сообщению на сайте форума SearchEngineWatch, вебмастера некотрых сайтов начали получать от поисковика Live.com "чёрные метки", сообщающие об удалении подшефного сайта из индекса этой поисковой системы за обильный нетематический обмен ссылками, по всей видимости направленый на искуственное увеличение рейтинга. Как и Яндекс, Live.com просит связаться со слубой поддержкикак только ссылки будут убраны с сайта, чтобы рассмотреть вопрос включения сайта обратно в индекс.

3

Компания Microsoft объявила о завершении бета-тестирования и официальном запуске её поискового портала Live Search, работающего в 47 странах. В этой версии помимо запланированого развития поисковых технологий, также учтены замечания и предложения, полученные от пользователей бета-версии поисковика, отправленные через форму обратной связи. Основная страница поисковика максимально облегчена (эксперименты с интерфейсов завершены) и напоминает основную страницу Google. Также в правом верхнем углу появились предложения по уточнению поиска.

...читать далее "Обновлён live.com"

На проходящей в эти дни в Сиэтле (США) конференции SIGIR-2006, Microsoft Research представила работу: Using Web-Graph Distance for Relevance Feedback in Web Search, Sergei Vassilvitskii (Stanford University), Eric Brill. Для улучшения ранжирования документов в выдаче рассматривается в общем-то широкоизвестная гипотеза, состоящая из двух постулатов:

  • Релевантные страницы ссылаются на другие релевантные страницы;
  • На нерелевантные страницы ссылаются другие нерелевантные страницы.

В данной работе предложен алгоритм, по которому в процессе улучшения рейтинга рассматриваются не только ближайшие соседи, но также и все страницы на и с которых ссылаются вплоть до четвёртого колена. И, естественно, показывается, что такой подход позволяет улучшить релевантность выдачи.

В экспериментах использовался движок и база MSN Search. Используется ли такой алгоритм при обслуживании запросов от обычных пользователей и будет ли нечто подобное использоваться в ближайшем будущем пока неизвестно.