Перейти к содержимому

5

Очередной выпуск оптимизаторской рассылки от "Ашманов и партнёры" принёс ссылку на очередное исследование поисковиков: Анализатор качества апдейтов поисковых систем.

Суть в том, что для наиболее популярных запросов к поисковикам сложилось общественное мнение, какой сайт Рунета должен обязательно находиться по этому ключевику на первой странице выдачи.На данный момент такие сайты выбраны для 21-го запроса. В среднем, целевые сайты в Google находтся на 3.24 позиции, тогда как в Яндексе на 3.95. Таким образом, согласно этому тесту выходит, что Google ищет совсем нанемного лучше Яндекса.

1

С Новым Годом, Мир! 🙂

Суммарные переходы пользователей из России с трёх крупнейших поисковых машин Рунета по месяцам в 2006 году:

Яндекс Рамблер Google
Январь 2006 60.6+0.6+0.1=61.3 21.7 6.3+0.3=6.6
Февраль 2006 61.5+0.8+0.0=62.3 20.9 6.3+0.3=6.6
Март 2006 61.4+0.9+0.1=62.4 20.9 6.4+0.3=6.7
Апрель 2006 60.3+0.9+0.1=61.3 21.6+0.0=21.6 6.6+0.3=6.9
Май 2006 60.6+1.0+0.1=61.7 21.7+0.1=21.8 6.6+0.3=6.9
Июнь 2006 60.4+1.0+0.1=61.5 21.2+0.1=21.3 7.1+0.3=7.4
Июль 2006 59.9+1.1+0.1=61.1 21.2+0.0=21.2 7.8+0.3=8.1
Август 2006 60.2+1.0+0.1=61.3 20.8+0.1=20.9 7.8+0.3=8.1
Сентябрь 2006 60.2+1.0+0.1=61.3 21.0+0.1=21.1 8.1+0.3=8.4
Октябрь 2006 60.6+1.0+0.1=61.7 20.3+0.1=20.4 8.3+0.3=8.6
Ноябрь 2006 60.0+1.0+0.1=61.1 20.3+0.1=20.4 8.8+0.3=9.1
Декабрь 2006 59.5+0.6+0.1=60.2 20.3+0.1=20.4 9.4+0.4=9.8

Первое слагаемое -- переходы с основного поиска, второе -- переходы с поиска изображений, третье -- с поиска по блогам.

См. Тенденции 2005

15

Наблюдал по логам, почему эффективность HTTP кэша получается не очень. Оказалось весьма просто и неожиданно мелкогадко: кто у нас жрёт страницы немерянно, -- правильно, боты поисковиков. Получается такая фигня: боты Google, Yahoo, Ask, WebAlta поддерживают получение сжатого контента, боты Яндекса, Рамблера и MSN -- не поддерживают, и вот ночью набегает стая ботов первой группы, забивает кэш сжатыми копиями страниц, прибегает свора ботов второй группы, тянет тоже самое, кэш естественно не работает, бо не умеет расжимать на лету, перетягивает тот же контент, но уже в несжатом виде...

Почему это мелкогадко -- прикрутить к краулеру поддержку сжатия контента при передаче это задача для студиозусов (решается просто и быстро, благо библиотек навало, да и инфы много, ка кэто должно работать). Получается, что у Яндекса, Рамблера и MSN либо соответствующие менеджеры мышей не ловят, либо их инфраструктура уже почти на пределе и не позволяет тянуть небольной overhead разжатия вытянутого контента...

По любому выходит, что WebAlta уже уделала и Яндекс и Рамблер, по крайней мере в технической реализации поддержки протокола HTTP. 🙂

4

Оказывается, если в Яндексе ввести запрос типа "перевод dataflow", т.е. слово "перевод" и слово на английском, то выше результатов поиска будет показан перевод английского слова по словарю ABBYY Lingvo. К сожаленнию, для словосочетаний эта фича не работает.

Интересно, кто из поисковиков догадается перевод коротких предложений оформить в виде специального оператора ? 🙂

9

Если вы умеете генерить дорвеи, то для вас не секрет, что Яндекс повернулся задом к лесу и принялся мочить дорвеи (в сортире, очевидно).

Одновременно с теми же фанфарами разворачивается новый сервис поиска по блогам и прочим фидам. И у этого поиска есть одно родовое пятно, -- бот, выкачивающий фиды, не соблюдает robots.txt, -- нет это не ошибка, это позиция разработчика этого поиска, Романа Иванова, известного в блогосфере под ником kukutz. Ну ладо бы не соблюдал, ничем не отличаясь от обычного пользователя, но... Даже если на фид никто в Яндекс.Ленте не подписан, бот будет посещять этот фид по нескольку раз в сутки, примерно обращения идут дуплетом раз в три часа.

Т.е. существует вид файлов, которые Яндекс очень любит, и весьма часто, независимо от того, читает ли это хоть один человек. Т.е. о чём скоро будут "говорить" в блогосфере согласно Яндекс.Блогам ? Правильно, о ксанаксе и фентермине 🙂

22

В работе Методы сравнительного анализа современных поисковых систем и определения объема Рунета. И.В. Сегалович, Ю.Г. Зеленков, Д.О. Нагорнов (Яндекс) среди прочих высказывается идея приблизительного равенства отношений объёмов результатов сэмпплирования каких-либо двух поисковых машин и отношений реальных объёмов их архивов (т.е. баз проиндексированых документов). В приложениее к этой работе приводится список 120 редковстречаемых однословных запросов, использованых для сравнения крупных поисковых машин Рунета. Используя этот список запросов и зная реальные объёмы баз Яндекса (1'192'438'541) и Вершков Рунета (1'060'916), можно проверить верность этой идеи.

...читать далее "Вершки Рунета vs Яндекс"

2

... по результатам, полученным авторами в феврале 2004 года (начало систематических исследований), объём Рунета составлял примерно 400 млн. докуметов, тогда как к концу 2005 года эта цифра была уже порядка 2500 млн., т.е. увеличилась более, чем в 6 (!) раз за два года. Судя по последним измерениям, такой темп может сохраниться и в ближайшее время.

//Методы сравнительного анализа современных поисковых систем и определения объема Рунета. И.В. Сегалович, Ю.Г. Зеленков, Д.О. Нагорнов (Яндекс)

Если предположение верно, и темп роста сохранился, то Рунет сейчас должен весить порядка 7,5-8 млрд. страниц, -- примерно один Гугле трёхлетней (наверное) давности.

11

В блоге Яндекса появилась запись, сообщающая об изменении цвета дизайна Яндекс.Погоды в зависимости от текущей температуры в Москве. Забавно, лет 5 назад на сайте Интернет Сочи (правда он тогда назывался по-другому и располагался на другом домене), дизайн тоже менялся в зависимости от температуры в Сочи. Однако пользователям это отчего-то не нравилось, поэтому дизайн эволюционировал.

Сейчас в зависимости от температуры меняется цвет стрекли, показывающей направление изменения температуры, на нашем температурном информере:

Air temperature at Sochi city, Russia

По цвету этой полоски можно судить о тоне, который пребладал в нашем старом "хамелеонском" дизайне.

2

Интерфейс еще минимальнее от Яндекса. Интересно, а ещё минимальнее можно ? 🙂 [можно, opensearch-поисковик по умолчанию прямо из адресной строки]
Хотя пессимист скажет: когда не могут тягаться в сложном точёном интерефейсе, делают минимальный...

4

Аркадий Волож, руководитель компании «Яндекс» отвечает на вопросы интернетчиков на сайте Состав.ру. Давольно занимально, времени на прочтение не жаль. 🙂