Перейти к содержимому

3

Проект Open Source Search -- новая википедия, посвященная технологиям поиска с открытым исходным кодом.

4

Проект Hadoop выделен в отдельный подпроект проекта Lucene из другого подпроекта Nutch. Hadoop состоит из Hadoop Distributed Filesystem (HDFS), распределённой файловой системы, ранее называвшейся Nutch Distributed Filesystem (NDFS), а также реализации MapReduce, технологии работы с большими наборами данных, разработанной компанией Google.

Что отвечают поисковики на вопрос "завоюет гугл рунет ?".

6

IT.com -- новый вертикальный поисковик по ресурсам, относящимся к информационным технологиям. Индексируются сайты компаний этой отрасли, а также новости, статьи (white papers) и веб-касты данной тематики. Также все проиндексированые ресурсы разбиты на подразделы, такие как "Network Services", "IT Security", "Servers", "Open Source" и т.д. Можно осуществлять поиск отдельно по каждому подразделу.

27

Среднесуточные проценты переходов с трёх наиболее популярных поисковых машин РуНета по месяцам:

  Яндекс Рамблер Google
Март 2005 58.3 26.2 5.3
Апрель 2005 58.5 25.6 5.5
Май 2005 59.5 24.9 5.4
Июнь 2005 60.3 24.5 5.5
Июль 2005 61.7 23.0 5.7
Август 2005 61.8 23.0 5.6
Сентябрь 2005 61.5 23.0 5.6
Октябрь 2005 61.6+0.2=61.8 22.5 5.6+0.1=5.7
Ноябрь 2005 60.6+0.7=61.3 22.5 5.7+0.3=6.0
Декабрь 2005 60.5+0.7=61.2 22.3 5.9+0.3=6.2
Январь 2006 60.4+0.8=61.2 21.7 6.4+0.3=6.7

Добавка: для Яндекса и Google добавлены проценты поиска по картинкам, данные по ним доступны с октября месяца.

5

Краткая история: один новый домен, назовём его mon-domain.com попал в сэндбокс Гугла скорее всего за быстрый рост числа входящих ссылок на него; у владельца этого домена был другой домен, назовём его mondomain.com, давно находящийся в индексе Гугла. Был опробован следующий способ вывода mon-domain.com из сэндбокса: его контент был размещён на сайте mondomain.com и был сделан редирект 301 c mon-doamin.com на домен mondomain.com (без какого-то изменения контента). Через некоторое время (несколько дней, что много меньше стандартного выхода из сендбокса через 2-6 месяцев) робот гугла просёк, что mon-domain.com является зеркалом "нормального" сайта.

//Yoda.com

Да, самое главное, перед этой операцией нужно убедиться, что вы правильно определили причину попадания вашего сайта в сэндбокс, иначе у вас будет два домена в сэнбоксе 🙂

7

В этой таблице приведено сравнение поисковых машин на запросах "Сочи" и "Sochi" (как точных фраз).

  "Сочи" "Sochi"
страниц сайтов страниц сайтов
Яндекс 4918162 4555 322471 1768
Рамблер 5575764 99770 521724 20226
Апорт 20000 4200 20000 1245
43°с.ш.39°в.д. 102107 ~3246 43909 ~2179
Google ~2050000   ~1860000  
MSN Search 1135943   358524  
A9.com ~179000   ~171000  
Yahoo! ~4910000   ~1450000  

Лидер роста: Яндекс и Рамблер, последний сохраний абсолютное лидерство по числу страниц для русского варианта, а Яндекс ненамного, но опередил в этом Yahoo!. MSN Serch практически сохранил неизменным объём своей базы.

См. данные предыдущего месяца.

11

На сайте EvilOrNot.info проводится голосование "Google: Зло или Нет ?". Желающим принять участие предлагаются различные новостные сообщения и сообщения из блогов, освещающих Google, и предлагается оценить злыдность Google по этой новости. Таже приводится график тренда суммарной оценки, минимальное значение которой достигало всего нескольких процентов, а максимальное чуть-чуть переваливало за 64%.

4

Компания Яндекс открыла статистику переходов со страниц результатов своей поисковой машины на другие поисковики. Последний месяц, за который доступна статистика переходов на другие поисковые машины, -- ноябрь 2005. Итак, посмотрим, куда и в каком количестве переходят неудовлетворённые пользователи Яндекса. Всего в ноябре 2005 года поиск Яндекса получил 681,134,346 хитов из них переходов на другие поисковики 9,292,101 или чуть более 1.36%. Разбивка по поисковикам:

Google 3,630,342 30.07%
Рамблер 2,476,020 26.65%
Yahoo! 1,491,372 16.05%
Апорт! 994,232 10.70%
MSN 700,135 7.53%