Перейти к содержимому

5

Очередной выпуск оптимизаторской рассылки от "Ашманов и партнёры" принёс ссылку на очередное исследование поисковиков: Анализатор качества апдейтов поисковых систем.

Суть в том, что для наиболее популярных запросов к поисковикам сложилось общественное мнение, какой сайт Рунета должен обязательно находиться по этому ключевику на первой странице выдачи.На данный момент такие сайты выбраны для 21-го запроса. В среднем, целевые сайты в Google находтся на 3.24 позиции, тогда как в Яндексе на 3.95. Таким образом, согласно этому тесту выходит, что Google ищет совсем нанемного лучше Яндекса.

3

Люди с древнейших времён мечтали о полёте, ако птицы... И вот в начале 20 века человек полетел, немного не так, как мечтали, внутри "желзных птиц", ака самолётов.

Уже пару веков (а может и больше), человек мечтает о машине времени. Конец 20 века подарил надежду на реализацию и этой мечты -- виртуальные кибер-миры.

В данный момент разворачивается битва между Google и Microsoft за виртуальную модель Земли. Да, в данный момент всё ориентировано на поиск информации о каких-либо объектах на поверхности в данный конкретный момент времени. Но имея виртуальную Землю и проиндексированные архивы (вот где еще копать и копать :), можно давольно таки подробно реконструировать некоторые фрагменты поверхности Земли в прошлом, например поля знаменитых сражений, или распространение волны ценами в Азии в декабре 2004, или единственное плавание "Титаника", и т.д. В принципе можно "открутить" назад всю историю Земли, до момента зарождения Солнца.

UPDATE: Не говоря уже о возможных онлайновых играх над виртульной Землей, в антураже, наиболее приближенном к историческому.

5

Газета New York Times опубликовала заметку Google Answer to Filling Jobs Is an Algorithm (также доступная здесь), рассказывающую о том, как Google старается не потонуть в примерно 100000 резюме, подаваемых ежемесячно на вакантные позиции. Помимо расширения онлайновой формы заявления, теперь запрашивающей больше информации о кандидате, также сообщается о введении специальных алгоритмов, оценивающих каждое заявление на вакансию и присваивающих каждому такому заявлению некий коэффициент соответствия от 0 до 100.

Сведя каждое заявление к абстрактному числу (своего рода ранжирующая функция), несложно подключить обычный поиск, который у Gogle уже есть. Тем самым Google несложно будет сделать отдельные поисковики по всем вакансиям в мире, а также по аналогичным сервисам: анкетам сайтов знакомств, покупки/продажи/аренды недвижимости и т.п., где требуется многокритериальный поиск... Возможно, нечно подобное и появится скоро, эти ниши явно денежные 🙂

//3form (см. также упоминание о Google Online Assessments, - Google готовит нечто похожее на Brainbench ?).

3

Консольный Jabber-клиент mcabber работает с Gtalk, проверено.

Настройки, изменённые в дефолтном mcabberrc:

set username = ваше.имя.пользователя@gmail.com
set server = talk.google.com

set ssl = 1
set ssl_verify=0


4

На сайте блога Read/WriteWeb идёт голосование, какие технологии могут составить конкуренцию доминирующему Google. Предварительные результаты таковы:

1. Искусственный интеллект (напр. Hakia, Powerset) 23% (123 votes)

2. Поиск мнений экспертов (напр. del.icio.us, ChaCha) 21% (115 votes)

3. Вертикальный поиск (напр. SimplyHired, Technorati) 15% (81 votes)

4. Персонализированый поиск (напр. Collarity) 12% (63 votes)

5. Кластеризация (напр. Clusty, SearchMash) 11% (58 votes)

6. Общественный поиск (напр. Eurekster, Rollyo) 7% (37 votes)

7. Виртуализация (напр. Quintura and Kartoo) 6% (33 votes)

8. Предпросмотр (Snap, Live Image Search) 5% (25 votes)

Несогласны? -- Голосование продолжается, вы можете выбрать ваших кандидатов.

1

С Новым Годом, Мир! 🙂

Суммарные переходы пользователей из России с трёх крупнейших поисковых машин Рунета по месяцам в 2006 году:

Яндекс Рамблер Google
Январь 2006 60.6+0.6+0.1=61.3 21.7 6.3+0.3=6.6
Февраль 2006 61.5+0.8+0.0=62.3 20.9 6.3+0.3=6.6
Март 2006 61.4+0.9+0.1=62.4 20.9 6.4+0.3=6.7
Апрель 2006 60.3+0.9+0.1=61.3 21.6+0.0=21.6 6.6+0.3=6.9
Май 2006 60.6+1.0+0.1=61.7 21.7+0.1=21.8 6.6+0.3=6.9
Июнь 2006 60.4+1.0+0.1=61.5 21.2+0.1=21.3 7.1+0.3=7.4
Июль 2006 59.9+1.1+0.1=61.1 21.2+0.0=21.2 7.8+0.3=8.1
Август 2006 60.2+1.0+0.1=61.3 20.8+0.1=20.9 7.8+0.3=8.1
Сентябрь 2006 60.2+1.0+0.1=61.3 21.0+0.1=21.1 8.1+0.3=8.4
Октябрь 2006 60.6+1.0+0.1=61.7 20.3+0.1=20.4 8.3+0.3=8.6
Ноябрь 2006 60.0+1.0+0.1=61.1 20.3+0.1=20.4 8.8+0.3=9.1
Декабрь 2006 59.5+0.6+0.1=60.2 20.3+0.1=20.4 9.4+0.4=9.8

Первое слагаемое -- переходы с основного поиска, второе -- переходы с поиска изображений, третье -- с поиска по блогам.

См. Тенденции 2005

3

Компания Google планирует инвестировать 750 млн. долларов в нечно вроде серверного парка в Южной Каролине, если верить местной прессе < Южной Каролины, конечно >. Дочерняя компания, по видимому связанная с крупнейшим поисковиком, только что приобрела 520 акров рядом с Чарлестоном (Charleston). Google не разглашает своих планов, однако местный муниципалитет огласил размеры планируемых инвестиций, а также факт интереса покупателя к техническим возможностям обеспечения электричеством и водоснабжением.

//Valleywag

6

Оказывается, если в Google (англоязычном портале Google.com, для русской версии это не работает) ввести запрос, состоящий из названия какого-нибудь лекарства, то поисковик предложит уточнить запрос, разделив документы на кластеры: google-refine.jpg

3

Только что заметил, что в блоке рекламы AdSense появился логотип Google:

adsense-with-logo.jpg

Однако после перезагрузки страницы лого исчезло...

15

Наблюдал по логам, почему эффективность HTTP кэша получается не очень. Оказалось весьма просто и неожиданно мелкогадко: кто у нас жрёт страницы немерянно, -- правильно, боты поисковиков. Получается такая фигня: боты Google, Yahoo, Ask, WebAlta поддерживают получение сжатого контента, боты Яндекса, Рамблера и MSN -- не поддерживают, и вот ночью набегает стая ботов первой группы, забивает кэш сжатыми копиями страниц, прибегает свора ботов второй группы, тянет тоже самое, кэш естественно не работает, бо не умеет расжимать на лету, перетягивает тот же контент, но уже в несжатом виде...

Почему это мелкогадко -- прикрутить к краулеру поддержку сжатия контента при передаче это задача для студиозусов (решается просто и быстро, благо библиотек навало, да и инфы много, ка кэто должно работать). Получается, что у Яндекса, Рамблера и MSN либо соответствующие менеджеры мышей не ловят, либо их инфраструктура уже почти на пределе и не позволяет тянуть небольной overhead разжатия вытянутого контента...

По любому выходит, что WebAlta уже уделала и Яндекс и Рамблер, по крайней мере в технической реализации поддержки протокола HTTP. 🙂