Если посмотреть на файл robots.txt от Facebook, то можно заметить, что он закрыл все свои страницы для ботов, кроме ботов Baidu, Google, Yahoo, Bing, Naver, Seznam, Teoma и Яндекса.
...читать далее "Facebook и robots.txt"
Раздел: Search Engines
Китайский поисковик, ещё один
Чайна Мобайл (China Mobile Ltd), крупнейший в мире оператор мобильной связи, и китайское государтсвенное новостное агентство Синьхуа (Xinhua News Agency) во вторник объявили о запуске совместно поисковика по Интернету.
...читать далее "Китайский поисковик, ещё один"
Пионерка обратного индекса
Широко известно, что первым программистом была женщина - Ада Лавлейс. Но мало кто знает, что первым создателем обратного индекса (на чем основана работа поисковых машин) для светской литературы тоже была женщина.
...читать далее "Пионерка обратного индекса"
Два замечания
Попалась под руку книжка Web Dragons: Inside the Myths of Search Engine Technology, by Ian H. Witten, Marco Gori and Teresa Numerico, - отличное введение в историю и философские основы поиска и библиотек, и их взаимодействии.
В этой книжке можно найти два замечания, хорошо коррелирующих с сегодняшнем положением на рынке поиска.
...читать далее "Два замечания"
Приписка
В очередном, 351-м, выпуске рассылки "Продвижение сайта. Профессиональные советы экспертов" как-то уж очень непрофессионально приписали Мэтту Каттсу слова другого блогера, ссылающегося на твит Мэтта.
...читать далее "Приписка"
Качество поиска
26-й выпуска рассылки "Качество поиска" сообщил о статистике отношения числа поисковых запросов к числу переходов у Яндекса и Google, собранной поисковым тулбаром компании "Ашманов и Партнеры". У Google это соотношение получилось равным 1,3, тогда как у Яндекса - 1,7. Получается, что пользователи Google меньше кликают на результаты в выдаче, т.е. быстрее находят нужную страницу. Из чего получается, что Google ищет лучше Яндекса.
Замечание в этой рассылке, мол Яндекс дает больше информации на странице выдачи и пользователи находят ответ непосредственно на ней, мне кажется притянутым за уши - выдача Google точно также содержит подобные подсказки, позволяющие получить ответ на вопрос непосредственно на странице выдачи.
...читать далее "Качество поиска"
AltSearchEngines остановлен
Чарльз Найт (Charles Knight), бессменный редактор блога AltSearchEngines, обозревающего альтернативные поисковые машины, сообщил о приостановке его ведения, - в ближайшее время не планируется появления новых заметок, однако старые записи будут доступны.
...читать далее "AltSearchEngines остановлен"
Семь смертных грехов Solr
Работа в Lucid Imagination дает мне возможность проанализировать и оценить огромное число установок Solr, работающих как в крупнейших компаниях из списка Fortune 500, так и в самых маленьких стартапах. Этот опыт позволил мне выделить многие типичные ошибки и ловушки, в которые попадают либо в начале работы с новой установкой Solr, либо не следя за последними усовершенствованиями и изменениями.
Спасибо моему коллеге Саймону Розенталю (Simon Rosenthal) за предложение названия статьи, и Саймону, Лэнсу Норскогу (Lance Norskog) и Тому Хиллу (Tom Hill) за полезные замечания и предложения.
Итак, без лишних слов ... семь смертных грехов Solr.
...читать далее "Семь смертных грехов Solr"
nobrandsearch
NoBrandSearch - новый проект компании Hakia, является еще одним слепым тестом поисковиков (пользователю, в ответ на запрос, рядом показывается выдача двух поисковых машин, не сообщая какого именно поисковика, и предлагается выбрать, какая выдача из двух лучше для данного запроса).
В этом исследовании сравнивается поиск от Hakia с поиском от Google, Bing и Yahoo. На данный момент результат не удивителен, по количеству предпочтений как среди аудитории из стран США, Канада, Великобритания, Австралия и Новая Зеландия, так и среди остальных пользователей поисковики выстроились следующим образом: Google, Bing, Yahoo, Hakia.
...читать далее "nobrandsearch"
Законопроект Великобритании защитит поисковики
В течении последних лет в США ведутся активные дискуссии, нарушают ли Google и другие поисковые машины законодательство по защите авторского права при индексировании разного рода контента. Дело о сканировании книг - именно тяжба по авторскому праву. И новостные издания неоднократно обвиняли Google в создании новостного сервиса google News на основе их защищаемых авторским правом материалах. Новостные агентства AP и AFP подавали в суд на Google за нарушение авторских прав. (Сделка, урегулировавшая случай с AP, сейчас находится в стадии обновления).
...читать далее "Законопроект Великобритании защитит поисковики"