Перейти к содержимому

Таблицы операторов поисковиков: Google, Yahoo!, Ask.

Google начала поставку и поддержку пользователей корпоративного поиска Google Search Appliance and Google Mini в Мексике, через сеть консалтинговых компаний, таких как GT Consulting, MAR Consultoría, BearingPoint, Deloitte Consulting, Arteria Comunicaciones, Mobile Data, ParaByte, CasaMex и DELL.

Компания давно получала запросы на эти услуги от мексиканских пользователей, и даже обрела первого клиента за несколько дней до официального запуска сервиса.

//Google Enterprise blog

  Google Mini DataparkSearch
Лицензия Коммерческая, исходники закрыты GPL, открытый исходный текст
Число индексируемых документов и цена
  • до 50,000 за $1,995
  • до 100,000 за 2,995
  • до 200,000 за $5,995
  • до 300,000 за $8,995
до нескольких десятков миллионов, в зависимости от используемого железа. Бесплатное ПО.
Индексируемые форматы файлов 220 различных форматов файлов, включая HTML, PDF и документы Microsoft Office. Простой текст, HTML, XML, MP3, GIF, и любой другой через внешние парсеры.
Языки 28 языков 25 языковых групп, может разбивать на слова фразы традиционного письма на китайском, японском, корейском и тайском языках.
Доступ к файлам через HTTP, HTTPS, сетевые фаловые системы. HTTP, HTTPS, FTP, NNTP, HTTP Proxy, локальную файловую систему, htdb:// схема для индексирования SQL баз.
Доступ к защищенному контенту через HTTP Basic, NTLM v1 и v2, LDAP HTTP Basic
Коллекции документов Да Да, каждая коллекция может быть поделена на секции (тэги и категории).
Интеграция результатов поиска в дизайн сайта пользовательская таблица стилей XSLT, экспорт результатов в XML собственный язык шаблона страницы выдачи в любом тестовом формате (включая HTML,RSS,XML).
Синонимы Да Да
Вывод аттрибутов результатов поиска мета тэги мета тэги, заданные аттрибуты HTML, заданные XML тэги, regex-вырезки из текста (все перечисленные называются секциями)
Фильтрация результатов по мэта тэгам Да Да, + по любой секции или комбинации секций.
Задание различных весов мета тэгам/секциям Нет Да
Интеграция с Google Desktop и Google Toolbar for Enterprise Да Нет
Исключение страниц из поискового индекса Да Да
Спелчекер самообучаемый использует aspell
Кэшированные версии документов Да Да
Поиск в заданном числовом интервале Да Нет
Поиск в заданном интервале дат Да Да
Сортировка результатов по Релевантности, Дате Релевантности, Дате, Популярности, Важности и по всем этим в обратном порядке и любой комбинации.
Отчёты
  • Общее число запросов и уникальных запросов
  • Число запросов в день
  • Средние числа запросов по часам суток
  • Топ 100 ключевых слов и запросов
Нет отчётов. Для каждого запроса могут быть записаны все параметры поиска для последующей обработки.
Автоматическое создание Google sitemap Да Нет
OneBox for Enterprise Да Нет
Поддержка пользователей Сайт поддержки; поддержка по email; гарантированная замена отказавшего оборудования Форум на сайте проекта.
Автоматическое реферирование документов Нет Да, Summary Extraction Algorithm
Согласование содержимого по HTTP для заданные языков Нет Да
Ссылочное ранжирование Нет Да, алгоритмы Neo PopRank и Goo PopRank.

//Google Mini features, Google Mini Administrator features, DataparkSearch.

Обнаружен новый (для меня) блог: GSA Developer, Google Search Appliance and Google Mini development, -- заметки пользователя GSA и Google Mini.

6

При очередном обновлении Java Run-time на одной машине с Виндовз, заметил такую фичу: вместе с обновлением самой Джавы также предлагается установить Google Toolbar для ИЕ и Google Desktop, причём галка согласия с установкой Google Toolbar включена по-умолчанию.

Хитрый трюк, сразу напомнил о недавнем пакте Google и Sun, -- вот такими финтами в ответ Майкрософт и уделывают покапельке 🙂

1

В блоге Google Research blog появилась запись, рассказывающая о ведущихся работах по распознаванию и поиску похожих звуков. А также, уже традиционно, приглашение специалистов, работающих над этими или смежными технологиями, на работу в Google.

2

Во время празднования Дня Австралии, обе компании, Google и Microsoft, запланировали пролёты самолетов над Сиднеем с целью обновления своих виртуальных моделей местности, используемых в Google Maps и Earth и в Microsoft Live Local (Virtual Earth). Компания Microsoft даже провела рекламную кампанию, призывая сиднейцев выйти на улицу и "помахать ручкой" и учередив приз в $2000 самой экстравагантно одетой персоне.

В назначенное время самолёт Microsoft пролетел на Сиднеем на высоте 2500 метров. В то время как пролёт самолёта Google не состоялся, -- его планировали провести на гораздо более низкой высоте, 600 метров, однако авиационные власти Австралии не разрешили вылет самолёту Google в назначенное время из-за высокого авиа-трафика над городом в этот день.
//SearchEngineLand.

4

Возращаясь к тесту апдейтов поисковиков от "Ашманов и партнёры", проверим, а насколько хорош Exalead для поиска в Рунете.

Замечу, что с момента моей первой соноты, тест Ашманова немного изменился, в него были добавлены новые запросы и проверочные сайты для них, другие же запросы были убраны. Я тестировал Exalead по запросам, входившим в тест качества на момент моей первой соноты.

Всего 21 запрос. Exalead дал в ответах проверочные сайты на 12 из них. Для этих 12 запросов средняя позиция проверочных сайтов равна 1.5, что превосходит показатель Google (1.64), лидирующего в данный момент в этом тесте у "Ашманов и партнёры".

Похоже у Exalead нет поддержки русской морфологии (или её тщательно скрывают), тем не менее, этот поисковик уже достаточно хорошо ищет по Рунету. Для справки: в базе Exalead на данный момент находится сыше 8 млрд. проиндексированых страниц.

5

Очередной выпуск оптимизаторской рассылки от "Ашманов и партнёры" принёс ссылку на очередное исследование поисковиков: Анализатор качества апдейтов поисковых систем.

Суть в том, что для наиболее популярных запросов к поисковикам сложилось общественное мнение, какой сайт Рунета должен обязательно находиться по этому ключевику на первой странице выдачи.На данный момент такие сайты выбраны для 21-го запроса. В среднем, целевые сайты в Google находтся на 3.24 позиции, тогда как в Яндексе на 3.95. Таким образом, согласно этому тесту выходит, что Google ищет совсем нанемного лучше Яндекса.