Метка: google
YAGK
Выписывая тэги к предыдущему посту, придумалась новая аббревиатура: YAGK = Yet Another Google Killer. 🙂
Google Enterprise в Мексике
Google начала поставку и поддержку пользователей корпоративного поиска Google Search Appliance and Google Mini в Мексике, через сеть консалтинговых компаний, таких как GT Consulting, MAR Consultoría, BearingPoint, Deloitte Consulting, Arteria Comunicaciones, Mobile Data, ParaByte, CasaMex и DELL.
Компания давно получала запросы на эти услуги от мексиканских пользователей, и даже обрела первого клиента за несколько дней до официального запуска сервиса.
DataparkSearch vs Google Mini
Google Mini | DataparkSearch | |
---|---|---|
Лицензия | Коммерческая, исходники закрыты | GPL, открытый исходный текст |
Число индексируемых документов и цена |
|
до нескольких десятков миллионов, в зависимости от используемого железа. Бесплатное ПО. |
Индексируемые форматы файлов | 220 различных форматов файлов, включая HTML, PDF и документы Microsoft Office. | Простой текст, HTML, XML, MP3, GIF, и любой другой через внешние парсеры. |
Языки | 28 языков | 25 языковых групп, может разбивать на слова фразы традиционного письма на китайском, японском, корейском и тайском языках. |
Доступ к файлам через | HTTP, HTTPS, сетевые фаловые системы. | HTTP, HTTPS, FTP, NNTP, HTTP Proxy, локальную файловую систему, htdb:// схема для индексирования SQL баз. |
Доступ к защищенному контенту через | HTTP Basic, NTLM v1 и v2, LDAP | HTTP Basic |
Коллекции документов | Да | Да, каждая коллекция может быть поделена на секции (тэги и категории). |
Интеграция результатов поиска в дизайн сайта | пользовательская таблица стилей XSLT, экспорт результатов в XML | собственный язык шаблона страницы выдачи в любом тестовом формате (включая HTML,RSS,XML). |
Синонимы | Да | Да |
Вывод аттрибутов результатов поиска | мета тэги | мета тэги, заданные аттрибуты HTML, заданные XML тэги, regex-вырезки из текста (все перечисленные называются секциями) |
Фильтрация результатов по мэта тэгам | Да | Да, + по любой секции или комбинации секций. |
Задание различных весов мета тэгам/секциям | Нет | Да |
Интеграция с Google Desktop и Google Toolbar for Enterprise | Да | Нет |
Исключение страниц из поискового индекса | Да | Да |
Спелчекер | самообучаемый | использует aspell |
Кэшированные версии документов | Да | Да |
Поиск в заданном числовом интервале | Да | Нет |
Поиск в заданном интервале дат | Да | Да |
Сортировка результатов по | Релевантности, Дате | Релевантности, Дате, Популярности, Важности и по всем этим в обратном порядке и любой комбинации. |
Отчёты |
|
Нет отчётов. Для каждого запроса могут быть записаны все параметры поиска для последующей обработки. |
Автоматическое создание Google sitemap | Да | Нет |
OneBox for Enterprise | Да | Нет |
Поддержка пользователей | Сайт поддержки; поддержка по email; гарантированная замена отказавшего оборудования | Форум на сайте проекта. |
Автоматическое реферирование документов | Нет | Да, Summary Extraction Algorithm |
Согласование содержимого по HTTP для заданные языков | Нет | Да |
Ссылочное ранжирование | Нет | Да, алгоритмы Neo PopRank и Goo PopRank. |
//Google Mini features, Google Mini Administrator features, DataparkSearch.
GSA Developer
Обнаружен новый (для меня) блог: GSA Developer, Google Search Appliance and Google Mini development, -- заметки пользователя GSA и Google Mini.
Эх-хе
При очередном обновлении Java Run-time на одной машине с Виндовз, заметил такую фичу: вместе с обновлением самой Джавы также предлагается установить Google Toolbar для ИЕ и Google Desktop, причём галка согласия с установкой Google Toolbar включена по-умолчанию.
Хитрый трюк, сразу напомнил о недавнем пакте Google и Sun, -- вот такими финтами в ответ Майкрософт и уделывают покапельке 🙂
Google работает над звуком
В блоге Google Research blog появилась запись, рассказывающая о ведущихся работах по распознаванию и поиску похожих звуков. А также, уже традиционно, приглашение специалистов, работающих над этими или смежными технологиями, на работу в Google.
Google и Mirosoft пролетели
Во время празднования Дня Австралии, обе компании, Google и Microsoft, запланировали пролёты самолетов над Сиднеем с целью обновления своих виртуальных моделей местности, используемых в Google Maps и Earth и в Microsoft Live Local (Virtual Earth). Компания Microsoft даже провела рекламную кампанию, призывая сиднейцев выйти на улицу и "помахать ручкой" и учередив приз в $2000 самой экстравагантно одетой персоне.
В назначенное время самолёт Microsoft пролетел на Сиднеем на высоте 2500 метров. В то время как пролёт самолёта Google не состоялся, -- его планировали провести на гораздо более низкой высоте, 600 метров, однако авиационные власти Австралии не разрешили вылет самолёту Google в назначенное время из-за высокого авиа-трафика над городом в этот день.
//SearchEngineLand.
И Exalead тоже ищет
Возращаясь к тесту апдейтов поисковиков от "Ашманов и партнёры", проверим, а насколько хорош Exalead для поиска в Рунете.
Замечу, что с момента моей первой соноты, тест Ашманова немного изменился, в него были добавлены новые запросы и проверочные сайты для них, другие же запросы были убраны. Я тестировал Exalead по запросам, входившим в тест качества на момент моей первой соноты.
Всего 21 запрос. Exalead дал в ответах проверочные сайты на 12 из них. Для этих 12 запросов средняя позиция проверочных сайтов равна 1.5, что превосходит показатель Google (1.64), лидирующего в данный момент в этом тесте у "Ашманов и партнёры".
Похоже у Exalead нет поддержки русской морфологии (или её тщательно скрывают), тем не менее, этот поисковик уже достаточно хорошо ищет по Рунету. Для справки: в базе Exalead на данный момент находится сыше 8 млрд. проиндексированых страниц.
Google ищет чуть лучше Яндекса ?
Очередной выпуск оптимизаторской рассылки от "Ашманов и партнёры" принёс ссылку на очередное исследование поисковиков: Анализатор качества апдейтов поисковых систем.
Суть в том, что для наиболее популярных запросов к поисковикам сложилось общественное мнение, какой сайт Рунета должен обязательно находиться по этому ключевику на первой странице выдачи.На данный момент такие сайты выбраны для 21-го запроса. В среднем, целевые сайты в Google находтся на 3.24 позиции, тогда как в Яндексе на 3.95. Таким образом, согласно этому тесту выходит, что Google ищет совсем нанемного лучше Яндекса.