Перейти к содержимому

4

Оказывается, если в Google ввести запрос «datapark search», то он переспрашивает: Did you mean: dataparksearch

Конечно, для чистоты проверки нужно посмотреть на этот запрос с машины, на которой никогда не запрашивали поиск по слову dataparksearch, чтобы исключить персонализацию спелчекера.

23

В официальном блоге «Google Россия» появилась заметка Саши Владимирова, рассказывающая о том, насколько увлекательно разрабатывать поддержку большого числа валют и разнообразных платёжных систем, не забывая учитывать ньюансы каждой.

Но самое главное в этой заметке -- сообщение о том, что Google AdWords теперь работает с рублями и оплатить показ рекламы можно банковским переводом из любого банка или отделения на территории России.

Подробнее можно прочитать здесь (внимание: при обращении к сайту adwords.google.ru появляется сообщение, что сертификат на самом деле принадлжеит сайту adwords.google.com.ru -- похоже какой-то косяк у гугловцев).

1

Поисковик Google продолжает улучшать свою выдачу. Добавились две новые фичи:

1. Автоматическое исправление орфографии и включение исправленых вариантов в выдачу (помимо указания ссылки на отдельный запрос с исправленой орфографией). Если на французском портале Google ввести запрос veille peros, то перыми результатами будут идти документы с выделенным исправленым вариантом "Veille Perso":google_ordre1.png

2. Автоматический поиск с учётом синонимов слова. Да, у Google есть оператор ~, который позволяет в строке запроса включить поиск и синонимов этого слова. Теперь же в некоторых случаях синонимы включаются автоматически. Например, для запроса "stationery products competitor" помимо самого слова competitor будут также искаться и слова competition, competitive.

// inFLUX

Такие же функции можно включить и в DataparkSearch (включть, в смысле enable, они уже давно включены в возможности движка). Но поминмо этих функций есть также функция атоматического разворачивания акронимов и расширения аббревиатур при поиске, а также функция показа реферата документа (в дополнение к цитированию найденых слов). Интересно, как скоро Google добавит их в свой поисковик. 🙂

1

Мэт Катс (Matt Cutts) в своём блоге проводит разбор вылета хакнутого сайта из поискового индекса Google, приводя временной график поисшедших событий.

Оказывается, Google имеет форму подтверждения статуса сайта по отношению к индексу своей поисковой машины. Если команда сотрудников Google, занимающаяся борьбой с поисковым спамом, сочтёт, что ваш сайт стал жертвой хака (и через это набит спамерскими ссылками), то через эту форму можно узнать, что сайт убран из индекса. Само-собой, если посчитают, что такое сообщение поможет спамеру понять, за что именно его пенализировали, -- спамер не получит подтверждения вылета из индекса через эту форму.

Интересно, а сколько времени понадобиться Яндексу, чтобы сделать такую же форму и тем самым снять с Платона большую часть вопросов о наличии или отсутствии бана сайта в Яндексе ?

1

Планы Google на 2007 год: главное борьба за внешнюю простоту. Как отмечает Брин, внешняя простота -- вот что изначально привлекало пользователей к поиску Google. Все сервисы будут приводиться к максимально общему интерфейсу, если какой-то проект не будет вписываться в общий интерфейс, от него скорее откажутся. Либо он перестанет быть отдельным проектом, а станет новыми фичами уже известных продуктов. Цель компании: иметь небольшой набор продуктов с максимально широким общим набором фич.

Второй важный аспект на 2007 год -- персонализация сервисов, и само-собой, внешнее упрощение персонализации для пользователей.

5

Не секрет, что страницы, на которых размещена реклама Google AdSense, посещаются специальным ботом Mediapartners-Google/2.1

<>Судя по обращениям к сайту с "обрезаными" URL, максимальная длина пути, имени файла и CGI-параметров в URL, которые этот бот может "переварить" составляет 503 байта, если считать с именем хоста -- получается 515, а со схемой -- 522. (Хм, интересно, а Google тут с памятью проблем нет ? 🙂

Очевидно, что на страницах с большей длиной URL, подбор релевантной рекламы по контенту страницы работать не будет. Возможно, будет показываться реклама, релевантная тематике сайта.

3

Пришла ещё одна напасть, любящая RSS-фиды и ненавидящая robots.txt, звать Google Desktop (оно само так представляется в User-Agent: Mozilla/4.0 (compatible; Google Desktop) ). Также как и Яндекс, компания Google считает, что правила robots.txt не распространяются на фиды, поэтому берёт их где-только найдёт и когда захочет. А хочет оно местами часто (особой закономерности не уловил, то пусто, то густо), порой один и тот же фид запрашивается раз в пять минут....

А вот я считал, что Google Desktop, по идее, вообще дальше локальной машины ходить не должен... А ещё думал, что Google умеет делать SGML-unescape для урлов, прописаных в HTML-документах, -- Google Desktop не умеет, как нашёл, так вот прямо и запрашивает, без всякого unescape...

3

Новая версия поиска на Google.cn получили одну особенность, на которую стоит обратить внимание, возможно скоро она появится на всех поисковых сайтах Google. Речь идёт о подсказках-уточняющих запросах, располагающихся внизу каждой страницы выдачи. Например, если дать запрос [Washington], то в списке подсказок окажутся washington post, washington dc, denzel washington, washington times, washington metro, washington state, и т.д.

related-search-chine.jpg

//Zorgloob

В последнем релизе Google Search Appliance обзавёлся новым оператором inmeta, позволяющим искать в тэгах META. Ранее поиск в тэгах META можно было осуществлять через API, а сейчас появилась возможность такого поиска чепрез строку запроса.
Синтаксис оператора:

inmeta:{meta_tag}
inmeta:{meta_tag}~{meta_tag_value}
inmeta:{meta_tag}={meta_tag_value}

Оператор = между meta_tag и meta_tag_value означает точное совпадение всего значения тэга, а ~ - означает, что указанное значение содержится в заданом META-тэге.

//Google Enterprise blog

20

В официальном блог Google Enterprise Search опубликова заметка, описывающая возможности расширения поисковых запросов. В принципе функциональность такая же как и DataparkSearch, за исключением, что DataparkSearch не поддерживает многосвловную синонимию (т.е. когда два и более слова ставятся в соответсвие двум и более словам), но зато DataparkSearch может автоматически расширять запрос вариантами слов без акцентов над буквами (по-другому их называют диакритическими знаками).