Перейти к содержимому

5

Прошла весна, настало лето. Спасибо Гугелю за это!

Очередная рассылка "Продвижение сайта. Профессиональные советы экспертов" от Ашманова и партнеров в разделе главных новостей за неделю преподносит де "Google начинает скрывать ключевые слова переходов". И делает это для защиты приватности своих пользователей.

Да, все слова из этой песни воспроизведены правильно, и ссылка дана на правильную запись в блоге Google. Только причинно-следственная связь вывернута шиворот-навыворот.
...читать далее "Прошла весна, настало лето…"

9

Наконец-то дошли руки открыть книжку Ашманова и Иванова "Продвижение сайта в поисковых системах". Сразу наткнулся на корявое определение URL:

По определению Яндекса, "URL (от англ. Universal Resource Locator, как правило, произносится "урл") -- это адрес страницы в Интернете. URL состоит из доменного имени (см. домен), пути к странице на сайте и имени файла страницы. Например: www.rossia.ru/moskva/arbat/domknigi.htm. Здесь www.rossia.ru -- доменное имя сайта, /moskva/arbat/ -- путь и domknigi.htm -- имя файла. ...

Инересно, а господа Ашманов и Иванов не читают RFC ? В частности RFC1738 дает нужное (общее) определение URL следующим образом:

In general, URLs are written as follows:       <scheme>:<scheme-specific-part>

A URL contains the name of the scheme being used (<scheme>) followed

   by a colon and then a string (the <scheme-specific-part>) whose

   interpretation depends on the scheme.

...

 While the syntax for the rest of the URL may vary depending on the

   particular scheme selected, URL schemes that involve the direct use

   of an IP-based protocol to a specified host on the Internet use a

   common syntax for the scheme-specific data:

//<user>:<password>@<host>:<port>/<url-path>

...

[и далее расшифровываются составные части URL.]

Интересно, отальная книга написана в том же духе ?

12

В официальном блоге компании Google появилась заметка, в которой сообщается о расширении протокола исключений для ротобов (Robots Exclusion Protocol). В доболнение к файлу robots.txt и мета тэгу gooblebot (аналогичному тэгу robots, но с небольшим расширением) добавлен HTTP заголовок X-Robots-Tag, который может передаваться для каждой страницы по отдельности.

Примеры использования этого заголовка:

  • Не показывать закэшированую копию и не показывать снипет на страницах результатов поиска:
    X-Robots-Tag: noarchive, nosnippet
    
  • Не включать документ в результаты выдачи:
    X-Robots-Tag: noindex
    
  • Сообщить, что документ не будет доступен после указаной даты (используется формат RFC 850):
    X-Robots-Tag: unavailable_after: 7 Jul 2007 16:30:00 GMT
    

Можно комбинировать несколько тэгов X-Robots-Tag для одного документа. Например, запретить показ кэшированой копии и удалить из индекса после 23rd July 2007, 3pm PST:

X-Robots-Tag: noarchive
X-Robots-Tag: unavailable_after: 23 Jul 2007 15:00:00 PST

//The Google official blog

Заметил, что один сервер отдаёт дату устаревания куки в странном формате, свиду напоминающем "исправленый" формат даты, предложенный в RFC 850:


Server: Apache
X-Powered-By: PHP/5.1.6
Set-Cookie: e63_session_time=1171220096; expires=Tue, 09-Oct-2007 18:54:56 GMT; path=/; domain=.e-sochi.ru
Set-Cookie: e63_session=ba835067ae0a5518c660812b3a203102; expires=Tue, 09-Oct-2007 18:54:56 GMT; path=/; domain=.e-sochi.ru
Set-Cookie: e63_session_id=deleted; expires=Sat, 11-Feb-2006 18:54:55 GMT; path=/; domain=.e-sochi.ru
Set-Cookie: e63_pass=deleted; expires=Sat, 11-Feb-2006 18:54:55 GMT; path=/; domain=.e-sochi.ru
Set-Cookie: E63_UIN=e63_45cf6680b5d93; expires=Tue, 09-Oct-2007 18:54:56 GMT; path=/; domain=.e-sochi.ru

Интересно, насколько распространено применение такого формата даты в нете ? К сожалению, найти приложение, которое высталяет куки с префиксом E63_, не удалось.