Перейти к содержимому

5

Недавнее иследование, проведённое Hitwise, выявило важные различия в структуре трафика, перенаправляемого поисковыми машинами.

Традиционно поисковые машины ранжируются по занимаевой ими совокупной доли рынка поиска. Структура же трафика с этих поисковых машин, как правило, при этом не учитывается. Однако именно структуру этого трафика исследовало американское отделние Hitwise среди 10 самых популярных поисковиков США. И это дало несколько сюрпризов. Рассмотрим на примере первой четвёрки: Google, Yahoo!Search, MSN Search и Ask Jevees доли перенаправляемого ими трафика:

Категория Google Yahoo!Search MSN Search Ask Jevees
Сайты-магазины и сайты объявлений 10.68% 11.24% 10.65% 15.05%
Развлечения 9.58% 9.81% 8.97% 7.68%
Экономика и финансы 6.54% 7.10% 8.10% 8.55%
Образование 6.24% 5.28% 3.48% 6.45%
Стиль жизни 5.98% 5.36% 5.33% 7.36%
Средства информации 4.58% 4.79% 3.60% 2.73%
Путешествия 4.00% 4.73% 4.51% 4.11%

Вся четвёрка большую часть своих посетителей перенаправляют на сайты-магазины или сайты объявлений, но доля этого трафика не одинакова, самую большую долю имеет Ask Jevees, далее по порядку идут Yahoo!Search, Google и MSN Search.

Порядок по долям пользователей, ищущих новости, несколько иной: Yahoo!Search, Google, Ask Jevees, MSN Search.

Ask Jevees лидирует относительно доли трафика в категории "Стиль жизни", далее идут Google, Yahoo!Search и MSN Search.

Можно ли по этим достаточно очевидным различиям судить о силе или слабости поисковых машин в той или иной области ? Согласно аналогичным исследованиям Hitwise, проведённым в прошлые годы, тенденция скорее в нивелировании этих различий со временем.

//Le journal du Net

50

Разгребая в очередной раз авгиевы страницы сочинcкого инета подумалось, а сколько сайтостроителей читало, к примеру, рекомендации Google для вебмаcтеров ? Явно же делают всё наоборот...

На всякий случай приведу некоторые из них.

Рекомендации по дизайну и контенту

  • Создавайте сайт с чёткой структурой и текстовыми ссылками. Каждая страница должна быть достижима хотя бы по одной статичной текстовой ссылке.
  • Создавайте для пользователей карту сайта. Если карта сайта содержит более 100 ссылок, разбивайте карту на страницы.
  • Создавайте полезный и информативный сайт; создавайте страницы чётко и аккуратно описавающие ваш контент.
  • Подумайте, по каким словам искали бы пользователи ваш контент и убедитесь, что страницы вашего сайта содержат эти слова.
  • Старайтесь использовать текст вместо картинок для вывода важных наименований, контента или ссылок. Помните, пауки Google не понимают текста, выводимого в изображениях.
  • Убедитесь, что ваши тэги TITLE и ALT наглядны и аккуратны.
  • Проверьте все ссылки, не биты ли они; проверьте HTML код ваших страниц.
  • Если вы решаете использовать динамические страницы (т.е. URL которых содержит '?'), учитывайте, что далеко не каждый поисковый робот воспринимает такие страницы также, как и статические страницы. Полезно давать параметрам динамических страниц короткие имена и постараться сохранить число параметров малым.
  • Число ссылок на странице должно быть разумным (менее 100).

Технические рекомендации

  • Используйте текстовый проузер, например Lynx, для проверки вашего сайта, так как большинство поисковых роботов видят сайт примерно таким, как он выглядит в Lynx. Если различные фичи вроде кук, JavaScript, фреймов, идентификаторов сессий, DHTML или Flash не позволяют полноценно просматривать ваш сайт в текстовом броузере, весьма вероятно поисковым роботам также будет затруднительно проиндексировать ваш сайт.
  • Позвольте поисковым роботам передвигаться по вашему сайту без использования идентификаторов сессий, переменных или кук, отслеживающих движение пользователей по сайту. Эти технологии полезны для отслеживания поведения обычных пользователей, поведение поисковых роботов совершенно другое. Они также могут привести к неполной индексации сайта, т.к. поисковый робот не сможет вычислить различные URL, указывающие на одну и ту же страницу.
  • Убедитесь, что ваш веб-сервер поддерживает HTTP заголовок If-Modified-Since. Эта фича позволит вашему веб-серверу указать роботу Google, изменилась ли ваша страница с момента предыдущего посещения. Что также умешит нагрузку на ваш сервер и сократит объём передаваемых данных.
  • Используйте файл robots.txt на вашем сервере. Этот файл говорит роботам какие директории могут или не могут быть проиндексированы. Также проверьте, не блокирует ли случайно текущая версия этого файла на вашем сайте его индексирование роботом Google. См. http://www.robotstxt.org/wc/faq.html как правильно составлять этот файл.
  • Если ваша компания покупает CMS (систему управления контентом), убедитесь, имеет ли эта система может выводить контент в доступном для поисковых роботов виде.
  • Не используйте параметр "&id=" в ваших URL, т.к. наш робот не индексирует подобные страницы.

137

Недавнее исследование, проведённое Джери Вестом (Jerry West) из WebMarketingNow и Search Engine Academy, показало, что ни один из трёх крупнейших поисковиков (Google, Yahoo! MSN Search) не учитывает содержимое атрибута ALT тэга IMG при расчёте релевантности документа. Даже наоборот, перенасыщеность этого атрибута ключевыми словами может рассматриваться как чрезмерная переоптимизация страницы и вести к понижению релеватности документа.

Т.е. на сегодняшний день, этот тэг выгоднее всего использовать по прямому назначению, а именно для описания самого изобращения.

//SearchEngineGuide.com

Собственно, ну да, атрибут ALT убрран из индесирования поисковой машиной «Весь интернет Сочи» уж не помню как давно, - мусору там немеряно напихано было 🙂

Seoblog сообщает о поисковике по новостям от AOL. Хочу упоминуть еще о двух подобных серверах. Первый из них, newslookup.com, предлагает поиск по новостям на английском языке со всего света, а также экспорт заголовков этих новостей в формате RSS. Все новости рубрицированы географически и тематически. Второй поисковик: newsa.ru предлагает поиск по новостным сайтам Рунета. Примечательно, что оба сервиса реализованы с помощью поискового движка DataparkSearch.

2

Стартап компания Glenbrook Networks из Сан-Матео (San Mateo) заявила об изобретении способа проникновения в глубинный Веб (веб-страницы, всё еще не просмотренные поисковыми машинами) и извлечения оттуда до сих пор недоступной информации.

Для показа возможностей своей технологии, компания Glenbrook создала демонстрационный поисковик, просматривающий списки объявлений поиска и предложения работы из баз специализированых сайтов, заявляя, что обычне поисковики не могут этого делать, т.к. для доступа к этим файлам требуется человеческое вмешательство - заполнить нужные формы различными параметрами.

SiliconValley.com

7

Калифорнийский унииверситет в Беркли собирается создать научно-ислледовательских центр разработок передовых технологий поиска в Интернет.

В данный момент ведутся переговоры с курпнейшими поисковыми машинами, например, с Google, на каких условиях они могли бы присоединиться к проекту. В своё время в университете в Беркли родилась технология поиска inktomi, также это тот университет, в котором учился Эрик Шмидт (Eric Schmidt), исполнительный директор компании Google.

Цель проекта состоит в объединении усилий примерно двадцати исследователей с различных факультетов для создания новых технологий поиска. Исследовательский центр планируется открыть в следующем году.

Отметим, что в этом университете также будет находится исследовательский центр Yahoo!, открытие которого запланировано на это лето.

//Abondance

1

На "барометре" поисковых машин - своеобразном рейтинге популярности поисковиков среди участников французского рейтинга Xiti продолжается падение рейтинга Google (второй месяц подряд). Несмотря на это, Google продолжает доминировать на рынке поиска с 78,47% (-0,73%). Неудивительно, что второе место и самый значительный прирост имеет главный соперник Google - поиск от Yahoo! с 6,31% (+0,54%).

//Secrets2Moteurs

5

По сообщению президента компании News Corp. Руперта Мэрдока (Rupert Murdoch), ведутся переговоры о приобретении контрольного пакета неназванного поисковика.

Это приобретение является частью плана компании по "завоеванию" Интернета, на цели поглощения интернет-компаний разных направлений выделено 2 млрд. долларов США.

Со слов Руперта Мэрдока, маловероятно, что новый портал News Corp. будет конкурировать с Google, скорее конкурентом будет являться Yahoo!. Также не исключается "мирное сосуществование" с основными игроками рынка.

//News.com

18

Компания IBM заявила о намерении открыть свои технологии поиска, ориентированые в отличие от традиционного поиска по ключевым словам на поиск фактов, понятий и идей.

Точнее в планах IBM открыть для разработчиков её технологию Unstructured Information Management Architecture (UIMA), технологию анализа текста и других медиа-данных с целью определения смысла этого теста, какие факты или идеи в нём изложены, а также связи между этими фактами и идеями.

По заявлению компании IBM ряд компаний, занимающихся созданием ПО обработки текстов, изъявили желение использовать UIMA в своих продуктах.

Ожидается, что технология UIMA будет доступна на сайте ПО с открытым исходным кодом SourceForge в конце 2005 года. Рабочая среда UIMA в данный момент может быть свободно скачана с IBM AlphaWorks.

//Yahoo!News