Перейти к содержимому

5

PolyMeta -- ещё один мета-поисковик, объединяющий результаты поиска с Google, Yahoo! Search, MSN Search, AskJeeves, Gigablast и Teoma (последние два не включены по-умолчанию). Также предоставляется возможность поиска новостей (через Google News, Yahoo!News, MSN News, NYTimes, USNews и Topix) и изображений (через Google, Yahoo!, MSN). Кроме этого отдельно предоставляется возможность поиска по крупнейшим поисковым сайтам и базам данных, относящихся к области медицины и здоровья (PubMed, MEDLINEPlus, National Institutes of Health (NIH), ClinicalTrials.gov, Scirus, Yahoo! Health, HealthMaps, HealthFinder, ...)

Основные возможности:

  • Во время поиска выводится число результатов, найденых на каждом из поисковиков. Также для каждого результата выводится его позиция в выдаче поисковиков, где этот документ обнаружен.
  • Возможность сортировки результатов по алфавиту, релевантности и источнику.
  • Кластеризация результатов (для поисков по вебу, новостям и сайтам о медицине).
  • Выделение голубым фоном уникальных результатов, полученых только с одного поискового сервера.
  • Возможность поиска в найденом.
  • Возможность фильтрации результатов по категориям кластеризации.

//InFlux.

Таже Nigma, только посолиднее и красивее сделаная.

2

IBM и Google заключили соглашение, по которому компания IBM свяжет свою технологию поиска OmniFind с платформой Google Desktop Search. Этот плугин будет распространятся вместе с Enterprise версией поиска на локальном PC от компании Google. Таким образом пользователи IBM WebSphere Information Integrator OmniFind Edition смогут расширить область локального поиска на своих компьютерах.

//Secrets2Moteurs

2

Список официальных блогов Google, а также блогов сотрудников Google (и некоторых бывших сотрудников).

15

SearchEngineGuide.com даёт 10 новых рекомендаций как попасть на вершину выдачи:

  1. Не покупайте новых доменов без особой необходимости. Google не принимает всерьёз только что созданные сайты и открытые домены, поэтому постарайтесь использовать старые насколько это возможно.
  2. Оптимизируйте ваш сайт для целевой аудитории, а не для поисковых машин.
  3. Как следует изучите ваши ключевые слова и фразы. Возможно ключевые слова, которые как вы полагаете относятся к вашей нише, совсем ими не являются, и наоборот, вы можете упустить некоторые ключевые фразы вашего рынка. Используйте для изучения реальные данные о статистике запросов поисковых машин, например, www.keyworddiscovery.com и www.wordtracker.com
  4. Создавайте архитектуру и навигацию вашего сайта на основе вашего изучения ключевых слов и фраз. Например, если ваш сайт продаёт игрушки, вы серьёзно полагаете, что родители выбирают игрушки по уровню развития своего ребёнка ?
  5. Создавайте ваш сайт дружественным для ботов поисковых машин. Боты поисковых машине не могут заполнять формы, не могут выполнять поиск по вашему сайту, не могут выполнятьJavaScript код меню, не читают графику и Flash. Это не запрет на использование этих технологий, но вы должны подумать об альтернативной навигации по вашему сайту.
  6. Заполняйте атрибуты ваших внутренних ссылок и кликабельных картинок (атрибуты alt) как можно яснее и точнее.
  7. Напишите завлекательную копию завлекательный текст ваших основных страниц, обязательно сделайте их доступными ботам поисковых машин, не перегружайте их графикой и флэш-роликами, а также постарайтесь привлечь пользователей эмоционально. Используйте на этих страницах ключевые фразы и обороты именно таким образом, как пользователи поисковиков могли бы искать информацию о вашем рынке.
  8. Добавьте ваши ключевые слова в уникальный для каждой страницы тэг Title.
  9. Убедитесь, что ваш сайт имеет ссылочный вес, т.е. на него ссылается достаточное количество сайтов с хорошей репутацией (желательно в той же области).
  10. Не зацикливайтесь только на одной ключевой фразе или слове и не слишком заморачивайтесь позицией в рейтинге.

1

8 октября на пресс-конференции в Фениксе (США), исполнительный директор Google Эрик Шмидт (Eric Schmidt) заявил, что его компании понадобилось бы около 300 лет, чтобы проиндексировать весь контент на Земле (теоретически речь идёт о сканировании и индексировании книг, журналов и т.п.). Согласно Шмидту, Google проиндексировал 170 Терабайт (терабайт -- 1000 или 1024 гигобайта, смотря как считать), в то время объём всего контента на Земле оценивается примерно в 5 миллионов терабайт.

//pcinpact.com

3

Барометр поисковиков по данным интернет-счётчика Xiti (в основном франкоязычные сайты) за сентябрь месяц: Google - после незначительного падения летом вернул свои позиции, самый крупный рост, +1,1%, и достиг отметки 79,58% всех поисковых запросов. Причём рост прошел в основном за счёт своего основного конкурента, Yahoo!, -- самое сильное падение, -0,79%. AOL также пострадал, -0,13%. MSN совсем чуть выиграл: +0,01%. В целом пятёрка лидеров такая же, как и в сентябре 2002 года: Google, Yahoo!, Voilà, MSN, AOL.

//Secrets2Moteurs

15

Факторы содержимого сайта, могущие повлиять на ранжирование в поисковых машиных. В скобочках дан уровень важности от 1 до 5.

  • Глобальная ссылочная популярность сайта [5]. Просто равна значимости всех ссылок, указывающих на этот сайт. Чем больше ссылок с важных сайтов (по их глобальной ссылочной популярности), тем большее влияние имеет этот фактор.
  • Ссылочная популярность сайта в своей категории [5]. Аналогичен фактору глобальной ссылочной популярности сайта, только учитываются ссылки с сайтов такойже или схожей тематики. Ссылки с сайтов схожей тематики обычно имеют больший вес, нежели ссылки с сайтов другой тематики.
  • Текст входящих ссылок [5]. Для определения основной темы сайта успользуется как текст документов на этом сайте, так и текст ссылок на этот сайт. Если тема документа сайта совпадает с темой сайта и большинства входящих ссылок, этот документ может получить больший вес при ранжировании.
  • Оcновная тема сайта [4]. Основная тема сайта (определяемая по содержимому находящихся на нём документов) может влиять на вес исходящих ссылок. Например, для сайта финансового агентсва больший вес будут иметь ссылки только на документы, касающихся вопросов финансов, тогда как ссылки с сайта информационного агентства CNN будут иметь высокий вес для широкого спектра тем.
  • Тематическая релевантность входящих ссылок на сайт [4]. Ссылки на сайт могут быть релевантными теме сайта или быть оффтопиком. В последнем случае значимость этих ссылок принижается.
    Если большинство входящих ссылок совпадают с темой страницы и идут с сайтов тойже или схожей тематики, такие документы ранжируются выше.
  • Возраст сайта [4]. Возраст сайта может влиять на значимость и вес его документов. Более старые сайты имеют больше доверия.
  • Язык сайта [3]. Язык сайта (большинства его документов) влияет на вес документов в зависимости от языка запроса к поисковой машине. Документы на языке, совпадающем с языком запроса, будут иметь больший вес, на несовпадающем -- меньший.
  • Доля редактирования или добавления документов [3]. Суммарный уровень добавления/изменения/удаления документов на сайте может влиять на рейтинг документов с этого сайта. Увеличение или уменьшение этого уровня может как позитивно, так и негативно влиять на рейтинг таких страниц, в зависимости от их возраста в стравнении с другими страницами сайта.
  • Доля новых входящих ссылок на сайт [3]. Число указывающих на документ входящих ссылок может учитываться поисковой машиной во времени, и мера изменения этого числа может влиять на расчёт веса и значимости этих новых ссылок. Этот фактор можут затрагивать рейтинг всех документов сайта, независимо получают ли эти документы внешние ссылки непосредственно.
  • Доля удалённых, устаревших или битых ссылок на сайт [2]. Поисковые машины могут учитывать появление и удаление ссылок на сайт, указывают ли они на никогда несуществовавшие или удалённые старницы сайта и др. Эта информация может использоваться для предсказания поведения в будущем, отслеживания различных аномалий, а также положительно или отрицательно сказываться на рейтинге, в стравнении с аналогичным поведением сайтов схожей тематики.
  • История ретинга сайта в серпах [2]. Поисковые машины могут отслеживать положение страниц сайта в выдаче со временем. И это может повышать или понижать рейтинг во избежание резких взлётов и падений в выдаче. Также резкое изменение рейтинга может служить основанием для расследования его причин, не является ли это следствием спама.
  • История кликов по результатам с сайта [2]. Поисковые машины могут учитывать клики пользователей на результаты в серпах и отслеживать изменение этого числа аналогично изменению обычной позиции сайта в выдаче.
  • Ключевые слова в имени домена [2]. Поисковые машины могут учитывать кличевые слова или фразы в имени домена. Таким образом сайты с подобными доменными именами получат небольшой выигрышь в рейтинге по этим ключевикам.
  • Наличие тире (дефисов) в имени домена [2]. Замечено, что доменные имена с двумя и более дефисами в имени домена расцениваются нискосортными, если не спамерскими.
  • Суффикс домена [3]. .com, .net, .biz и другие доступные каждому домены обычно ценяться меньше, чем домены из .mil, .gov, .edu, которые можно приобрести только обладая некоторыми привилегиями.
  • Внутренняя ссылочная структура [2]. Внутренная ссылочная структура сайта может влиять на его рейтинг, в зависимости насколько хорошо она сделана. Посетители сайта обычно ожидают постоянное навигационное меню с хорошей иерархией уточнения. Сайты придерживающиеся этой структуры могут получить рейтинг повыше.
  • Участие в Google Sitemaps или подобном [1]. Участие в Google Sitemaps или Yahoo! paid inclusion не влияет на рейтинг, однако гарантирует более быстрое и глубоко индексирование сайта, а также более пыстрое обновление в индексе.
  • Семантическая связанность документов сайта [1]. Если для большинства документов сайта будет обнаружена общность темы и/или используемых терминов и ключевих слов, то этот сайт будет сочтён сайтом это тематики, и его страницы получат больший рейтинг по запросам этой тематики.
  • Число документов на сайте [1]. Размер сайта, измеряемый в числе его документов, может влиять на рейтинг, в зависимости от предпочтений конкретной поисковой машины.
  • Размер документов на сайте [1]. Средний размер документа сайта может влиять на оценку сайта, например, большое число длинных исследовательских работ может вести к большему рейтингу сайта для определёных запросов.
  • Изменения в доле редактирования (правки) документов сайта [1].
  • Наличие карты сайта [1]. Посзволяет ускорить индексирование и тем самым ранговую эффективность документов сайта.
  • Использование редиректа [1]. Использование редиректа с кодом ответа 301 или 302, может влиять на рейтинг, в зависимости от массовости его применения, откуда и куда происходит редирект. Сайты, на которые недавно был редирект с другого сайта, могут цениться ниже.

//SEOMOZ.org

7

Хорошо известно, что текст ссылок играет важную роль в ссылочном ранжировании. Но как оптимально это использовать ?

По мнению Шэрон и Рой (Sharon et Roy), одного из участников форума Search Engine Watch, Google учитывает не более 8-ми первых слов текста ссылок или аттрибута ALT тэга IMG. Т.е. предлагается длинные текстовые ссылки разбивать на несколько идущих вподряд и содержащих не более 8-ми слов каждая.

//WebRankInfo

4

На сайте SEOMOZ.org опубликована статья «Search Engine Ranking Factors» (Факторы, влияющие на ранжирование). В этой статье на английском языке упоминаются 93 фактора, которые могут влиять на позицию сайта в выдаче поисковиков (Yahoo!, MSN, Google и AskJeeves). Все они разбиты на пять категорий:

  • Факторы текста документа;
  • Факторы содержимого всего веб-сайта;
  • Ссылочные факторы;
  • Технические факторы;
  • Вредоносные факторы.

7

На anandtech.com исследовали внутренности Google mini: обычный 1U-сервер, из необычного -- встроеным CD-ROMом нельзя воспользоваться не разобрав корпус; производитель сервера и материнки: Gigabyte; два процессора Pentium III-S 1,26 ГГц; 2 Гб SDRAM (4x256); 1 HDD Seagate Barracuda 120 Гб; AMI BIOS.

Перевод на русский этого исследования можно прочитать здесь: mobbit.info. Единственно, что перевод заканчивается на описании железа, не захватив описания конфигурирования Google mini.