Перейти к содержимому

6

Компания Looksmart объявила о запуске 181 сайта в 13 вертикальных категориях. Тем самым компания позиционирует себя как самый крупный вертикальный поисковик в Сети.

//SearchEngineGuide.com

SplogSpot.com -- директория сплогов, основана на сервисе pingoat.com, умеющем автоматически определять спамерские блоги, но также возможно ручное добавление слога посетителями. Также предлагается API для проверки фидов на спложность (наличие в базе SplogSpot).

20

Сплог -- слово, образованое из двух: спам и блог. Новая эпидемия в Сети. Скнируются блоги, на которых выбираются самые популярные и читаемые статьи, затем контент этих статей копируется в свой блог, зачастую размещенный на одном из блог-сервисов. Далее, с этого фальш-блога (сплога) делаются ссылки на определённый сайт. Цель манипуляции: получить посетителей на целевой сайт.

//Branchez-vous

9

Забежал сегодня на сайт новый бот, представился как Gokubot/1.14 (Goku; http://goku.ru/bot.htm). По указаному адресу инфы не много:

Гоку - это новый сервис поиска по Рунету.

В данное время Гокубот проходит тестирование.
Если вам надо запретить посещение определенных страниц сайта Гокуботом, воспользуйтесь robots.txt
Если у вас есть вопросы, обращайтесь на адрес bot [@] goku.ru

В описании записи whois домена goku.ru указано: GoKu search.

Похоже бот умеет "ходить" по формам, т.е. как минимум пытается сканировать URL, указаные в атрибуте ACTION тэга FORM.

Уж не готовится ещё один поисковик по РуНету ?

Самое забавное, вчера попался "слух" о создании (возможно) другого поисковика, как минимум тоже по РуНету.

7

Сергей Петренко Неизвестный автор в новостях на сайте searchengines.ru недоумевает, почему MSN Search не входит в список Searchengineinvestment.com, -- а ответ прост, это не список поисковиков к освещению, это список компаний, занимающихся информационно-поисковыми технологиями, курс акций которых учитывается в индексе Webeffekt® Index 2, некоем аналоге индексов Доу Джонса и DAX. Соответсвенно, Microsoft в большей своей части не является такой комапнией (MSN Search является её подразделением). И соответственно, новый сайт будет заниматься не освещением поисковых систем как таковых, а будет ориентироваться на финансовые показатели компаний данного сегмента рынка.

29

Австралийский поисковик Ansearch вынужден в ближайшем времени внести изменения в код своего поисковика для устранения жалоб со стороны вебмасетров, обнаружевших копии своих страниц с сайта Ansearch в кэше других поисковиков.

Хм, а не проще ли просто соответсвующего правило в robots.txt прописать 🙂

В принципе, показ кээшированых копий страниц является необходимой функцией современного поисковика, однако большинство поисковиков закрывают такие страницы от индексирования другими поисковиками, -- это негласное правило хорошего тона.

//AustralianIt

24

В этой таблице приведено сравнение поисковых машин на запросах "Сочи" и "Sochi" (как точных фраз).

  "Сочи" "Sochi"
страниц сайтов страниц сайтов
Яндекс 5499806 2705 462465 1614
Рамблер 4310311 83792 428673 15968
Апорт 20000 4488 10000 1180
43°с.ш.39°в.д. 81848 ~2508 35966 ~1966
Google ~1870000   ~1960000  
MSN Search 1127239   355519  
A9.com ~152000   ~173000  
Yahoo! ~6110000   ~1180000  

Что в лоб, что в профиль одинаково у MSN Search и 43n39e.ru, у остальных поисковых машин примерно через два часа и для точных фраз из одного слова число находимых документов или серверов изменилось.

19

В этой таблице приведено сравнение поисковых машин на запросах "Сочи" и "Sochi".

  Сочи Sochi
страниц сайтов страниц сайтов
Яндекс 6074460 4191 464661 1622
Рамблер 4555812 96075 427611 16027
Апорт 20000 4493 10000 688
43°с.ш.39°в.д. 81848 ~2508 35966 ~1966
Google ~2090000   ~1980000  
MSN Search 1127239   355519  
A9.com ~153000   ~172000  
Yahoo! ~6090000   ~1170000  

Замечание по Яндексу: одновременно со словом "Сочи" почему-то также находятся "сочилась кровь" и "Соч.И-С.Баха" и т.п., это приносит "лишние" результаты...

Лидеры роста за месяц: MSN Search и Рамблер.

Число страниц, найденых MSN по русскому варианту выросло примерно в 10 раз за месяц!

Лидеры роста прошлого месяца, Яндекс и Yahoo!, оба обновременно немного уменьшили число находимых документов, вероятно это связано с технологиями отлова дублей и бана некоторых сайтов/страниц.

См. данные предыдущего месяца.

15

SearchEngineGuide.com даёт 10 новых рекомендаций как попасть на вершину выдачи:

  1. Не покупайте новых доменов без особой необходимости. Google не принимает всерьёз только что созданные сайты и открытые домены, поэтому постарайтесь использовать старые насколько это возможно.
  2. Оптимизируйте ваш сайт для целевой аудитории, а не для поисковых машин.
  3. Как следует изучите ваши ключевые слова и фразы. Возможно ключевые слова, которые как вы полагаете относятся к вашей нише, совсем ими не являются, и наоборот, вы можете упустить некоторые ключевые фразы вашего рынка. Используйте для изучения реальные данные о статистике запросов поисковых машин, например, www.keyworddiscovery.com и www.wordtracker.com
  4. Создавайте архитектуру и навигацию вашего сайта на основе вашего изучения ключевых слов и фраз. Например, если ваш сайт продаёт игрушки, вы серьёзно полагаете, что родители выбирают игрушки по уровню развития своего ребёнка ?
  5. Создавайте ваш сайт дружественным для ботов поисковых машин. Боты поисковых машине не могут заполнять формы, не могут выполнять поиск по вашему сайту, не могут выполнятьJavaScript код меню, не читают графику и Flash. Это не запрет на использование этих технологий, но вы должны подумать об альтернативной навигации по вашему сайту.
  6. Заполняйте атрибуты ваших внутренних ссылок и кликабельных картинок (атрибуты alt) как можно яснее и точнее.
  7. Напишите завлекательную копию завлекательный текст ваших основных страниц, обязательно сделайте их доступными ботам поисковых машин, не перегружайте их графикой и флэш-роликами, а также постарайтесь привлечь пользователей эмоционально. Используйте на этих страницах ключевые фразы и обороты именно таким образом, как пользователи поисковиков могли бы искать информацию о вашем рынке.
  8. Добавьте ваши ключевые слова в уникальный для каждой страницы тэг Title.
  9. Убедитесь, что ваш сайт имеет ссылочный вес, т.е. на него ссылается достаточное количество сайтов с хорошей репутацией (желательно в той же области).
  10. Не зацикливайтесь только на одной ключевой фразе или слове и не слишком заморачивайтесь позицией в рейтинге.

1

8 октября на пресс-конференции в Фениксе (США), исполнительный директор Google Эрик Шмидт (Eric Schmidt) заявил, что его компании понадобилось бы около 300 лет, чтобы проиндексировать весь контент на Земле (теоретически речь идёт о сканировании и индексировании книг, журналов и т.п.). Согласно Шмидту, Google проиндексировал 170 Терабайт (терабайт -- 1000 или 1024 гигобайта, смотря как считать), в то время объём всего контента на Земле оценивается примерно в 5 миллионов терабайт.

//pcinpact.com