Компания Looksmart объявила о запуске 181 сайта в 13 вертикальных категориях. Тем самым компания позиционирует себя как самый крупный вертикальный поисковик в Сети.
Раздел: Search Engines
SplogSpot
SplogSpot.com -- директория сплогов, основана на сервисе pingoat.com, умеющем автоматически определять спамерские блоги, но также возможно ручное добавление слога посетителями. Также предлагается API для проверки фидов на спложность (наличие в базе SplogSpot).
Сплог
Сплог -- слово, образованое из двух: спам и блог. Новая эпидемия в Сети. Скнируются блоги, на которых выбираются самые популярные и читаемые статьи, затем контент этих статей копируется в свой блог, зачастую размещенный на одном из блог-сервисов. Далее, с этого фальш-блога (сплога) делаются ссылки на определённый сайт. Цель манипуляции: получить посетителей на целевой сайт.
GoKu — новый бот
Забежал сегодня на сайт новый бот, представился как Gokubot/1.14 (Goku; http://goku.ru/bot.htm). По указаному адресу инфы не много:
Гоку - это новый сервис поиска по Рунету.
В данное время Гокубот проходит тестирование.
Если вам надо запретить посещение определенных страниц сайта Гокуботом, воспользуйтесь robots.txt
Если у вас есть вопросы, обращайтесь на адрес bot [@] goku.ru
В описании записи whois домена goku.ru указано: GoKu search.
Похоже бот умеет "ходить" по формам, т.е. как минимум пытается сканировать URL, указаные в атрибуте ACTION тэга FORM.
Уж не готовится ещё один поисковик по РуНету ?
Самое забавное, вчера попался "слух" о создании (возможно) другого поисковика, как минимум тоже по РуНету.
О Searchengineinvestment.com
Сергей Петренко Неизвестный автор в новостях на сайте searchengines.ru недоумевает, почему MSN Search не входит в список Searchengineinvestment.com, -- а ответ прост, это не список поисковиков к освещению, это список компаний, занимающихся информационно-поисковыми технологиями, курс акций которых учитывается в индексе Webeffekt® Index 2, некоем аналоге индексов Доу Джонса и DAX. Соответсвенно, Microsoft в большей своей части не является такой комапнией (MSN Search является её подразделением). И соответственно, новый сайт будет заниматься не освещением поисковых систем как таковых, а будет ориентироваться на финансовые показатели компаний данного сегмента рынка.
Ansearch проштрафился
Австралийский поисковик Ansearch вынужден в ближайшем времени внести изменения в код своего поисковика для устранения жалоб со стороны вебмасетров, обнаружевших копии своих страниц с сайта Ansearch в кэше других поисковиков.
Хм, а не проще ли просто соответсвующего правило в robots.txt прописать 🙂
В принципе, показ кээшированых копий страниц является необходимой функцией современного поисковика, однако большинство поисковиков закрывают такие страницы от индексирования другими поисковиками, -- это негласное правило хорошего тона.
Сравнение поисковых машин “по-сочински”, в профиль
В этой таблице приведено сравнение поисковых машин на запросах "Сочи" и "Sochi" (как точных фраз).
"Сочи" | "Sochi" | |||
---|---|---|---|---|
страниц | сайтов | страниц | сайтов | |
Яндекс | 5499806 | 2705 | 462465 | 1614 |
Рамблер | 4310311 | 83792 | 428673 | 15968 |
Апорт | 20000 | 4488 | 10000 | 1180 |
43°с.ш.39°в.д. | 81848 | ~2508 | 35966 | ~1966 |
~1870000 | ~1960000 | |||
MSN Search | 1127239 | 355519 | ||
A9.com | ~152000 | ~173000 | ||
Yahoo! | ~6110000 | ~1180000 |
Что в лоб, что в профиль одинаково у MSN Search и 43n39e.ru, у остальных поисковых машин примерно через два часа и для точных фраз из одного слова число находимых документов или серверов изменилось.
Сравнение поисковых машин “по-сочински”
В этой таблице приведено сравнение поисковых машин на запросах "Сочи" и "Sochi".
Сочи | Sochi | |||
---|---|---|---|---|
страниц | сайтов | страниц | сайтов | |
Яндекс | 6074460 | 4191 | 464661 | 1622 |
Рамблер | 4555812 | 96075 | 427611 | 16027 |
Апорт | 20000 | 4493 | 10000 | 688 |
43°с.ш.39°в.д. | 81848 | ~2508 | 35966 | ~1966 |
~2090000 | ~1980000 | |||
MSN Search | 1127239 | 355519 | ||
A9.com | ~153000 | ~172000 | ||
Yahoo! | ~6090000 | ~1170000 |
Замечание по Яндексу: одновременно со словом "Сочи" почему-то также находятся "сочилась кровь" и "Соч.И-С.Баха" и т.п., это приносит "лишние" результаты...
Лидеры роста за месяц: MSN Search и Рамблер.
Число страниц, найденых MSN по русскому варианту выросло примерно в 10 раз за месяц!
Лидеры роста прошлого месяца, Яндекс и Yahoo!, оба обновременно немного уменьшили число находимых документов, вероятно это связано с технологиями отлова дублей и бана некоторых сайтов/страниц.
10 новых рекомендаций
SearchEngineGuide.com даёт 10 новых рекомендаций как попасть на вершину выдачи:
- Не покупайте новых доменов без особой необходимости. Google не принимает всерьёз только что созданные сайты и открытые домены, поэтому постарайтесь использовать старые насколько это возможно.
- Оптимизируйте ваш сайт для целевой аудитории, а не для поисковых машин.
- Как следует изучите ваши ключевые слова и фразы. Возможно ключевые слова, которые как вы полагаете относятся к вашей нише, совсем ими не являются, и наоборот, вы можете упустить некоторые ключевые фразы вашего рынка. Используйте для изучения реальные данные о статистике запросов поисковых машин, например, www.keyworddiscovery.com и www.wordtracker.com
- Создавайте архитектуру и навигацию вашего сайта на основе вашего изучения ключевых слов и фраз. Например, если ваш сайт продаёт игрушки, вы серьёзно полагаете, что родители выбирают игрушки по уровню развития своего ребёнка ?
- Создавайте ваш сайт дружественным для ботов поисковых машин. Боты поисковых машине не могут заполнять формы, не могут выполнять поиск по вашему сайту, не могут выполнятьJavaScript код меню, не читают графику и Flash. Это не запрет на использование этих технологий, но вы должны подумать об альтернативной навигации по вашему сайту.
- Заполняйте атрибуты ваших внутренних ссылок и кликабельных картинок (атрибуты alt) как можно яснее и точнее.
- Напишите
завлекательную копиюзавлекательный текст ваших основных страниц, обязательно сделайте их доступными ботам поисковых машин, не перегружайте их графикой и флэш-роликами, а также постарайтесь привлечь пользователей эмоционально. Используйте на этих страницах ключевые фразы и обороты именно таким образом, как пользователи поисковиков могли бы искать информацию о вашем рынке. - Добавьте ваши ключевые слова в уникальный для каждой страницы тэг Title.
- Убедитесь, что ваш сайт имеет ссылочный вес, т.е. на него ссылается достаточное количество сайтов с хорошей репутацией (желательно в той же области).
- Не зацикливайтесь только на одной ключевой фразе или слове и не слишком заморачивайтесь позицией в рейтинге.
300 лет на весь контент
8 октября на пресс-конференции в Фениксе (США), исполнительный директор Google Эрик Шмидт (Eric Schmidt) заявил, что его компании понадобилось бы около 300 лет, чтобы проиндексировать весь контент на Земле (теоретически речь идёт о сканировании и индексировании книг, журналов и т.п.). Согласно Шмидту, Google проиндексировал 170 Терабайт (терабайт -- 1000 или 1024 гигобайта, смотря как считать), в то время объём всего контента на Земле оценивается примерно в 5 миллионов терабайт.