Перейти к содержимому

3

К и в прошлому году, публикую самые популярные запросы 2006 года (топ 25) к поисковым машинам «Вершки Рунета» и «Интернет Сочи»:

1. 3601 Сочи
2. 3324 FreeBSD
3. 2199 PostgreSQL
4. 1586 test
5. 1485 lolita
6. 1263 Лазаревское
7. 1218 порно
8. 1185 проститутки
9. 1094 Адлер
10. 1062 работа
11. 981 Хоста
12. 892 sex
13. 758 Карта Сочи
14. 713 Sochi
15. 652 Макопсе
16. 551 preteen
17. 568 Google
18. 536 Аше
19. 498 знакомства
20. 480 правда
21. 476 секс
22. 458 Веб-камера
23. 449 секс Сочи
24. 442 расписание электричек
25. 408 Дагомыс

Всего за 2006 год выполнено свыше 230 тысяч запросов, почти на треть больше, чем в прошлом году.

10

Для поисковых машин «Интернет Сочи» и «Вершки Рунета» добавлен показ превьюшек заглавных страниц сайтов, куда ведут ссылки со страницы результатов поиска. Чтобы увидеть превьюшку нужно навести мышиный курсор на соответствующую ссылку.

22

В работе Методы сравнительного анализа современных поисковых систем и определения объема Рунета. И.В. Сегалович, Ю.Г. Зеленков, Д.О. Нагорнов (Яндекс) среди прочих высказывается идея приблизительного равенства отношений объёмов результатов сэмпплирования каких-либо двух поисковых машин и отношений реальных объёмов их архивов (т.е. баз проиндексированых документов). В приложениее к этой работе приводится список 120 редковстречаемых однословных запросов, использованых для сравнения крупных поисковых машин Рунета. Используя этот список запросов и зная реальные объёмы баз Яндекса (1'192'438'541) и Вершков Рунета (1'060'916), можно проверить верность этой идеи.

...читать далее "Вершки Рунета vs Яндекс"

Поисковый плагин для «Вершков Рунета» добавлен в список поисковых плагинов на сайте Mozilla Россия, а также в базу mycroft.mozdev.org.

20

Не сегодняшнее утро в поисковой машине «Вершки Рунета» насчитывалось 334120 проиндексированых сайтов, из них в зоне .ru зарегистрировано 283113. Где-то проскакивал инфа, что то ли уже зарегистрировано 600 тыс. доменов в зоне .ru, то ли ожидается преодоление этого рубежа до конца этого года, -- я ожидал большего числа сайтов в Рунете. Либо Рунет не слишком связан, тогда возникает вопрос где ещё искать новые сайты, если каталоги Rambler Top100 и liveinternet.ru уже просканированы, а каталог Яндекса в процессе (но там вроде всего чуть менее 80 тыс. сайтов зарегистрировано, и далеко не только из зоны .ru).

PS: хосты типа xxx.narod.ru сайтами не считаются, и я надеюсь, что доменами и тех 600 тыс. тоже 🙂

4

Как сообщает «Хабрахабр», компания Google открыла поиск по архиву газетных публикаций за последние 200 лет. Разуемеется речь идёт об американских газетах.

У нас есть тоже проект оцифровки старых газет: OldGazette.ru, правда он пока не столь полон и ограничивается газетами первой половины 20 XX века. Поисковой машиной «Вершки Рунета» на данный момент проиндексировано 1834 страниц этого сервера. Индексирование теперь ведется поисковой машиной "Интернет Сочи".

Для поиска по этому сайту можно воспользоваться этой формой:

Добавка, поиск по сайту starosti.ru:

2

В базе поисковой машины «Вершки Рунета» снова более миллиона проиндексированых веб-страниц. Это немногим более, чем у недавно открытого нового поисковика «Мамонт».

Сложно сказать, открыты «Вершки Рунета» или нет. 🙂 С одной стороны, ещё не состоялся первый "апдейт" (тотальный пересчет Neo PopRank), но c другой -- поиск уже работает, и им начинают потихонечку пользоваться.

3

Для поисковой машины 43N 39E изменён метод расчёта релевантности с FAST на FULL. Пока заметных измненений в скорости поиска не наблюдается, но метод FULL показал немного более высокие результаты на TREC2005 (genomics ad-hoc track), чем метод FAST.

Также добавлена возможность поиска того же самого запроса в поисковой машине Нигма. Напомню, что ссылки поиска в других поисковых системах находятся внизу страницы результатов поиска.