Перейти к содержимому

Поисковой машиной 43°с.ш.39°в.д. проиндексировано 1,084 млн. документов c 430516 сайтов объёмом 27,804 гигабайта. Количество результатов по сочинским топонимам:

на 11.11 изм.за неделю
Сочи 7203 -69
Sochi 2584 +33
"Чёрное море" 2525 -32
Адлер 2289 -24
"Красная поляна" 1853 -1
Лазаревское 1643 -21
Кубань 1546 -7
Хоста 1323 -9
Дагомыс 1273 -2
Мацеста 920 -10
Лоо 841 -12
Ахун 755 -1
Кудепста 684 -3
Adler 581 +7
Мамайка 490 -10
Аибга 406 +5
"Эсто-садок" 342 +1
Магри 268 +1
"Бочаров ручей" 254 -3
Dagomys 223 +18
Sotschi 200 +6
"Krasnaya polyana" 185 +8
"Роза Хутор" 83 +1
Sotji 21 +2
ソチ 15 +1
소치 12 +1
索契 4 0

Данные предыдущей недели.

6

С открытием своего веб-сайта, молодая компания из Сан-Франциско Powerset делает свои первые шаги. Powerset является стартапом поисковика третьего покаления, т.е. ориентирующегося на поиск на естественом языке.

В данный момент технология поиска компании находится в стадии закрытого тестирования. Открытие для публичного тестирования запланировано на весну 2007 года.

Бэмби Франсиско (Bambi Francisco), журналистка издания MarketWatch, провела сравнительное тестирование поисковиков Powerset и Google и сообщает о результатах в своей заметке The search engine that would outdo Google. Мадам Франсиско заключает, что поисковик от Powerset лучше учитывает семантику слов конретного вопроса, нежели поисковик от Google, и тем самым выдаёт более релевантные ответы.
//DSI

31

Поисковой машиной 43°с.ш.39°в.д. проиндексировано 1,063 млн. документов c 426571 сайтов объёмом 27,23 гигабайта. Количество результатов по сочинским топонимам:

на 04.11 изм.за неделю
Сочи 7272 +20
"Чёрное море" 2557 -4
Sochi 2551 +21
Адлер 2313 +17
"Красная поляна" 1854 +18
Лазаревское 1664 +6
Кубань 1553 +10
Хоста 1332 +3
Дагомыс 1275 +1
Мацеста 930 +2
Лоо 853 0
Ахун 756 +4
Кудепста 687 -1
Adler 574 +5
Мамайка 500 0
Аибга 401 +1
"Эсто-садок" 341 0
Магри 267 -1
"Бочаров ручей" 257 0
Dagomys 205 +6
Sotschi 194 -2
"Krasnaya polyana" 177 +4
"Роза Хутор" 83 +1
Sotji 19 0
ソチ 14 0
소치 11 0
索契 4 0

Данные предыдущей недели.

4

Подогрели ссылочкой на ещё один общероссийский поисковик Что.ру. Вроде ищет, но обладает отличным гимороем для исследователей: контент отдаёт в UTF-8, а в заголовках сообщает windows-1251, -- некузяво однако, для общероссийского-то поисковика...

Оценка объёма базы по нескольким редким ключевикам (наскоро) -- примерно одна пятая от объёма Яндекса (для конретных ключевиков это значение варьируется от 1 до 11).

7

Тим о'Рэйли в своём «Радаре» отмечает мысль, высказаную Билом Бурнхэмом (Bill Burnham):

Сегодня многочисленные поисковые стартапы в духе Google, Yahoo, Ask и т.п., ищущие источники финансирования, по большей части заведомо мертвы, поскольку на сегодняшний момент поисковик, это не столько алгоритмы, сколько дорогостоящая платформа для индексирования всего Интернета, хранения собраной информации, а также способная обрабатывать огромное число запросов на поиск от многочисленных пользователей. Возможно, выжить смогут только те, кто сможет переориентироваться на создание новых приложений, а не на попытки построения собственной инфраструктуры поиска. Вполне возможно, что в ближайшее время инфрастуртура, необходимая для глобального поиска, будет доступна в качестве сервиса. Здесь компания Amazon, открыв индексирующий и поисковый API своего поисковика Alexa, выступает пионером "поиска как сервиса".

Далее Тим приводит пример Nutch, проекта создания поисковика с открытым исходным кодом, которым он когда-то занимался, и отмечает, что он, до сих пор не получив достаточного финансирования на создание собственной инфрастуктуры глобального поиска, так и остался по большей части исследовательским проектом.

Таким образом, Web 2.0 вступает в новую фазу, где соперничают не столько конкретные приложения, сколько платформы для таких приложений, но в отличие от эры Windows, главное здесь не контроль за API, он как правило открытый и всем доступный, а именно инфраструктура, и в первую очередь огромные базы данных, лежащие в основе приложений Web 2.0.

3

Поисковой машиной 43°с.ш.39°в.д. проиндексировано 1,056 млн. документов c 417529 сайтов объёмом 27,058 гигабайта. Количество результатов по сочинским топонимам:

на 28.10 изм.за неделю
Сочи 7252 -19
"Чёрное море" 2561 -7
Sochi 2530 +1
Адлер 2296 -9
"Красная поляна" 1836 +7
Лазаревское 1658 -20
Кубань 1543 -25
Хоста 1329 -4
Дагомыс 1274 -6
Мацеста 928 -1
Лоо 853 -5
Ахун 752 +1
Кудепста 688 -8
Adler 569 +13
Мамайка 500 -5
Аибга 400 +3
"Эсто-садок" 341 +4
Магри 268 -3
"Бочаров ручей" 257 -1
Dagomys 199 +2
Sotschi 196 +4
"Krasnaya polyana" 173 -4
"Роза Хутор" 82 +2
Sotji 19 0
ソチ 14 0
소치 11 0
索契 4 0

Данные предыдущей недели.

3

Случилось давеча попутешестовать поездами, в кои веки. Обнаружилось, что нумерация вагонов теперь начинается с 3 (по крайней мере у двух поездов было именно так). Интересно, чем не угодили 1 и 2 МПСу ? 🙂

Под стук колёс подумалось, что хотя рост числа ссылок между страницами и отрицательно сказывается на традиционных методах ссылочного ранжирования а-ля Page Rank, зато может позволить перейти к ранжированию, используя различные численные методы. Например, можно рассматривать страницы как электрические заряды, рангом страницы считать абсолютную величину соответсвующего ей заряда, исходящие ссылки рассматривать как взаимодействие зарядов с одинаковым знаком (т.е. отталкивающихся), входящие - как зарядов с разным знаком (притягивающихся), тематиченскую близость страниц - как расстояние между зарядами. Тогда задача нахождения  ранга страницы будет сводиться к нахождению величины соответсвующего ей заряда, при котором рассматриваемая модель будет находиться в равновесии.

Ежу понятно, что эта модель скорее из разряда "Занимательной IR". Но построив множество таких моделей, можно занять студентов их анализом, где самым главным будет анализ того, как будет влиять добавление новой ссылки, входящей или исходящей, на величину рэнка страницы.

5

Поисковой машиной 43°с.ш.39°в.д. проиндексировано 1,033 млн. документов c 402621 сайтов объёмом 26,675 гигабайта. Количество результатов по сочинским топонимам:

на 21.10 изм.за неделю
Сочи 7271 +14
"Чёрное море" 2568 +19
Sochi 2529 +6
Адлер 2305 +5
"Красная поляна" 1829 +27
Лазаревское 1678 +8
Кубань 1568 -6
Хоста 1333 +13
Дагомыс 1280 +7
Мацеста 929 +11
Лоо 858 +10
Ахун 751 +14
Кудепста 696 +12
Adler 553 +5
Мамайка 505 +4
Аибга 397 +6
"Эсто-садок" 337 +5
Магри 271 +6
"Бочаров ручей" 258 0
Dagomys 197 0
Sotschi 192 -1
"Krasnaya polyana" 177 +1
"Роза Хутор" 80 +2
Sotji 19 +1
ソチ 14 +1
소치 11 0
索契 4 0

Данные предыдущей недели.

В этой таблице приведено сравнение поисковых машин на запросах "Сочи" и "Sochi" (как точных фраз).

"Сочи" "Sochi"
страниц сайтов страниц сайтов
Яндекс 6062691 3062 240925 1581
Рамблер 11460918 142016 707236 27497
Апорт 2383048 5833 187401 2579
43°с.ш.39°в.д. 150172 ~7254 49036 ~2527
Webalta ~7493000 ~335000
Лупа.ру 213967 16496 17984 2420
Черепаха 2188539 173651
Google ~25700000 ~2610000
Live.com 1105631 345668
Yahoo! ~8310000 ~1450000

Лидеры роста: Webalta и Апорт. Незначительное падение: Яндекс, 43N39E, Черепаха, Live.com. Результаты Лупа.ру совершенно не изменились с прошлого месяца.

См. данные предыдущего месяца.