web — СоНоты

Два замечания 3

Максим Захаров6 февраля 20113 комментария

Попалась под руку книжка Web Dragons: Inside the Myths of Search Engine Technology, by Ian H. Witten, Marco Gori and Teresa Numerico, - отличное введение в историю и философские основы поиска и библиотек, и их взаимодействии.

В этой книжке можно найти два замечания, хорошо коррелирующих с сегодняшнем положением на рынке поиска.
...читать далее "Два замечания"

Рейтинг веб-студий Сочи 9

Максим Захаров17 декабря 200927 декабря 20099 комментариев

Рейтинг веб-студий Сочи составлен по результатам поиска сигнатур подписей, используемых этими вэб-студиями на сайтах своих клиентов, индексируемых поисковой машиной Интернет Сочи (т.е. сайты, созданные для иногородних и иностранных клиентов не учитываются).

Поз.	Студия	Сайтов	Страниц
1	Элит Дизайн	130	16349
2	РУДизайн	95	5050
3	Хороший проект	90	1855
4	Новые Технологии	55	1112
5	АктивДизайн	36	1343
6	Соника	30	384
7	Авалон	27	475
8	NetWebsite	23	112
9	Конторра	21	982
10	ВебРост	18	274
11	Сочи-интернет	16	1523
12	Студия электронного дизайна	16	153
13	ЮНИКС	12	107
14	Интернет-Бум	12	90
15	Промо	12	51
16	Sochi Web Studio	11	79
17	ДуалАрт	9	543
18	ARAIK	9	450
19	Multi Web	9	82
20	Дом снежного барса	8	22
21	Индиго	6	5292
22	Студия дизайна А. Мельникова	6	60
23	Шафт	5	652

...читать далее "Рейтинг веб-студий Сочи"

Web Optimizer 7

Максим Захаров22 октября 200923 октября 20097 комментариев

Web Optimizer начиная с версии 0.6.3 работает с WordPress сразу после установки без каких-либо допиливаний.

Даже в бесплатной конфигурации, не включающей все возможности оптимизации и ускорения, блог на WordPress ускоряется заметно на глаз.

Кроме WordPress также поддерживаются Joomla! и Drupal, но работоспособность этих версий я не проверял.

Веб-камеры Сочи 134

Максим Захаров15 августа 2008134 комментария

Еще три web-камеры в Сочи, от ЮТК:

Камеры находятся в активном тестировании, возможно по окончании тестирования страница переедит на другую машину с другим адресом.

Гугл пошел в глубину 23

Mike13 апреля 200823 комментария

На Official Google Webmaster Central Blog появилось сообщение о том, что бот Гугла приступил к индексированию глубинного веба:

... when we encounter a <FORM> element on a high-quality site, we might choose to do a small number of queries using the form. For text boxes, our computers automatically choose words from the site that has the form; for select menus, check boxes, and radio buttons on the form, we choose from among the values of the HTML. Having chosen the values for each input, we generate and then try to crawl URLs that correspond to a possible query a user may have made. If we ascertain that the web page resulting from our query is valid, interesting, and includes content not in our index, we may include it in our index much as we would include any other web page.

Т.е. если на достаточно интересном сайте (с точки зрения Гугла) будет обнаружена поисковая форма,бот Гугла начинает подставлять в поисковую форму некоторые слова, найденные на этом сайте, а также перебирать все возмножные варианты в селектах, боксах и радио-кнопках формы поиска. Если результат такого "поиска" покажется Гуглу интересным и заслуживающим внимания пользователей, а также этот контент до этого не числился в его поисковом индексе, он будет включен в индекс на равне с другими страницами.

Собственно это объясняет замеченную пару дней назад активность гуглового бота на одном из сайтов с поиском, где скрипт поиска не был закрыт в robots.txt. Таким образом, если вы хотите закрыть ваши поисковые (или другие интерактивные) базы от бота Гугла, вам нужно закрыть обработчики ваших форм в robots.txt.

Комбинирование поисков 4

Mike12 января 20084 комментария

Примерно с пол-года назад на страницах результатов поиска в поисковиках Интернет Сочи и Вершки Рунета появились вспомогательные поиски (в левой колонке). Сначала это были результаты поиска по тому же запросу, только отсортированные по-другому. Затем их заметили результаты поиска видео (для обоих поисковиков) и поиска по телефонному справочнику (для Интернета Сочи).

И вот компания Google выпускает Related Web Results, фичу для Google Mini и Google Search Appliance, позволяющая интегрировать на страницы результатов поиска результаты поиска по тому же запросу, получаемые в Custom Search Business Edition.

Вебмастеру на заметку 7

Максим Захаров24 августа 20077 ноября 20097 комментариев

В копилку вебмастера рекомендации по формату записи телефонных номеров: ITU-T Recommendation E.123: Notation for national and international telephone numbers, e-mail addresses and Web addresses.

В поисковых машинах «Интернет Сочи» и «Вершки Рунета» начат автоматических сбор с индексируемых страниц номеров телефонов, которые будут выводится на страницах выдачи результатов поиска.

Будут учитываться номера телефонов, записаных в соответствии с указанными выше рекомендациями, т.е. в виде +7 8622 XX-XX-XX, а также, в виду массовости использования: (8622) XX-XX-XX.

Доклады РИТ-2007

Максим Захаров4 августа 2007Добавить комментарий

Доклады РИТ-2007 появились в свободном доступе: www.rit2007.ru/org.html. К сожалению не все доклады имеют презентации к скачиванию, или имеют только видео-отчет, но все равно я нашел много интересного к прочтению:

Настройка FreeBSD для обслуживания 100-200 тысяч соединений (Сысоев Игорь Владимирович, автор nginx);
Поисковый спам (Кудинов Павел Владимирович);
Разработка архитектуры больших систем (Александр Горный, Mail.Ru);
nginx - зачем он вообще нужен, текущие и будущие возможности (Сысоев Игорь Владимирович);
Микроформаты: свежий взгляд на семантику веб-страниц (Максим Россомахин);
Важнейшие принципы работы с текстом и кодировками (Андреев Олег Дмитриевич);
Semantic Web & электронные СМИ (Клинцов Илья Викторович);
Фактографическое аннотирование новостных сюжетов (Лев Гершензон );
PostgreSQL в веб-приложениях: отказоустойчивость, балансировка нагрузки, репликация, масштабирование (Иван Золотухин);
Оптимизация производительности баз данных (Бесков-Доронин Денис Николаевич);
Полнотекстовый поиск в PostgreSQL (Бартунов Олег Сергеевич);
Эффективный полнотекстовый поиск по базам данных (Андрей Аксенов).

Ноктурнал 2

Максим Захаров16 мая 20072 комментария

В конце прошлого года появились сообщения о проекте создания поисковика основателем Википедии, отличительной чертой которого будет участие компьюнити в "рихтовке" результатов поиска. Пока процесс создания этого поисковика находится в начальной стадии обсуждения архитектуры, создания команды разработчиков и т.п.

В тоже время, компания Microsoft выпустила сообщение о том, что в её исследовательском центре в Силиконовой долине также разрабатывается технология поика, использующая сложившееся онлайновое окружение конкретного пользователя выполняющего поисковый запрос. Эта технология, получившая название Ноктурнал (Nocturnal), основывается на двух продуктах: Microsoft Live Messenger, используемом для обмена информацией (файлы, картинки, историю действий и что-угодно ещё) в уже сложившейся инфраструктуре онлановых контактов между пользователями; и конечно же на Microsoft Live Search, результаты поиска которого специальный тулбар обрабатывает (досортировывает) особым образом с учётом рекомендаций, получаемых от ваших контактов в Live Messenger.

Основной лейтмотив этой новой технологии: кто еще, как не ваше ближайшее окружение может знать ваши потребности и предпочтения (очевидно для разрешения возможных неоднозначностей при поиске).

// Web Search—With a Little Help from Your Friends