Некоторое время назад обнаружил странные записи в логе веб-сервера (фрагмент ниже). Все запросы идут с одного IP-адреса, в User-Agent содержится подстрока Google Desktop. Мужду некоторыми последовательными запросами интервал в несколько секунд, что явно мало для обычного поиска в одну человеческую силу. Запросы повторялись непрерывно с небольшими интервалами двое суток кряду (до блокировки файрволом) -- человек столько без сна непрерывно запрашивать одно и тоже явно не может (с нормальной головой). Предварительный вывод: Google Desktop чудит.
Отписал в поддержку Google Desktop. Сегодня получил ответ, перечисляющий случаи, в которых Google Desktop что-либо передаёт через Интернет, неявно намекая что это не штатное поведение Google Desktop. Ещё один вывод: какие-то умельцы приспособили Google Desktop в качестве вовсе не персонального поисковика 🙂
У кого-нибудь нечто подобное наблюдается ? Если последний вывод правлен, то я должен быть не один такой :]
Замечание: путь /cgi-bin/search закрыт в robots.txt (т.е. этот самопал явно robots.txt не соблюдает).
xxx.yyy.zzz.йй [24/Feb/2006:12:58:30 +0300] "GET
/cgi-bin/search.cgi.en?q=l%27extension+des+brevets+%26%23224%3B+tous&c=&site=&m=a;y&sp=;&sy=;&s=DRP&tmplt=rss.htm.en
HTTP/1.1" - "Mozilla/4.0 (compatible; Google Desktop)"-"-"
xxx.yyy.zzz.йй [24/Feb/2006:13:00:06 +0300] "GET
/cgi-bin/search.cgi.en?q=i5&c=&site=&m=a;y&sp=;&sy=;&s=DRP&tmplt=rss.htm.en
HTTP/1.1" - "Mozilla/4.0 (compatible; Google Desktop)"-"-"
xxx.yyy.zzz.йй [24/Feb/2006:13:00:16 +0300] "GET
/cgi-bin/search.cgi.en?q=extension+des+brevets+%26%23224%3B+tous&c=&site=&m=a;y&sp=;&sy=;&s=DRP&tmplt=rss.htm.en
HTTP/1.1" - "Mozilla/4.0 (compatible; Google Desktop)"-"-"
xxx.yyy.zzz.йй [24/Feb/2006:13:00:33 +0300] "GET
/cgi-bin/search.cgi.en?q=ffi&c=&site=&m=a;y&sp=;&sy=;&s=DRP&tmplt=rss.htm.en
HTTP/1.1" - "Mozilla/4.0 (compatible; Google Desktop)"-"-"
xxx.yyy.zzz.йй [24/Feb/2006:13:00:52 +0300] "GET
/cgi-bin/search.cgi.en?q=l%27extension+des+brevets+%26%23224%3B+tous&c=&site=&m=n;ar&sp=;&sy=;&s=DRP&tmplt=rss.htm.en
HTTP/1.1" - "Mozilla/4.0 (compatible; Google Desktop)"-"-"
xxx.yyy.zzz.йй [24/Feb/2006:13:02:27 +0300] "GET
/cgi-bin/search.cgi.en?q=parti+socialiste&c=&site=&m=n;ar&sp=;&sy=;&s=DRP&tmplt=rss.htm.en
HTTP/1.1" - "Mozilla/4.0 (compatible; Google Desktop)"-"-"
xxx.yyy.zzz.йй [24/Feb/2006:13:02:48 +0300] "GET
/cgi-bin/search.cgi.en?q=ffii&c=&site=&m=a;y&sp=;&sy=;&s=DRP&tmplt=rss.htm.en
HTTP/1.1" - "Mozilla/4.0 (compatible; Google Desktop)"-"-"
xxx.yyy.zzz.йй [24/Feb/2006:13:03:32 +0300] "GET
/cgi-bin/search.cgi.en?q=l%27extension+des+brevets+%26%23224%3B+tous&c=&site=&m=a;y&sp=;&sy=;&s=DRP&tmplt=rss.htm.en
HTTP/1.1" - "Mozilla/4.0 (compatible; Google Desktop)"-"-"
xxx.yyy.zzz.йй [24/Feb/2006:13:05:13 +0300] "GET
/cgi-bin/search.cgi.en?q=i5&c=&site=&m=a;y&sp=;&sy=;&s=DRP&tmplt=rss.htm.en
HTTP/1.1" - "Mozilla/4.0 (compatible; Google Desktop)"-"-"
xxx.yyy.zzz.йй [24/Feb/2006:13:05:25 +0300] "GET
/cgi-bin/search.cgi.en?q=extension+des+brevets+%26%23224%3B+tous&c=&site=&m=a;y&sp=;&sy=;&s=DRP&tmplt=rss.htm.en
HTTP/1.1" - "Mozilla/4.0 (compatible; Google Desktop)"-"-"
xxx.yyy.zzz.йй [24/Feb/2006:13:05:36 +0300] "GET
/cgi-bin/search.cgi.en?q=ffi&c=&site=&m=a;y&sp=;&sy=;&s=DRP&tmplt=rss.htm.en
HTTP/1.1" - "Mozilla/4.0 (compatible; Google Desktop)"-"-"
xxx.yyy.zzz.йй [24/Feb/2006:13:06:15 +0300] "GET
/cgi-bin/search.cgi.en?q=l%27extension+des+brevets+%26%23224%3B+tous&c=&site=&m=n;ar&sp=;&sy=;&s=DRP&tmplt=rss.htm.en
HTTP/1.1" - "Mozilla/4.0 (compatible; Google Desktop)"-"-"
xxx.yyy.zzz.йй [24/Feb/2006:13:07:28 +0300] "GET
/cgi-bin/search.cgi.en?q=parti+socialiste&c=&site=&m=n;ar&sp=;&sy=;&s=DRP&tmplt=rss.htm.en
HTTP/1.1" - "Mozilla/4.0 (compatible; Google Desktop)"-"-"
xxx.yyy.zzz.йй [24/Feb/2006:13:07:50 +0300] "GET
/cgi-bin/search.cgi.en?q=ffii&c=&site=&m=a;y&sp=;&sy=;&s=DRP&tmplt=rss.htm.en
HTTP/1.1" - "Mozilla/4.0 (compatible; Google Desktop)"-"-"
Добавка: еще один, другой IP, другая сеть, другая страна по whois, поведение тоже, и таже подстрока Google Desktop в User-Agent. Определённо что-то странное...