DigiMind: Discover and exploit the Invisible Web for competitive intelligence. Обзор доступен на двух языках, английском и французском, после бесплатной регистрации с основной страницы сайта (ищите ссылку "Découvrir les trésors du Web Invisible").
Поисковые машины, Сидней и обо всём по-немногу
DigiMind: Discover and exploit the Invisible Web for competitive intelligence. Обзор доступен на двух языках, английском и французском, после бесплатной регистрации с основной страницы сайта (ищите ссылку "Découvrir les trésors du Web Invisible").
Слабая работа - фактически ничего оригинального. Лучше уж прочитать первоисточник на который французы постоянно ссылаются ( http://www.press.umich.edu/jep/07-01/bergman.html ). Или еще лучше свежую статью из сборника Яндекса по грантам - она по-русски и про рунет да и ссылки в ней ИМХО приводятся неплохие - http://company.yandex.ru/grant/2005/07_Shestakov_102104.pdf
Не согласен, единственное преимещество работы Шестакова и Воронцовой для русскоязычного читателя - язык этой работы, а так они не делают раличия между hidden, deep и invisible web, хотя есть нюансы, на которые обращают внимание французы.
Ну, я тоже не согласен 🙂 Французы просто "перепели" работу Бергмана (которая по первой ссылке), сами они ничего нового о invisible web не говорят, разве только замечают, что некоторые части invisible web за последние годы стали visible 🙂 Ну а в той статье, что я упомянул (вторая ссылка) по крайней мере приводится оценка размера русского deep web - а никакой "национальный" deep web (кроме английского конечно) вообще насколько я знаю до этого никем не оценивался.
Что же касается терминов, то в научной лит-ре под deep и hidden понимают одно и тоже (ну может быть почти одно и тоже) - динамические веб-страницы с данным из бд. Invisible в принципе более широкое понятие - т.е. это и динамические страницы и скажем какие-нибудь домашние странички о которых неизвестно поисковикам, но дело в том, что наибольший интерес во всех смыслах представляют именно динамические страницы. Поэтому под invisible опять же преимущественно понимают именно динамические страницы. Кстати, французы тоже написали в середине, что вместо invisible корректнее использовать deep.