AUMO — Поиск смысла

Максим Захаров21 июля 200617 комментариев

Наткнулся на ссылку на новый проект AUMO. Интересно, какие там технологии используются, если автоматическое реферирование, то это не особо ново. Если же строят семантическую модель документа, то уже интереснее 🙂

AUMO — Поиск смысла: 17 комментариев

Lermont 21 июля 2006 в 15:22

Какого-либо поиска я так не нашел, пишут, что заблокирован. В этом проекте мне интересным показалось другое - как они отбирают документы для последующей обработки? Взять документ, зная, что это статья, посчитать по нему ключевые слова и вынести их в качестве тегов - это просто, а вот найти такую статью - это проблема.
Maxime 21 июля 2006 в 15:47

Поиск обещают сделать позже 🙂
Насколько я понял, сейчас сервера-источники документов к индексированию отбираются вручную, т.е. берутся сервера с заведомо "хорошими" документами.
Lermont 21 июля 2006 в 15:53

Но даже на "хороших" серверах нужно найти "хорошие" документы - ведь не по размеру же HTML-файлов они это делают.
Maxime 21 июля 2006 в 16:12

Боюсь, что ради атких подробностей нужно пытать не меня, а авторов 🙂
Я не знаю деталей, самому интересно, как оно у них работает 🙂
wmas 21 июля 2006 в 22:43

Как говорят сами авторы: «…Аумо читает текст и пытается "понять"…» (взято со страницы О проекте). То есть реализован какой то интеллект. Хотя говорить о семантике я бы пока не спешил. Что-то слышал о RDF формате, но не могу сказать реализован ли он на этом проекте. Пока это больше напоминает большую энциклопедию которую формирует машина. А так как файла robots.txt вроде нет, то могут реально забанить вить это фактически чистый copy + past имхо. Если что, надеюсь меня поправят 🙂

AUMO — Поиск смысла

Похожие записи:

AUMO — Поиск смысла: 17 комментариев

Добавить комментарий