Идеальный поиск

Мариса Майер, вице-президент компании Google, рассказывает об идеальном поиске и секрете успеха Google в поиске.

В прошлом месяце, во время пресc-конференции по финансовым итогам третьего квартала, Эрик Шмидт (Eric Schmidt), генеральный директор Google, заявил о 120 улучшениях в поиске, реализованных Google в третьем квартале на их пути к поставленной цели: "Мы хотим создать идеальную поисковую машину".

Никто не попросил его остановиться по-подробнее на этой благородной цели, поэтому когда служба новостей IDG получила возможность взять интервью у Марисы Майер (Marissa Mayer), вице-президента по поисковым продуктам и практики их использования, мы сразу же попросили её объяснить, что имел в виду Шмидт. Она также рассказала о том, что удерживает Google в лидерах поиска, как компания относится к семантическим технологиям, и что будет дальше с её универсальным поиском, технологии по объединению различных типов данных - новостей, изображений, видео, книг, карт, - в едином результате поиска.

Отредактированная запись беседы:

Что такое идеальный поисковая система? Если бы у вас была волшебная палочка, способная её создать, как бы она выглядела и что бы она делала?

Это была бы машина, способная ответить на этот вопрос, серьезно. Она бы распознавала речь, понимать вопросы, фразы, определять о каких предметах и понятиях идет речь. Могла бы искать во всех мировых источниках информации, [находить] различные идеи и концепции и возвращать все в виде информативной и логически структурированной презентации.

Много различных научных разработок необходимо собрать воедино в такой поисковой машине. Вам нужно распознавать речь, распознавать картинки. Вам нужен перевод, чтобы находить ответы независимо от языка, на котором они записаны. Вам понадобится искусственный интеллект, чтобы иметь возможность анализировать, какая информация является актуальной и синтезировать её. Вам нужен также отличные пользовательский интерфейс и методики использования для пользователей. И вам возможно понадобится некоторая персонализация, чтобы поисковая система подстраивалась под пользователей, их бэкграунд, что они уже знают о предмете и что искали на прошлой неделе.

На уровне интерфейса пользователя Google постоянно критикуется своими конкурентами за, то, что они пренебрежительно называют "десятью голубыми ссылками" страницы выдачи Google. Они говорят, что Google - старая школа, а её парадигма поиска неэффективна и неудобна. Как вы реагируете на такую критику?

Я бы сказала, что универсальный поиск является действительно переломным моментом в этом. Вы получаете диаграммы, фотографии, блоги, местную информацию, книги, новости, и все это увязано в единой поисковой системе. Пока многие из наших конкурентов заняты строительством отдельных вертикальных поисковиков, и вам еще нужно помнить, у кого из них какие, мы заняты решением очень сложной вычислительной задачи: как объединять все эти разнородные типы информации в единый целостный набор ответов, и как все это синтезировать. Мы делаем все это потому, что это лучше для пользователей: вот инструмент и он дает дает мне, что я хочу, независимо от формата, в котором оно находится.

У нас еженедельно вносится от двух до пяти изменений в интерфейс, видимых конечному пользователю. Мы не публикуем изменения в нашей системе ранжирования. Мы вносим изменения в наш алгоритм ранжирования примерно дважды в день. Интересно, что некоторые наши конкуренты не вносили никаких изменений в их алгоритмы ранжирования давольно-таки продолжительное время. Поиск должен развиваться, и в пользовательском интерфейсе, и в алгоритме ранжирования. Это процесс состоит во множестве мелких изменений, проводимых все время и непрерывно улучшающих систему.

Каков статус семантического поиска в Google? Вы сказали когда-то давно, что при помощи "грубой силы", - анализируя огромный массив запросов и контента всемирной паутины, - движок Google может давать результаты, которые выглядят будто бы он владеет семантическим анализом, хотя на самом деле он использует другие алгоритмические подходы. Этот подход все еще самый используемый?

Мы верим в возможность постройки интеллектуальных систем, обучаемых на потоках данных в автоматическом режиме, [а затем] подстраиваемых и улучшаемых. Когда люди говорят о семантическом поиске и семантическом Вебе, они обычно подразумевают нечно весьма неавтоматизированное, сделанное вручную, с картами различных ассоциаций между словами и понятиями или нечто вроде этого. Мы думаем, что можно добиться более лучшего уровня понимания при помощи сравнения данных с шаблонами и строя широкомасштабные системы. Именно так работает мозг. Именно поэтому имеются все эти нечеткие связи, потому что мозг непрерывно обрабатывает огромнейший и приогромный объем данных все время.

Пару лет назад, или около того, некоторые эксперты предсказывали, что семантические технологии произведут революцию в поиске и затмят Google, но этого не случилось. Похоже сематические технологии застопорились, особенно из-за трудностей с масштабированием семантических движков.

Проблема в том, что язык непрерывно меняется. Веб-страницы меняются. Методы самовыражения людей меняются. И все это влияет на то, насколько хорошо семантический поиск работает. Именно поэтому лучше иметь подход, основанный на машинном обучении, изменяемый, итерационный и подстраиваемый под данные. Это более надежный подход. Но это не говорит о том, что у семантического поиска нет своего места в поиске. Это всего лишь касается нас, мы действительно предпочитаем сосредоточиться на вещах масштабируемых. Если бы мы нашли семантическое решение, которое масштабируется, это было бы здорово. Пока мы видим, что набор наших методов приближается к интеллекту семантического поиска, но достигает этого другими средствами.

Об универсальном поиске объявили в мае 2007. Он уже считается готовым, или он всегда будет в стадии разработки?

Он по-прежнему активно развивается. Сейчас у нас несколько команд: у нас есть группа локального универсального поиска, группа универсального поиска изображений, группа универсального поиска товаров и продуктов. Все они исследуют, как мы можем еще лучше ранжировать и подключать этот контент. Когда мы его запустили, он работал примерно для одного из 25 запросов. Сегодня он показывается примерно для 25% запросов. И мы полагаем, что все еще существуют случаи, когда данные в этих вспомогательных форматах могли бы помочь, но мы их не включаем в нашу страницу результатов. Это то, над чем нам надо продолжать работать.

//PCWorld

Идеальный поиск: 9 комментариев

  1. андор

    я думаю гугл станет не только идеальным поисковиком но и вообще операциоку сделает отличную

  2. Maxime

    Вопрос уже не сделает или нет (можно считать. что уже сделал), а насколько она будет успешна.

  3. NULL

    Судя по презентации, Chrome OS займет свою нишу на нетбуках в странах с дешевыми и толстыми каналами. Не очень мало, но и не много.

  4. Maxime

    А также в организациях и муниципалитетах, перешедших на Google Apps, их сейчас свыше 2 млн. и число продолжает расти.

  5. Inura

    Я бы лично не сказала что Google – старая школа, эт слишком громко сказано....

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *