СоНоты

DataparkSearch vs Google Mini

  Google Mini DataparkSearch
Лицензия Коммерческая, исходники закрыты GPL, открытый исходный текст
Число индексируемых документов и цена
  • до 50,000 за $1,995
  • до 100,000 за 2,995
  • до 200,000 за $5,995
  • до 300,000 за $8,995
до нескольких десятков миллионов, в зависимости от используемого железа. Бесплатное ПО.
Индексируемые форматы файлов 220 различных форматов файлов, включая HTML, PDF и документы Microsoft Office. Простой текст, HTML, XML, MP3, GIF, и любой другой через внешние парсеры.
Языки 28 языков 25 языковых групп, может разбивать на слова фразы традиционного письма на китайском, японском, корейском и тайском языках.
Доступ к файлам через HTTP, HTTPS, сетевые фаловые системы. HTTP, HTTPS, FTP, NNTP, HTTP Proxy, локальную файловую систему, htdb:// схема для индексирования SQL баз.
Доступ к защищенному контенту через HTTP Basic, NTLM v1 и v2, LDAP HTTP Basic
Коллекции документов Да Да, каждая коллекция может быть поделена на секции (тэги и категории).
Интеграция результатов поиска в дизайн сайта пользовательская таблица стилей XSLT, экспорт результатов в XML собственный язык шаблона страницы выдачи в любом тестовом формате (включая HTML,RSS,XML).
Синонимы Да Да
Вывод аттрибутов результатов поиска мета тэги мета тэги, заданные аттрибуты HTML, заданные XML тэги, regex-вырезки из текста (все перечисленные называются секциями)
Фильтрация результатов по мэта тэгам Да Да, + по любой секции или комбинации секций.
Задание различных весов мета тэгам/секциям Нет Да
Интеграция с Google Desktop и Google Toolbar for Enterprise Да Нет
Исключение страниц из поискового индекса Да Да
Спелчекер самообучаемый использует aspell
Кэшированные версии документов Да Да
Поиск в заданном числовом интервале Да Нет
Поиск в заданном интервале дат Да Да
Сортировка результатов по Релевантности, Дате Релевантности, Дате, Популярности, Важности и по всем этим в обратном порядке и любой комбинации.
Отчёты
  • Общее число запросов и уникальных запросов
  • Число запросов в день
  • Средние числа запросов по часам суток
  • Топ 100 ключевых слов и запросов
Нет отчётов. Для каждого запроса могут быть записаны все параметры поиска для последующей обработки.
Автоматическое создание Google sitemap Да Нет
OneBox for Enterprise Да Нет
Поддержка пользователей Сайт поддержки; поддержка по email; гарантированная замена отказавшего оборудования Форум на сайте проекта.
Автоматическое реферирование документов Нет Да, Summary Extraction Algorithm
Согласование содержимого по HTTP для заданные языков Нет Да
Ссылочное ранжирование Нет Да, алгоритмы Neo PopRank и Goo PopRank.

//Google Mini features, Google Mini Administrator features, DataparkSearch.