Перейти к содержимому

DataparkSearch 4.50

Выпущена новая версия, 4.50, DataparkSearch Engine. Основные отличия от предыдущей версии:

  • Значение по умолчанию для команды PopRankSkipSameSite изменено на "yes".
  • Исправлена возможная утечка памяти при индексировании поддокумента из базы stored.
  • Добавлен параметр strict для команды Section.
  • Добавлено автоматическое разбиение на слова для сокращений во французском языке.
  • Добавлены большие листы синонимов английского и русского языков.
  • Команда MaxSiteLevel теперь принимает отрицательный аргумент задающий группировку URL по поддиректориям.
  • Расширены возможности команды SkipUnreferred. Теперь с её помощью можно удалять документы, на которые никто не ссылается.
  • Обработка логов удаления исправлена в splitter в случае пустых логов обновления.
  • Некоторые немецкие буквы автоматически заменяются двубуквенными комбинациями при поиске без учета акцентов символов.
    Eszett (scharfes S) -> SS, A with diaeresis -> AE, O with diaeresis -> OE, U with diaeresis -> UE.
  • Добавлена поддержка SQLite3. Используйте ключ --with-sqlite3 для configure чтобы включить её.
  • Исправлено индексирование документов с несколькими версиями на разных языках.
    При апргрейде вам необходимо выполнить команду "indexer -Erehashstored".
  • Парсер HTML теперь понимает коментарии <!-- google_ad_section_start -->,
    <!-- google_ad_section_start(weight=ignore) --> и <!-- google_ad_section_end --> как тэги для включения/исключения контента из индексирования.
  • Улучшен подсчет релевантности при использовании акронимов и аббревиатур.

DataparkSearch 4.50: 2 комментария

  1. Уведомление: Recent URLs tagged Splitter - Urlrecorder

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *