Выпущена новая версия, 4.50, DataparkSearch Engine. Основные отличия от предыдущей версии:
- Значение по умолчанию для команды PopRankSkipSameSite изменено на "yes".
- Исправлена возможная утечка памяти при индексировании поддокумента из базы stored.
- Добавлен параметр strict для команды Section.
- Добавлено автоматическое разбиение на слова для сокращений во французском языке.
- Добавлены большие листы синонимов английского и русского языков.
- Команда MaxSiteLevel теперь принимает отрицательный аргумент задающий группировку URL по поддиректориям.
- Расширены возможности команды SkipUnreferred. Теперь с её помощью можно удалять документы, на которые никто не ссылается.
- Обработка логов удаления исправлена в splitter в случае пустых логов обновления.
- Некоторые немецкие буквы автоматически заменяются двубуквенными комбинациями при поиске без учета акцентов символов.
Eszett (scharfes S) -> SS, A with diaeresis -> AE, O with diaeresis -> OE, U with diaeresis -> UE. - Добавлена поддержка SQLite3. Используйте ключ --with-sqlite3 для configure чтобы включить её.
- Исправлено индексирование документов с несколькими версиями на разных языках.
При апргрейде вам необходимо выполнить команду "indexer -Erehashstored". - Парсер HTML теперь понимает коментарии <!-- google_ad_section_start -->,
<!-- google_ad_section_start(weight=ignore) --> и <!-- google_ad_section_end --> как тэги для включения/исключения контента из индексирования. - Улучшен подсчет релевантности при использовании акронимов и аббревиатур.
Ого спс большое
Уведомление: Recent URLs tagged Splitter - Urlrecorder