Выпущен новый снапшот DataparkSearch Engine версии 4.54. Вы можете скачать его с Google Drive.
Ниже дан список изменений с момента выпуска предыдущего снапшота:
- Секция Crossword теперб включает значения аттрибута TITLE тэга IMG и значения атрибутов ALT и TITLE тэгов A и LINK, найденных на страницах, ссылающихся на индексируемый документ
- Мета PROPERTY теперь индексируется
- Мета-информация об URL теперь сохраняется для всех документов с HTTP статус-кодом < 400
- configure скрипт теперь понимает ключ --without-libextractor, позволяющий собрать dpsearch без поддержки libextractor даже если эта библиотека установлена
- Включена поддержка robots.txt для сайтов, индексируемых с использованием HTTPS
- Добавлена команда AuthPing, позволяющая посылать авторизационные запросы перед началом индексирования сайта. См. детали ниже.
- Добавлена команда Cookie
- Добавлена поддержка SOCKS5 прокси серверов без авторизации или с использованием авторизации по логину и паролю. См. детали ниже.
- небольшие исправления