Перейти к содержимому

7

Раньше случалось присылали всякие значки "5 звёзд", "выбор редакции" и т.п. Но на сей раз прислали нечто новое:

DataparkSearch Antivirus Report
Вроде как проверили на наличие шпинского ПО и прочей гадости, естественно не нашли (такого добра отродясь не держим). Просто интересно, а как они проверяют исходный код ?

1

Выпущена новая версия DataparkSearch 4.38. Основные отличия от предыдущей версии:

  • Значение по умолчанию для ключа configure --with-wrdunifactor изменено на 1.5.
  • Имя шаблона результатов поиска теперь можно передавать через path_info часть URL, например, http://localhost/cgi-bin/search.cgi/template.htm
  • Если для нечёткого поиска с использованием ispell-данных не найдено точного соответсвия в словаре, для построения всех форм слова выбирается запись с максимально совпадающим суффиксом.
  • indexer теперь воспринимает МЕТА-таг DP.PopRank для задания начального значения рейтинга популярности страницы.
  • Исправлен трап indexer на Debian Linux.
  • Исправлена обработка robots.txt для записей с двумя и более полями User-Agent.

2

Если есть свободное время, протестируйте, пожалуйста, различные методы релевантности поисковика 43°с.ш.39°в.д..

В форме поиска самый левый селектор в нижнем ряду задаёт один из трёх методов: full, fast или ultra. Собственно хочется знать субъективные впечатления об этих методах, ещё и в купе с сортирокой по релевантности/важности 🙂

1

Для поисковых машин Весь интернет Сочи и 43°с.ш.39°в.д. добавлено новшество: если при нечётком поиске с учётом всех форм слов запроса (включено по умолчанию) не удалось найти точного совпадения в словаре, для построения всех форм слова берётся запись словаря, имеющая наибольший общий суффикс с искомым словом.

Конечно, этот приём также привнесёт и некоторые неправильные словоформы, однако в большинстве случаев этот подход работает правильно для новых (не известных ранее в словаре ispell) слов.

Выпущена новая версия DataparkSearch 4.37. Основные отличия от предыдущей версии:

  • Заголовки документов теперь сохраняются в базе stored и могут быть использованы в шаблоне storedoc.
  • Исправлена уязвимость к Cross Scripting. Проверьте и обновите ваши поисковые шаблоны при необходимости.
  • Автоматическая коррекция правописания слов запроса заменена на предложение поиска с правильной орфографией. Используйте мета-переменные $(Suggest_url) и $(Suggest_q) для построения такого запроса (см. etc/search.htm-dist для примера).
  • Исправлен возможный трап на логических запросах с пропущенными аргументами.
  • Добавлена команда GuesserBytes.
  • Улучшена работа узнавателя языка и кодировки. Вам необходимо пересоздвать вами созданные карты языков.
  • Исправлено ошибочное удаление записей из таблицы "links".
  • Исправлено усечение переменных шаблона для мультибайтных кодировок.
  • Добавлена поддерджка директивы Host: в robots.txt.
  • Исправлены некоторые баги.

4

Выпущен DataparkSearch 4.36. Основные новшества:

  • Слегка модифицирован Neo PopRank.
  • Исправлена компиляция с поддержкой aspell под OpenBSD.
  • indexer теперь может работать с cached и stored через NAT.
  • Добавлена команда BodyPattern.
  • Улучшена работа SEA.
  • Исправлен трап при некорректном значении указаном в <BASE HREF
  • Ключ --enable-full-rel у configure заменён на --enable-rel. Поддерживаются методы: full, fast, ultra.
  • Добавлены команды Store и NoStore.
  • Исправлены некоторые баги.

15

Выпущена новая версия DataparkSearch 4.35. Основная новинка: Алгоритм Построения Рефератов индексируемых документов. См.: Список всех изменений.

DataparkSearch поучаствовал в сравнении сегментеров китайского. Не самый лучший, но далеко не самый худший результат :).