Перейти к содержимому

2

В последнем снапшоте DataparkSearch добавлена возможность расширения поисковых запросов при помощи регулярных шаблонов замены. В первую очередь это полезно при поиске по номеру телефона, - как правило их записывают разными способами.

Например, по запросу 8622-64-24-24 Сочи будет найден и телефонный номер, записанный в канонической форме +78622642424.

Воспользоваться этой возможностью можно на сайте Интернет Сочи при поиске по базе телефонных номеров.

На данный момент, ни Гугл, ни тем более Яндекс такой фичи не поддерживают.
...читать далее "Регулярное расширение"

3

В последнем снапшоте DataparkSearch Engine расширена команда Limit, теперь в ней можно указывать SQL-запрос, возвращающий все возможные пары значение лимита и значение url.rec_id. Например:
...читать далее "dpsearch-4.53-03052009"

1

Выпущена новая версия, 4.52, DataparkSearch Engine. Основные отличия от предыдущей версии:

5

Изменения от снапшота dpsearch-4.52-21022009:

  • Добавлена команда SkipHrefIn. Используйте её для указания какие HTML тэги нужно пропустить при поиске новых ссылок.
  • Добавлена команда SEASections. Используйте её для указания списка секций документов, по которым будет строится SEA-реферат.
  • Исправлен возможный трап на пустом документе.
  • Команда Disallow в robots.txt больше не приводит к удалению документа из базы.
  • Исправлена ошшибка в декодировании больших файлов со сжатым содержимым.

...читать далее "dpsearch-4.52-06042009"

4

Изменения от версии 4.51:

  • Добавлена команда Quffix.
  • searchd теперь очищает кэш поисковых запросов при загрузке и при перезагрузке конфига.
  • Исправлен баг в проверке базы stored.
  • Добавлена обработка часового пояса в заголовках Last-Modified и мета.
  • Добавлена команда MakePrefixes. Используйте её для создания всех префиксов индексируемых слов документа. Предназначена для организации подсказок (suggestions).

...читать далее "dpsearch-4.52-21022009"

2

За год показатель в тесте навигационного поиска увеличен с 58.719% на 4 января 2008 до 85.141% на сегодня. За тоже время средняя позиция сайтов-маркеров сократилась с 2.4545 до 2.3491. По этому показателю DataparkSearch превосходит поисковики Yahoo, Aport и Yanga.

В тематическом поиске на сегодняшний день поисковик Вершки Рунета находит 16.143% сайтов маркеров (190 из 1177). И по этому показателю опережает поисковики Yanga, Aport, Rambler и Yahoo.

10

Выпущена новая версия, 4.51, DataparkSearch Engine. Основные отличия от предыдущей версии:

  • В расчет релевантности добавлен учет нахождения на страницах документа точной как в запросе фразы.
  • Реализована синхронизация на основе CAS для платформы i386/x86_64.
  • Добавлена команда ActionSQL. Используйте её для выполнения SQL-запросов с данными документа во время индексирования.
  • Добавлена поддержка кодировки KOI8-C (вариант KOI8-R с буквами старо-русского алфавита).
  • Добавлена команда FastHrefCheck. Используйте её для выключения проверки ссылок против списка серверов на этапе парсинга страницы.
  • Добавлена команда SubDocCnt. Используйте её для задания максимального числа индексируемых поддокументов для одного документа.
  • Добавлена команда SubDocLevel. Используйте её для задания максимального уровня вложенности поддокументов.
  • Исправлена обработка HrefSection в парсере XML.
  • Добавлена мета-переменная $(url.directory).
  • storedoc.cgi теперь принимает имя шаблона в CGI-параметре &tmplt=.
  • Поправлен HTTP-заголовок Accept: для случая указания шаблона Content-Type в команде MIME.
  • Исправлена ошибка в смешивании результатов поиска при использовании multi-dbaddr.
  • Добавлен оператор allin<section>: к языку поисковых запросов.
  • storedoc.cgi теперь если документ недоступен в базе stored получает его непосредственно с сервера.

С Новым Годом!