Перейти к содержимому

11

Я уже публиковал несколько модификаций для некоторых функций из libc, оптимизированных для быстрой работы на современных процессорах (см. категорию Algorithms and Technologies).

Все эти функции были реализованы в поисковом движке DataparkSearch Engine. Поскольку производительность этих функций, особенно в сравнении со стандартной реализацией на конкретной платформе, зависит от используемых микропроцессора и уровня оптимизации компилятора, я добавил специальную процедуру тестирования на этапе конфигурирования DataparkSearch, выбирающую только те новые варианты функций, которые исполняются быстрее на платформе, где производится установка. Это позволяет получить максимальную производительность DataparkSearch на каждой платформе.
...читать далее "Небольшое ускорение"

Порт FreeBSD www/dpsearch обновлен до последней выпущенной версии DataparkSearch Engine, 4.53.

131

Выпущена новая версия, 4.53, DataparkSearch Engine. Основные отличия от предыдущей версии:
...читать далее "DataparkSearch 4.53"

За год показатель в тесте навигационного поиска изменился с 85.141% на 31 декабря 2009 до 83.516% на 31 декабря 2009. За тоже время средняя позиция сайтов-маркеров сократилась с 2.3491 до 1.9918. Однако, максимальный показатель 87.476% был достигнут 20 апреля 2009, а минимальная средняя позиция 1.7824 - 8 октября 2009.

В тематическом поиске на 31 декабря 2009 поисковик Вершки Рунета находил 26.483% сайтов маркеров, 384 из 1450 (год назад было 16.143%). Максимальный же показатель, 30.514%, 433 из 1419, был достигнут 8 ноября 2009.

6

Изменения в снапшоте dpsearch-4.53-24122009 относительно снапшота dpsearch-4.53-12092009:
...читать далее "dpsearch-4.53-24122009"

21

Создал sitemap для сайта Интернет Сочи (при помощи новой фичи DataparkSearch Engine, -Esitemap).

Созданный sitemap был засабмичен в консоли вебмастеров обои поисковиков практически одновременно (сначала в "Яндекс", и тут же в Google). Google обработал новый sitemap в течении 5 минут, "Яндекс" до сих пор его не обработал.
...читать далее "Sitemap: Yandex vs Google"

7

В новом снапшоте dpsearch-4.53-12092009 добавлена команда SectionSQL.

SectionSQL <name> <num> <maxlength> [strict] <SQLtemplate> [<DBAddr>]


...читать далее "dpsearch-4.53-12092009"

2

В последнем снапшоте поискового движка DataparkSearch, для поисковых шаблонов добавлен новый логический оператор <!IFREGEX, позволяющий как проверять перед выводом значение какой-либо мета-переменной на соответствие регулярному шаблону, так и модифицировать значение этой переменной перед выводом на основе этого шаблона.

Например, при поиске в базе телефонных номеров на сайте sochi.org.ru телефонные номера из канонической записи +78622xxxxxx переводятся в более привычную локальную запись xx-xx-xx, а остальные номера из канонической записи +7xxxyyyzzzzzz в более наглядный вид +7-xxx-yyy-zz-zz-zz при помощи такой конструкции в поисковом шаблоне:


<!IFREGEX NAME="tel" CONTENT="\+78622([0-9][0-9])([0-9][0-9])([0-9][0-9])(.*)">$1-$2-$3$4
<!EREGEX NAME="tel" CONTENT="\+7([0-9][0-9][0-9])([0-9][0-9][0-9])([0-9][0-9])([0-9][0-9])(.*)">+7-$1-$2-$3-$4$5
<!ELSE>$&(tel)<!ENDIF>

Последнем снапшоте DataparkSearch добавлена поддержка библиотеки libextractor.

При помощи этой бибилиотеки DataparkSearch может индексировать ключевые слова из файлов следующих форматов: PDF, PS, OLE2 (DOC, XLS, PPT), OpenOffice (sxw), StarOffice (sdw), DVI, MAN, FLAC, MP3 (ID3v1 and ID3v2), NSF(E) (NES music), SID (C64 music), OGG, WAV, EXIV2, JPEG, GIF, PNG, TIFF, DEB, RPM, TAR(.GZ), ZIP, ELF, S3M (Scream Tracker 3), XM (eXtended Module), IT (Impulse Tracker), FLV, REAL, RIFF (AVI), MPEG, QT and ASF.

Ниже приводится соответствие между типами keyword в libextractor и именами секций DataparkSearch:
...читать далее "dpsearch-4.53-14072009"