3

Выпущен новый снапшот DataparkSearch Engine. Он доступен на Google Drive или on GitHub.

Изменения от предыдущего снапшота:

  • добавлено задание таймаута чтения для сокета на основе значения таймаута чтения документа
  • добавлена поддержка библиотек wolfssl и mbedtls
  • добавлено отслеживание таймаутов для https
  • убрана поправка на вес сервера перед записью URL PopRank в данные об URL
  • исправлена компиляция без openssl
  • улучшено определение OpenSSL
  • добавлен ключ --enable-mcmodel для configure
  • исправлены флаги компиляции свободной от нитей версии libdpsearch в случае сборки без модуля Apache
  • переход на CRYPTO_THREADID для OpenSSL 1.0.0 и выше
  • небольшие исправления и обновления

2

Выпущен новый снапшот DataparkSearch Engine. Он доступен на Google Drive или on GitHub.

Изменения от предыдущего снапшота:

  • Исправлена схема SQL для MySQL5
  • Исправлено падение при обработке ссылок без указанной схемы
  • Новое определение версии Apache
  • Исправлено построение crossword секции
  • HTML тэги p, option и input теперь могут быть секциями
  • Более тонкая спячька для нитей при невозможности залочить мютекс
  • Исправлена компиляция на FreeBSD 10
  • Добавлена команда Robots collect
  • Исправлено падение при задании лимита dt:minute
  • Выключена обработка карт-сайтов для Server/Realm/Subnet с указанным аттрибутом nofollow
  • Ряд незначительных исправлений

Я планирую прекратить поддержку Apache 1.3 в будущем, дайте мне знать, если вы все еще его используете.

1

Выпущен новый снапшот DataparkSearch Engine версии 4.54. Вы можете скачать его с Google Drive.

Ниже дан список изменений с момента выпуска предыдущего снапшота:

  • Секция Crossword теперб включает значения аттрибута TITLE тэга IMG и значения атрибутов ALT и TITLE тэгов A и LINK, найденных на страницах, ссылающихся на индексируемый документ
  • Мета PROPERTY теперь индексируется
  • Мета-информация об URL теперь сохраняется для всех документов с HTTP статус-кодом < 400
  • configure скрипт теперь понимает ключ --without-libextractor, позволяющий собрать dpsearch без поддержки libextractor даже если эта библиотека установлена
  • Включена поддержка robots.txt для сайтов, индексируемых с использованием HTTPS
  • Добавлена команда AuthPing, позволяющая посылать авторизационные запросы перед началом индексирования сайта. См. детали ниже.
  • Добавлена команда Cookie
  • Добавлена поддержка SOCKS5 прокси серверов без авторизации или с использованием авторизации по логину и паролю. См. детали ниже.
  • небольшие исправления

...читать далее "dpsearch-4.54-2015-07-06"

1

Если у вас сайт на попечении, сделайте его пригодным для мобильных. Для этого в большинстве случаев достаточно додавить в head такую мету:


<meta name="viewport" content="width=device-width, initial-scale=1">

И Гугол вас не забудет - намек, что он учитывает дружественность к мобильным при ранжировании.

Проверить дружественность вашего сайта к мобильным устройствам можно здесь: //www.google.com.au/webmasters/tools/mobile-friendly/.

3

Доступен новый снапшот DataparkSearch Engine: dpsearch-4.54-2013-12-31.

Основные отличия от предыдущего снапшота:

  • улучшено определение кодировки/языка в случае когда они указаны либо только в мета, либо только в заголовках ответа сервера
  • исправлено зацикливание а случае, когда значение htdblimit не задано в файле конфигурации
  • Исправлено возможное падение при неиспользовании расширений aspell
  • Добаылены команды AllowIf/DisallowIf
  • исправлено автоматическое построение IDN-шаблона для команды 'Server page'
  • дабавлена записть данных об URL для страниц переадресации в случае включенной поддержки поддокументов
  • Восстановлена работа функции зеркалирования проиндексированных сайтов
  • Добавлено добавление значения атрибута alt тэга img в секцию кросс-слов crossword для изобращения, на которое указывает этот тэг

Соответствующие пэкаджи в формате Ubuntu/Debian и RPM доступны во вкладке Download на Google Code.

11

Доступен новый снапшот DataparkSearch Engine 4.54 доступен для скачивания: dpsearch-4.54-2013-11-07.tar.bz2 на Google Code.

Изменения в этом снапшоте по сравнению с предыдущим:

  • Для поисковых шаблонов добавлена секция BETWEENRES
  • В ответ по интерфейсу RESTfull добавлены HTTP статус и заголовки
  • Улучшена производительность при расчете Neo PopRank при большом числе ссылок
  • GuesserUseMeta теперь включен по умолчанию
  • Исправлена проверка наличия aspell; добавлена проверка на наличие qsort_r; проверка на наличие и тип gethostbyname_r сменена на стандартную GNU проверку
  • Исправлено падение при обработке sitemap
  • Для ссылок добавлена проверка попадают ли они под команду Server с атрибутом nofollow

Соответствующие пэкаджи в формате Ubuntu/Debian и RPM доступны во вкладке Download на Google Code.

2

Я создал git-репозиторий для DataparkSearch на Github.com: github.com/Maxime2/dataparksearch.

SVN-репозиторий на Google Code будет продолжать поддерживаться и оба репозитория будет получать текущие обновления проекта.

На работе появилась новая "игрушка" - видеотелефон Yealink VP-2009P

...читать далее "Video IP Phone"

20

Поисковой машиной Интернет Сочи обнаружено 449695 страниц с контекстной рекламой на 500 сочинских сайтах (в среднем чуть менее 900 страниц с контекстной рекламой на одном сайте).

В таблице ниже приводятся доли систем контекстной рекламы "Бегун", AdSense и "Директ" на этих страницах:
...читать далее "Доли площадок контекстной рекламы, 2011"

Попалась тут к переводу статейка про бетонные оболочки (из австралийского журнала, для точности). Вот эта фраза - некий тест на способности автоматических переводчиков.

This nothingness belies the considerable parametric computer modeling that went into the shell construction.

...читать далее "Состояние перевода"