Перейти к содержимому

7

В процессе решения задачи быстрого подсчета частот совместных появлений слов в тексте создал интересную структуру данных, которая также позволяет вычислять частоты появления первого слова проверяемой пары, а также эта структура строит префиксное дерево, которое может быть использовано в последующем анализе текста.

Исходный код доступен на GitHub: github.com/Maxime2/cooccurrences

Когда вы выполните команду make, вы должны увидеть такой вывод:


cc -O3 -funsigned-char cooccur.c -o cooccur -lm

Example 1
./cooccur a.txt 2 < a.in | tee a.out

Checking pair d e
Count:3  cocount:3
Relative frequency: 1.00

Checking pair a b
Count:3  cocount:1
Relative frequency: 0.33


Example 2
./cooccur b.txt 3 < b.in | tee b.out

Checking pair a penny
Count:3  cocount:3
Relative frequency: 1.00

Checking pair penny earned
Count:4  cocount:1
Relative frequency: 0.25

Программа cooccur принимает два аргумента: имя файла для обработки и размер окна слов, в котором считаются частоты совместного появления. После обработки текста и заполнения этой структуры данных, программа считывает пары слов со стандартного файла ввода, по одной паре на строку, и подсчитывает частоту появления первого слова пары в текста и частоту совместного появления в тексте указанной пары слов в пределах заданного окна. Если второе слово встречается более одного раза в окне, только первое появление учитывается.

Примеры взяты отсюда:

5

Если при обновлении WordPress до версии 3.1 вы столкнулись с таким сообщением об ошибке:


Fatal error: Call to a member function query() on a non-object in /home/<...>/wp-content/db.php on line 4

...читать далее "Траблы при обновлении WordPress"

7

Web Optimizer начиная с версии 0.6.3 работает с WordPress сразу после установки без каких-либо допиливаний.

Даже в бесплатной конфигурации, не включающей все возможности оптимизации и ускорения, блог на WordPress ускоряется заметно на глаз.

Кроме WordPress также поддерживаются Joomla! и Drupal, но работоспособность этих версий я не проверял.

15

Поисковик Answers.com и сервис блогов WordPress заключили партнерское соглашение, по которому все пользователи блоговой платформы WordPress получат инструмент для связывания слов со статей своего блога ссылками на соответсвующие определения и описания в Answers.com.

Пользователи движка WordPress получат аналогичный сервис в виде плагина к этому движку.

Для реализации этой фичи, среди иконок меню создания и редактирования статьи в WordPress появится новая иконка, по которой будет запускаться приложение, автоматически предлагающая ключевые слова для такого связывания. Типичными словами, предлагаемыми к такому связыванию являются имена, технические термини и другие специальные слова, значение которых может быть непонятно давольно-таки широкому кругу читателей. Но само связывание будет проводиться только для тех слов, которые выберет автор статьи в WordPress.

//AltSearchEngines

Забавно, примерно уже год, а то и более, я на этом блоге использую аналогичный плагин WPKeys, связывающий такие ключевые слова с другими заметками блога, а также свою модификацию этого плагина для связывания слов с ответами поисковой машины Вершки Рунета. Удивительно, что так долго не появлялись аналогичные плагины для топовых поисковиков, фича же полезная. Да и поисковикам принесла бы больше поисковых запросов и посетителей. Куда эти Яндексы, Рамблеры и Гуглы с Вебальтами смотрять...

3

DPKeys -- плагин для WordPress аналогичный плагину WPKeys, только ключевые слова используются для создания ссылок на результаты поиска поисковика чей префикс URL запроса задан в макро DPURLPREFIX macro (см. в код dpkeys.php).

8

Оригинальный метод привлечения внимания к рекламе AdSense придумала JenSense: рядом с блоком рекламы располагаются абстрактные пиктограммы:

Эта идея также реализована в виде плагина к WordPress под названием Adsense Beautifier. В принципе, если пиктограммы не призывают кликать на рекламу, то такой метод не противоречит Правилам участия в программе AdSense.

Самое индересное, похожий метод используется и самим Google (см. Гибридная реклама в Google AdSense).

//Search Engine Roundtable

27

Начав поближе разбираться с WordPress'ом сразу столкнулся с необходимостью руссификации его тем. Применение решения "в лоб" связанное с прямым переводом отображаемых слов в исходниках мне как-то не импонирует. А столкнувшись с приятной возможностью локализации в теме Binary Blue я понял, что это то что надо. Немного поигравшись с новыми возможностями, я перешёл к другой теме и попробовал таким же образом руссифицировать и её. Не тут-то было!

...читать далее "Руссификация тем WordPress’а"