СоНоты

OOmnik

Открытый лингвистический интерпретатор русского языка, OOmnik -- проект по созданию лингвистического интерпретатора русского языка под свободной лицензией GPL. Выполняется сотрудниками Лаборатории информационных лингвистических технологий ИЛИ РАН.

Проект начат в июле 2005 года и расчитан на десять лет. Но уже в данный момент опубликованы некоторые предварительные материалы, в частности в разделе "Технологии": набросок синтаксического формализма для глубокого разбора предложения, черновик модуля токенизации для разделения символьного потока на лексемы с учетом разных типов данных и начальная версия списка корней русского языка (содержит около 17 тысяч корней).