СоНоты

Математические лепты

Распознавая речь. Современные системы распознавания речи достаточно хороши в не-диалоговых приложениях, таких как диктовка или запросы к различным справочникам. Подобные приложения возможно не столь впечатляющи, но из-за акцента, различных интонаций и пауз, даже такие простые приложения требуют давольно сложного аппарата для аккуратного перевода звуковых колебаний в слова. Одним из таких наиболее часто используемых методов является неявная марковская модель (hidden Markov model), использующая условные вероятности, обучаемая на тестовых звуках для нахождения лучшего варианта для заданного ввода.

Диктовка компьютеру, являющейся в данный момент роскошью, возможно в скором времени станет обычным и необходимым интерфейсом, по мере уменьшения устройств ввода. Исследователи продолжают искать мовые математические модели и алгоритмы (которые возможно будут использовать математическую статистику и машинное обучение), способные отфильтровывать шум, распознавать различный слэнг и подстраиваться под кажого говорящего. Это давольно-таки трудные задачи, но будучи решёнными, позволят речевому интерфейсу быстро вытеснить клавиатуру, мышь и всевозможные пульты управления.