Машинная графика - Учебное пособие (П.В.Вельтмандер)

0.13.2  речевой диалог

В общем случае система речевого диалога осуществляет распознавание, смысловую интерпретацию и синтез речевых сигналов и обеспечивает устный диалог человека с ЭВМ либо на формализованных, либо на усеченных естественных языках. В такого сорта системах можно выделить две основные компоненты - средства распознавания речи и средства синтеза речи.

Для надежного распознавания как отдельно произносимых слов так и слитной речи в реальном масштабе времени требуется производительность порядка 10 млн оп/с.

Появились коммерческие системы речевого ввода, распознающие порядка 1000 слов. Слова определяются как отдельные высказывания, отделенные достаточно длительными промежутками от других слов во фразе. Для целей диалога распознаватели речи используются в составе вспомогательных средств подачи отдельных простых команд. На графических рабочих местах такие системы могут освобождать пользователя от необходимости задания команд с помощью клавиатуры или меню, например, при вводе графической информации с помощью планшетов, когда подача команд с помощью обычных средств диалога нарушает так называемую тактильную непрерывность диалога.

Синтез речи обычно производится по формантному методу. Сначала текст переводится в последовательность фонем, затем по ней рассчитывается динамика управления формантным синтезатором, который генерирует и выдает сообщение.