Архитектура Microsoft Windows для разработчиков


Занятие 6. Microsoft Speech API

(Продолжительность занятия 5 минут)

Microsoft Speech API (SAPI) позволяет создавать Win32-приложения с поддержкой технологии распознавания речи и преобразования текста в речь. SAPI доступен разработчикам на Visual Basic, C/C++ или любом другом языке программирования, который способен обращаться к объектам OLE напрямую или посредством автоматизации. Использование SAPI требует наличия на компьютере операционной системы Windows 95 или Windows NT, а также систем речевой поддержки сторонних производителей, включая систему распознавания речи и преобразования текста в речь. Это занятие посвящено роли SAPI в предоставлении приложениям возможностей преобразования текста в речь и распознавания речи.

 
Изучив материал этого занятия, Вы сможете:

  • перечислить основные компоненты Microsoft Speech API.

Преобразование текста в речь

Система преобразования текста в речь синтезирует речевое представление текстов в формате ANSI или Unicode. Это позволяет Windows-приложениям говорить с пользователем. Речевое представление текста:

  • сообщает информацию в любое время;
  • облегчает работу слепым и плохо видящим пользователям;
  • озвучивает события.

Распознавание речи

Функция распознавания речи позволяет общаться с компьютером голосом, а не посредством клавиатуры и мыши. Она также способна ускорить интерактивный процесс. Например, сказать «Да», «Нет», «Отменить» или «Послать письмо начальнику», как правило, быстрее и проще, чем выбирать нужные команды мышью.

Независимость речевых систем

SAPI позволяет создавать приложения, не заботясь о том, какая речевая система будет установлена на компьютере пользователя. Распространяемые сейчас речевые системы совместимы со всеми речевыми приложениями именно благодаря SAPI. А значит, пользователи не ограничены в выборе речевых систем и могут остановиться на той, которая более всего отвечает их нуждам. Точно так же интерфейс графических устройств позволяет программам работать с рисунками, не зная о том, какие графическая плата или монитор установлены на компьютере пользователя.

Резюме

Microsoft Speech API (SAPI) позволяет приложениям использовать технологии преобразования текста в речь и распознавания речи, обеспечивая при этом независимость от речевых систем. Система преобразования текста в речь может информировать пользователей в звуковой форме. Распознавание речи позволяет отдавать компьютеру голосом команды, например, об открытии и закрытии документов или об отправке электронных сообщений.