«Яндекс» запустил приложение «Диктовка», чтобы продемонстрировать свои новые разработки в области речевых технологий. Приложение-витрина слушает пользователя и преобразовывает его речь в текст в режиме реального времени. Для запуска голосового ввода необходимо произнести активационную команду «Яндекс, записывай». Получившийся текст можно «расшарить» в социальных сетях, отправить по электронной почте или сохранить как заметку.
Текст можно отредактировать с помощью голосовых команд, например, «Удали последнее слово», «Начни с новой строки», «Добавь весёлый смайлик». Впрочем, список команд не ограничен, поскольку приложение понимает смысл произносимого. «Диктовка» также ориентируется на паузы в речи и расставляет знаки препинания. Чтобы прослушать текст, достаточно сказать «Прочитай всё». Если приложение неверно распознало то или иное слово, пригодится функция «Корректор».
«Диктовка» объединила все новые возможности комплекса SpeechKit. Это такие дополнения, как голосовая активация, выделение смысловых объектов из текста и синтез речи. Теперь система умеет включаться по голосовой команде, понимает смысл слов, а также отвечает пользователю. Смысловыми объектами могут быть дата и время, имена и фамилии или адреса.
Все три функции доступны в библиотеке SpeechKit Mobile SDK и на облачной платформе SpeechKit Cloud. За счет них сторонние разработчики могут расширить возможности своих продуктов: мобильных приложений, игр, компьютерных программ, корпоративных сервисов.
Технология распознавания речи создана «Яндексом» в 2013 году. Она понимает запросы на русском и турецком языках. Сейчас её используют 500 мобильных приложений, а также сервисы и устройства 600 различных компаний. Качество распознавания для географических названий составляет 95%, для коротких фраз — 88%, для текстов вроде заметок и SMS — 82%.