Многие из умных гаджетов, которыми мы ежедневно пользуемся, поддерживают технологию распознавания речи. С помощью голоса мы ищем информацию, покупаем товары, управляем другими устройствами
В настоящее время существуют многочисленные технические средства, могущие воспринимать (распознавать) произносимые речевые сообщения: компьютеры, медицинское электронное оборудование, автомобили, мобильные телефоны и др. Что такое распознавание речи? На первый взгляд, все кажется очень просто: человек произносит слово (фразу), а техническая система адекватно реагирует на него: либо выполняет команду, содержащуюся в слове (фразе), либо набирает диктуемый текст, либо как-то иначе «распоряжается» извлеченной из фразы информацией.
Бурное развитие распознавания речи с помощью персонального компьютера (ПК) началось с 1993 г. Две ключевых задачи распознавания речи – достижение 100 % распознавания на ограниченном наборе команд хотя бы для одного диктора и независимое от диктора распознавание непрерывного речевого потока в реальном масштабе времени произвольного языка с приемлемым качеством – до сих пор не решены, несмотря на многочисленные попытки решения этих задач в течение последних 50-ти лет. Современные системы распознавания речи уже дают возможность пользователям диктовать слова (фразы) в обычной разговорной манере. Однако процесс непрерывного распознавания речи, дающий до 95 % качества распознавания при оптимальных условиях, все-таки дает на 100 знаков 5 ошибок. Около 200 ошибок на странице формата A4 – слишком много для профессиональной работы.
1.Технологии распознавания речи. 3
1.1 История создания и развития технологий. 3
1.2 Развитие систем распознавания голоса. 5
1.3 Этапы развития систем распознавания речи. 6
1.5 Технология распознавания в повседневной жизни. 9
1.6 Качество систем распознавания голоса. 9
1.7 Применение нейронных сетей. 10
2. Мировые игроки рынка технологий. 11
1. Барский А. Б. Нейронные сети: распознавание, управление, принятие решений. М.: Финансы и статистика, 2017.
2. Белоруцкий Р.Ю., Житник С.В. РАСПОЗНАВАНИЕ РЕЧИ НА ОСНОВЕ СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ. Вопросы радиоэлектроники. 2019;(4):47-52. https://doi.org/10.21778/2218-5453-2019-4-47-52
3. Д.А. Гефке, П.М. Зацепин, Применение скрытых марковских моделей для распознавания звуковых последовательностей // Известия 133 Алтайского государственного университета. – Вып. 1(73), т. 2. – Барнаул: Известия АГУ, 2012. –
4. Методы автоматического распознавания речи: В 2-х книгах. Пер. с англ./Под ред. У. Ли. – М.: Мир, 1983. – Кн. 1.
5. Огнев И.В., Огнев А.И., Парамонов П.А., Классификация речевых образов на основе анализа распределений их локальных экстремумов // 131 труды XXI международной научно-технической конференции "Информационные средства и технологии". - М.: МЭИ, 2013