Подход к классификации имен собственных для системы распознавания команд диспетчера
https://doi.org/10.46973/0201-727X_2023_1_175
Аннотация
В настоящее время распространение и актуализация использования систем машинного обучения открывают новые горизонты использования систем речевого распознавания во всех областях промышленности, в том числе в железнодорожном транспорте, где предъявляются особо повышенные требования к безопасности пассажиров. Авторами проведен обзор актуальных патентов существующих систем распознавания речи, выделены возможные связи между патентами. В работе также рассматривается возможное использование трансферного обучения для повышения производительности распознавания речи диктора. Исходя из анализа литературы, сформулирована цель исследований как разработка алгоритма распознавания команд устойчивого к шумам и независимого от диктора. В рамках данной статьи рассматривается решение задачи классификации имен собственных с использованием мел-частотных кепстральных коэффициентов и сверточной нейронной сети. Авторы приводят анализ результатов обучения нейронной сети на тестовой выборке для разного количества мел-частотных кепстральных коэффициентов.
Об авторах
В. Г. СидоренкоРоссия
Сидоренко Валентина Геннадьевна, кафедра «Управление и защита информации», доктор технических наук, профессор
Е. П. Балакина
Россия
Балакина Екатерина Петровна, кафедра «Управление и защита информации», кандидат технических наук, доцент
Л. Н. Логинова
Россия
Логинова Людмила Николаевна, кафедра «Управление и защита информации», кандидат технических наук, доцент
М. А. Кулагин
Россия
Кулагин Максим Алексеевич, кафедра «Управление и защита информации», кандидат технических наук, доцент
Список литературы
1. Васильев, А. С. Анализ патентов как фактор исследования технического уровня развития техники на примере щековых дробилок / А. С. Васильев, Н. С. Крупко // Инженерный Вестник Дона. – 2016. – № 2. – URL: https://cyberleninka.ru/article/n/analizpatentov-kak-faktor-issledovaniya-tehnicheskogourovnya-razvitiya-tehniki-na-primere-schekovyhdrobilok (дата обращения: 27.05.2022).
2. Патент № 2216052C2 Российская Федерация, МПК G10L 15/22, G10L 15/02(2006.01), G10L 15/26. Автоматическое распознавание речи / Д. Меррил. – № 2001104348/09 ; заявл. 17.06.1999 ; опубл. 10.11.2003.
3. Патент № WO2013002674A1 Международное бюро, МПК G10L 15/187 (2013.01), G10L 25/78 (2013.01). Система и способ распознавания речи / Д. А. Кочаров, А. Б. Хомяков. – Заявл. 12.05.2012 ; опубл. 03.01.2013, Бюл. № 1. – С. 35.
4. Патент №2382399С2 Российская федерация, МПК G06F 17/28 (2006.01). Адаптивный машинный перевод / С. Д. Ричардсон, Р. Ф. Рашид. – № 2004118671/09 ; заявл. 18.06.2004 ; опубл. 20.02.2010, Бюл. № 5. – С. 36.
5. Патент №2628202С1 Российская федерация, МПК G06F 17/28 (2006.01). Адаптивный контекстно-тематический машинный перевод / М. М. Гольдреер. – № 2016113939; заявл. 11.04.2016; опубл. 15.08.2017, Бюл. № 23. – С. 13.
6. Патент № 2606566С2 Российская федерация, МПК G10L 15/08 (2006.01), G10L 15/00 (2013.01). Способ и устройство классификации сегментов зашумленной речи с использованием полиспектрального анализа / О. Н. Титов, А. А. Афанасьев, М. В. Илюшин. – № 2014154081 ; заявл. 29.12.2014 ; опубл. 20.07.2016, Бюл. № 1. – С. 3
7. Патент № 2698773С2 Российская федерация, МПК G10L 15/07 (2013.01), G10L 15/22 (2006.01), G10L 15/28 (2013.01). Устройство и способ распознавания речи / К. Арндт Хабил, У. Гуссен, Ф. Штефан. – № 2015118431 ; заявл. 18.05.2015 ; опубл. 10.12.2016, Бюл. № 34. – С. 2
8. Речевые технологии в обучении оперативного персонала городских рельсовых транспортных систем / Е. П. Балакина, М. А. Кулагин, В. Г. Сидоренко, Л. Н. Логинова // Качество. Инновации. Образование. – 2022. – № 3 (179). – С. 36–48. – DOI 10.31145/1999-513x-2022-3-36-48.
9. Chu, Chzhn. Technical description of multilingual and interlingual speech recognition / Chzhn Chu. – URL: https://www.21ic.com/article/828871.html (date of access: 07/29/2022).
10. Stanford Vision and Learning Lab. CS231n Convolutional Neural Networks for Visual Recognition. – URL: https://cs231n.github.io/transferlearning (date of access: 07.30.2022).
11. Обеспечение безопасности применения речевых технологий в работе оперативного персонала городских рельсовых транспортных систем / Е. П. Балакина, М. А. Кулагин, Л. Н. Логинова, В. Г. Сидоренко // Проблемы управления безопасностью сложных систем : Материалы XXIX международной научно-практической конференции, Москва, 15 декабря 2021 года. – Москва : Институт проблем управления им. В. А. Трапезникова РАН, 2021. – С. 355–361. – DOI 10.25728/iccss.2021.94.35.056.
12. Иванов, И. И. Анализ метода мел-частотных кепстральных коэффициентов применительно к процедуре голосовой аутентификации // Актуальные проблемы гуманитарных и естественных наук. – 2015. – № 10-1. – URL: https://cyberleninka.ru/article/n/analizmetoda-mel-chastotnyh-kepstralnyh-koeffitsientovprimenitelno-k-protsedure-golosovoy-autentifikatsii (дата обращения: 06.02.2023).
13. Mitchell, T. Machine Learning / T. Mitchell. – Redmond : McGraw-Hill Science/Engineering/Math, 1997. – 432 p. – ISBN 0070428077.
Рецензия
Для цитирования:
Сидоренко В.Г., Балакина Е.П., Логинова Л.Н., Кулагин М.А. Подход к классификации имен собственных для системы распознавания команд диспетчера. Вестник Ростовского государственного университета путей сообщения. 2023;(1):175-183. https://doi.org/10.46973/0201-727X_2023_1_175
For citation:
Sidorenko V.G., Balakina E.P., Loginova L.N., Kulagin M.A. An approach to classifying proper names for the dispatcher command recognition system. Vestnik Rostovskogo Gosudarstvennogo Universiteta Putej Soobshcheniya. 2023;(1):175-183. (In Russ.) https://doi.org/10.46973/0201-727X_2023_1_175
JATS XML