<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.3 20210610//EN" "JATS-journalpublishing1-3.dtd">
<article article-type="research-article" dtd-version="1.3" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xml:lang="ru"><front><journal-meta><journal-id journal-id-type="publisher-id">vrgup</journal-id><journal-title-group><journal-title xml:lang="ru">Вестник Ростовского государственного университета путей сообщения</journal-title><trans-title-group xml:lang="en"><trans-title>Vestnik Rostovskogo Gosudarstvennogo Universiteta Putej Soobshcheniya</trans-title></trans-title-group></journal-title-group><issn pub-type="ppub">0201-727X</issn><publisher><publisher-name>Ростовский государственный университет путей сообщения</publisher-name></publisher></journal-meta><article-meta><article-id pub-id-type="doi">10.46973/0201-727X_2023_1_175</article-id><article-id custom-type="elpub" pub-id-type="custom">vrgup-135</article-id><article-categories><subj-group subj-group-type="heading"><subject>Research Article</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="ru"><subject>ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ, АВТОМАТИКА И ТЕЛЕКОММУНИКАЦИИ</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="en"><subject>INFORMATION TECHNOLOGIES, AUTOMATION AND TELECOMMUNICATIONS</subject></subj-group></article-categories><title-group><article-title>Подход к классификации имен собственных для системы распознавания команд диспетчера</article-title><trans-title-group xml:lang="en"><trans-title>An approach to classifying proper names for the dispatcher command recognition system</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Сидоренко</surname><given-names>В. Г.</given-names></name><name name-style="western" xml:lang="en"><surname>Sidorenko</surname><given-names>V. G.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Сидоренко Валентина Геннадьевна, кафедра «Управление и защита информации», доктор технических наук, профессор </p></bio><bio xml:lang="en"><p>Sidorenko Valentina Gennadievna, Chair «Control and Information Security», Doctor of Engineering Sciences, Professor</p></bio><email xlink:type="simple">valenfalk@mail.ru</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Балакина</surname><given-names>Е. П.</given-names></name><name name-style="western" xml:lang="en"><surname>Balakina</surname><given-names>E. P.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Балакина Екатерина Петровна, кафедра «Управление и защита информации», кандидат технических наук, доцент </p></bio><bio xml:lang="en"><p>Balakina Ekaterina Petrovna, Chair «Control and Information Security», Candidate of Engineering Sciences, Associate Professor </p></bio><email xlink:type="simple">balakina_e@list.ru</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Логинова</surname><given-names>Л. Н.</given-names></name><name name-style="western" xml:lang="en"><surname>Loginova</surname><given-names>L. N.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Логинова Людмила Николаевна, кафедра «Управление и защита информации», кандидат технических наук, доцент</p></bio><bio xml:lang="en"><p>Loginova Lyudmila Nikolayevna, Chair «Control and Information Security», Candidate of Engineering Sciences, Associate Professor </p></bio><email xlink:type="simple">ludmilanv@mail.ru</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Кулагин</surname><given-names>М. А.</given-names></name><name name-style="western" xml:lang="en"><surname>Kulagin</surname><given-names>M. A.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Кулагин Максим Алексеевич, кафедра «Управление и защита информации», кандидат технических наук, доцент </p></bio><bio xml:lang="en"><p>Kulagin Maxim Alekseyevich, Chair «Control and Information Security», Candidate of Engineering Sciences, Associate Professor </p></bio><email xlink:type="simple">maksimkulagin06@yandex.ru</email><xref ref-type="aff" rid="aff-1"/></contrib></contrib-group><aff-alternatives id="aff-1"><aff xml:lang="ru"><institution>Российский университет транспорта (МИИТ)</institution></aff><aff xml:lang="en"><institution>Russian University of Transport (MIIT)</institution></aff></aff-alternatives><pub-date pub-type="collection"><year>2023</year></pub-date><pub-date pub-type="epub"><day>30</day><month>03</month><year>2023</year></pub-date><volume>0</volume><issue>1</issue><fpage>175</fpage><lpage>183</lpage><permissions><copyright-statement>Copyright &amp;#x00A9; Сидоренко В.Г., Балакина Е.П., Логинова Л.Н., Кулагин М.А., 2023</copyright-statement><copyright-year>2023</copyright-year><copyright-holder xml:lang="ru">Сидоренко В.Г., Балакина Е.П., Логинова Л.Н., Кулагин М.А.</copyright-holder><copyright-holder xml:lang="en">Sidorenko V.G., Balakina E.P., Loginova L.N., Kulagin M.A.</copyright-holder><license xml:lang="ru" license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple"><license-p>Данная работа распространяется под лицензией Creative Commons Attribution 4.0.</license-p></license><license xml:lang="en" license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple"><license-p>This work is licensed under a Creative Commons Attribution 4.0 License.</license-p></license></permissions><self-uri xlink:href="https://vestnik.rgups.ru/jour/article/view/135">https://vestnik.rgups.ru/jour/article/view/135</self-uri><abstract><p>В настоящее время распространение и актуализация использования систем машинного обучения открывают новые горизонты использования систем речевого распознавания во всех областях промышленности, в том числе в железнодорожном транспорте, где предъявляются особо повышенные требования к безопасности пассажиров. Авторами проведен обзор актуальных патентов существующих систем распознавания речи, выделены возможные связи между патентами. В работе также рассматривается возможное использование трансферного обучения для повышения производительности распознавания речи диктора. Исходя из анализа литературы, сформулирована цель исследований как разработка алгоритма распознавания команд устойчивого к шумам и независимого от диктора. В рамках данной статьи рассматривается решение задачи классификации имен собственных с использованием мел-частотных кепстральных коэффициентов и сверточной нейронной сети. Авторы приводят анализ результатов обучения нейронной сети на тестовой выборке для разного количества мел-частотных кепстральных коэффициентов.</p></abstract><trans-abstract xml:lang="en"><p>Currently, the spread and actualization of the use of machine learning systems are opening up new horizons for the use of speech recognition systems in all areas of industry, including railway transport, where particularly high requirements for passenger safety are imposed. The authors conducted a review of current patents of existing speech recognition systems, highlighted possible links between patents. The paper also discusses the possible use of transfer learning to improve the speaker's speech recognition performance. Based on the analysis of the literature, the research goal is formulated as the development of a noise-resistant and speaker-independent command recognition algorithm. Within the framework of this paper, the solution of the problem of classifying proper names using low-frequency kepstral coefficients and a convolutional neural network is considered. The authors present an analysis of the results of neural network training on a test sample for a different number of low-frequency kepstral coefficients.</p></trans-abstract><kwd-group xml:lang="ru"><kwd>распознавание речи</kwd><kwd>патент</kwd><kwd>машинное обучение</kwd><kwd>трансферное обучение</kwd><kwd>мел-частотные кепстральные коэффициенты</kwd><kwd>матрица ошибок</kwd></kwd-group><kwd-group xml:lang="en"><kwd>speech recognition</kwd><kwd>patent</kwd><kwd>machine learning</kwd><kwd>transfer learning</kwd><kwd>low-frequency kepstral coefficients</kwd><kwd>error matrix</kwd></kwd-group></article-meta></front><back><ref-list><title>References</title><ref id="cit1"><label>1</label><citation-alternatives><mixed-citation xml:lang="ru">Васильев, А. С. Анализ патентов как фактор исследования технического уровня развития техники на примере щековых дробилок / А. С. Васильев, Н. С. Крупко // Инженерный Вестник Дона. – 2016. – № 2. – URL: https://cyberleninka.ru/article/n/analizpatentov-kak-faktor-issledovaniya-tehnicheskogourovnya-razvitiya-tehniki-na-primere-schekovyhdrobilok (дата обращения: 27.05.2022).</mixed-citation><mixed-citation xml:lang="en">Vasiliev, A. S. Analysis of patents as a factor in the study of the technical level of development of technology on the example of jaw crushers / A. S. Vasiliev, N. S. Krupko // Engineering Bulletin of the Don. – 2016. – No. 2. – URL: https://cyberleninka.ru/article/n/analiz-patentov-kak-faktor-issledovaniya-tehnicheskogourovnya-razvitiya-tehniki-na-primere-schekovyh-drobilok (date of access: 05.27.2022).</mixed-citation></citation-alternatives></ref><ref id="cit2"><label>2</label><citation-alternatives><mixed-citation xml:lang="ru">Патент № 2216052C2 Российская Федерация, МПК G10L 15/22, G10L 15/02(2006.01), G10L 15/26. Автоматическое распознавание речи / Д. Меррил. – № 2001104348/09 ; заявл. 17.06.1999 ; опубл. 10.11.2003.</mixed-citation><mixed-citation xml:lang="en">Patent No. 2216052C2 Russian Federation, IPC G10L 15/22, G10L 15/02(2006.01), G10L 15/26. Automatic speech recognition / D. Merrill. – No. 2001104348/09 ; declaration 06.17.1999 ; publ. 11.10.2003.</mixed-citation></citation-alternatives></ref><ref id="cit3"><label>3</label><citation-alternatives><mixed-citation xml:lang="ru">Патент № WO2013002674A1 Международное бюро, МПК G10L 15/187 (2013.01), G10L 25/78 (2013.01). Система и способ распознавания речи / Д. А. Кочаров, А. Б. Хомяков. – Заявл. 12.05.2012 ; опубл. 03.01.2013, Бюл. № 1. – С. 35.</mixed-citation><mixed-citation xml:lang="en">Patent No. WO2013002674A1 International Bureau, IPC G10L 15/187 (2013.01), G10L 25/78 (2013.01). System and method of speech recognition / D. A. Kocharov, A. B. Khomyakov. – Declaration 12.05.2012 ; publ. 03.01.2013 ; Bull. No. 1. – P. 35.</mixed-citation></citation-alternatives></ref><ref id="cit4"><label>4</label><citation-alternatives><mixed-citation xml:lang="ru">Патент №2382399С2 Российская федерация, МПК G06F 17/28 (2006.01). Адаптивный машинный перевод / С. Д. Ричардсон, Р. Ф. Рашид. – № 2004118671/09 ; заявл. 18.06.2004 ; опубл. 20.02.2010, Бюл. № 5. – С. 36.</mixed-citation><mixed-citation xml:lang="en">Patent No. 2382399С2 Russian Federation, IPC G06F 17/28 (2006.01). Adaptive machine translation / S. D. Richardson, R. F. Rashid. – No. 2004118671/09 ; declaration 06.18.2004 ; publ. 02/20/2010, Bull. No. 5. – P. 36.</mixed-citation></citation-alternatives></ref><ref id="cit5"><label>5</label><citation-alternatives><mixed-citation xml:lang="ru">Патент №2628202С1 Российская федерация, МПК G06F 17/28 (2006.01). Адаптивный контекстно-тематический машинный перевод / М. М. Гольдреер. – № 2016113939; заявл. 11.04.2016; опубл. 15.08.2017, Бюл. № 23. – С. 13.</mixed-citation><mixed-citation xml:lang="en">Patent No. 2628202 C1 Russian Federation, IPC G06F 17/28 (2006.01). Adaptive contextthematic machine translation / M. M. Goldreer. – No. 2016113939 ; declaration 04.11.2016 ; publ. 08.15.2017, Bull. No. 23. – P. 13.</mixed-citation></citation-alternatives></ref><ref id="cit6"><label>6</label><citation-alternatives><mixed-citation xml:lang="ru">Патент № 2606566С2 Российская федерация, МПК G10L 15/08 (2006.01), G10L 15/00 (2013.01). Способ и устройство классификации сегментов зашумленной речи с использованием полиспектрального анализа / О. Н. Титов, А. А. Афанасьев, М. В. Илюшин. – № 2014154081 ; заявл. 29.12.2014 ; опубл. 20.07.2016, Бюл. № 1. – С. 3</mixed-citation><mixed-citation xml:lang="en">Patent No. 2606566С2 Russian Federation, IPC G10L 15/08 (2006.01), G10L 15/00 (2013.01). Method and device for classifying segments of noisy speech using polyspectral analysis / O. N. Titov, A. A. Afanasiev, M. V. Ilyushin. – No. 2014154081 ; declaration 12.29.2014 ; publ. 07.20.2016, Bull. No. 1. – P. 3.</mixed-citation></citation-alternatives></ref><ref id="cit7"><label>7</label><citation-alternatives><mixed-citation xml:lang="ru">Патент № 2698773С2 Российская федерация, МПК G10L 15/07 (2013.01), G10L 15/22 (2006.01), G10L 15/28 (2013.01). Устройство и способ распознавания речи / К. Арндт Хабил, У. Гуссен, Ф. Штефан. – № 2015118431 ; заявл. 18.05.2015 ; опубл. 10.12.2016, Бюл. № 34. – С. 2</mixed-citation><mixed-citation xml:lang="en">Patent No. 2698773С2 Russian Federation, IPC G10L 15/07 (2013.01), G10L 15/22 (2006.01), G10L 15/28 (2013.01). Device and method of speech recognition / K. Arndt Habil, W. Goossen, F. Stefan. – No. 2015118431 ; declaration May 18, 2015 ; publ. 12.10.2016, Bull. No. 34. – Р. 2.</mixed-citation></citation-alternatives></ref><ref id="cit8"><label>8</label><citation-alternatives><mixed-citation xml:lang="ru">Речевые технологии в обучении оперативного персонала городских рельсовых транспортных систем / Е. П. Балакина, М. А. Кулагин, В. Г. Сидоренко, Л. Н. Логинова // Качество. Инновации. Образование. – 2022. – № 3 (179). – С. 36–48. – DOI 10.31145/1999-513x-2022-3-36-48.</mixed-citation><mixed-citation xml:lang="en">Speech technologies in training operational personnel of urban rail transport systems / Balakina, E. P., Kulagin, M. A., Sidorenko, V. G., Loginova, L. N. // Quality. Innovation. Education. – 2022. – No. 3 (179). – P. 36–48. – DOI 10.31145/1999-513x-2022-3-36-48.</mixed-citation></citation-alternatives></ref><ref id="cit9"><label>9</label><citation-alternatives><mixed-citation xml:lang="ru">Chu, Chzhn. Technical description of multilingual and interlingual speech recognition / Chzhn Chu. – URL: https://www.21ic.com/article/828871.html (date of access: 07/29/2022).</mixed-citation><mixed-citation xml:lang="en">Chu, Chzhn. Technical description of multilingual and interlingual speech recognition / Chzhn Chu. – URL: https://www.21ic.com/article/828871.html (date of access: 07.29.2022).</mixed-citation></citation-alternatives></ref><ref id="cit10"><label>10</label><citation-alternatives><mixed-citation xml:lang="ru">Stanford Vision and Learning Lab. CS231n Convolutional Neural Networks for Visual Recognition. – URL: https://cs231n.github.io/transferlearning (date of access: 07.30.2022).</mixed-citation><mixed-citation xml:lang="en">Stanford Vision and Learning Lab. CS231n Convolutional Neural Networks for Visual Recognition. – URL: https://cs231n.github.io/transferlearning (date of access: 07.30.2022).</mixed-citation></citation-alternatives></ref><ref id="cit11"><label>11</label><citation-alternatives><mixed-citation xml:lang="ru">Обеспечение безопасности применения речевых технологий в работе оперативного персонала городских рельсовых транспортных систем / Е. П. Балакина, М. А. Кулагин, Л. Н. Логинова, В. Г. Сидоренко // Проблемы управления безопасностью сложных систем : Материалы XXIX международной научно-практической конференции, Москва, 15 декабря 2021 года. – Москва : Институт проблем управления им. В. А. Трапезникова РАН, 2021. – С. 355–361. – DOI 10.25728/iccss.2021.94.35.056.</mixed-citation><mixed-citation xml:lang="en">Security of the use of speech technologies in the work of operational personnel of urban rail transport systems / E. P. Balakina, M. A. Kulagin, L. N. Loginova, V. G. Sidorenko // Problems of managing the safety of complex systems: Proceedings of the XXIX International Scientific and practical conference, Moscow, December 15, 2021. – Moscow : Institute of Management Problems. V. A. Trapeznikova RAN, 2021. – P. 355– 361. – DOI 10.25728/iccss.2021.94.35.056.</mixed-citation></citation-alternatives></ref><ref id="cit12"><label>12</label><citation-alternatives><mixed-citation xml:lang="ru">Иванов, И. И. Анализ метода мел-частотных кепстральных коэффициентов применительно к процедуре голосовой аутентификации // Актуальные проблемы гуманитарных и естественных наук. – 2015. – № 10-1. – URL: https://cyberleninka.ru/article/n/analizmetoda-mel-chastotnyh-kepstralnyh-koeffitsientovprimenitelno-k-protsedure-golosovoy-autentifikatsii (дата обращения: 06.02.2023).</mixed-citation><mixed-citation xml:lang="en">Ivanov, I. I. Analysis of the method of chalkfrequency cepstral coefficients in relation to the procedure of voice authentication // Actual problems of the humanities and natural sciences. – 2015. – No. 10-1. – URL: https://cyberleninka.ru/article/n/analiz-metoda-melchastotnyh-kepstralnyh-koeffitsientov-primenitelno-k-protsedure-golosovoy-autentifikatsii (date of access: 02.06.2023).</mixed-citation></citation-alternatives></ref><ref id="cit13"><label>13</label><citation-alternatives><mixed-citation xml:lang="ru">Mitchell, T. Machine Learning / T. Mitchell. – Redmond : McGraw-Hill Science/Engineering/Math, 1997. – 432 p. – ISBN 0070428077.</mixed-citation><mixed-citation xml:lang="en">Mitchell, T. Machine Learning / T. Mitchell. – Redmond: McGraw-Hill Science/Engineering/Math, 1997. – 432 p. – ISBN 0070428077.</mixed-citation></citation-alternatives></ref></ref-list><fn-group><fn fn-type="conflict"><p>The authors declare that there are no conflicts of interest present.</p></fn></fn-group></back></article>
