СИСТЕМА РАСПОЗНАВАНИЯ КЛЮЧЕВЫХ ФРАЗ В РЕЧИ НА ПРИМЕРЕ ТАДЖИКСКОГО ЯЗЫКА

Авторы

Худойбердиев Хуршед Атохоновичкандидат физико-математических наук, доцент, кафедра программирования и информационных технологий, Политехнический институт Таджикского технического университета имени академика М.С. Осими, г. Худжанд, Республика Таджикистан, tajlingvo@gmail.com
Дадобоев Акмал Анварджоновичдокторант PhD, Таджикский государсвенный университет права, бизнеса и политики, г. Худжанд, Республика Таджикистан, akmal_dadoboev@mail.ru
Солиева Мехрангез Толибовнадокторант PhD, Политехнический институт Таджикского технического университета имени академика М.С. Осими, г. Худжанд, Республика Таджикистан, smehrangez92@gmail.com

Аннотация

В представленном в данной статье исследовании анализируются результаты, полученные с использованием современных алгоритмов динамического программирования, применяемых для распознавания ключевых слов и фраз. Для моделирования фонем применяется скрытая марковская модель (СММ), являющаяся одним из ключевых компонентов процесса распознавания ключевых слов. Эта модель позволяет учитывать вероятностные характеристики фонем, что в итоге обеспечивает высокую точность распознавания ключевых фраз за счёт уточнения звуков и слов. Ключевые фразы представляются последовательностью звуковых элементов в виде транскрипции слогов. Результаты поиска ключевых фраз приведены на относительно небольшом наборе данных голосовых записей участников. Специальный алгоритм поиска ключевых фраз разработан для работы с последовательностями фонем речи, представленных в виде слогов. В контексте создания звукового корпуса таджикского языка предлагаемый алгоритм предполагается использовать для поиска фонетических признаков в больших объёмах речевых данных. Результатом статьи является система распознавания фраз и ключевых слов в речи на примере таджикского языка.

Ключевые слова

распознавание речи, фонемы речи, звуковой корпус, скрытая марковская модель, поиск ключевых фраз в речи, таджикский язык.

Дата публикации

2026-03-26