СИСТЕМА РАСПОЗНАВАНИЯ КЛЮЧЕВЫХ ФРАЗ В РЕЧИ НА ПРИМЕРЕ ТАДЖИКСКОГО ЯЗЫКА
Авторы
Аннотация
В представленном в данной статье исследовании анализируются результаты, полученные с использованием современных алгоритмов динамического программирования, применяемых для распознавания ключевых слов и фраз. Для моделирования фонем применяется скрытая марковская модель (СММ), являющаяся одним из ключевых компонентов процесса распознавания ключевых слов. Эта модель позволяет учитывать вероятностные характеристики фонем, что в итоге обеспечивает высокую точность распознавания ключевых фраз за счёт уточнения звуков и слов. Ключевые фразы представляются последовательностью звуковых элементов в виде транскрипции слогов. Результаты поиска ключевых фраз приведены на относительно небольшом наборе данных голосовых записей участников. Специальный алгоритм поиска ключевых фраз разработан для работы с последовательностями фонем речи, представленных в виде слогов. В контексте создания звукового корпуса таджикского языка предлагаемый алгоритм предполагается использовать для поиска фонетических признаков в больших объёмах речевых данных. Результатом статьи является система распознавания фраз и ключевых слов в речи на примере таджикского языка.
Ключевые слова
распознавание речи, фонемы речи, звуковой корпус, скрытая марковская модель, поиск ключевых фраз в речи, таджикский язык.
Дата публикации
2026-03-26