МЕТОДЫ И АЛГОРИТМЫ СИНТЕЗА РЕЧИ НА ОСНОВЕ ТЕКСТА

Авторы

Худойбердиев Хуршед Атохоновичдоктор технических наук, доцент, кафедра программирования и информационных систем, Политехнический институт Таджикского технического университета имени академика М.С. Осими, г. Худжанд, Республика Таджикистан, tajlingvo@gmail.com
Ашурзода Бахром Хайриддинкандидат технических наук, старший преподаватель, кафедра автоматизированные системы управления, Таджикский технический университет имени академика М.С. Осими, г. Душанбе, Республика Таджикистан, bahrom.91@mail.ru
Анварзода Акмал Анвардокторант (PhD), кафедра информационно-коммуникационных технологий и программирования, Таджикский государственный университет права, бизнеса и политики, г. Худжанд, Республика Таджикистан, akmal_dadoboev@mail.ru
Ашурова Шабнам Нуруллоевнастарший преподаватель, кафедра программирования и информационных систем, Политехнический институт Таджикского технического университета имени академика М.С. Осими, г. Худжанд, Республика Таджикистан, sh.nurulloevna@gmail.com

Аннотация

Статья посвящена разработке компьютерной модели, основанной на методах и алгоритмах синтеза речи с использованием созданного речевого корпуса таджикского языка. Задача обработки речи была определена на основе её цифрового образа. Рассматриваются такие методы синтеза речи, как параметрический синтез речи, конкатенационный синтез речи, полный синтез речи по правилам. На основании проведённого анализа алгоритм синтеза речи был реализован с применением конкатенационного метода и представлен в виде блок-схемы. Также предложены подходы к выбору и объединению речевых единиц с учётом изменения параметров синтетической речи и их влияния на тип математических моделей. Для решения задачи синтеза речи были выполнены следующие этапы: предварительный анализ текста; выбор и соединение речевых компонентов естественного языка из базы данных на основе автоматического алгоритма разложения; изменение значений фонетических и просодических размеров синтетической речи с использованием синусоидальной модели синтеза речи; разработка компьютерных программ для обеспечения синтеза звука на таджикском языке. Рассматриваемые результаты были получены в Худжандском научном центре НАНТ в рамках бюджетного проекта «Разработка корпуса речи таджикского языка для решения задач компьютерной лингвистики», утвержденного под номером 0123TJ1547.

Ключевые слова

компютерная лингвистика, таджикский язык, компьютерная модель, синтез речи, технологии обработки речи, корпус речи.

Дата публикации

2026-03-31