Авторы
Мадибрагимов Н.Ш. – ассистент, кафедра математики, физики и медицинской информатики, Рязанский государственный медицинский университет имени академика И.П Павлова, г. Рязань, Россия navruzmadibragimov@gmail.com
Пруцков А.В. – доктор технических наук, профессор, кафедра вычислительной и прикладной математики, Рязанский государственный радиотехнический университет имени В.Ф. Уткина, г. Рязань, Россия mail@prutzkow.com
Аннотация
В статье представлены результаты классификации слов таджикского языка для последующей генерации и определения форм слов. Слова классифицируются для формализации образования форм слов таджикского языка в терминах универсальной модели формообразования. Универсальная модель формообразования относится к словесно-парадигматическим моделям. Слова классифицируются по типам формообразования. Каждый тип имеет определенные цепочки преобразований основы в словоформу. Классификация состоит в получении словоформ анализируемого слова и отнесения его к одному из типов, имеющим такой же способ получения словоформ, т.е. цепочки преобразований, или создании нового типа. Статьи разделены на типы слов таджикского языка, следующих частей речи: существительное – 5 типов и 12 подтипов, глагол – 9 типов и 2 подтипа, прилагательное – 5 типов и 2 подтипа и местоимение – 5 типов. В настоящее время, классифицируются слова оставшихся частей речи таджикского языка. Классификация проводится на основе научных результатов, полученных исследованиями З.Д. Усманова и Г.М. Довудова. Отмечен значительный вклад З.Д. Усманова в формирование фундаментальных основ автоматической обработки текстов на таджикском языке, введении в научный оборот таких новых понятий, как αβ-кодирование и γ-классификатор, которые повышают показатели результатов решения задач обработки текстов. Воспитание им талантливых учеников, развивающих автоматическую обработку текстов.
Ключевые слова
автоматическая обработка текстов, машинный морфологический анализ и синтез, модель формообразования, классификация слов, генерация формообразования, словоформы.
Язык русский |
Тип технический |
Год 2022 |
Страница 7-11 |
Список использованной литературы
1. Мадибрагимов Н.Ш., Пруцков А.В. Исследование типов формообразования слов таджикского языка // Прикладные информационные системы: проблемы моделирования, применения в развивающихся странах: материалы 3-й республик. науч.-практ. конф. – Худжанд: Худжанд. политехн. ин-т Таджик. техн. ун-та, 2022. – С. 41–45.
2. Hockett C.F. Two Models of Grammatical Description. In Word, 1954, 10 (210–31):386-399.
3. Пруцков А.В. Алгебраическое представление модели формообразования естественных языков // Cloud of Science. T. 1. № 1. С. 88-97.
4. Prutskov A.V. Algorithmic Provision of a Universal Method for Word-Form Generation and Recognition. In Automatic Documentation and Mathematical Linguistics, 2011, 45(5):232-238.
5. Пруцков А.В. Математико–алгоритмическая формализация моделей морфологического анализа и синтеза словоформ естественных языков// Cloud of Science. Т. 5. № 4. С. 729-748.
6. Мадибрагимов Н.Ш., Пруцков А.В. Классификация существительных таджикского языка для автоматической обработки текстов // Прикаспийский журнал: управление и высокие технологии. 2020. № 4 (52). С. 39-52.
7. Мадибрагимов Н.Ш., Пруцков А.В. Типы прилагательных и местоимений таджикского языка и их использование для генерации и определения словоформ // International Journal of Open Information Technologies. 2021. Т. 9. № 11. С. 85-89.
8. МадибрагимовН.Ш. Особенности машинного морфологического анализа и синтеза глаголов таджикского языка // International Journal of Open Information Technologies. 2022.
9. Арзуманов С.Д., Сангинов А. Таджикский язык. Душанбе: Маориф, 1988. 416с.
10. Довудов Г.М., Усманов З.Д. Морфологический анализ словоформ таджикского языка: монография. Душанбе: Дониш, 2015. 132 с.
Довудов Г.М. Компьютерный морфологический анализ таджикских словоформ. [Текст]: дис…..канд. техн. наук: 05.13.11: защищена 06.04.18 / Довудов Гулшан Мирбахоевич. Душанбе, 2018. 161 с.
12. Усманов З.Д. Об упорядоченном алфавитном кодировании слов естественных языков // Доклады Академии наук Республики Таджикистан. 2012. Т. 55. № 7. С. 545-548.
13. Усманов З.Д. Оценка эффективности применения -классификатора // Доклады Академии наук Республики Таджикистан. 2020. Т. 63. № 3-4. С. 172-179.
14. Косимов А.А. Определение шифра специальности с помощью символьных униграмм // Информационный обмен в междисциплинарных исследованиях: сб. тр. Всерос. науч.-практ. конф. с междунар. участием. Рязань: Рязан. гос. радиотехн. ун-т, 2022.
15. Косимов А.А. Становление компьютерной лингвистики Таджикистана. Душанбе: «Ирфон», 2021. 102 с.
Дата публикация
2023-10-09