ПРИМЕНЕНИЕ ТЕЗАУРУСА В ЗАДАЧАХ ЛИНГВИСТИКИ ТАДЖИКСКОГО ЯЗЫКА: ПОДХОДЫ И РЕАЛИЗАЦИЯ

Авторы

Ашурова Ш.Н.старший преподаватель, кафедра программирования и информационных систем, Политехнический институт Таджикского технического университета имени академика М.С. Осими, г. Худжанд, Республика Таджикистан, sh.nurulloevna@gmail.com
Назаров А.А.старший преподаватель, кафедра программирования и информационных систем, Политехнический институт Таджикского технического университета имени академика М.С. Осими, г. Худжанд, Республика Таджикистан, n.abdusamad@gmail.com
Худойбердиев Х.А.кандидат физико математических наук, заведующий кафедрой, кафедра программирования и информационных систем, Политехнический институт Таджикского технического университета имени академика М.С. Осими, г. Худжанд, Республика Таджикистан, tajlingvo@gmail.com

Аннотация

В статье рассматривается проблема применения тезауруса в задачах компьютерной лингвистики таджикского языка. Предпринята попытка обобщения подходов и реализации применения тезауруса в задачах лингвистики. Отмечается, что компьютерная лингвистика — это область знаний, связанная с автоматической обработкой информации, представленной на естественном языке. Ее центральной научной проблемой является моделирование процесса понимания смысла текста и синтез речи на основе формализованных представлений смысла. Эти проблемы возникают при решении прикладных задач автоматического анализа и синтеза устной речи, машинного перевода, общения с системами на естественном языке, классификации и реферирования документов, полнотекстового поиска. Тезаурус представляет собой словарь, в котором указаны семантические отношения между лексическими единицами, такие как синонимия, антонимия, гипонимия/гиперонимия, меронимия/партонимия. Он позволяет выявить смысл слова не только через определение, но и через связи с другими понятиями. Тезаурусы могут применяться для описания предметных областей, машинного перевода, проверки орфографии и грамматики, информационного поиска, индексирования документов, семантического анализа текстов. В заключении сделан вывод, что создание тезауруса для таджикского языка на базе проекта WordNet будет способствовать развитию компьютерной лингвистики таджикского языка, решению задач автоматизированной обработки текста, повышению эффективности информационного поиска и машинного перевода. Применение тезауруса для таджикского языка открывает широкие перспективы для развития компьютерной лингвистики и решения многих практических задач автоматической обработки текстов на таджикском языке. Разработка тезауруса таджикского языка по образцу проекта WordNet является перспективным направлением, которое будет способствовать развитию компьютерной лингвистики таджикского языка и созданию эффективных интеллектуальных систем обработки текстовой информации на таджикском языке.

Ключевые слова

тезаурус, компьютерная лингвистика, семантические отношения, автоматическая обработка текста, машинный перевод.

Список литературы

1. Белоногов Г.Г., Калинин Ю.П., Хорошилов А.А. Компьютерная лингвистика и перспективные информационные технологии. М., 2004.

2. Гетман, Иван Михайлович. Тезаурус как инструмент современного языкознания: Автореф. дис. докт. филол. наук. — Киев: Ин-т языковедения, 1991. — С. 34.

3. Нгуен М. Х., Аджиев А. С. Описание и использование тезаурусов в информационных системах, подходы и реализация // Электронные библиотеки. — 2004. — Т. 7, № 1. — С. 16-45. — ISSN 1562-5419.


Дата публикации

2026-03-17