ОПРЕДЕЛЕНИЕ АВТОРСТВА ТАДЖИКСКИХ ЛИТЕРАТУРНЫХ ТЕКСТОВ НА ОСНОВЕ ЧАСТОТНОСТИ СЛОГОВ

Авторы: Ҳудойбердиев Х.А Қосимов А.А

Авторы

Худойбердиев Х.Акандидат физико-математических наук, доцент, кафедра программирования и информационных технологий, Политехнический институт Таджикского технического университета имени академика М.С. Осими,г. Худжанд, Республика Таджикистан, tajlingvo@gmail.com

Қосимов О.А. кандидат технических наук, старший преподаватель кафедры программирования и информационных технологий, Политехнический институт Таджикского технического университета имени академика М.С. Осими, г.Худжанд, Республика Таджикистан, abdunabi_kbtut@mail.ru

Аннотация

Решается задача распознавания авторов произведений по отдельности для классической и современной поэзии, а также современной прозы. В произведениях сопоставляется цифровой портрет с точки зрения распределения в них частотности слогов. Устанавливается эффективность примененияклассификатора для идентификации авторов произведений.

Ключевые слова

таджикский язык, текст, поэзия, проза, частотность, слог, классификатор, определение авторства.

Язык

русский

Тип

научный

Год

2020

Страницы

34-46

Список использованной литературы

  1. Каримов А.А. О цифровом портрете текстовой информации – Политехнический вестник, 2019, 1 (45), Серия: интеллект, инновации, инвестиции, С. 7-10.
  2. Каюмов М.М. О цифровом портрете текстовой информации, основанном на частотности знаков пунктуации– Политехнический вестник, 2019, 1 (45), Серия: интеллект, инновации, инвестиции, С. 20-23.
  3. Косимов А.А., Бахтеев К.С. О распознавании автора текстового фрагмента // Известия Академии наук Республики Таджикистан. Отделение физико-математических, химических, геологических и технических наук, 2019.
  4. Косимов А.А., Бахтеев К.С. Применение специфичного цифрового портрета для идентификации авторов произведений // Известия Академии наук Республики Таджикистан. Отделение физико-математических, химических, геологических и технических наук, 2019.
  5. Усманов З.Д. Алгоритм настройки кластеризатора дискретных случайных величин Доклады Академии наук Республики Таджикистан, 2017, т. 60, № 9, С. 392 – 397.
  6. Усманов З.Д. Классификатор дискретных случайных величин Доклады Академии наук Республики Таджикистан, 2017, т. 60, № 7-8, С. 291 – 300.
  7. Усманов З.Д. Об одном цифровом портрете текста и его приложении – Политехнический вестник, 2019, 3 (47). Серия: интеллект, инновации, инвестиции.
  8. Усманов З.Д., Косимов А.А. К вопросу об автоматическом распознавании авторства и стилей произведений таджикско-персидской художественной литературы // Доклады Академии наук Республики Таджикистан, 2019.
  9. Усманов З.Д., Косимов А.А. О применимости γ-классификатора к распознаванию авторства и тематики художественных произведений // Материалы двадцать второго научно-практического семинара “Новые информационные технологии в автоматизированных системах”, Москва, 2019, С. 174 – 178.
  10. Усманов З.Д., Косимов А.А. О распознавании авторства таджикского текста – Доклады Академии наук Республики Таджикистан, 2016, т. 59, № 3-4, С. 114 – 119.
  11. Усманов З.Д., Косимов А.А. Цифровой образ “Шахнаме” (“Книги царей”) А.Фирдауси – Доклады Академии наук Республики Таджикистан, 2014, т. 57, № 6, С. 471 – 476.
  12. Усманов З.Д., Косимов А.А. Частотность биграмм в таджикской литературе – Доклады Академии наук Республики Таджикистан, 2016, т. 59, № 1-2, С. 28-32.
  13. Усманов З.Д., Косимов А.А. Частотность букв таджикской литературы –Доклады Академии наук Республики Таджикистан, 2015, т. 58, № 2, С. 112-115.
  14. Усманов З.Д., Солиев О.М. Проблема раскладки символов на компьютерной клавиатуре. – Душанбе: Ирфон, 2010, 104 с.
  15. Худойбердиев Х.А., Косимов А.А. О распознавании автора текста на основе частотности слогов // Доклады Академии наук Республики Таджикистан, 2019.

Дата публикации

Душанбе,05 Июн 2023