ОЦЕНКА ЭФФЕКТИВНОСТИ ИСПОЛЬЗОВАНИЯ УНИГРАММ ПРИ ИДЕНТИФИКАЦИИ ТЕКСТА

Авторы

 

   Худойбердиев Х. А. – кандидат физико – математических наук,  заведующий кафедрой программирования и информационные технологий,  Политехнический институт Таджикского технического университета имени академика М.С.Осими

   Касимов А. А. – старший преподаватель кафедры программирования и  информационных технологий, Политехнический институт  Таджикского технического университета имени академика М.С.Осими

 

Аннотация

 

     Исследованы возможности критерия однородности Н.В.Смирнова и его модификатора распознавать автора текста по частотности буквенных униграмм. Обосновано, что данный критерий и его модификатор позволяют по частотности знаков таджикского алфавита идентифицировать произведения поэтов классической таджикско-персидской литературы, а также различных авторов современной таджикской поэзии и прозы.

 

Ключевые слова 

 

         таджикский язык, униграмма, частотность, статистика, эффективность.

 

Список использованной литературы

 

  1. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. – Москва: Наука, Гл. ред. физ-мат. литературы, 1983, 416 с.
  2. Ганҷавӣ Н. Лайлӣ ва Маҷнун (Куллиёт). – Душанбе: Ирфон, 1982, ҷилди 2, 368 с.
  3. Ганҷавӣ Н. Хусрав ва Ширин (Куллиёт). – Душанбе: Ирфон, 1983, ҷилди 1, с. 1 – 82.
  4. Романов А.С., Шелупанов А.А., Мещеряков Р.В. Разработка и исследование математических моделей, методик и программных средств информационных процессов при идентификации автора текста. -В-Спектр, Томск, 2011, 188 с.
  5. Суруш А. Дафтари 1. Хуҷанд. 1999. 37 с.
  6. Суруш А. Дафтари 2. Хуҷанд. 2000 40 с.
  7. Турсун С. Нисфирӯзӣ. Душанбе. 1978. – 22 с.
  8. Турсун С. Повести Камони Рустам. Душанбе. 1974. – 164 с.
  9. Усманов З.Д., Солиев О.М. Проблема раскладки символов на компьютерной клавиатуре. – Душанбе: Ирфон, 2010. 104 с.
  10. Усманов З.Д., Косимов А.А. Частотность букв таджикской литературы. – Доклады Академии наук Республики Таджикистан, 2015, т.58, № 2. -С. 112-115.
  11. Усманов З.Д., Косимов А.А. Частотность биграмм таджикской литературы. – Доклады Академии наук Республики Таджикистан, 2016, т.59, № 1-2. – С. 28-32.
  12. Усманов З.Д., Косимов А.А. О распознавании авторства таджикского текста. – Доклады Академии наук Республики Таджикистан, 2016, т.59, № 3-4. – С. 114-119.
  13. Фарзона И. Саду як Ғазал. – Душанбе: 2011. 109 с.
  14. Фарзона И. Мӯҳри гули мино. – Хуҷанд: 2006. 370 с.

 

Дата публикация

2023-10-25