ИДЕНТИФИКАЦИЯ АВТОРОВ ЭКОНОМИКО – ПОЛИТИЧЕСКИХ ПРОИЗВЕДЕНИЙ С ПОМОЩЬЮ СИМВОЛЬНЫХ БИГРАММ

Авторы

 

Солиев О.М. кандидат физико – математических наук, старший преподаватель, кафедра программирования и информационных технологий, Политехнический  институт Таджикского технического университета имени академика М.С. Осими

Косимов О.А.магистрант, кафедра программирования и информационных  технологий, Политехнический институт Таджикского технического университета имени академика М.С. Осими

 

Аннотация

 

   Устанавливается, что распределение частотности биграмм в экономико-политических произведениях русского языка является идентификатором авторства. Исследованы возможности классификатора З.Д. Усманова распознавать автора текста по частотности буквенных биграмм. Сконструированы цифровой портрет и метрическое пространство произведений. В предположении уникальности авторского творчества устанавливаются пороговые значения метрики, на основе которых определяются классы “однородных” произведений. -классификатор дискретных случайных величин, подтвердивший высокую эффективность при идентификации авторства текстовых фрагментов в произведениях классической и современной поэзии, а также в современной прозе таджикского языка, тестируется на предмет приспособляемости к распознаванию авторства в экономико-политических произведениях.

 

Ключевые слова

 

 русский язык, экономико-политическией произведения, биграмма, классификатор, частотность, статистика, эффективность

 

Дата публикация

2023-10-26