Авторы
Солиев О.М. – кандидат физико – математических наук, старший преподаватель, кафедра программирования и информационных технологий, Политехнический институт Таджикского технического университета имени академика М.С. Осими
Косимов О.А. – магистрант, кафедра программирования и информационных технологий, Политехнический институт Таджикского технического университета имени академика М.С. Осими
Аннотация
Устанавливается, что распределение частотности биграмм в экономико-политических произведениях русского языка является идентификатором авторства. Исследованы возможности классификатора З.Д. Усманова распознавать автора текста по частотности буквенных биграмм. Сконструированы цифровой портрет и метрическое пространство произведений. В предположении уникальности авторского творчества устанавливаются пороговые значения метрики, на основе которых определяются классы “однородных” произведений. -классификатор дискретных случайных величин, подтвердивший высокую эффективность при идентификации авторства текстовых фрагментов в произведениях классической и современной поэзии, а также в современной прозе таджикского языка, тестируется на предмет приспособляемости к распознаванию авторства в экономико-политических произведениях.
Ключевые слова
русский язык, экономико-политическией произведения, биграмма, классификатор, частотность, статистика, эффективность
Дата публикация
2023-10-26