Авторы
Солиев О.М. – кандидат физико – математических наук, старший преподаватель, кафедра программирования и информационных технологий, Политехнический институт Таджикского технического университета имени академика М.С. Осими, г. Худжанд, Республика Таджикистан, osoliev@gmail.com.
Косимов О.А. – ассистент, кафедра программирования и информационных технологий, Политехнический институт Таджикского технического университета имени академика М.С. Осими, г. Худжанд, Республика Таджикистан, oqosimov9293@gmail.com.
Аннотация
Устанавливается, что распределение частотности триграмм в экономико-политических произведениях русского языка является идентификатором авторства. Исследованы возможности классификатора З.Д. Усманова распознавать автора текста по частотности буквенных триграмм. Сконструированы цифровой портрет и метрическое пространство произведений. В предположении уникальности авторского творчества устанавливаются пороговые значения метрики, на основе которых определяются классы “однородных” произведений. Классификатор дискретных случайных величин, подтвердивший высокую эффективность при идентификации авторства текстовых фрагментов в произведениях классической и современной поэзии, а также в современной прозе таджикского языка, тестируется на предмет приспособляемости к распознаванию авторства в экономико-политическом произведении. Сделаны выводы, что символьные триграммы являются приемлемыми количественными характеристиками для идентификации авторов текстов. Учёт пробелов в триграммах повышает точность классификации. Классификатор позволяет по частотности элементов алфавита буквенных триграмм с высокой степенью эффективности идентифицировать произведения различных авторов.
Ключевые слова
символьные триграммы, идентификация авторов, экономико-политические произведения, буквенные триграммы, классификатор, частотность, статистика, эффективность
Язык русский |
Тип технические |
Год 2019 |
Страница 22-27 |
Список использованной литературы
-
- Бурханова Н.М. Бюджетная система РФ. – М.: Эксмо, 2007, 32 с.
- Бурханова Н.М. Экономическая география. Шпаргалки. – М.: Эксмо, 2008, 32 с.
- Катасонов В.Ю. Америка против России. – М.: Книжный мир, 2015, 449 с.
- Катасонов В.Ю. Антикризис. Выжить и победить. – М.: Алгоритм, 2015, 149 с.
- Катасонов В.Ю. Битва за рубль. – М.: Книжный мир, 2015, 288 с.
- Климова М.А. Заработная плата. – М.: Налоговый Вестник, 2008, 320 с.
- Климова М.А. Налог на прибыль. – М.: Налоговый Вестник, 2008, 98 с.
- Никаноров П.С. Посредническая деятельность. – М.: Налоговый вестник, 2008, 320 с.
- Никаноров П.С. Совместная деятельность. – М.: Налоговый вестник, 2008, 320 с.
- Панченко Т.М. Займы и кредиты. – М.: Налоговый вестник, 2008, 158 с.
- Панченко Т.М. Отпускные и социальные выплаты. – М.: Налоговый вестник, 2008, 340 с.
- Стариков Н.В. Геополитика. Как это делается. – СПб.: Питер, 2014, 368 с.
- Стариков Н.В. Национализация рубля. – СПб.: Питер, 2011, 169 с.
- Усманов З.Д. N-граммы в распознавании однородных текстов. – Материалы 20 научно-практического семинара “Новые информационные технологии в автоматизированных системах”. – М.: 2017, С. 52 – 54.
- Усманов З.Д. Алгоритм настройки кластеризатора дискретных случайных величин.– Доклады Академии наук Республики Таджикистан, 2017, т. 60, № 9, С. 392 – 397.
- Усманов З.Д. Классификатор дискретных случайных величин. – Доклады Академии наук Республики Таджикистан. 2017, т. 60, № 7 – 8, С. 291 – 300.
- Шевчук Д.А. История экономики. – М.: Автор, 2009, 305 с.
- Шевчук Д.А. Мировая экономика. Конспект лекций. – Ростов-на-дону: Феникс, 2007, 417 с.
Дата публикация
09/22/2023