ОПРЕДЕЛЕНИЕ МИНИМАЛЬНОГО ОБЪЁМА ВЫБОРКИ СЛОВ ДЛЯ ИДЕНТИФИКАЦИИ ТЕКСТА

Авторы

           Худойбердиев Х.А. – кандидат физико – математических наук, заведующий кафедрой программирования и информационных технологий, Политехнический институт Таджикского технического университета имени академика М.С. Осими.

           Касимов А.А. – старший преподаватель, кафедра программирования и информационных технологий, Политехнический институт Таджикского технического университета имени академика М.С. Осими.

 Аннотация

 Определен минимальный объём выборки слов для распознавания автора таджикского текста. Описаны результаты экспериментов с минимальным объёмом выборки слов для распознавания автора текста.

Ключевые слова

таджикский язык, слова, триграмма, частотность, статистика, эффективность.

Язык

русский

Тип

технический

Год

2017

Страница

14-21

Список использованной литературы

    1. Усманов З.Д. Проблема раскладки символов на компьютерной клавиатуре / З.Д. Усманов, О.М. Солиев. – Душанбе: Ирфон, 2010. – 104 с.
    2. Усманов З.Д. Частотность букв таджикской литературы / З.Д. Усманов, А.А. Косимов // Доклады Академии наук Республики Таджикистан. – 2015. – Т. 58. – № 2. – С. 112 – 115.
    3. Косимов А.А. Оценка эффективности использования униграмм при идентификации текста / А.А. Косимов // Доклады Академии наук Республики Таджикистан. – 2017. – Т. 60. № 3 – 4. – С. 132 – 137.
    4. Усманов З.Д. Частотность биграмм таджикской литературы / З.Д. Усманов, А.А. Косимов // Доклады Академии наук Республики Таджикистан. – 2016. – Т. 59. – № 1 – 2. – С. 28 – 32.
    5. Косимов А.А. Оценка эффективности использования биграмм при идентификации текста / А.А. Косимов // Доклады Академии наук Республики Таджикистан. – 2017. – Т. 60. № 5 – 6. – С. 224 – 229.
    6. Усманов З.Д. О распознавании авторства таджикского текста / З.Д. Усманов, А.А. Косимов // Доклады Академии наук Республики Таджикистан. – 2016. – Т. 59. – № 3 – 4. – С. 114 – 119.
    7. Косимов А.А. Оценка эффективности использования триграмм при идентификации текста / А.А. Косимов // Доклады Академии наук Республики Таджикистан. – 2017. – Т. 60. № 7 – 8.
    8. Усманов З.Д. Цифровой образ “Шахнаме” (“Книги царей”) А. Фирдауси / З.Д. Усманов, А.А. Косимов // Доклады Академии наук Республики Таджикистан. – 2014. – Т. 57. – № 6. – С. 471 – 476.
    9. Турсун С. Нисфирўзӣ / C. Турсун // – Душанбе, 1973. – 25 с.
    10. Большев Л.Н. Таблицы математической статистики / Л.Н. Большев, Н.В. Смирнов // – Москва: Наука, Гл. ред. физ-мат. литературы, 1983. – 416 с.

Дата публикация

2023-09-25