Авторы: Низамитдинов А.И , Иномов Б.Б.
Авторы
Низамитдинов А.И. – доктор философии по специальности (PhD), старший преподаватель, кафедра программирования и информационные системы, Политехнический институт Таджикского университета Таджикистана имени академика М.С.Осими, г.Худжанд, Республика Таджикистан, ahlidin@gmail.com.
Иномов Б.Б. – докторант (Ph.D) специальности 6D070300 Информационные системы (по отраслям), ассистент кафедры программирования и информационных технологий, Политехнический институт Таджикского университета Таджикистана имени академика М.С.Осими, г.Худжанд, Республика Таджикистан, behruzinomov@gmail.com.
Аннотация
В данной статье даётся обзорное рассмотрение имеющихся алгоритмов машинного обучения для задач классификации, в частности в задачах классификации текстов разных контекстов языка. Классификация текстов является одной из основных задач компьютерной лингвистики. Данное направление имеет несколько основных задач, такие как, определение тематической принадлежности текстов, автора текста, эмоциональной окраски высказываний и др. Для обеспечения информационной и общественной безопасности в социальных сетях, информационных сайтах большое значение имеет анализ в телекоммуникационных сетях контента, содержащего противоправную информацию. Использование алгоритмов машинного обучения для решения задач классификации текста достаточно распространенная задача на сегодняшний день, поскольку комплексы программ, основанные на данных алгоритмах, имеют достаточно высокий показатель оценки в сравнении с другими подходами классификации. Применение и сравнение алгоритмов классификации является достаточно сложной задачей, поскольку различные входные данные могут давать разный результат. Поэтому программные средства алгоритмов необходимо обучать и тестировать на одинаковых наборах данных.
Ключевые слова
алгоритм, машинное обучение, классификация текста, обработка данных
Язык
русскый
Тип
научный
Год
2020
Страницы
34-46
Список использованной литературы
- Aggarwal C. and Zhai C. (2012) A survey of text classification algorithms. Springer, P. 163—222.
- Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani. (2013). An introduction to statistical learning: with applications in R. New York: Springer.
- Jimenez, S. (2014) Text Classification and Clustering with WEKA.
- Каюмов М.М. (2019) Об эффективности применения основанных на высокочастотных знаков пунктуации цифровых портретов для распознавание авторов произведений, Политехнический вестник. Серия Интеллект. Инновации. Инвестиции. 4 (48), С. 23-26.
- Korde V. and Mahender C. (2012) Text classification and classifiers: A survey. International Journal of Artificial Intelligence & Applications (IJAIA), 3 (2), P. 85—99.
- Назаров А.А. (2019) Автоматический синтез таджикских словоформ имени прилагательного. Политехнический вестник. Серия Интеллект. Инновации. Инвестиции. 4 (48), С. 16-18.
- Niharika S., Latha V. and Lavanya, D. (2012). A Survey on Text Categorization. International Journal of Computer Trends and Technology, volume 3, Issue 1.
- Максудов Х.Т., Иномов Б.Б. (2019) Оценка эффективности методов k-ближайших соседей и логистической регрессии при определении специальности научных текстов. Политехнический вестник. Серия Интеллект. Инновации. Инвестиции. 4(48), С. 34-38.
- Мухсинзода М.Ё., Солиев О.М. (2019) Генерация новых национальных таджикских имен с помощью искусственных нейронных сетей. Политехнический вестник. Серия Интеллект. Инновации. Инвестиции. 4 (48), С. 18 – 23.
- Pandey U. and Chakraverty S.A (2011) Review of Text Classification Approaches for E-mail Management. IACSIT International Journal of Engineering and Technology, 3(2).
- Patra A. and Singh D. (2013). A Survey Report on Text Classification with Different Term Weighing Methods and Comparison between Classification Algorithms. International Journal of Computer Applications, Volume 75, № 7, P. 14 – 18.
- Wilcox A. and Hripcsak G. (1999) Classification algorithms applied to narrative reports. P. 455.
Дата публикации
Пониделник,05 Июн 2023