Авторы
Ванюшкин А. С. – ассистент кафедры, Псковский государственный университет, г. Псков, Россия
Гращенко Л. А. – младший научный сотрудник, Институт математики АН РТ, г. Душанбе, Таджикистан
Аннотация
Описывается программный инструментарий для исследования различных аспектов извлечения ключевых слов из текстов на естественных языках. Исследователю доступны визуальное проектирование и настройка тракта обработки текстов; расчет и визуализация показателей эффективности ряда встроенных графовых алгоритмов. Предусмотрена возможность расширения функционала стенда. Первые испытания показали значительный разброс точности извлечения ключевых слов при варьировании размеров текстов.
Ключевые слова
обработка текстов, ключевые слова, алгоритмы извлечения, экспериментальный стенд.
Список использованной литературы
- Ванюшкин А.С. Методы и алгоритмы извлечения ключевых слов / А.С. Ванюшкин, Л.А. Гращенко // Новые информационные технологии в автоматизированных системах. – 2016. – №19 – С. 85–93.
- Marujo L., Gershman A., Carbonell J., Frederking R. Supervised Topical Key Phrase Extraction of News Stories using Crowdsourcing, Light Filtering and Co-reference Normalization. Lrec 2012. pp 399–403.
- Mihalcea R., Tarau P. TextRank: Bringing order into texts Proc. EMNLP 2004. Vol. 4 pp. 404–411.
- Palshikar G. Keyword Extraction from a Single Document Using Centrality Measures. Pattern Recognit. Mach. Intell, LNCS 2007. Vol. 4851 pp. 503–510.
- Rose S., Engel D., Cramer N., Cowley W. Automatic Keyword Extraction from Individual Documents. Text Min. Appl. Theory. 2010. pp. 1–20.
Дата публикация
2023-10-25