Авторы
Ибрагимов У.М. – PhD, доцент, Бухарский инженерно-технологический институт, г. Бухара, Узбекистан, ciulugbek@list.ru
Аннотация
В данной статье рассматриваются базовые понятия и методы, ис-пользуемые при решении задачи классификации в машинном обучении. Дается определе-ние классификации как процесса отнесения объектов к заданным классам на основе ана-лиза признаков объектов. Приводятся примеры бинарной и много классовой классифика-ции. На примере построения простейшего классификатора сигналов с помощью дерева решений подробно разбирается процесс создания классификатора и анализа его эффек-тивности на тестовых данных с использованием матрицы ошибок и показателей каче-ства, таких как точность, полнота, F-мера. Приводятся формулы расчета этих пока-зателей. Отмечается важность репрезентативности тестовых данных для оценки ка-чества классификатора. В заключении автор делает вывод, что точность по тестово-му набору Te определяется как доступ только к истинным классам небольшой части пространства экземпляров, вследствие этого оценка — это все, на что мы можем надеяться. Поэтому важно, чтобы набор тестов был максимально репрезентативным. Это обычно формализуется предположением, что появление экземпляров в мире, управ-ляется неизвестным распределением вероятностей на X и, что тестовый набор Te гене-рируется в соответствии с этим распределением. В целом статья представляет инте-рес для специалистов в области машинного обучения и анализа данных.
Ключевые слова
классификация, машинное обучение, функция, фильтрация сигнала, бинврный, дерево признаков, тестовые экземпляры, вероятность.
Язык русский |
Тип технический |
Год 2023 |
Страница 20-24 |
Список использованной литературы
-
- Авезов А.Х. Применение информационных технологий для обучения научному творчеству. Вестник Таджикского государственного университета права, бизнеса и политики. 2014. № 1 (57). С. 316-327.
-
- Allwein, E.L., Schapire, R.E. and Singer, Y. (2000). Reducing multiclass to binary: A unifying approach for margin classifiers. In P. Langley (ed.), Proceedings of the Seventeenth International Conference on Machine Learning (ICML 2000), pp. 9–16.
-
- Blockeel, H., De Raedt, L. and Ramon, J. (1998). Top-down induction of clustering trees. In J.W. Shavlik (ed.), Proceedings of the Fifteenth International Conference on Machine Learning (ICML 1998), pp. 55–63.
-
- Boser, B.E., Guyon, I. and Vapnik, V. (1992). A training algorithm for optimal margin classifiers. In Proceedings of the International Conference on Computational Learning Theory (COLT 1992), pp. 144–152.
-
- Breiman, L., Friedman, J.H., Olshen, R.A. and Stone, C.J. (1984). Classification and Regression Trees. Wadsworth.
Дата публикация
2023-10-19