Материалов:
1 005 012

Репозиториев:
30

Авторов:
761 409

Новые статистический и энтропийный подходы к выбору признаков при классификации сетевого трафика

Дата публикации в реестре: 2025-05-27T14:27:47Z

Аннотация:

В машинном обучении отбор наиболее информативных признаков входных данных является очень важным этапом, цель которого заключается не только в снижении затраченного времени на обучение конкретной модели, но еще и по возможности в улучшении показателей обучаемой модели. Целью данной работы является исследование влияния двух предложенных параметрических алгоритмов снижения размерности на качество прогнозирования классов интернет-трафика на основе набора данных NSL-KDD. Первый алгоритм вырабатывает статистический фильтр, позволяющий установить критерий значимости атрибутов в разделении классов между собой. Второй предложенный алгоритм снижает размерность входных обучающих векторов за счет поиска линейной зависимости между признаками, используя при этом энтропию и сверки законов распределения признаков. Проведенные эксперименты с использованием моделей машинного обучения, такие как дерево решения, метод опорных векторов, наивный байесовский классификатор и К-ближайших соседей показывают, что энтропийный алгоритм в 80 % случаев превосходит по показателям точности, полноты и F1. Аналогичные алгоритмы - метод главных компонентов, гребневая регуляризация регрессии, в то время как наш статический фильтр по своим показателям сравним с перечисленными методами. Данные результаты показывают, что предложенные алгоритмы эффективны и могут быть применены как альтернатива традиционным алгоритмам.

Тип: Article

Источник: Наука и бизнес: пути развития


Связанные документы (рекомендация CORE)