Использование информации о влияющих факторах для разбиения выборок данных в методах машинного обучения для оценки состояния ИБ

Системы машинного обучения и управления базами знаний
Авторы:
Аннотация:

Повышение качественных показателей идентификации состояния информацион-
ной безопасности отдельных сегментов киберфизических систем связано с обработкой боль-
ших информационных массивов. Предлагается метод разбиения выборок данных для повы-
шения показателей качества алгоритмов классификации состояний ИБ. Классификационные
модели настраиваются на обучающих множествах примеров, в которых могут присутствовать
выбросы, зашумленные данные, дисбаланс наблюдаемых объектов, что влияет на качествен-
ные показатели результатов. В определенные моменты времени под воздействием внешней
среды могут изменяться частоты появления наблюдаемых событий, диапазоны регистрируе-
мых значений, что существенно влияет на качественные показатели. Показано, что ряд собы-
тий в выборках возникает в результате действий внутренних и внешних факторов