В статье представлены результаты исследования интерпретируемости моделей искусственного интеллекта, нашедших широкое применение в решении задач предиктивного обнаружения вторжений и аномалий, в том числе модели случайного леса на известном наборе данных KDD99, который был задействован для обучения и тестирования упомянутого подхода. Представлены результаты практических экспериментов, в ходе которых были получены оценки значимости информативных признаков на основе известных методов SHAP, Boruta, RandomForest и др. Это позволило определить возможные пути достижения высокой точности обнаружения вторжений и аномалий, а также разработать соответствующие алгоритмы интерпретации выявленных информативных признаков.
< ... >
This article presents the results of a study of the interpretability of artificial intelligence models, which have found wide application in solving problems of predictive intrusion and anomaly detection, including random forest models on the well-known KDD99 dataset, which was used to train and test the mentioned approach. The results of practical experiments are presented, during which estimates of the significance of informative features were obtained based on the well-known methods This made it possible to determine possible ways to achieve high accuracy in predicting the detection of intrusions and anomalies, as well as to develop algorithms for interpreting the identified informative features.
Keywords:
artificial intelligence, intrusion and anomaly detection, features for decision making, random forest