В статье описывается поиск математического аппарата, отвечающего задаче распознавания и классификации компьютерных атак по совокупности параметров. Исходя из утверждения, что новые и модифицированные попытки вторжений лучше других выявляют ансамблевые гибридные методы, рассмотрены различные варианты формализованной реализации терминального классификатора, что оказывается наиболее важной частью классификации с помощью ансамблевых структур.
Базовыми классификаторами выбраны искусственные нейронные сети, так как они относительно просты в реализации, обладают адаптивностью к неизвестным входным данным и могут иметь достаточно высокую производительность, что также важно при обнаружении аномалий или злоупотреблений.
Математические выкладки сопровождаются демонстрацией результатов работы программы, реализующей ансамбль из трех искусственных нейронных сетей, обученных на различных малых выборках набора KDDCup 1999 и протестированных на наборе в 14 раз крупнее обучающей выборки. Полученные результаты в целом подтверждают утверждение о преимуществах ансамблевых гибридных методов, а также позволяют использовать их в несигнатурных системах обнаружения вторжений, гарантируя высокую вероятность обнаружения злонамеренных действий.
< ... >
The article describes the search for the mathematical tools which meet the problem of identification and classification of computer attacks by a combination of parameters. Based on the statement that ensemble hybrid methods detect new and modified intrusion attempts better than others, the number of options of a formalized implementation of the terminal classifier is considered. Artificial neural networks were chosen as the basic classifiers. The mathematical treatment is accompanied by the demonstration of the results of the programme which implements the ensemble of three artificial neural networks. The obtained results generally confirm the statement about advantages of ensemble hybrid methods and also allow their use in non-signature-based intrusion detection systems.
Keywords:
intrusion detection, artificial neural networks, hybrid methods, ensemble methods, mean square error, majority voting, Bayesian classification