|
|
№ 4 июль–август 2020 г.
Тема номера:
BIG DATA В КИБЕРБЕЗОПАСНОСТИ
|
Сравнительный анализ методов машинного обучения для оценки качества ИТ-услуг
Comparative Analysis of Machine Learning Methods to Assess the Quality of IT Services
Максим Александрович Большаков,
старший преподаватель
M. A. Bolshakov,
Senior Lecturer
Игорь Андреевич Молодкин,
ассистент
I. A. Molodkin,
Assistant
Сергей Валентинович Пугачев,
кандидат технических наук, доцент
S. V. Pugachev,
PhD (Eng.), Associate Professor
Петербургский государственный университет путей сообщения Императора Александра I
Emperor Alexander I St. Petersburg State Transport University
|
|
|
Рассматривается выбор метода машинного обучения для решения задачи оценки текущего качества ИТ-услуги. Для корректного формирования обучающей выборки выбран язык программирования Python и импортированные библиотеки Pandas и Numpy. В качестве критериев сравнения методов машинного обучения рассмотрена F-мера как обобщающее понятие полноты и точности классификации по каждому классу состояний отдельно и длительность выполнения процедуры обучения и предсказания. На основе описанных критериев рассмотрены методы машинного обучения, применяемые для решения задач классификации, а именно: метод ближайших соседей, логистической регрессии, наивного Байесовского классификатора, дерева решений, градиентного бустинга и нейронной сети. В результате сравнительного анализа из указанного набора методов определен один — наиболее успешный для решения рассматриваемой задачи.
< ... >
Ключевые слова:
машинное обучение, гипотеза Барлоу, F-мера, датасет, разнородность данных, ЭТРАН, метод ближайших соседей, логистическая регрессия, наивный Байесовский классификатор, дерево решений, градиентный бустинг, нейронная сеть
The choice of a machine learning method for solving the problem of assessing the current quality of IT services is considered. For the correct formation of the training sample, the Python programming language and the imported Pandas and Numpy libraries were selected. F-measure is considered as criteria for comparing machine learning methods, as a generalizing concept of completeness and accuracy of classification, for each class of states separately and the duration of the training and prediction procedures. Based on the described criteria, the machine learning methods used to solve the classification problems are considered.
Keywords:
machine learning, Barlow hypothesis, F-measure, Dataset, data heterogeneity, ETRAN, closest neighbor method, logistic regression, naive Bayes classifier, decision tree, gradient boosting, neural network
Полную версию статьи смотрите на страницах журнала «Защита информации. Инсайд»
Обращайтесь!!!
e-mail: magazine@inside-zi.ru
тел.: +7 (921) 958-25-50, +7 (911) 921-68-24
Предыдущая статья СОДЕРЖАНИЕ НОМЕРА Следующая статья
|