Optımızed weıghted ensemble classıfıer for ıntrusıon detectıon applıcatıon
Files
Date
2017
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Başkent Üniversitesi Fen Bilimleri Enstitüsü
Abstract
Computer and communication systems become the foundations of modern life. With
the advances in the Internet, usage of these systems increases and intrusions
against these systems increases too. Therefore, finding and preventing intrusions
against these systems becomes more and more important. To protect these
systems, Intrusion Detection Systems (IDS) are implemented. In recent years,
machine learning and optimization techniques are increasingly used in IDS. New
methods are implemented using KDD99 and its derivative NSL-KDD datasets based
on intelligent IDS systems in this thesis study. First, a detailed review is made on
studies that uses above mentioned datasets, and according to this review, detailed
statistics are derived on usage of these datasets. Next, two different methods are
proposed for IDS. These methods are based on principles of classifier ensemble
and hybrid IDS. In the first method, genetic algorithms (GA) are used for feature
selection (an important part for classification) and ensemble weight finding. The
proposed method is named as Genetic Algorithms based Feature Selection and
Weights Finding (GA-FS-WF). In the second method, hybrid ensemble classifier
subject re-visited again. In this method, convex optimization techniques are used for
finding weights for ensemble classifiers. Proposed method models weights finding
in ensemble as a mathematical objective function and solves it as an optimization
problem. In both proposed methods, full dataset NSL-KDD is used. Success of
proposed methods are measured with classifier performance metrics and compared
with similar methods in the literature.
Bilgisayar ve iletişim sistemleri modern hayatın temellerini oluşturmaktadır. Internet
ağının gelişmesiyle birlikte bu sistemlerin kullanımında büyük artışlar olmakta, ancak
bu sistemlere yönelik saldırılar da aynı oranda artmaktadır. Bu yüzden, söz
konusu sistemlerin saldırılara karşı korunması ve gelen saldırıların tespiti giderek
önem kazanmış ve bu amaçla Saldırı Tespit Sistemleri (STS) geliştirilmiştir. Son
yıllarda STS’lerde makine öğrenmesi ve eniyileme tekniklerinin kullanımı giderek
artmaktadır. Bu tez çalışmasında özgün STS yöntemleri önerilmiş ve önerilen
bu yöntemler KDD99 ve türevi NSL-KDD veri setleri kullanılarak doğrulanmıştır.
STS çalışmaları üzerinde yapılan detaylı literatür taraması sonucuna göre, bu
veri setlerinin makine öğrenmesi alanında kullanımına yönelik detaylı istatistikler
çıkarılmıştır. Çalışmanın devamında, STS için iki farklı sınıflandırıcı füzyon
yöntemi geliştirilmiştir. Genetik Algoritma tabanlı Nitelik Seçme ve Ağırlık Bulma
(GA-NS-AB) olarak adlandırılan ilk yöntemde, sınıflandırıcı çalışmaları için önemli bir
aşama olan nitelik çıkarma ve sınıflandırıcı füzyonu ağırlık bulma işlemleri, Genetik
Algoritmalar (GA) kullanılarak gerçekleştirilmiştir. İkinci yöntemde ise sınıflandırıcı
ağırlıklarını bulma problemi, eniyileme problemi olarak modellenmiş ve yeni bir
maliyet fonksiyonu tanımlanmıştır. Bu fonksiyonun çözümü için dışbükey gevşetme
ve dışbükey eniyileme yöntemleri kullanılmıştır. Geliştirilen her iki yöntemde de
NSL-KDD veri setinin tamamı kullanılırken, yöntemlerin başarısı benzer yöntemlerle
karşılaştırılmıştır.
Description
Keywords
Feature selection, Classifier fusion, Genetic algorithms, Intrusion detection systems, Machine learning, Convex optimization, Convex relaxation