Ağ saldırılarının sınıflandırılmasında karar ağaçlarına dayalı arttırma (boosting) algoritmalarının karşılaştırılması
Tez Türü: Yüksek Lisans
Tezin Yürütüldüğü Kurum: Muğla Sıtkı Koçman Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye
Tez Danışmanı: Gürcan Çetin
Tezin Onay Tarihi: 2020
Tezin Dili: Türkçe
Özet:
Son yıllarda bilişim kaynaklarının güvenliğini sağlama oldukça önemli bir konu haline gelmiştir. Özellikle internet erişimi sağlayan ağ yapısı ulusal ve uluslarası birçok konumdan gelen saldırıların hedefi olabilmekte ve bu ağ yapısını kullanan kurumlarda kayıplara neden olabilmektedir. Birçok kaynakta saldırı tespit sistemleri olarak da anılan anomali tespit sistemleri de bu tür ağlarda oluşan düzensizlikleri tespit etmeyi hedeflerler. Ancak saldırı tespit sistemlerinin başarısı bu yazılımların arka planda kullandıkları algoritmalar ve öğrenme kapasiteleri ile sınırlıdır. Bu tez çalışmasında, topluluk öğrenmesi algoritmalarından arttırma (boosting) yönteminin zararlı ağ trafiğini belirlemedeki başarım oranı araştırılmıştır. Bu bağlamda AdaBoost, CatBoost, Gradyan Arttırma, LightGBM ve XGBoost algoritmaları Google Colab üzerinde modellenmiş ve CICID2017 veri kümesi üzerinde uygulanmıştır. Ayrıca, tez çalışmasında, CICIDS2017 veri kümesindeki etiketlenmiş ağ saldırılarının tespit edilmesinde Karar Ağaçları yöntemi, arttırma algoritmalarının başarımını karşılaştırmak amacıyla kullanılmıştır. Eğitilen ve test edilen sınıflandırıcıların performansları doğruluk, kesinlik, duyarlılık, F1 değeri, Kappa değeri ve ROC eğrisi gibi performans değerlendirme ölçütleri ile incelenmiştir. Bunlar haricinde başka bir değerlendirme ölçütü olarak da algoritmaların öğrenme süreleri de kullanılmıştır. Çalışma sonucunda F1 değeri açısından en iyi sonucu %99.89 ile XGBoost algoritmasının verdiği ve ayrıca AUC değerlerinin de 0.9989 ile 1'e çok yakın olduğu belirlenmiştir. Ancak bunun yanında yüksek başarım elde edilen diğer arttırma algoritmalarının yanında XGBoost algoritmasının işlem süresinin daha uzun sürdüğü görülmüştür. Hesaplamalarda 0.9773 değerini veren LightGBM algoritması eğitim süresi bakımından incelendiğinde 4.5 dakikalık bir süreyle Karar Ağaçları algoritmasının ardından en hızlı ikinci algoritma olarak tespit edilmiştir.