PERBANDINGAN METODE KLASIFIKASI DECISSION TREE, NAIVE BAYES, K-NEAREST-NEIGHBOR, DAN LOGISTIC REGRESSION PADA DATASET PHISHING
Keywords:
Decission tree, naive bayes, k-nearest-neighbor, logistic regression, accuracy, ROCAbstract
Dalam menentukan algoritma yang digunakan pada machine learning, diperlukan pengujian kinerja terhadap metode klasifikasi yang digunakan. Pada artikel ini akan dibandingkan kinerja dari metode klasifikasi Decission Tree, Naive Bayes, K-Nearest-Neighbor, dan Logistic Regression pada dataset phising sehingga dapat memberikan gambaran tentang metode yang relatif optimal untuk dipilih sebagai tahap awal dalam memilih algoritma yang akan diterapkan. Metode yang digunakan untuk mengukur kinerja empat model pada penelitian ini adalah nilai accuracy, kurva ROC dan nilai AUC. Semakin tinggi nilai accuracy dan nilai AUC maka semakin baik suatu model. Nilai accuracy dan nilai AUC yang dihasilkan pada model logistic regression paling tinggi dibandingkan tiga model lainnya.
References
Gorunescu, F. (2011). Data Mining:Concepts,Models and Techniques (Vol. 12). Berlin, Heidelberg: Springer Berlin Heidelberg. https://doi.org/10.1007/978-3-642- 19721-5
Han, J., Kamber, M., & Pei, J. (2011). Data Mining:Concepts and Techniques (3rd ed.). Elsevier. https://doi.org/10.1016/B978-0-12-381479-1.00001-0
https://www.kaggle.com/datasets/shashwatwork/web-page-phishing-detection-dataset. Diakses tanggal : 27 September 2022. Pukul 19.15.