PERBANDINGAN FEATURE SELECTION ANTARA BACKWARD METHOD DAN STEPWISE METHOD PADA DATASET PRIMARY TUMOR
Keywords:
Feature Selection, Backward Method, Stepwise Method, Primary Tumor, AccuracyAbstract
Feature selection dalam data mining bertujuan mengidentifikasi dan mempertahankan fitur-fitur relevan, meningkatkan kinerja model, serta mempermudah interpretasi, yang menghasilkan model yang efisien dan efektif untuk pengambilan keputusan lebih baik. Penelitian ini bertujuan untuk membandingkan kinerja dua Feature Selection, yaitu antara Backward Method dan Stepwise Method, pada dataset Primary Tumor. Pada dataset ini memberikan informasi tentang berbagai jenis tumor primer yang didiagnosis pada pasien di berbagai lokasi dalam tubuh. Metode yang digunakan untuk mengukur kinerja dua feature selection pada penelitian ini adalah menggunakan nilai accuracy. Nilai accuracy yang lebih tinggi menunjukkan bahwa model yang dikembangkan dengan fitur-fitur yang dipilih melalui metode backward atau metode stepwise memiliki kemampuan yang lebih baik dalam memprediksi data uji atau memodelkan hubungan dalam dataset. Pada penelitian ini, didapatkan hasil bahwa accuracy dari metode backward cenderung lebih tinggi yaitu sebesar 66.774 (0.021) sedangkan accuracy dari metode stepwise adalah sebesar 65.806 (0.008). Hal ini menunjukkan bahwa dengan menggunakan metode backward cenderung lebih baik dalam memprediksi variabel dependen dibandingkan dengan model yang dibangun menggunakan metode stepwise dalam konteks data yang digunakan.
References
Arie, Gunawan (2023) Pengantar Sistem Informasi Kesehatan. PT. Literasi Nusantara Abadi Grup.
Arauzo-Azofra, J. L. Aznarte, and J. M. Benítez, “Empirical study of feature selection methods based on individual feature evaluation for
classification problems,” Expert Systems with Applications, Vol, 38. 8170-8177, 2011.
Barro, R. A., Sulvianti, I. D., dan Afendi, F. M. 2013. Penerapan Synthetic Minority Oversampling Technique (SMOTE) Terhadap Data Tidak Seimbang Pada Pembuatan Model Komposisi Jamu. Journal of Statistics. 1(1).
Han, J., Kamber, M., and Pei, J., 2011. Data Mining Concepts and Techniques. (3rd ed.). USA: Morgan Kaufmann.
Han, J., Kamber, M., and Pei, J., 2012, Data Mining: Concepts and Techniques (Waltham, MA: Elsevier).
Leto, C., Sujana, D., Windyasari, V. S., Mahmudin, & Muhammad, R. (2023). KONSEP DATA MINING DAN PENERAPAN.
Nugroho, W. (2020). Optimasi Metode K-Nearest Neighbours dengan Backward Elimination Menggunakan Dataset Software Effort Estimation Bianglala Informatika. Bianglala Informatika, 8(2), 129–133.
S. Doraisami, dan S. Golzari, “A Study on Feature selection and Classification Techniques for Automatic Genre Classification of Traditional Malay Music, Content-Based Retrieval, Categorization and Similarity” 2008.
Zwitter, M., dan M., Soklic. (1988). Primary Tumor. https://archive.ics.uci.edu/dataset/83/primary+tumor.