Perbandingan Kinerja Model Linear Discriminant Analysis dan Decission Tree pada Studi Kasus Dataset Audit Data

Authors

  • Wahyu Aprillia Sari Universitas Cenderawasih
  • Febryana D. Hanafi
  • Halle F. P. Watory
  • Muhammad Asghar Nazal

Abstract

Penelitian ini akan membandingkan dua metode penambangan data yang umum digunakan, yaitu Linear Discriminant Analysis (LDA) dan Decission Tree dengan nilai accuracy 99,6% memiliki kinerja lebih baik dan relatif optimal pada dataset audit data. Dengan tujuan mengoptimalkan analisis statistik audit data, pengujian ini mengidentifikasi model mana yang lebih baik dan relatif optimal pada dataset audit data. Penelitian dilakukan untuk membandingkan performa machine learning dengan memilih subkumpulan fitur yan relevan dari data. Perbandingan dengan menggunnakan nilai accuracy menunjukkan jika model Decission Tree dan hasil accuracy sebesar 99,6%.

References

Achmad, B. D. M., Slamat, F,. & ITATS, F. T. I. (2012). Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Desiccion Tree. Jurnal IPTEK, 16(1).

Ansori, Y., & Khadijah, F. H. H. (2022). Perbandingan Metode Machine Learning Dalam Analisis Sentimen Twitter. Jurnal Sistem Dan Teknologi Informasi. Jawa Timur: Universitas Islam Negeri Maulana Malik Ibrahim.

Basuki, A., & Iwan, S. (2003). Decision Tree. Surabaya: Politeknik Electronika Negeri.

Clark, A. (2003). Pre-processing Very Noisy Text. Proceedings of Workshop on Shallow Processing of Large Corpora (pp. 12-22). Lancaster: Lancaster University.

Fatmawati. (2016). Perbandingan Algoritma Klasifikasi Data Mining Model C4.5 Dan Naive Bayes Untuk Prediksi Penyakit Diabetes. Jurnal Techno Nusa Mandiri, XIII (1), 50–59.

Ghorbani, R., & Ghousi, R. (2019). Predictive Data Mining Approaches In Medical Diagnosis: A Review Of Some Diseases Prediction. International Journal of Data and Network Science, 3, 47–70. https://doi.org/10.5267/j.ijdns.2019.1.003.

Gorunescu, F. (2011). Data Mining: Concepts, Models and Techniques (Vol. 12). Berlin, Heidelberg: Springer Berlin Heidelberg. https://doi.org/10.1007/978-3-642-19721-5.

Han, J., Kamber, M., & Pei, J. (2011). Data Mining: Concepts and Techniques (3rd)., Elsevier. https://myweb.sabanciuniv.edu/rdehkharghani/files/2016/02/The-Morgan-Kaufmann-Series-in-Data-Management-Systems-Jiawei-Han-Micheline-Kamber-Jian-Pei-Data-Mining.-Concepts-and-Techniques-3rd-Edition-Morgan-Kaufmann-2011.pdf.

Hooda, N. (2018). Audit Data. https://archive.ics.uci.edu/dataset/475/audit+data.

Tatham, R.L., Hair, J.F, Anderson, R.E., dan Black, W.C., (1998), “Multivariate Data Analysis”, Prentice Hall, New Jersey.

Wei, Y., Gu, K., & Tan, L. (2022). A Positioning Method For Maize Seed Lasercutting Slice Using Linear Discriminant Analysis Based On Isometric Distance Measurement. Information Processing In Agriculture, 9(2), 224-232.

Zhang, Y., Xin, Y., Li, Q., Ma, J., Li, S., Lv, X., & Lv, W. (2017). Empirical Study Of Seven Data Mining Algorithms On Different Characteristics Of Datasets For Biomedical Classification Applications. Biomedical Engineering OnLine, 16(1), 125. https://doi.org/10.1186/s12938-017-0416-x.

Downloads

Published

2024-01-30