Penerapan Algoritme C4.5 untuk Klasifikasi Kasus COVID-19
Abstract
Wabah virus corona versi SARS-nCov2 telah terjadi di akhir tahun 2019 di Wuhan, Tiongkok. Karena kemampuan penularan yang supercepat, virus ini sudah bertransmisi lintas negara. Hampir semua negara terkena wabah virus ini, hingga PBB melalui WHO menjadikan wabah virus ini sebagai pandemi global. Penelitian ini menggunakan teknik klasifikasi data mining dengan algoritme C4.5 dengan alat bantu Orange data mining. Juga dilakukan pengolahan dengan bahasa pemrograman Python menggunakan library standar yang sudah disediakan seperti matplotlib, seaborn, numpy, pandas, dan decisionTree Classification. Klasifikasi dilakukan untuk mengelompokkan data kasus terkonfirmasi, meninggal, dan sembuh dari covid 19 menjadi tinggi dan rendah. Hasil klasifikasi didapatkan nilai AUC 0.871, yang menunjukkan klasifikasi kategori baik, nilai accuracy sebesar 93%, nilai precision sebesar 95%, dan nilai recall 96%. Pada pemodelan menggunakan Python, nilai akurasi yang didapatkan adalah 94%, nilai presisi adalah 98%, dan nilai recall yang didapatkan adalah 95%. Penelitian juga berhasil memprediksi tren kasus di Indonesia dengan menggunakan model fungsi logistic, model standar yang digunakan untuk memprediksi laju pertumbuhan populasi. Hasil prediksi yang didapatkan adalah rata-rata laju pertumbuhan virus adalah 0.0255, puncak pandemi terjadi pada hari ke-196 sampai 200 atau tanggal 14 sampai 18 September 2020, akhir pandemi diprediksi pada hari ke-717 atau tanggal 17 Februari 2022 mendatang.
References
[2] I. Kamila, U. Khairunnisa, and M. Mustakim, “Perbandingan Algoritma K-Means dan K-Medoids untuk Pengelompokan Data Transaksi Bongkar Muat di Provinsi Riau,” J. Ilm. Rekayasa dan Manaj. Sist. Inf., 2019, doi: 10.24014/rmsi.v5i1.7381.
[3] J. Jamal and D. Yanto, “Analisis RFM dan Algoritma K-Means untuk Clustering Loyalitas Customer,” Energy, 2019.
[4] D. Marlina, N. Lina, A. Fernando, and A. Ramadhan, “Implementasi Algoritma K-Medoids dan K-Means untuk Pengelompokkan Wilayah Sebaran Cacat pada Anak,” J. CoreIT J. Has. Penelit. Ilmu Komput. dan Teknol. Inf., 2018, doi: 10.24014/coreit.v4i2.4498.
[5] E. H. S. Atmaja, “Implementation of k-Medoids Clustering Algorithm to Cluster Crime Patterns in Yogyakarta,” Int. J. Appl. Sci. Smart Technol., 2019, doi: 10.24071/ijasst.v1i1.1859.
[6] W. Katrina, H. J. Damanik, F. Parhusip, D. Hartama, A. P. Windarto, and A. Wanto, “C.45 Classification Rules Model for Determining Students Level of Understanding of the Subject,” 2019, doi: 10.1088/1742-6596/1255/1/012005.
[7] D. Hartama, A. Perdana Windarto, and A. Wanto, “The Application of Data Mining in Determining Patterns of Interest of High School Graduates,” 2019, doi: 10.1088/1742-6596/1339/1/012042.
[8] M. Widyastuti, A. G. Fepdiani Simanjuntak, D. Hartama, A. P. Windarto, and A. Wanto, “Classification Model C.45
on Determining the Quality of Custumer Service in Bank BTN Pematangsiantar Branch,” 2019, doi: 10.1088/1742-6596/1255/1/012002.
[9] Y. Mardi, “Data Mining : Klasifikasi Menggunakan Algoritma C4.5,” J. Edik Inform., vol. 2, no. 2, pp. 213–219, 2017.
[10] P. Assiroj, “Kajian Perbandingan Teknik Klasifikasi AlgoritmaC4.5, Naive Bayes, dan CART untk Prediksi Kelulusan Mahasiswa (Studi Kasus: STMIK ROSMA Karawang),” Media Inform., vol. 15, no. 2, pp. 1–17, 2016, doi: 10.5281/zenodo.1184054.
[11] E. E. Pramadhani and T. Setiadi, “210945-Penerapan-Data-Mining-Untuk-Klasifikasi.Pdf.” 2014.
[12] S. Defiyanti and M. Jajuli, “Integrasi Metode Klasifikasi Dan Clustering dalam Data Mining,” no. March, pp. 39–44, 2015.
[13] S. Hendrian, “Algoritma Klasifikasi Data Mining Untuk Memprediksi Siswa Dalam Memperoleh Bantuan Dana Pendidikan,” Fakt. Exacta, vol. 11, no. 3, pp. 266–274, 2018, doi: 10.30998/faktorexacta.v11i3.2777.
[14] I. H. Witten, E. Frank, M. A. Hall, and C. J. Pal, Data Mining: Practical Machine Learning Tools and Techniques. 2016.
[15] W. T. Ina, “Klasifikasi Data Rekam Medis Berdasarkan Kode Penyakit Internasional Menggunakan Algoritma C4.5,” J. Media Elektro, 2013.
[16] K. Hastuti, “Analisis komparasi algoritma klasifikasi data mining untuk prediksi mahasiswa non aktif,” Semin. Nas. Teknol. Inf. Komun. Terap., 2012.
[17] H. D. Honesqi, “Klasifikasi Data Mining Untuk Menentukan Tingkat Persetujuan Kartu Kredit,” J. Teknoif, vol. 5, no. 2, pp. 57–62, 2017, doi: 10.21063/jtif.2017.v5.2.57-62.
[18] A. F. Watratan, A. P. B, and D. Moeis, “Implementasi Algoritma Naive Bayes Untuk Memprediksi Tingkat Penyebaran Covid-19 Di Indonesia,” J. Appl. Comput. Sci. Technol. ( Jacost ), vol. 1, no. 1, pp. 7–14, 2020.
[19] J. Han, M. Kamber, and J. Pei, Data Mining: Concepts and Techniques. Elsevier B.V., 2012.
[20] M. Sokolova and G. Lapalme, “A systematic analysis of performance measures for classification tasks,” Inf. Process.Manag., vol. 45, no. 4, pp. 427–437, 2009, doi: 10.1016/j.ipm.2009.03.002.
[21] J. Xu, Y. Zhang, and D. Miao, “Three-way confusion matrix for classification: A measure driven view,” Inf. Sci.(Ny)., vol. 507, no. July, pp. 772–794, 2020, doi: 10.1016/j.ins.2019.06.064.