KOMPARASI MODEL DECISION TREE DAN RANDOM FOREST UNTUK MEMPREDIKSI PENYAKIT JANTUNG
Abstract
Data pasien penyakit jantung yang diperoleh dari Kementrian Kesehatan Republik Indonesia tahun 2020 mejelaskan bahwa, penyakit jantung mengalami peningkatan setiap tahunnya dan menempati peringkat tertinggi penyebab kematian di Indonesia terutama pada usia-usia produktif. Apabila penderita penyakit jantung tidak ditangani dengan baik, maka di usia produktif seorang pasien bisa mengalami kematian lebih cepat. Sehingga, perlunya sebuah model prediksi yang mampu membantu tenaga medis untuk menyelesaikan masalah-masalah Kesehatan. Menggunakan proses klasifikasi algoritma Random Forest dan Decision Tree dengan mengola data tersebut. Tujuan penelitian untuk mengetahui performa teknik model algoritma machine learning pada algoritma Decision Tree C45 dan Random Forest Clasifier. Pengunaan teknik confusion matrik untuk pengujian Precision, Recall, dan F1-SCORE, serta Accuracy. Berdasarkan hasil penelitian yang telah dilakukan teknik pengujian K-Fold 10 dengn teknik Cofusion matrix, Random Forest merupakan salah satu teknik prediksi terbaik yang memiliki Accurasy lebih besar 90,72% dan evaluasi menggunakan Receiver Operating Characteristics (ROC) curve untuk mengetahui nilai kinerja suatu algoritma dengan nilai Area Under Curve (AUC) pada model sebesar 0,801. Dibandingkan penerapan model prediksi mengguanakan algoritma Decision Tree C45 tingkat prediksi dengan accuracy sebesar 86,5 dan nilai kinerja algoritma dengan hasil Area Under Curve (AUC) yang kurang baik sebesar 0,588. Berdasarkan evaluasi penelitian yang telah dilakukan pada data penyakit jantung, algoritma Random Forest sangat cocok untuk prediksi data penyakit jantung yang berasal dari Centers for Disease Control and Prevention (2020) yang mampu menghasilkan model prediksi yang lebih baik dengan teknik confucion matrix serta perhitungan K-Fold cross validation.
References
[2] BHF, “UK Factsheet,” Br. Hear. Found., no. April, pp. 1–21, 2019.
[3] J. J. Pangaribuan, C. Tedja, and S. Wibowo, “PERBANDINGAN METODE ALGORITMA C4.5 DAN EXTREME LEARNING MACHINE UNTUK MENDIAGNOSIS PENYAKIT JANTUNG KORONER,” 2019.
[4] A. Rohman and D. M. Rochcham, “MODEL ALGORITMA C4.5 UNTUK PREDIKSI PENYAKIT JANTUNG,” 2018.
[5] N. Khasanah, R. Komarudin, N. Afni, Y. I. Maulana, and A. Salim, “Skin Cancer Classification Using Random Forest Algorithm,” Sisfotenika, vol. 11, no. 2, p. 137, 2021, doi: 10.30700/jst.v11i2.1122.
[6] S. Ath et al., “Jurnal Teknologi Terpadu HYBRID MACHINE LEARNING MODEL UNTUK MEMPREDIKSI PENYAKIT JANTUNG DENGAN METODE LOGISTIC REGRESSION DAN RANDOM,” vol. 8, no. 1, pp. 40–46, 2022.
[7] I. M. El-Hasnony, O. M. Elzeki, A. Alshehri, and H. Salem, “Multi-Label Active Learning-Based Machine Learning Model for Heart Disease Prediction,” Sensors, vol. 22, no. 3, 2022, doi: 10.3390/s22031184.
[8] D. Derisma, “Perbandingan Kinerja Algoritma untuk Prediksi Penyakit Jantung dengan Teknik Data Mining,” J. Appl. Informatics Comput., vol. 4, no. 1, pp. 84–88, 2020, doi: 10.30871/jaic.v4i1.2152.
[9] “CDC - 2020 BRFSS Survey Data and Documentation.” https://www.cdc.gov/brfss/annual_data/annual_2020.html (accessed Sep. 01, 2022).
[10] S. Polamuri, “HOW THE LOGISTIC REGRESSION MODEL WORKS,” Dataaspirant, 2017. https://dataaspirant.com/how-logistic-regression-modelworks/ (accessed Aug. 04, 2022).
[11] A. Fahlevi, “Proses Data Mining KDD,” 2021. https://sis.binus.ac.id/2021/09/30/proses-data-mining-kdd/.
[12] W. Sullivan, “Machine Learning For Beginners Guide Algorithms,” 2017. https://www.perlego.com/book/975057/machine-learning-for-beginners-guidealgorithms-supervised-unsupervsied-learning-decision-tree-random-forest-introduction-pdf.
[13] A. Cherfi, K. Nouira, and A. Ferchichi, “Very Fast C4.5 Decision Tree Algorithm,” Appl. Artif. Intell., vol. 32, no. 2, pp. 119–137, 2018, doi: 10.1080/08839514.2018.1447479.
[14] M. Kretowski, “Evolutionary Decision Trees in Large-Scale Data Mining,” vol. 59, 2019, doi: 10.1007/978-3-030-21851-5.
[15] M. Mia, A. F. N. Masruriyah, and A. R. Pratama, “The Utilization of Decision Tree Algorithm In Order to Predict Heart Disease,” J. Sisfotek Glob., vol. 12, no. 2, p. 138, 2022, doi: 10.38101/sisfotek.v12i2.551.
[16] A. Primajaya and B. N. Sari, “Random Forest Algorithm for Prediction of Precipitation,” Indones. J. Artif. Intell. Data Min., vol. 1, no. 1, p. 27, 2018, doi: 10.24014/ijaidm.v1i1.4903.
[17] S. Zitao, “3 min of Machine Learning: Cross Vaildation,” Zitao’s Web, 2020. https://zitaoshen.rbind.io/project/machine_learning/machine-learning-101- cross-vaildation/ (accessed Aug. 31, 2022).
[18] A. Rohman and D. M. Rochcham, “MODEL ALGORITMA C4.5 UNTUK PREDIKSI PENYAKIT JANTUNG,” J. Neo Tek., vol. 4, no. 2, pp. 52–54, 2018.