PENERAPAN ALGORITMA K-NEAREST NEIGHBOR DAN C4.5 UNTUK KLASIFIKASI PENYAKIT KANKER SERVIKS

  • Muhammad Ridzki Ramadhan
  • Yana Cahyana
  • Ayu Ratna Juwita
Keywords: Klasifikasi, Kanker Serviks, K-Nearest Neighbor (KNN), C4.5

Abstract

Kanker serviks merupakan penyebab kematian nomor dua pada perempuan di dunia setelah kanker payudara, sedangkan di Indonesia kanker serviks menduduki peringkat pertama, hal tersebut yang menjadikan masalah kesehatan reproduksi di Indonesia masih menjadi sorotan utama. K-Nearest Neighbor (KNN) adalah suatu metode algoritma supervised learning, di mana kelas yang paling banyak muncul (mayoritas) yang akan menjadi kelas hasil klasifikasi. Sedangkan Algoritma C4.5 merupakan sebuah algoritma klasifikasi yang digunakan untuk membangun decision tree (pohon keputusan). Penelitian kali ini bertujuan untuk mengklasifikasikan data resiko kebiasaan kanker serviks dengan menerapkan algoritma KNN dan C4.5. Data diambil dari website UCI Machine Learning sebanyak 72 data dan 19 atribut setelah dilakukan seleksi menjadi 63 data dan 5 atribut yang diantaranya adalah dukungan sosial instrumental, pengetahuan pemberdayaan, kemampuan pemberdayaan dan keinginan pemberdayaan lalu untuk kanker serviks dijadikan untuk atribut kelas. Pengujian ini dilakukan dengan cara manual, pemrograman python dan rapidminer. Penghitungan algoritma KNN telah dilakukan pada pengujian menggunakan rapidminer dengan cross validation kemudian menghasilkan akurasi 80.95% dan dengan split validation membagi data menjadi data training dan testing sebesar 80 : 20 menghasilkan akurasi 83.33%, sedangkan algoritma C4.5 dengan cross validation kemudian menghasilkan akurasi 76.19% dan dengan split validation membagi data menjadi data training dan testing sebesar 80 : 20 menghasilkan akurasi 75.00%. Untuk pengujian dengan pemrograman python dengan split validation membagi data menjadi data training dan testing sebesar 80 : 20 kemudian algoritma KNN mendapatkan hasil akurasi 84.00%, sedangkan algoritma C4.5 menghasilkan akurasi 69.00%. Sehingga algoritma KNN dengan pengujian Python mendapatkan akurasi terbaik pada penelitian ini dengan nilai akurasi 84.00%.

References

[1] R. M. Andanni, “Perancangan Strategi Kampanye Bahaya Kanker Serviks Bagi Remaja Putri Usia 13-18 Tahun,” 2016, [Online]. Available: https://repository.its.ac.id/id/eprint/75601%0A.
[2] T. Praningki and I. Budi, “Sistem Prediksi Penyakit Kanker Serviks Menggunakan CART, Naive Bayes, dan k-NN,” Creat. Inf. Technol. J., vol. 4, no. 2, p. 83, 2018, doi: 10.24076/citec.2017v4i2.100.
[3] S. S. Arifin, A. M. Siregar, A. Ratna, and T. Al Mudzakir, “Klasifikasi Penyakit Kanker Serviks Menggunakan Algoritma Support Vector Machine ( SVM),” no. Ciastech, pp. 521–528, 2021.
[4] S. Nurjanah, A. M. Siregar, and D. S. Kusumaningrum, “Penerapan Algoritma K – Nearest Neighbor (Knn) Untuk Klasifikasi Pencemaran Udara Di Kota Jakarta,” Sci. Student J. Information, Technol. Sci., vol. 1, no. 2, pp. 71–76, 2020.
[5] F. M. Hana, “Klasifikasi Penderita Penyakit Diabetes Menggunakan Algoritma Decision Tree C4.5,” J. SISKOM-KB (Sistem Komput. dan Kecerdasan Buatan), vol. 4, no. 1, pp. 32–39, 2020, doi: 10.47970/siskom-kb.v4i1.173.
Published
2024-01-31