K-Means Clustering untuk Mengelompokan Tingkat Putus Sekolah Jenjang SMP di Indonesia
Abstract
Mendapatkan pendidikan adalah hak setiap warga Negara Indonesia, dari tingkat Sekolah Dasar (SD), Sekolah
Menengah Pertama (SMP), hingga Sekolah Menengah Atas (SMA) maupun yang sederajat. Namun, ternyata
masih ada siswa yang tidak dapat menyelesaikan pendidikannya pada tingkat tertentu maupun melanjutkan ke
jenjang selanjutnya. Siswa yang tidak dapat menyelesaikan pendidikannya diberikan sebutan putus sekolah. Pada
situs Kementrian Pendidikan dan Kebudayaan (Kemendikbud) terdapat banyak data yang disajikan, salah satunya
adalah data angka putus sekolah dari berbagai jenjang pendidikan dan tahun ajar. Data-data tersebut belum jelas
dikarenakan belum dapat dikategorikan maupun dikelompokan berdasarkan besar kecilnya angka putus sekolah.
Berdasarkan permasalahan tersebut, maka penelitian ini mengolah data angka putus sekolah jenjang SMP di
Indonesia dengan menggunakan terknik pada data mining yaitu clustering (pengelompokan) dengan menggunakan
algoritma K-Means. Pengelompokan pada data tersebut dibagi menjadi tiga kelompok yaitu kelompok tingkat
putus sekolah jenjang SMP rendah, sedang, dan tinggi. Penelitian ini dilakukan menggunakan dua cara yaitu:
perhitungan manual dengan menggunakan Microsoft Excel 2013 dan pengujian menggunakan tools Rapid Miner
versi 5.3.000. Hasil dari penelitian ini yaitu provinsi yang masuk pada kelompok tingkat putus sekolah jenjang
SMP rendah sebanyak 21 provinsi, kelompok sedang sebanyak 12 provinsi dan yang masuk pada kelompok tinggi
sebanyak 1 provinsi.
References
[2] Noor Rizqa. (2015). Skripsi Faktor Penyebab Anak Putus Sekolah Pada Tingkat Smp Di Desa Bumi
Rejo Kecamatan Baradatu Kabupaten Way Kanan Tahun 2014. Biomass Chem Eng, 49(23–6).
[3] Kemendikbud. (2017). Ikhtisar Data Pendidikan dan Kebudayaan Tahun 2017/2018, 1–61.
Retrieved from http://publikasi.data.kemdikbud.go.id
[4] Kemendikbud. (2018). Statistik Persekolahan SMP 2017/2018 (1st ed.). Jakarta Pusat: PDSPK
Kemendikbud. Retrieved from http://repositori.kemdikbud.go.id
[5] Pang-Ning Tan, Michael Steinbach, V. K. (2006). Introduction to Data mining.
https://doi.org/10.1007/430_2009_1
[6] Jiawei Han, Micheline Kamber, J. P. (2012). Data mining – Concepts & Techniques.
https://doi.org/10.1016/B978-0-12-381479-1.00001-0
[7] Aditya, K. B., Setiawan, Y., & Puspitaningrum, D. (2018). Sistem Informasi Geografis Pemetaan
Faktor-Faktor Yang Mempengaruhi Angka Kematian Ibu (Aki) Dan Angka Kematian Bayi (Akb)
Dengan Metode K-Means Clustering (Studi Kasus: Provinsi Bengkulu). Jurnal Teknik Informatika,
10(1), 59–66. https://doi.org/10.15408/jti.v10i1.6817
[8] Windarto, A. P. (2017). Implementation of Data mining on Rice Imports by Major Country of
Origin Using Algorithm Using K-Means Clustering Method. International Journal of Artificial
Intelligence Research, 1(2), 26. https://doi.org/10.29099/ijair.v1i2.17
[9] Suryanto, J. (2017). Analisa Perbandingan Pengelompokkan Curah Hujan 15 Harian Provinsi DIY
Menggunakan Fuzzy Clustering Dan K-Means Clustering, XVI, 229–242
[10] Siregar, A. M., & Puspabhuana, A. (2017). Data mining, I(ISBN: 978-602-5473-96-8), 1–198.
[11] Prasetyo, E. (2014). Data mining Mengolah Data Menjadi Informasi menggunakan Matlab. (A.
Sahala, Ed.) (1st ed.). Yogyakarta: Penerbit Andi.
[12] Prasetyo, E. (2012). Data mining Konsep dan Aplikasi menggunakan Matlab. (N. WK, Ed.) (1st
ed.). Yogyakarta: Penerbit Andi.
[13] Larose, D. T. (2005). Discovering Knowledge In Data An Introduction to Data mining.
https://doi.org/http://dx.doi.org/10.18637/jss.v016.b01
[14] Gudono. (2011). Analisis Data Multivariat.
[15] Halkidi, M., Batistakis, Y., & Vazirgiannis, M. (2001). On Clustering Validation Techniques, 107–145.
[16] Suprihatin. (2011). Klastering K-means untuk Penentuan Nilai Ujian, 1(1), 53–62.
[17] Musthafawi, A. Z., Rosiani, U. D., & Atmoko, A. (2017). Analisis Respon Emosi Marah Wanita
Jawa Dengan Algoritma K-Means Clustering, 33–38.
[18] Zubair Khan , Jianjun Ni , Xinnan Fan, and P. S. (2017). an Improved K -Means Clustering
Algorithm Based on an Adaptive Initial Parameter Estimation Procedure, 13(5).
[19] Zulfadhilah, M. (2016). Log Classification using K-Means Clustering for Identify Internet User
Behaviors. Internatonal Journal of Computer Application, 154(3), 34–39.
https://doi.org/10.5120/ijca2016912076
[20] Aranda, J., & Natasya, W. A. G. (2016). Penerapan Metode K-Means Cluster Analysis Pada Sistem
Pendukung Keputusan Pemilihan Konsentrasi Untuk Mahasiswa International Class Stmik
Amikom Yogyakarta. Semnasteknomedia Online, 4(1), 4-2–1. Retrieved from
https://ojs.amikom.ac.id/index.php/semnasteknomedia/article/view/129
[21] Herawatie, D. (2014). Perbandingan Algoritma Pengelompokan Non-Hierarki untuk Dataset
Dokumen. Seminar Nasional Aplikasi Teknologi Informasi (SNATI) Yogyakarta, 11–16.
[22] Soni, N., & Ganatra, A. (2012). Categorization of Several Clustering Algorithms from Different
Perspective: A Review, 2(8), 63–68.
[23] Maulida, L. (2018). Kunjungan Wisatawan Ke Objek Wisata Unggulan Di Prov . Dki Jakarta
Dengan K-Means. JISKa, 2(3), 167–174.