Penerapan Algoritma Machine Learning untuk Mengklasifikasikan Polusi Udara di Wilayah DKI Jakarta
Abstract
Polusi udara di DKI Jakarta merupakan masalah serius dengan tingkat polusi tertinggi di Asia Tenggara. Sumber utama polusi udara berasal dari sektor transportasi, industri, dan pembakaran sampah. Keterbatasan sistem pemantauan konvensional mendorong pemanfaatan kecerdasan buatan, khususnya algoritma machine learning, untuk meningkatkan akurasi klasifikasi kualitas udara. Penelitian ini membandingkan performa empat algoritma, yaitu Support Vector Machine (SVM), Gradient Boosting, Random Forest, dan Decision Tree, dalam mengklasifikasikan tingkat polusi udara di Jakarta. Dataset yang digunakan terdiri atas 1.675 data Indeks Standar Pencemar Udara (ISPU) yang diperoleh dari Dinas Lingkungan Hidup Jakarta selama periode Januari hingga November 2024. Parameter yang digunakan meliputi PM10, PM2.5, SO₂, CO, O₃, dan NO₂. Proses penelitian mencakup tahapan pembersihan data, normalisasi, reduksi dimensi menggunakan Principal Component Analysis (PCA), pembangunan model melalui pembagian data latih dan data uji dengan rasio 80:20, serta evaluasi performa menggunakan metrik akurasi, presisi, recall, dan F1-score. Hasil evaluasi menunjukkan bahwa seluruh algoritma menghasilkan tingkat akurasi yang tinggi. Algoritma Random Forest mencapai performa terbaik dengan akurasi sebesar 93,71%, diikuti oleh Decision Tree sebesar 93,41%, Gradient Boosting sebesar 92,81%, dan Support Vector Machine sebesar 92,51%. Temuan ini mendukung penerapan machine learning sebagai solusi yang efektif untuk pemantauan polusi udara di Jakarta.
References
[2] Geneva: World Health Organization, “WHO global air quality guidelines,” Part. matter (PM2.5 PM10), ozone, nitrogen dioxide, sulfur dioxide carbon monoxide, pp. 1–360, 2021.
[3] Asiva Noor Rachmayani, “Statistik Transportasi Provinsi DKI Jakarta 2022/2023,” p. 6, 2023.
[4] G. Syuhada et al., “Impacts of Air Pollution on Health and Cost of Illness in Jakarta, Indonesia,” Int. J. Environ. Res. Public Health, vol. 20, no. 4, 2023, doi: 10.3390/ijerph20042916.
[5] I. Irwansyah, A. D. Wiranata, and T. T. M, “Komparasi Algoritma Decision Tree, Naive Bayes Dan K-Nearest Neighbor Untuk Menentukan Kualitas Udara Di Provinsi Dki Jakarta,” Infotech J. Technol. Inf., vol. 9, no. 2, pp. 193–198, 2023, doi: 10.37365/jti.v9i2.203.
[6] A. Hidayat, “Dampak Perubahan Iklim Terhadap Pertanian Dan Strategi Adaptasi Yang Diterapkan Oleh Petani (2),” Univ. Medan Area, 2023.
[7] Rosatul Umah and Eva Gusmira, “Dampak Pencemaran Udara terhadap Kesehatan Masyarakat di Perkotaan,” Profit J. Manajemen, Bisnis dan Akunt., vol. 3, no. 3, pp. 103–112, 2024, doi: 10.58192/profit.v3i3.2246.
[8] M. Pandia, “Kajian Literatur Multimedia Retrieval : Machine Learning Untuk Pengenalan Wajah,” J. Ilmu Komput. dan Sist. Inf., vol. 7, no. 1, pp. 161–166, 2024, doi: 10.55338/jikomsi.v7i1.2758.
[9] I. I. Ridho and G. Mahalisa, “Analisis Klasifikasi Dataset Indeks Standar Pencemaran Udara (Ispu) Di Masa Pandemi Menggunakan Algoritma Support Vector Machine (Svm),” Technol. J. Ilm., vol. 14, no. 1, p. 38, 2023, doi: 10.31602/tji.v14i1.8005.
[10] R. E. Putra, M. Kalista, and ..., “Klasifikasi prediksi kualitas udara Menggunakan metode Support Vector Machine (SVM),” eProceedings …, vol. 10, no. 4, pp. 3790–3796, 2023, [Online]. Available: https://openlibrarypublications.telkomuniversity.ac.id/index.php/engineering/article/view/20808%0Ahttps://openlibrarypublications.telkomuniversity.ac.id/index.php/engineering/article/download/20808/20307
[11] J. Nasional, S. Informasi, N. Christina, and T. Linda, “Komparasi Algoritma Naïve Bayes dan Gradient Boosting untuk Prediksi Pasien Diabetes,” vol. 02, pp. 118–125, 2024.
[12] A. T. Pratiwi, A. Barizi, M. I. Maulana, and P. Rosyani, “Systematic Literature Review Penerapan Gradient Boosting Untuk Klasifikasi Penyakit Diabetes Tipe 2,” vol. 2, no. 3, pp. 454–458, 2024.
[13] M. Asgari, W. Yang, and M. Farnaghi, “Spatiotemporal data partitioning for distributed random forest algorithm: Air quality prediction using imbalanced big spatiotemporal data on spark distributed framework,” Environ. Technol. Innov., vol. 27, p. 102776, 2022, doi: 10.1016/j.eti.2022.102776.
[14] H. Hasna, Nonong Amalita, Dony Permana, and Admi Salma, “Random Forest Implementation for Air Pollution Standard Index Classification in DKI Jakarta 2022,” UNP J. Stat. Data Sci., vol. 2, no. 2, pp. 226–233, 2024, doi: 10.24036/ujsds/vol2-iss2/173.
[15] A. Ilyasa et al., “Diagnosa Penyakit Kulit Wajah Dengan Metode Decision Tree dan Algoritma C4 . 5,” vol. 6, pp. 88–98, 2025.
[16] A. Z. D. Nur Adiya, A. F. Desvita, A. Fidela, D. Amelia, and T. Astuti, “Penerapan Data Mining Untuk Klasifikasi Kualitas Udara di Daerah Istimewa Yogyakarta Menggunakan Algoritma C4.5,” JDMIS J. Data Min. Inf. Syst., vol. 2, no. 2, pp. 59–65, 2024, doi: 10.54259/jdmis.v2i2.2800.
[17] A. W. Mucholladin, F. A. Bachtiar, and M. T. Furqon, “Klasifikasi Penyakit Diabetes menggunakan Metode Support Vector Machine,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 5, no. 2, pp. 622–633, 2024, [Online]. Available: http://j-ptiik.ub.ac.id
