Analisis Kinerja Algoritma Naïve Bayes dan Random Forest dalam Memprediksi Hasil Klasemen English Premier League

  • Muhamad Ibnu Rizky Universitas Buana Perjuangan Karawang
  • Sutan Faisal Universitas Buana Perjuangan Karawang
  • Iman Sanjaya Universitas Buana Perjuangan Karawang
  • Deden Wahiddin Universitas Buana Perjuangan Karawang
Keywords: Machine Learning, Naïve Bayes, Random Forest, Prediksi Klasemen, Premier League

Abstract

English Premier League dikenal sebagai liga sepak bola yang paling kompetitif dan menarik untuk dianalisis secara statistik. Penelitian ini dilakukan untuk membandingkan kinerja dua algoritma machine learning, yaitu Naïve Bayes dan Random Forest, dalam memprediksi posisi akhir klasemen berdasarkan data statistik pertandingan. Data dikumpulkan melalui teknik web scraping dari situs FBref.com, yang mencakup data tiga musim kompetisi serta sejumlah fitur relevan lainnya. Setelah melalui tahap prapemrosesan (preprocessing), data dibagi menjadi data pelatihan dan data pengujian dengan rasio 80:20. Evaluasi terhadap model dilakukan menggunakan berbagai metrik, seperti akurasi, presisi, recall, F1-score, serta confusion matrix. Hasil pengujian menunjukkan bahwa algoritma Naïve Bayes memperoleh akurasi sebesar 69,83% dan menunjukkan kinerja yang cukup baik dalam memprediksi hasil seri. Di sisi lain, algoritma Random Forest menunjukkan performa yang lebih unggul dengan akurasi mencapai 99,57%, serta nilai presisi, recall, dan F1-score yang tinggi dan konsisten. Prediksi klasemen akhir yang dihasilkan oleh Random Forest juga lebih mendekati hasil sebenarnya. Berdasarkan temuan tersebut, dapat disimpulkan bahwa Random Forest lebih mampu menangani kompleksitas data pertandingan sepak bola dan lebih direkomendasikan untuk digunakan dalam sistem prediksi di bidang analitik olahraga.

References

[1] M. N. Fauzan and M. N. Bawono, “Analisis Statistik Pertandingan Tim Nasional Sepak Bola Indonesia U-18 Di Piala Aff 2019,” J. Kesehat. Olahraga, vol. 09, no. 03, pp. 371–380, 2021.
[2] E. Wheatcroft, “Forecasting football matches by predicting match statistics,” J. Sport. Anal., vol. 7, no. 2, pp. 77–97, 2021, doi: 10.3233/jsa-200462.
[3] Syahril Dwi Prasetyo, Shofa Shofiah Hilabi, and Fitri Nurapriani, “Analisis Sentimen Relokasi Ibukota Nusantara Menggunakan Algoritma Naïve Bayes dan KNN,” J. KomtekInfo, vol. 10, pp. 1–7, 2023, doi: 10.35134/komtekinfo.v10i1.330.
[4] W. Winata, L. P. Dewi, and A. N. Tjondrowiguno, “Prediksi Skor Pertandingan Sepak Bola Menggunakan Neuroevolution of Augmenting Topologies dan Backpropagation,” J. Infra, vol. 8, no. 1, 2020.
[5] R. A. Pratama, W. Apriandari, and D. Indrayana, “Prediksi Hasil Pertandingan Liga Serie A Menggunakan Metode Naïve Bayes,” J. SAINTIKOM (Jurnal Sains Manaj. Inform. dan Komputer), vol. 22, no. 2, p. 364, 2023, doi: 10.53513/jis.v22i2.8448.
[6] A. A. Karim, M. A. Prasetyo, and M. R. Saputro, “Perbandingan Metode Random Forest, K-Nearest Neighbor, dan SVM Dalam Prediksi Akurasi Pertandingan Liga Italia,” Pros. Semin. Nas. Teknol. dan Sains , vol. 2, pp. 377–342, 2023, [Online]. Available: http://www.football-data.co.uk.
[7] M. Ridho Handoko, “Sistem Pakar Diagnosa Penyakit Selama Kehamilan Menggunakan Metode Naive Bayes Berbasis Web,” J. Teknol. dan Sist. Inf., vol. 2, no. 1, pp. 50–58, 2021, [Online]. Available: http://jim.teknokrat.ac.id/index.php/JTSI
[8] C. Liu, Z. Gu, and J. Wang, “A Hybrid Intrusion Detection System Based on Scalable K-Means+ Random Forest and Deep Learning,” IEEE Access, vol. 9, pp. 75729–75740, 2021, doi: 10.1109/ACCESS.2021.3082147.
[9] T. Nurmayanti, D. Hartini, T. Rohana, S. Arum, P. Lestari, and D. Wahiddin, “Comparison of K-Nearest Neighbors and Convolutional Neural Network Algorithms in Potato Leaf Disease Classification,” J. Sist. Inf. dan Ilmu Komput. Prima, vol. 8, no. 1, pp. 360–372, 2024.
Published
2026-01-31