Perbandingan Algoritma Naive Bayes di dalam Scikit-Learn Python Library dengan Murni Algoritma Naive Bayes: Studi Kasus Klasifikasi Email Berbahaya
DOI:
https://doi.org/10.36805/technoxplore.v9i1.5824Keywords:
Algoritma Naïve Bayes, Dampak email spam, Deteksi spam, Keamanan email, Kebocoran dataAbstract
Saat ini, penggunaan email yang masif telah meluas dan memiliki dampak baik dan buruk. Salah satu dampak negatif adalah munculnya email spam, yang berisi promosi produk, konten pornografi, virus, dan konten tidak penting yang dikirim ke banyak orang tanpa permintaan. Hal tersebut bisa terjadi dikarenakan kebocoran data, penjualan data ilegal, dan pendaftaran kita sendiri ke berbagai grup dan milis-milis tertentu yang disalahgunakan. Untuk mengatasi masalah ini, diperlukan metodologi klasifikasi email yang dapat secara otomatis mendeteksi apakah sebuah email merupakan spam email berbahaya atau bukan. Penelitian ini bertujuan untuk mengembangkan sebuah model klasifikasi email spam dan non-spam menggunakan Algoritma Naïve Bayes dengan menggunakan dua pendekatan, yaitu penggunaan library scikit-learn dan juga matematika murni Algoritma Naïve Bayes. Penggunaan matematika murni suatu algoritma sangat jarang digunakan di dalam perbandingan antar algoritma. Biasanya memperbandingkan beberapa algoritma. Oleh karena itu, peneliti mencoba melakukan perbandingan tersebut di dalam penelitian ini. Hasil penelitian menunjukkan bahwa penggunaan Algoritma Naïve Bayes dengan library scikit-learn mampu melakukan klasifikasi dengan sangat baik, mencapai tingkat akurasi sebesar 97%, sedangkan penerapan metode matematika Naïve Bayes yang menghasilkan tingkat akurasi yang lebih besar yaitu 98%.