Analisis Sentimen Menggunakan Algoritma K-Means untuk Mengetahui Kalimat Positif maupun Negatif pada Buletin APTIKOM

Anton Junior; Hanny Handayani; Anis Masruriyah

Anton Romadoni Junior Universitas Buana Perjuangan Karawang
Hanny Hikmayanti Handayani Universitas Buana Perjuangan Karawang
Anis Fitri Nur Masruriyah Universitas Buana Perjuangan Karawang

Keywords: Analisis Sentimen, Buletin APTIKOM, K-Means, Sum of Square Error, Term – Inverse Document Frequency, Text Mining

Abstract

Kurangnya pemahaman literasi membuat masyarakat mengalami kesulitan dalam mengeksplorasi pengetahuan. Sehingga, Asosiasi Pendidikan Tinggi Ilmu Komputer (APTIKOM) membuat media informasi secara daring yang dapat menjelaskan secara detail terhadap pemahaman masyarakat yang berbeda - beda. Media tersebut diberi nama Buletin APTIKOM yang terbit setiap bulan sejak tahun 2020. Melalui buletin ini diharapkan dapat memberikan pengetahuan terhadap masyarakat yang awam dalam teknologi terkini. Namun, dari penerbitan buletin pada aplikasi buletin APTIKOM, tidak adanya pengecekan mengenai sentimen penulisan berupa kalimat positif maupun negatif. Maka dari itu, dibuatnya penelitian ini adalah untuk mencari kalimat positif maupun negatif dalam buletin APTIKOM. Data yang digunakan merupakan data yang diambil dari Buletin APTIKOM. Cara untuk mengetahui sentimen analisis pada buletin tersebut terdapat beberapa proses yaitu dengan menggunakan Text Processing, Term Frequency – Inverse Document Frequency (TF-IDF), algoritma K- Means dan Sum of Square Error (SSE) sebagai evaluasi. Implementasi proses tersebut yaitu menggunakan Bahasa pemrograman R atau bisa disebut R Studio. Hasil dari penelitian menunjukan bahwa dari akurasi K-means dengan dataset berupa 115 kalimat terdapat 1 kalimat bernilai negatif dan 12 kalimat bernilai positif. Dari hasil evaluasi SSE semakin banyak cluster yang digunakan semakin besar nilai SSE dan nilai akurasi k-means semakin kecil. Dapat disimpulkan SSE terbaik bernilai 75.0% dari 2 cluster dan akan bernilai besar jika ditambahkannya cluster secara terus menerus dengan nilai maksimal sampai 100%.

References

[1] D. S. Pamungkas, N. A. Setiyanto, and E. Dolphina, “Analisis Sentiment Pada Sosial Media Twitter Menggunakan Naive Bayes Classifier Terhadap Kata Kunci ‘Kurikulum 2013’’,’” vol. 14, no. 4, pp. 299–314, 2015.
[2] A. Karami, M. Lundy, F. Webb, and Y. K. Dwivedi, “Twitter and Research: A Systematic Literature Review through Text Mining,” IEEE Access, vol. 8, pp. 67698–67717, 2020, doi: 10.1109/ACCESS.2020.2983656.
[3] S. Sharma and S. Kr., “Review on Text Mining Algorithms,” Int. J. Comput. Appl., vol. 134, no. 8, pp. 39–43, 2016, doi: 10.5120/ijca2016907972.
[4] M. Soleymani, D. Garcia, B. Jou, B. Schuller, S. F. Chang, and M. Pantic, “A survey of multimodal sentiment analysis,” Image Vis. Comput., vol. 65, pp. 3–14, 2017, doi: 10.1016/j.imavis.2017.08.003.
[5] M. P. Bach, Ž. Krstič, S. Seljan, and L. Turulja, “Text mining for big data analysis in financial sector: A literature review,” Sustain., vol. 11, no. 5, 2019, doi: 10.3390/su11051277.
[6] H. J. Lin, P. C. Y. Sheu, J. J. P. Tsai, C. C. N. Wang, and C. Y. Chou, “Text mining in a literature review of urothelial cancer using topic model,” BMC Cancer, vol. 20, no. 1, pp. 1–7, 2020, doi: 10.1186/s12885-020-06931-0.
[7] M. Nurjannah and I. Fitri Astuti, “PENERAPAN ALGORITMA TERM FREQUENCY-INVERSE DOCUMENT FREQUENCY (TF-IDF) UNTUK TEXT MINING Mahasiswa S1 Program Studi Ilmu Komputer FMIPA Universitas Mulawarman Dosen Program Studi Ilmu Komputer FMIPA Universitas Mulawarman,” J. Inform. Mulawarman, vol. 8, no. 3, pp. 110–113, 2013.