Analisis Performa Naïve Bayes, K-Neares Neighbor, dan Random Forest dalam Klasifikasi Sentimen Ulasan Aplikasi Netflix

Yasinta Nurbaya; Rossiana Sihombing; Harjanti Bhatara  I; Dian Sifa Salsabila

doi:10.31004/riggs.v5i1.5886

Authors

Yasinta Nurbaya Universitas Bina Sarana Informatika
Rossiana Sihombing Universitas Bina Sarana Informatika
Harjanti Bhatara I Universitas Bina Sarana Informatika
Dian Sifa Salsabila Universitas Bina Sarana Informatika

DOI:

https://doi.org/10.31004/riggs.v5i1.5886

Keywords:

Anaisis Sentimen, Naïve Bayes, K-Nearest Neighbor, Random Forest, Netflix

Abstract

Dengan jutaan pengguna aktif di Indonesia, Netflix menjadi salah satu platform streaming digital terdepan yang terus berupaya menjaga kualitas layanan dan kepuasan penggunanya. Ulasan pengguna yang tersedia pada Google Play Store merepresentasikan sumber data penting yang mencerminkan persepsi, pengalaman, serta tingkat kepuasan konsumen terhadap layanan yang diberikan. Namun, besarnya jumlah ulasan dan bentuknya yang tidak terstruktur menuntut adanya pendekatan otomatis untuk menganalisis opini pengguna secara sistematis dan objektif. Penelitian ini bertujuan untuk mengkategorikan sentimen ulasan pengguna Netflix ke dalam tiga kelas, yaitu positif, negatif, dan netral, serta membandingkan kinerja algoritma klasifikasi machine learning yang digunakan. Penelitian ini mengimplementasikan tiga algoritma klasifikasi, yaitu Naïve Bayes, K-Nearest Neighbor (KNN), dan Random Forest, dengan memanfaatkan perangkat lunak Orange Data Mining. Proses penelitian meliputi tahap preprocessing data teks, ekstraksi fitur menggunakan metode Term Frequency–Inverse Document Frequency (TF-IDF), serta evaluasi model menggunakan teknik 10-fold stratified cross-validation. Kinerja model dievaluasi berdasarkan metrik akurasi, Area Under Curve (AUC), F1-score, precision, recall, dan Matthews Correlation Coefficient (MCC). Hasil penelitian menunjukkan bahwa algoritma Naïve Bayes menghasilkan performa terbaik dengan tingkat akurasi sebesar 99,2% dan nilai AUC sebesar 1,000, diikuti oleh Random Forest dengan akurasi 98,3% dan AUC 0,998. Sebaliknya, algoritma KNN menunjukkan performa terendah dengan akurasi 36,2% dan AUC 0,500. Analisis statistik mengonfirmasi adanya perbedaan performa yang signifikan antara Naïve Bayes dan KNN (p < 0,05). Temuan ini menunjukkan bahwa algoritma probabilistik berbasis Naïve Bayes lebih efektif dalam menangani data teks berdimensi tinggi dengan representasi TF-IDF.

Downloads

Download data is not yet available.

References

Abdillah, T., Khaira, U., & Hutabarat, B. F. (2024). Komparasi Metode Naive Bayes dan K-Nearest Neighbors terhadap Analisis Sentimen Pengguna Aplikasi Zenius. Jurnal PROCESSOR, 19(1), 32–44 , https://doi.org/10.33998/processor.2024.19.1.1596

Ak, A., Callet, P. Le, Gera, A., Tmar, H., Noyes, D., & Katsavounidis, I. (2024). Sustainable Video Streaming using Acceptability and Annoyance Paradigm. 2024 32nd European Signal Processing Conference (EUSIPCO), 952–956. https://doi.org/10.23919/EUSIPCO63174.2024.10715438

Aldhyani, T. H. H., & Alkahtani, H. (2023). Cyber Security For Detecting Distributed Denial Of Service Attacks in Agriculture 4.0: Deep Learning Model. Mathematics, 11(1), 1–19, https://doi.org/10.3390/math11010233

Breiman, L. (2001). Random Forests. Machine Learning 45, 5–32, https://doi.org/10.1023/A:1010933404324

Budiman, A., Yaputera, R. A., Achmad, S., & Kurniawan, A. (2023). Student attendance with face recognition (LBPH or CNN): Systematic literature review. Procedia Computer Science, 216, 31–38, https://doi.org/10.1016/j.procs.2022.12.108

Chicco, D., & Jurman, G. (2020). The Advantages Of The Matthews Correlation Coefficient (MCC) Over F1 Score And Accuracy In Binary Classification Evaluation. BMC Genomics, 21(1), 6, https://doi.org/10.1186/s12864-019-6413-7

Fan, X., & Meng, D. (2021). Optimal Action Strategy Approach For Desert Crossing Based On Dynamic Programming. Procedia Computer Science, 188, 144–154, https://doi.org/10.1016/j.procs.2021.05.063

N. Khoirunnisaa, K. Nabila Nastiti Kesuma, S. Setiawan, and A. Yunizar Pratama Yusuf. Klasifikasi Teks Ulasan Aplikasi Netflix Pada Google Play Store Menggunakan Algoritma Naïve Bayes Dan Svm. SKANIKA, 7(1), 64–73, https://doi.org/10.36080/skanika.v7i1.3138

Kumalasari, J. T. (2025). Masukan Akademik Terkait Pendekatan Klasifikasi Teks Dan Analisis Sentimen. Universitas BSI.

Mathayomchan, B., & Taecharungroj, V. (2020). “How Was Your Meal?” Examining Customer Experience Using Google Maps Reviews. International Journal of Hospitality Management, 90, 102641, https://doi.org/10.1016/j.ijhm.2020.102641

Nahrowi, D., & Hariyanto, D. (2022). Development And Evaluation Of Portable Microcontroller Training System. Journal of Physics: Conference Series, 2406(1), 012012, 10.1088/1742-6596/2406/1/012012

Pranata, A. B., Abdillah, A. R., & Irwiensyah, F. (2024). Analisis Sentimen Ulasan Pengguna Aplikasi Netflix Pada Google Play Menggunakan Algoritma Naïve Bayes. KLIK: Kajian Ilmiah Informatika dan Komputer, 4(6), 3091–3098, https://doi.org/10.30865/klik.v4i6.1964

Roy, P. R., et al. (2022). A study on paper and author ranking. In International Conference on Innovations in Science, Engineering and Technology (ICISET), 545–549, 10.1109/ICISET54810.2022.9775821

Sailunaz, K., & Alhajj, R. (2019). Emotion And Sentiment Analysis From Twitter Text. Journal Of Computational Science, 36, 101003.

Suhendra, T., Intan, B., & Martadinata, A. T. (2024). Analisis Sentimen Pengguna Aplikasi Netflix Pada Ulasan Google Playstore Menggunakan Metode Naïve Bayes. In ESCaF 3rd Conference.

Perbandingan Naive Bayes dan K-Nearest Neighbor untuk Analisis Sentimen Aplikasi Gapura UB Berdasarkan Ulasan Pengguna pada Playstore. (2023). Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 7(1), 229-236. https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/12142

Velankar, S. (2025). Decoding Millennial Preferences: Drivers Of Ott Platform Adoption In The Digital Era. International Journal of Advanced Research, 13(08), 480–484. https://doi.org/10.21474/IJAR01/21537

Xie, D. (2024). From Incipience To Status Quo: Development From Theatre To Streaming. Scholarly Review Journal, SR Online: Showcase (Equinox 2024), 1–8, https://doi.org/10.70121/001c.124871

Yadav, A., & Vishwakarma, D. K. (2020). Sentiment analysis using deep learning architectures: A review. Artificial Intelligence Review, 53(6), 4335–4385.

Yang, X.-P. (2020). Leximax Minimum Solution Of Addition-Min Fuzzy Relation Inequalities. Information Sciences, 524, 184–198.

Zulkarnain, Z., Mutia, R., Ariani, J. A., Barik, Z. A., & Azmi, H. (2024). Performance Comparison K-Nearest Neighbor, Naive Bayes, And Decision Tree Algorithms For Netflix Rating Classification. IJATIS, 1(1), 16–22.