Analisis Performa Naïve Bayes, K-Neares Neighbor, dan Random Forest dalam Klasifikasi Sentimen Ulasan Aplikasi Netflix
DOI:
https://doi.org/10.31004/riggs.v5i1.5886Keywords:
Anaisis Sentimen, Naïve Bayes, K-Nearest Neighbor, Random Forest, NetflixAbstract
Dengan jutaan pengguna aktif di Indonesia, Netflix menjadi salah satu platform streaming digital terdepan yang terus berupaya menjaga kualitas layanan dan kepuasan penggunanya. Ulasan pengguna yang tersedia pada Google Play Store merepresentasikan sumber data penting yang mencerminkan persepsi, pengalaman, serta tingkat kepuasan konsumen terhadap layanan yang diberikan. Namun, besarnya jumlah ulasan dan bentuknya yang tidak terstruktur menuntut adanya pendekatan otomatis untuk menganalisis opini pengguna secara sistematis dan objektif. Penelitian ini bertujuan untuk mengkategorikan sentimen ulasan pengguna Netflix ke dalam tiga kelas, yaitu positif, negatif, dan netral, serta membandingkan kinerja algoritma klasifikasi machine learning yang digunakan. Penelitian ini mengimplementasikan tiga algoritma klasifikasi, yaitu Naïve Bayes, K-Nearest Neighbor (KNN), dan Random Forest, dengan memanfaatkan perangkat lunak Orange Data Mining. Proses penelitian meliputi tahap preprocessing data teks, ekstraksi fitur menggunakan metode Term Frequency–Inverse Document Frequency (TF-IDF), serta evaluasi model menggunakan teknik 10-fold stratified cross-validation. Kinerja model dievaluasi berdasarkan metrik akurasi, Area Under Curve (AUC), F1-score, precision, recall, dan Matthews Correlation Coefficient (MCC). Hasil penelitian menunjukkan bahwa algoritma Naïve Bayes menghasilkan performa terbaik dengan tingkat akurasi sebesar 99,2% dan nilai AUC sebesar 1,000, diikuti oleh Random Forest dengan akurasi 98,3% dan AUC 0,998. Sebaliknya, algoritma KNN menunjukkan performa terendah dengan akurasi 36,2% dan AUC 0,500. Analisis statistik mengonfirmasi adanya perbedaan performa yang signifikan antara Naïve Bayes dan KNN (p < 0,05). Temuan ini menunjukkan bahwa algoritma probabilistik berbasis Naïve Bayes lebih efektif dalam menangani data teks berdimensi tinggi dengan representasi TF-IDF.
Downloads
References
Abdillah, T., Khaira, U., & Hutabarat, B. F. (2024). Komparasi Metode Naive Bayes dan K-Nearest Neighbors terhadap Analisis Sentimen Pengguna Aplikasi Zenius. Jurnal PROCESSOR, 19(1), 32–44 , https://doi.org/10.33998/processor.2024.19.1.1596
Ak, A., Callet, P. Le, Gera, A., Tmar, H., Noyes, D., & Katsavounidis, I. (2024). Sustainable Video Streaming using Acceptability and Annoyance Paradigm. 2024 32nd European Signal Processing Conference (EUSIPCO), 952–956. https://doi.org/10.23919/EUSIPCO63174.2024.10715438
Aldhyani, T. H. H., & Alkahtani, H. (2023). Cyber Security For Detecting Distributed Denial Of Service Attacks in Agriculture 4.0: Deep Learning Model. Mathematics, 11(1), 1–19, https://doi.org/10.3390/math11010233
Breiman, L. (2001). Random Forests. Machine Learning 45, 5–32, https://doi.org/10.1023/A:1010933404324
Budiman, A., Yaputera, R. A., Achmad, S., & Kurniawan, A. (2023). Student attendance with face recognition (LBPH or CNN): Systematic literature review. Procedia Computer Science, 216, 31–38, https://doi.org/10.1016/j.procs.2022.12.108
Chicco, D., & Jurman, G. (2020). The Advantages Of The Matthews Correlation Coefficient (MCC) Over F1 Score And Accuracy In Binary Classification Evaluation. BMC Genomics, 21(1), 6, https://doi.org/10.1186/s12864-019-6413-7
Fan, X., & Meng, D. (2021). Optimal Action Strategy Approach For Desert Crossing Based On Dynamic Programming. Procedia Computer Science, 188, 144–154, https://doi.org/10.1016/j.procs.2021.05.063
N. Khoirunnisaa, K. Nabila Nastiti Kesuma, S. Setiawan, and A. Yunizar Pratama Yusuf. Klasifikasi Teks Ulasan Aplikasi Netflix Pada Google Play Store Menggunakan Algoritma Naïve Bayes Dan Svm. SKANIKA, 7(1), 64–73, https://doi.org/10.36080/skanika.v7i1.3138
Kumalasari, J. T. (2025). Masukan Akademik Terkait Pendekatan Klasifikasi Teks Dan Analisis Sentimen. Universitas BSI.
Mathayomchan, B., & Taecharungroj, V. (2020). “How Was Your Meal?” Examining Customer Experience Using Google Maps Reviews. International Journal of Hospitality Management, 90, 102641, https://doi.org/10.1016/j.ijhm.2020.102641
Nahrowi, D., & Hariyanto, D. (2022). Development And Evaluation Of Portable Microcontroller Training System. Journal of Physics: Conference Series, 2406(1), 012012, 10.1088/1742-6596/2406/1/012012
Pranata, A. B., Abdillah, A. R., & Irwiensyah, F. (2024). Analisis Sentimen Ulasan Pengguna Aplikasi Netflix Pada Google Play Menggunakan Algoritma Naïve Bayes. KLIK: Kajian Ilmiah Informatika dan Komputer, 4(6), 3091–3098, https://doi.org/10.30865/klik.v4i6.1964
Roy, P. R., et al. (2022). A study on paper and author ranking. In International Conference on Innovations in Science, Engineering and Technology (ICISET), 545–549, 10.1109/ICISET54810.2022.9775821
Sailunaz, K., & Alhajj, R. (2019). Emotion And Sentiment Analysis From Twitter Text. Journal Of Computational Science, 36, 101003.
Suhendra, T., Intan, B., & Martadinata, A. T. (2024). Analisis Sentimen Pengguna Aplikasi Netflix Pada Ulasan Google Playstore Menggunakan Metode Naïve Bayes. In ESCaF 3rd Conference.
Perbandingan Naive Bayes dan K-Nearest Neighbor untuk Analisis Sentimen Aplikasi Gapura UB Berdasarkan Ulasan Pengguna pada Playstore. (2023). Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 7(1), 229-236. https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/12142
Velankar, S. (2025). Decoding Millennial Preferences: Drivers Of Ott Platform Adoption In The Digital Era. International Journal of Advanced Research, 13(08), 480–484. https://doi.org/10.21474/IJAR01/21537
Xie, D. (2024). From Incipience To Status Quo: Development From Theatre To Streaming. Scholarly Review Journal, SR Online: Showcase (Equinox 2024), 1–8, https://doi.org/10.70121/001c.124871
Yadav, A., & Vishwakarma, D. K. (2020). Sentiment analysis using deep learning architectures: A review. Artificial Intelligence Review, 53(6), 4335–4385.
Yang, X.-P. (2020). Leximax Minimum Solution Of Addition-Min Fuzzy Relation Inequalities. Information Sciences, 524, 184–198.
Zulkarnain, Z., Mutia, R., Ariani, J. A., Barik, Z. A., & Azmi, H. (2024). Performance Comparison K-Nearest Neighbor, Naive Bayes, And Decision Tree Algorithms For Netflix Rating Classification. IJATIS, 1(1), 16–22.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2026 Yasinta Nurbaya, Rossiana Sihombing, Harjanti Bhatara I, Dian Sifa Salsabila

This work is licensed under a Creative Commons Attribution 4.0 International License.


















