Evaluasi Kinerja SVM dan Logistic Regression pada Data Multiclass dalam Analisis Sentimen Film Dirty Vote dengan Metode Pelabelan Lexicon Based
DOI:
https://doi.org/10.31004/riggs.v4i2.576Keywords:
Multiclass, SVM, Logistic Regresion, Kernel, Dirty VoteAbstract
Pada 11 Februari 2024, saluran Youtube Dirty Vote dan PSHK Indonesia merilis film berjudul Dirty Vote yang menuai perdebatan masyarakat. Dalam rangka mengetahui sentimen masyarakat, dilakukan analisis sentimen. Analisis sentimen merupakan metode untuk mengkategorikan sentimen dengan melibatkan Natural Language Processing (NLP) dan algoritma machine learning, seperti Support Vector Machine (SVM) dan Logistic Regression. Penelitian sebelumnya telah membandingkan kedua algoritma tersebut dalam melakukan analisis sentimen pada dua atau tiga kategori. Namun, pada penelitian tiga kategori SVM hanya dilatih dan diuji dengan kernel RBF. Oleh karena itu, dilakukan penelitian untuk membandingkan nilai akurasi model SVM dan Logistic Regression dalam mengklasifikasikan sentimen film Dirty Vote. SVM dilatih dan diuji menggunakan tiga kernel, yaitu Polynomial, RBF, dan Sigmoid. Penelitian ini menggunakan tahapan-tahapan NLP dengan menggunakan data sebanyak 3.500 yang berasal dari proses scraping film Dirty Vote. Data digolongkan menjadi tiga kategori, yaitu sentimen negatif sebesar 36,31%, sentimen positif sebesar 31,95%, dan sentimen netral sebesar 31,74%. Data tersebut dibagi menjadi data latih dan data uji dengan rasio 90:10, 80:20, 70:30. Dari penelitian ini, diperoleh hasil rata-rata akurasi untuk ketiga kernel SVM dan Logistic Regression. Hasil penelitian menunjukan nilai akurasi tertinggi diperoleh oleh algoritma SVM dengan kernel RBF sebesar 77%, diikuti oleh Logistic Regression sebesar 76%, kernel Sigmoid sebesar 75%, dan kernel Polynomial sebesar 65%.
Downloads
References
Christha, A., Warouw, D. M. D., & Waleleng, G. J. (2021). Pesan moral pada film Cek Toko Sebelah (analisis semiotika John Fiske). Acta Diurna Komunikasi, 3(4), 1–7.
Devid, H. W., & Azhari, S. N. (2016). Peringkasan sentimen ekstraktif di Twitter menggunakan hybrid TF-IDF dan cosine similarity. Indonesian Journal of Computing and Cybernetics Systems, 10(2), 207–218. https://doi.org/10.22146/ijccs.16625
Diah, F. S., Guna, B. W. K., & Yudhakusuma, D. (2024). Analisis sentimen film Dirty Vote menggunakan BERT (Bidirectional Encoder Representations from Transformers). Jurnal Teknologi Informasi dan Komunikasi, 8(2), 393–404. https://doi.org/10.35870/jtik.v8i2.1580
Ismia, I., Triayudi, A., & Soepriyono, G. (2023). Analisa sentimen pengguna transportasi Jakarta terhadap Transjakarta menggunakan metode Naïve Bayes dan K-Nearest Neighbor. Journal of Information System Research (JOSH), 4(2), 543–550. https://doi.org/10.47065/josh.v4i2.293
Meishita, I. P., & Kharisudin, I. (2022). Analisis sentimen pengguna marketplace Tokopedia pada situs Google Play menggunakan metode Support Vector Machine (SVM), Naïve Bayes, dan Logistic Regression. Prosiding Seminar Nasional Matematika (PRISMA), 5, 759–766.
Maryam, S., Sari, A. R., Florid, M. I., Widyastuti, & Runtu, A. R. (2024). Documentary film Dirty Vote: Substance and sensation. International Journal of Society Reviews (INJOSER), 2(4), 956–962.
Sisferi, H., Pardamean, A., & Khasanah, S. N. (2020). Sentimen analisis publik terhadap Joko Widodo terhadap wabah Covid-19 menggunakan metode machine learning. Jurnal Kajian Ilmiah, 20(2), 167–176.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Andini Sintawati, Farida Amalya, Ahmad Hidayat, Nur Muhammad Supyan

This work is licensed under a Creative Commons Attribution 4.0 International License.