Analisis Sentimen untuk Deteksi Penipuan pada Twitter Menggunakan TF-IDF dan Naive Bayes

Najwa Meyda; Muhammad Tafarel Akbar; Muhamad Nurdin; Septian Handita Surya; Alghozi Irsyadul Ibad; Ahmad Nursodiq

doi:10.31004/riggs.v5i1.4991

Authors

Najwa Meyda Universitas Pamulang
Muhammad Tafarel Akbar Universitas Pamulang
Muhamad Nurdin Universitas Pamulang
Septian Handita Surya Universitas Pamulang
Alghozi Irsyadul Ibad Universitas Pamulang
Ahmad Nursodiq Universitas Pamulang

DOI:

https://doi.org/10.31004/riggs.v5i1.4991

Keywords:

Penipuan Digital, Analisis Sentimen, Twitter, TF-IDF, Naive Bayes

Abstract

Penipuan digital melalui media sosial, khususnya Twitter, semakin marak dan menimbulkan kerugian bagi masyarakat. Penelitian ini bertujuan untuk menganalisis sentimen dan mendeteksi konten penipuan pada tweet berbahasa Indonesia menggunakan pendekatan pembelajaran mesin. Dataset diperoleh dari Twitter pada periode 2022–2025 dengan proses pengambilan data berdasarkan kata kunci terkait penipuan digital. Sebanyak 2.593 tweet digunakan setelah melalui proses pembersihan dan penghapusan duplikasi, dengan distribusi 1.829 tweet non-penipuan dan 764 tweet penipuan. Data kemudian dilabeli secara manual menjadi dua kelas, yaitu penipuan dan non-penipuan. Tahapan praproses meliputi pembersihan teks, tokenisasi, stemming menggunakan Sastrawi Stemmer, filtering stopword, dan normalisasi huruf. Ekstraksi fitur dilakukan menggunakan metode Term Frequency–Inverse Document Frequency (TF-IDF) dengan konfigurasi unigram dan bigram. Model klasifikasi utama dibangun menggunakan algoritma Multinomial Naive Bayes dengan penanganan ketidakseimbangan kelas melalui pembobotan sampel (sample weight). Sebagai pembanding, dilakukan pula eksperimen menggunakan algoritma Decision Tree dengan pengaturan class weight balanced. Hasil pengujian menunjukkan bahwa model Naive Bayes mencapai akurasi sebesar 87,09% dengan recall kelas penipuan sebesar 94,12%, yang menunjukkan kemampuan model dalam mendeteksi tweet penipuan secara efektif. Model Decision Tree menghasilkan akurasi lebih tinggi sebesar 96,53% dengan recall penipuan 92,81%. Analisis fitur menunjukkan bahwa kata-kata seperti “tipu”, “scam”, “modus”, dan “deepfake” memiliki pengaruh kuat dalam klasifikasi penipuan. Penelitian ini diharapkan dapat menjadi dasar pengembangan sistem deteksi penipuan berbasis teks pada media sosial.

Downloads

Download data is not yet available.

References

D. Setyo Nugroho, I. F. Hanifuddin, M. A. Hasbi, F. Fredianto, A. M. Saputra, dan R. Zildjian, “Sentiment Analysis of Alleged 2024 Election Fraud Based on Tweets Using the Naïve Bayes Classifier Algorithm,” Malcom: Indonesian Journal of Machine Learning and Computer Science, vol. 4, no. 3, 2025, doi: 10.57152/malcom.v4i3.1496.

N. W. A. S. Aprilia dan A. R. Isnain, “Analisis Sentimen Terhadap Media Sosial Twitter dengan Kasus Kampanye Anti-Korupsi di Indonesia Menggunakan Naive Bayes,” Jurnal Media Informatika Budidarma, vol. 8, no. 2, 2025, doi: 10.30865/mib.v8i2.7582.

M. Imam Ghozali, W. H. Sugiharto, dan A. F. Iskandar, “Analisis Sentimen Pinjaman Online Di Media Sosial Twitter Menggunakan Metode Naive Bayes,” KLIK: Kajian Ilmiah Informatika dan Komputer, vol. 3, no. 6, 2025, doi: 10.30865/klik.v3i6.936.

R. Sovia, D. A. Valkyrie, R. H. Zain, dan F. Firdaus, “Language Processing for Detecting Fake News on Twitter Using a Long Short-Term Memory Architecture,” Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi), vol. 9, no. 4, pp. 935–943, 2025, doi: 10.29207/resti.v9i4.6570.

A. Lestari, A. I. Purnamasari, A. Bahtiar, dan E. Tohidi, “Sentiment Analysis to Classify TikTok Shop Users on Twitter with Naïve Bayes Classifier Algorithm,” Journal of Artificial Intelligence and Engineering Applications (JAIEA), vol. 4, no. 2, 2025, doi: 10.59934/jaiea.v4i2.748.

K. Machova, M. Mach, dan M. Vasilko, “Comparison of Machine Learning and Sentiment Analysis in Detection of Suspicious Online Reviewers on Different Type of Data,” Sensors, vol. 22, no. 1, 2022, doi: 10.3390/s22010155.

Apif Supriadi, Fatmasari,” Implementasi Metode Klasifikasi Naive Bayes Pada Sistem Analisis Opini Pengguna Twitter Berbasis Web, ” February 3, 2021 // DOI: 10.51998/jsi.v10i1.356.

Bagus Muhammad Akbar, Ahmad Taufiq Akbar, Rochmat Husaini, “Sinovac Vaccine Sentiment and Emotion Analysis on Twitter Using Naïve Bayes and Valence Shifter, ” December 30, 2021 // DOI: 10.54914/jtt.v7i2.433

Asrumi Asrumi, Didik Suharijadi, Agustina Dewi Setiari, Diah Putri Wulanda, “Analisis Sentimen dan Penggalian Opini, ” November 27, 2023.

K. Ponmani, M. Thangaraj, “Clustering Based Sentiment Analysis on Twitter Data for COVID-19 Vaccines in India, ” 2022 // DOI: 10.53730/ijhs.v6nS2.6126

Ni Kadek Indah Puspaningrum, Putu Diah Sastri Pitanatri, Ni Wayan Chintia Pinaria, “Analisis Sentimen dalam Mengurangi Pembatalan Reservasi di The Westin Resort & Spa Ubud, ” July 2025 // DOI: 10.35912/simo.v6i2.4707

Sri Hadianti, Firman Yosep Tember, “Analisis Sentiment Covid-19 di Twitter Menggunakan Metode Naive Bayes dan SVM,” June 30, 2022 // DOI: 10.36294/jurti.v6i1.2557

Rizka Safitri Lutfiyani, Niken Retnowati, “Implementation of Email Spam Detection Using Naïve Bayes Algorithm and Decision Tree J48 Text Mining Method, ” October 30, 2021 // DOI: 10.35508/jicon.v9i2.5304

Rengga Asmara, Muhammad Febrian Ardiansyah, Muhammad Anshori, “Analisa Sentiment Masyarakat terhadap Pemilu 2019 Berdasarkan Opini di Twitter Menggunakan Metode Naive Bayes Classifier,” 2020 // DOI: 10.35314/isi.v5i2.1095

Abi Rafdi, Herman Mawengkang, Syahril Efend, “Sentiment Analysis Using Naive Bayes Algorithm with Feature Selection Particle Swarm Optimization (PSO) and Genetic Algorithm,” 2021 // DOI: 10.25008/ijadis.v2i2.1224

Muhammad Dwison Alizah, Arifin Nugroho, Ummu Radiyah, Windu Gata, “Sentimen Analisis Terkait Lockdown pada Sosial Media Twitter, ” 2020 // DOI: 10.31294/ijse.v6i2.8991