Analisis Komparatif Penerapan K-Means Clustering pada Lima Dataset Nyata untuk Evaluasi Sosial Ekonomi dan Finansial

Authors

  • Fat Khudin Universitas_Pamulang
  • Irfan Dias Saputra Universitas Pamulang
  • Muhammad Ilham Universitas Pamulang
  • Muhamad Sahrul Hafidz Fadilah Universitas Pamulang
  • Dika Surya Rahmadan Universitas Pamulang
  • Jupron Jupron Universitas Pamulang

DOI:

https://doi.org/10.31004/riggs.v4i2.1361

Keywords:

K-Means Clustering, Data Nyata, Elbow Method, Bitcoin, Kemiskinan

Abstract

Penerapan algoritma K-Means Clustering banyak digunakan dalam eksplorasi data multidomain, mulai dari sektor keuangan digital hingga indikator sosial ekonomi dan kesehatan. Penelitian ini membandingkan penggunaan algoritma K-Means pada lima jenis dataset nyata, yaitu distribusi suplai Bitcoin (2009–2024), harga saham Citigroup Inc. (2008–2024), kontribusi pajak daerah kota Banjarmasin (2007–2014), data kemiskinan Indonesia (1976–1993), dan prevalensi penyakit kronis pada lansia (2022). Seluruh data diproses melalui tahap normalisasi, dilanjutkan analisis klaster menggunakan algoritma K-Means dengan jumlah klaster optimal yang ditentukan melalui metode Elbow. Hasil penelitian menunjukkan bahwa semua domain memiliki pola klasterisasi yang bermakna: distribusi Bitcoin terbagi ke dalam tiga fase pertumbuhan, saham Citigroup memperlihatkan dua fase risiko, data kemiskinan dan pajak menunjukkan segmentasi tren historis, serta penyakit lansia mengarah pada kelompok risiko prevalensi. Evaluasi menggunakan Silhouette Score menunjukkan kualitas pemisahan klaster yang cukup baik (nilai antara 0,61 hingga 0,82). Pendekatan ini membuktikan bahwa K-Means dapat diandalkan untuk pengelompokan lintas domain dan dapat menjadi alat bantu dalam pengambilan keputusan berbasis data.

Downloads

Download data is not yet available.

References

Han, J., Kamber, M., & Pei, J. (2012). Data mining: Concepts and techniques (3rd ed.). Morgan Kaufmann. https://archive.org/details/the-morgan-kaufmann-series-in-data-management-systems-jiawei-han-micheline-kambe

Investopedia. (n.d.). Bitcoin supply data & halving info. https://www.investopedia.com/terms/b/bitcoin-halving.asp

Jain, A. K. (2010). Data clustering: 50 years beyond K-means. Pattern Recognition Letters, 31(8), 651–666. https://doi.org/10.1016/j.patrec.2009.09.011

Nasution, F. N., Lubis, M. A. R., & Purba, R. (2021). Penerapan algoritma K-Means clustering dalam analisis penyakit di Puskesmas Kota Medan. Jurnal Mantik Penusa, 5(2), 673–680. https://ejurnal.stmik-budidarma.ac.id/index.php/mantik/article/view/2337

PERGEMI. (2022). Survei kondisi kesehatan dan kesejahteraan lansia di Indonesia tahun 2022. Jakarta: Perhimpunan Gerontologi Medik Indonesia. https://www.pergemi.id/info/5/survei-kondisi-kesehatan-dan-kesejahteraan-lansia-di-indonesia

Putra, R. A., & Nugroho, H. (2023). Analisis klaster harga cryptocurrency menggunakan K-Means clustering. Jurnal Teknologi dan Sistem Informasi, 4(1), 55–63. https://doi.org/10.21070/jtsi.v4i1.1697

Scikit-learn. (n.d.). KMeans - sklearn.cluster.KMeans documentation. https://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html

Soesastro, H. (1995). Mengukur kemiskinan di Indonesia: Data, masalah, dan solusi. Jakarta: BPS & LP3ES. https://opac.perpusnas.go.id/DetailOpac.aspx?id=135184

Wulandari, R., & Iryanie, S. (2020). Ekonomi daerah dan pajak daerah: Pendekatan teoritis dan empiris. Jakarta: Salemba Empat. https://opac.perpusnas.go.id/DetailOpac.aspx?id=1303772

Yahoo Finance. (n.d.). Citigroup Inc. stock historical data. https://finance.yahoo.com/quote/C/history

Downloads

Published

09-07-2025

How to Cite

[1]
F. Khudin, I. D. Saputra, M. Ilham, M. S. H. Fadilah, D. S. Rahmadan, and J. Jupron, “Analisis Komparatif Penerapan K-Means Clustering pada Lima Dataset Nyata untuk Evaluasi Sosial Ekonomi dan Finansial”, RIGGS, vol. 4, no. 2, pp. 5081–5091, Jul. 2025.

Issue

Section

Articles