Penerapan H2O AutoML untuk Prediksi Kanker Kolorektal

Authors

  • Marina Artiyasa Universitas Nusa Putra
  • Gina Syahbani Yuda Universitas Nusa Putra

DOI:

https://doi.org/10.31004/riggs.v4i1.395

Keywords:

H2O AutoML, Prediksi, Kanker Kolorektal, UCI

Abstract

Penelitian ini bertujuan untuk memprediksi hasil kanker kolorektal dan mengidentifikasi faktor risiko utama menggunakan dataset global dari UCI Machine Learning Repository . Dataset mencakup 28 variabel terkait demografi pasien (usia, jenis kelamin, negara), gaya hidup (merokok, konsumsi alkohol, aktivitas fisik), riwayat medis (keluarga, diabetes, mutasi genetik), stadium kanker, pengobatan, tingkat kelangsungan hidup, dan biaya perawatan kesehatan. Metode yang digunakan adalah H2O AutoML , sebuah alat automated machine learning (AutoML) yang melatih berbagai model pembelajaran mesin secara otomatis, termasuk Gradient Boosting Machines (GBM) , Random Forest , dan Deep Learning . Proses analisis melibatkan feature engineering , optimasi hiperparameter, dan evaluasi model berdasarkan metrik seperti akurasi, AUC-ROC, presisi, recall, dan F1-score. Hasil menunjukkan bahwa faktor risiko utama seperti usia, ukuran tumor, gaya hidup, riwayat medis, akses layanan kesehatan, dan biaya perawatan memiliki dampak signifikan terhadap perkembangan dan prognosis penyakit. Variabel seperti biaya perawatan kesehatan (Healthcare_Costs) berkontribusi sebesar 21.53% terhadap prediksi, diikuti oleh ukuran tumor (Tumor_Size_mm) sebesar 11.19% , dan usia pasien (Age) sebesar 10.38% . Model prediksi yang dihasilkan mampu memprediksi tingkat kelangsungan hidup dan respons terhadap pengobatan dengan performa tinggi, serta mengidentifikasi pola data tidak biasa menggunakan teknik seperti Isolation Forest dan Principal Component Analysis (PCA) . Implikasi penelitian ini penting untuk meningkatkan strategi pencegahan, diagnosis dini, dan perawatan kanker kolorektal secara global, terutama dalam mengatasi disparitas akses layanan kesehatan dan biaya pengobatan.

Downloads

Download data is not yet available.

References

A. Lewandowska, G. Rudzki, T. Lewandowski, A. Stryjkowska-Góra, and S. Rudzki, “Title: Risk Factors for the Diagnosis of Colorectal Cancer,” Cancer Control, vol. 29, 2022, doi: 10.1177/10732748211056692.

K. Thanikachalam and G. Khan, “Colorectal cancer and nutrition,” 2019. doi: 10.3390/nu11010164.

Agi Satria Putranto, “Manajemen Kanker Kolorektal,” MEDICINUS, vol. 35, no. 3, 2022, doi: 10.56951/medicinus.v35i3.99.

A. A. B. P. Indrakusuma et al., “POTENSI LACTOBACILLUS PLANTARUM SEBAGAI INTERVENSI PENATALAKSANAAN KANKER KOLOREKTAL BERBASIS MODIFIKASI MIKROBIOTA USUS,” Jurnal Kesehatan, vol. 13, no. 2, 2020, doi: 10.24252/kesehatan.v13i2.17044.

H. Sung et al., “Global Cancer Statistics 2020: GLOBOCAN Estimates of Incidence and Mortality Worldwide for 36 Cancers in 185 Countries,” CA Cancer J Clin, vol. 71, no. 3, pp. 209–249, May 2021, doi: 10.3322/CAAC.21660.

M. W. Sugeng, H. Agusaputra, I. Inawati, and T. Sunaryati, “Penyuluhan Pengaruh Indeks Masa Tubuh (IMT), Kadar Gula Darah dan Prilaku Diet Tinggi Serat untuk Mencegah Kanker Kolorektal,” Jurnal Abdidas, vol. 4, no. 6, 2023, doi: 10.31004/abdidas.v4i6.848.

M. S. Hossain et al., “Colorectal Cancer: A Review of Carcinogenesis, Global Epidemiology, Current Challenges, Risk Factors, Preventive and Treatment Strategies,” Cancers 2022, Vol. 14, Page 1732, vol. 14, no. 7, p. 1732, Mar. 2022, doi: 10.3390/CANCERS14071732.

K. Adipati, A. Setiawan, S. Muhammad, B. Muh, Bhatnagar, and G. Chandra, “Hubungan antara kadar carcinoembryonic antigen (CEA) dan stadium kanker kolorektal di RSUP Sanglah,” Sari Pediatri, vol. 15, no. 1, 2016.

D. Aune et al., “Dietary fibre, whole grains, and risk of colorectal cancer: systematic review and dose-response meta-analysis of prospective studies,” BMJ, vol. 343, no. 7833, p. 1082, Nov. 2011, doi: 10.1136/BMJ.D6617.

P. Gallagher and D. O’Mahony, “Constipation in old age,” Best Pract Res Clin Gastroenterol, vol. 23, no. 6, pp. 875–887, Dec. 2009, doi: 10.1016/J.BPG.2009.09.001.

E. H. Schreuders et al., “Colorectal cancer screening: a global overview of existing programmes,” Gut, vol. 64, no. 10, pp. 1637–1649, Oct. 2015, doi: 10.1136/gutjnl-2014-309086.

M. Arnold, M. S. Sierra, M. Laversanne, I. Soerjomataram, A. Jemal, and F. Bray, “Global patterns and trends in colorectal cancer incidence and mortality,” Gut, vol. 66, no. 4, pp. 683–691, Apr. 2017, doi: 10.1136/GUTJNL-2015-310912/-/DC1.

Y. Zhang et al., “Distinguishing Rectal Cancer from Colon Cancer Based on the Support Vector Machine Method and RNA-sequencing Data,” Curr Med Sci, vol. 41, no. 2, 2021, doi: 10.1007/s11596-021-2356-8.

L. Wang, G. Wang, C. Lu, B. Feng, and J. Kang, “Contribution of the -160C/A polymorphism in the E-cadherin promoter to cancer risk: A meta-analysis of 47 case-control studies,” PLoS One, vol. 7, no. 7, 2012, doi: 10.1371/journal.pone.0040219.

A. Tiessen, E. A. Cubedo-Ruiz, and R. Winkler, “Improved Representation of Biological Information by Using Correlation as Distance Function for Heatmap Cluster Analysis,” Am J Plant Sci, vol. 08, no. 03, 2017, doi: 10.4236/ajps.2017.83035.

A. A. Arifiyanti, N. R. Shantika, and A. O. Syafira, “ANALISIS SENTIMEN ULASAN PENGGUNA BSI MOBILE PADA GOOGLE PLAY DENGAN PENDEKATAN SUPERVISED LEARNING,” Jurnal Informatika Polinema, vol. 9, no. 3, 2023, doi: 10.33795/jip.v9i3.1003.

S. Hariri, M. C. Kind, and R. J. Brunner, “Extended Isolation Forest,” IEEE Trans Knowl Data Eng, vol. 33, no. 4, 2021, doi: 10.1109/TKDE.2019.2947676.

M. Tokovarov and P. Karczmarek, “A probabilistic generalization of isolation forest,” Inf Sci (N Y), vol. 584, 2022, doi: 10.1016/j.ins.2021.10.075.

A. K. Gárate-Escamila, A. Hajjam El Hassani, and E. Andrès, “Classification models for heart disease prediction using feature selection and PCA,” Inform Med Unlocked, vol. 19, 2020, doi: 10.1016/j.imu.2020.100330.

Downloads

Published

22-04-2025

How to Cite

[1]
M. Artiyasa and G. S. Yuda, “Penerapan H2O AutoML untuk Prediksi Kanker Kolorektal”, RIGGS, vol. 4, no. 1, pp. 222–232, Apr. 2025.

Most read articles by the same author(s)