Komparasi Metode Machine Learning Untuk Diagnosis Penyakit Kanker Payudara

Kardita Magda, Onassis Yusuf Inonu, Erliyan Redy Susanto

Abstract


Diabetes merupakan penyakit metabolik yang menjadi salah satu masalah kesehatan utama di dunia. Deteksi dini dan diagnosis yang akurat sangat penting untuk mencegah komplikasi jangka panjang. Dengan perkembangan teknologi machine learning, prediksi risiko diabetes berbasis data menjadi lebih efektif dan efisien. Penelitian ini bertujuan untuk menganalisis kinerja algoritma Random Forest dalam memprediksi status diabetes menggunakan dataset Pima Indians Diabetes. Tahapan penelitian meliputi pra-pemrosesan data, pelatihan model, evaluasi kinerja, serta visualisasi hasil.  Dataset yang digunakan terdiri dari 154 sampel dengan delapan fitur klinis dan satu variabel target. Pra-pemrosesan dilakukan untuk menangani nilai nol, normalisasi data, serta pembagian data latih dan uji. Model Random Forest dilatih dan dievaluasi menggunakan metrik akurasi, presisi, recall, F1-score, confusion matrix, dan kurva ROC-AUC. Hasil menunjukkan bahwa model menghasilkan akurasi sebesar 78%, dengan nilai AUC sebesar 0.82, menandakan kemampuan diskriminasi yang sangat baik antara pasien positif dan negatif diabetes.  Visualisasi Confusion Matrix dan kurva ROC membantu memberikan interpretasi yang jelas mengenai performa model secara grafis. Berdasarkan hasil tersebut, dapat disimpulkan bahwa algoritma Random Forest memiliki potensi besar sebagai pendukung keputusan dalam bidang medis, khususnya untuk prediksi risiko diabetes. Penggunaan model ini dapat meningkatkan efisiensi dan akurasi diagnosis awal, serta membantu tenaga medis dalam pengambilan keputusan yang lebih cepat dan objektif.

Keywords


Evaluasi Model; Machine Learning; Prediksi; Random Forest; UCI dataset.

Full Text:

PDF

References


S. K. Hero, “FAKTOR RISIKO KANKER PAYUDARA,” JMH, vol. 3, no. 1, pp. 3–8, 2021.

Jean Sunny, Nikita Rane, Rucha Kanade, and Sulochana Devi, “Breast Cancer Classification and Prediction using Machine Learning,” Int. J. Eng. Res., vol. V9, no. 02, pp. 576–580, 2020, doi: 10.17577/ijertv9is020280.

R. Entezari, “Breast Cancer Diagnosis via Classification Algorithms,” 2018.

S. Wu and W. Xiong, “Comparison of Different Machine Learning Models in Breast Cancer,” Highlights Sci. Eng. Technol., vol. 8, pp. 624–629, 2022, doi: 10.54097/hset.v8i.1238.

N. R. Muntiari and K. H. Hanif, “Klasifikasi Penyakit Kanker Payudara Menggunakan Perbandingan Algoritma Machine Learning,” J. Ilmu Komput. dan Teknol., vol. 3, no. 1, pp. 1–6, 2022, doi: 10.35960/ikomti.v3i1.766.

V. Angkasa and J. J. Pangaribuan, “Information System Development Komparasi Tingkat Akurasi Random Forest Dan Knn Untuk Mendiagnosis Penyakit Kanker Payudara,” J. Inf. Syst. Dev., vol. 7, no. 1, pp. 37–38, 2022.

R. A. Sowah, A. A. Bampoe-Addo, S. K. Armoo, F. K. Saalia, F. Gatsi, and B. Sarkodie-Mensah, “Design and Development of Diabetes Management System Using Machine Learning,” Int. J. Telemed. Appl., vol. 2020, 2020, doi: 10.1155/2020/8870141.

Jamaludin, A. Kholiq Fajar, M. Zaenal Mutaqin, M. Malik Mutoffar, and D. Setiyadi, “Klasifikasi Kanker Payudara Menggunakan Algoritma Neural Network dan Random Forest,” STMIK Sinar Nusant. Jln. Sersan Aswan, vol. 7, no. 1, pp. 74–80, 2024.

F. S. Nugraha, M. J. Shidiq, and S. Rahayu, “Analisis Algoritma Klasifikasi Neural Network Untuk Diagnosis Penyakit Kanker Payudara,” J. Pilar Nusa Mandiri, vol. 15, no. 2, pp. 149–156, 2019, doi: 10.33480/pilar.v15i2.601.

T. B. Surbakti, A. Fauzi, and H. Khair, “Hybrid Sistem Algoritma Rivest Shamir Adleman (RSA) dan Algoritma Blum Blum Shub (BBS) dalam Mengamankan File Database E-Absensi,” Indones. J. Educ. …, vol. 1, no. 3, pp. 89–97, 2023.

A. B. Wibisono and A. Fahrurozi, “Perbandingan Algoritma Klasifikasi Dalam Pengklasifikasian Data Penyakit Jantung Koroner,” J. Ilm. Teknol. dan Rekayasa, vol. 24, no. 3, pp. 161–170, 2019, doi: 10.35760/tr.2019.v24i3.2393.

M. Wibowo and R. Ramadhani, “Perbandingan Metode Klasifikasi Data Mining Untuk Rekomendasi Tanaman Pangan,” J. Media Inform. Budidarma, vol. 5, no. 3, p. 913, 2021, doi: 10.30865/mib.v5i3.3086.

Z. Jin, J. Shang, Q. Zhu, C. Ling, W. Xie, and B. Qiang, “RFRSF: Employee Turnover Prediction Based on Random Forests and Survival Analysis,” Lect. Notes Comput. Sci. (including Subser. Lect. Notes Artif. Intell. Lect. Notes Bioinformatics), vol. 12343 LNCS, pp. 503–515, 2020, doi: 10.1007/978-3-030-62008-0_35.

Z. Huang and D. Chen, “A Breast Cancer Diagnosis Method Based on VIM Feature Selection and Hierarchical Clustering Random Forest Algorithm,” IEEE Access, vol. 10, pp. 3284–3293, 2022, doi: 10.1109/ACCESS.2021.3139595.

G. Dhanalakshmi, “Decision Support System for Breast Cancer Prediction,” Int. J. Res. Appl. Sci. Eng. Technol., vol. 7, no. 3, pp. 816–821, 2019, doi: 10.22214/ijraset.2019.3142.

H. Ma’rifah, A. P. Wibawa, and M. I. Akbar, “Klasifikasi Artikel Ilmiah Dengan Berbagai Skenario Preprocessing,” Sains, Apl. Komputasi dan Teknol. Inf., vol. 2, no. 2, p. 70, 2020, doi: 10.30872/jsakti.v2i2.2681.

Z. Abdussamad, Metodologi Penelitian Kualitatif. Makasar: CV. syakir Media Press, 2021.

Indrawan and Yaniawati, Metodologi Penelitian: Kuantitatif, Kualitatif dan Campuran untuk Manajemen, Pembangunan, dan Pendidikan, Edisi Revi. Bandung: Refika Aditama, 2021.

“Breast Cancer Wisconsin (Diagnostic) Data Set" UCI Machine Learning, 2021.

Suci Amaliah, M. Nusrang, and A. Aswi, “Penerapan Metode Random Forest Untuk Klasifikasi Varian Minuman Kopi di Kedai Kopi Konijiwa Bantaeng,” VARIANSI J. Stat. Its Appl. Teach. Res., vol. 4, no. 3, pp. 121–127, 2022, doi: 10.35580/variansiunm31.




DOI: http://dx.doi.org/10.36448/expert.v15i1.4313

Refbacks

  • There are currently no refbacks.


EXPERT: Jurnal Manajemen Sistem Informasi dan Teknologi

Published by Pusat Studi Teknologi Informasi, Fakultas Ilmu Komputer, Universitas Bandar Lampung
Gedung M Lt.2 Pascasarjana Universitas Bandar Lampung
Jln Zainal Abidin Pagaralam No.89 Gedong Meneng, Rajabasa, Bandar Lampung,
LAMPUNG, INDONESIA

Indexed by:



Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.