Prediksi Kanker Payudara Melalui Penerapan Algoritma C4.5

Jefri Junifer Pangaribuan, Romindo Romindo, Mirza Ilhami, Segar Napitupulu, Wenripin Chandra

Abstract


[id] Kanker merupakan salah satu penyebab kematian baik di negara maju maupun di negara yang sedang berkembang. Kanker payudara merupakan kanker yang berasal dari sel-sel yang terdapat di payudara, bisa dari sel-sel saluran air susu atau sel-sel kelenjar penghasil air susu atau jaringan lain. Penyakit ini juga menjadi penyebab kematian utama karena kanker di Indonesia pada tahun 2012. Oleh sebab itu sangat penting untuk dilakukan deteksi dini terhadap penyakit kanker payudara agar dapat segera dilakukan pengobatan. Pada praktiknya, di dunia kedokteran seringkali data rekam medis seperti penyakit kanker payudara disimpan untuk berbagai tujuan. Namun kenyataannya, proses penyimpanan dan pengolahan data rekam medis di beberapa rumah sakit masih belum memanfaatkan media komputer sehingga data sering hilang ataupun rusak. Selain itu, data rekam medis yang tercatat dan terkumpul biasanya diolah dan dimanfaatkan menjadi sebuah pengetahuan untuk melakukan prediksi. Oleh karena permasalahan tersebut, maka perlu dibangun sebuah sistem informasi dengan penerapan Data Mining dalam dunia kesehatan khususnya pengelolaan data rekam medis. Tujuan penelitian menggunakan penerapan algoritma prediksi C4.5 adalah dapat menghasilkan pohon keputusan yang memiliki tingkat akurasi yang dapat diterima dan efisien dalam menangani atribut yang bertipe diskret atau numerik. Hasil penelitian menunjukkan bahwa penerapan algoritma Data Mining Decision Tree C4.5 digunakan untuk melakukan prediksi penyakit kanker payudara menggunakan data training rekam medis sebanyak 116 data dapat menghasilkan rule sebanyak 4 rule. Tingkat keakuratan dari algoritma Data Mining Decision Tree C4.5 cukup akurat karena dari 10 percobaan terdapat 9 percobaan yang mendapatkan hasil prediksi yang tepat sesuai rule yang ada.

[en] Cancer is one of the causes of death in both developed and developing countries. Breast cancer is cancer that originates from cells in the breast, either from milk duct cells, milk-producing gland cells, or other tissues. This disease was also the main cause of cancer deaths in Indonesia in 2012. Therefore, it is very important to detect breast cancer early so that treatment can be carried out immediately. In practice, in the medical world, medical record data such as breast cancer is often stored for various purposes. However, the process of storing and processing medical record data in several hospitals still does not utilize computer media so that data is often lost or damaged. In addition, medical record data that is recorded and collected is usually processed and used as knowledge to make predictions. Because of these problems, it is necessary to build an information system with the application of Data Mining in the world of health, especially managing medical record data. The aim of research using the C4.5 prediction algorithm is to produce a decision tree that has an acceptable level of accuracy and is efficient in handling discrete or numerical attributes. The research results show that the application of the Data Mining Decision Tree C4.5 algorithm which is used to predict breast cancer using 116 medical record training data can produce 4 rules. The accuracy level of the Data Mining Decision Tree C4.5 algorithm is quite accurate because out of 10 experiments there were 9 experiments that obtained correct prediction results according to existing rules.


Keywords


Data Mining; Breast Cancer Prediction Information System; C4.5 Decision Tree Algorithm; Medical Records; Sistem Informasi Prediksi Kanker Payudara; Algoritma Decision Tree C4.5; Rekam Medis

Full Text:

PDF

References


Yuliana, "Risiko dan Deteksi Dini Kanker Payudara," CDK-261, vol. XLV, no. 2, pp. 144-149, 2018.

GLOBOCAN, "Global Cancer Statistics 2012," 2012. [Online]. Available: https://acsjournals.onlinelibrary.wiley.com/doi/pdf/10.3322/caac.21262#:~:text=Based%20on%20GLOBOCAN%20estimates%2C%20about,65%25%20of%20cancer%20deaths%20worldwide.. [Accessed 11 Maret 2021].

C. Chazar and W. Widhiaputra, "Machine Learning Diagnosis Kanker Payudara Menggunakan Algoritma Support Vector Machine," INFORMASI (Jurnal Informatika dan Sistem Informasi), vol. XII, no. 1, pp. 67-80, 2020.

I. Setiawan and E. K. Nurnawati, "Penerapan Algoritma Decision Tree Untuk Memprediksi Kanker Payudara menggunakan Data Mining dan Machine Learning," Jurnal Dinamika Informatika, vol. XI, no. 2, pp. 103-112, 2022.

E. Kurniawan, "Analisa Data Rekam Medis Menggunakan Teknik Data Mining Association Rules Dengan Algoritma Clustering," Semarang, 2017.

A. Ali, "Klasifikasi Data Rekam Medis Pasien Menggunakan Metode K-Means Clustering Di Rumah Sakit Anwar Medika Balong Bendo Sidoarjo," Jurnal MATRIK, vol. XIX, no. 1, pp. 186-195, 2019.

P. Handayani, E. Nurlelah, M. Raharjo and P. M. Ramdani, "Prediksi Penyakit Liver Dengan Menggunakan Metode Decision Tree dan Neural Network," Journal of Computer Engineering System and Science (CESS), vol. IV, no. 1, pp. 55-59, 2019.

B. A. Farahdiba and Y. S. Nugroho, "Klasifikasi Kanker Payudara Menggunakan Algoritma Gain Ratio," Jurnal Teknik Elektro, vol. 8, no. 2, pp. 43-46, 2016.

F. Ghalib and W. Wasilah, "Deteksi Dini Kanker Payudara Menggunakan Algoritma K-Nearest Neighbour (KNN) dan Decision Tree C-45," Jurnal TEKNIKA, vol. XVII, no. 2, pp. 427-434, 2023.

P. Singhal and S. Pareek, "Artificial Neural Network for Prediction of Breast Cancer," India, 2018.

I. P. P. Iswara, F. Farhan, W. Kumara and A. A. Supianto, "Rekomendasi Pengambilan Mata Kuliah Pilihan Untuk Mahasiswa Sistem Informasi Menggunakan Algoritma Decision Tree," Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK), vol. 6, no. 3, pp. 341-348, 2019.

E. Elisa, "Analisa dan Penerapan Algoritma C4.5 Dalam Data Mining Untuk Mengidentifikasi Faktor-Faktor Penyebab Kecelakaan Kerja Kontruksi PT.Arupadhatu Adisesanti," Jurnal Online Informatika (JOIN), vol. 2, no. 1, pp. 36-41, 2017.

J. J. Pangaribuan, C. Tedja and S. Wibowo, "Perbandingan Metode Algoritma C4.5 dan Extreme Learning Machine Untuk Mendiagnosis Penyakit Jantung Koroner," Informatics Engineering Research and Technology, vol. I, no. 1, pp. 1-7, 2019.

M. Bramer, Principles of Data Mining, London: Springer, 2007.




DOI: http://dx.doi.org/10.36448/expert.v13i2.3364

Refbacks

  • There are currently no refbacks.


EXPERT: Jurnal Manajemen Sistem Informasi dan Teknologi

Published by Pusat Studi Teknologi Informasi, Fakultas Ilmu Komputer, Universitas Bandar Lampung
Gedung M Lt.2 Pascasarjana Universitas Bandar Lampung
Jln Zainal Abidin Pagaralam No.89 Gedong Meneng, Rajabasa, Bandar Lampung,
LAMPUNG, INDONESIA

Indexed by:



Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.