Penerapan Seleksi Fitur Analysis of Variance Pada Algoritma Random Forest Classifier Dalam Klasifikasi Nilai Mahasiswa

Muhammad Fath Thoriq, Wawan Joko Pranoto, Faldi Faldi

Abstract


Dalam lembaga pendidikan, seperti universitas, penting untuk memperhatikan kinerja mahasiswa agar mereka dapat menyelesaikan studi mereka tepat waktu. Namun, masih terdapat masalah di mana sebagian mahasiswa tidak mampu menyelesaikan studi mereka dengan tepat waktu, bahkan ada yang memutuskan untuk berhenti atau tidak lagi aktif sebagai mahasiswa. Hal ini diperlihatkan oleh penurunan nilai mahasiswa pada mata kuliah Bahasa Indonesia dari angkatan 2020 hingga 2021 di UMKT. Untuk mengatasi masalah ini, diperlukan metode yang dapat mengukur kinerja mahasiswa dalam menyelesaikan studi mereka. Penelitian ini bertujuan untuk mengetahui atribut-atribut yang berpengaruh terhadap penurunan nilai mahasiswa dalam mata kuliah Bahasa Indonesia, serta meningkatkan akurasi algoritma Random Forest Classifier dengan menggunakan seleksi fitur ANOVA. Data yang digunakan dalam penelitian ini adalah data mahasiswa UMKT yang mengambil mata kuliah Bahasa Indonesia pada periode 2020/2021 hingga 2021/2022. Data diperoleh dari bagian administrasi akademik (BAA) UMKT dan unit Mata Kuliah Dasar Umum (MKDU) UMKT, dengan jumlah data sebanyak 1028. Proses analisis data dilakukan menggunakan metode 5-Fold Cross Validation. Hasil penelitian menunjukkan bahwa atribut-atribut seperti Progress, persen Course completed, Tugas 1, dan Tugas 2 memiliki pengaruh signifikan terhadap penurunan nilai mahasiswa dalam mata kuliah Bahasa Indonesia. Selain itu, penggunaan seleksi fitur ANOVA pada algoritma Random Forest Classifier mampu meningkatkan kinerja algoritma tersebut, dengan akurasi meningkat dari 85.65persenmenjadi 87.3 persen.


Keywords


Nilai Mahasiswa; Data Mining; Random Forest; 5-Fold Cross Validation; ANOVA

Full Text:

PDF

References


Makkawaru, M. (2019). Pentingnya Pendidikan Bagi Kehidupan dan Pendidikan Karakter dalam Dunia Pendidikan. Jurnal Konsepsi, 8(3), 116–119.

Gunawan Sudarsono, B., & Ulan Bani, A. (2020). Prediksi Mahasiswa Berpotensi Berhenti Kuliah Secara Sepihak Menggunakan Data Mining Algoritma C4.5. Jurnal Sains Komputer & Informatika (J-SAKTI, 4(2), 359–367.

Rady, E. H. A., & Anwar, A. S. (2019). Prediction of kidney disease stages using data mining algorithms. Informatics in Medicine Unlocked, 15(April), 100178. https://doi.org/10.1016/j.imu.2019.100178.

Priantama, Y., & Yoga Siswa, T. A. (2022). Optimasi Correlation-Based Feature Selection Untuk Perbaikan Akurasi Random Forest Classifier Dalam Prediksi Performa Akademik Mahasiswa. JIKO (Jurnal Informatika Dan Komputer), 6(2), 251. https://doi.org/10.26798/jiko.v6i2.651.

Daqiqil, I. (2021). MACHINE LEARNING: Teori, Studi Kasus dan Implementasi Menggunakan Python. UR PRESS. https://www.researchgate.net/publication/353338909_Machine_Learning_Teori_Studi_Kasus_dan_Implementasi_Menggunakan_Python.

Gopal Krishna Ranjan. (2021, july 12) Introduction to k-fold Cross Validation in Python. SQLRelease. https://sqlrelease.com/introduction-to-k-fold-cross-validation-in-python.

Breiman, L. (2001). Random Forest. Machine Learning, 45(1), 5-32. Springer.

Primartha, R. (2021). Algoritma Machine Learning. Penerbit Informatika.

Liparas, D., Hacohen-kerner, Y., & Moumtzidou, A. (2014). News Articles Classification Using Random Forests and Weighted Multimodal Features. Springer International Publishing Switzerland, 63–75.

Daniya, T., Geetha, M., & Kumar, K. S. (2020). Classification and regression trees with Gini index. Advances in Mathematics: Scientific Journal, 9(10), 8237- 8247.

Wenda, A. (2022). Support Vector Machine Untuk Pengenalan Bentuk Manusia Menggunakan Kumpulan Fitur Yang Dioptimalkan. JST (Jurnal Sains Dan Teknologi), 11(1), 77–84. https://doi.org/10.23887/jstundiksha.v11i1.4443.

Chen, Z., Jiao, S., Zhao, D., Zou, Q., Xu, L., Zhang, L., & Su, X. (2022). The Characterization of Structure and Prediction for Aquaporin in Tumour Progression by Machine Learning. Frontiers in Cell and Developmental Biology, 10(February), 1–11. https://doi.org/10.3389/fcell.2022.845622.




DOI: http://dx.doi.org/10.36448/jsit.v14i2.3187

Refbacks

  • There are currently no refbacks.


About the JournalJournal PoliciesAuthor Information

Explore: Jurnal Sistem Informasi dan Telematika (Telekomunikasi, Multimedia dan Informatika)
e-ISSN: 2686-181X
Website: http://jurnal.ubl.ac.id/index.php/explore
Email: explore@ubl.ac.id
Published by: Pusat Studi Teknologi Informasi, Fakultas Ilmu Komputer, Universitas Bandar Lampung
Office: Jalan Zainal Abidin Pagar Alam No 89, Gedong Meneng, Bandar Lampung, Indonesia

This work is licensed under a Creative Commons Attribution 4.0 International License
Technical Support by:  RYE Education Hub