Analisis Performansi Naïve Bayes pada Klasifikasi Plagiarisme Dokumen Berdasarkan Pembobotan Teks Menggunakan Algoritma TF-IDF
Abstract
Proposal skripsi adalah rencana penelitian yang diajukan oleh mahasiswa dengan bimbingan dari Dosen Pembimbing, dan disusun mengikuti aturan penulisan karya ilmiah. Algoritma TF-IDF adalah metode statistik numerik yang menunjukkan seberapa penting suatu kata dalam sebuah dokumen atau korpus. Metode Naive Bayes Classifiers adalah teknik klasifikasi teks yang menggunakan probabilitas kata kunci untuk membandingkan dokumen pelatihan dengan dokumen uji. Penelitian ini bertujuan untuk melakukan analisis performansi Naïve Bayes Classifier pada klasifikasi plagiarisme dokumen proposal skripsi berdasarkan pembobotan teks menggunakan algoritma TF-IDF. Analisis performansi dilakukan menggunakan metode Confusion Matrix. Berdasarkan pengujian dan analisis yang dilakukan menggunakan uji performansi Naive Bayes Classifier untuk klasifikasi kelas Plagiarisme Rendah, Plagiarisme Sedang, dan Plagiarisme Berat dengan jumlah dataset 85 dokumen proposal skripsi yang terbagi dalam Data Training dan Data Testing. Jumlah Data Training berjumlah 59 korpus dan Data Testing berjumlah 26 korpus. Berdasarkan uji performansi yang dilakukan mengguanakn metode Confusion Matrix didapatkan hasil yang ditunjukan pada Tabel 6 dengan Split Data 70 : 30, dengan nilai Accuracy 97,65%, nilai Precision 95,23%, dan nilai Precall 98,74%. Hal ini menunjukkan bahwa Naive Bayes Classifier berada pada tingkat excellent classification. Untuk penelitian berikutnya, analisis kritis lebih tinggi dalam dataset, maka prediksi pada data testing semakin akurat. Dengan precision sebesar 95,23%, recall sebesar 98,74%, dan accuracy sebesar 97,65%, dapat disimpulkan bahwa algoritma Naïve Bayes Classifier menunjukkan tingkat excellent classification.
Keywords
Full Text:
PDFReferences
Fakultas Ekonomi, “Pedoman Penulisan Skripsi dan Proposal Skripsi 2021 Fakultas Ekonomi Universitas Negeri Jakarta,” 2021.
A. K. Saputra, R. Y. Endra, F. Ariani, T. Tanjung, and A. Prakarsya, “Implementasi Algoritma Rabin-Karp pada Pendeteksian Plagiarisme,” Expert J. Manaj. Sist. Inf. dan Teknol., vol. 13, no. 1, p. 23, Jun. 2023, doi: 10.36448/expert.v13i1.3161.
Y. vita Via and R. Mumpuni, “Deteksi Kemiripan Dokumen Publikasi Skripsi Mahasiswa Menggunakan Algoritma Modifikasi Cosine Similarity,” J. Inf. Eng. Educ. Technol., vol. 3, no. 2, pp. 57–61, Dec. 2019, doi: 10.26740/jieet.v3n2.p57-61.
S. Yuliyanti and Rizky, “Implementasi Algoritma Rabin Karp Untuk Mendeteksi Kemiripan Dokumen Stmik Bandung,” J. Bangkit Indones., vol. 10, no. 02, p. 1, Oct. 2020, doi: 10.52771/bangkitindonesia.v10i02.124.
L. Mayola, M. Hafizh, and D. M. Putra, “Perancangan Aplikasi Similarity Deteksi Kemiripan Judul Disertasi Berbasis Web,” J. Teknol. Dan Sist. Inf. Bisnis, vol. 6, no. 2, pp. 452–257, Apr. 2024, doi: 10.47233/jteksis.v6i2.1164.
S. Chamira, “Implementasi Metode Text Mining Frequency-Invers Document Frequency (Tf-Idf) Untuk Monitoring Diskusi Online,” J. Informatics, Electr. Electron. Eng., vol. 1, no. 3, pp. 97–102, Mar. 2022, doi: 10.47065/jieee.v1i3.353.
A. K. Saputra, K. Muludi, and T. Thamrin, “Comparative Analysis between Rabin Karp Algorithm , Winnowing , and Turnitin Applications for Detecting Plagiarized Words,” Proceeding 6th ICITB 2020 –, no. December, pp. 40–49, 2020, [Online]. Available: https://jurnal.darmajaya.ac.id/index.php/icitb/article/view/2505
F. Handayani, D. Feddy, and S. Pribadi, “Implementasi Algoritma Naive Bayes Classifier dalam Pengklasifikasian Teks Otomatis Pengaduan dan Pelaporan Masyarakat melalui Layanan Call Center 110,” J. Tek. Elektro, vol. 7, no. 1, pp. 19–24, 2015.
A. Apriani, H. Zakiyudin, and K. Marzuki, “Penerapan Algoritma Cosine Similarity dan Pembobotan TF-IDF System Penerimaan Mahasiswa Baru pada Kampus Swasta,” J. Bumigora Inf. Technol., vol. 3, no. 1, pp. 19–27, Jul. 2021, doi: 10.30812/bite.v3i1.1110.
I. S. Tomagola, A. Id Hidiana, and P. Nurul Sabrina, “Analisis Sentimen Terhadap Pangan Nasional Pada Media Sosial Twitter Menggunakan Algoritma Naïve Bayes,” Jati (Jurnal Mhs. Tek. Inform., vol. 7, no. 5, pp. 3350–3356, Jan. 2024, doi: 10.36040/jati.v7i5.7473.
R. Al Rasyid and D. H. U. Ningsih, “Penerapan Algoritma TF-IDF dan Cosine Similarity untuk Query Pencarian Pada Dataset Destinasi Wisata,” J. JTIK (Jurnal Teknol. Inf. dan Komunikasi), vol. 8, no. 1, pp. 170–178, Jan. 2024, doi: 10.35870/jtik.v8i1.1416.
S. N. Zyra, T. P. Alamsyah, and R. Yuliana, “Penggunaan E-Learning Berbasis Edmodo Terhadap Hasil Belajar Kelas 4 Sekolah Dasar,” J. PGSD J. Ilm. Pendidik. Guru Sekol. Dasar, vol. 15, no. 2, pp. 97–106, Nov. 2022, doi: 10.33369/pgsd.15.2.97-106.
R. Wati, S. Ernawati, and H. Rachmi, “Pembobotan TF-IDF Menggunakan Naïve Bayes pada Sentimen Masyarakat Mengenai Isu Kenaikan BIPIH,” J. Manaj. Inform., vol. 13, no. 1, pp. 84–93, Apr. 2023, doi: 10.34010/jamika.v13i1.9424.
R. Zulfirman, “Implementasi Metode Outdoor Learning dalam Peningkatan Hasil Belajar Siswa pada Mata Pelajaran Agama Islam di MAN 1 Medan,” J. Penelitian, Pendidik. dan Pengajaran JPPP, vol. 3, no. 2, pp. 147–153, Aug. 2022, doi: 10.30596/jppp.v3i2.11758.
Y. Yahya and M. Hamonangan Nasution, “Penggunaan Algoritma K-Means Untuk Menganalisis Pelanggan Potensial Pada Dealer SPS Motor Honda Lombok Timur Nusa Tenggara Barat,” Infotek J. Inform. dan Teknol., vol. 2, no. 2, pp. 32–41, Feb. 2019, doi: 10.29408/jit.v3i1.1814.
Y. Wulandari, E. Haerani, S. K. Gusti, and S. Ramadhani, “Klasifikasi Berita Menggunakan Algoritma C4.5,” J. Nas. Komputasi dan Teknol. Inf., vol. 5, no. 2, pp. 279–289, Apr. 2022, doi: 10.32672/jnkti.v5i2.4194.
H. Sari, G. L. Ginting, T. Zebua, and Mesran, “Penerapan Algoritma Text Mining dan TF-IDF untuk Pengelompokan Topik Skripsi pada Aplikasi Repository STMIK Budi Darma,” TIN Terap. Inform. Nusant., vol. 2, no. 7, pp. 414–432, 2021.
R. Kurniawan R and I. Zufria, “Penerapan Text Mining Pada Sistem Penyeleksian Judul Skripsi Menggunakan Algoritma Latent Dirichlet Allocation(LDA),” Indones. J. Comput. Sci., vol. 11, no. 3, pp. 1036–1052, Dec. 2022, doi: 10.33022/ijcs.v11i3.3120.
B. R. Atmadja, “Analisis Sentimen Bahasa Indonesia Pada Tempat Wisata Di Kabupaten Sukabumi Dengan Naive Bayes Classifier,” Elkom J. Elektron. dan Komput., vol. 15, no. 2, pp. 371–382, Dec. 2022, doi: 10.51903/elkom.v15i2.872.
N. Hidayah, “Implementasi Algoritma Multinomial Naïve Bayes, TF-IDF dan Confusion Matrix dalam Pengklasifikasian Saran Monitoring dan Evaluasi Mahasiswa Terhadap Dosen Teknik Informatika Universitas Dayanu Ikhsanuddin,” J. Akad. Pendidik. Mat., vol. 10, no. 1, pp. 8–15, 2024.
R. Indransyah, Y. H. Chrisnanto, P. N. Sabrina, and S. Kom, “Klasifikasi Sentimen Pergelaran MotoGP di Indonesia Menggunakan Algoritma Correlated Naive Bayes Clasifier,” INFOTECH J., vol. 8, no. 2, pp. 60–66, 2022, doi: https://doi.org/10.31949/infotech.v8I2.3103.
Karsito and S. Santi, “Klasifikasi Kelayakan Peserta Pengajuan Kredit Rumah Dengan Algoritma Naïve Bayes Di Perumahan Azzura Residencia,” J. Teknol. Pelita Bangsa, vol. 9, pp. 43–48, 2019.
S. Angnitha Purba, “Estimasi Parameter Data Berdistribusi Normal Menggunakan Maksimum Likelihood Berdasarkan Newton Raphson,” J. Sains Dasar, vol. 9, no. 1, pp. 16–18, Feb. 2021, doi: 10.21831/jsd.v9i1.38564.
DOI: http://dx.doi.org/10.36448/expert.v14i2.3952
Refbacks
- There are currently no refbacks.
EXPERT: Jurnal Manajemen Sistem Informasi dan Teknologi
Published by Pusat Studi Teknologi Informasi, Fakultas Ilmu Komputer, Universitas Bandar Lampung
Gedung M Lt.2 Pascasarjana Universitas Bandar Lampung
Jln Zainal Abidin Pagaralam No.89 Gedong Meneng, Rajabasa, Bandar Lampung,
LAMPUNG, INDONESIA
Indexed by:
This work is licensed under a Creative Commons Attribution 4.0 International License.