Perbandingan Performa Algoritma Naive Bayes, Random Forest dan K-Nearest Neighbor pada Prediksi Calon Jemaah Haji Indonesia yang Berpotensi Membatalkan Haji

Feri Setiadi, Setiadi and Handoyo Widi Nugroho, Handoyo and Yusuf, Suhendro (2024) Perbandingan Performa Algoritma Naive Bayes, Random Forest dan K-Nearest Neighbor pada Prediksi Calon Jemaah Haji Indonesia yang Berpotensi Membatalkan Haji. Masters thesis, Institut Informatika dan Bisnis Darmajaya.

[img] Text
Cover.pdf

Download (61kB)
[img] Text
Halaman Pernyataan Keaslian.pdf

Download (199kB)
[img] Text
Halaman Persetujuan.pdf

Download (191kB)
[img] Text
Halaman Pengesahan.pdf

Download (202kB)
[img] Text
Abstrak.pdf

Download (9kB)
[img] Text
Daftar Isi.pdf

Download (81kB)
[img] Text
BAB I.pdf

Download (86kB)
[img] Text
BAB II.pdf

Download (211kB)
[img] Text
BAB III.pdf

Download (174kB)
[img] Text
BAB IV.pdf

Download (273kB)
[img] Text
BAB V.pdf

Download (12kB)
[img] Text
Daftar Pustaka.pdf

Download (80kB)
[img] Text
Lampiran dataset haji.pdf

Download (1MB)

Abstract

Penelitian ini bertujuan untuk mengidentifikasi model klasifikasi yang paling efektif dalam memprediksi calon jemaah haji yang berpotensi membatalkan pendaftaran hajinya serta menentukan fitur-fitur yang paling berpengaruh terhadap keputusan tersebut. Penelitian ini membandingkan tiga model klasifikasi, yaitu Naïve Bayes, Random Forest, dan K-Nearest Neighbor (k-NN), dengan menggunakan dataset jemaah haji dari Siskohat Kantor Kementerian Agama Kabupaten Pringsewu. Selain itu, penelitian ini juga menerapkan metode seleksi fitur Recursive Feature Elimination Cross Validation (REFCV) untuk mengidentifikasi fitur-fitur yang paling relevan dalam mempengaruhi pembatalan haji. Hasil penelitian menunjukkan bahwa model Random Forest memberikan performa terbaik dengan akurasi, presisi, dan recall yang lebih tinggi dibandingkan model Naïve Bayes dan k-NN, baik sebelum maupun setelah seleksi fitur. Fitur-fitur seperti 'usia', 'pekerjaan', dan 'alamat' ditemukan sebagai atribut yang paling signifikan dalam mempengaruhi pembatalan haji. Penerapan metode REFCV terbukti meningkatkan akurasi model, khususnya pada model Random Forest yang mencapai akurasi 95% setelah seleksi fitur. Penelitian ini menyimpulkan bahwa model Random Forest dengan seleksi fitur REF merupakan kombinasi yang paling efektif dalam memprediksi pembatalan pendaftaran haji, serta memberikan rekomendasi bagi pengelola haji dalam meningkatkan akurasi prediksi dan efisiensi pengelolaan data jemaah haji.

Item Type: Thesis (Masters)
Subjects: eTheses
Divisions: Pasca Sarjana > Magister Teknik Informatika
Depositing User: Feri Setiadi Setiadi
Date Deposited: 21 Nov 2024 06:17
Last Modified: 21 Nov 2024 06:17
URI: http://repo.darmajaya.ac.id/id/eprint/18867

Actions (login required)

View Item View Item