SOLUSI MASALAH SCALABILITY DAN SPARSITY PADA COLLABORATIVE FILTERING DENGAN PENDEKATAN CLUSTERING DAN RANKING BASED

Hafidz, Mohamad Fahmi and Lestari, Sri (2023) SOLUSI MASALAH SCALABILITY DAN SPARSITY PADA COLLABORATIVE FILTERING DENGAN PENDEKATAN CLUSTERING DAN RANKING BASED. Masters thesis, INSTITUT INFORMATIKA DAN BISNIS DARMAJYA.

[img] Text
01 HALAMAN JUDUL.pdf

Download (131kB)
[img] Text
02 ABSTRAK.pdf

Download (133kB)
[img] Text
03 HALAMAN PERSETUJUAN.pdf

Download (115kB)
[img] Text
04 DAFTAR ISI.pdf

Download (145kB)
[img] Text
BAB 1.pdf

Download (136kB)
[img] Text
BAB 2.pdf

Download (489kB)
[img] Text
BAB 3.pdf

Download (304kB)
[img] Text
BAB 4.pdf

Download (458kB)
[img] Text
BAB 5.pdf

Download (61kB)
[img] Text
DAFTAR PUSTAKA.pdf

Download (135kB)

Abstract

INTISARI SOLUSI MASALAH SCALABILITY DAN SPARSITY PADA COLLABORATIVE FILTERING DENGAN PENDEKATAN CLUSTERING DAN RANKING BASED Oleh MOHAMAD FAHMI HAFIDZ fahmidzic2015@gmail.com Seiring waktu berjalan, maka jumlah data semakin banyak. Karena itu, dibutuhkan suatu system rekomendasi yang cepat dan akurat. Salah satu system rekomendasi yang terkenal adalah Collaborative Filtering. Tetapi, Collaborative Filtering memiliki kelemahan di antaranya Scalability dan Sparsity. Penelitian ini menggunakan dataset Movielens 100k yang diklaster menggunakan metode K-Means dan DBSCAN kemudian diimputasi menggunakan nilai rata – rata. Selanjutnya hasilnya diranking menggunakan WP-Rank dan dievaluasi menggunakan metode NDCG. Hasil riset menunjukkan bahwa, dataset ini sebaiknya diklaster dengan K-Means dan DBSCAN menjadi 2 buah klaster. Pada metode K-Means, Davies Bouldin Index paling kecil yaitu 0,503 didapatkan pada klaster berjumlah 2 buah. Pada metode DBSCAN, epsilon terbaik bernilai 2. Hasil riset juga menunjukkan bahwa metode K-Means dan DBSCAN mampu mempersingkat waktu proses. Waktu proses Metode K-Means yaitu 1,5355 kali lipat lebih cepat daripada dataset tidak diklaster sedangkan Metode DBSCAN mampu mempersingkat waktu proses 1,0407 kali lipat daripada dataset tidak diklaster. Keduanya terbukti dapat mempercepat waktu proses sehingga mengatasi scalability. Selain itu, NDCG pada K-Means mengalami peningkatan, sedangkan NDCG pada DBSCAN mengalami penurunan daripada NDCG dataset aslinya. Hal ini menunjukkan bahwa K-Means lebih baik daripada DBSCAN dalam mengklaster dataset ini. Selanjutnya, Hasil klasterisasi K-Means menghasilkan persentase null sebesar 3,570% dan 13,032%. Hasil klasterisasi DBSCAN menghasilkan persentase null sebesar 0% dan 100%. Ini menunjukkan bahwa imputasi hasil klaster K-Means lebih baik daripada imputasi pada hasil klaster DBSCAN. Hal ini menunjukkan bahwa hasil klaster K-Means menghasilkan imputasi yang lebih baik daripada hasil klaster DBSCAN. Kata Kunci : K-Means, DBSCAN, Scalability, WP-Rank, NDCG

Item Type: Thesis (Masters)
Subjects: 600 Teknologi - Ilmu terapan > 620 Ilmu Teknik - Engineering
eTheses
Divisions: Pasca Sarjana > Magister Teknik Informatika
Depositing User: S.Si., Gr. Mohamad Fahmi Hafidz
Date Deposited: 16 Aug 2023 08:02
Last Modified: 16 Aug 2023 08:02
URI: http://repo.darmajaya.ac.id/id/eprint/12431

Actions (login required)

View Item View Item