Kalau selama ini kamu hanya tahu sistem rekomendasi dari Netflix, Tokopedia, atau Spotify, sekarang saatnya coba bikin sendiri versi sederhananya! Jangan khawatir, kita tidak perlu jadi ahli machine learning dulu. Dengan Python dan beberapa pustaka dasar, kita bisa membuat sistem rekomendasi mini yang cukup keren.
Bagi yang belum membaca artikel sebelumnya, alangkah baiknya membacanya terlebih dahulu dengan mengklik link berikut :
Etika
dan Privasi dalam Sistem Rekomendasi – Apakah Algoritma Terlalu Dalam Mengenal Kita?
Masalah
Cold Start dalam Sistem Rekomendasi – dan Cara Mengatasinya
Perbandingan:
Content-Based vs Collaborative Filtering – Mana yang Lebih Baik?
Mengenal
Sistem Rekomendasi: Cara Netflix dan Tokopedia Menebak Selera Kita
🔍 Dataset yang Digunakan
Untuk belajar, kita bisa pakai MovieLens Dataset — dataset film yang berisi rating dari pengguna terhadap berbagai film. Dataset ini sangat populer untuk eksperimen sistem rekomendasi.
Kamu bisa unduh versi kecilnya (100k data) di: https://grouplens.org/datasets/movielens
📦 Persiapan Tools
Sebelum mulai, pastikan kamu punya Python (versi 3.x) dan beberapa library berikut:
🧑💻 Membuat Content-Based Recommendation
Di pendekatan content-based, kita akan merekomendasikan film yang mirip dengan film yang sudah dipilih pengguna berdasarkan genre.
Contoh kode sederhana:
👉 Outputnya akan memberikan daftar film yang mirip dengan Toy Story (1995) berdasarkan genre.
🤝 Membuat Collaborative Filtering
Collaborative filtering menggunakan rating pengguna lain. Kita akan mencari film yang mirip berdasarkan pola rating.
Contoh sederhana dengan pivot
dan cosine similarity
:
👉 Outputnya berupa daftar movieId film yang mirip berdasarkan rating pengguna.
⚖️ Content-Based vs Collaborative Filtering
- Content-Based: cocok untuk pengguna baru, karena cukup analisis metadata (genre, kategori, dll).
- Collaborative Filtering: lebih akurat di platform besar, tapi butuh banyak data rating dari pengguna.
✍️ Penutup
Kita baru saja membuat dua sistem rekomendasi sederhana:
-
Content-Based → berdasarkan kemiripan konten (genre film).
-
Collaborative Filtering → berdasarkan perilaku pengguna lain.
Meskipun sederhana, ini adalah fondasi dari sistem rekomendasi canggih yang digunakan raksasa teknologi.
0 Comments