Berikut ini adalah materi pengayaan yang lebih rinci mengenai Supervised Learning dan Unsupervised Learning, termasuk penjelasan teori, visualisasi konsep, algoritma yang umum digunakan, serta perbedaan keduanya.
π Materi Pengayaan: Supervised dan Unsupervised Learning
1. Supervised Learning
π Definisi:
Supervised learning adalah pendekatan machine learning di mana model dilatih pada dataset yang berlabelβartinya setiap input memiliki output yang sesuai. Model belajar untuk memetakan input ke output berdasarkan contoh yang ada.
π― Tujuan:
Memprediksi label atau nilai dari data baru berdasarkan pola dari data pelatihan.
π¦ Struktur Dataset:
- Fitur (X): Data input
- Label (y): Target output yang ingin diprediksi
π’ Contoh Masalah:
- Klasifikasi:
- Deteksi email spam
- Prediksi penyakit berdasarkan gejala
- Regresi:
- Prediksi harga rumah
- Prediksi suhu berdasarkan waktu dan lokasi
π§ Algoritma Supervised Learning:
π Regresi Linear
- Output: Kontinu
- Rumus: \(y = \beta_0 + \beta_1 x + \epsilon\)
- Evaluasi: MSE, RMSE
π Regresi Logistik
- Output: Kategori (0/1)
- Rumus: \(\hat{y} = \frac{1}{1 + e^{-z}}$ dengan $z = \beta_0 + \beta_1 x\)
- Evaluasi: Akurasi, Precision, Recall, F1-score
π³ Decision Tree
- Pembelajaran berbasis aturan if-then
- Cocok untuk klasifikasi dan regresi
π² Random Forest
- Ensemble dari decision tree β lebih stabil dan akurat
π‘ Support Vector Machine (SVM)
- Mencari hyperplane terbaik yang memisahkan kelas
π₯ K-Nearest Neighbors (KNN)
- Prediksi berdasarkan tetangga terdekat di ruang fitur
π Naive Bayes
- Berdasarkan Teorema Bayes dengan asumsi independensi fitur
π§ Neural Networks (MLP)
- Model kompleks dengan lapisan tersembunyi
- Cocok untuk data berstruktur kompleks (gambar, suara)
2. Unsupervised Learning
π Definisi:
Unsupervised learning digunakan ketika data tidak memiliki label. Tujuannya adalah untuk mengidentifikasi pola, struktur tersembunyi, atau kelompok dalam data.
π― Tujuan:
Menemukan representasi atau struktur alami dalam data.
π¦ Struktur Dataset:
- Hanya memiliki fitur (X), tidak ada label (y)
π§ Algoritma Unsupervised Learning:
π― K-Means Clustering
- Mengelompokkan data ke dalam k kelompok berdasarkan kemiripan
- Evaluasi: Inertia, Silhouette Score
𧬠Hierarchical Clustering
- Tidak perlu menentukan jumlah klaster di awal
- Visualisasi dengan dendrogram
π§ DBSCAN
- Deteksi klaster berdasarkan kepadatan (density)
- Cocok untuk data dengan bentuk klaster yang tidak teratur
π Principal Component Analysis (PCA)
- Reduksi dimensi: transformasi ke fitur utama yang menjelaskan variasi data
π§ Autoencoders
- Neural network untuk encoding dan decoding data
- Cocok untuk kompresi data dan deteksi anomali
π Perbandingan Supervised vs Unsupervised Learning
Aspek | Supervised Learning | Unsupervised Learning |
---|---|---|
Data Label | Diperlukan | Tidak diperlukan |
Tujuan | Prediksi label | Temukan pola/struktur |
Output | Nilai atau kelas | Kelompok atau representasi |
Contoh | Klasifikasi, regresi | Klastering, reduksi dimensi |
π Tools dan Bahasa Pemrograman:
- Python: Scikit-learn, Pandas, Matplotlib, Seaborn
- Google Colab: Gratis dan mudah digunakan
- Jupyter Notebook: Ideal untuk eksplorasi data dan presentasi interaktif
π§ Penugasan Terpadu: Supervised & Unsupervised Learning
π Pengantar ke Support Vector Machines (SVM & SVR)
π― Tujuan Pembelajaran
Mahasiswa diharapkan:
- Memahami secara praktis perbedaan supervised dan unsupervised learning.
- Mengimplementasikan minimal satu algoritma dari masing-masing pendekatan.
- Menganalisis hasil dan membandingkan karakteristik keduanya.
- Siap menerima materi lanjutan tentang SVM dan SVR.
π Tugas 1: Eksplorasi Dataset & Klasifikasi Supervised Learning
Deskripsi:
- Pilih satu dataset berlabel (supervised), contoh:
- Iris dataset (klasifikasi jenis bunga)
- Titanic (klasifikasi selamat/tidak)
- Breast cancer
- Terapkan dua algoritma supervised berikut:
- K-Nearest Neighbors (KNN)
- Logistic Regression
- Lakukan evaluasi model menggunakan:
- Akurasi, Confusion Matrix, F1-score
Output:
- Grafik perbandingan hasil klasifikasi
- Analisis: kapan model salah prediksi? Kenapa?
π Tugas 2: Eksplorasi Dataset Tanpa Label & Unsupervised Learning
Deskripsi:
- Pilih dataset tanpa label atau abaikan label (misalnya gunakan hanya fitur dari Iris dataset)
- Terapkan algoritma:
- K-Means Clustering
- (Opsional) PCA untuk reduksi dimensi dan visualisasi
- Bandingkan hasil klaster dengan label aslinya (jika tersedia)
Output:
- Visualisasi klaster (2D PCA plot atau scatter plot warna per klaster)
- Analisis:
- Sejauh mana klaster mencerminkan kelas sebenarnya?
- Apa tantangan dari unsupervised learning?
π Tugas 3: Studi Pendahuluan SVM & SVR
Deskripsi:
- Baca materi awal tentang Support Vector Machine dan Support Vector Regression
- Buat ringkasan (maks. 1 halaman):
- Apa itu margin dan hyperplane
- Perbedaan klasifikasi vs regresi di SVM
- Contoh sederhana aplikasi SVM
Output:
- Satu halaman PDF ringkasan teori
- 3 pertanyaan yang diajukan kelompok terkait materi SVM/SVR untuk diskusi pertemuan berikutnya
π¦ Output Akhir:
- Jupyter Notebook
.ipynb
atau Google Colab - Laporan hasil tugas (boleh ringkas, format bebas: markdown di notebook atau PDF)
- Ringkasan materi SVM (maks. 1 halaman)
- Slide presentasi mini