Supervise Learning (Kalsifikasi) Dan Algoritma Yang Ada Di Dalamnya Minimal 30 Algoritma Klasifikasi (Pertemuan 9)
SUPERVISE LEARNING (KLASIFIKASI)
&
30 ALGORITMA(KLASIFIKASI) YANG ADA DIDALAMNYA
Apa Itu Supervised Learning (Klasifikasi)?
Supervised Learning adalah teknik dalam machine learning di mana model dilatih menggunakan data yang sudah diberi label. Data ini terdiri dari input dan output yang sudah diketahui. Model mempelajari pola dari data tersebut untuk membuat prediksi yang akurat saat diberikan data baru.
Klasifikasi adalah salah satu jenis supervised learning yang fokus pada prediksi output dalam bentuk kategori atau kelas. Contoh aplikasinya adalah mengidentifikasi email sebagai spam atau bukan, dan mengenali digit tulisan tangan.
Algoritma Klasifikasi dalam Supervised Learning
Berikut adalah 30 algoritma klasifikasi yang sering digunakan dalam supervised learning:
1. Logistic Regression: Digunakan untuk memprediksi probabilitas kejadian suatu peristiwa dengan fungsi logit. Meskipun namanya regresi, ia digunakan untuk tugas klasifikasi biner.
2. K-Nearest Neighbors (KNN): Mengklasifikasikan data berdasarkan kategori mayoritas dari K tetangga terdekat dalam ruang fitur. Contohnya adalah klasifikasi gambar wajah.
3. Support Vector Machine (SVM): Mencari hyperplane terbaik yang memisahkan data dari dua kelas dalam ruang fitur berdimensi tinggi.
4. Naive Bayes: Algoritma probabilistik yang mengasumsikan independensi antar fitur dan menghitung probabilitas berdasarkan Teorema Bayes. Contohnya adalah klasifikasi teks seperti analisis sentimen.
5. Decision Tree: Menggunakan struktur pohon untuk membuat keputusan berdasarkan fitur input, membagi data pada setiap simpul internal.
6. Random Forest: Menggunakan banyak pohon keputusan dan menggabungkan hasilnya untuk meningkatkan akurasi dan mengurangi overfitting. Contoh penggunaannya adalah klasifikasi jenis penyakit berdasarkan gejala.
7. Gradient Boosting Machines (GBM): Membangun model prediktif secara bertahap dengan menggabungkan banyak model lemah, biasanya pohon keputusan.
8. XGBoost: Implementasi efisien dari algoritma gradient boosting yang dioptimalkan untuk kecepatan dan performa.
9. AdaBoost: Algoritma boosting yang menambahkan model lemah secara berurutan dan memberi bobot lebih pada kesalahan prediksi sebelumnya. Contohnya adalah klasifikasi risiko kredit.
10. CatBoost: Algoritma gradient boosting yang dioptimalkan untuk menangani data kategori dan missing values.
11. LightGBM: Implementasi gradient boosting yang dirancang untuk kecepatan dan efisiensi, terutama pada dataset besar.
12. Linear Discriminant Analysis (LDA): Mencari kombinasi linear dari fitur yang memisahkan dua atau lebih kelas. Contohnya adalah klasifikasi gambar dalam pengenalan wajah.
13. Quadratic Discriminant Analysis (QDA): Mirip dengan LDA, tetapi mengasumsikan distribusi Gaussian yang berbeda untuk setiap kelas. Contohnya adalah klasifikasi jenis bunga dalam dataset iris.
14. Stochastic Gradient Descent (SGD) Classifier : Mengoptimalkan model menggunakan pendekatan gradient descent secara bertahap dan acak. Contohnya adalah klasifikasi teks dalam pengolahan bahasa alami.
15. Perceptron: Algoritma dasar dari jaringan saraf yang digunakan untuk klasifikasi biner.
16. Multi-Layer Perceptron (MLP): Jaringan saraf tiruan dengan satu atau lebih lapisan tersembunyi yang digunakan untuk klasifikasi. Contohnya adalah pengenalan karakter tulisan tangan.
17. Convolutional Neural Network (CNN): Jaringan saraf yang dioptimalkan untuk pengenalan gambar dengan menggunakan operasi konvolusi.
18. Recurrent Neural Network (RNN): Jaringan saraf yang digunakan untuk data berurutan dengan mempertimbangkan konteks sebelumnya.
19. Long Short-Term Memory (LSTM): Jenis RNN yang mengatasi masalah pelatihan pada urutan panjang dengan mekanisme memori khusus.
20. Gated Recurrent Unit (GRU): Varian RNN yang lebih sederhana dibandingkan LSTM namun tetap efektif untuk data sekuensial.
21. Extreme Learning Machine (ELM): Algoritma jaringan saraf dengan pelatihan cepat yang mengacak bobot lapisan tersembunyi. Contohnya adalah klasifikasi data medis.
22. Radial Basis Function (RBF) Network: Jaringan saraf dengan fungsi aktivasi berbasis jarak yang digunakan untuk klasifikasi. Contohnya adalah pengenalan pola dalam sinyal biologis.
23. Bayesian Network: Model graf probabilistik yang mewakili sekumpulan variabel acak dan ketergantungannya.
24. Hidden Markov Model (HMM): Model statistik untuk data urutan yang menggambarkan sistem yang berubah-ubah dengan keadaan tersembunyi. Contohnya adalah pengenalan ucapan.
25. Voting Classifier: Kombinasi dari beberapa algoritma klasifikasi yang menggabungkan prediksi mereka dengan voting mayoritas untuk meningkatkan akurasi klasifikasi teks.
26. Bagging Classifier: Teknik ensemble yang menggabungkan hasil dari beberapa model yang dilatih dengan subset data yang berbeda. Contohnya adalah klasifikasi risiko finansial.
27. Stacking Classifier: Algoritma ensemble yang menggabungkan prediksi dari beberapa model dasar melalui model meta.
28. Gaussian Naive Bayes: Varian Naive Bayes yang mengasumsikan bahwa fitur mengikuti distribusi Gaussian.
29. Bernoulli Naive Bayes: Varian Naive Bayes yang digunakan untuk data biner.
30. Multinomial Naive Bayes: Varian Naive Bayes yang digunakan untuk data dengan jumlah kejadian fitur. Contohnya adalah klasifikasi dokumen dalam analisis teks.
Setiap algoritma memiliki kelebihan dan kekurangan serta cocok untuk berbagai jenis data dan masalah klasifikasi. Pemilihan algoritma yang tepat bergantung pada karakteristik data dan tujuan analisis.
Komentar
Posting Komentar