Pengertian dan Contoh Algoritma Naive Bayes Classifier
Algoritma Naive Bayes Classifier merupakan salah satu algoritma machine learning yang banyak digunakan untuk tugas klasifikasi.
Pengertian Naive Bayes Classifier
Naive Bayes Classifier adalah sekumpulan algoritma yang didasarkan pada Teorema Bayes. Dengan kata lain, algoritma ini bukan algoritma tunggal melainkan satu grup algoritma dimana masing-masing memiliki prinsip kerja yang mirip.
Algoritma ini bekerja berdasarkan prinsip probabilitas bersyarat, seperti yang diberikan oleh Teorema Bayes.
Teorema Bayes menemukan probabilitas atau kemungkinan suatu peristiwa akan terjadi dengan memberikan probabilitas peristiwa lain yang telah terjadi.
Dalam istilah yang lebih sederhana, Teorema Bayes adalah metode untuk menemukan probabilitas ketika kita mengetahui probabilitas tertentu lainnya.
Teorema Bayes dinyatakan secara matematis dalam persamaan berikut:
Dimana P(B) != 0
- Pada dasarnya, kita mencoba mencari peluang kejadian A, apabila kejadian B bernilai benar. Kejadian B juga disebut sebagai bukti.
- P(A) adalah apriori dari A (probabilitas sebelumnya, yaitu probabilitas peristiwa sebelum bukti terlihat). Bukti adalah nilai atribut dari instance yang tidak diketahui (peristiwa B).
- P(A|B) adalah probabilitas posteriori dari B, yaitu probabilitas kejadian setelah bukti terlihat.
Ciri utama dari algoritma Naive Bayes Classifier adalah adanya asumsi yg sangat kuat (naif) akan independensi dari masing-masing kondisi / kejadian.
Contoh Cara Kerja Algoritma Naive Bayes Classifier
Untuk memudahkan penjelasan, kita akan mengambil contoh kasus. Misalkan kita memiliki dataset yang ditunjukkan oleh tabel di bawah.
No | Outlook | Temperature | Humidity | Windy | Play Golf |
---|---|---|---|---|---|
0 | Rainy | Hot | High | FALSE | No |
1 | Rainy | Hot | High | TRUE | No |
2 | Overcast | Hot | High | FALSE | Yes |
3 | Sunny | Mild | High | FALSE | Yes |
4 | Sunny | Cool | Normal | FALSE | Yes |
5 | Sunny | Cool | Normal | TRUE | No |
6 | Overcast | Cool | Normal | TRUE | Yes |
7 | Rainy | Mild | High | FALSE | No |
Tabel di atas menggambarkan kondisi cuaca untuk bermain golf. Dengan mempertimbangkan kondisi cuaca, setiap tuple mengklasifikasikan keputusan untuk bermain golf atau tidak.
Dataset di atas dibagi menjadi dua bagian, yaitu matriks fitur dan vektor respons.
- Matriks fitur berisi semua vektor (baris) dari dataset di mana setiap vektor terdiri dari nilai fitur dependen. Dalam dataset di atas, fitur-fiturnya adalah 'Outlook', 'Temperature', 'Humidity' dan 'Windy'.
- Vektor respons berisi nilai variabel kelas (prediksi atau keluaran) untuk setiap baris matriks fitur. Dalam dataset di atas, nama variabel kelas adalah ‘Play golf’'.
Dengan menggunakan formula naive bayes, probabilitas masing-masing fitur dependen dapat dihitung.
Sumber: geeksforgeeks.org |
Pada gambar di atas, kita telah menghitung masing-masing fitur dependen secara manual pada tabel 1-4. Misalnya, peluang bermain golf jika suhunya dingin, yaitu P(temp. = cool | play golf = Yes) = 3/9
.
Juga kita perlu mencari peluang kelas (P(y))
yang telah dihitung pada tabel 5. Misalnya, P(Play golf = Yes) = 9/14
.
Dengan menghitung semua peluang, maka model klasifikasi untuk Naive Bayes Classifier sudah siap.
Kita dapat melakukan pengujian dengan menerapkan beberapa kondisi tertentu untuk mengetahui probabilitas bermain golf apakah yes atau no.
Contoh kita ingin tahu apakah kita bisa bermain golf dengan kondisi yang berikut:
Kita dapat menghitung peluang bermain golf dengan persamaan
Kemudian peluang tidak bermain golf adalah
Karena, variabel pembagi P(today) identik di kedua persamaan, kita dapat mengabaikan P(today) dan menemukan probabilitas proporsional dengan persamaan:
dan
Mengingat jumlah peluang kejadian harus bernilai 1, maka
Kita dapat melakukan normalisasi dengan persamaan berikut:
dan
Kemudian kita bandingkan antara kedua probabilitas tersebut.
Karena probabilitas p(yes|today)
lebih besar daripada p(no|today)
maka dengan kondisi cuaca yang diberikan, maka prediksi klasifikasinya adalah ‘Yes’
Penerapan Algoritma Naive Bayes Classifier
Naive Bayes Classifier banyak digunakan pada tugas klasifikasi seperti:
- Pengenalan wajah
Sebagai algoritma klasifikasi, Naive Bayes Classifier dapat digunakan untuk mengidentifikasi wajah atau fitur lainnya, seperti hidung, mulut, mata, dll. - Prediksi cuaca
Algoritma ini dapat digunakan untuk memprediksi apakah cuaca akan baik atau buruk. - Diagnosa medis
Dokter dan profesional kesehatan dapat menggunakan Naive Bayes untuk mendiagnosis apakah pasien berisiko tinggi untuk penyakit dan kondisi tertentu, seperti penyakit jantung, kanker, dan penyakit lainnya. - Klasifikasi berita
Dengan bantuan Naive Bayes, Google News dapat mengenali apakah sebuah berita bersifat politik, berita dunia, dan sebagainya.
Keunggulan Algoritma Naive Bayes Classifier
Adapun keunggulan dari algoritma Naive Bayes Classifier adalah sbb:
- sederhana dan mudah diterapkan
- tidak membutuhkan banyak data pelatihan
- menangani data kontinu dan diskrit
- sangat skalabel dengan jumlah prediktor dan titik data
- cepat dan dapat digunakan untuk membuat prediksi realtime
- tidak sensitif terhadap fitur yang tidak relevan
Penutup
Sebagai kesimpulan, algoritma Naive Bayes Classifier sangat direkomendasikan digunakan untuk tugas-tugas klasifikasi pada machine learning karena kesederhanaanya dalam melakukan prediksi berdasarkan pada probabilitas dari fitur-fitur yang ada.
Demikianlah penjelasan mengenai algoritma Naive Bayes. Semoga bermanfaat.
Apabila Anda suka dengan artikel serupa, Anda bisa mengunjungi rubrik Machine Learning atau membaca artikel lainnya mengenai algoritma Decision Tree.
Salam!
Referensi
Posting Komentar untuk "Pengertian dan Contoh Algoritma Naive Bayes Classifier"
Komentar SPAM akan disensor. Harap gunakan kalimat yang tidak menjurus pada SARA dan pornografi.