Metode yang digunakan adalah K-Nearest Neighbor (KNN) adalah suatu metode yang menggunakan algoritma supervised dimana hasil dari query instance
yang baru diklasifikan berdasarkan mayoritas dari kategori pada KNN.
Tujuan dari algoritma ini adalah mengklasifikasikan obyek baru
bedasarkan atribut dan training sample. Classifier tidak menggunakan model apapun untuk dicocokkan dan hanya berdasarkan pada memori. Diberikan titik query, akan ditemukan sejumlah k obyek atau (titik training) yang paling dekat dengan titik query. Klasifikasi menggunakan voting terbanyak diantara klasifikasi dari k obyek.. algoritma KNN menggunakan klasifikasi ketetanggaan sebagai nilai prediksi dari query instance yang baru.
Algoritma metode KNN sangatlah sederhana, bekerja berdasarkan jarak terpendek dari query instance ke training sample untuk menentukan KNN-nya. Training sample
diproyeksikan ke ruang berdimensi banyak, dimana masing-masing dimensi
merepresentasikan fitur dari data. Ruang ini dibagi menjadi
bagian-bagian berdasarkan klasifikasi training sample. Sebuah titik pada ruang ini ditandai kelac c jika kelas c merupakan klasifikasi yang paling banyak ditemui pada k buah tetangga terdekat dari titik tersebut.
Data untuk algoritma
KNN terdiri dari beberapa atribut multi-variate Xi yang akan digunakan
untuk mengklasifikasikan Y. Data dari KNN dapat dalam skala ukuran
apapun, dari ordinal ke nominal.
Kelebihan
KNN memiliki beberapa kelebihan yaitu bahwa dia tangguh terhadap
training data yang noisy dan efektif apabila data latih nya besar.
Kelemahan
Sedangkan kelemahan dari KNN adalah :
1. KNN perlu menentukan nilai dari parameter K (jumlah dari tetangga
terdekat)
2. Pembelajaran berdasarkan jarak tidak jelas mengenai jenis jarak apa
yang harus digunakan dan atribut mana yang harus digunakan untuk
mendapatkan hasil yang terbaik
3. Biaya komputasi cukup tinggi karena diperlukan perhitungan jarak dari
tiap sample uji pada keseluruhan sample latih
Today Deal $50 Off : https://goo.gl/efW8Ef
Today Deal $50 Off : https://goo.gl/efW8Ef
Data untuk algoritma
KNN terdiri dari beberapa atribut multi-variate Xi yang akan digunakan
untuk mengklasifikasikan Y. Data dari KNN dapat dalam skala ukuran
apapun, dari ordinal ke nominal.
Kelebihan
KNN memiliki beberapa kelebihan yaitu bahwa dia tangguh terhadap
training data yang noisy dan efektif apabila data latih nya besar.
Kelemahan
Sedangkan kelemahan dari KNN adalah :
1. KNN perlu menentukan nilai dari parameter K (jumlah dari tetangga
terdekat)
2. Pembelajaran berdasarkan jarak tidak jelas mengenai jenis jarak apa
yang harus digunakan dan atribut mana yang harus digunakan untuk
mendapatkan hasil yang terbaik
3. Biaya komputasi cukup tinggi karena diperlukan perhitungan jarak dari
tiap sample uji pada keseluruhan sample latih
Today Deal $50 Off : https://goo.gl/efW8Ef
Today Deal $50 Off : https://goo.gl/efW8Ef
Langkah-langkah untuk menghitung metode K-Nearest Neighbor :
1.Menentukan parameter K (jumlah tetangga paling dekat).
2.Menghitung kuadrat jarak euclid (query instance) masing–masin obyek terhadap data sampel yang diberikan.
3.Kemudian mengurutkan objek–bjck tersebut kedalam kelompok yangmempunyai jarak euclid terkecil.
4.Mengumpulkan kategori Y (Klasifikasi nearest neighbor)
5.Dengan menggunakan kategori nearest neighbor yang paling mayoritasmaka dapat dipredisikan nilai query instance yang telah dihitung.
Kelebihan
Kelebihan
- Lebih efektif di data training yang besar
- Dapat menghasilkan data yang lebih akurat
- Perlu ditentukan nilai k yang paling optimal yang menyatakan jumlah tetangga terdekat
- Biaya komputasi cukup tinggi karena perhitungan jarak harus dilakukan pada setiap query instance bersama-sama dengan seluruh instan dari training sample
Data untuk algoritma
KNN terdiri dari beberapa atribut multi-variate Xi yang akan digunakan
untuk mengklasifikasikan Y. Data dari KNN dapat dalam skala ukuran
apapun, dari ordinal ke nominal.
Kelebihan
KNN memiliki beberapa kelebihan yaitu bahwa dia tangguh terhadap
training data yang noisy dan efektif apabila data latih nya besar.
Kelemahan
Sedangkan kelemahan dari KNN adalah :
1. KNN perlu menentukan nilai dari parameter K (jumlah dari tetangga
terdekat)
2. Pembelajaran berdasarkan jarak tidak jelas mengenai jenis jarak apa
yang harus digunakan dan atribut mana yang harus digunakan untuk
mendapatkan hasil yang terbaik
3. Biaya komputasi cukup tinggi karena diperlukan perhitungan jarak dari
tiap sample uji pada keseluruhan sample latih
Today Deal $50 Off : https://goo.gl/efW8Ef
Today Deal $50 Off : https://goo.gl/efW8Ef
Data untuk algoritma
KNN terdiri dari beberapa atribut multi-variate Xi yang akan digunakan
untuk mengklasifikasikan Y. Data dari KNN dapat dalam skala ukuran
apapun, dari ordinal ke nominal.
Kelebihan
KNN memiliki beberapa kelebihan yaitu bahwa dia tangguh terhadap
training data yang noisy dan efektif apabila data latih nya besar.
Kelemahan
Sedangkan kelemahan dari KNN adalah :
1. KNN perlu menentukan nilai dari parameter K (jumlah dari tetangga
terdekat)
2. Pembelajaran berdasarkan jarak tidak jelas mengenai jenis jarak apa
yang harus digunakan dan atribut mana yang harus digunakan untuk
mendapatkan hasil yang terbaik
3. Biaya komputasi cukup tinggi karena diperlukan perhitungan jarak dari
tiap sample uji pada keseluruhan sample latih
Today Deal $50 Off : https://goo.gl/efW8Ef
Today Deal $50 Off : https://goo.gl/efW8Ef
Tidak ada komentar:
Posting Komentar