Metode

Metode yang digunakan adalah K-Nearest Neighbor (KNN) adalah suatu metode yang menggunakan algoritma supervised dimana hasil dari query instance yang baru diklasifikan berdasarkan mayoritas dari kategori pada KNN. Tujuan dari algoritma ini adalah mengklasifikasikan obyek baru bedasarkan atribut dan training sample. Classifier tidak menggunakan model apapun untuk dicocokkan dan hanya berdasarkan pada memori. Diberikan titik query, akan ditemukan sejumlah k obyek atau (titik training) yang paling dekat dengan titik query. Klasifikasi menggunakan voting terbanyak diantara klasifikasi dari k obyek.. algoritma KNN menggunakan klasifikasi ketetanggaan sebagai nilai prediksi dari query instance yang baru.
Algoritma metode KNN sangatlah sederhana, bekerja berdasarkan jarak terpendek dari query instance ke training sample untuk menentukan KNN-nya. Training sample diproyeksikan ke ruang berdimensi banyak, dimana masing-masing dimensi merepresentasikan fitur dari data. Ruang ini dibagi menjadi bagian-bagian berdasarkan klasifikasi training sample. Sebuah titik pada ruang ini ditandai kelac c jika kelas c merupakan klasifikasi yang paling banyak ditemui pada k buah tetangga terdekat dari titik tersebut.
Data untuk algoritma KNN terdiri dari beberapa atribut multi-variate Xi yang akan digunakan untuk mengklasifikasikan Y. Data dari KNN dapat dalam skala ukuran apapun, dari ordinal ke nominal. Kelebihan KNN memiliki beberapa kelebihan yaitu bahwa dia tangguh terhadap training data yang noisy dan efektif apabila data latih nya besar. Kelemahan Sedangkan kelemahan dari KNN adalah : 1. KNN perlu menentukan nilai dari parameter K (jumlah dari tetangga terdekat) 2. Pembelajaran berdasarkan jarak tidak jelas mengenai jenis jarak apa yang harus digunakan dan atribut mana yang harus digunakan untuk mendapatkan hasil yang terbaik 3. Biaya komputasi cukup tinggi karena diperlukan perhitungan jarak dari tiap sample uji pada keseluruhan sample latih

Today Deal $50 Off : https://goo.gl/efW8Ef

Data untuk algoritma KNN terdiri dari beberapa atribut multi-variate Xi yang akan digunakan untuk mengklasifikasikan Y. Data dari KNN dapat dalam skala ukuran apapun, dari ordinal ke nominal. Kelebihan KNN memiliki beberapa kelebihan yaitu bahwa dia tangguh terhadap training data yang noisy dan efektif apabila data latih nya besar. Kelemahan Sedangkan kelemahan dari KNN adalah : 1. KNN perlu menentukan nilai dari parameter K (jumlah dari tetangga terdekat) 2. Pembelajaran berdasarkan jarak tidak jelas mengenai jenis jarak apa yang harus digunakan dan atribut mana yang harus digunakan untuk mendapatkan hasil yang terbaik 3. Biaya komputasi cukup tinggi karena diperlukan perhitungan jarak dari tiap sample uji pada keseluruhan sample latih

Today Deal $50 Off : https://goo.gl/efW8Ef
 Langkah-langkah untuk menghitung metode K-Nearest Neighbor :
1.Menentukan parameter K (jumlah tetangga paling dekat).
2.Menghitung kuadrat jarak euclid (query instance) masing–masin  obyek terhadap data sampel yang diberikan. 
3.Kemudian mengurutkan objek–bjck tersebut kedalam kelompok yangmempunyai jarak euclid terkecil.
4.Mengumpulkan kategori Y (Klasifikasi nearest neighbor)
5.Dengan menggunakan kategori nearest neighbor yang paling mayoritasmaka dapat dipredisikan nilai query instance yang telah dihitung.

Kelebihan
  • Lebih efektif di data training yang besar
  • Dapat menghasilkan data yang lebih akurat
Kekurangan
  • Perlu ditentukan nilai k yang paling optimal yang menyatakan jumlah tetangga terdekat
  • Biaya komputasi cukup tinggi karena perhitungan jarak harus dilakukan pada setiap query instance bersama-sama dengan seluruh instan dari training sample


Data untuk algoritma KNN terdiri dari beberapa atribut multi-variate Xi yang akan digunakan untuk mengklasifikasikan Y. Data dari KNN dapat dalam skala ukuran apapun, dari ordinal ke nominal. Kelebihan KNN memiliki beberapa kelebihan yaitu bahwa dia tangguh terhadap training data yang noisy dan efektif apabila data latih nya besar. Kelemahan Sedangkan kelemahan dari KNN adalah : 1. KNN perlu menentukan nilai dari parameter K (jumlah dari tetangga terdekat) 2. Pembelajaran berdasarkan jarak tidak jelas mengenai jenis jarak apa yang harus digunakan dan atribut mana yang harus digunakan untuk mendapatkan hasil yang terbaik 3. Biaya komputasi cukup tinggi karena diperlukan perhitungan jarak dari tiap sample uji pada keseluruhan sample latih

Today Deal $50 Off : https://goo.gl/efW8Ef
Data untuk algoritma KNN terdiri dari beberapa atribut multi-variate Xi yang akan digunakan untuk mengklasifikasikan Y. Data dari KNN dapat dalam skala ukuran apapun, dari ordinal ke nominal. Kelebihan KNN memiliki beberapa kelebihan yaitu bahwa dia tangguh terhadap training data yang noisy dan efektif apabila data latih nya besar. Kelemahan Sedangkan kelemahan dari KNN adalah : 1. KNN perlu menentukan nilai dari parameter K (jumlah dari tetangga terdekat) 2. Pembelajaran berdasarkan jarak tidak jelas mengenai jenis jarak apa yang harus digunakan dan atribut mana yang harus digunakan untuk mendapatkan hasil yang terbaik 3. Biaya komputasi cukup tinggi karena diperlukan perhitungan jarak dari tiap sample uji pada keseluruhan sample latih

Today Deal $50 Off : https://goo.gl/efW8Ef

Tidak ada komentar:

Posting Komentar