Analisis diskriminan berguna pada situasi di mana kita ingin membentuk sebuah model prediktif dari beberapa kelompok (group) berdasarkan pada karakteristik pada masing-masing kasus. Prosedur pembentukan fungsi diskriminan (atau, pada lebih dari dua kelompok, serangkaian set dari fungsi diskriminan) berdasarkan pada kombinasi linear dari variabel-variabel prediktor yang memberikan pembeda terbaik dari kelompok-kelompok tersebut. Fungsi dibentuk dari sebuah sampel pada sebuah kasus di dalam sebuah group yang telah diketahui; fungsi lalu dapat diaplikasikan pada kasus baru dengan pengukuran pada variabel-variabel prediktor yang tidak diketahui masuk pada kelompok mana.
Catatan: Pengelompokan variabel dapat mempunyai lebih dari dua nilai. Kode untuk masing-masing pengelompokan variabel harus integer, akan tetapi, kita dapat menspesifikasikan nilai maksimum dan minimum. Kasus-kasus pada nilai di luar batas tidak termasuk pada analisis.
Sebagai contoh: Berdasarkan rata-rata, orang-orang pada daerah empat musim mengkonsumsi kalori per hari lebih banyak dibandingkan orang yang tinggal di daerah tropis. Peneliti ingin mengkombinasikan informasi ini pada sebuah fungsi untuk membedakan bagaimana seorang individu dapat dibedakan dalam dua daerah. Peneliti beranggapan bahwa informasi tentang ukuran populasi dan ekonomi juga penting. Analisis diskriminan memungkinkan kita mengestimasi koefisien dari fungsi linear diskriminan, yang merupakan bentuk lain dari persamaan regresi. Dengan demikian, dengan menggunakan koefisien a, b, c dan d, persamaannya adalah:
D= a * climate + b * urban + c * populasi + d * pdb
Jika variabel-variabel dapat membedakan dua iklim tersebut, maka nilai D akan berbeda antara daerah empat musim dan daerah tropis. Jika kita menggunakan metode stepwise, maka kita dapat menemukan varabel apa yang tidak masuk ke dalam fungsi. Asumsi pada analisis diskriminan:
mau tanya, itu datanya real atau ga ya ? klo real sumbernya dari mana ?
BalasHapusItu hanya simulasi data saja. Terima kasih.
Hapus