Analisis Diskriminan

Analisis diskriminan berguna pada siatuasi di mana kita ingin membentuk sebuah model prediktif dari beberapa kelompok (group) berdasarkan pada karakteristik pada masing-masing kasus. Prosedur pembentukan fungsi diskriminan (atau, pada lebih dari dua kelompok, serangkaian set dari fungsi diskriminan) berdasarkan pada kombinasi linear dari variabel-variabel prediktor yang memberikan pembeda terbaik dari kelompok-kelompok tersebut. Fungsi dibentuk dari sebuah sampel pada sebuah kasus di dalam sebuah group yang telah diketahui; fungsi lalu dapat diaplikasikan pada kasus baru dengan pengukuran pada variabel-variabel prediktor yang tidak diketahui masuk pada kelompok mana.

Catatan: Pengelompokan variabel dapat mempunyai lebih dari dua nilai. Kode untuk masing-masing pengelompokan variabel harus integer, akan tetapi, kita dapat menspesifikasikan nilai maksimum dan minimum. Kasus-kasus pada nilai di luar batas tidak termasuk pada analisis.

Sebagai contoh: Berdasarkan rata-rata, orang-orang pada daerah empat musim mengkonsumsi kalori per hari lebih banyak dibandingkan orang yang tinggal di daerah tropis. Peneliti ingin mengkombinasikan informasi ini pada sebuah fungsi untuk membedakan bagaimana seorang individu dapat dibedakan dalam dua daerah. Peneliti beranggapan bahwa informasi tentang ukuran populasi dan ekonomi juga penting. Analisis diskriminan memungkinkan kita mengestimasi koefisien dari fungsi linear diskriminan, yang merupakan bentuk lain dari persamaan regresi. Dengan demikian, dengan menggunakan koefisien a, b, c dan d, persamaannya adalah:
D= a * climate + b * urban + c * populasi + d * pdb
Jika variabel-variabel dapat membedakan dua iklim tersebut, maka nilai D akan berbeda antara daerah empat musim dan daerah tropis. Jika kita menggunakan metode stepwise, maka kita dapat menemukan varabel apa yang tidak masuk ke dalam fungsi. Asumsi pada analisis diskriminan
  1. Prediktor tidak mempunyai korelasi yang tinggi satu dengan yang lain
  2. Rata-rata dan varians pada prediktor tidak berkorelasi
  3. Corelasi antara dua prediktor adalah konstan pada semua group
  4. Nilai masing-masing prediktor harus berdistribusi normal
Untuk lebih jelasnya silahkan download simulasi dan contoh analisis diskriminan di bawah ini. sebagai informasi, materi ini disarikan dari manual book SPSS termasuk contoh data yang dipergunakan pada simulasi di bawah.

2 comments:

  1. mau tanya, itu datanya real atau ga ya ? klo real sumbernya dari mana ?

    BalasHapus
    Balasan
    1. Itu hanya simulasi data saja. Terima kasih.

      Hapus

Cari Materi