Regresi dan Korelasi

Regresi dan Sebab Akibat
Meskipun analisis regresi berkaitan dengan ketergantungan dari suatu variabel kepada variabel lain, tidak berarti bahwa hal itu merupakan hubungan sebab akibat (causation). Kendal dan Stuart (M. G. Kendall and A. Stuart, The Advanced Theory of Statistics, Charles Griffin Publishers, New York, 1961, vol. 2, chap. 26, p. 279) mengatakan bahwa ‘Sebuah hubungan statistik, meskipun kuat dan sugestive, akan tetapi tidak pernah dapat membentuk suatu hubungan sebab akibat, karena hubungan sebab akibat berasal dari teori atau sumber lain.

Dalam contoh hasil panen, tidak ada alasan statistik yang mengatakan bahwa hujan tidak tergantung pada hasil panen. Faktanya adalah bahwa hasil panen merupakan variabel yang tergantung pada curah hujan yang bukan merupakan hasil dari analisis statistik. Kita tidak dapat mengontrol curah hujan dengan memberikan variasi pada hasil panen.

Jadi sebuah hubungan statistik tidak dapat dilogika sebagai hubungan sebab akibat. Untuk menggambarkan hubungan sebab akibat (kausalitas), kita harus menggunakan teori terlebih dahulu. Atau contoh lain yaitu bahwa kita mengatakan pengeluaran tergantung dari pendapatan adalah berdasarkan teori ekonomi (bukan pertimbangan statistik). Akan tetapi, analisis regresi juga berdasarkan asumsi bahwa model yang digunakan dalam analisis adalah sebuah model yang benar. Oleh karena itu, arah hubungan sebab akibat tersirat secara implisit dalam bentuk model yang dipostulatkan (postulat: pernyataan yang dianggap benar, sampai ada bukti yang menyatakan bahwa pernyataan itu salah atau aksioma).

Regresi dan Korelasi
Pernyataan yang sering kita dengan adalah bahwa regresi dimengerti dengan kata kunci pengaruh, dan korelasi dimengerti dengan kata kunci hubungan. Pengertian sederhana itu tidaklah salah, akan tetapi, tidak ada salahnya juga kita memahami secara lebih lanjut tentang regresi dan korelasi.
Analisis korelasi berkaitan erat dengan regresi, tetapi secara konsep berbeda dengan analisis regresi. Analisis korelasi adalah mengukur suatu tingkat atau kekuatan hubungan linear antara dua variabel. Koefisien korelasi adalah mengukur kekuatan hubungan linear. Sebagai contoh, kita tertarik untuk menemukan korelasi antara merokok dengan penyakit kanker, berdasarkan penjelasan statistik dan matematika, pada anak sekolah dan mahasiswa (dst). Dalam analisis regresi, kita tidak menggunakan pengukuran tersebut. Analisis regresi mencoba untuk mengestimasi atau memprediksikan nilai rata-rata suatu variabel yang sudah diketahui nilainya, berdasarkan suatu variabel lain yang juga sudah diketahui nilainya. Misalnya, kita ingin mengetahui apakah kita dapat memprediksikan nilai rata-rata ujian statistik berdasarkan nilai hasil ujian matematika.

Regresi dan korelasi mempunyai perbedaan mendasar. Dalam analisis regresi terdapat asimtri pada variabel tergantung dan terkiat yang akan dianalisis. Variabel terikat diasumsikan random atau stokastik, sehingga mempunyai distribusi probabilitas. Variabel penjelas (variabel bebas) diasumsikan mempunyai nilai yang tertentu (dalam sampel tertentu). Sebenarnya sangat dimungkinkan bahwa variabel bebas juga stokastik secara intrinsik, akan tetapi untuk kegunaan analisis regresi, maka kita asumsikan bahwa nilai variabel bebas adalah tertentu (fixed). Nilai-nilai pada variabel bebas adalah sama pada berbagai sampel sehingga tidak random atau tidak stokastik.

Dalam analisis korelasi, kita menggunakan dua variabel yang simetris, sehingga tidak ada perbedaan antara variabel terikat dengan variabel penjelas. Korelasi antara nilai ujian matematika dan ujian statistik (dalam contoh di atas) adalah sama dengan korelasi antara ujian statistik dan ujian matematika. Lebih lanjut, dua variabel tersebut diasumsikan random. Seperti yang telah kita ketahui, bahwa kebanyakan teori korelasi berdasarkan pada asumsi variabel random, di mana kebanyakan teori regresi berdasarkan pada asumsi variabel tergantung stokastik dan variabel bebas adalah tertentu atau non stokastik. Meskipun demikian, dalam analisis yang lebih mendalam, kita dapat mempertimbangkan kembali asumsi bahwa variabel penjelas merupakan non stokastik.

(Gujarati, 2004:22-24)



Artikel Terkait
  1. Sejarah Regresi
  2. Statistik dan Deterministik
  3. Regresi Linear
  4. Koefisien Determinasi

2 comments:

  1. bedanya penggunaan korelasi spearman rho dengan chisquare gmn ya kak ?? makasih

    BalasHapus
  2. kalau kita cari pengaruh menggunakan regresi logistik kemudian mau cari hubungan dengan korelasi dengan satu kasus yang sama, apakah bisa?

    BalasHapus

Cari Materi