Uji Asumsi Klasik (Lengkap)

Sebenarnya sudah ada postingan tentang uji asumsi klasik dalam web ini bahkan merupakan artikel yang paling populer. Artikel ini hanya untuk melengkapi saja tulisan tersebut dengan melengkapinya. Uji asumsi klasik merupakan terjemahan dari clasical linear regression model (CLRM) yang merupakan asumsi yang diperlukan dalam analisis regresi linear dengan ordinary least square (OLS). Sebagai informasi, semua ini berkat kejeniusan seorang matematikawan Jerman bernama Carl Friedrich Gauss.

CLRM juga sering disebut dengan The Gaussian Standard, yang sebenarnya terdiri dari 10 item. Akan tetapi, yang sering kita jumpai dalam berbagai penelitian, atau berbagai buku statistik terapan mungkin hanya 4 atau 5 saja. Mengapa? Berikut sedikit uraian tentang 10 item tersebut.

1.    Asumsi 1: Linear Regression Model.
Model regresi haruslah linear, meskipun bisa saja sebenarnya variabel terikat Y dengan variabel bebas X tidak linear. Istilah linear sebenarnya ada dua macam, yaitu linearitas pada variabel dan linearitas pada parameter. Yang disebut dengan linearitas pada variabel adalah jika digambarkan dalam grafik maka akan berbentuk garis lurus. Misalnya persamaan Y = a + bX. Seandainya persamaannya adalah Y = a + b X^2 maka disebut tidak linear, karena jika digambarkan dalam grafik tidak membentuk garis lurus. Atau secara umum dapat dikatakan jika X mempunyai pangkat 1. Sedangkan linearitas pada parameter adalah merujuk kepada koefisiennya yaitu b. Jadi persamaan Y = a + b X^2 dapat disebut linear jika koefisien b mempunyai pangkat 1. Asumsi yang diperlukan dalam regresi linear adalah linearitas pada parameter, bukan linearitas pada variabel.

2.    Asumsi 2: X values are fixed in repeated sampling.
Nilai variabel X diasumsikan stokastik atau dianggap tetap dalam sampel yang berulang. Misalnya ada 7 data yang akan dianalisis dengan regresi (ini hanya contoh saja, karena regresi dengan 7 data tampaknya terlalu sedikit).
Gaji (juta)        Pengeluaran (juta)
3                     2,5
3                     2
3                     3
4                     3
4                     2,5
5                     4,5
5                     4
Jadi misalnya ambil nilai tetap untuk X, yaitu gaji 3 juta maka sampel pertama mempunyai pengeluaran 2,5 juta. Lalu ambil lagi sampel kedua dengan gaji 3 juta maka pengeluarannya adalah 2 juta. Demikian seterusnya untuk sampel dengan gaji 4 juta dan 5 juta. Jadi nilai X dianggap tetap pada sampel yang berulang. (dalam regresi lanjut, dapat diasumsikan bahwa X tidak stokastik).

3.    Asumsi 3: Zero mean value of disturbance ui
Nilai Y hasil prediksi dengan model regresi tentunya mempunyai kesalahan atau tidak tepat sama dengan nilai Y pada data. Selisihnya sering disebut dengan disturbance dan sering disimbolkan dengan u. Nilai ini harus mempunyai rata-rata sama dengan 0 (eksak). Ketika kita telah mendaptkan garis lurus pada model, maka nilai Y yang sebenarnya bisa berada di atas atau di bawah garis lurus tersebut, akan tetapi jumlahnya akan seimbang sehingg rata-ratanya sama dengan 0.

4.    Asumsi 4: Homoscedasticity or equal variance of ui
Homo berarti sama atau equal, scedasticity berarti disperse atau scatter atau ada yang mengartikan sebaran. Jadi varians dari error atau disturbance haruslah sama pada masing-masing nilai X. Sebagai contoh, ada 3 orang dengan gaji 3 juta sehingga memberikan tiga buah error dan mempunyai varians. Varians ini harus sama (equal) dengan varians error pada nilai X yang lain misalnya 4 juta. Demikian seterusnya.

5.    Asumsi 5: No autocorrelation between the disturbances
Asumsi ini masih berkaitan dengan nilai error, yaitu bahwa untuk sembarang 2 buah nilai X, maka kedua error itu tidak berkorelasi (atau mempunyai korelasi 0). Misalnya error pada X sebesar 3 juta dengan Y sebesar 2,5 dengan error pada X sebesar 3 juta dengan Y sebesar 2 juta tidak berkorelasi. Pengertian lain adalah misalnya ada persamaan Y = a + b X + u dengan u adalah error. Jika ada korelasi antara u dengan u-1 (error sebelumnya) maka model akan gagal, karena Y pada model harusnya dipengaruhi oleh X saja, akan dipengaruhi oleh u. Demikian seterusnya.

6.    Asumsi 6: Zero covariance between ui and Xi
Artinya nilai variabel bebas (Xi) dengan error (ui) tidak berkorelasi. Diasumsikan bahwa Y adalah dipengaruhi oleh X dan u, sehingga X dan u harus tidak saling berkorelasi. Jika X dan u berkorelasi, maka tidak mungkin mencari pengaruh masing-masing terhadap Y. Jika X berkorelasi positif dengan u, maka jika X meningkat u juga meningkat, atau jika X menurun maka u juga menurun (juga sebaliknya jika berkorelasi negatif). Sehingga sulit untuk mengisolasi pengaruh X dan u terhadap Y. Asumsi ini sebenarnya akan terpenuhi secara otomatis jika X merupakan stokastik karena untuk X bernilai tetap, u akan berubah.

7.    Asumsi 7: The number of observations n must be greater than the number of parameters to be estimated
Asumsi ini sebenarnya tidak asing bagi matematika sederhana. Jika ada dua parameter yang akan dicari nilainya maka tentunya tidak mungkin diselesaikan dengan satu persamaan (observasi).

8.    Asumsi 8: Variability in X values
Harus ada variasi nilai dalam variabel X. Jika X nilainya sama untuk semua observasi maka tentunya tidak dapat diestimasi. Meskipun ini mudah dimengerti namun sering dilupakan.
9.    Asumsi 9: The regression model is correctly specified
Model regresi yang dibangun haruslah benar dalam arti sesuai dengan teori yang telah dikembangkan. Seperti telah dijelaskan bahwa statistik hanyalah untuk menguji teori atau fenomena tertentu. Jadi jika menggunakan variabel yang sembarangan (atau tidak berdasarkan teori tertentu) maka model regresi yang dihasilkan juga patut dipertanyakan.

10.    Asumsi 10: There is no perfect multicollinearity
Tidak ada hubungan linear yang tinggi antara variabel-variabel bebas dalam model regresi. Jadi asumsi ini tentunya tidak bisa diterapkan pada regresi dengan satu variabel bebas (regresi linear sederhana).

Setelah menyimak uraian di atas, mungkin ada beberapa pertanyaan yang spontan muncul dalam benak Anda. Misalnya, mengapa uji normalitas residual tidak ada? Tepat sekali, asumsi normalitas residual (bukan normalitas pada masing-masing variabel) memang diperlukan akan tetapi itu tidak termasuk dalam uji asumsi klasik. Gujarati (2004:93) menulis 'The assumption that the disturbances ui are normally distributed is not a part of the CLRM’. Jika Anda masih berargumen, bahwa di dalam berbagai penelitian, uji normalitas residual dimasukkan dalam uji asumsi klasik (CLRM). Kajian tentang normalitas dimasukkan dalam Classical Normal Linear Regression Model (CNLRM). Jadi masalah penempatannya mau di mana, kita tidak dapat berkomentar.

Jika Anda simak lebih lanjut, maka dari 10 asumsi dalam CLRM tidak semuanya perlu diuji karena secara otomatis telah dimasukkan dalam persamaan untuk mengestimasi nilai konstanta, koefisien atau errornya. Asumsi 2, 3, 6, 7, 8 dan 9 tidak perlu lagi dilakukan pengujian tersendiri. Asumsi 1 juga sering tidak dilakukan karena terkait dengan asumsi 9, yaitu bahwa model harus dispesifikasi dengan benar. Asumsi 4, 5 dan 10 yang memerlukan pengujian tersendiri ditambah dengan pengujian normalitas.

Sumber Bacaan: Gujarati (2004)

6 comments:

  1. untuk penelitian skripsi, apa digunakan semuanya?

    BalasHapus
  2. mau tanya nih, apa bedanya regresi dan metode kalibrasi?

    BalasHapus
  3. Untuk uji asumsi klasik sendiri apa bisa dilakukan dengan software SEM-PLS atau memang hanya SPSS saja yang bisa melakukan uji asumsi klasik??

    BalasHapus
    Balasan
    1. Silahkan telusuri dulu literatur SEM-PLS. Terima kasih.

      Hapus
    2. Maaf mau tanya pak, untuk second difference delta ada buku pendukungnya tidak ya? Terima kasih sebelumnya

      Hapus

Cari Materi