Cari Materi

Simulasi Multikolinearitas pada Regresi Logistik

Uji asumsi klasik yang sering dipergunakan dalam regresi linear berganda adalah uji normalitas, uji heteroskedastisitas, uji autokorelasi dan uji multikolinearitas. Dari keempat uji tersebut, jika kita simak maka uji normalitas, uji heteroskedastisitas dan uji autokorelasi berkaitan dengan nilai residualnya, sedangkan uji multikolinearitas berkaitan dengan variabel bebasnya. Regresi logistik adalah regresi di mana variabel terikatnya adalah dummy, yaitu 1 dan 0. Dengan demikian, residualnya yang merupakan selisih antara nilai prediksi dengan nilai sebenarnya tidak perlu dilakukan ketiga uji tersebut. Akan tetapi untuk uji multikolinearitas, karena hanya melibatkan variabel bebas, maka masih diperlukan uji tersebut. Mannual book SPSS menuliskan ‘Preferably, your predictors should not be highly correlated’. Sedangkan untuk autokorelasi pada time series akan dibahas belakangan.

1.    Objek penelitian
Penelitian menggunakan populasi seluruh perusahaan consumer goods, food and beverages dan tobacco pada Bursa Efek Indonesia pada periode tahun 2006 sampai dengan tahun 2008, di mana berdasarkan ICMD terdapat 25 perusahaan. Penelitian ini menggunakan 7 buah variabel bebas dan 1 buah variabel terikat yaitu financial distress. Adapun variabel bebasnya adalah NPM, CR, TATO, ROE, DTA, Posisi Kas dan Pertumbuhan.

2.    Menilai kelayakan model regresi (goodness of fit)
Penelitian menggunakan analisis regresi logistik karena variabel terikat (financial distress) menggunakan variabel dummy yaitu 0 (tidak mengalami financial distress) dan 1 (mengalami financial distress). Jumlah data yang dipergunakan adalah sebanyak 25 x 3 tahun = 75 data dengan mengeluarkan 1 buah data karena tidak memenuhi kriteria. Dengan demikian data yang dipergunakan adalah sebanyak 74 buah.


Nilai -2 Log Likelihood pada Beginning Block adalah sebesar 102,369 pada iterasi ke-2. Nilai tersebut merupakan nilai Chi Square yang dibandingkan dengan nilai Chi Square pada tabel dengan df sebesar N – 1 = 74 – 1 = 73 pada taraf signifikansi 0,05 yaitu sebesar 93,945. Tampak bahwa -2 Log Likelihood > Chi Square tabel (102,369 > 93,945) yang menunjukkan bahwa terdapat perbedaan yang signifikan antara model dengan konstanta saja dengan data.

Tabel 1


Hal ini menunjukkan bahwa model dengan konstanta saja belum fit. Sehingga diperlukan pengujian lain yaitu dengan memasukkan variabel bebas sebanyak 7 buah sehingga mempunyai df sebesar 74 – 7 - 1 = 66 dan mempunyai nilai chi square tabel sebesar 85,965 pada signifikansi 0,05. Sedangkan nilai -2 Log Likelihood dengan memasukkan variabel bebas adalah sebagai berikut:

Tabel 2


Tampak bahwa nilai -2 Log Likelihood < Chi Square tabel (46,443 < 85,965) yang menunjukkan bahwa model dengan memasukkan variabel bebas adalah fit dengan data. Hal ini menunjukkan bahwa model layak untuk dipergunakan. Jika ingin melihat selisih dari kedua nilai di atas yaitu antara Blok 0 dengan Blok 1, maka dilakukan dengan mengurangkan nilainya yaitu 102,369 – 46,443 = 55,926 dan Program SPSS juga menampilkan selisih tersebut yaitu sebagai berikut:

Tabel 3

Tampak bahwa selisihnya adalah sebesar 55,926 dengan signifikansi sebesar 0,000 (< 0,05) yang menunjukkan bahwa penambahan variabel bebas memberikan pengaruh nyata terhadap model, atau dengan kata lain model dinyatakan fit. Lebih lanjut, untuk melihat apakah data empiris cocok dengan model (tidak ada perbedaan antara model dengan data) dilakukan dengan melihat nilai Hosmer and Lemeshow Test yaitu sebagai berikut:

Tabel 4

Nilai Chi Square tabel untuk df 8 pada taraf signifikansi 0,05 adalah sebesar 15,507 sehingga Chi Square hitung < Chi Square tabel (2,692 < 15,507). Tampak juga bahwa nilai signifikansi adalah sebesar 0,952 (> 0,05) yang menunjukkan bahwa model dapat diterima dan pengujian hipotesis dapat dilakukan.

Untuk melihat kemampuan variabel bebas dalam menjelaskan varians financial distress, digunakan nilai Cox dan Snell R Square dan Nagelkerke R Square. Nilai Nagelkerke R Square sebesar 0,708 yang lebih besar dari pada Cox dan Snell R Square, yang menunjukkan bahwa kemampuan ketujuh variabel bebas dalam menjelaskan varians financial distress adalah sebesar 70,8% dan terdapat 29,2% faktor lain yang menjelaskan varians financial distress.

Tabel 5

Untuk melihat ketepatan model yang dibentuk dilihat dengan Klasifikasi tabel sebagai berikut:

Tabel 6

Sampel yang tidak mengalami financial distress (0) adalah sebanyak 35 perusahaan. Hasil prediksi model pada Tabel di atas adalah 30 perusahaan tidak mengalami financial distress (0) dan 5 mengalami financial distress (1). Berarti terdapat 5 prediksi yang salah sehingga prediksi yang benar adalah sebanyak 30/35 = 85,7%. Sedangkan untuk perusahaan yang melakukan mengalami financial distress, dari 39 sampel hanya 3 perusahaan yang diprediksi tidak sesuai oleh model penelitian sehingga kebenaran model untuk perusahaan yang mengalami financial distress adalah sebesar 36/39 = 92,3%. Dengan demikian tabel di atas memberikan nilai overall percentage sebesar (30+36)/74 = 89,2% yang berarti ketepatan model penelitian ini adalah sebesar 89,2%.

3.    Pengujian Hipotesis
Setelah diperoleh model yang fit terhadap data, maka langkah selanjutnya adalah dilakukan uji hipotesis. Pengujian hipotesis dilakukan untuk menjawab pertanyaan penelitian ini.
Tabel 7

Dengan menggunakan tingkat kepercayaan 90% maka yang dinyatakan signifikan adalah NPM (Sig. 0,001) dan ROA (Sig. 0,000) terhadap financial distress. Jika dilihat dari koefisiennya (B) maka tampak bahwa koefisien NPM adalah positif yang berarti bahwa semakin tinggi NPM berarti semakin tinggi pula kemungkinan mengalami distress. Sedangkan ROA mempunyai koefisien negatif yang menunjukkan bahwa semakin tinggi ROA maka semakin rendah kemungkinan perusahaan mengalami distress.

Sampai di sini, kita punya pertanyaan penting, Apakah benar semakin tinggi NPM berarti semakin tinggi perusahaan mengalami financial distress. Silahkan Anda rujuk kepada teori yang ada. Jika Anda tidak yakin akan hal itu, silahkan lihat tabel di bawah:

Tabel 8

Tampak jelas bahwa korelasi antara ROA dengan NPM adalah 0,970 (tanda minus kita abaikan) yang berarti bahwa terdapat korelasi yang tinggi antara kedua variabel tersebut sehingga mengganggu model penelitian. Anda dapat melakukan modifikasi terhadap model, tentunya dengan justifikasi teori atau rujukan yang kuat. Karena ini hanya simulasi, maka modifikasi dilakukan dengan mengganti variabel ROA dengan ROE yang keduanya mengukur profitabilitas. Sehingga tabulasi korelasinya adalah sebagai berikut:

Tabel 9

Tampak bahwa tidak ada variabel bebas yang saling mempunyai korelasi yang tinggi sehingga tidak ada gangguan multikolinearitas pada model penelitian. Secara singkat, hasil estimasi model adalah sebagai berikut:

Tabel 10





   

Tampak bahwa semua asumsi yang diperlukan tetap terpenuhi pada model dengan ROE yang menggantikan ROA. Selain itu, NPM dan TATO mempunyai pengaruh negatif terhadap financial distress.

Penting untuk dicatat, bahwa simulasi ini hanya bertujuan untuk menunjukkan bahwa asumsi multikolinearitas masih diperlukan pada regresi logistik.


Download artikel di atas
Download data dalam SPSS

5 komentar:

  1. Saya Dicki mas..saya lagi skripsi tentang peramalan krisis keuangan pakai binary logistik, tapi nilai nagelkerke R square nya sempurna alias 1.000 dan signifikansi pada tabel hosmer lemeshow juga 1.000 dengan chi square pada tabel hosmer lemeshow 0.000,
    juga tidak ada variabel yang signifikan secara statistik, dengan nilai uji wald berkisar 0.000 sampai 0.001.
    saya rasa itu aneh mas..mohon pencerahannya, makasih mas...

    BalasHapus
  2. Buat Dicki
    Memang agak mencurigakan. Artinya model itu tepat 100%. Coba check lagi datanya. Terima kasih

    BalasHapus
  3. saya erika... misalkan data sem saya sudah fit namun karena determinant saya 0,000 maka ada indikasi multikolinearitas, apakah dapat diabaikan bila sudah mencapai tahap fit???adakah teorinya???

    BalasHapus
  4. Saya Eka Pak..ada dua pertanyaan: 1)apa beda binary logistic dan multinominal logistic dalam penggunaannya? 2) secara umum regresi logistik (entah yg mana dari kedua logistic di atas) dipakai untuk menganalisis data yang variabel dependent-nya kategori. Nah, bila hubungan antara kedua variabel tersebut (yg dianalisis reg logisti; indepen nya interval, dependen nya kategori) dimoderatori oleh usia dan jenis kelamin, bagaimana menganalisisnya? terima kasih

    BalasHapus
  5. pk mau tnya, klau pkai uji regresi logistik. sampelnya minimum 50 ya?? klau 35-40 bsa??

    BalasHapus

Untuk memberikan fasilitas diskusi yang lebih, silahkan visit Forum Diskusi lalu register untuk diskusi tanpa moderasi. Terima kasih.