Selasa, 31 Mei 2011

Help Me, Prediktor-Prediktor saya Multikol !

Wahyu Widhiarso | Fakultas Psikologi UGM | 2011

Apa Multikol itu ?
Multikol memiliki nama panjang multikolinieritas. Yaitu kondisi ketika antara satu prediktor dengan prediktor lain dalam regresi memiliki korelasi yang tinggi. Korelasi yang tinggi menunjukkan bahwa wilayah mereka berhimpitan, alias overlap.
Multikol menunjukkan ketidakefektifan. Misalnya kita hendak memprediksi popularitas remaja di antara teman-temannya. Prediktor pertama adalah harga diri sedangkan prediktor kedua adalah kepercayaan diri. Jika regresi diterapkan pada data yang ada pasti multikolinieritas akan muncul. Kenapa? Karena harga diri dan kepercayaan diri memiliki korelasi yang sangat tinggi. Keduanya overlap. Jadi, model kita tidak efektif. Buat apa memasukkan prediktor yang mirip, bukankah variabel lain yang unik masih banyak?
Contoh Multikol dan Dampaknya pada Regresi ?
Lihat matriks korelasi di bawah ini. X1 dan X2 masing-masing memiliki korelasi yang tinggi dengan variabel dependen (Y). X1-Y korelasinya positif signifikan, demikian juga X2-Y. Korelasinya mereka pada kategori sedang. Lihat juga korelasi antar prediktor (X1-X2), r=0.955. Tinggi banget korelasinya, ini merupakan contoh data yang terjangkit multikol.
Tabel 1. Matriks Korelasi

Tabel 2 di bawah ini adalah hasil analisis regresi pada variabel di atas. Kita melihat kejadian aneh. Dari Tabel 1 kita melihat X1 dan X2 awalnya memiliki korelasi yang positif dan signifikan, ketika dimasukkan dalam satu analisis, salah satu prediktor (X1) memiliki nilai prediksi yang negatif dan hampir signifikan. Hanya X2 saja yang signifikan.
 

Ya itulah salah satu dampak multikolinieritas. Dia akan menyebabkan hasil analisis menjadi aneh. Masak, X1 memiliki korelasi positif tetapi ketika dimasukkan regresi justru berubah arah menjadi negatif. Arti negatif berarti menurunkan, berarti jika X2 dan X1 masuk dalam sistem analisis sama salah satu meningkatkan dan salah satu menurunkan. Padahal, kalau analisis sendiri-sendiri, keduanya sama meningkatkan.
 
Bisa dijelaskan Mengapa Arah koefisien menjadi berubah arah ?
Dua variabel yang kolinier memiliki posisi garis regresi yang sama dalam menjelaskan variabel dependen (Pedhazur, 1997). Karena memiliki garis yang sama maka keduanya akan berkelahi, berebutan untuk mengakui garis tersebut. Yang menang akan menguasai garis tersebut sedangkan yang kalah tidak memiliki apa2, akibatnya tidak ada garis yang bisa mewakili yang kalah.

Kalau ada terjadi perkelahian, siapa yang menang? Yang menang adalah prediktor yang memiliki korelasi lebih tinggi dengan variabel dependen. Contoh regresi di atas terlihat bahwa korelasi X1-Y adalah 0.552 sedangkan korelasi X2-Y adalah 0.721. Karena korelasi X2-Y lebih besar, maka dia yang menguasai garis tersebut. X1 kalah sehingga ketika nilai prediksinya menjadi negatif. Penjelasan secara visual dapat dibaca pada tulisan saya (Widhiarso, 2010)
 
Bagaimana Mendeteksi Keberadaan Multikolinieritas ?
Ada banyak prosedur untuk mendeteksi apakah data kita terjangkit multikol ataukah tidak. Cara yang paling sederhana adalah melalui korelasi antar prediktor. Korelasi antar prediktor yang terlalu tinggi (di atas 0.8 atau 0.9) menunjukkan data terjangkit multikol (Field, 2000).
Kalau melalui SPSS kita bisa mengetahui melalui nilai Variance Inflation Factors (VIF). Ada ahli yang bilang bahwa VIF sebesar 10 menunjukkan data kita tidak terjangkit multikol (Bowerman & O'Connell, 2000). Ada lagi ahli lain yang bilang di atas 1, menunjukkan multikol (Myers, 1990).
 
Apa yang dilakukan Setelah Kita Mendapati Adanya Multikolinieritas ?
Kita tadi tahu kalau hasil regresi akan aneh data kita terjangkit multikolinieritas. Jadi pilihlah prediktor yang memiliki daya prediksi yang tinggi saja. Lalu laporkan persamaan regresi berdasarkan analisis regresi tersebut.
Untuk menambah informasi mengenai hasil penelitian kita, jangan lupa untuk melaporkan juga matriks korelasi variabel-variabel penelitian kita, agar pembaca kita tahu bahwa sebenarnya X1 memiliki prediksi yang kuat juga terhadap Y, akan tetapi karena terjadi multikolinieritas, maka X1 menjadi tidak bisa dilibatkan.

Hipotesis secara terpisah yang mengatakan bahwa X1 behubungan dengan Y dan X2 berhubungan dengan Y tetap terbukti. Namun dengan catatan jika keduanya digabung dalam analisis yang sama, salah satu tidak signifikan. Penelitian bukan hanya menjawab hipotesis, tetapi juga bagaimana menjelaskan hasil analisis data kita secara komprehensif.

 
Apa Hikmah di Balik Ini ?
Jangan memilih prediktor-prediktor yang berpotensi memiliki korelasi yang tinggi antara satu dengan lainnya. Pilihlah prediktor yang satu dengan lainnya unik. Misalnya meninjau tingkat depresi, satu prediktor mewakili internal individu (misalnya harga diri), satu prediktor lainnya mewakili eksternal (e.g. lingkungan, dukungan sosial). Jangan asal memilih prediktor karena penelitian-penelitian sebelumnya telah membuktikannya. Memilih model bukan hanya sekedar berdasarkan hasil terdahulu, akan tetapi ada peran keaktifan dalam mendesain model tersebut.

Daftar Pustaka

 
Bowerman, B. L., & O'Connell, R. T. (2000). Linear Statistical Models: An Applied Approach. Boston: Duxbury Press.
Field, A. (2000). Discovering statistics using SPSS for Windows: advanced techniques for the beginner. Thousand Oaks: SAGE.
Myers, R. H. (1990). Classical and modern regression with applications. Boston: Duxbury Press.
Pedhazur, E. J. (1997). Multiple regression in behavioral research: explanation and prediction (3rd ed.). Forth Worth: Harcourt Brace College Publishers.
Widhiarso, W. (2010). Belajar Secara Visual: Korelasi dan Regresi. Diskusi Metodologi Penelitian. Retrieved from http://wahyupsy.blog.ugm.ac.id/2010/12/12/belajar-secara-visual-korelasi-dan-regresi/

 

Tidak ada komentar:

Kuliah ATBK - Pengantar CAT