Aplikasi Uji Keberfungsian
Butir Diferensial (DIF) Melalui Teknik Mantel Haenszel pada Program SPSS
Wahyu Widhiarso
Fakultas Psikologi Universitas Gadjah Mada
(2012)
Salah
satu butir pada tes inteligensi (WAIS) di dalamnya terdapat butir soal yang
meminta individu untuk menafsirkan gambar sebuah rumah yang di atasnya terdapat
salju. Butir ini oleh banyak ahli dikatakan butir yang bias secara budaya,
karena orang yang tinggal di lokasi dekat garis katulistiwa tidak pernah
berinteraksi dengan salju. Butir ini dapat dikatakan memihak individu yang
sering berinteraksi dengan salju. Dua individu yang memiliki tingkat
inteligensi yang setara bisa saja memiliki skor butir yang berbeda. Mereka yang
pernah berinteraksi dengan salju relatif diuntungkan. Oleh karena itu peluang
untuk mendapatkan jawaban benar pada butir ini lebih tinggi dibanding dengan
mereka yang tidak pernah berinteraksi dengan salju. Butir ini bias, karena
memihak pada mereka yang tinggal jauh dari garis katulistiwa.
Contoh lain, bias jender
juga terjadi pada pengukuran depresi. Widhiarso dan Retnowati (2011)
menemukan bahwa pada pengukuran depresi, butir yang mengukur perilaku menangis
ternyata memihak perempuan. Dengan tingkat depresi yang sama, perempuan lebih
cenderung mendapatkan skor yang rendah dibanding laki-laki. Kita tahu “boys don’t cry”, laki-laki tidak boleh
menangis. Pandangan masyarakat mengenai laki-laki yang seharusnya ditunjukkan
dengan perilaku pantang menyerah mempengaruhi respons mereka terhadap alat
ukur. Sementara itu Dewi (2010) menemukan
bahwa pada pengukuran dukungan sosial, butir “Guru memberi nasehat berguna” termasuk butir bias jender yang
memihak perempuan. Dengan tingkat dukungan sosial yang setara, perempuan lebih
sering mendapatkan nasehat dari guru daripada laki-laki.
A. Keberfungsian Butir Diferensial
Butir yang bias dalam
mengukur dinamakan dengan butir yang terjangkit keberfungsian butir diferensial
yang diterjemahkan dari differential item
functioning (DIF). DIF adalah situasi
ketika dua subjek yang memiliki trait psikologis yang setara akan tetapi
memiliki kecenderungan yang berbeda dalam merespon sebuah butir (Camilli & Shepard, 1994). Peluang yang berbeda ini menunjukkan bahwa butir yang
terjangkit DIF berpihak pada subjek tertentu. Butir tersebut memberikan peluang
besar pada satu subjek untuk mendapatkan skor tinggi, tetapi sebaliknya untuk
subjek yang lain. Diskusi mengenai butir yang terjangkit DIF telah diangkat
dalam penyusun pengukuran, misalnya bagaimana mengembangkan tes yang tidak bias
budaya (culture fair). Butir tes yang
bias budaya secara psikometris berpotensi terjangkit DIF karena butir tersebut
memudahkan subjek dari budaya tertentu untuk mendapatkan skor tinggi dan justru
merugikan subjek dari budaya lainnya.
Ada dua jenis DIF, yaitu
DIF tingkat kesulitan (uniform DIF) dan DIF daya beda (nonuniform DIF). DIF tingkat
kesulitan menunjukkan bahwa butir memiliki tingkat kesulitan yang berbeda jika
diterapkan pada dua karakteristik yang berbeda. Butir bias jender pada
pengukuran depresi di muka mewakili DIF jenis ini. DIF daya beda menunjukkan
daya beda butir akan berbeda jika diterapkan pada dua karakteristik yang
berbeda. Widhiarso dan Retnowati (2011) mencontohkan bahwa butir yang mengukur perasaan
ketidakmampuan dalam pengukuran depresi terjangkit DIF jenis kedua. Melalui
perasaan ketidakmampuan, kita dapat membedakan apakah laki-laki memiliki level
depresi yang tinggi ataukah rendah. Sebaliknya pada perempuan perasaan
ketidakmampuan belum tentu memanifestasikan level depresi mereka. Tulisan ini
hanya akan membatasi pada uji DIF jenis pertama.
B. Aplikasi Analisis
Banyak sekali tes yang
dikembangkan oleh para ahli dalam menguji DIF. Salah satunya adalah Teknik
Mantel-Haenszel yang dapat diaplikasikan melalui program SPSS. Kali ini kita
akan menguji apakah 10 butir di dalam Skala Harga Diri Rosenberg terjangkit DIF.
Gambar
1. Persiapan Data
1.
Persiapan Data
Siapkan data seperti
biasanya, kolom berisi informasi variabel dan baris menjelaskan informasi
tersebut pada tiap individu (lihat Gambar 1). Data ini didapatkan dari
penelitian Retnowati (2004) yang meneliti remaja di Yogyakarta. Data harga diri
sebelumnya merupakan data kontinum yang bergerak dari skor 0 hingga 4. Namun
untuk keperluan analisis ini data kita kode ulang sehingga menjadi data
dikotomi. Skor butir 0 dan 1 dikonversi menjadi 1 sedangkan skor butir 2 dan 3
dikonversi menjadi 1. Jenis kelamin ditunjukkan dengan nama sexe, dengan kode 1
dan 2, dengan rincian 1 untuk laki-laki dan 2 untuk perempuan.
2.
Melakukan Analisis
Masuklah pada Menu ANALYZE
> DESCRIPTIVE STATISTICS > CROSSTABS. Setelah masuk dalam menu ketiga
data yang telah dipersiapkan dimasukkan dalam tiga kotak yang telah tersedia.
Data kelompok (SEXE) masuk ke dalam kotak Row(s), Skor butir (hd01-hd10) masuk
ke dalam kotak Coloumn(s), dan skor total (Total) yang berisi butir yang diuji
masuk dalam kotak Layer (Gambar 2).
Gambar
2. Menu Analisis pada SPSS
2.
Membaca Hasil Analisis
Kita lihat Tabel TEST OF
CONDITIONAL INDEPENDENCE yang didalamnya ada hasil uji Mantel-Haenszel (MH).
Nilai signifikansi MH yang dibawah 0.05 menunjukkan butir yang diuji terjangkit
DIF.
Kita lihat hasil uji MH
pada butir 1 (Gambar 3) menunjukkan bahwa butir tersebut terjangkit DIF karena
nilai ln(MH)= -0.389 (p<0.05). Hasil yang memiliki arah positif menunjukkan
bahwa butir memihak pada karakteristik yang memiliki angka kode lebih besar.
Sebaliknya, jika memiliki arah negatif maka butir lebih memihak pada
karakteristik angka kode yang lebih kecil.
Pada data kita, laki-laki
di kode 1 dan perempuan di kode 2. Dengan demikian butir 1 memihak laki-laki
daripada perempuan. Dapat disimpulkan bahwa pada butir 1 laki-laki cenderung
mendapatkan skor butir yang tinggi dibanding dengan perempuan.
Gambar
3. Hasil Uji MH untuk Butir 1
Kita lihat pada butir 5, nilai
ln(MH) memiliki arah positif yang menunjukkan bahwa pada butir ini perempuan
cenderung mendapatkan skor tinggi dibanding dengan laki-laki.
Gambar
4. Hasil Uji MH untuk Butir 5
3.
Rangkuman Hasil Analisis
Dari keseluruhan hasil ini
dapat kita ketahui bahwa dari 10 butir pengukuran harga diri, ada 8 butir yang
terjangkit DIF. 3 butir memihak pria dan 5 butir memihak perempuan (Tabel 1).
Meski hasil analisis sedikit tidak konsisten, namun dapat diketahui bahwa
butir-butir yang menguntungkan laki-laki lebih banyak berkaitan dengan
kemampuan sedangkan butir yang memihak perempuan lebih banyak terkait dengan performansi.
Misalnya butir 1 yang mengukur indikator perasaan berharga. Pada butir ini,
laki-laki cenderung mengatakan YA dibanding dengan perempuan, meski keduanya
memiliki level harga diri yang sama.
Tabel 1. Rangkuman Hasil Analisis
No
|
Indikator
|
MH
|
Sig
|
DIF
|
Bias
|
1
|
Merasa bahwa diri cukup berharga
|
-0.39
|
0.00
|
*
|
L
|
2
|
Measa banyak hal-hal yang baik dalam diri
|
-0.48
|
0.00
|
*
|
L
|
3
|
Tidak merasa sebagai orang yang gagal.
|
-0.15
|
0.16
|
||
4
|
Mampu mengerjakan sesuatu seperti orang
lain.
|
0.30
|
0.00
|
*
|
P
|
5
|
Merasa ada yang dibanggakan
|
0.52
|
0.00
|
*
|
P
|
6
|
Menerima keadaan diri saya seperti apa
adanya.
|
-0.42
|
0.00
|
*
|
L
|
7
|
Puas dengan kondisi diri
|
0.38
|
0.00
|
*
|
P
|
8
|
Berharap saya dapat lebih dihargai.
|
0.19
|
0.44
|
||
9
|
Merasa diri berguna.
|
0.26
|
0.03
|
*
|
P
|
10
|
Merasa bahwa diri saya tidak baik.
|
0.54
|
0.00
|
*
|
P
|
Keterangan
: *=terjangkit DIF. Bias menunjukkan siapa yang diuntungkan (cenderung
mendapatkan skor tinggi). L=Laki-laki dan P=perempuan
Hasil analisis ini menunjukkan
bahwa pada butir yang terkait dengan kondisi diri (misalnya merasa cukup berharga,
banyak hal-hal yang baik dalam diri), perempuan cenderung mendapatkan skor rendah.
Sebaliknya pada butir terkait dengan kemampuan, laki-laki cenderung mendapatkan
skor rendah. Butir-butir yang terjangkit DIF ini perlu dievaluasi lebih lanjut agar
hasil pengukuran benar-benar memberikan hasil yang akurat.
Tidak ada komentar:
Posting Komentar