B. Perhitungan Daya Beda Butir Soal
B.1
Pengertian dan Konsep Dasar Daya Beda
Daya
beda (discriminating power atau item discrimination) adalah
kemampuan suatu butir soal untuk membedakan antara peserta didik yang memiliki
kemampuan tinggi dan peserta didik yang memiliki kemampuan rendah. Daya pembeda
soal adalah kemampuan butir-butir item soal untuk membedakan antara testee yang
memiliki kemampuan tinggi dan testee yang memiliki kemampuan rendah dengan
anggapan bahwa kemampuan setiap testee itu berbeda-beda, dan butir-butir item
tes hasil belajar haruslah mencerminkan perbedaan tersebut Ikhlas et al.,
2023). Analisis daya beda butir merupakan pengkajian butir-butir instrumen yang
bertujuan untuk mengetahui kesanggupan butir untuk membedakan peserta tes yang
tergolong mampu dengan peserta tes yang tergolong tidak mampu (Febriyanty et
al., 2021; .
Dalam
konteks Confirmatory Factor Analysis (CFA) untuk analisis butir soal,
daya pembeda soal direpresentasikan sebagai factor loading atau muatan
faktor, yang menunjukkan seberapa kuat hubungan antara butir soal dengan
konstruk yang diukur (Umar & Nisa, 2020; . Semakin tinggi nilai factor
loading suatu butir soal, semakin baik kemampuan butir soal tersebut dalam
membedakan antara peserta didik yang memiliki kemampuan tinggi dan rendah.
Dalam "CFA for Categorical Variables", daya pembeda soal dapat
diperhitungkan secara simultan dengan tingkat kesukaran dan varians kesalahan
pengukuran (Umar & Nisa, 2020; .
Dalam
konteks model Rasch, daya beda soal direpresentasikan sebagai item fit
yang menunjukkan seberapa baik soal tersebut sesuai dengan model pengukuran
yang digunakan. Soal yang memiliki item fit yang baik menunjukkan bahwa
soal tersebut mampu membedakan antara peserta didik yang memiliki kemampuan
tinggi dan rendah secara konsisten dan akurat Aprilia et al., 2021), (Laeli
& Kasmui, 2024). Dalam penelitian aplikasi model Rasch pada instrumen tes
kemampuan pemecahan masalah, analisis model Rasch dilakukan untuk summary
statistics, item-fit, wright-map, item-measure, person-measure,
person-fit, dan item-DIF Aprilia et al., 2021).
B.2
Formula Perhitungan Daya Beda
Dalam
pendekatan Classical Test Theory (CTT), daya beda soal dihitung
menggunakan formula yang membandingkan proporsi peserta didik yang menjawab
benar pada kelompok atas (upper group) dengan proporsi peserta didik
yang menjawab benar pada kelompok bawah (lower group). Formula dasar
untuk menghitung daya beda soal adalah sebagai berikut:
D =
BA/JA - BB/JB
Di
mana:
- D = Discriminatory
power (angka indeks diskriminasi item)
- BA =
Banyaknya peserta kelompok atas yang menjawab benar
- JA =
Banyaknya peserta kelompok atas
- BB =
Banyaknya peserta kelompok bawah yang menjawab benar
- JB =
Banyaknya peserta kelompok bawah Ikhlas et al., 2023)
Formula
ini menghasilkan nilai D yang berkisar antara -1 hingga +1. Nilai D yang
positif menunjukkan bahwa soal tersebut mampu membedakan antara peserta didik
yang memiliki kemampuan tinggi dan rendah secara tepat (peserta didik
berkemampuan tinggi lebih banyak menjawab benar dibandingkan peserta didik
berkemampuan rendah). Sebaliknya, nilai D yang negatif menunjukkan bahwa soal
tersebut berfungsi terbalik (peserta didik berkemampuan rendah lebih banyak
menjawab benar dibandingkan peserta didik berkemampuan tinggi), yang merupakan
indikasi bahwa soal tersebut memiliki kualitas yang sangat buruk dan harus
segera direvisi atau diganti Ikhlas et al., 2023), (Febriyanty et al., 2021; .
Dalam
konteks analisis butir soal menggunakan software ANATES, daya beda soal
dihitung secara otomatis berdasarkan data jawaban peserta didik, sehingga guru
tidak perlu melakukan perhitungan manual yang memakan waktu Fitriani et al.,
2024). Dalam pengembangan instrumen tes three-tier multiple choice
berbantuan Google Form, daya beda soal dianalisis menggunakan program ANATES
4.0.2, dengan hasil bahwa persentase data daya pembeda dengan kategori baik
lebih banyak yaitu 44,5% Fitriani et al., 2024).
B.3
Penentuan Kelompok Atas dan Kelompok Bawah
Salah
satu langkah penting dalam perhitungan daya beda soal adalah penentuan kelompok
atas (upper group) dan kelompok bawah (lower group). Secara umum,
kelompok atas terdiri dari 27% peserta didik yang memiliki skor total
tertinggi, sementara kelompok bawah terdiri dari 27% peserta didik yang
memiliki skor total terendah. Menurut Arikunto (2007) sebagaimana dikutip dalam
literatur, daya pembeda butir soal untuk membuktikan perbedaan antara peserta
didik dengan kemampuan tinggi dan rendah dapat diambil sebesar 50% dengan
kemampuan tinggi dan 50% dengan kemampuan rendah (Ayubi et al., 2023; .
Dalam
konteks analisis butir soal menggunakan software SPSS, penentuan kelompok atas
dan kelompok bawah dilakukan secara otomatis berdasarkan distribusi skor total
peserta didik (Mutakin, 2023; . Penggunaan software analisis yang tepat dapat
meningkatkan akurasi dan efisiensi proses penentuan kelompok atas dan kelompok
bawah, sehingga hasil analisis daya beda soal yang diperoleh lebih akurat dan
dapat diandalkan.
B.4
Analisis Daya Beda Menggunakan Korelasi Point-Biserial
Selain
formula D yang sederhana, daya beda soal juga dapat dihitung menggunakan
korelasi point-biserial (r_pbis), yang mengukur korelasi antara
skor butir soal (dikotomis: benar/salah) dengan skor total tes. Korelasi point-biserial
memberikan informasi yang lebih akurat tentang daya beda soal dibandingkan
dengan formula D sederhana, karena mempertimbangkan seluruh distribusi skor
peserta didik, bukan hanya kelompok atas dan kelompok bawah (Umar & Nisa,
2020; .
Dalam
konteks pengembangan instrumen tes three-tier untuk mengidentifikasi
miskonsepsi pada konsep fluida statis, validitas butir soal dianalisis melalui
korelasi antara jumlah skor jawaban dua tingkat pertama dengan jumlah skor
tingkat keyakinan siswa menggunakan korelasi product moment (Kamilah
& Suwarna, 2019). Hasil analisis menunjukkan bahwa siswa yang memiliki skor
tinggi pada dua tingkat pertama yakin dengan jawabannya dan siswa yang memiliki
skor rendah pada dua tingkat pertama tidak yakin dengan jawabannya, yang
menunjukkan bahwa instrumen tes berfungsi dengan baik (Kamilah & Suwarna,
2019).
B.5
Analisis Daya Beda Menggunakan Model Rasch
Dalam
pendekatan Item Response Theory (IRT) dan model Rasch, daya beda soal
dianalisis melalui parameter item fit yang menunjukkan seberapa baik
soal tersebut sesuai dengan model pengukuran yang digunakan. Soal yang memiliki
nilai infit dan outfit yang berada dalam rentang yang dapat
diterima (biasanya 0,5 hingga 1,5 atau 0,6 hingga 1,4) menunjukkan bahwa soal
tersebut memiliki daya beda yang baik dan sesuai dengan model Rasch Aprilia et
al., 2021), (Laeli & Kasmui, 2024).
Dalam
penelitian penerapan model pembelajaran berbasis masalah berbantuan media
QuizWhizzer, soal pretest dan posttest telah melewati pengujian menggunakan
analisis Rasch Model sehingga dinyatakan layak untuk digunakan (Laeli &
Kasmui, 2024). Penggunaan model Rasch dalam analisis daya beda soal memberikan
informasi yang lebih rinci dan akurat dibandingkan dengan pendekatan CTT,
karena model Rasch mempertimbangkan kemampuan masing-masing peserta didik dan
kesulitan setiap butir soal secara bersamaan Aprilia et al., 2021).
B.6
Daya Beda dalam Konteks Analisis Faktor
Dalam
konteks analisis faktor (factor analysis), daya beda soal
direpresentasikan sebagai factor loading yang menunjukkan seberapa kuat
hubungan antara butir soal dengan faktor atau konstruk yang diukur. Nilai factor
loading yang tinggi (biasanya > 0,4 atau > 0,5) menunjukkan bahwa
butir soal tersebut memiliki daya beda yang baik dan mampu mengukur konstruk
yang dimaksud secara akurat (Umar & Nisa, 2020; , (Subagis & Setiawan,
2022).
Dalam
pengembangan instrumen penilaian psikomotor pada penggunaan lego dalam mata
pelajaran matematika, uji validitas konstruk menggunakan analisis faktor dengan
nilai KMO 0,616 > 0,5, sig 0,000 < 0,05 dengan Initial Eigenvalues
Commulative 61% > 62,508% dan terbentuk 4 faktor (Subagis &
Setiawan, 2022). Hasil analisis faktor ini memberikan informasi tentang daya
beda setiap butir soal dalam mengukur konstruk yang dimaksud, sehingga dapat
diidentifikasi butir-butir soal yang perlu direvisi atau diganti.

Tidak ada komentar:
Posting Komentar