Sabtu, 16 Mei 2026

Daya Beda Butir Soal


 B. Perhitungan Daya Beda Butir Soal

B.1 Pengertian dan Konsep Dasar Daya Beda

Daya beda (discriminating power atau item discrimination) adalah kemampuan suatu butir soal untuk membedakan antara peserta didik yang memiliki kemampuan tinggi dan peserta didik yang memiliki kemampuan rendah. Daya pembeda soal adalah kemampuan butir-butir item soal untuk membedakan antara testee yang memiliki kemampuan tinggi dan testee yang memiliki kemampuan rendah dengan anggapan bahwa kemampuan setiap testee itu berbeda-beda, dan butir-butir item tes hasil belajar haruslah mencerminkan perbedaan tersebut Ikhlas et al., 2023). Analisis daya beda butir merupakan pengkajian butir-butir instrumen yang bertujuan untuk mengetahui kesanggupan butir untuk membedakan peserta tes yang tergolong mampu dengan peserta tes yang tergolong tidak mampu (Febriyanty et al., 2021; .

Dalam konteks Confirmatory Factor Analysis (CFA) untuk analisis butir soal, daya pembeda soal direpresentasikan sebagai factor loading atau muatan faktor, yang menunjukkan seberapa kuat hubungan antara butir soal dengan konstruk yang diukur (Umar & Nisa, 2020; . Semakin tinggi nilai factor loading suatu butir soal, semakin baik kemampuan butir soal tersebut dalam membedakan antara peserta didik yang memiliki kemampuan tinggi dan rendah. Dalam "CFA for Categorical Variables", daya pembeda soal dapat diperhitungkan secara simultan dengan tingkat kesukaran dan varians kesalahan pengukuran (Umar & Nisa, 2020; .

Dalam konteks model Rasch, daya beda soal direpresentasikan sebagai item fit yang menunjukkan seberapa baik soal tersebut sesuai dengan model pengukuran yang digunakan. Soal yang memiliki item fit yang baik menunjukkan bahwa soal tersebut mampu membedakan antara peserta didik yang memiliki kemampuan tinggi dan rendah secara konsisten dan akurat Aprilia et al., 2021), (Laeli & Kasmui, 2024). Dalam penelitian aplikasi model Rasch pada instrumen tes kemampuan pemecahan masalah, analisis model Rasch dilakukan untuk summary statistics, item-fit, wright-map, item-measure, person-measure, person-fit, dan item-DIF Aprilia et al., 2021).

 

B.2 Formula Perhitungan Daya Beda

Dalam pendekatan Classical Test Theory (CTT), daya beda soal dihitung menggunakan formula yang membandingkan proporsi peserta didik yang menjawab benar pada kelompok atas (upper group) dengan proporsi peserta didik yang menjawab benar pada kelompok bawah (lower group). Formula dasar untuk menghitung daya beda soal adalah sebagai berikut:

D = BA/JA - BB/JB

Di mana:

  • D = Discriminatory power (angka indeks diskriminasi item)
  • BA = Banyaknya peserta kelompok atas yang menjawab benar
  • JA = Banyaknya peserta kelompok atas
  • BB = Banyaknya peserta kelompok bawah yang menjawab benar
  • JB = Banyaknya peserta kelompok bawah Ikhlas et al., 2023)

Formula ini menghasilkan nilai D yang berkisar antara -1 hingga +1. Nilai D yang positif menunjukkan bahwa soal tersebut mampu membedakan antara peserta didik yang memiliki kemampuan tinggi dan rendah secara tepat (peserta didik berkemampuan tinggi lebih banyak menjawab benar dibandingkan peserta didik berkemampuan rendah). Sebaliknya, nilai D yang negatif menunjukkan bahwa soal tersebut berfungsi terbalik (peserta didik berkemampuan rendah lebih banyak menjawab benar dibandingkan peserta didik berkemampuan tinggi), yang merupakan indikasi bahwa soal tersebut memiliki kualitas yang sangat buruk dan harus segera direvisi atau diganti Ikhlas et al., 2023), (Febriyanty et al., 2021; .

Dalam konteks analisis butir soal menggunakan software ANATES, daya beda soal dihitung secara otomatis berdasarkan data jawaban peserta didik, sehingga guru tidak perlu melakukan perhitungan manual yang memakan waktu Fitriani et al., 2024). Dalam pengembangan instrumen tes three-tier multiple choice berbantuan Google Form, daya beda soal dianalisis menggunakan program ANATES 4.0.2, dengan hasil bahwa persentase data daya pembeda dengan kategori baik lebih banyak yaitu 44,5% Fitriani et al., 2024).

 

B.3 Penentuan Kelompok Atas dan Kelompok Bawah

Salah satu langkah penting dalam perhitungan daya beda soal adalah penentuan kelompok atas (upper group) dan kelompok bawah (lower group). Secara umum, kelompok atas terdiri dari 27% peserta didik yang memiliki skor total tertinggi, sementara kelompok bawah terdiri dari 27% peserta didik yang memiliki skor total terendah. Menurut Arikunto (2007) sebagaimana dikutip dalam literatur, daya pembeda butir soal untuk membuktikan perbedaan antara peserta didik dengan kemampuan tinggi dan rendah dapat diambil sebesar 50% dengan kemampuan tinggi dan 50% dengan kemampuan rendah (Ayubi et al., 2023; .

Dalam konteks analisis butir soal menggunakan software SPSS, penentuan kelompok atas dan kelompok bawah dilakukan secara otomatis berdasarkan distribusi skor total peserta didik (Mutakin, 2023; . Penggunaan software analisis yang tepat dapat meningkatkan akurasi dan efisiensi proses penentuan kelompok atas dan kelompok bawah, sehingga hasil analisis daya beda soal yang diperoleh lebih akurat dan dapat diandalkan.

 

B.4 Analisis Daya Beda Menggunakan Korelasi Point-Biserial

Selain formula D yang sederhana, daya beda soal juga dapat dihitung menggunakan korelasi point-biserial (r_pbis), yang mengukur korelasi antara skor butir soal (dikotomis: benar/salah) dengan skor total tes. Korelasi point-biserial memberikan informasi yang lebih akurat tentang daya beda soal dibandingkan dengan formula D sederhana, karena mempertimbangkan seluruh distribusi skor peserta didik, bukan hanya kelompok atas dan kelompok bawah (Umar & Nisa, 2020; .

Dalam konteks pengembangan instrumen tes three-tier untuk mengidentifikasi miskonsepsi pada konsep fluida statis, validitas butir soal dianalisis melalui korelasi antara jumlah skor jawaban dua tingkat pertama dengan jumlah skor tingkat keyakinan siswa menggunakan korelasi product moment (Kamilah & Suwarna, 2019). Hasil analisis menunjukkan bahwa siswa yang memiliki skor tinggi pada dua tingkat pertama yakin dengan jawabannya dan siswa yang memiliki skor rendah pada dua tingkat pertama tidak yakin dengan jawabannya, yang menunjukkan bahwa instrumen tes berfungsi dengan baik (Kamilah & Suwarna, 2019).

 

B.5 Analisis Daya Beda Menggunakan Model Rasch

Dalam pendekatan Item Response Theory (IRT) dan model Rasch, daya beda soal dianalisis melalui parameter item fit yang menunjukkan seberapa baik soal tersebut sesuai dengan model pengukuran yang digunakan. Soal yang memiliki nilai infit dan outfit yang berada dalam rentang yang dapat diterima (biasanya 0,5 hingga 1,5 atau 0,6 hingga 1,4) menunjukkan bahwa soal tersebut memiliki daya beda yang baik dan sesuai dengan model Rasch Aprilia et al., 2021), (Laeli & Kasmui, 2024).

Dalam penelitian penerapan model pembelajaran berbasis masalah berbantuan media QuizWhizzer, soal pretest dan posttest telah melewati pengujian menggunakan analisis Rasch Model sehingga dinyatakan layak untuk digunakan (Laeli & Kasmui, 2024). Penggunaan model Rasch dalam analisis daya beda soal memberikan informasi yang lebih rinci dan akurat dibandingkan dengan pendekatan CTT, karena model Rasch mempertimbangkan kemampuan masing-masing peserta didik dan kesulitan setiap butir soal secara bersamaan Aprilia et al., 2021).

 

B.6 Daya Beda dalam Konteks Analisis Faktor

Dalam konteks analisis faktor (factor analysis), daya beda soal direpresentasikan sebagai factor loading yang menunjukkan seberapa kuat hubungan antara butir soal dengan faktor atau konstruk yang diukur. Nilai factor loading yang tinggi (biasanya > 0,4 atau > 0,5) menunjukkan bahwa butir soal tersebut memiliki daya beda yang baik dan mampu mengukur konstruk yang dimaksud secara akurat (Umar & Nisa, 2020; , (Subagis & Setiawan, 2022).

Dalam pengembangan instrumen penilaian psikomotor pada penggunaan lego dalam mata pelajaran matematika, uji validitas konstruk menggunakan analisis faktor dengan nilai KMO 0,616 > 0,5, sig 0,000 < 0,05 dengan Initial Eigenvalues Commulative 61% > 62,508% dan terbentuk 4 faktor (Subagis & Setiawan, 2022). Hasil analisis faktor ini memberikan informasi tentang daya beda setiap butir soal dalam mengukur konstruk yang dimaksud, sehingga dapat diidentifikasi butir-butir soal yang perlu direvisi atau diganti.

Tidak ada komentar:

Posting Komentar

Interpretasi Hasil Analisi Butir Soal

  C. Interpretasi Hasil Analisis Butir Soal C.1 Kriteria Interpretasi Tingkat Kesukaran Interpretasi hasil analisis tingkat kesukaran so...