A.
Bentuk-Bentuk
Tes Objektif (Pilihan Ganda, Benar-Salah, Menjodohkan)
1. Pendahuluan
Penulisan butir soal objektif yang berkualitas merupakan salah satu
aspek paling krusial dalam pengembangan instrumen penilaian pendidikan.
Kualitas butir soal secara langsung menentukan validitas dan reliabilitas hasil
pengukuran yang diperoleh, sehingga berpengaruh pada ketepatan keputusan
pedagogis yang diambil oleh pendidik (Mondolang et al., 2019; , Azzahroh et
al., 2022; . Dalam konteks pendidikan Indonesia, kaidah penulisan butir soal
objektif yang baik mencakup aspek materi, konstruksi, dan bahasa, yang
ketiganya harus dipenuhi secara bersamaan agar instrumen penilaian dapat
berfungsi secara optimal Prihadi et al., 2021).
Tes objektif, yang mencakup soal pilihan ganda (multiple choice),
benar-salah (true-false), menjodohkan (matching), dan isian (completion),
merupakan bentuk instrumen penilaian yang paling banyak digunakan di berbagai
jenjang pendidikan (Mondolang et al., 2019; , (Pranata et al., 2020; . Namun
demikian, penggunaan tes objektif yang tidak memperhatikan kaidah penulisan
yang baik dapat menghasilkan instrumen yang tidak valid, tidak reliabel, dan
tidak mampu mengukur kemampuan peserta didik secara akurat Azzahroh et al.,
2022; , Masae, 2019; . Oleh karena itu, pemahaman mendalam tentang kaidah
penulisan butir soal objektif yang baik menjadi kebutuhan mendasar bagi setiap
pendidik dan pengembang instrumen penilaian.
2. Prinsip Umum Penulisan Butir Soal Objektif
2.1 Validitas dan Reliabilitas sebagai Landasan Utama
Setiap butir soal objektif yang baik harus memenuhi dua syarat
utama, yaitu validitas dan reliabilitas. Validitas merujuk pada kemampuan soal
untuk mengukur apa yang seharusnya diukur, sedangkan reliabilitas merujuk pada
konsistensi hasil pengukuran Azzahroh et al., 2022; , Masae, 2019; . Dalam
penelitian analisis butir soal ujian akhir semester mata kuliah psikologi
belajar, ditemukan bahwa soal benar-salah memperoleh hasil reliabilitas tes
sebesar 0,41 dan soal pilihan ganda memperoleh angka 0,46, yang menunjukkan
bahwa kedua jenis soal memiliki reliabilitas yang sedang Azzahroh et al., 2022;
. Sementara itu, dalam pengembangan tes membaca bahasa Indonesia berbasis web,
karakteristik tes pilihan ganda, tes benar-salah, dan tes menjodohkan memiliki
validitas isi yang baik dan koefisien reliabilitas tes masing-masing kategori
tinggi, dengan nilai Alpha masing-masing 0,748, 0,762, dan 0,772 Masae, 2019; .
2.2 Kesesuaian dengan Tujuan Pembelajaran
Butir soal yang baik harus selaras dengan tujuan pembelajaran yang
telah ditetapkan. Dalam pengembangan instrumen penilaian HOTS fisika di SMA,
disebutkan bahwa soal tes yang dikembangkan harus memperhatikan ciri-ciri HOTS
seperti indikator-indikator HOTS, KKO (Kata Kerja Operasional), permasalahan
fisika dan stimulus, serta taksonomi Bloom Desiriah & Setyarsih, 2021). Hal
ini menunjukkan bahwa kaidah penulisan soal tidak dapat dilepaskan dari
kerangka tujuan pembelajaran yang ingin dicapai.
2.3 Aspek Materi, Konstruksi, dan Bahasa
Secara umum, kualitas butir soal objektif dinilai dari tiga aspek
utama: materi, konstruksi, dan bahasa. Penelitian tentang kualitas instrumen
penilaian sumatif seni rupa di SMP Kabupaten Sleman menunjukkan bahwa secara
umum kualitas soal pilihan ganda yang digunakan sangat baik dari segi materi,
konstruksi, dan bahasa Prihadi et al., 2021). Ketiga aspek ini menjadi standar
baku dalam penilaian kualitas butir soal objektif di Indonesia dan harus
dipenuhi secara bersamaan.
3. Kaidah Penulisan Soal Pilihan Ganda
3.1 Kaidah Aspek Materi
Dari segi materi, soal pilihan ganda yang baik harus memenuhi
beberapa kaidah penting. Pertama, soal harus mengukur kompetensi yang sesuai
dengan indikator pembelajaran yang telah ditetapkan. Dalam penelitian
pengembangan soal HOTS pada materi asam-basa, hasil validasi menunjukkan bahwa
soal yang dikembangkan sangat valid (90,7%) berdasarkan aspek materi,
konstruksi, HOTS, dan bahasa (Risdiana et al., 2022; . Kedua, materi yang
ditanyakan harus faktual, konseptual, prosedural, atau metakognitif sesuai dengan
dimensi pengetahuan yang ingin diukur (Pranata et al., 2020; .
Ketiga, soal pilihan ganda harus mampu membedakan antara peserta
didik yang memiliki kemampuan tinggi dan rendah. Dalam analisis butir soal,
daya pembeda soal pilihan ganda memiliki persentase 18,75% sampai 62,50%, yang
berarti soal memiliki daya beda yang beragam mulai dari jelek hingga baik
sekali Azzahroh et al., 2022; . Soal dengan daya pembeda yang baik merupakan
indikator bahwa soal tersebut telah memenuhi kaidah materi yang baik.
Keempat, tingkat kesukaran soal harus diperhatikan agar soal tidak
terlalu mudah atau terlalu sulit. Dalam penelitian kualitas instrumen penilaian
sumatif seni rupa, ditemukan bahwa instrumen penilaian masih didominasi soal
dengan tingkat kesukaran mudah dan sedang dan belum mencakup soal untuk
kategori high order thinking skill Prihadi et al., 2021). Hal ini
menunjukkan pentingnya memperhatikan distribusi tingkat kesukaran soal dalam
penulisan butir soal pilihan ganda.
3.2 Kaidah Aspek Konstruksi
Dari segi konstruksi, soal pilihan ganda yang baik harus memenuhi
kaidah-kaidah teknis penulisan yang ketat. Pertama, pokok soal (stem)
harus dirumuskan dengan jelas dan tidak menimbulkan penafsiran ganda. Soal
pilihan ganda terdiri dari sebuah pernyataan atau pertanyaan (pokok soal/stem)
yang diikuti oleh beberapa alternatif jawaban, di mana peserta didik diminta
untuk memilih satu jawaban yang paling tepat (Rohmawati et al., 2021).
Kejelasan rumusan stem merupakan syarat mutlak agar soal dapat mengukur
kemampuan yang sebenarnya.
Kedua, pilihan jawaban (option) harus homogen dan logis.
Dalam pengembangan asesmen HOTS berbasis CBT, rata-rata validasi konstruksi
pada tipe soal multiple choice mencapai 77%, yang artinya soal memiliki
validasi konstruksi yang valid Pranata et al., 2020). Ketiga, hanya ada satu
jawaban yang benar atau paling benar di antara semua pilihan yang tersedia.
Keempat, pengecoh (distractor) harus berfungsi dengan baik untuk menarik
peserta didik yang tidak memahami materi.
Efektivitas pengecoh merupakan salah satu aspek konstruksi yang
paling penting dalam soal pilihan ganda. Dalam analisis butir soal, ditemukan
bahwa 30% soal pilihan ganda memiliki efektivitas pengecoh yang kurang baik,
10% yang termasuk dalam efektivitas pengecoh baik adalah 50%, sedangkan
efektivitas pengecoh yang sangat baik hanya 10% Azzahroh et al., 2022; . Temuan
ini menunjukkan bahwa penulisan pengecoh yang efektif merupakan tantangan
tersendiri dalam pengembangan soal pilihan ganda.
Kelima, soal pilihan ganda yang baik harus dilengkapi dengan
stimulus yang mampu menstimulus kemampuan berpikir peserta didik. Soal pilihan
ganda dapat melatih kemampuan eksplorasi fenomena fisika peserta didik dengan
bantuan ilustrasi soal yang mampu menstimulus kemampuan berpikir peserta didik
(Pranata et al., 2020; . Penggunaan stimulus berupa wacana, gambar, grafik,
video, animasi, dan simulasi interaktif dapat meningkatkan kualitas soal
pilihan ganda secara signifikan (Pranata et al., 2020; .
3.3 Kaidah Aspek Bahasa
Dari segi bahasa, soal pilihan ganda yang baik harus menggunakan
bahasa yang baku, jelas, dan mudah dipahami oleh peserta didik. Dalam analisis
penggunaan bahasa dalam soal cerita matematika, ditemukan bahwa terdapat ketidaktepatan
dalam penggunaan bahasa soal dengan persentase yang variatif:
ketidakgramatikalan 31%, ketidaktepatan diksi 25%, ketidakhematan 15%,
ketidakparalelan 6%, dan ketidaklogisan 22% (Nurwahidah, 2023). Temuan ini
menunjukkan betapa pentingnya memperhatikan aspek bahasa dalam penulisan butir
soal objektif.
Bahasa yang digunakan dalam soal harus komunikatif, sesuai dengan
tingkat perkembangan peserta didik, dan tidak mengandung kata-kata yang dapat
menimbulkan penafsiran ganda. Dalam pengembangan soal HOTS pada materi
asam-basa, hasil validasi menunjukkan bahwa soal yang dikembangkan sangat valid
berdasarkan aspek bahasa (Risdiana et al., 2022; , yang menunjukkan bahwa aspek
bahasa merupakan komponen penting dalam penilaian kualitas soal.
4. Kaidah Penulisan Soal Benar-Salah
4.1 Kaidah Aspek Materi
Soal benar-salah yang baik harus mengandung pernyataan yang secara
faktual benar atau salah secara mutlak, tanpa ambiguitas. Pernyataan yang
digunakan harus didasarkan pada fakta, konsep, atau prinsip yang telah
dipelajari oleh peserta didik. Dalam penelitian analisis kemampuan literasi
sains siswa kelas X, data diperoleh berdasarkan hasil tes NOSLiT dalam bentuk
pilihan ganda dan benar-salah, yang menunjukkan bahwa soal benar-salah dapat
digunakan untuk mengukur berbagai aspek kemampuan kognitif peserta didik
(Kamelia et al., 2022).
Soal benar-salah yang baik juga harus mampu mendeteksi miskonsepsi
pada peserta didik. Tes diagnostik di awal pembelajaran menggunakan kuis trivia
dengan bentuk soal benar-salah dengan alasan, yang terbukti efektif dalam
mendeteksi miskonsepsi (Permana & Bakri, 2022). Oleh karena itu, penulisan
soal benar-salah yang baik harus mempertimbangkan kemungkinan miskonsepsi yang
umum terjadi pada peserta didik terkait materi yang diujikan.
4.2 Kaidah Aspek Konstruksi
Dari segi konstruksi, soal benar-salah yang baik harus memenuhi
beberapa kaidah penting. Pertama, setiap pernyataan harus mengandung satu ide
pokok yang jelas dan tidak mengandung dua pernyataan sekaligus. Kedua,
pernyataan harus dirumuskan secara singkat, padat, dan jelas agar tidak
menimbulkan kebingungan pada peserta didik.
Ketiga, untuk mengatasi kelemahan utama soal benar-salah berupa
tingginya kemungkinan menebak (50%), soal benar-salah dapat dikembangkan dengan
menambahkan pilihan "Yakin" atau "Tidak Yakin" (Y-TY).
Penelitian yang dilakukan oleh Mondolang et al. menunjukkan bahwa penilaian
kelas yang menggunakan bentuk soal tipe B-S yang dilengkapi dengan pilihan Y-TY
dapat mengukur pemahaman siswa secara lebih objektif dibandingkan dengan bentuk
soal B-S tanpa pilihan Y-TY (Mondolang et al., 2019; . Validasi instrumen pengembangan
soal benar-salah yang dilengkapi pilihan Y-TY oleh pakar evaluasi dan pakar
materi melalui instrumen angket diperoleh rerata persentase sebesar 92,5%
dengan kategori valid (Mondolang et al., 2019; .
Keempat, soal benar-salah dapat dikembangkan menjadi soal
benar-salah dengan alasan (true-false with reason) untuk meningkatkan
kemampuannya dalam mengukur proses kognitif yang lebih tinggi. Tes diagnostik
dalam bentuk formatif berupa tes pilihan ganda empat tingkat (four-tier
multiple choice test) yang dikembangkan dari soal benar-salah terbukti
efektif dalam menilai kesalahpahaman peserta didik (Permana & Bakri, 2022).
Kelima, dalam konteks pengembangan asesmen HOTS berbasis CBT,
rata-rata validasi konstruksi pada tipe soal true or false mencapai 77%,
yang artinya soal memiliki validasi konstruksi yang valid Pranata et al.,
2020). Rata-rata validasi bahasa pada tipe soal true or false mencapai
84%, yang artinya soal memiliki validasi bahasa yang valid Pranata et al.,
2020).
4.3 Kaidah Aspek Bahasa
Dari segi bahasa, soal benar-salah yang baik harus menggunakan
pernyataan yang jelas, tidak ambigu, dan tidak mengandung kata-kata yang dapat
mengarahkan peserta didik ke jawaban yang benar (clue words). Pernyataan
yang mengandung kata-kata seperti "selalu", "tidak pernah",
"semua", atau "tidak ada" cenderung mengarahkan peserta
didik untuk menjawab "salah", sehingga harus dihindari dalam
penulisan soal benar-salah yang baik.
5. Kaidah Penulisan Soal Menjodohkan
5.1 Kaidah Aspek Materi
Soal menjodohkan yang baik harus mengukur kemampuan peserta didik
dalam mengenali hubungan antara konsep-konsep yang homogen. Dalam pengembangan
tes membaca bahasa Indonesia berbasis web, soal menjodohkan digunakan bersama
dengan soal pilihan ganda dan benar-salah, dengan hasil bahwa karakteristik tes
menjodohkan memiliki validitas isi yang baik dan koefisien reliabilitas tes
yang tinggi (Alpha = 0,772) Masae, 2019; . Hal ini menunjukkan bahwa soal
menjodohkan yang dirancang dengan baik dapat menghasilkan instrumen yang valid
dan reliabel.
Materi yang diujikan dalam soal menjodohkan harus homogen, artinya
semua item dalam satu set soal menjodohkan harus berasal dari satu topik atau
konsep yang sama. Pencampuran materi yang berbeda dalam satu set soal
menjodohkan dapat membingungkan peserta didik dan mengurangi validitas soal.
5.2 Kaidah Aspek Konstruksi
Dari segi konstruksi, soal menjodohkan yang baik harus memenuhi
beberapa kaidah penting. Pertama, jumlah item dalam kolom jawaban harus lebih
banyak daripada jumlah item dalam kolom pertanyaan untuk mengurangi kemungkinan
menebak. Kedua, semua item dalam satu set soal menjodohkan harus dapat dimuat
dalam satu halaman agar peserta didik tidak perlu membolak-balik halaman saat
menjawab.
Ketiga, petunjuk pengerjaan soal menjodohkan harus jelas dan mudah
dipahami. Dalam pengembangan asesmen HOTS berbasis CBT, tipe soal matching
mendapatkan persentase kelayakan tertinggi sebesar 93% (Pranata et al., 2020; ,
Pranata et al., 2020), yang menunjukkan bahwa soal menjodohkan yang dirancang
dengan baik memiliki tingkat kelayakan yang sangat tinggi untuk digunakan dalam
penilaian. Rata-rata validasi konstruksi pada tipe soal matching
mencapai 76%, yang artinya soal memiliki validasi konstruksi yang valid Pranata
et al., 2020).
Keempat, soal menjodohkan yang baik harus memiliki stimulus yang
jelas dan tidak menimbulkan penafsiran ganda. Dalam konteks pengembangan
asesmen HOTS berbasis CBT, soal menjodohkan dilengkapi dengan ilustrasi dalam
bentuk wacana, gambar, grafik, video, animasi, dan simulasi interaktif untuk
meningkatkan kemampuannya dalam menstimulus HOTS peserta didik (Pranata et al.,
2020; .
5.3 Kaidah Aspek Bahasa
Dari segi bahasa, soal menjodohkan yang baik harus menggunakan
bahasa yang konsisten antara kolom pertanyaan dan kolom jawaban. Petunjuk
pengerjaan harus ditulis dengan jelas dan menggunakan bahasa yang mudah
dipahami oleh peserta didik. Rata-rata validasi bahasa pada tipe soal matching
mencapai 83%, yang artinya soal memiliki validasi bahasa yang valid Pranata et
al., 2020).
6. Analisis Butir Soal sebagai Bagian dari Kaidah Penulisan
6.1 Pentingnya Analisis Butir Soal
Analisis butir soal merupakan bagian integral dari proses penulisan
butir soal objektif yang baik. Dalam kegiatan PTK, instrumen tes (soal) yang
digunakan sebagai alat ukur untuk mengukur keberhasilan suatu metode atau
tindakan perlu diuji kualitasnya berdasarkan unsur validitas, reliabilitas,
indeks kesukaran, dan daya pembeda soal Mutakin, 2023; . Analisis butir soal
memungkinkan pendidik untuk mengidentifikasi soal-soal yang perlu diperbaiki
atau diganti sebelum digunakan dalam penilaian yang sesungguhnya.
Manfaat setelah dilakukan analisis instrumen soal adalah dapat
membantu dalam evaluasi atas tes yang digunakan, mendukung penulisan butir soal
yang efektif, menentukan apakah suatu fungsi butir soal sesuai dengan yang
diharapkan, dan merevisi materi yang dinilai atau diukur Mutakin, 2023; . Hal
ini menunjukkan bahwa analisis butir soal bukan hanya merupakan kegiatan
pasca-penulisan, tetapi juga merupakan bagian dari proses penulisan butir soal
yang berkelanjutan.
6.2 Tingkat Kesukaran
Tingkat kesukaran (difficulty index) merupakan salah satu
parameter penting dalam analisis butir soal. Dalam penelitian pengembangan tes
membaca bahasa Indonesia berbasis web, analisis butir tes berdasarkan tingkat
kesukaran butir tes menunjukkan hasil yang baik Masae, 2019; . Dalam penelitian
pengembangan instrumen penilaian HOTS fisika, disebutkan bahwa instrumen HOTS
perlu melalui proses uji tingkat kesukaran sebagai bagian dari analisis
kelayakan instrumen Desiriah & Setyarsih, 2021).
Tingkat kesukaran soal pilihan ganda dalam analisis butir soal
ujian akhir semester menunjukkan bahwa soal pilihan ganda memiliki tingkat
kesukaran antara 33% sampai 81%, yang menunjukkan tidak ada soal yang sukar
Azzahroh et al., 2022; . Distribusi tingkat kesukaran yang ideal adalah sekitar
25% soal mudah, 50% soal sedang, dan 25% soal sukar, meskipun distribusi ini
dapat disesuaikan dengan tujuan penilaian.
6.3 Daya Pembeda
Daya pembeda (discriminating power) merupakan parameter yang
menunjukkan kemampuan soal untuk membedakan antara peserta didik yang memiliki
kemampuan tinggi dan rendah. Dalam analisis butir soal, daya pembeda soal
benar-salah memiliki persentase 12,50% sampai 68,75%, soal pilihan ganda 18,75%
sampai 62,50%, yang berarti soal memiliki daya beda yang beragam mulai dari
jelek hingga baik sekali Azzahroh et al., 2022; .
Dalam penelitian pengembangan instrumen HOTS, disebutkan bahwa
instrumen HOTS perlu melalui proses uji daya beda sebagai bagian dari analisis
kelayakan instrumen Desiriah & Setyarsih, 2021). Soal dengan daya pembeda
yang baik merupakan indikator bahwa soal tersebut telah memenuhi kaidah
penulisan yang baik dan dapat digunakan secara efektif dalam penilaian.
6.4 Efektivitas Pengecoh
Efektivitas pengecoh (distractor effectiveness) merupakan
parameter khusus untuk soal pilihan ganda yang menunjukkan seberapa efektif
pilihan jawaban yang salah dalam menarik peserta didik yang tidak memahami
materi. Dalam analisis butir soal, ditemukan bahwa 30% soal pilihan ganda
memiliki efektivitas pengecoh yang kurang baik Azzahroh et al., 2022; . Hal ini
menunjukkan bahwa penulisan pengecoh yang efektif merupakan salah satu aspek
yang paling sulit dalam penulisan soal pilihan ganda.
Pengecoh yang baik harus tampak masuk akal bagi peserta didik yang
tidak memahami materi, tetapi jelas salah bagi peserta didik yang memahami
materi dengan baik. Dalam penelitian pengembangan tes membaca bahasa Indonesia
berbasis web, efektivitas pengecoh butir tes menunjukkan hasil yang baik karena
pengecoh bekerja dengan baik Masae, 2019
7. Penggunaan Teknologi dalam Penulisan dan Analisis Butir Soal
7.1 Pemanfaatan Software Analisis
Penggunaan teknologi dalam penulisan dan analisis butir soal
objektif telah berkembang pesat. Dalam penelitian analisis butir soal ujian
akhir semester, data dianalisis menggunakan software Anates ver.4 dan Microsoft
Excel Azzahroh et al., 2022; . Dalam penelitian analisis instrumen penelitian
dalam PTK, instrumen soal dianalisis menggunakan software SPSS versi 16.0
Mutakin, 2023; . Penggunaan software analisis memungkinkan pendidik untuk
melakukan analisis butir soal secara lebih cepat, akurat, dan komprehensif.
7.2 Pengembangan Asesmen Berbasis Komputer
Pengembangan asesmen berbasis komputer (Computer Based Test/CBT)
merupakan salah satu inovasi terkini dalam penulisan dan pelaksanaan tes
objektif. Dalam penelitian pengembangan asesmen HOTS berbasis CBT, produk
asesmen HOTS menggunakan CBT dengan empat tipe soal (benar-salah, pilihan
ganda, isian, dan menjodohkan) terbukti valid dan praktis (Pranata et al.,
2020; , Pranata et al., 2020). Pengembangan asesmen berbasis CBT memungkinkan
penggunaan stimulus yang lebih beragam, seperti wacana, gambar, grafik, video,
animasi, dan simulasi interaktif, yang dapat meningkatkan kualitas soal secara
signifikan (Pranata et al., 2020; .
Dalam pengembangan tes membaca bahasa Indonesia berbasis web,
proses pengembangan tes diawali dengan penyusunan kisi-kisi, menyusun
butir-butir soal dan ditelaah butir tes oleh ahli serta merevisi, uji coba tes,
dan analisis butir tes Masae, 2019; . Proses ini menunjukkan bahwa pengembangan
tes berbasis teknologi tetap harus mengikuti kaidah penulisan butir soal yang
baik.
8. Kaidah Penulisan Soal Objektif untuk Mengukur HOTS
8.1 Karakteristik Soal HOTS
Penulisan soal objektif untuk mengukur HOTS (Higher Order
Thinking Skills) memerlukan perhatian khusus terhadap beberapa kaidah
tambahan. Soal tes yang dikembangkan harus memperhatikan ciri-ciri HOTS seperti
indikator-indikator HOTS, KKO, permasalahan fisika dan stimulus, serta
taksonomi Bloom Desiriah & Setyarsih, 2021). Cara mengevaluasi HOTS peserta
didik dapat ditempuh dengan cara memilih (multiple-choice, matching,
rank-order items), menggeneralisasi (jawaban singkat, esai), dan memberi
alasan (Risdiana et al., 2022;
8.2 Penggunaan Stimulus dalam Soal HOTS
Penggunaan stimulus yang tepat merupakan kaidah penting dalam
penulisan soal objektif untuk mengukur HOTS. Soal pilihan ganda dapat melatih
kemampuan eksplorasi fenomena fisika peserta didik dengan bantuan ilustrasi
soal yang mampu menstimulus kemampuan berpikir peserta didik (Pranata et al.,
2020; . Stimulus yang digunakan dapat berupa wacana, gambar, grafik, video,
animasi, dan simulasi interaktif (Pranata et al., 2020; .
8.3 Validasi Soal HOTS
Soal objektif untuk mengukur HOTS harus melalui proses validasi
yang ketat. Instrumen HOTS perlu melalui proses uji dan analisis kelayakan, di
antaranya yaitu uji kevalidan dari validator, uji validitas, uji reliabilitas,
uji tingkat kesukaran, uji daya beda, analisis model Rasch, analisis dengan
formula Alpha Cronbach, dan uji pengecoh soal Desiriah & Setyarsih, 2021).
Dalam penelitian pengembangan soal HOTS pada materi asam-basa, hasil validasi
menunjukkan bahwa soal yang dikembangkan sangat valid (90,7%) berdasarkan aspek
materi, konstruksi, HOTS, dan bahasa (Risdiana et al., 2022; .
9. Proses Pengembangan Butir Soal Objektif yang Baik
9.1 Tahapan Pengembangan
Pengembangan butir soal objektif yang baik harus mengikuti tahapan
yang sistematis. Dalam pengembangan tes membaca bahasa Indonesia berbasis web,
proses pengembangan tes diawali dengan penyusunan kisi-kisi, menyusun
butir-butir soal dan ditelaah butir tes oleh ahli serta merevisi, uji coba tes,
dan analisis butir tes Masae, 2019; . Tahapan ini mencerminkan proses
pengembangan butir soal yang komprehensif dan sistematis.
Dalam penelitian pengembangan soal benar-salah dengan pilihan Y-TY,
penelitian menggunakan model Research & Development (R&D) dari
Sivasailam Thiagarajan, Dorothy S. Semmel, dan Melvyn I. Semmel yang terdiri
dari 4 tahap utama yaitu define (pendefinisian), design
(perancangan), develop (pengembangan), dan disseminate
(penyebaran) (Mondolang et al., 2019; . Model pengembangan ini merupakan salah
satu model yang paling banyak digunakan dalam pengembangan instrumen penilaian.
9.2 Validasi oleh Ahli
Validasi oleh ahli merupakan tahapan penting dalam pengembangan
butir soal objektif yang baik. Dalam penelitian pengembangan soal benar-salah
dengan pilihan Y-TY, validasi instrumen oleh pakar evaluasi dan pakar materi
melalui instrumen angket diperoleh rerata persentase sebesar 92,5% dengan
kategori valid (Mondolang et al., 2019; . Dalam penelitian pengembangan asesmen
HOTS berbasis CBT, validitas logis yang diperoleh dari validasi ahli pada
asesmen HOTS menggunakan CBT adalah 81% dengan kategori valid (Pranata et al., 2020;
, Pranata et al., 2020).
9.3 Uji Coba dan Revisi
Setelah melalui proses validasi oleh ahli, butir soal objektif
harus diuji cobakan kepada peserta didik sebelum digunakan dalam penilaian yang
sesungguhnya. Dalam penelitian pengembangan soal benar-salah dengan pilihan
Y-TY, dari hasil uji coba kepada 32 siswa, soal yang dikembangkan dapat
meminimalisir spekulasi siswa dalam menjawab soal (Mondolang et al., 2019; .
Dalam penelitian pengembangan tes membaca bahasa Indonesia berbasis web, uji
coba tes dilakukan kepada 12 mahasiswa Thailand yang kuliah di Universitas
Negeri Yogyakarta Masae, 2019.
10. Kesimpulan
Kaidah penulisan butir soal objektif yang baik mencakup aspek
materi, konstruksi, dan bahasa yang harus dipenuhi secara bersamaan untuk
menghasilkan instrumen penilaian yang valid, reliabel, dan mampu mengukur
kemampuan peserta didik secara akurat Prihadi et al., 2021). Setiap bentuk soal
objektif, baik pilihan ganda, benar-salah, maupun menjodohkan, memiliki kaidah
penulisan yang spesifik yang harus diperhatikan oleh para pendidik dan
pengembang instrumen penilaian (Mondolang et al., 2019; , (Pranata et al.,
2020; , Masae, 2019; .
Analisis butir soal merupakan bagian integral dari proses penulisan
butir soal objektif yang baik, mencakup analisis validitas, reliabilitas,
tingkat kesukaran, daya pembeda, dan efektivitas pengecoh Azzahroh et al.,
2022; , Desiriah & Setyarsih, 2021), Mutakin, 2023; . Penggunaan teknologi,
baik dalam bentuk software analisis maupun pengembangan asesmen berbasis
komputer, dapat meningkatkan kualitas dan efisiensi proses penulisan dan
analisis butir soal objektif (Pranata et al., 2020; , Mutakin, 2023; , Pranata
et al., 2020).
Penulisan soal objektif untuk mengukur HOTS memerlukan perhatian
khusus terhadap penggunaan stimulus yang tepat, kesesuaian dengan indikator
HOTS, dan proses validasi yang ketat (Risdiana et al., 2022; , Desiriah &
Setyarsih, 2021). Dengan memperhatikan semua kaidah penulisan butir soal
objektif yang baik, para pendidik dapat mengembangkan instrumen penilaian yang
berkualitas tinggi dan mampu mengukur hasil belajar peserta didik secara
komprehensif dan akurat (Mondolang et al., 2019; , Azzahroh et al., 2022; ,
Masae, 2019; , Prihadi et al., 2021).



.png)
