ALFY'S BLOG: Bentuk-Bentuk Tes Objektif

A. Bentuk-Bentuk Tes Objektif (Pilihan Ganda, Benar-Salah, Menjodohkan)

1. Pendahuluan

Penulisan butir soal objektif yang berkualitas merupakan salah satu aspek paling krusial dalam pengembangan instrumen penilaian pendidikan. Kualitas butir soal secara langsung menentukan validitas dan reliabilitas hasil pengukuran yang diperoleh, sehingga berpengaruh pada ketepatan keputusan pedagogis yang diambil oleh pendidik (Mondolang et al., 2019; , Azzahroh et al., 2022; . Dalam konteks pendidikan Indonesia, kaidah penulisan butir soal objektif yang baik mencakup aspek materi, konstruksi, dan bahasa, yang ketiganya harus dipenuhi secara bersamaan agar instrumen penilaian dapat berfungsi secara optimal Prihadi et al., 2021).

Tes objektif, yang mencakup soal pilihan ganda (multiple choice), benar-salah (true-false), menjodohkan (matching), dan isian (completion), merupakan bentuk instrumen penilaian yang paling banyak digunakan di berbagai jenjang pendidikan (Mondolang et al., 2019; , (Pranata et al., 2020; . Namun demikian, penggunaan tes objektif yang tidak memperhatikan kaidah penulisan yang baik dapat menghasilkan instrumen yang tidak valid, tidak reliabel, dan tidak mampu mengukur kemampuan peserta didik secara akurat Azzahroh et al., 2022; , Masae, 2019; . Oleh karena itu, pemahaman mendalam tentang kaidah penulisan butir soal objektif yang baik menjadi kebutuhan mendasar bagi setiap pendidik dan pengembang instrumen penilaian.

2. Prinsip Umum Penulisan Butir Soal Objektif

2.1 Validitas dan Reliabilitas sebagai Landasan Utama

Setiap butir soal objektif yang baik harus memenuhi dua syarat utama, yaitu validitas dan reliabilitas. Validitas merujuk pada kemampuan soal untuk mengukur apa yang seharusnya diukur, sedangkan reliabilitas merujuk pada konsistensi hasil pengukuran Azzahroh et al., 2022; , Masae, 2019; . Dalam penelitian analisis butir soal ujian akhir semester mata kuliah psikologi belajar, ditemukan bahwa soal benar-salah memperoleh hasil reliabilitas tes sebesar 0,41 dan soal pilihan ganda memperoleh angka 0,46, yang menunjukkan bahwa kedua jenis soal memiliki reliabilitas yang sedang Azzahroh et al., 2022; . Sementara itu, dalam pengembangan tes membaca bahasa Indonesia berbasis web, karakteristik tes pilihan ganda, tes benar-salah, dan tes menjodohkan memiliki validitas isi yang baik dan koefisien reliabilitas tes masing-masing kategori tinggi, dengan nilai Alpha masing-masing 0,748, 0,762, dan 0,772 Masae, 2019; .

2.2 Kesesuaian dengan Tujuan Pembelajaran

Butir soal yang baik harus selaras dengan tujuan pembelajaran yang telah ditetapkan. Dalam pengembangan instrumen penilaian HOTS fisika di SMA, disebutkan bahwa soal tes yang dikembangkan harus memperhatikan ciri-ciri HOTS seperti indikator-indikator HOTS, KKO (Kata Kerja Operasional), permasalahan fisika dan stimulus, serta taksonomi Bloom Desiriah & Setyarsih, 2021). Hal ini menunjukkan bahwa kaidah penulisan soal tidak dapat dilepaskan dari kerangka tujuan pembelajaran yang ingin dicapai.

2.3 Aspek Materi, Konstruksi, dan Bahasa

Secara umum, kualitas butir soal objektif dinilai dari tiga aspek utama: materi, konstruksi, dan bahasa. Penelitian tentang kualitas instrumen penilaian sumatif seni rupa di SMP Kabupaten Sleman menunjukkan bahwa secara umum kualitas soal pilihan ganda yang digunakan sangat baik dari segi materi, konstruksi, dan bahasa Prihadi et al., 2021). Ketiga aspek ini menjadi standar baku dalam penilaian kualitas butir soal objektif di Indonesia dan harus dipenuhi secara bersamaan.

3. Kaidah Penulisan Soal Pilihan Ganda

3.1 Kaidah Aspek Materi

Dari segi materi, soal pilihan ganda yang baik harus memenuhi beberapa kaidah penting. Pertama, soal harus mengukur kompetensi yang sesuai dengan indikator pembelajaran yang telah ditetapkan. Dalam penelitian pengembangan soal HOTS pada materi asam-basa, hasil validasi menunjukkan bahwa soal yang dikembangkan sangat valid (90,7%) berdasarkan aspek materi, konstruksi, HOTS, dan bahasa (Risdiana et al., 2022; . Kedua, materi yang ditanyakan harus faktual, konseptual, prosedural, atau metakognitif sesuai dengan dimensi pengetahuan yang ingin diukur (Pranata et al., 2020; .

Ketiga, soal pilihan ganda harus mampu membedakan antara peserta didik yang memiliki kemampuan tinggi dan rendah. Dalam analisis butir soal, daya pembeda soal pilihan ganda memiliki persentase 18,75% sampai 62,50%, yang berarti soal memiliki daya beda yang beragam mulai dari jelek hingga baik sekali Azzahroh et al., 2022; . Soal dengan daya pembeda yang baik merupakan indikator bahwa soal tersebut telah memenuhi kaidah materi yang baik.

Keempat, tingkat kesukaran soal harus diperhatikan agar soal tidak terlalu mudah atau terlalu sulit. Dalam penelitian kualitas instrumen penilaian sumatif seni rupa, ditemukan bahwa instrumen penilaian masih didominasi soal dengan tingkat kesukaran mudah dan sedang dan belum mencakup soal untuk kategori high order thinking skill Prihadi et al., 2021). Hal ini menunjukkan pentingnya memperhatikan distribusi tingkat kesukaran soal dalam penulisan butir soal pilihan ganda.

3.2 Kaidah Aspek Konstruksi

Dari segi konstruksi, soal pilihan ganda yang baik harus memenuhi kaidah-kaidah teknis penulisan yang ketat. Pertama, pokok soal (stem) harus dirumuskan dengan jelas dan tidak menimbulkan penafsiran ganda. Soal pilihan ganda terdiri dari sebuah pernyataan atau pertanyaan (pokok soal/stem) yang diikuti oleh beberapa alternatif jawaban, di mana peserta didik diminta untuk memilih satu jawaban yang paling tepat (Rohmawati et al., 2021). Kejelasan rumusan stem merupakan syarat mutlak agar soal dapat mengukur kemampuan yang sebenarnya.

Kedua, pilihan jawaban (option) harus homogen dan logis. Dalam pengembangan asesmen HOTS berbasis CBT, rata-rata validasi konstruksi pada tipe soal multiple choice mencapai 77%, yang artinya soal memiliki validasi konstruksi yang valid Pranata et al., 2020). Ketiga, hanya ada satu jawaban yang benar atau paling benar di antara semua pilihan yang tersedia. Keempat, pengecoh (distractor) harus berfungsi dengan baik untuk menarik peserta didik yang tidak memahami materi.

Efektivitas pengecoh merupakan salah satu aspek konstruksi yang paling penting dalam soal pilihan ganda. Dalam analisis butir soal, ditemukan bahwa 30% soal pilihan ganda memiliki efektivitas pengecoh yang kurang baik, 10% yang termasuk dalam efektivitas pengecoh baik adalah 50%, sedangkan efektivitas pengecoh yang sangat baik hanya 10% Azzahroh et al., 2022; . Temuan ini menunjukkan bahwa penulisan pengecoh yang efektif merupakan tantangan tersendiri dalam pengembangan soal pilihan ganda.

Kelima, soal pilihan ganda yang baik harus dilengkapi dengan stimulus yang mampu menstimulus kemampuan berpikir peserta didik. Soal pilihan ganda dapat melatih kemampuan eksplorasi fenomena fisika peserta didik dengan bantuan ilustrasi soal yang mampu menstimulus kemampuan berpikir peserta didik (Pranata et al., 2020; . Penggunaan stimulus berupa wacana, gambar, grafik, video, animasi, dan simulasi interaktif dapat meningkatkan kualitas soal pilihan ganda secara signifikan (Pranata et al., 2020; .

3.3 Kaidah Aspek Bahasa

Dari segi bahasa, soal pilihan ganda yang baik harus menggunakan bahasa yang baku, jelas, dan mudah dipahami oleh peserta didik. Dalam analisis penggunaan bahasa dalam soal cerita matematika, ditemukan bahwa terdapat ketidaktepatan dalam penggunaan bahasa soal dengan persentase yang variatif: ketidakgramatikalan 31%, ketidaktepatan diksi 25%, ketidakhematan 15%, ketidakparalelan 6%, dan ketidaklogisan 22% (Nurwahidah, 2023). Temuan ini menunjukkan betapa pentingnya memperhatikan aspek bahasa dalam penulisan butir soal objektif.

Bahasa yang digunakan dalam soal harus komunikatif, sesuai dengan tingkat perkembangan peserta didik, dan tidak mengandung kata-kata yang dapat menimbulkan penafsiran ganda. Dalam pengembangan soal HOTS pada materi asam-basa, hasil validasi menunjukkan bahwa soal yang dikembangkan sangat valid berdasarkan aspek bahasa (Risdiana et al., 2022; , yang menunjukkan bahwa aspek bahasa merupakan komponen penting dalam penilaian kualitas soal.

4. Kaidah Penulisan Soal Benar-Salah

4.1 Kaidah Aspek Materi

Soal benar-salah yang baik harus mengandung pernyataan yang secara faktual benar atau salah secara mutlak, tanpa ambiguitas. Pernyataan yang digunakan harus didasarkan pada fakta, konsep, atau prinsip yang telah dipelajari oleh peserta didik. Dalam penelitian analisis kemampuan literasi sains siswa kelas X, data diperoleh berdasarkan hasil tes NOSLiT dalam bentuk pilihan ganda dan benar-salah, yang menunjukkan bahwa soal benar-salah dapat digunakan untuk mengukur berbagai aspek kemampuan kognitif peserta didik (Kamelia et al., 2022).

Soal benar-salah yang baik juga harus mampu mendeteksi miskonsepsi pada peserta didik. Tes diagnostik di awal pembelajaran menggunakan kuis trivia dengan bentuk soal benar-salah dengan alasan, yang terbukti efektif dalam mendeteksi miskonsepsi (Permana & Bakri, 2022). Oleh karena itu, penulisan soal benar-salah yang baik harus mempertimbangkan kemungkinan miskonsepsi yang umum terjadi pada peserta didik terkait materi yang diujikan.

4.2 Kaidah Aspek Konstruksi

Dari segi konstruksi, soal benar-salah yang baik harus memenuhi beberapa kaidah penting. Pertama, setiap pernyataan harus mengandung satu ide pokok yang jelas dan tidak mengandung dua pernyataan sekaligus. Kedua, pernyataan harus dirumuskan secara singkat, padat, dan jelas agar tidak menimbulkan kebingungan pada peserta didik.

Ketiga, untuk mengatasi kelemahan utama soal benar-salah berupa tingginya kemungkinan menebak (50%), soal benar-salah dapat dikembangkan dengan menambahkan pilihan "Yakin" atau "Tidak Yakin" (Y-TY). Penelitian yang dilakukan oleh Mondolang et al. menunjukkan bahwa penilaian kelas yang menggunakan bentuk soal tipe B-S yang dilengkapi dengan pilihan Y-TY dapat mengukur pemahaman siswa secara lebih objektif dibandingkan dengan bentuk soal B-S tanpa pilihan Y-TY (Mondolang et al., 2019; . Validasi instrumen pengembangan soal benar-salah yang dilengkapi pilihan Y-TY oleh pakar evaluasi dan pakar materi melalui instrumen angket diperoleh rerata persentase sebesar 92,5% dengan kategori valid (Mondolang et al., 2019; .

Keempat, soal benar-salah dapat dikembangkan menjadi soal benar-salah dengan alasan (true-false with reason) untuk meningkatkan kemampuannya dalam mengukur proses kognitif yang lebih tinggi. Tes diagnostik dalam bentuk formatif berupa tes pilihan ganda empat tingkat (four-tier multiple choice test) yang dikembangkan dari soal benar-salah terbukti efektif dalam menilai kesalahpahaman peserta didik (Permana & Bakri, 2022).

Kelima, dalam konteks pengembangan asesmen HOTS berbasis CBT, rata-rata validasi konstruksi pada tipe soal true or false mencapai 77%, yang artinya soal memiliki validasi konstruksi yang valid Pranata et al., 2020). Rata-rata validasi bahasa pada tipe soal true or false mencapai 84%, yang artinya soal memiliki validasi bahasa yang valid Pranata et al., 2020).

4.3 Kaidah Aspek Bahasa

Dari segi bahasa, soal benar-salah yang baik harus menggunakan pernyataan yang jelas, tidak ambigu, dan tidak mengandung kata-kata yang dapat mengarahkan peserta didik ke jawaban yang benar (clue words). Pernyataan yang mengandung kata-kata seperti "selalu", "tidak pernah", "semua", atau "tidak ada" cenderung mengarahkan peserta didik untuk menjawab "salah", sehingga harus dihindari dalam penulisan soal benar-salah yang baik.

5. Kaidah Penulisan Soal Menjodohkan

5.1 Kaidah Aspek Materi

Soal menjodohkan yang baik harus mengukur kemampuan peserta didik dalam mengenali hubungan antara konsep-konsep yang homogen. Dalam pengembangan tes membaca bahasa Indonesia berbasis web, soal menjodohkan digunakan bersama dengan soal pilihan ganda dan benar-salah, dengan hasil bahwa karakteristik tes menjodohkan memiliki validitas isi yang baik dan koefisien reliabilitas tes yang tinggi (Alpha = 0,772) Masae, 2019; . Hal ini menunjukkan bahwa soal menjodohkan yang dirancang dengan baik dapat menghasilkan instrumen yang valid dan reliabel.

Materi yang diujikan dalam soal menjodohkan harus homogen, artinya semua item dalam satu set soal menjodohkan harus berasal dari satu topik atau konsep yang sama. Pencampuran materi yang berbeda dalam satu set soal menjodohkan dapat membingungkan peserta didik dan mengurangi validitas soal.

5.2 Kaidah Aspek Konstruksi

Dari segi konstruksi, soal menjodohkan yang baik harus memenuhi beberapa kaidah penting. Pertama, jumlah item dalam kolom jawaban harus lebih banyak daripada jumlah item dalam kolom pertanyaan untuk mengurangi kemungkinan menebak. Kedua, semua item dalam satu set soal menjodohkan harus dapat dimuat dalam satu halaman agar peserta didik tidak perlu membolak-balik halaman saat menjawab.

Ketiga, petunjuk pengerjaan soal menjodohkan harus jelas dan mudah dipahami. Dalam pengembangan asesmen HOTS berbasis CBT, tipe soal matching mendapatkan persentase kelayakan tertinggi sebesar 93% (Pranata et al., 2020; , Pranata et al., 2020), yang menunjukkan bahwa soal menjodohkan yang dirancang dengan baik memiliki tingkat kelayakan yang sangat tinggi untuk digunakan dalam penilaian. Rata-rata validasi konstruksi pada tipe soal matching mencapai 76%, yang artinya soal memiliki validasi konstruksi yang valid Pranata et al., 2020).

Keempat, soal menjodohkan yang baik harus memiliki stimulus yang jelas dan tidak menimbulkan penafsiran ganda. Dalam konteks pengembangan asesmen HOTS berbasis CBT, soal menjodohkan dilengkapi dengan ilustrasi dalam bentuk wacana, gambar, grafik, video, animasi, dan simulasi interaktif untuk meningkatkan kemampuannya dalam menstimulus HOTS peserta didik (Pranata et al., 2020; .

5.3 Kaidah Aspek Bahasa

Dari segi bahasa, soal menjodohkan yang baik harus menggunakan bahasa yang konsisten antara kolom pertanyaan dan kolom jawaban. Petunjuk pengerjaan harus ditulis dengan jelas dan menggunakan bahasa yang mudah dipahami oleh peserta didik. Rata-rata validasi bahasa pada tipe soal matching mencapai 83%, yang artinya soal memiliki validasi bahasa yang valid Pranata et al., 2020).

6. Analisis Butir Soal sebagai Bagian dari Kaidah Penulisan

6.1 Pentingnya Analisis Butir Soal

Analisis butir soal merupakan bagian integral dari proses penulisan butir soal objektif yang baik. Dalam kegiatan PTK, instrumen tes (soal) yang digunakan sebagai alat ukur untuk mengukur keberhasilan suatu metode atau tindakan perlu diuji kualitasnya berdasarkan unsur validitas, reliabilitas, indeks kesukaran, dan daya pembeda soal Mutakin, 2023; . Analisis butir soal memungkinkan pendidik untuk mengidentifikasi soal-soal yang perlu diperbaiki atau diganti sebelum digunakan dalam penilaian yang sesungguhnya.

Manfaat setelah dilakukan analisis instrumen soal adalah dapat membantu dalam evaluasi atas tes yang digunakan, mendukung penulisan butir soal yang efektif, menentukan apakah suatu fungsi butir soal sesuai dengan yang diharapkan, dan merevisi materi yang dinilai atau diukur Mutakin, 2023; . Hal ini menunjukkan bahwa analisis butir soal bukan hanya merupakan kegiatan pasca-penulisan, tetapi juga merupakan bagian dari proses penulisan butir soal yang berkelanjutan.

6.2 Tingkat Kesukaran

Tingkat kesukaran (difficulty index) merupakan salah satu parameter penting dalam analisis butir soal. Dalam penelitian pengembangan tes membaca bahasa Indonesia berbasis web, analisis butir tes berdasarkan tingkat kesukaran butir tes menunjukkan hasil yang baik Masae, 2019; . Dalam penelitian pengembangan instrumen penilaian HOTS fisika, disebutkan bahwa instrumen HOTS perlu melalui proses uji tingkat kesukaran sebagai bagian dari analisis kelayakan instrumen Desiriah & Setyarsih, 2021).

Tingkat kesukaran soal pilihan ganda dalam analisis butir soal ujian akhir semester menunjukkan bahwa soal pilihan ganda memiliki tingkat kesukaran antara 33% sampai 81%, yang menunjukkan tidak ada soal yang sukar Azzahroh et al., 2022; . Distribusi tingkat kesukaran yang ideal adalah sekitar 25% soal mudah, 50% soal sedang, dan 25% soal sukar, meskipun distribusi ini dapat disesuaikan dengan tujuan penilaian.

6.3 Daya Pembeda

Daya pembeda (discriminating power) merupakan parameter yang menunjukkan kemampuan soal untuk membedakan antara peserta didik yang memiliki kemampuan tinggi dan rendah. Dalam analisis butir soal, daya pembeda soal benar-salah memiliki persentase 12,50% sampai 68,75%, soal pilihan ganda 18,75% sampai 62,50%, yang berarti soal memiliki daya beda yang beragam mulai dari jelek hingga baik sekali Azzahroh et al., 2022; .

Dalam penelitian pengembangan instrumen HOTS, disebutkan bahwa instrumen HOTS perlu melalui proses uji daya beda sebagai bagian dari analisis kelayakan instrumen Desiriah & Setyarsih, 2021). Soal dengan daya pembeda yang baik merupakan indikator bahwa soal tersebut telah memenuhi kaidah penulisan yang baik dan dapat digunakan secara efektif dalam penilaian.

6.4 Efektivitas Pengecoh

Efektivitas pengecoh (distractor effectiveness) merupakan parameter khusus untuk soal pilihan ganda yang menunjukkan seberapa efektif pilihan jawaban yang salah dalam menarik peserta didik yang tidak memahami materi. Dalam analisis butir soal, ditemukan bahwa 30% soal pilihan ganda memiliki efektivitas pengecoh yang kurang baik Azzahroh et al., 2022; . Hal ini menunjukkan bahwa penulisan pengecoh yang efektif merupakan salah satu aspek yang paling sulit dalam penulisan soal pilihan ganda.

Pengecoh yang baik harus tampak masuk akal bagi peserta didik yang tidak memahami materi, tetapi jelas salah bagi peserta didik yang memahami materi dengan baik. Dalam penelitian pengembangan tes membaca bahasa Indonesia berbasis web, efektivitas pengecoh butir tes menunjukkan hasil yang baik karena pengecoh bekerja dengan baik Masae, 2019

7. Penggunaan Teknologi dalam Penulisan dan Analisis Butir Soal

7.1 Pemanfaatan Software Analisis

Penggunaan teknologi dalam penulisan dan analisis butir soal objektif telah berkembang pesat. Dalam penelitian analisis butir soal ujian akhir semester, data dianalisis menggunakan software Anates ver.4 dan Microsoft Excel Azzahroh et al., 2022; . Dalam penelitian analisis instrumen penelitian dalam PTK, instrumen soal dianalisis menggunakan software SPSS versi 16.0 Mutakin, 2023; . Penggunaan software analisis memungkinkan pendidik untuk melakukan analisis butir soal secara lebih cepat, akurat, dan komprehensif.

7.2 Pengembangan Asesmen Berbasis Komputer

Pengembangan asesmen berbasis komputer (Computer Based Test/CBT) merupakan salah satu inovasi terkini dalam penulisan dan pelaksanaan tes objektif. Dalam penelitian pengembangan asesmen HOTS berbasis CBT, produk asesmen HOTS menggunakan CBT dengan empat tipe soal (benar-salah, pilihan ganda, isian, dan menjodohkan) terbukti valid dan praktis (Pranata et al., 2020; , Pranata et al., 2020). Pengembangan asesmen berbasis CBT memungkinkan penggunaan stimulus yang lebih beragam, seperti wacana, gambar, grafik, video, animasi, dan simulasi interaktif, yang dapat meningkatkan kualitas soal secara signifikan (Pranata et al., 2020; .

Dalam pengembangan tes membaca bahasa Indonesia berbasis web, proses pengembangan tes diawali dengan penyusunan kisi-kisi, menyusun butir-butir soal dan ditelaah butir tes oleh ahli serta merevisi, uji coba tes, dan analisis butir tes Masae, 2019; . Proses ini menunjukkan bahwa pengembangan tes berbasis teknologi tetap harus mengikuti kaidah penulisan butir soal yang baik.

8. Kaidah Penulisan Soal Objektif untuk Mengukur HOTS

8.1 Karakteristik Soal HOTS

Penulisan soal objektif untuk mengukur HOTS (Higher Order Thinking Skills) memerlukan perhatian khusus terhadap beberapa kaidah tambahan. Soal tes yang dikembangkan harus memperhatikan ciri-ciri HOTS seperti indikator-indikator HOTS, KKO, permasalahan fisika dan stimulus, serta taksonomi Bloom Desiriah & Setyarsih, 2021). Cara mengevaluasi HOTS peserta didik dapat ditempuh dengan cara memilih (multiple-choice, matching, rank-order items), menggeneralisasi (jawaban singkat, esai), dan memberi alasan (Risdiana et al., 2022;

8.2 Penggunaan Stimulus dalam Soal HOTS

Penggunaan stimulus yang tepat merupakan kaidah penting dalam penulisan soal objektif untuk mengukur HOTS. Soal pilihan ganda dapat melatih kemampuan eksplorasi fenomena fisika peserta didik dengan bantuan ilustrasi soal yang mampu menstimulus kemampuan berpikir peserta didik (Pranata et al., 2020; . Stimulus yang digunakan dapat berupa wacana, gambar, grafik, video, animasi, dan simulasi interaktif (Pranata et al., 2020; .

8.3 Validasi Soal HOTS

Soal objektif untuk mengukur HOTS harus melalui proses validasi yang ketat. Instrumen HOTS perlu melalui proses uji dan analisis kelayakan, di antaranya yaitu uji kevalidan dari validator, uji validitas, uji reliabilitas, uji tingkat kesukaran, uji daya beda, analisis model Rasch, analisis dengan formula Alpha Cronbach, dan uji pengecoh soal Desiriah & Setyarsih, 2021). Dalam penelitian pengembangan soal HOTS pada materi asam-basa, hasil validasi menunjukkan bahwa soal yang dikembangkan sangat valid (90,7%) berdasarkan aspek materi, konstruksi, HOTS, dan bahasa (Risdiana et al., 2022; .

9. Proses Pengembangan Butir Soal Objektif yang Baik

9.1 Tahapan Pengembangan

Pengembangan butir soal objektif yang baik harus mengikuti tahapan yang sistematis. Dalam pengembangan tes membaca bahasa Indonesia berbasis web, proses pengembangan tes diawali dengan penyusunan kisi-kisi, menyusun butir-butir soal dan ditelaah butir tes oleh ahli serta merevisi, uji coba tes, dan analisis butir tes Masae, 2019; . Tahapan ini mencerminkan proses pengembangan butir soal yang komprehensif dan sistematis.

Dalam penelitian pengembangan soal benar-salah dengan pilihan Y-TY, penelitian menggunakan model Research & Development (R&D) dari Sivasailam Thiagarajan, Dorothy S. Semmel, dan Melvyn I. Semmel yang terdiri dari 4 tahap utama yaitu define (pendefinisian), design (perancangan), develop (pengembangan), dan disseminate (penyebaran) (Mondolang et al., 2019; . Model pengembangan ini merupakan salah satu model yang paling banyak digunakan dalam pengembangan instrumen penilaian.

9.2 Validasi oleh Ahli

Validasi oleh ahli merupakan tahapan penting dalam pengembangan butir soal objektif yang baik. Dalam penelitian pengembangan soal benar-salah dengan pilihan Y-TY, validasi instrumen oleh pakar evaluasi dan pakar materi melalui instrumen angket diperoleh rerata persentase sebesar 92,5% dengan kategori valid (Mondolang et al., 2019; . Dalam penelitian pengembangan asesmen HOTS berbasis CBT, validitas logis yang diperoleh dari validasi ahli pada asesmen HOTS menggunakan CBT adalah 81% dengan kategori valid (Pranata et al., 2020; , Pranata et al., 2020).

9.3 Uji Coba dan Revisi

Setelah melalui proses validasi oleh ahli, butir soal objektif harus diuji cobakan kepada peserta didik sebelum digunakan dalam penilaian yang sesungguhnya. Dalam penelitian pengembangan soal benar-salah dengan pilihan Y-TY, dari hasil uji coba kepada 32 siswa, soal yang dikembangkan dapat meminimalisir spekulasi siswa dalam menjawab soal (Mondolang et al., 2019; . Dalam penelitian pengembangan tes membaca bahasa Indonesia berbasis web, uji coba tes dilakukan kepada 12 mahasiswa Thailand yang kuliah di Universitas Negeri Yogyakarta Masae, 2019.

10. Kesimpulan

Kaidah penulisan butir soal objektif yang baik mencakup aspek materi, konstruksi, dan bahasa yang harus dipenuhi secara bersamaan untuk menghasilkan instrumen penilaian yang valid, reliabel, dan mampu mengukur kemampuan peserta didik secara akurat Prihadi et al., 2021). Setiap bentuk soal objektif, baik pilihan ganda, benar-salah, maupun menjodohkan, memiliki kaidah penulisan yang spesifik yang harus diperhatikan oleh para pendidik dan pengembang instrumen penilaian (Mondolang et al., 2019; , (Pranata et al., 2020; , Masae, 2019; .

Analisis butir soal merupakan bagian integral dari proses penulisan butir soal objektif yang baik, mencakup analisis validitas, reliabilitas, tingkat kesukaran, daya pembeda, dan efektivitas pengecoh Azzahroh et al., 2022; , Desiriah & Setyarsih, 2021), Mutakin, 2023; . Penggunaan teknologi, baik dalam bentuk software analisis maupun pengembangan asesmen berbasis komputer, dapat meningkatkan kualitas dan efisiensi proses penulisan dan analisis butir soal objektif (Pranata et al., 2020; , Mutakin, 2023; , Pranata et al., 2020).

Penulisan soal objektif untuk mengukur HOTS memerlukan perhatian khusus terhadap penggunaan stimulus yang tepat, kesesuaian dengan indikator HOTS, dan proses validasi yang ketat (Risdiana et al., 2022; , Desiriah & Setyarsih, 2021). Dengan memperhatikan semua kaidah penulisan butir soal objektif yang baik, para pendidik dapat mengembangkan instrumen penilaian yang berkualitas tinggi dan mampu mengukur hasil belajar peserta didik secara komprehensif dan akurat (Mondolang et al., 2019; , Azzahroh et al., 2022; , Masae, 2019; , Prihadi et al., 2021).

ALFY'S BLOG

Minggu, 26 April 2026

Bentuk-Bentuk Tes Objektif

Tidak ada komentar:

Posting Komentar

Prinsip Keamanan, Kejujuran Akademik, dan Etika Digital

KEMENTERIAN AGAMA KABUPATEN KEDIRI

Cari Blog Ini

Mengenai Saya

Arsip Blog

Laporkan Penyalahgunaan