.
.
Oleh : Andriawan Timumun, Ramlawati Harun, Yolanda Gani, Salam W. Naki,
Moh. Mufli Alfira, Rahmat Hasan.
Moh. Mufli Alfira, Rahmat Hasan.
Tempat : Gorontalo
Lembaga : Universitas Negeri Gorontalo
Tahun : 2017
Pilihan Unduh File Ada Di Bagian Bawah Artikel Ini..!
Penilaian terhadap butir soal
pada dasarnya merupakan analisis butir soal, dan selama ini pada umumnya para
ahli pengukuran mengatakan bahwa analisis butir soal maksudnya adalah penilaian
terhadap soal. Telah diketahui bersama bahwa penyusunan tes sangat mempengaruhi
kualitas butir soal.
Pendekatan untuk menganalisis
butir soal yang berkembang saat ini terdiri dari dua pendekatan yaitu
pendekatan klasik dan pendekatan modern. Kedua pendekatan ini masing-masing
memiliki kelebihan dan kekurangan. Namun keduanya masih sering digunakan dalam
analisis butir soal. Analisis butir soal dengan pendekatan klasik diantaranya
dapat dilakukan menggunakan Program Iteman.
Dengan
melihat beberapa persyaratan yang harus dipenuhi, penyusunan tes dituntut untuk
mengikuti pedoman penyusunan tes dan melakukan ujicoba. Kemudian berdasarkan
hasil ujicoba, respon peserta dianalisis menggunakan Program Iteman untuk
mendapatkan karakteristik butir soal.
Data hasil analisis dengan
Program Iteman dianalisis kembali menggunakan instrumen penilaian butir soal
yang memenuhi syarat sebagai alat ukur yang baik. Suryabrata (1999) menyatakan
bahwa analisis butir soal mencakup telaah soal atau analisis kualitatif dan analisis
terhadap data empirik hasil ujicoba atau analisis kuantitatif.
Analisis butir soal secara
kualitatif menekankan penilaian dari ketiga segi yaitu materi, konstruksi, dan
bahasa. Namun demikian dalam pembahasan ini dikhususkan untuk menjelaskan analisis
butir soal secara kuantitatif.
Analisis
ini dilakukan berdasarkan data yang diperoleh secara empiris melalui ujicoba
dari suatu perangkat tes. Analisis kuantitatif sering disebut dengan analisis
item yang menghasilkan karakteristik atau parameter butir dan tes, yaitu:
tingkat kesukaran, daya beda dan distribusi jawaban dan kunci setiap butir,
serta reliabilitas dan kesalahan pengukuran (SEM) dalam tes.
Telah disinggung di depan
bahwa analisis soal antara lain bertujuan untuk mengadakan identifikasi soal-soal
yang baik, kurang lebih atau sedang dan soal yang tidak baik. Dengan analisis
soal dapat diperoleh informasi tentang kekurangan sebuah soal tes dan
“petunjuk” untuk mengadakan perbaikan.
Dalam tes dan pengukuran,
dikenal beberapa karakteristik butir soal. Untuk tes hasil belajar pada umumnya
dipertimbangkan tiga karakteristik butir soal, yaitu : tingkat kesukaran, daya
beda dan distribusi jawaban atau berfungsi tidaknya pilihan jawaban
(distraktor). Ketiga karakteristik butir soal ini secara bersama-sama akan
menentukan mutu butir soal. Bila salah satu dari ketiga karakteristik ini tidak
memenuhi persyaratan maka mutu butir soal akan turun.
Karakteristik
Butir Soal
1.
Tingkat
Kesukaran (Difficulty level)
Menurut
Asmawi Zainul, dkk (1997) tingkat kesukaran butir soal adalah proporsi peserta
tes menjawab benar terhadap butir soal tersebut. Tingkat kesukaran butir soal
biasanya dilambangkan dengan p. Makin besar nilai p yang berarti makin besar
proporsi yang menjawab benar terhadap butir soal tersebut, makin rendah tingkat
kesukaran butir soal itu. Hal ini mengandung arti bahwa soal itu makin mudah,
demikian pula sebaliknya.
Soal
yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal
yang terlalu mudah tidak merangsang mahasiswa untuk mempertinggi usaha
memecahkannya. Sebaliknya soal yang terlalu sukar akan menyebabkan mahasiswa
menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena di
luar jangkauannya (Suharsimi Arikunto : 2001).
Tingkat
kesukaran butir soal tidaklah menunjukkan bahwa butir soal itu baik atau tidak.
Tingkat kesukaran butir hanya menunjukkan bahwa butir soal itu sukar atau mudah
untuk kelompok peserta tes tertentu. Butir soal hasil belajar yang terlalu
sukar atau terlalu mudah tidak banyak memberi informasi tentang butir soal atau
peserta tes (Asmawi Zainul, dkk : 1997).
Pada
analisis butir soal secara klasikal, seperti yang dijelaskan oleh Depdikbud
(1997) tingkat kesukaran dapat diperoleh dengan beberapa cara antara lain :
a)
skala
kesukaran linier
b)
skala
bivariate
c)
indeks
davis
d)
proporsi
menjawab benar.
Cara
yang paling umum digunakan adalah proporsi menjawab benar atau proportion
correct, yaitu jumlah peserta tes yang menjawab benar pada soal yang dianalisis
dibandingkan dengan peserta tes seluruhnya. Dalam analisis item ini digunakan
proportion correct (p), untuk menilai tingkat kesukaran butir soal, yang dapat
dilihat berdasarkan hasil analisis iteman pada lampiran 6.
Besarnya
tingkat kesukaran berkisar antara 0,00 sampai 1,00. Untuk sederhananya, tingkat
kesukaran butir dan perangkat soal dapat dibagi menjadi tiga kelompok, yaitu
mudah, sedang dan sukar. Sebagai patokan menurut (Asmawi Zainul, dkk : 1997)
dapat digunakan tabel sebagai berikut:
2.
Daya
Beda
Daya
beda butir soal ialah indeks yang menunjukkan tingkat kemampuan butir soal
membedakan kelompok yang berprestasi tinggi (kelompok atas) dari kelompok yang
berprstasi rendah (kelompok bawah) diantara para peserta tes (Asmawi Zainul,
dkk : 1997). Suryabrata (1999) menyatakan tujuan pokok mencari daya beda adalah
untuk menentukan apakah butir soal tersebut memiliki kemampuan membedakan
kelompok dalam aspek yang diukur, sesuai dengan perbedaan yang ada pada
kelompok itu.
Daya
beda butir soal yang sering digunakan dalam tes hasil belajar adalah dengan
menggunakan indeks korelasi antara skor butir dengan skor totalnya. Daya beda
dengan cara ini sering disebut validitas internal, karena nilai korelasi
diperoleh dari dalam tes itu sendiri. Daya beda dapat dilihat dari besarnya
koefisien korelasi biserial maupun koefesien korelasi point biserial.
Dalam
analisis ini digunakan nilai koefisien korelasi biserial untuk menentukan daya
beda butir soal. Koefisien korelasi biserial menunjukkan hubungan antara dua
skor, yaitu skor butir soal dan skor keseluruhan dari peserta tes yang sama.
Koefisien
daya beda berkisar antara –1,00 sampai dengan +1,00. Daya beda +1,00 berarti
bahwa semua anggota kelompok atas menjawab benar terhadap butir soal itu,
sedangkan kelompok bawah seluruhnya menjawab salah terhadap butir soal itu.
Sebaliknya daya beda –1,00 berarti bahwa semua anggota kelompok atas menjawab
salah butir soal itu, sedangkan kelompok bawah seluruhnya menjawab benar
terhadap soal itu.
Daya
beda yang dianggap masih memadahi untuk sebutir soal ialah apabila sama atau
lebih besar dari +0,30. Bila lebih kecil dari itu, maka butir soal tersebut
dianggap kurang mampu membedakan peserta tes yang mempersiapkan diri dalam
menghadapi tes dari peserta yang tidak mempersiapkan diri. Bahkan bila daya
beda itu menjadi negatif, maka butir soal itu sama sekali tidak dapat dipakai
sebagai alat ukur prestasi belajar. Oleh karena itu butir soal tersebut harus
dikeluarkan dari perangkat soal. Makin tinggi daya beda suatu butir soal, maka
makin baik butir soal tersebut, dan sebaliknya makin rendah daya bedanya, maka
butir soal itu dianggap tidak baik (Asmawi Zainul, dkk : 1997).
3.
Distribusi
Jawaban (Distraktor)
Dilihat
dari konstruksi butir soal terdiri dari dua bagian, yaitu pokok soal dan
alternatif jawaban. Alternatif jawaban jawaban juga terdiri dari dua bagian,
yaitu kunci jawaban dan pengecoh. Pengecoh dikatakan berfungsi apabila semakin
rendah tingkat kemampuan peserta tes semakin banyak memilih pengecoh, atau
makin tinggi tingkat kemampuan peserta tes akan semakin sedikit memilih
pengecoh.
Hal
demikian dapat ditunjukkan dengan adanya korelasi yang tinggi, rendah atau
negatif pada hasil analisis. Apabila proporsi peserta tes yang menjawab dengan
salah atau memilih pengecoh kurang dari 0,025 maka pengecoh tersebut harus
direvisi. Dan untuk pengecoh yang ditolak apabila tidak ada yang memilih atau
proporsinya 0,00 (Depdikbud : 1997).
Proporsi
alternatif jawaban masing-masing butir soal dapat dilihat pada kolom proportion
endorsing pada hasil analisis iteman.
Selain
memperhatikan fungsi daya tarik untuk dipilih oleh peserta tes, pengecoh soal
juga perlu memperhatikan daya beda (koefisien korelasi) yang ditunjukkan oleh
masing-masing alternatif jawaban. Setiap pengecoh diharapkan memiliki daya beda
negatif, artinya suatu pengecoh diharapkan lebih sedikit dipilih oleh kelompok
tinggi dibandingkan dengan kelompok bawah. Atau daya beda pengecoh tidak lebih
besar dari daya beda kunci jawaban setiap butir soal.
Pengertian
Analisis Butir Soal
Analisis
butir soal merupakan suatu prosedur yang sistematis, yang akan memberikan
informasi-informasi yang sangat khusus terhadap butir tes yang akan kita susun.
Analisis butir soal pada dasarnya bertujuan untuk mengetahui apakah setiap item
soal benar-benar baik, sehingga diperlukan analisis terhadapnya. Analisis item
soal terutama dapat dilakukan untuk tes objektif. Dimana tes objektif merupakan
alat evaluasi (hasil belajar mengajar) yang mengukur kepada objek-objeknya. Hal
ini tidak berarti bahwa tes uraian tidak dapat di analisis, akan tetapi memang
dalam menganalisis butir tes uraian belum ada pedoman secara standar.
Tentang
kegunaan analisis terhadap item soal pada umumnya dilakukan terhadap beberapa
hal yaitu:
1. Seberapa
besar tingkat kesukaran pada butir/item soal.
2. Apakah
butir item itu mampu membedakan kemampuan antara siswa pandai dan kurang
pandai.
3. Apakah
butir item tersebut menggunakan distraktor yang baik atau belum.
Maka
dari itu dengan analisis item soal dapat diperoleh informasi tentang kejelekan
sebuah soal dan petunjuk untuk mengadakan perbaikan.
Tujuan Analisis
Analisis
butir tes merupakan kegiatan penting dalam upaya memperoleh instrument yang
berkategori baik. Analisis ini meliputi:
1. Menentukan
Validitas Dan Reliabilitas Instrumen
a. Validitas
Validitas merupakan produk dari
validasi. Validasi adalah suatu proses yang dilakukan oleh penyusun atau
pengguna instrumen untuk mengumpulkan data secara empiris guna mendukung
kesimpulan yang dihasilkan oleh skor instrumen. Sedangkan validitas adalah
kemampuan suatu alat ukur untuk mengukur sasaran ukurnya.
Suatu alat ukur disebut memiliki
validitas apabila alat ukur tersebut isinya layak mengukur objek yang
seharusnya diukur dan sesuai dengan kreteria tertentu, artinya adanya kesesuaian
antara alat ukur dengan fungsi pengukuran dan sasaran pengukuran. Ini sesuai
dengan Encyclopedia of Educational Evaluation yang ditulis oleh Scarvia B
Anderson dan disadur oleh Prof. Dr. Suharsimi Arikunto (2007, 65) bahwa A test
is valid if it measures what it purpose to measure bila diartikan sebuah tes
dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur. Bilamana
alat ukur tidak memiliki validitas yang dapat dipertanggung jawabkan, maka data
yang masuk juga sis dan kesimpulan yang ditarik juga menjadi salah.
b.
Validitas Tes Hasil Belajar
Menurut
Suharsimi Arikunto 2007, validitas sebuah tes dapat diketahui dari hasil
pemikiran dan dari hasil pengalaman. Hal yang pertama akan diperoleh validitas
logis dan hal yang kedua akan diperoleh validitas empiris. Dua hal inilah yang
menjadi dasar pengelompokan validitas tes.
c.
Validasi logis
Mengandung
arti penalaran, sehingga validitas logis untuk suatu instrumen evaluasi
menunjuk pada kondisi bagi sebuah instrumen yang memenuhi persyaratan valid
berdasarkan hasil penalaran. Kondisi valid itu dipandang terpenuhi karena
instrument itu telah dirancang sebaik mungkin menurut ketentuan yang ada.
Dengan
keadaan itu validitas logis dapat dicapai apabila instrument disusun mengikuti
ketentuan yang ada. Validitas logis yang dapat dicapai oleh sebuah instrumen
terdiri dari dua yaitu :
d.
Validitas Isi
Validitas isi bagi sebuah
instrumen menunjuk suatu kondisi sebuah instrument yang disusun berdasarkan isi
materi pelajaran yang dievaluasi. Sebuah tes dikatakan memiliki validitas isi
apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi
pelajaran yang di berikan. Oleh karena materi yang diajarkan tertera dalam
kurikulum maka validitas ini sering disebut juga dengan validitas kurikuler. Validitas
isi dapat diusahakan tercapainya sejak saat penyusunan dengan cara merinci
materi kurikulum atau materi buku pelajaran.
e.
Validitas Konstruk
Validitas konstruk sebuah
instrumen menunjukkan suatu kondisi sebuah instrumen yang disusun berdasarkan
konstruk-konstruk aspek kejiwaan yang seharusnya dievaluasi. Sebuah tes
dikatakan memiliki validitas konstruk apabila butir-butir soal yang membangun
tes tersebut mengukur setiap aspek berfikir seperti yang disebutkan dalam
tujuan instruksional khusus. Dengan kata lain jika butir-butir soal mengukur
aspek berfikir tersebut sudah sesuai dengan aspek berfikir yang menjadi tujuan
instruksional.
f.
Validitas Empiris
Mengandung
arti kata pengalaman. Sebuah instrument dikatakan memiliki validitas empiris
apabila sudah di uji dengan pengalaman. Sebagai contoh, seseorang dapat diakui
jujur oleh masyarakat lain apabila dalam pengalaman dia diakui memang jujur.
Pada Validitas empiris
terdiri dari dua cara yang dilakukan untuk mengujinya sehingga dia menjadi
valid. Pengujian itu dilakuakn dengan membandingkan kondisi instrumen yang
bersangkutan dengan suatu ukuran. Kriteria yang digunakan adalah :
g. Validitas
Konkuren
Disebut
juga dengan validitas “yang ada sekarang ‘tetapi lebih dikenal dengan validitas
empiris. Sebuah instrument dikatakan memiliki validitas empiris jika hasilnya
sesuai dengan pengalaman. Jika ada istilah :sesuai” tentu ada dua hal yang
dipasangkan, dimana dalam hal ini hasil tes dipasangkan dengan hasil
pengalaman. Pengalaman selalu mengenai hal yang telah lampau sehingga data
pengalaman tersebut sekarang sudah ada.
Dalam
membandingkan hasil sebuah tes maka diperlukan suatu alat pembanding. Maka
hasil tes merupakan sesuatu yang dibandingkan. Contoh : seorang guru ingin
mengetahui apakah tes sumatif yang disusun sudah valid atau belum. Untuk ini
perlu sebuah kreteria masa lalu yang datanya sekarang dimiliki. Misalnya nilai
ulangan harian atau nilai semester yang lalu.
h. Validitas
prediksi
Prediksi
artinya meramal. Dengan meramal selalu mengenai hal yang akan datang jadi
sekarang belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi
apabila mempunyai kemampuan untuk meramalkan apa yang terjadi pada masa yang
akan datang. Misalnya tes masuk
perguruan tinggi adalah sebuah tes yang diperkirakan dapat meramalkan
keberhasilan peserta tes dalam mengikuti kuliah di masa yang akan datang. Calon
yang tersaring berdasarkan hasil tes diharapkan mencerminkan tinggi rendahnya
kemampuan mengikuti kuliah. Jika nilai tesnya tinggi tentu menjamin
keberhasilan kelak. Sebaliknya seorang calon dikatakan tidak lulus tes karena
memiliki nilai tes yang rendah jadi diperkirakan akan tidak mampu mengikuti
perkuliahan yang akan datang. Sebagai
alat pembanding validitas prediksi adalah nilai-nilai yang diperoleh setelah
peserta tes mengikuti pelajaran diperguruan tinggi. Jika ternyata siapa yang
memiliki nilai tes lebih tinggi gagal dalam ujian semester I dibandingkan
dengan yang dahulu nilai tesnya lebih rendah maka tes masuk yang dimaksud tidak
memiliki validitas.
i.
Validitas Item Tes Hasil Belajar
Tinggi
rendahnya validitas suatu tes secara keseluruhan sangat dipengaruhi oleh
validitas yang dimiliki oleh masing-masing butir item yang membangun tes
tersebut. Semakin besar dukungan yang diberikan oleh butir-butir item terhadap
tes hasil belajar maka tes tersebut akan semakin dapat menunjukkan
kemantapannya. Item tes hasil belajar dapat dikatakan valid apabila skor-skor
pada butir item yang bersangkutan memiliki kesesuaian arah dengan skor
totalnya. Atau dengan kata lain memilki korelasi positif yang signifikan antara
skor item dengan skor totalnya.
Suatu
butir item dikatakan valid jika skor item yang bersangkutan berkorelasi positif
yang signifikan dengan skor total. Untuk menentukan valid tidaknya suatu butir
item dapat digunakan teknik korelasi product moment dan korelasi point
biserial.
2. Penyebab
Invaliditas
Ancaman utama terhadap
validitas instrumen adalah:
a. Ketakterwakilan
konstruk
Menunjukkan bahwa tugas
yang diukur dalam penilaian tidak mencakup dimensi penting dari konstruk. Oleh
karena itu, hasil tes tersebut tidak mungkin untuk mengungkapkan kemampuan
siswa sebenarnya dalam konstruk yang hendak diukur oleh instrumen;
b. Penyimpangan
keragaman konstruk berarti bahwa instrumen tersebut mengukur terlalu banyak
variabel, dan kebanyakan variabel tersebut tidak relevan terhadap isi konstruk.
Jenis penyimpangan validitas seperti ini mencakup dua bentuk, yaitu
penyimpangan kemudahan konstruk (Construct irrelevant easiness) dan
penyimpangan kesukaran konstruk (Construct irrelevant difficulty).
Penyimpangan kemudahan
konstruk terjadi ketika faktor-faktor luar seperti kata-kata kunci atau bentuk
instrumen memungkinkan seseorang untuk menjawab benar dengan cara yang tidak
sesuai dengan konstruk yang diukur, dan penyimpangan kesukaran konstruk terjadi
bila aspek-aspek luar dari tugas membuat tingkat kesukaran tugas tidak sejalan
terhadap sebagian atau keseluruhan anggota kelompok.
Sementara bila terjadi
penyimpangan keragaman konstruk yang pertama menyebabkan seseorang memperoleh
skor yang lebih tinggi dibanding dengan kemampuan yang sebenarnya, dan
terjadinya penyimpangan keragaman konstruk yang kedua menyebabkan seseorang
memperoleh skor yang lebih rendah dibanding dengan kemampuan yang sebenarnya
c. Reliabilitas
Reliabilitas
instrumen adalah keadaan instrumen yang menunjukkan hasil pengukuran yang
reliable (tidak berubah-ubah, konsisten). Instrumen yang reliable adalah
instrumen yang apabila digunakan untuk mengukur subyek atau objek yang sama
pada waktu yang berbeda dan pengukuran dilakukan oleh orang yang berbeda
hasilnya tetap sama.
Beberapa
faktor penting yang mempengaruhi reliabilitas suatu tes yaitu:
- . Kemampuan peserta tes atau subjek uji coba. Makin heterogen atau makin berbeda kemampuan peserta tes makin tinggi reliabilitas tes.
- Semakin besar jumlah peserta tes semakin besar reliabilitas, karena semakin banyak peserta tes maka semakin beragam kemampuannya.
- Panjang pendeknya tes. Jumlah item tes yang banyak dengan mengkaji beberapa tujuan akan lebih reliable dibandingkan dengan jumlah item yang sedikit, karena akan lebih representatif. Namun jumlah item tes yang terlalu banyak akan melelahkan dan mengganggu konsentrasi sehingga hasil yang diperoleh tidak tepat lagi.
- Evaluasi yang subjektif juga akan menurunkan reliabilitas.
- Hal yang berhubungan dengan penyelenggaraan tes.
Adanya hal-hal yang
mempengaruhi hasil tes ini semua, secara tidak langsung akan mempengaruhi
reliabilitas soal tes.
Reliabilitas instrumen
dinyatakan dengan koefisien reliabilitas. Instrumen yang reliable adalah
instrumen yang memiliki koefisien reliabilitas minimal 0,70. Sebaiknya
koefisien reliabilitas instrumen 0,80 atau lebih. Koefisien reliabilitas
instrumen dihitung dengan menggunakan rumus tertentu.
3. Analisis
butir tes.
Menurut Thorndike &
Hagen, analisis terhadap butir tes yang telah dijawab siswa suatu kelas
mempunyai dua tujuan, yakni:
a. Jawaban-jawaban
soal-soal tersebut merupakan informasi diagnosis untuk meneliti pelajaran dari
kelas itu dan kegagalan-kegagalan belajarnya, serta selanjutnya untuk
membimbing kea rah cara belajar yang baik, dan
b. Jawaban
terhadap soal-soal dan perbaikan soal-soal yang didasarkan atas jawaban-jawaban
tersebut merupakan dasar bagi penyiapan tes-tes yang lebih baik.
Analisis
butir tes bertujuan untuk mengidentifikasi butir-butir manakah yang termasuk
dalam kategori baik, kurang baik, dan jelek. Analisis butir tes memungkinkan
kita memperoleh informasi mengenai baik tidaknya suatu butir, sekaligus
memperoleh petunjuk untuk melakukan perbaikan.
Penganalisaan terhadap Butir Soal
1. Teknik Analisa Derajat
Kesukaran Soal
Analisis tingkat
kesukaran soal yaitu mengkaji soal-soal tes dari segi kesulitannya sehingga
dapat diperoleh soal-soal mana yang termasuk mudah, sedang, dan sukar. Tingkat
kesukaran soal dipandang dari kesanggupan atau kemampuan siswa dalam menjawab,
bukan dilihat dari sudut guru sebagai pembuat soal. Persoalan yang penting
dalam melakukan analisis tingkat kesukaran soal adalah penentuan proporsi dan
kriteria soal yang termasuk mudah, sedang dan sukar.Tingkat kesukaran soal
adalah peluang untuk menjawab benar suatu soal pada tingkat kemampuan tertentu
yang biasanya dinyatakan dalam bentuk indeks.
Bermutu atau tidaknya
butir-butir item tes hasil belajar pertama-tama dapat diketahui dari derajat
kesukaran atau taraf kesulitan yang dimiliki oleh masing-masing butir item
tersebut. Butir-butir item tes hasil belajar dapat dinyatakan sebagai
butir-butir item yang baik apabila butir-butir item tersebut tidak terlalu
sukar dan tidak pula terlalu mudah dengan kata lain derajat kesukaran item itu
adalah sedang atau cukup. Bertitik tolak dari pernyataan tersebut di atas maka
butir-butir item hasil belajar di mana seluruh testee tidak dapat menjawab
dengan betul (karena terlalu sukar) tidak dapat disebut sebagai item yang baik.
Demikian pula sebaliknya,
butir-butir item tes hasil belajar dimana seluruh testee dapat menjawab dengan
betul (karena terlalu mudah) juga tidak dapat dimasukkan dalam kategori item
yang baik
2. Teknik Analisis Daya
Pembeda Item
Daya
pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk dapat
membedakan (mendiskriminasi) antara kemampuan tinggi dan rendah.
Daya
pembeda item itu penting sekali bagi salah satu dasar untuk menyusun butir item
tes hasil belajar adalah adanya anggapan.Tes dikatakan tidak memiliki daya
pembeda apabila tes tersebut, jika diujikan kepada anak berprestasi tinggi,
hasilnya rendah tetapi bila diberikan kepada anak yang lemah hasilnya lebih
tinggi. Atau bila diberikan kepada kedua kategori siswa tersebut hasilnya sama
saja.
3. Teknik Analisis Fungsi
Distraktor
Distraktor
adalah pengecoh, jawaban-jawaban yang mengecoh. Ini bertujuan menarik untuk
menjawabnya padahal itu salah. Sebagai tindak lanjut atas hasil penganalisaan
terhadap fungsi distraktor tersebut maka distraktor yang sudah menjalankan
fungsinya dengan baik dapat dipakai lagi pada tesnya.
Tujuan
utama pemasangan distraktor pada setiap butir itu adalah, agar dari sekian
banyak testee yang mengikuti tes hasil belajar ada yang tertarik atau
terangsang untuk memilihnya, sebab mereka menyangka bahwa distraktor yang
mereka pilih itu merupakan jawaban yang betul.
Analisis Butir Soal Secara Kualitatif
1. Pengertian
Pada prinsipnya analisis butir soal secara kualitatif
dilaksanakan berdasarkan kaidah penulisan soal (tes tertulis, perbuatan, dan
sikap). Penelaahan ini biasanya dilakukan sebelum soal digunakan/diujikan.
Aspek yang diperhatikan di dalam penelaahan secara kualitatif ini adalah setiap
soal ditelaah dari segi materi, konstruksi, bahasa/budaya, dan kunci
jawaban/pedoman penskorannya. Dalam melakukan penelaahan setiap butir soal,
penelaah perlu mempersiapkan bahan-bahan penunjang seperti: (1) kisi-kisi tes,
(2) kurikulum yang digunakan, (3) buku sumber, dan (4) kamus bahasa Indonesia.
2. Teknik Analisis Secara Kualitatif
secara kualitatif, diantaranya adalah teknik moderator
dan teknik panel. Teknik moderator merupakan teknik berdiskusi yang di dalamnya
terdapat satu orang sebagai penengah. Berdasarkan teknik ini, setiap butir soal
didiskusikan secara bersama-sama dengan beberapa ahli seperti guru yang
mengajarkan materi, ahli materi, penyusun/pengembang kurikulum, ahli penilaian,
ahli bahasa, berlatar belakang psikologi. Teknik ini sangat baik karena setiap
butir soal dilihat secara bersama-sama berdasarkan kaidah penulisannya. Di
samping itu, para penelaah dipersilakan mengomentari/ memperbaiki berdasarkan
ilmu yang dimilikinya. Setiap komentar/masukan dari peserta diskusi dicatat
oleh notulis. Setiap butir soal dapat dituntaskan secara bersama-sama,
perbaikannya seperti apa. Namun, kelemahan teknik ini adalah memerlukan waktu
lama untuk rnendiskusikan setiap satu butir soal.
Teknik
panel merupakan suatu teknik menelaah butir soal yang setiap butir soalnya
ditelaah berdasarkan kaidah penulisan butir soal, yaitu ditelaah dari segi
materi, konstruksi, bahasa/budaya, kebenaran kunci jawaban/pedoman penskorannya
yang dilakukan oleh beberapa penelaah. Caranya adalah beberapa penelaah
diberikan: butir-butir soal yang akan ditelaah, format penelaahan, dan pedoman
penilaian/ penelaahannya. Pada tahap awal para penelaah diberikan pengarahan,
kemudian tahap berikutnya para penelaah berkerja sendiri-sendiri di tempat yang
tidak sama. Para penelaah dipersilakan memperbaiki langsung pada teks soal dan
memberikan komentarnya serta memberikan nilai pada setiap butir soalnya yang
kriterianya adalah: baik, diperbaiki, atau diganti.
Analisis Butir Soal Secara Kuantitatif
1. Pengertian
Penelaahan soal secara kuantitatif maksudnya adalah
penelaahan butir soal didasarkan pada data empirik dari butir soal yang
bersangkutan. Data empirik ini diperoleh dari soal yang telah diujikan.
2. Analisis Butir Soal
Ada dua pendekatan dalam analisis secara kuantitatif,
yaitu pendekatan secara klasik dan modern.
1.
Klasik
Analisis
butir soal secara klasik adalah proses penelaahan butir soal melalui informasi
dari jawaban peserta didik guna meningkatkan mutu butir soal yang bersangkutan
dengan menggunakan teori tes klasik. Kelebihan analisis butir soal secara
klasik adalah murah, dapat dilaksanakan sehari-hari dengan cepat menggunakan
komputer, murah, sederhana, familier dan dapat menggunakan data dari beberapa
peserta didik atau sampel kecil (Millman dan Greene, 1993: 358). Adapun proses
analisisnya sudah banyak dilaksanakan para guru di sekolah seperti beberapa
contoh di bawah ini.
2.
Modern
Analisis
butir soal secara modern yaitu penelaahan butir soal dengan menggunakan Item
Response Theory (IRT) atau teori jawaban butir soal. Teori ini merupakan suatu
teori yang menggunakan fungsi matematika untuk menghubungkan antara peluang
menjawab benar suatu scal dengan kemampuan siswa. Nama lain IRT adalah latent
trait theory (LTT), atau characteristics curve theory (ICC). Asal mula IRT
adalah kombinasi suatu versi hukum phi-gamma dengan suatu analisis faktor butir
soal (item factor analisis) kemudian bernama Teori Trait Latent (Latent Trait
Theory), kemudian sekarang secara umum dikenal menjadi teori jawaban butir sapoal
(Item Response Theory) (McDonald, 1999: 8). Dalam subbab ini akan disajikan
kelebihan analisis secara IRT dan kalibrasi butir soal dan pengukuran kemampuan
orang.
Kesimpulan
Analisis butir soal merupakan suatu
prosedur yang sistematis, yang akan memberikan informasi-informasi yang sangat
khusus terhadap butir tes yang akan kita susun. Analisis butir soal pada
dasarnya bertujuan untuk mengetahui apakah setiap item soal benar-benar baik,
sehingga diperlukan analisis terhadapnya.
Analisis butir tes bertujuan untuk
mengidentifikasi butir-butir manakah yang termasuk dalam kategori baik, kurang
baik, dan jelek.
Validitas merupakan produk dari
validasi. Validasi adalah suatu proses yang dilakukan oleh penyusun atau
pengguna instrumen untuk mengumpulkan data secara empiris guna mendukung
kesimpulan yang dihasilkan oleh skor instrumen.
Reliabilitas instrumen adalah
keadaan instrumen yang menunjukkan hasil pengukuran yang reliable (tidak
berubah-ubah, konsisten).
Penganalisisan terhadap butir-butir
soal dapat dilakukan dari tiga segi yaitu:
1. Teknik analisis
kesukaran item soal
2. Teknik analisis daya
pembeda
3. Teknik analisis fungsi
distraktor
Saran
Analisis
butir soal hendaknya kita lakukan untuk dapat mengidentifikasi butir-butir tes
secara baik dan tepat dan dapat memahami informasi yang diperoleh untuk
melakukan perbaikan.
Sumber:
Aiken, Lewis R. (1994). Psychological Testing and
Assessment,(Eight Edition), Boston: Allyn and Bacon.
Anastasi. Anne and Urbina, Susana. (1997).
Psicoholological Testing. (Seventh Edition). New Jersey: Prentice-Hall, Inc.
Assessment Systems Corporation. (1984). User's Manual
for the MiicroCat Testing System, USA.
Atkinson, John W. (1978). Personality Motivation and
Achievemcnt. Sashington. Hemisphere Publishing Corporation.
Bejar, Isaac I. (1983). Introduction to Item Response
Theory and Their- Assumptions. Hambleton, Ronald K. (Editor). Applications of
Item Response Theory. Canada: Educational Research Institute of British
Columbia.
Bruning, James L. and Kintz, B. L. (1987).
Computational Handbook of Statistics. Third Edition. Illinois: Scott, Foresman
and Company.
File Word-nya bisa unduh di sini : Makalah Analisis Butir Soal
Catatan:
Cara download file-nya bisa di lihat disini: Tutorial Download File Menggunakan Desktop atau Tutorial Download File Menggunakan Mobile Android atau bisa lihat langsung melalui video di samping..!
.
.
0 komentar:
Post a Comment