Analisis Soal - 2017

.
.

Oleh        : Andriawan Timumun, Ramlawati Harun, Yolanda Gani, Salam W. Naki,
                  Moh. Mufli Alfira, Rahmat Hasan.
Tempat    : Gorontalo
Lembaga : Universitas Negeri Gorontalo
Tahun      : 2017

Pilihan Unduh File Ada Di Bagian Bawah Artikel Ini..!
Sumber Gambar: https://gurusd.web.idPenilaian terhadap butir soal pada dasarnya merupakan analisis butir soal, dan selama ini pada umumnya para ahli pengukuran mengatakan bahwa analisis butir soal maksudnya adalah penilaian terhadap soal. Telah diketahui bersama bahwa penyusunan tes sangat mempengaruhi kualitas butir soal.

Pendekatan untuk menganalisis butir soal yang berkembang saat ini terdiri dari dua pendekatan yaitu pendekatan klasik dan pendekatan modern. Kedua pendekatan ini masing-masing memiliki kelebihan dan kekurangan. Namun keduanya masih sering digunakan dalam analisis butir soal. Analisis butir soal dengan pendekatan klasik diantaranya dapat dilakukan menggunakan Program Iteman.
            Dengan melihat beberapa persyaratan yang harus dipenuhi, penyusunan tes dituntut untuk mengikuti pedoman penyusunan tes dan melakukan ujicoba. Kemudian berdasarkan hasil ujicoba, respon peserta dianalisis menggunakan Program Iteman untuk mendapatkan karakteristik butir soal.
Data hasil analisis dengan Program Iteman dianalisis kembali menggunakan instrumen penilaian butir soal yang memenuhi syarat sebagai alat ukur yang baik. Suryabrata (1999) menyatakan bahwa analisis butir soal mencakup telaah soal atau analisis kualitatif dan analisis terhadap data empirik hasil ujicoba atau analisis kuantitatif.
Analisis butir soal secara kualitatif menekankan penilaian dari ketiga segi yaitu materi, konstruksi, dan bahasa. Namun demikian dalam pembahasan ini dikhususkan untuk menjelaskan analisis butir soal secara kuantitatif.
            Analisis ini dilakukan berdasarkan data yang diperoleh secara empiris melalui ujicoba dari suatu perangkat tes. Analisis kuantitatif sering disebut dengan analisis item yang menghasilkan karakteristik atau parameter butir dan tes, yaitu: tingkat kesukaran, daya beda dan distribusi jawaban dan kunci setiap butir, serta reliabilitas dan kesalahan pengukuran (SEM) dalam tes.
Telah disinggung di depan bahwa analisis soal antara lain bertujuan untuk mengadakan identifikasi soal-soal yang baik, kurang lebih atau sedang dan soal yang tidak baik. Dengan analisis soal dapat diperoleh informasi tentang kekurangan sebuah soal tes dan “petunjuk” untuk mengadakan perbaikan.
Dalam tes dan pengukuran, dikenal beberapa karakteristik butir soal. Untuk tes hasil belajar pada umumnya dipertimbangkan tiga karakteristik butir soal, yaitu : tingkat kesukaran, daya beda dan distribusi jawaban atau berfungsi tidaknya pilihan jawaban (distraktor). Ketiga karakteristik butir soal ini secara bersama-sama akan menentukan mutu butir soal. Bila salah satu dari ketiga karakteristik ini tidak memenuhi persyaratan maka mutu butir soal akan turun.
*      Karakteristik Butir Soal
    1.      Tingkat Kesukaran (Difficulty level)
Menurut Asmawi Zainul, dkk (1997) tingkat kesukaran butir soal adalah proporsi peserta tes menjawab benar terhadap butir soal tersebut. Tingkat kesukaran butir soal biasanya dilambangkan dengan p. Makin besar nilai p yang berarti makin besar proporsi yang menjawab benar terhadap butir soal tersebut, makin rendah tingkat kesukaran butir soal itu. Hal ini mengandung arti bahwa soal itu makin mudah, demikian pula sebaliknya.
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang mahasiswa untuk mempertinggi usaha memecahkannya. Sebaliknya soal yang terlalu sukar akan menyebabkan mahasiswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena di luar jangkauannya (Suharsimi Arikunto : 2001).
Tingkat kesukaran butir soal tidaklah menunjukkan bahwa butir soal itu baik atau tidak. Tingkat kesukaran butir hanya menunjukkan bahwa butir soal itu sukar atau mudah untuk kelompok peserta tes tertentu. Butir soal hasil belajar yang terlalu sukar atau terlalu mudah tidak banyak memberi informasi tentang butir soal atau peserta tes (Asmawi Zainul, dkk : 1997).
Pada analisis butir soal secara klasikal, seperti yang dijelaskan oleh Depdikbud (1997) tingkat kesukaran dapat diperoleh dengan beberapa cara antara lain :
a)      skala kesukaran linier
b)      skala bivariate
c)      indeks davis
d)      proporsi menjawab benar.
Cara yang paling umum digunakan adalah proporsi menjawab benar atau proportion correct, yaitu jumlah peserta tes yang menjawab benar pada soal yang dianalisis dibandingkan dengan peserta tes seluruhnya. Dalam analisis item ini digunakan proportion correct (p), untuk menilai tingkat kesukaran butir soal, yang dapat dilihat berdasarkan hasil analisis iteman pada lampiran 6.
Besarnya tingkat kesukaran berkisar antara 0,00 sampai 1,00. Untuk sederhananya, tingkat kesukaran butir dan perangkat soal dapat dibagi menjadi tiga kelompok, yaitu mudah, sedang dan sukar. Sebagai patokan menurut (Asmawi Zainul, dkk : 1997) dapat digunakan tabel sebagai berikut:
    2.      Daya Beda
Daya beda butir soal ialah indeks yang menunjukkan tingkat kemampuan butir soal membedakan kelompok yang berprestasi tinggi (kelompok atas) dari kelompok yang berprstasi rendah (kelompok bawah) diantara para peserta tes (Asmawi Zainul, dkk : 1997). Suryabrata (1999) menyatakan tujuan pokok mencari daya beda adalah untuk menentukan apakah butir soal tersebut memiliki kemampuan membedakan kelompok dalam aspek yang diukur, sesuai dengan perbedaan yang ada pada kelompok itu.
Daya beda butir soal yang sering digunakan dalam tes hasil belajar adalah dengan menggunakan indeks korelasi antara skor butir dengan skor totalnya. Daya beda dengan cara ini sering disebut validitas internal, karena nilai korelasi diperoleh dari dalam tes itu sendiri. Daya beda dapat dilihat dari besarnya koefisien korelasi biserial maupun koefesien korelasi point biserial.
Dalam analisis ini digunakan nilai koefisien korelasi biserial untuk menentukan daya beda butir soal. Koefisien korelasi biserial menunjukkan hubungan antara dua skor, yaitu skor butir soal dan skor keseluruhan dari peserta tes yang sama.
Koefisien daya beda berkisar antara –1,00 sampai dengan +1,00. Daya beda +1,00 berarti bahwa semua anggota kelompok atas menjawab benar terhadap butir soal itu, sedangkan kelompok bawah seluruhnya menjawab salah terhadap butir soal itu. Sebaliknya daya beda –1,00 berarti bahwa semua anggota kelompok atas menjawab salah butir soal itu, sedangkan kelompok bawah seluruhnya menjawab benar terhadap soal itu.
Daya beda yang dianggap masih memadahi untuk sebutir soal ialah apabila sama atau lebih besar dari +0,30. Bila lebih kecil dari itu, maka butir soal tersebut dianggap kurang mampu membedakan peserta tes yang mempersiapkan diri dalam menghadapi tes dari peserta yang tidak mempersiapkan diri. Bahkan bila daya beda itu menjadi negatif, maka butir soal itu sama sekali tidak dapat dipakai sebagai alat ukur prestasi belajar. Oleh karena itu butir soal tersebut harus dikeluarkan dari perangkat soal. Makin tinggi daya beda suatu butir soal, maka makin baik butir soal tersebut, dan sebaliknya makin rendah daya bedanya, maka butir soal itu dianggap tidak baik (Asmawi Zainul, dkk : 1997).
    3.      Distribusi Jawaban (Distraktor)
Dilihat dari konstruksi butir soal terdiri dari dua bagian, yaitu pokok soal dan alternatif jawaban. Alternatif jawaban jawaban juga terdiri dari dua bagian, yaitu kunci jawaban dan pengecoh. Pengecoh dikatakan berfungsi apabila semakin rendah tingkat kemampuan peserta tes semakin banyak memilih pengecoh, atau makin tinggi tingkat kemampuan peserta tes akan semakin sedikit memilih pengecoh.
Hal demikian dapat ditunjukkan dengan adanya korelasi yang tinggi, rendah atau negatif pada hasil analisis. Apabila proporsi peserta tes yang menjawab dengan salah atau memilih pengecoh kurang dari 0,025 maka pengecoh tersebut harus direvisi. Dan untuk pengecoh yang ditolak apabila tidak ada yang memilih atau proporsinya 0,00 (Depdikbud : 1997).
Proporsi alternatif jawaban masing-masing butir soal dapat dilihat pada kolom proportion endorsing pada hasil analisis iteman.
Selain memperhatikan fungsi daya tarik untuk dipilih oleh peserta tes, pengecoh soal juga perlu memperhatikan daya beda (koefisien korelasi) yang ditunjukkan oleh masing-masing alternatif jawaban. Setiap pengecoh diharapkan memiliki daya beda negatif, artinya suatu pengecoh diharapkan lebih sedikit dipilih oleh kelompok tinggi dibandingkan dengan kelompok bawah. Atau daya beda pengecoh tidak lebih besar dari daya beda kunci jawaban setiap butir soal.
Pengertian Analisis Butir Soal
Analisis butir soal merupakan suatu prosedur yang sistematis, yang akan memberikan informasi-informasi yang sangat khusus terhadap butir tes yang akan kita susun. Analisis butir soal pada dasarnya bertujuan untuk mengetahui apakah setiap item soal benar-benar baik, sehingga diperlukan analisis terhadapnya. Analisis item soal terutama dapat dilakukan untuk tes objektif. Dimana tes objektif merupakan alat evaluasi (hasil belajar mengajar) yang mengukur kepada objek-objeknya. Hal ini tidak berarti bahwa tes uraian tidak dapat di analisis, akan tetapi memang dalam menganalisis butir tes uraian belum ada pedoman secara standar.
Tentang kegunaan analisis terhadap item soal pada umumnya dilakukan terhadap beberapa hal yaitu:
1.      Seberapa besar tingkat kesukaran pada butir/item soal.
2.      Apakah butir item itu mampu membedakan kemampuan antara siswa pandai dan kurang pandai.
3.      Apakah butir item tersebut menggunakan distraktor yang baik atau belum.
Maka dari itu dengan analisis item soal dapat diperoleh informasi tentang kejelekan sebuah soal dan petunjuk untuk mengadakan perbaikan.
Tujuan Analisis
Analisis butir tes merupakan kegiatan penting dalam upaya memperoleh instrument yang berkategori baik. Analisis ini meliputi:
     1.      Menentukan Validitas Dan Reliabilitas Instrumen
       a.       Validitas
            Validitas merupakan produk dari validasi. Validasi adalah suatu proses yang dilakukan oleh penyusun atau pengguna instrumen untuk mengumpulkan data secara empiris guna mendukung kesimpulan yang dihasilkan oleh skor instrumen. Sedangkan validitas adalah kemampuan suatu alat ukur untuk mengukur sasaran ukurnya.
            Suatu alat ukur disebut memiliki validitas apabila alat ukur tersebut isinya layak mengukur objek yang seharusnya diukur dan sesuai dengan kreteria tertentu, artinya adanya kesesuaian antara alat ukur dengan fungsi pengukuran dan sasaran pengukuran. Ini sesuai dengan Encyclopedia of Educational Evaluation yang ditulis oleh Scarvia B Anderson dan disadur oleh Prof. Dr. Suharsimi Arikunto (2007, 65) bahwa A test is valid if it measures what it purpose to measure bila diartikan sebuah tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur. Bilamana alat ukur tidak memiliki validitas yang dapat dipertanggung jawabkan, maka data yang masuk juga sis dan kesimpulan yang ditarik juga menjadi salah.
       b.      Validitas Tes Hasil Belajar
            Menurut Suharsimi Arikunto 2007, validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil pengalaman. Hal yang pertama akan diperoleh validitas logis dan hal yang kedua akan diperoleh validitas empiris. Dua hal inilah yang menjadi dasar pengelompokan validitas tes.
       c.       Validasi logis
            Mengandung arti penalaran, sehingga validitas logis untuk suatu instrumen evaluasi menunjuk pada kondisi bagi sebuah instrumen yang memenuhi persyaratan valid berdasarkan hasil penalaran. Kondisi valid itu dipandang terpenuhi karena instrument itu telah dirancang sebaik mungkin menurut ketentuan yang ada.
            Dengan keadaan itu validitas logis dapat dicapai apabila instrument disusun mengikuti ketentuan yang ada. Validitas logis yang dapat dicapai oleh sebuah instrumen terdiri dari dua yaitu :
       d.      Validitas Isi
Validitas isi bagi sebuah instrumen menunjuk suatu kondisi sebuah instrument yang disusun berdasarkan isi materi pelajaran yang dievaluasi. Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang di berikan. Oleh karena materi yang diajarkan tertera dalam kurikulum maka validitas ini sering disebut juga dengan validitas kurikuler. Validitas isi dapat diusahakan tercapainya sejak saat penyusunan dengan cara merinci materi kurikulum atau materi buku pelajaran.
       e.       Validitas Konstruk
Validitas konstruk sebuah instrumen menunjukkan suatu kondisi sebuah instrumen yang disusun berdasarkan konstruk-konstruk aspek kejiwaan yang seharusnya dievaluasi. Sebuah tes dikatakan memiliki validitas konstruk apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berfikir seperti yang disebutkan dalam tujuan instruksional khusus. Dengan kata lain jika butir-butir soal mengukur aspek berfikir tersebut sudah sesuai dengan aspek berfikir yang menjadi tujuan instruksional.
       f.        Validitas Empiris
            Mengandung arti kata pengalaman. Sebuah instrument dikatakan memiliki validitas empiris apabila sudah di uji dengan pengalaman. Sebagai contoh, seseorang dapat diakui jujur oleh masyarakat lain apabila dalam pengalaman dia diakui memang jujur. 
Pada Validitas empiris terdiri dari dua cara yang dilakukan untuk mengujinya sehingga dia menjadi valid. Pengujian itu dilakuakn dengan membandingkan kondisi instrumen yang bersangkutan dengan suatu ukuran. Kriteria yang digunakan adalah :
       g.      Validitas Konkuren
            Disebut juga dengan validitas “yang ada sekarang ‘tetapi lebih dikenal dengan validitas empiris. Sebuah instrument dikatakan memiliki validitas empiris jika hasilnya sesuai dengan pengalaman. Jika ada istilah :sesuai” tentu ada dua hal yang dipasangkan, dimana dalam hal ini hasil tes dipasangkan dengan hasil pengalaman. Pengalaman selalu mengenai hal yang telah lampau sehingga data pengalaman tersebut sekarang sudah ada.
            Dalam membandingkan hasil sebuah tes maka diperlukan suatu alat pembanding. Maka hasil tes merupakan sesuatu yang dibandingkan. Contoh : seorang guru ingin mengetahui apakah tes sumatif yang disusun sudah valid atau belum. Untuk ini perlu sebuah kreteria masa lalu yang datanya sekarang dimiliki. Misalnya nilai ulangan harian atau nilai semester yang lalu.
       h.      Validitas prediksi
            Prediksi artinya meramal. Dengan meramal selalu mengenai hal yang akan datang jadi sekarang belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi apabila mempunyai kemampuan untuk meramalkan apa yang terjadi pada masa yang akan datang.  Misalnya tes masuk perguruan tinggi adalah sebuah tes yang diperkirakan dapat meramalkan keberhasilan peserta tes dalam mengikuti kuliah di masa yang akan datang. Calon yang tersaring berdasarkan hasil tes diharapkan mencerminkan tinggi rendahnya kemampuan mengikuti kuliah. Jika nilai tesnya tinggi tentu menjamin keberhasilan kelak. Sebaliknya seorang calon dikatakan tidak lulus tes karena memiliki nilai tes yang rendah jadi diperkirakan akan tidak mampu mengikuti perkuliahan yang akan datang. Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang diperoleh setelah peserta tes mengikuti pelajaran diperguruan tinggi. Jika ternyata siapa yang memiliki nilai tes lebih tinggi gagal dalam ujian semester I dibandingkan dengan yang dahulu nilai tesnya lebih rendah maka tes masuk yang dimaksud tidak memiliki validitas.
       i.        Validitas Item Tes Hasil Belajar
            Tinggi rendahnya validitas suatu tes secara keseluruhan sangat dipengaruhi oleh validitas yang dimiliki oleh masing-masing butir item yang membangun tes tersebut. Semakin besar dukungan yang diberikan oleh butir-butir item terhadap tes hasil belajar maka tes tersebut akan semakin dapat menunjukkan kemantapannya. Item tes hasil belajar dapat dikatakan valid apabila skor-skor pada butir item yang bersangkutan memiliki kesesuaian arah dengan skor totalnya. Atau dengan kata lain memilki korelasi positif yang signifikan antara skor item dengan skor totalnya.
            Suatu butir item dikatakan valid jika skor item yang bersangkutan berkorelasi positif yang signifikan dengan skor total. Untuk menentukan valid tidaknya suatu butir item dapat digunakan teknik korelasi product moment dan korelasi point biserial.
     2.      Penyebab Invaliditas
Ancaman utama terhadap validitas instrumen adalah:
       a.       Ketakterwakilan konstruk
Menunjukkan bahwa tugas yang diukur dalam penilaian tidak mencakup dimensi penting dari konstruk. Oleh karena itu, hasil tes tersebut tidak mungkin untuk mengungkapkan kemampuan siswa sebenarnya dalam konstruk yang hendak diukur oleh instrumen;
b.      Penyimpangan keragaman konstruk berarti bahwa instrumen tersebut mengukur terlalu banyak variabel, dan kebanyakan variabel tersebut tidak relevan terhadap isi konstruk. Jenis penyimpangan validitas seperti ini mencakup dua bentuk, yaitu penyimpangan kemudahan konstruk (Construct irrelevant easiness) dan penyimpangan kesukaran konstruk (Construct irrelevant difficulty).
Penyimpangan kemudahan konstruk terjadi ketika faktor-faktor luar seperti kata-kata kunci atau bentuk instrumen memungkinkan seseorang untuk menjawab benar dengan cara yang tidak sesuai dengan konstruk yang diukur, dan penyimpangan kesukaran konstruk terjadi bila aspek-aspek luar dari tugas membuat tingkat kesukaran tugas tidak sejalan terhadap sebagian atau keseluruhan anggota kelompok.
Sementara bila terjadi penyimpangan keragaman konstruk yang pertama menyebabkan seseorang memperoleh skor yang lebih tinggi dibanding dengan kemampuan yang sebenarnya, dan terjadinya penyimpangan keragaman konstruk yang kedua menyebabkan seseorang memperoleh skor yang lebih rendah dibanding dengan kemampuan yang sebenarnya
       c.       Reliabilitas
Reliabilitas instrumen adalah keadaan instrumen yang menunjukkan hasil pengukuran yang reliable (tidak berubah-ubah, konsisten). Instrumen yang reliable adalah instrumen yang apabila digunakan untuk mengukur subyek atau objek yang sama pada waktu yang berbeda dan pengukuran dilakukan oleh orang yang berbeda hasilnya tetap sama.
Beberapa faktor penting yang mempengaruhi reliabilitas suatu tes yaitu:

  1.        . Kemampuan peserta tes atau subjek uji coba. Makin heterogen atau makin berbeda kemampuan peserta tes makin tinggi reliabilitas tes.
  2.         Semakin besar jumlah peserta tes semakin besar reliabilitas, karena semakin banyak peserta tes maka semakin beragam kemampuannya.
  3.         Panjang pendeknya tes. Jumlah item tes yang banyak dengan mengkaji beberapa tujuan akan lebih reliable dibandingkan dengan jumlah item yang sedikit, karena akan lebih representatif. Namun jumlah item tes yang terlalu banyak akan melelahkan dan mengganggu konsentrasi sehingga hasil yang diperoleh tidak tepat lagi.
  4.          Evaluasi yang subjektif juga akan menurunkan reliabilitas.
  5.           Hal yang berhubungan dengan penyelenggaraan tes.
Adanya hal-hal yang mempengaruhi hasil tes ini semua, secara tidak langsung akan mempengaruhi reliabilitas soal tes.
Reliabilitas instrumen dinyatakan dengan koefisien reliabilitas. Instrumen yang reliable adalah instrumen yang memiliki koefisien reliabilitas minimal 0,70. Sebaiknya koefisien reliabilitas instrumen 0,80 atau lebih. Koefisien reliabilitas instrumen dihitung dengan menggunakan rumus tertentu.
     3.      Analisis butir tes.
Menurut Thorndike & Hagen, analisis terhadap butir tes yang telah dijawab siswa suatu kelas mempunyai dua tujuan, yakni:
       a.       Jawaban-jawaban soal-soal tersebut merupakan informasi diagnosis untuk meneliti pelajaran dari kelas itu dan kegagalan-kegagalan belajarnya, serta selanjutnya untuk membimbing kea rah cara belajar yang baik, dan
       b.      Jawaban terhadap soal-soal dan perbaikan soal-soal yang didasarkan atas jawaban-jawaban tersebut merupakan dasar bagi penyiapan tes-tes yang lebih baik.
Analisis butir tes bertujuan untuk mengidentifikasi butir-butir manakah yang termasuk dalam kategori baik, kurang baik, dan jelek. Analisis butir tes memungkinkan kita memperoleh informasi mengenai baik tidaknya suatu butir, sekaligus memperoleh petunjuk untuk melakukan perbaikan.
Penganalisaan terhadap Butir Soal
   1. Teknik Analisa Derajat Kesukaran Soal
Analisis tingkat kesukaran soal yaitu mengkaji soal-soal tes dari segi kesulitannya sehingga dapat diperoleh soal-soal mana yang termasuk mudah, sedang, dan sukar. Tingkat kesukaran soal dipandang dari kesanggupan atau kemampuan siswa dalam menjawab, bukan dilihat dari sudut guru sebagai pembuat soal. Persoalan yang penting dalam melakukan analisis tingkat kesukaran soal adalah penentuan proporsi dan kriteria soal yang termasuk mudah, sedang dan sukar.Tingkat kesukaran soal adalah peluang untuk menjawab benar suatu soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks.
Bermutu atau tidaknya butir-butir item tes hasil belajar pertama-tama dapat diketahui dari derajat kesukaran atau taraf kesulitan yang dimiliki oleh masing-masing butir item tersebut. Butir-butir item tes hasil belajar dapat dinyatakan sebagai butir-butir item yang baik apabila butir-butir item tersebut tidak terlalu sukar dan tidak pula terlalu mudah dengan kata lain derajat kesukaran item itu adalah sedang atau cukup. Bertitik tolak dari pernyataan tersebut di atas maka butir-butir item hasil belajar di mana seluruh testee tidak dapat menjawab dengan betul (karena terlalu sukar) tidak dapat disebut sebagai item yang baik.
Demikian pula sebaliknya, butir-butir item tes hasil belajar dimana seluruh testee dapat menjawab dengan betul (karena terlalu mudah) juga tidak dapat dimasukkan dalam kategori item yang baik
2. Teknik Analisis Daya Pembeda Item
            Daya pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk dapat membedakan (mendiskriminasi) antara kemampuan tinggi dan rendah.
            Daya pembeda item itu penting sekali bagi salah satu dasar untuk menyusun butir item tes hasil belajar adalah adanya anggapan.Tes dikatakan tidak memiliki daya pembeda apabila tes tersebut, jika diujikan kepada anak berprestasi tinggi, hasilnya rendah tetapi bila diberikan kepada anak yang lemah hasilnya lebih tinggi. Atau bila diberikan kepada kedua kategori siswa tersebut hasilnya sama saja.
3.  Teknik Analisis Fungsi Distraktor
            Distraktor adalah pengecoh, jawaban-jawaban yang mengecoh. Ini bertujuan menarik untuk menjawabnya padahal itu salah. Sebagai tindak lanjut atas hasil penganalisaan terhadap fungsi distraktor tersebut maka distraktor yang sudah menjalankan fungsinya dengan baik dapat dipakai lagi pada tesnya.
            Tujuan utama pemasangan distraktor pada setiap butir itu adalah, agar dari sekian banyak testee yang mengikuti tes hasil belajar ada yang tertarik atau terangsang untuk memilihnya, sebab mereka menyangka bahwa distraktor yang mereka pilih itu merupakan jawaban yang betul.
Analisis Butir Soal Secara Kualitatif
1. Pengertian
            Pada prinsipnya analisis butir soal secara kualitatif dilaksanakan berdasarkan kaidah penulisan soal (tes tertulis, perbuatan, dan sikap). Penelaahan ini biasanya dilakukan sebelum soal digunakan/diujikan. Aspek yang diperhatikan di dalam penelaahan secara kualitatif ini adalah setiap soal ditelaah dari segi materi, konstruksi, bahasa/budaya, dan kunci jawaban/pedoman penskorannya. Dalam melakukan penelaahan setiap butir soal, penelaah perlu mempersiapkan bahan-bahan penunjang seperti: (1) kisi-kisi tes, (2) kurikulum yang digunakan, (3) buku sumber, dan (4) kamus bahasa Indonesia.
2. Teknik Analisis Secara Kualitatif
            secara kualitatif, diantaranya adalah teknik moderator dan teknik panel. Teknik moderator merupakan teknik berdiskusi yang di dalamnya terdapat satu orang sebagai penengah. Berdasarkan teknik ini, setiap butir soal didiskusikan secara bersama-sama dengan beberapa ahli seperti guru yang mengajarkan materi, ahli materi, penyusun/pengembang kurikulum, ahli penilaian, ahli bahasa, berlatar belakang psikologi. Teknik ini sangat baik karena setiap butir soal dilihat secara bersama-sama berdasarkan kaidah penulisannya. Di samping itu, para penelaah dipersilakan mengomentari/ memperbaiki berdasarkan ilmu yang dimilikinya. Setiap komentar/masukan dari peserta diskusi dicatat oleh notulis. Setiap butir soal dapat dituntaskan secara bersama-sama, perbaikannya seperti apa. Namun, kelemahan teknik ini adalah memerlukan waktu lama untuk rnendiskusikan setiap satu butir soal.
            Teknik panel merupakan suatu teknik menelaah butir soal yang setiap butir soalnya ditelaah berdasarkan kaidah penulisan butir soal, yaitu ditelaah dari segi materi, konstruksi, bahasa/budaya, kebenaran kunci jawaban/pedoman penskorannya yang dilakukan oleh beberapa penelaah. Caranya adalah beberapa penelaah diberikan: butir-butir soal yang akan ditelaah, format penelaahan, dan pedoman penilaian/ penelaahannya. Pada tahap awal para penelaah diberikan pengarahan, kemudian tahap berikutnya para penelaah berkerja sendiri-sendiri di tempat yang tidak sama. Para penelaah dipersilakan memperbaiki langsung pada teks soal dan memberikan komentarnya serta memberikan nilai pada setiap butir soalnya yang kriterianya adalah: baik, diperbaiki, atau diganti.
Analisis Butir Soal Secara Kuantitatif
1. Pengertian
            Penelaahan soal secara kuantitatif maksudnya adalah penelaahan butir soal didasarkan pada data empirik dari butir soal yang bersangkutan. Data empirik ini diperoleh dari soal yang telah diujikan. 
2. Analisis Butir Soal
            Ada dua pendekatan dalam analisis secara kuantitatif, yaitu pendekatan secara klasik dan modern.
      1.      Klasik
Analisis butir soal secara klasik adalah proses penelaahan butir soal melalui informasi dari jawaban peserta didik guna meningkatkan mutu butir soal yang bersangkutan dengan menggunakan teori tes klasik. Kelebihan analisis butir soal secara klasik adalah murah, dapat dilaksanakan sehari-hari dengan cepat menggunakan komputer, murah, sederhana, familier dan dapat menggunakan data dari beberapa peserta didik atau sampel kecil (Millman dan Greene, 1993: 358). Adapun proses analisisnya sudah banyak dilaksanakan para guru di sekolah seperti beberapa contoh di bawah ini.
      2.      Modern
Analisis butir soal secara modern yaitu penelaahan butir soal dengan menggunakan Item Response Theory (IRT) atau teori jawaban butir soal. Teori ini merupakan suatu teori yang menggunakan fungsi matematika untuk menghubungkan antara peluang menjawab benar suatu scal dengan kemampuan siswa. Nama lain IRT adalah latent trait theory (LTT), atau characteristics curve theory (ICC). Asal mula IRT adalah kombinasi suatu versi hukum phi-gamma dengan suatu analisis faktor butir soal (item factor analisis) kemudian bernama Teori Trait Latent (Latent Trait Theory), kemudian sekarang secara umum dikenal menjadi teori jawaban butir sapoal (Item Response Theory) (McDonald, 1999: 8). Dalam subbab ini akan disajikan kelebihan analisis secara IRT dan kalibrasi butir soal dan pengukuran kemampuan orang.

Kesimpulan
            Analisis butir soal merupakan suatu prosedur yang sistematis, yang akan memberikan informasi-informasi yang sangat khusus terhadap butir tes yang akan kita susun. Analisis butir soal pada dasarnya bertujuan untuk mengetahui apakah setiap item soal benar-benar baik, sehingga diperlukan analisis terhadapnya.
            Analisis butir tes bertujuan untuk mengidentifikasi butir-butir manakah yang termasuk dalam kategori baik, kurang baik, dan jelek.
            Validitas merupakan produk dari validasi. Validasi adalah suatu proses yang dilakukan oleh penyusun atau pengguna instrumen untuk mengumpulkan data secara empiris guna mendukung kesimpulan yang dihasilkan oleh skor instrumen.
            Reliabilitas instrumen adalah keadaan instrumen yang menunjukkan hasil pengukuran yang reliable (tidak berubah-ubah, konsisten).
            Penganalisisan terhadap butir-butir soal dapat dilakukan dari tiga segi yaitu:
1. Teknik analisis kesukaran item soal
2. Teknik analisis daya pembeda
3. Teknik analisis fungsi distraktor
Saran
Analisis butir soal hendaknya kita lakukan untuk dapat mengidentifikasi butir-butir tes secara baik dan tepat dan dapat memahami informasi yang diperoleh untuk melakukan perbaikan.


Sumber:
Aiken, Lewis R. (1994). Psychological Testing and Assessment,(Eight Edition), Boston: Allyn and Bacon.
Anastasi. Anne and Urbina, Susana. (1997). Psicoholological Testing. (Seventh Edition). New Jersey: Prentice-Hall, Inc.
Assessment Systems Corporation. (1984). User's Manual for the MiicroCat Testing System, USA.
Atkinson, John W. (1978). Personality Motivation and Achievemcnt. Sashington. Hemisphere Publishing Corporation.
Bejar, Isaac I. (1983). Introduction to Item Response Theory and Their- Assumptions. Hambleton, Ronald K. (Editor). Applications of Item Response Theory. Canada: Educational Research Institute of British Columbia.
Bruning, James L. and Kintz, B. L. (1987). Computational Handbook of Statistics. Third Edition. Illinois: Scott, Foresman and Company.

File Word-nya bisa unduh di sini                 Makalah Analisis Butir Soal
File Powerpoint-nya bisa unduh di sini Presentasi Analisis Butir Soal

Catatan:
Cara download file-nya bisa di lihat disiniTutorial Download File Menggunakan Desktop atau Tutorial Download File Menggunakan Mobile Android atau bisa lihat langsung melalui video di samping..! 
.
.

0 komentar: