ANALISIS KUALITAS TES DAN BUTIR SOAL
MAKALAH
ANALISIS
KUALITAS TES DAN BUTIR SOAL
Untuk Memenuhi Tugas
Kuliah
Evaluasi Pembelajaran
Dosen Pengampu :
Hesty Puspitasari, M.Pd
Oleh
:
1. Arif Nur Fauzan (15108810017)
3. Moch. Lukman Hakim (15108810031)
4. Novi Wahyu N (15108810033)
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
PRODI BAHASA INGGRIS
UNIVERSITAS ISLAM BALITAR
November 2017
BAB I
PENDAHULUAN
A. Latar Belakang
Tes merupakan salah satu cara untuk
mengevaluasi proses pembelajaran yang dianggap mampu memfasilitasi kebutuhan
orang-orang di bidang pendidikan tentang perangkat atau alat yang mampu memberi
gambaran tentang proses pembelajaran yang dilaksanakan. Untuk menghasilkan
gambaran yang akurat, relevan dan sesuai dengan data yang sesungguhnya terjadi
dilapangan membutuhkan tes yang berkualitas, oleh karena itu dibutuhkan
analisis kualitas tes guna menciptakan kualitas tes yang benar-benar mampu
melaksanakan tugasnya sebagai alat evaluasi. Analisis kualitas tes
merupakan suatu tahap yang harus ditempuh untuk mengetahui derajat
kualitas suatu tes, baik tes secara keseluruhan maupun butir soal yang
menjadi bagian dari tes tersebut. Analisis kualitas tes digunakan untuk
menjawab pertanyaan apakah tes sebagai alat ukur benar-benar mampu mengukur apa
yang sebenarnya hendak diukur dan apakah tes tersebut dapat diandalkan dan
berguna bagi dunia pendidikan.
B. Rumusan
Masalah
Adapun rumusan masalah yang diangkat dalam penulisan ini
adalah:
a. Bagaimana cara untuk
melalukan analisis kualitas tes dan butir soal?
b. Bagaimana aplikasi analisis
kualitas tes dan butir soal pada dunia pendidikan?
C. Tujuan
Penulisan ini bertujuan untuk mengetahui bagaimana cara
melakukan analisis kualitas tes dan butir soal serta implementasinya dalam
proses pembelajaran.
BAB II
PEMBAHASAN
A. Pengertian
Analisis Tes dan Butir Soal
Analisis
tes dan butir soal merupakan suatu tahap yang harus ditempuh untuk mengetahui
derajat kualitas suatu tes, baik tes secara keseluruhan maupun butir soal
yang menjadi bagian dari tes tersebut. Tes diharapkan dapat
menggambarkan sample perilaku dan menghasilkan nilai yang objecktif serta
akurat. tes hendaknya disusun sesuai dengan prinsip dan prosedur penyusunan
tes. Para ahli banyak yang mengemukakan tentang karakteristik tersebut.
R.L.Thorndike, dan H.P. Hagen (1977) mengemukakan, “there are many specific
considerations entering into the evaluation of a test, but we shall consider
them...under three main headings. These are, respectively , validity,
reliability and practicality.”
B. Tujuan
Analisis Tes dan Butir Soal
Analisis tes dan butir soal
bertujuan untuk:
a. Mengetahui apakah tes
atau soal yang digunakan untuk mengevaluasi sudah mampu mengukur apa yang
sebenarnya ingin diukur melalui tes atau soal tersebut.
b. Mengetahui sejauh mana data
atau informasi yang dihasilkan oleh tes maupun butir soal dapat diandalkan.
c. Mengetahui sejauh
mana data yang dihasilkan oleh tes atau soal dapat bergunabagi proses
pembelajaran.
C.
ANALISIS KUALITAS TES DAN BUTIR SOAL
Analisis kualitas tes merupakan
suatu tahap yang harus ditempuh untuk mengetahui derajat kualitas suatu tes,
baik tes secara keseluruhan maupun butir soal yang menjadi bagian dari tes
tersebut. Tes diharapkan dapat menggambarkan sample perilaku dan menghasilkan
nilai yang objecktif serta akurat. tes hendaknya disusun sesuai dengan prinsip
dan prosedur penyusunan tes. Para ahli banyak yang mengemukakan tentang
karakteristik tersebut. R.L.Thorndike, dan H.P. Hagen (1977) mengemukakan,
“there are many specific considerations entering into the evaluation of a test,
but we shall consider them...under three main headings. These are, respectively
, validity, reliability and practicality.”
1. Validitas
Sebelum
guru menggunakan suatu tes, hendaknya guru mengukur terlebih dahulu derajat
validitasnya berdasarkan kriteria tertentu. Untuk melihat apakah tes tersebut
valid (sahih), kita harus membandingkan skor peserta didik yang didapat dalam tes
dengan skor yang dianggap sebagai nilai baku.
Ada dua unsur penting dalam
validitas ini. Pertama, validitas menunjukkan suatu derajat, ada yang sempurna,
ada yang sedang, dan ada pula yang rendah. Kedua validitas selalu dihubungkan
dengan suatu outusan atau tujuan yang spesifik. Sebagaimana pendapat R.L.
Thorndike dan H.P. Hagen (1977) bahwa “validity is always in relation to a
specific decision or use”.Sementara itu, Gronlund (1985) mengemukakan ada tiga
faktor yang mempengarauhi validitas hasil tes , yaitu “faktor instrumen
evaluasi, faktor administrasi evaluasi dan penskoran , dan faktor dari jawaban
peserta didik.”
1. Faktor instrumen evaluassi
Dalam mengembangkan instrumen
evaluasi, seorang evaluator harus memperhatikan hal hal yang memperngaruhi
validitas instrumen dan berkaitan dengan prosedur penyusunan instrumen, seperti
silabus kisi kisi soal petunjuk mengerjakan soal dan pengisian lembar soal dan
pengisian lembar jawaban, kunci jawaban, penggunaan kalimat efektif, bentuk
alternatif jawaban , tingkat kesukaran, daya pembeda.
2. Faktor administrasi evaluasi dan penskoran
Dalam administrasi evaluasi dan penskoran, banyak
sekali penyimpangan atau kekeliruan, seperti alokasi waktu untuk pengerjaan
soal yang tidak proporsionals, memberkan banuan kesalahan penskoran, termasuk
kondisi fisik dan psikis peserta didik yang kurang menguntungkan.
3.Faktor jawaban dari peserta didik
Dalam praktiknya, faktor jawaban
peserta didik justru lebih banyak berpengaruh dari pada faktor sebelomnya.
Faktor ini meliputi kecenderungan peserta didik untuk menjawab secara tepat,
tapi tidak tepat, keinginan melakukan coba coba, dan penggunaan gaya bahasa
tertentu dalam menjawab soal bentuk uraian.
Kerlinger (1986)
mengemukaakn, validitas instrumen tidak cukup di tentukan oleh derajat
ketepatan instrumen untuk mengukur apa yang seharusnya di ukur, tetapi perlu
juga di lihat dari 3 keriteria yang laen, yaitu approprietness,
meaningfullness, dan usefullness.
Appropriatness
menunjukan kelayaan dari test sebagai instrumen yaitu seberapa jauh instrumen
dapat menjangkau keragaman aspek prilaku peserta didik.
Meaningfullness
menunjukan kemampuan instrumen dalam memberikan keseimbangan soal soal
pengukurannya berdasarkan tingkat kepentingan dari setiap fenomena
Usefullnes to
inferences menunjukan sensitif tidaknya instrumen dalam menangkap fenomena
prilaku dan tingkat ketelitian yang di tunjukan dalam membuat kesimpulan.
1. Validitas Permukaan
Validitas ini
menggunakan kriteria yang sangat sederhana, karena hanya melihat dari sisi muka
atau tampang dari instrumen itu sendiri. Artinya, jika suatu tes secara
sepintas telah dianggap baik untuk mengungkapkan fenomena yang akan diukur,
maka tes tersebut dapat dikatakan memenuhi syarat validitas permukaan, sehingga
tidak perlu lagi adanya judgement yang mendalam.
2. Validitas Isi
Sering digunakan
dalam penilaian hasil belajar. Tujuan utamanya adalah untuk mengetahui sejauh
mana peserta didik menguasai materi
pelajaran yang telah disampaikan dan perubahan-perubahan psikologis apa yang
timbul pada diri peserta didik tersebut setelah mengalami proses pembelajaran
tertentu.Validitas
isi disebut pula validitas kurikuler berkenan dengan relevansi materi tes
dengan kurikulum yang ditentukan atau validitas perumusan berkenaan dengan
apakah apek dalam soal tercakup dalam apa yang hendak diukur.
3. Validitas empiris
Validitas empiris dilakukan dengan
pendekatan korelasi untuk mencari hubungan skor tes dengan kriteria tertentu.
Validitas empiris dibagi menjadi 3, yaitu:
1.) Validitas prediktif (Predictive
validity) yang digunakan untuk meramalkan prestasi belajar peserta didik pada
masa depan.
2.) Validitas kongkuren (concurrent
validity) digunakan untuk kriteria standar yang berlainan.
3.) Validitas sejenis (congruent validity)
untuk kriteria yang sejenis.
8 kriteria bahan bandingan
berdasarkan pendapat Anastasi dalam Conny Semiawan Stamboel, yaitu:
1.) Diferensiasi umur
2.) Kemajuan akademis
3.) Kriteria dalam Pelaksanaan Latihan
Khusus
4.) Kriteria dalam Pelaksanaan Kerja
5.) Penilaian
6.) Kelompok yang Bertentangan
7.) Korelasi dengan tes lain
8.) Konsistensi Internal
Contoh perhitungan korelasi:
1.) Korelasi Product Moment dengan Angka
Simpangan
keterangan:
r =
koefisien korelasi
∑xy = jumlah produk x dan y
Langkah-langkah penyelesaian:
-
Membuat table persiapan
No.
|
X
|
Y
|
x
|
Y
|
x2
|
y2
|
Xy
|
- Memasukan
nilai masing-masing mata pelajaran X dan Y
-
Jumlahkan seluruh nilai dan hitung rata-rata masing-masing variable
- Isi
kolom x dengan nilai tiap peserta pada mata pelajaran X dikurangi dengan nilai
rata-rata mata pelajaran X
- Isi
kolom x dengan nilai tiap peserta pada mata pelajaran Y dikurangi dengan nilai
rata-rata mata pelajaran Y
- Cari
x2 dengan mengkuadratkan nilai pada kolom x
- Cari
y2 dengan mengkuadratkan nilai pada kolom y
-
Hitung xy dengan mengalikan nilai pada kolom x dan nilai pada kolom y
Korelasi product-moment juga dapat dilakukan dengan
menggunakan angka kasar, dengan rumus:
2.) Korelasi Perbedaan Peringkat (Rank
Differences Correlation)
keterangan:
r
= koefisien korelasi
1 dan
6 = bilangan
tetap
D = perbedaan antara dua
peringkat atau rank
n = jumlah sampel
Langkah-langkah:
- Cari
peringkat dari tiap-tiapmata pelajaran dengan mengurutkan nilai-nilai dari yang
terbesar sampai yang terkecil.
- Jika
terdapat nilai yang sama, maka jumlahkan nilai peringkat pertama dengan kedua
lalu bagi dua, maka kedua orang tersebut memiliki peringkat yang sama.
- Cari
perbedaan peringkat dengan mengurangkan peringkat mata pelajaran X dengan Y
-
Perbedaan peringkat kemudian dikuadratkan.
3.) Teknik Diagram Pencar (Scatter
Diagram)
Dalam statistika koefisien korelasi dinotasikan dengan “r”
dimana -1,00 ≤ r ≥ 1,00, r = +1,00 artinya korelasi sempurna positif dan
r = -1,00 artinya korelasi sempurna negative. Untuk menafsirkan koefisien
korelasi dapat menggunakan criteria berikut:
0,81 – 1,00 = sangat tinggi
0,61 – 0,80 = tinggi
0,41 – 0,60 = cukup
0,21 – 0,40 = rendah
0,00 – 0,20 = sangat rendah
d. Validitas Konstruk
Valditas konstruk merupakan konsep
yang dapat diobservasi dan dapat diukur, validitas konstruk dikenal juga dengan
istilah validitas logis dan digunakan dalam tes-tes psikologi untuk mengukur
gejala perilaku yang abstrak. Validitas konstruk digunakan untuk mengetahui
sejauh mana tes dapat mengobservasi dan mengukur fungsi psikologis.
e. Validitas Faktor
Penilaian hasil belajar kerap menggunakan pengukuran atas
suatu variable yang terdiri dari beberapa faktor yang diperoleh dari indicator.
Validitas faktor dapat dihitung dengan menghitung homogenitas skor setiap faktor
dengan total skor dan antara skor faktor satu dengan lainnya.
D. Reliabilitas
Reliabilitas merupakan derajat
konsistensi suatu instrument. Suatu tes dapat dikatakan reliable apabila selalu
memberikan hasil yang sama bila diteskan pada kelompok yang sama pada
kesempatan yang berbeda. Berikut ini merupakan empat factor yang mempengaruhi
reliabilitas, yaitu:
a. Panjang tes
(Length of Test)
b. Sebaran skor
(spread of scores)
c. Tingkat
kesukaran (Difficulties Index)
d. Obyektifitas
Menurut perhitungan product Moment ada 3 macam reliabilitas,
yaitu:
a. Koefisien stabilitas
Koefisien
stabilitas merupakan jenis reliabilitas yang menggunakan teknik test and retest
yaitu memberikan tes kepada sekelompok individu kemudian mengulang tes yang
sama pada kelompok yang sama di waktu yang berbeda.
b. Koefisien Ekuivalen
Koefisien ekuivalen dilakukan dengan
mengkorelasikan tes yang paralel pada kelompok yang sama waktu yang sama dengan
syarat kedua tes tersebut memiliki criteria, jumlah, isi, corak, tingkat
kesukaran, petunjuk pengerjaan dan waktu pengerjaan yang sama.
c. Koefisien Konsistensi Internal
Koefisien konsistensi internal merupakan reliabilitas yang
didapat dari mengkorelasikan dua buah tes dari kelompok yang sama tetapi
diambil dari butir-butir yang berbeda namun jumlahnya sama (genap dengan ganjil
atau acak)
Rumus Spearman Brown
Rumus Kuder Richardson
Keterangan
P = proporsi peserta didik yang menjawab
betul dari suatu butir soal
Q = 1-p
K = jumlah butir soal
Teknik Koefisien Alpha
E.
Kepraktisan
Kepraktisan berarti kemudahan baik
dalam hal persiapan, penggunaan, mengolahan, penafsiran maupun
pengadminitrasian. Berikut ini merupakan faktor-faktor yang mempengaruhi
kepraktisan, yaitu:
a. Kemudahan
mengadministrasi
b. Waktu yang disediakan untuk
melancarkan evaluasi
c. Kemudahan menskor
d. Kemudahan intrepretasi
danaplikasi
e. Tersedianya bentuk
instrument evaluasi yang ekuivalen.
F. Analisis
Butir Soal
a. Tingkat Kesukaran
1.) Soal bentuk objektif
Menggunakan rumus tingkat kesukaran
Keterangan:
WL = jumlah peserta didik yang
menjawab salah dari kelompok bawah
WH = jumlah peserta didik yang
menjawab salah adri kelompok atas
nL = jumlah
kelompok bawah
nH = jumlah kelompok
atas
Langkah-langkah
-
Menyusun lembar jawaban dari skor tertinggi sampai terendah
-
Menyisihkn 27% dari kelompok atas dan bawah
-
Membuat tabel untuk mengetahui jawaban benar (+) salah (-)
Kriteria penafsiran tingkat kesukaran soal:
- ≤
27%
= mudah
- 27%
- 72% =
sedang
- ≥
72%
= sukar
2.) Soal bentuk uraian
Menghitung tingkat kesukaran soal
bentuk uraian adalah dengan menghitung persentase peserta didik yang gagal
menjawab benar atau dibawah batas lulus
b. Daya Pembeda
Perhitungan daya pembeda adalah
peengukuran sejauh mana suatu butir soal mampu membedakan peserta didik
yang belum atau kurang mengasaui kompetensi.
Keterangan:
DP = daya pembeda
n = 27% x N
Kriteria Daya pembeda
·
0,40 and up
= very good items
·
0,30 –
0,39 =
reasonably good
·
0,20 –
0,30 =
marginal items
·
Below
0,19 = poor
items
1.) Menghitung Signifikansi
Daya Pembeda Soal Objektif
-
Membuat table persiapan
-
Menghitung jumlah WL dan WH
-
Menguranngkan WL dengan WH
-
Menambahkan WL dengan WH
-
Membandingkan nilai WL-WH dengan nilai table signifikansi DP
2.) Menghitung Signifikansi
Daya Pembeda Soal Uraian
G. Analisis
Pengecoh
Indeks pengecoh:
Keterangan:
IP = Indeks pengecoh
P = jumlah
peserta didik yang memilih pengecoh
N = jumlah
peserta didik yang ikut tes
B = jumlah
peserta didik yang menjawab benar
n =
jumlah opsi
1 =
bilangan tetap
Adapun kualitas pengecoh berdasarkan indeksnya adalah:
76% - 125%
= sangat baik
51% -75% atau 126% -
150% =
baik
26%- 50% atau 151% -
175% =
kurang baik
0% - 25% atau 176% -
200%
= jelek
Lebih dari
200%
= sangat jelek
H. Analisis
Homogenitas Soal
Homogentias diketahui dengan
menghitung koefisien korelasi antara skor tiap butir dengan skor total.
Salah satu teknik korelasi yang dapat digunakan adalah korelasi product moment
atau korelasi point biserial.
I.
Efektivitas Fungsi Opsi
Langkah-langkah:
a.
Menentukan jumlan peserta didik
b.
Menentukan jumlah sampel kelompok atas danbawah
c.
Membuat table pengujian efektivitas
d.
Menghitung jumlah alternative jawaban yang diipilih peserta didik
e.
Menentukan efektivitas fungsi opsi dengan criteria:
1.) Opsi kunci
-
Jumlah pemilih kelompok atas dan bawah antara 25% - 75%
Keterangan:
∑PKA = jumlah pemilih
kelompok atas
∑PKB = jumlah pemilih
kelompok bawah
N1
= jumlah sampel kelompok atas
N2
= jumlah sampel kelompok bawah
-
Jumlah pemilih kelompok atas harus lebih banyak dari jumlah pemilih kelompok
bawah
2.) Untuk opsi pengecoh
-
Jumlah pemilih kelompok atas dan bawah tidak kurang dari:
25%
Keterangan:
d
= jumlah opsi pengecoh
Ka
= kelompok atas
Kb
= kelompok bawah
-
Jumlah pemilih kelompok bawah harus lebih besar daripada kelompok atas.
BAB III
KESIMPULAN
Analisis
soal bertujuan untuk mengadakan identifikasi soal-soal yang baik, kurang baik,
dan soal yang jelek. Dengan anlisis soal dapat diperoleh informasi tentang
kejelekan sebuah soal dan petunjuk untuk mengadakan perbaikan. Untuk menghitung tingkat
kesukaran soal bentuk objektif dapat digunakan dengan cara menggunakan rumus
tingkat kesukaran (TK):
TK = (WL+WH) x
100%
(nL + nH)
Cara menghitung tingkat kesukaran untuk soal bentuk uraian
adalah menghitung berapa persen peserta didik yang gagal menjawab benar atau
ada dibawah batas lulus untuk tiap-tiap soal. Perhitungan daya pembeda adalah
pengukuran sejauh mana suatu butir soal mampu membedakan peserta didik yang
sudah menguasai kompetensi dengan peserta didik yang belum/kurang menguasai kompetensi berdasarkan
kriteria tertentu. Validitas
adalah suatu konsep yang berkaitan dengan sejauh mana tes telah mengukur apa
yang seharusnya diukur. Dan Reliabilitas
adalah tingkat atau derajat konsistensi dari suatu instrumen. Suatu tes dapat
dikatakan reliabel jika selalu memberikan hasil yang sama bila diteskan pada
kelompok yang sama pada waktu atau kesempatan yang berbeda.
DAFTAR PUSTAKA
Arifin, Zainal. 2010.
Evaluasi Pembelajaran. Bandung: PT.Remaja Rosdakarya.
Arikunto, Suharsimi.
2009. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.
Komentar
Posting Komentar