ANALISIS KUALITAS TES DAN BUTIR SOAL



MAKALAH
ANALISIS KUALITAS TES DAN BUTIR SOAL
Untuk Memenuhi Tugas Kuliah
Evaluasi Pembelajaran

Dosen Pengampu :
Hesty Puspitasari, M.Pd

Oleh :
1.      Arif Nur Fauzan                   (15108810017)
2.      Idang Ihza M             (15108810008)
3.      Moch. Lukman Hakim         (15108810031)
4.      Novi Wahyu N                       (15108810033)
 






FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
PRODI BAHASA INGGRIS
UNIVERSITAS ISLAM BALITAR
November 2017

BAB I
PENDAHULUAN

A.    Latar Belakang
Tes merupakan salah satu cara untuk mengevaluasi proses pembelajaran yang dianggap mampu memfasilitasi kebutuhan orang-orang di bidang pendidikan tentang perangkat atau alat yang mampu memberi gambaran tentang proses pembelajaran yang dilaksanakan. Untuk menghasilkan gambaran yang akurat, relevan dan sesuai dengan data yang sesungguhnya terjadi dilapangan membutuhkan tes yang berkualitas, oleh karena itu dibutuhkan analisis kualitas tes guna menciptakan kualitas tes yang benar-benar mampu melaksanakan tugasnya sebagai alat evaluasi. Analisis kualitas tes merupakan  suatu tahap yang harus ditempuh untuk mengetahui derajat kualitas suatu tes, baik tes secara keseluruhan maupun butir  soal yang menjadi bagian dari tes tersebut. Analisis kualitas tes digunakan untuk menjawab pertanyaan apakah tes sebagai alat ukur benar-benar mampu mengukur apa yang sebenarnya hendak diukur dan apakah tes tersebut dapat diandalkan dan berguna bagi dunia pendidikan.

B.     Rumusan Masalah
Adapun rumusan masalah yang diangkat dalam penulisan ini adalah:
a.       Bagaimana cara untuk melalukan analisis kualitas tes dan butir soal?
b.      Bagaimana aplikasi analisis kualitas tes dan butir soal pada dunia pendidikan?

C.    Tujuan
Penulisan ini bertujuan untuk mengetahui bagaimana cara melakukan analisis kualitas tes dan butir soal serta implementasinya dalam proses pembelajaran.




BAB II
PEMBAHASAN

A.    Pengertian Analisis Tes dan Butir Soal
Analisis tes dan butir soal merupakan suatu tahap yang harus ditempuh untuk mengetahui derajat kualitas suatu tes, baik tes secara keseluruhan maupun butir  soal yang menjadi bagian dari tes tersebut. Tes diharapkan dapat menggambarkan sample perilaku dan menghasilkan nilai yang objecktif serta akurat. tes hendaknya disusun sesuai dengan prinsip dan prosedur penyusunan tes. Para ahli banyak yang mengemukakan tentang karakteristik tersebut. R.L.Thorndike, dan H.P. Hagen (1977) mengemukakan, “there are many specific considerations entering into the evaluation of a test, but we shall consider them...under three main headings. These are, respectively , validity, reliability and practicality.”
B.     Tujuan Analisis Tes dan Butir Soal
Analisis tes dan butir soal bertujuan untuk:
a.       Mengetahui apakah tes atau soal yang digunakan untuk mengevaluasi sudah mampu mengukur apa yang sebenarnya ingin diukur melalui tes atau soal tersebut.
b.      Mengetahui sejauh mana data atau informasi yang dihasilkan oleh tes maupun butir soal dapat diandalkan.
c.       Mengetahui sejauh mana data yang dihasilkan oleh tes atau soal dapat bergunabagi proses pembelajaran.

C. ANALISIS KUALITAS TES DAN BUTIR SOAL
Analisis kualitas tes merupakan suatu tahap yang harus ditempuh untuk mengetahui derajat kualitas suatu tes, baik tes secara keseluruhan maupun butir soal yang menjadi bagian dari tes tersebut. Tes diharapkan dapat menggambarkan sample perilaku dan menghasilkan nilai yang objecktif serta akurat. tes hendaknya disusun sesuai dengan prinsip dan prosedur penyusunan tes. Para ahli banyak yang mengemukakan tentang karakteristik tersebut. R.L.Thorndike, dan H.P. Hagen (1977) mengemukakan, “there are many specific considerations entering into the evaluation of a test, but we shall consider them...under three main headings. These are, respectively , validity, reliability and practicality.”

1. Validitas
            Sebelum guru menggunakan suatu tes, hendaknya guru mengukur terlebih dahulu derajat validitasnya berdasarkan kriteria tertentu. Untuk melihat apakah tes tersebut valid (sahih), kita harus membandingkan skor peserta didik yang didapat dalam tes dengan skor yang dianggap sebagai nilai baku.
Ada dua unsur penting dalam validitas ini. Pertama, validitas menunjukkan suatu derajat, ada yang sempurna, ada yang sedang, dan ada pula yang rendah. Kedua validitas selalu dihubungkan dengan suatu outusan atau tujuan yang spesifik. Sebagaimana pendapat R.L. Thorndike dan H.P. Hagen (1977) bahwa “validity is always in relation to a specific decision or use”.Sementara itu, Gronlund (1985) mengemukakan ada tiga faktor yang mempengarauhi validitas hasil tes , yaitu “faktor instrumen evaluasi, faktor administrasi evaluasi dan penskoran , dan faktor dari jawaban peserta didik.”
1. Faktor instrumen evaluassi
Dalam mengembangkan instrumen evaluasi, seorang evaluator harus memperhatikan hal hal yang memperngaruhi validitas instrumen dan berkaitan dengan prosedur penyusunan instrumen, seperti silabus kisi kisi soal petunjuk mengerjakan soal dan pengisian lembar soal dan pengisian lembar jawaban, kunci jawaban, penggunaan kalimat efektif, bentuk alternatif jawaban , tingkat kesukaran, daya pembeda.
2. Faktor administrasi evaluasi dan penskoran
Dalam administrasi evaluasi dan penskoran, banyak sekali penyimpangan atau kekeliruan, seperti alokasi waktu untuk pengerjaan soal yang tidak proporsionals, memberkan banuan kesalahan penskoran, termasuk kondisi fisik dan psikis peserta didik yang kurang menguntungkan.
3.Faktor jawaban dari peserta didik
Dalam praktiknya, faktor jawaban peserta didik justru lebih banyak berpengaruh dari pada faktor sebelomnya. Faktor ini meliputi kecenderungan peserta didik untuk menjawab secara tepat, tapi tidak tepat, keinginan melakukan coba coba, dan penggunaan gaya bahasa tertentu dalam menjawab soal bentuk uraian.
Kerlinger (1986) mengemukaakn, validitas instrumen tidak cukup di tentukan oleh derajat ketepatan instrumen untuk mengukur apa yang seharusnya di ukur, tetapi perlu juga di lihat dari 3 keriteria yang laen, yaitu approprietness, meaningfullness, dan usefullness.
Appropriatness menunjukan kelayaan dari test sebagai instrumen yaitu seberapa jauh instrumen dapat menjangkau keragaman aspek prilaku peserta didik.
Meaningfullness menunjukan kemampuan instrumen dalam memberikan keseimbangan soal soal pengukurannya berdasarkan tingkat kepentingan dari setiap fenomena
Usefullnes to inferences menunjukan sensitif tidaknya instrumen dalam menangkap fenomena prilaku dan tingkat ketelitian yang di tunjukan dalam membuat kesimpulan.
1. Validitas Permukaan
Validitas ini menggunakan kriteria yang sangat sederhana, karena hanya melihat dari sisi muka atau tampang dari instrumen itu sendiri. Artinya, jika suatu tes secara sepintas telah dianggap baik untuk mengungkapkan fenomena yang akan diukur, maka tes tersebut dapat dikatakan memenuhi syarat validitas permukaan, sehingga tidak perlu lagi adanya judgement yang mendalam.
2. Validitas Isi
Sering digunakan dalam penilaian hasil belajar. Tujuan utamanya adalah untuk mengetahui sejauh mana peserta  didik menguasai materi pelajaran yang telah disampaikan dan perubahan-perubahan psikologis apa yang timbul pada diri peserta didik tersebut setelah mengalami proses pembelajaran tertentu.Validitas isi disebut pula validitas kurikuler berkenan dengan relevansi materi tes dengan kurikulum yang ditentukan atau validitas perumusan berkenaan dengan apakah apek dalam soal tercakup dalam apa yang hendak diukur.
3.      Validitas empiris
Validitas empiris dilakukan dengan pendekatan korelasi untuk mencari hubungan skor tes dengan kriteria tertentu. Validitas empiris dibagi menjadi 3, yaitu:
1.)    Validitas prediktif (Predictive validity) yang digunakan untuk meramalkan prestasi belajar peserta didik pada masa depan.
2.)    Validitas kongkuren (concurrent validity) digunakan untuk kriteria standar yang berlainan.
3.)    Validitas sejenis (congruent validity) untuk kriteria yang sejenis.
8 kriteria bahan bandingan berdasarkan pendapat Anastasi dalam Conny Semiawan Stamboel, yaitu:
1.)    Diferensiasi umur
2.)    Kemajuan akademis
3.)    Kriteria dalam Pelaksanaan Latihan Khusus
4.)    Kriteria dalam Pelaksanaan Kerja
5.)    Penilaian
6.)    Kelompok yang Bertentangan
7.)    Korelasi dengan tes lain
8.)    Konsistensi Internal
Contoh perhitungan korelasi:
1.)    Korelasi Product Moment dengan Angka Simpangan
keterangan:
r           = koefisien korelasi
∑xy     = jumlah produk x dan y
Langkah-langkah penyelesaian:
-          Membuat table persiapan
No.
X
Y
x
Y
x2
y2
Xy








-          Memasukan nilai masing-masing mata pelajaran X dan Y
-          Jumlahkan seluruh nilai dan hitung rata-rata masing-masing variable
-          Isi kolom x dengan nilai tiap peserta pada mata pelajaran X dikurangi dengan nilai rata-rata mata pelajaran X
-          Isi kolom x dengan nilai tiap peserta pada mata pelajaran Y dikurangi dengan nilai rata-rata mata pelajaran Y
-          Cari x2 dengan mengkuadratkan nilai pada kolom x
-          Cari y2 dengan mengkuadratkan nilai pada kolom y
-          Hitung xy dengan mengalikan nilai pada kolom x dan nilai pada kolom y
Korelasi product-moment juga dapat dilakukan dengan menggunakan angka kasar, dengan rumus:

2.)    Korelasi Perbedaan Peringkat (Rank Differences Correlation)
keterangan:
r                       = koefisien korelasi
1 dan 6            = bilangan tetap
D                                 = perbedaan antara dua peringkat atau rank
n                      = jumlah sampel
Langkah-langkah:
-          Cari peringkat dari tiap-tiapmata pelajaran dengan mengurutkan nilai-nilai dari yang terbesar sampai yang terkecil.
-          Jika terdapat nilai yang sama, maka jumlahkan nilai peringkat pertama dengan kedua lalu bagi dua, maka kedua orang tersebut memiliki peringkat yang sama.
-          Cari perbedaan peringkat dengan mengurangkan peringkat mata pelajaran X dengan Y
-          Perbedaan peringkat kemudian dikuadratkan.
3.)     Teknik Diagram Pencar (Scatter Diagram)
Dalam statistika koefisien korelasi dinotasikan dengan “r” dimana -1,00 ≤ r ≥ 1,00,  r = +1,00 artinya korelasi sempurna positif dan r = -1,00 artinya korelasi sempurna negative. Untuk menafsirkan koefisien korelasi dapat menggunakan criteria berikut:
0,81 – 1,00      = sangat tinggi
0,61 – 0,80      = tinggi
0,41 – 0,60      = cukup
0,21 – 0,40      = rendah
0,00 – 0,20      = sangat rendah


d.      Validitas Konstruk
Valditas konstruk merupakan konsep yang dapat diobservasi dan dapat diukur, validitas konstruk dikenal juga dengan istilah validitas logis dan digunakan dalam tes-tes psikologi untuk mengukur gejala perilaku yang abstrak. Validitas konstruk digunakan untuk mengetahui sejauh mana tes dapat mengobservasi dan mengukur fungsi psikologis.
e.       Validitas Faktor
Penilaian hasil belajar kerap menggunakan pengukuran atas suatu variable yang terdiri dari beberapa faktor yang diperoleh dari indicator. Validitas faktor dapat dihitung dengan menghitung homogenitas skor setiap faktor dengan total skor dan antara skor faktor satu dengan lainnya.

D.    Reliabilitas
Reliabilitas merupakan derajat konsistensi suatu instrument. Suatu tes dapat dikatakan reliable apabila selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada kesempatan yang berbeda. Berikut ini merupakan empat factor yang mempengaruhi reliabilitas, yaitu:
a.         Panjang tes (Length of Test)
b.         Sebaran skor (spread of scores)
c.         Tingkat kesukaran (Difficulties Index)
d.         Obyektifitas
Menurut perhitungan product Moment ada 3 macam reliabilitas, yaitu:
a.       Koefisien stabilitas
Koefisien stabilitas merupakan jenis reliabilitas yang menggunakan teknik test and retest yaitu memberikan tes kepada sekelompok individu kemudian mengulang tes yang sama pada kelompok yang sama di waktu yang berbeda.
b.      Koefisien Ekuivalen
Koefisien ekuivalen dilakukan dengan mengkorelasikan tes yang paralel pada kelompok yang sama waktu yang sama dengan syarat kedua tes tersebut memiliki criteria, jumlah, isi, corak, tingkat kesukaran, petunjuk pengerjaan dan waktu pengerjaan yang sama.
c.       Koefisien Konsistensi Internal
Koefisien konsistensi internal merupakan reliabilitas yang didapat dari mengkorelasikan dua buah tes dari kelompok yang sama tetapi diambil dari butir-butir yang berbeda namun jumlahnya sama (genap dengan ganjil atau acak)


Rumus Spearman Brown
Rumus Kuder Richardson
Keterangan
P    = proporsi peserta didik yang menjawab betul dari suatu butir soal
Q   = 1-p
K   = jumlah butir soal


Teknik Koefisien Alpha

E.     Kepraktisan
Kepraktisan berarti kemudahan baik dalam hal persiapan, penggunaan, mengolahan, penafsiran maupun pengadminitrasian. Berikut ini merupakan faktor-faktor yang mempengaruhi kepraktisan, yaitu:
a.       Kemudahan mengadministrasi
b.      Waktu yang disediakan untuk melancarkan evaluasi
c.       Kemudahan menskor
d.      Kemudahan intrepretasi danaplikasi
e.       Tersedianya bentuk instrument evaluasi yang ekuivalen.

F.     Analisis Butir Soal
a.       Tingkat Kesukaran
1.)    Soal bentuk objektif
Menggunakan rumus tingkat kesukaran
Keterangan:
WL      = jumlah peserta didik yang menjawab salah dari kelompok bawah
WH     = jumlah peserta didik yang menjawab salah adri kelompok atas
nL        = jumlah kelompok bawah
nH       = jumlah kelompok atas
Langkah-langkah
-          Menyusun lembar jawaban dari skor tertinggi sampai terendah
-          Menyisihkn 27% dari kelompok atas dan bawah
-          Membuat tabel untuk mengetahui jawaban benar (+) salah (-)
Kriteria penafsiran tingkat kesukaran soal:
-          ≤ 27%                    = mudah
-          27% - 72%            = sedang
-          ≥ 72%                    = sukar
2.)    Soal bentuk uraian
Menghitung tingkat kesukaran soal bentuk uraian adalah dengan menghitung persentase peserta didik yang gagal menjawab benar atau dibawah batas lulus
b.      Daya Pembeda
Perhitungan daya pembeda adalah peengukuran sejauh mana suatu butir soal mampu membedakan peserta didik yang  belum atau kurang mengasaui kompetensi.
Keterangan:
DP = daya pembeda
n = 27% x N
Kriteria Daya pembeda
·         0,40 and up           = very good items
·          0,30 – 0,39            = reasonably good
·          0,20 – 0,30            = marginal items
·         Below 0,19            = poor items
1.)      Menghitung Signifikansi Daya Pembeda  Soal Objektif
-          Membuat table persiapan
-          Menghitung jumlah WL dan WH
-          Menguranngkan WL dengan WH
-          Menambahkan WL dengan WH
-          Membandingkan nilai WL-WH dengan nilai table signifikansi DP
2.)      Menghitung Signifikansi Daya Pembeda Soal Uraian

G.    Analisis Pengecoh
Indeks pengecoh:
Keterangan:
IP        = Indeks pengecoh
P          = jumlah peserta didik yang memilih pengecoh
N         = jumlah peserta didik yang ikut tes
B         = jumlah peserta didik yang menjawab benar
n          = jumlah opsi
1          = bilangan tetap
Adapun kualitas pengecoh berdasarkan indeksnya adalah:
            76% - 125%                                        = sangat baik
            51% -75% atau 126% - 150%             = baik
            26%- 50% atau 151% - 175%             = kurang baik
            0% - 25% atau 176% - 200%              = jelek
            Lebih dari 200%                                 = sangat jelek
H.    Analisis Homogenitas Soal
Homogentias diketahui dengan menghitung koefisien korelasi antara skor tiap butir  dengan skor total. Salah satu teknik korelasi yang dapat digunakan adalah korelasi product moment atau korelasi point biserial.


I.       Efektivitas Fungsi Opsi
Langkah-langkah:
a.       Menentukan jumlan peserta didik
b.      Menentukan jumlah sampel kelompok atas danbawah
c.       Membuat table pengujian efektivitas
d.      Menghitung jumlah alternative jawaban yang diipilih peserta didik
e.       Menentukan efektivitas fungsi opsi dengan criteria:
1.)    Opsi kunci
-          Jumlah pemilih kelompok atas dan bawah antara 25% - 75%

Keterangan:
∑PKA       = jumlah pemilih kelompok atas
∑PKB       = jumlah pemilih kelompok bawah
N1              = jumlah sampel kelompok atas
N2              = jumlah sampel kelompok bawah
-          Jumlah pemilih kelompok atas harus lebih banyak dari jumlah pemilih kelompok bawah
2.)    Untuk opsi pengecoh
-          Jumlah pemilih kelompok atas dan bawah tidak kurang dari:
25%
Keterangan:
d                = jumlah opsi pengecoh
Ka             = kelompok atas
Kb             = kelompok bawah
-          Jumlah pemilih kelompok bawah harus lebih besar daripada kelompok atas.



BAB III
KESIMPULAN

Analisis soal bertujuan untuk mengadakan identifikasi soal-soal yang baik, kurang baik, dan soal yang jelek. Dengan anlisis soal dapat diperoleh informasi tentang kejelekan sebuah soal dan petunjuk untuk mengadakan perbaikan. Untuk menghitung tingkat kesukaran soal bentuk objektif dapat digunakan dengan cara menggunakan rumus tingkat kesukaran (TK):
TK = (WL+WH) x 100%
(nL + nH)
Cara menghitung tingkat kesukaran untuk soal bentuk uraian adalah menghitung berapa persen peserta didik yang gagal menjawab benar atau ada dibawah batas lulus untuk tiap-tiap soal. Perhitungan daya pembeda adalah pengukuran sejauh mana suatu butir soal mampu membedakan peserta didik yang sudah menguasai kompetensi dengan peserta didik yang belum/kurang menguasai kompetensi berdasarkan kriteria tertentu. Validitas adalah suatu konsep yang berkaitan dengan sejauh mana tes telah mengukur apa yang seharusnya diukur. Dan Reliabilitas adalah tingkat atau derajat konsistensi dari suatu instrumen. Suatu tes dapat dikatakan reliabel jika selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada waktu atau kesempatan yang berbeda.












DAFTAR PUSTAKA
 Arifin, Zainal. 2010. Evaluasi Pembelajaran. Bandung: PT.Remaja Rosdakarya.
 Arikunto, Suharsimi. 2009. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.

Komentar

Postingan populer dari blog ini

TEKNIK PENGOLAHAN HASIL TEST

PENGEMBANGAN INSTRUMEN EVALUASI NON-TEST