Validitas dan Reabilitas Tes

 


A.    Validalitas

Validalitas berkenaan dengan ketetapan alat penilaian terhadap konsep yang dinilai sehingga benar-benar menilai apa yang seharusnya dinilai. Contohnya menilai kemampuan siswa dalam matematika, dengan memberi soal yang panjang dan berbelit-belit sehingga sukar ditangkap maknanya. Akhirnya siswa tidak dapat menjawab karna tidak memahami pertanyaannya.[1]

Jika dikaitkan dengan evaluasi pembelajaran, maka alat tersebut tentu saja adalah instrumen yang digunakan dalam melakukan evaluasi. Instrumen dikatakan mengandung validitas yang baik jika mampu mengukur secara tepat mengukur yang hendak diukur, menilai apa yang hendak dinilai,  dan mengevaluasi yang hendak dievaluasi, dengan instrumen yang valid akan menghasilkan data yang valid juga.[2]


Secara garis besar ada dua macam validalitas, yaitu validitas logis, dan validitas empiris.

1.      Validitas logis

Istilah “validitas logis” mengandung kata “logis” berasal dari kata “logika” biasa juga disebut validitas rasional, atau analisis kuantitatif yaitu berupa penalaran atau penelaahan.[3]

Validitas logis addalah validitas yang berhubungan antara bahan dan isi tes. Bila ingin mengevaluasi pelajaran tertentu, maka untuk mengetahui validitas logis atau rasionalnya pertanyaan-pertanyaan itu dianalisis dan dicocokkan dengan pelajaran-pelajaran yang telah diberikan. [4]

 

2.      Validitas empiris

Istilah “validitas empiris” memuat kata “empiris” yang artinya adalah “pengalaman”. Sebuah tes dapat dikatakan memiliki validitas empiris apabila sudah diuji melalui pengalaman. Analisis soal secara kuantitatif menekankan pada analisis karakteristik internal tes melalui data yang diperoleh secara empiris. Karakteristik internal secara kuantitatif meliputi parameter tingkat kesukaran, daya pembeda, dan reabilitas.

Sebagai contoh sehari-hari, seseorang dapat diakui jujur oleh masyarakat apabila dalam pengalaman dibuktikan bahwa orang tersebut memang jujur. Contoh lain, seseorang dapat dikatakan kreatif apabila dari pengalaman dibuktikan bahwa orang tersebut telah menghasilkan ide-ide yang diakui banyak orang dan berbeda dengan hal-hal yang sudah ada.[5]

Ada empat macam validitas logis yang sering digunakan, yaitu validitas isi, validitas konstrak, validasi ramalan, dan validasi bandingan.

a.     Validitas isi

Validitas isi menunjuk suatu kondisi sebuah instrumen yang disusun berdasarkan materi pembelajaran yang dievaluasi. Sedangkan validitas konstrak merupakan sebuah instrumen yang menunjuk suatu kondisi instrumen yang disusun berdasarkan aspek-aspek kejiwaan yang seharusnya dievaluasi. [6]

 

Dalam pengertian lain, validasi isi merupakan derajat dimana sebuah tes evaluasi mengukur cakupan yang ingin diukur. Agar bisa mendapatkan validasi inti, ada dua aspek penting yang harus terpenuhi, yaitu : (1) valid dalam hal isinya dan (2) valid dalam teknik samplingnya. Valid dalam isi mencakup khususnya hal-hal yang berkaitan apakah item evaluasi itu menggambarkan pengukuran dalam cakupan yang ingin diukur.

Sedangkan valid dalam teknik sampling pada umumnya berkaitan dengan bagaimana baiknya suatu sampel tes mempresentasikan total cakupan isi.[7]

Sebuah tes dapat dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi yang diberikan. Sedangkan sebuah tes dikatakan memiliki validasi konstrak apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berpikir. Dengan kata lain, butir soal yang mengukur aspek berpikir sudah sesuai dengan aspek berpikir yang menjadi tujuan instruksional. [8]

 

b.    Validitas konstrak

Validitas konstrak merupakan derajat yang menunjukkan suatu tes mengukur sebuah konstruk sementara. Secara definisi, konstruk merupakan suatu sifat yang tidak dapat diobservasi, tetapi dapat dirasakan pengaruhnya melalui salah satu atau dua indra kita. Dengan demikian, konstruk merupakan temuan atau satu pendekatan untuk menerangkan tingkah laku. [9]

c.     Validasi ramalan

Validasi ramalan artinya adalah ketepatan suatu alat pengukur ditinjau dari kemampuan tes tersebut untuk meramalkan prestasi yang dicapai kemudian. Suatu tes dapat dikatakan memiliki nilai validasi ramalan yang tinggi, apabila hasil dari tes tersebut betul-betul meramalkan sukses atau tidaknya siswa tersebut dalam pelajaran yang akan datang. Dengan cara mencari korelasi antara nilai-nilai yang dicapai oleh siswa dalam tes tersebut dengan nilai-nilai yang dicapai kemudian.[10]

d.    Validitas bandingan

Kejituan suatu tes dilihat dari korelasinya terhadap kecakapan yang telah dimiliki saat ini secara rill. Validasi bandingan adalah ketika skor dalam suatu tes dihubungkan dengan skor lain yang telah dibuat. Validasi bandingan biasanya dilakukan dengan melibatkan antara skor pada tes  dengan skor yang telah baku atau kriteria tes yang sudah ada. Jika keofesian tinggi, berarti tes yang baru memiliki validitas konkuren yang baik. Dan jika sebaliknya, maka keofisien yang dihasilkan rendah.[11]

 

B.     Reabilitas

Menurut arti kata “reliabel” berarti “dapat dipercaya”. Berdasarkan arti kata tersebut,  maka instrumen yang reiabel adalah instrumen yang hasil pengukurannya dapat dipercaya. Kriteria instrumen yang dapat dipercaya adalah jika instrumen tersebut digunakan secara berulang-ulang, dan hasil pengukurannya tetap.[12]

Reabilitas dapat diukur  menggunakan tiga kriteria, yaitu ; Stabilitas, Dependabilitas, dan Prediktabilitas. Stabilitas menunjukkan keajengan suatu tes dalam mengukur gejala yang sama pada waktu yang berbeda. Dependabilitas menunjukkan kemantapan suatu tes atau seberapa jauh tes dapat diandalkan. Sedangkan prediktabilitas menunjukkan kemampuan tes untuk meramalkan hasil pada pengukuran gejala selanjutnya.[13]

Reabilitas dapat dicari dengan menggunakan dua cara, yaitu (1) mencari korelasi antara pengujian yang pertama dan ujian yang kedua dengan menggunakan tes yang sama. (2) membagi tes menjadi dua bagian, kemudian bagian yang satu dicari korelasinya dengan bagian yang lain.[14]

Menurut Gronlund, ada empat faktor yang dapat mempengaruhi reliabilitas, yaitu :

1.      Panjang tes

Panjang tes berarti banyak soal tes. Ada kecendrungan semakin panjang soal, maka akan akan lebih tinggi tingkat reliabilitas suatu tes. Karna semakin banyak soal, maka semakin banyak sampel yang diukur dan proposi jawaban benar semakin banyak, sehingga faktor menjawab dengan tebakan akan semakin rendah.

2.      Sebaran skor

Besarnya sebaran skor akan memuat tingkat reliabilitas menjadi lebih tinggi, karna keofisien reliabilitas yang lebih besar diperoleh ketika anak didik tetap pada posisi yang relatif sama pada satu pengujian kepengujian berikutnya.

3.      Tingkat kesukaran

Dalam penilaian yang mengguanakan pendekatan penilaian acuan norma (EAN), baik untuk soal yang mudah maupun sukar, cendrung menghasilkan reliabilitas yang rendah. Hal ini disebabkan karna antara hasil tes yang mudah dan sukar keduanya dalam sebaran skor yang terbatas. Tingkat kesukaran soal yang ideal untuk meningkatkan keofisien reliabilitas adalah soal yang menghasilkan sebaran skor berbentuk genta atau kurva normal.

4.      Objektivitas

Objektivitas ini menunjukkan adanya skor tes yang sama antara satu anak didik dengan anak didik yang lain. Jika anak didik memiliki kemampuan yang sama maka, akan memperoleh hasil yang sama pada saat mengerjakan tes yang sama.[15]

 



[1] Abdul Qodir , Evaluasi dan Penilaian Pembelajaran, hlm.153

[2] Haryanto, Evaluasi Pembelajaran (Konsep dan Manajemen), hlm. 142

[3] Abdul Qadir, hlm. 154

[4] Haryanto, hlm. 142

[5] Abdul Qadir, hlm. 156

[6]Abdul  Qadir, Evaluasi dan Penilaian Pembelajaran, hlm. 155

[7] Haryanto, Evaluasi Pembelajaran (Konsep dan Manajemen), hlm.

[8] Ibid, hlm.143

[9] Ibid, hlm. 143

[10]Nahjihah Ahmad, Buku Ajar Evaluasi Pembelajaran, hlm. 56

[11] Najihah Ahmad, Buku Ajar Evaluasi Pembelajaran, hlm. 56

[12] Arief Aulia Rahman dan Cut Eva Naysrah, Evaluasi Pembelajaran, hlm. 123

[13] Haryanto, Evaluasi dan Pembelajaran (Konsep dan Manajemen), hlm. 149

[14] Ibid

[15] Haryanto, Evaluasi dan Pembelajaran (Konsep dan Manajemen), hlm. 150

0 Komentar

Welcome Rosyiq Blogg