A. Validalitas
Validalitas berkenaan dengan ketetapan alat penilaian terhadap konsep yang
dinilai sehingga benar-benar menilai apa yang seharusnya dinilai. Contohnya
menilai kemampuan siswa dalam matematika, dengan memberi soal yang panjang dan
berbelit-belit sehingga sukar ditangkap maknanya. Akhirnya siswa tidak dapat
menjawab karna tidak memahami pertanyaannya.[1]
Jika dikaitkan dengan evaluasi pembelajaran, maka alat tersebut tentu saja
adalah instrumen yang digunakan dalam melakukan evaluasi. Instrumen dikatakan
mengandung validitas yang baik jika mampu mengukur secara tepat mengukur yang
hendak diukur, menilai apa yang hendak dinilai,
dan mengevaluasi yang hendak dievaluasi, dengan instrumen yang valid
akan menghasilkan data yang valid juga.[2]
Secara garis besar ada dua macam validalitas, yaitu validitas logis, dan
validitas empiris.
1. Validitas logis
Istilah “validitas logis” mengandung kata “logis” berasal dari kata
“logika” biasa juga disebut validitas rasional, atau analisis kuantitatif yaitu
berupa penalaran atau penelaahan.[3]
Validitas logis addalah validitas yang berhubungan antara bahan dan isi tes. Bila ingin mengevaluasi pelajaran tertentu, maka untuk mengetahui validitas logis atau rasionalnya pertanyaan-pertanyaan itu dianalisis dan dicocokkan dengan pelajaran-pelajaran yang telah diberikan. [4]
2. Validitas empiris
Istilah “validitas empiris” memuat kata “empiris” yang artinya adalah
“pengalaman”. Sebuah tes dapat dikatakan memiliki validitas empiris apabila
sudah diuji melalui pengalaman. Analisis soal secara kuantitatif menekankan
pada analisis karakteristik internal tes melalui data yang diperoleh secara
empiris. Karakteristik internal secara kuantitatif meliputi parameter tingkat
kesukaran, daya pembeda, dan reabilitas.
Sebagai contoh sehari-hari, seseorang dapat diakui jujur oleh masyarakat
apabila dalam pengalaman dibuktikan bahwa orang tersebut memang jujur. Contoh
lain, seseorang dapat dikatakan kreatif apabila dari pengalaman dibuktikan
bahwa orang tersebut telah menghasilkan ide-ide yang diakui banyak orang dan
berbeda dengan hal-hal yang sudah ada.[5]
Ada empat macam validitas logis yang sering digunakan, yaitu validitas isi,
validitas konstrak, validasi ramalan, dan validasi bandingan.
a. Validitas isi
Validitas isi menunjuk suatu kondisi sebuah instrumen yang disusun
berdasarkan materi pembelajaran yang dievaluasi. Sedangkan validitas konstrak
merupakan sebuah instrumen yang menunjuk suatu kondisi instrumen yang disusun
berdasarkan aspek-aspek kejiwaan yang seharusnya dievaluasi. [6]
Dalam pengertian lain, validasi
isi merupakan derajat dimana sebuah tes evaluasi mengukur cakupan yang ingin
diukur. Agar bisa mendapatkan validasi inti, ada dua aspek penting yang harus
terpenuhi, yaitu : (1) valid dalam hal isinya dan (2) valid dalam teknik
samplingnya. Valid dalam isi mencakup khususnya hal-hal yang berkaitan apakah
item evaluasi itu menggambarkan pengukuran dalam cakupan yang ingin diukur.
Sedangkan valid dalam teknik sampling pada umumnya berkaitan dengan
bagaimana baiknya suatu sampel tes mempresentasikan total cakupan isi.[7]
Sebuah tes dapat dikatakan
memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar
dengan materi yang diberikan. Sedangkan sebuah tes dikatakan memiliki validasi
konstrak apabila butir-butir soal yang membangun tes tersebut mengukur setiap
aspek berpikir. Dengan kata lain, butir soal yang mengukur aspek berpikir sudah
sesuai dengan aspek berpikir yang menjadi tujuan instruksional. [8]
b. Validitas konstrak
Validitas konstrak merupakan derajat yang menunjukkan suatu tes mengukur
sebuah konstruk sementara. Secara definisi, konstruk merupakan suatu sifat yang
tidak dapat diobservasi, tetapi dapat dirasakan pengaruhnya melalui salah satu
atau dua indra kita. Dengan demikian, konstruk merupakan temuan atau satu
pendekatan untuk menerangkan tingkah laku. [9]
c. Validasi ramalan
Validasi ramalan artinya adalah ketepatan suatu alat pengukur ditinjau dari
kemampuan tes tersebut untuk meramalkan prestasi yang dicapai kemudian. Suatu
tes dapat dikatakan memiliki nilai validasi ramalan yang tinggi, apabila hasil
dari tes tersebut betul-betul meramalkan sukses atau tidaknya siswa tersebut
dalam pelajaran yang akan datang. Dengan cara mencari korelasi antara
nilai-nilai yang dicapai oleh siswa dalam tes tersebut dengan nilai-nilai yang
dicapai kemudian.[10]
d. Validitas bandingan
Kejituan suatu tes dilihat dari korelasinya terhadap kecakapan yang telah
dimiliki saat ini secara rill. Validasi bandingan adalah ketika skor dalam
suatu tes dihubungkan dengan skor lain yang telah dibuat. Validasi bandingan
biasanya dilakukan dengan melibatkan antara skor pada tes dengan skor yang telah baku atau kriteria tes
yang sudah ada. Jika keofesian tinggi, berarti tes yang baru memiliki validitas
konkuren yang baik. Dan jika sebaliknya, maka keofisien yang dihasilkan rendah.[11]
B. Reabilitas
Menurut arti kata “reliabel” berarti “dapat dipercaya”.
Berdasarkan arti kata tersebut, maka
instrumen yang reiabel adalah instrumen yang hasil pengukurannya dapat
dipercaya. Kriteria instrumen yang dapat dipercaya adalah jika instrumen
tersebut digunakan secara berulang-ulang, dan hasil pengukurannya tetap.[12]
Reabilitas dapat diukur
menggunakan tiga kriteria, yaitu ; Stabilitas, Dependabilitas, dan
Prediktabilitas. Stabilitas menunjukkan keajengan suatu tes dalam
mengukur gejala yang sama pada waktu yang berbeda. Dependabilitas menunjukkan
kemantapan suatu tes atau seberapa jauh tes dapat diandalkan. Sedangkan
prediktabilitas menunjukkan kemampuan tes untuk meramalkan hasil pada pengukuran
gejala selanjutnya.[13]
Reabilitas dapat dicari dengan menggunakan dua cara,
yaitu (1) mencari korelasi antara pengujian yang pertama dan ujian yang kedua
dengan menggunakan tes yang sama. (2) membagi tes menjadi dua bagian, kemudian
bagian yang satu dicari korelasinya dengan bagian yang lain.[14]
Menurut Gronlund, ada empat faktor yang dapat
mempengaruhi reliabilitas, yaitu :
1.
Panjang tes
Panjang tes berarti banyak soal tes. Ada kecendrungan semakin panjang soal,
maka akan akan lebih tinggi tingkat reliabilitas suatu tes. Karna semakin
banyak soal, maka semakin banyak sampel yang diukur dan proposi jawaban benar
semakin banyak, sehingga faktor menjawab dengan tebakan akan semakin rendah.
2.
Sebaran skor
Besarnya sebaran skor akan memuat tingkat reliabilitas menjadi lebih
tinggi, karna keofisien reliabilitas yang lebih besar diperoleh ketika anak
didik tetap pada posisi yang relatif sama pada satu pengujian kepengujian
berikutnya.
3.
Tingkat kesukaran
Dalam penilaian yang mengguanakan pendekatan penilaian acuan norma (EAN),
baik untuk soal yang mudah maupun sukar, cendrung menghasilkan reliabilitas
yang rendah. Hal ini disebabkan karna antara hasil tes yang mudah dan sukar
keduanya dalam sebaran skor yang terbatas. Tingkat kesukaran soal yang ideal
untuk meningkatkan keofisien reliabilitas adalah soal yang menghasilkan sebaran
skor berbentuk genta atau kurva normal.
4.
Objektivitas
Objektivitas
ini menunjukkan adanya skor tes yang sama antara satu anak didik dengan anak
didik yang lain. Jika anak didik memiliki kemampuan yang sama maka, akan
memperoleh hasil yang sama pada saat mengerjakan tes yang sama.[15]
[1] Abdul
Qodir , Evaluasi dan Penilaian
Pembelajaran, hlm.153
[2] Haryanto, Evaluasi Pembelajaran (Konsep
dan Manajemen), hlm. 142
[3] Abdul
Qadir, hlm. 154
[4]
Haryanto, hlm. 142
[5] Abdul
Qadir, hlm. 156
[6]Abdul Qadir, Evaluasi dan Penilaian Pembelajaran, hlm. 155
[7] Haryanto, Evaluasi Pembelajaran (Konsep
dan Manajemen), hlm.
[8] Ibid, hlm.143
[9] Ibid, hlm. 143
[10]Nahjihah Ahmad, Buku Ajar Evaluasi Pembelajaran,
hlm. 56
[11] Najihah Ahmad, Buku Ajar Evaluasi
Pembelajaran, hlm. 56
[12] Arief
Aulia Rahman dan Cut Eva
Naysrah, Evaluasi Pembelajaran, hlm. 123
[13] Haryanto, Evaluasi dan Pembelajaran
(Konsep dan Manajemen), hlm. 149
[14] Ibid
[15] Haryanto, Evaluasi dan Pembelajaran
(Konsep dan Manajemen), hlm. 150

0 Komentar