Uji Validitas dan Reliabilitas Secara Empirik
Evaluasi pendidikan melibatkan banyak kegiatan teknis dalam menentukan
metode dan format penilaian yang dapat digunakan untuk mendapatkan
informasi yang dibutuhkan. Informasi tersebut diperlukan dalam menafsir
dan menetapkan keputusan untuk kepentingan pendidikan. Penilai
membutuhkan keterampilan dalam mengidentifikasi dan memahami berbagai
macam perspektif penilaian, baik penilaian kontekstual dan proses maupun
penilaian hasil. Karena penilaian merupakan pusat kontrol keberhasilan
program pendidikan, maka terdapat dua syarat utama yang harus dipenuhi
oleh suatu instrumen penilaian, yaitu validitas dan reliabilitas.
Dengan demikian, inti penilaian adalah proses memberikan atau menentukan
nilai kepada objek tertentu berdasarkan suatu kriteria tertentu. Proses
pemberian nilai tersebut berlangsung, baik dalam bentuk validitas
maupun reliabilitas. Validitas mengacu pada keberartian, kebenaran,
kemanfaatan, dan kesesuaian skor tes. Validitas merupakan karakteristik
suatu tes ketika diujikan pada suatu kelompok peserta tes. Validasi
suatu instrumen mencakup pengumpulan data empiris dan argumentasi logis
untuk menunjukkan bahwa kesimpulan tertentu adalah tepat. Sedangkan
reliabilitas yang berarti konsistensi adalah ciri umum dari suatu
instrumen pengukuran dan penilaian pendidikan. Konsistensi tinggi skor
instrumen dari suatu pengukuran ke pengukuran berikutnya merupakan ciri
terpenting dari instrumen yang berkualitas.
Keberhasilan mengungkapkan variabel yang ingin diukur sebagaimana adanya
(objektivitas hasil penilaian) sangat tergantung pada kualitas alat
penilaiannya di samping pada cara pelaksanaannya.
Berdasarkan beberapa pernyataan diatas diketahui bahwa mengetahui dan
memahami arti dari validitas dan reabilitas dalam penelitian sangatlah
penting. Oleh karena itu penulis akan fokus membahas mengenai validitas
dan rebilitas dalam suatu penelitian.
Pengertian Pengertian Uji Validitas dan Reliabilitas
Hasil penelitian yang valid bila terdapat kesamaan antara data yang
terkumpul dengan data yang sesungguhnya terjadi pada objek yang
diteliti. Hasil penelitian yang reliable bila terdapat kesamaan data
dalam waktu yang berbeda.
Instrumen yang valid berarti alat ukur yang digunakan untuk mendapatkan
data itu valid. Valid berarti instrument tersebut dapat digunakan untuk
mengukur apa yang seharusnya diukur. Instrumen yang reliabel adalah
instrumen yang bila digunakan beberapa kali untuk mengukur objek yang
sama, akan menghasilkan data yang sama.
Dengan menggunakan instrumen yang valid dan reliabel dalam pengumpulan
data, maka diharapkan hasil penelitian akan menjadi valid dan reliable.
Jadi instrument yang valid dan reliable menjadi syarat mutlak untuk
mendapatkan hasil yang valid dan reliable. Hal ini tidak berarti bahwa
dengan menggunakan instrumen yang valid danreliabel otomatis hasil
penelitian menjadi valid dan reliable, masih ada pengaruh lain seperti
objek yang diteliti dan kemampuan peneliti menggunakan instrument dalam
mengumpulkan data.
Instrument yang valid harus mempunyai validitas internal dan eksternal.
Instrument yang memiliki validitas internal atau rasional, bila kriteria
yang ada dalam instrument secara rasional (teoritis) telah mencerminkan
apa yang diukur. Jadi kriterianya ada di dalam instrument itu.
Instrument yang mempunyai validitas eksternal bila kriteria di dalam
instrumen disusun berdasarkan fakta-fakta empiris yang telah ada.
Penelitian yang memiliki validitas internal, bila data yang dihasilkan
merupakan fungsi dari rancangan dan instrument yang digunakan.
Penelitian yang memiliki validitas eksternal bila hasil penelitian dapat
diterapkan pada sampel yang lain, atau hasil penelitian itu dapat
digeneralisasikan.
Validitas internal instrumen yang berupa tes mempunyai validitas
konstruk dan validitas isi. Sedangkan untuk instrument non tes yang
digunakan untuk mengukur sikap cukup memenuhi validitas konstruksi.
Validitas
Pengertian Validitas
Validitas adalah suatu derajat ketepatan/kelayakan instrumen yang
digunakan untuk mengukur apa yang akan diukur (Zainal Ariffin.2012).
Menurut Sukardi (2013) validitas adalah derajat yang menunjukkan dimana
suatu tes mengukur apa yang hendak diukur. Sedangkan menurut Saifuddin
Azwar (2014) bahwa validitas mengacu sejauh mana akurasi suatu tes atau
skala dalam menjalankan fungsi pengukurannya.
Dari ketiga pendapat diatas dapat disimpulkan bahwa validitas adalah
Derajat keetepatan/kelayakan instrumen yang digunakan untuk mengukur apa
yang akan diukur serta sejauh mana instrumen tersebut menjalankan
fungsi pengukurannya .
Validitas merupakan produk dari validasi. Validasi adalah suatu proses
yang dilakukan oleh penyusun atau pengguna instrumen untuk mengumpulkan
data secara empiris guna mendukung kesimpulan yang dihasilkan oleh skor
instrumen. Sedangkan validitas adalah kemampuan suatu alat ukur untuk
mengukur sasaran ukurnya.Dalam mengukur validitas perhatian ditujukan
pada isi dan kegunaan instrumen. Validitas terdiri dari validitas
internal dan validitas eksternal. Validitas internal meliputi validitas
konstruk dan validitas isi, sedangkan validitas eksternal meliputi
validitas empiris yang di dalamnya ada validitas kongkuren, validitas
prediktif, dan validitas sejenis.
Jenis-jenis Validitas
Validitas terdiri dari validitas internal dan eksternal. Suatu
penelitian memiliki validitas internal sepanjang faktor-faktor yang
dimanipulasikan (variable bebas) benar-benar berpengaruh terhadap
variable tergantung yang diobservasi dalam latar penelitian.
Bila peneliti hanya sekedar mencapai validitas internal, maka nilai
praktis penemuannya akan rendah. Sebab tak bisa diberlakukan di luar
latar penelitian yang bersangkutan. Untuk itu, perlu pula mencapai
validitas eksternal. Dikatakan memiliki validitas eksternal sepanjang
hubungan antara variable yang ditemukan dapat digeneralisasikan pada
situasi-situasi non penelitian (bisa digeneralisasikan pada latar lain,
tritment lain, pengukuran lain, populasi lain).
1) Validitas Internal
Validitas internal adalah sebuah bentuk kesesuaian intrumen yag
dikemabngkan berdasarkan konstrak yang telha disusun, Bentuk dan tata
bahasa penggunaan instrumen. Validitas internal meliputi validitas
konstruk dan validitas isi
a) Validitas konstruk
Validitas konstruk menunjuk kepada asumsi, bahwa alat ukur yang dipakai
mengandung satu definisi operasional yang tepat dari suatu konsep
teoritis yang dapat diamati dan diukur. Seorang peneliti dalam membahas
validitas konstruk, mulai dengan menganalisis unsure-unsur suatu
konstruk. Kemudian diberikan penilaian apakah bagian-bagian itu memang
logis untuk disatukan menjadi skala yang mengukur suatu konstruk.
Langkah terakhir yaitu adalah menghubungkan konstruk yang sedang diamati
dengan konstruk lainnya, dan menelusi apa saja dari konstruk pertama
mempunyai kaitan dengan unsur-unsur tertentu pada konstruk yang lainnya.
b) Validitas isi
Menunjuk kepada suatu instrumen yang memiliki kesesuaian isi dalam
mengukur yang akan diukur. Penentuan suatu alat ukur mempunyai validitas
isi, biasanya dapat juga didasari pada penilaian para ahli dalam bidang
tersebut.
2) Validitas Eksternal (Validitas Empiris)
Validitas ini biasanya menggunakan teknik statistik, yaitu analisis
korelasi. Hal ini disebabkan validitas empiris mencari hubungan antara
skor tes dan suatu kriteria tertentu yang merupakan suatu tolok ukur di
luar tes yang bersangkutan. Namun, kriteria itu harus relevan dengan apa
yang diukur. Ada tiga macam validitas empiris, yaitu: validitas
prediktif (predictive validity), validitas kongkuren (concurrent
validity), dan validitas sejenis (congruent validity).Validitas
prediktif ialah jika kriteria standar yang digunakan adalah untuk
meramalkan prestasi belajar murid di masa yang akan datang. Sedangkan
validitas konkuren ialah jika kriteria standarnya berlainan. Sebaliknya,
jika kriteria standarnya sejenis, maka validitas tersebut disebut
validitas sejenis.
Validitas yang ideal tentunya mencakupvaliditas eksternal dan validitas
internal, namun biasanya tidak dapat dicakup secara sempurna karena ada
faktor-faktor yang dapat mengancam validitas.
Faktor-faktor yang dapat mempengaruhi validitas internal:
1) Kematangan
2) Peristiwa sewaktu-waktu
3) Ujian
4) Pengukuran tak stabil
5) Regresi statistik
6) Pilihan yang berbeda
7) Menguapnya sampel penelitian
Faktor-faktor yang mempengaruhi validitas eksternal
1) Latar penelitian yang buatan
2) Pengaruh placebo-homethorne
3) Kontaminasi
4) Campur tangan tritmen sebelumnya
5) Ujian
6) Pilihan yang bias
Pengujian Validitas
1. Validitas Konstruksi (Konstruk)
Untuk
menguji validitas konstruksi, dapat digunakan pendapat dari ahli yaitu
setelah instrumen dikonstruksi tentang aspek-aspek yang akan diukur
dengan berlandaskan teori tertentu. Setelah itu maka diteruskan dengan
uji coba instrumen. Pengujian validitas konstruksi dilakukan dengan
analisis faktor, dan mengkorelasikan skor faktor dengan skor total.
2. Validitas Isi
Untuk
instrumen berbentuk tes, pengujian validitas isi dapat dilakukan dengan
membandingkan antara isi instrumen dengan materi pelajaran yang telah
diajarkan. Untuk instrumen yang akan mengukur efektivitas pelaksanaan
program, maka pengujian validitas isi dapat dilakukan dengan
membandingkan antara isi instrumen dengan isi rancangan yang telah
ditetapkan.
Persamaan dalam uji validitas instrument non-test.
Uji validitas yang digunakan dalam penelitian ini adalah validitas
konstruk (Construct Validity). Menurut Jack R. Fraenkel (dalam Siregar
2010:163) validitas konstruk merupakan yang terluas cakupannya dibanding
dengan validitas lainnya, karena melibatkan banyak prosedur termasuk
validitas isi dan validitas kriteria.Pengujian Validitas instrument
test.
Penelitian berupa achivement test, memiliki nilai benar – salah, maka
pengujian validitas item instrumen dilakukan dengan menggunakan rumus
koefisien korelasi biserial. Rumus yang digunakan adalah sebagai
berikut:
Keterangan :
rpbi = Koefisien korelasi point biserial yang melambangkan
kekuatan korelasi antara variable I dengan variable II, yang dalam hal
ini dianggap sebagai Koefisien Validitas Item.
Mp = Skor rata-rata hitung yang dimiliki otel testee, yang untuk butir item yang bersangkutan telah dijawab dengan betul.
Mt = Skor rata-rata dari skor total.
SDt = Deviasi standar dari skor total.
p = Proporsi testee yang menjawab betul terhadap butir item yang sedang diuji validitas itemnya.
q = Proporsi testee yang menjawab salah terhadap buitr item yang sedang diuji validitas itemnya.
3. Validitas Empiris
Validitas
empiris instrumen diuji dengan cara membandingkan antara kriteria yang
ada pada instrumen dengan fakta-fakta empiris yang terjadi di lapangan.
Bila terdapat kesamaan antara criteria dalam instrumen dengan fakta di
lapangan, maka dapat dinyatakan instrument tersebut mempunyai validitas
yang tinggi. Untuk menguji validitas empiris dapat menggunakan analisis
korelasi product-moment dengan angka simpangan.
Nilai r kemudian dikonsultasikan dengan rtabel (rkritis). Bila rhitung
dari rumus di atas lebih besar dari rtabel maka butir tersebut valid,
dan sebaliknya.
Relibilitas
Pengertian Relibilitas
Reliabilitas diterjemahkan dari kata reliability yang berarti hal yang
dapat dipercaya (tahan uji). Sebuah tes dikatakan mempunyai reliabilitas
yang tinggi jika tes terebut memberikan data hasil yang ajeg (tetap)
walaupun diberikan pada waktu yang berbeda kepada responden yang sama.
Hasil tes yang tetap atau seandainya berubah maka perubahan i tu tidak
signifikan maka tes tersebut dikatakan reliabel. Oleh karena itu
reliabilitas sering disebut dengan keterpercayaan, keterandalan,
keajegan, konsistensi, kestabilan, dan sebagainya. Reliabilitas
menyangkut masalah ketepatan alat ukur. Ketepatan ini dapat dinilai
dengan analisa statistik untuk mengetahui kesalahan ukur. Reliabilitas
lebih mudah dimengerti dengan memperhatikan aspek pemantapan, ketepatan,
dan homogenitas. Suatu instrumen dianggap reliabel apabila instrumen
tersebut dapat dipercaya sebagai alat ukur data penelitian (Fred. N
kerlinger, 1973).
Definisi teoretis dari reliabilitas adalah proporsi keragaman skor tes
yang disebabkan oleh keragaman sistematis dalam populasi peserta tes.
Jika terdapat keragaman sistematis yang lebih besar dalam suatu populasi
dibanding dengan populasi lainnya, seperti dalam semua siswa sekolah
negeri dibandingkan hanya dengan kelas tertentu, tes akan mempunyai
reliabilitas lebih besar untuk populasi yang lebih bervariasi.
Reliabilitas adalah karakteristik bersama antara tes dan kelompok
peserta tes. Reliabilitas tes bervariasi dari suatu kelompok dengan
kelompok lainnya.
Uno, dkk. memberikan penekanan pada pengertian reliabilitas sebagai
konsistensi tes. Yaitu, seberapa konsisten skor tes dari satu pengukuran
ke pengukuran berikutnya. Reliabilitas merujuk pada ketetapan/keajegan
alat tersebut dalam menilai apa yang diinginkan, artinya kemampuan alat
tersebut digunakan akan memberikan hasil yang relatif sama.
Sehingga berdasarkan pernyataan-pernyataan diatas dapat disampaikan
bahwa, reliabilitas diartikan dengan keajekan (konsistensi) bila mana
tes tersebut diuji berkali-kali hasilnya relatif sama, artinya setelah
hasil tes yang pertama dengan tes yang berikutnya dikorelasikan terdapat
hasil korelasi yang signifikan. Derajat hubungan ini ditunjukkan dengan
koefesien reliabilitas yang bergerak dari 0 sampai dengan 1. Jika
koefesiennya semakin mendekati 1 maka semakin reliabel dan sebaliknya.
Pada umumnya para ahli memberikan standar minimal koefesien reliabilitas
sama atau lebih besar dari 0.6.
Dalam pendidikan, kegiatan pengukuran tentunya tidak berhubungan dengan
objek fisik seperti ukuran gedung, meja, tinggi badan, dan lain-lain.
Kegiatan pengukuran yang lebih sering dilakukan lebih bersifat non
fisik, seperti intelegensi, bakat dan minat, perilaku, persepsi siswa,
atau hasil belajar siswa. Dan untuk mengukur dimensi tersebut kita
memerlukan instrumen tes yang benar-benar reliabel.
Jenis-Jenis Reliabilitas
Kerlinger (1986) mengemukakan reliabilitas dapat diukur dari tiga
kriteria, yaitu stability, dependability, dan predictability. Stability
menunjukkan keajekan suatu tes dalam mengukur gejala yang sama pada
waktu yang berbeda. Dependability menunjukkan kemantapan suatu tes atau
seberapa jauh tes dapat diandalkan. Predictability menunjukkan kemampuan
tes untuk meramalkan hasil pada pengukuran gejala selanjutnya.
Menurut perhitungan product-moment dari pearson, ada tiga macam reliabilitas, yaitu
- Koefisien stabilitas (coefficient of stability) adalah jenis reliabilitas yang menggunakan teknik test and retest, yaitu memberikan tes kepada sekelompok individu, kemudian diadakan pengulangan tes pada kelompok yang sama dengan waktu yang berbeda. Cara memperoleh koefisien stabilitas adalah dengan mengorelasikan hasil tes pertama dengan hasil tes kedua dari kelompok yang sama, tes yang sama, pada waktu yang berbeda.
- Koefisien konsistensi internal (coefficient of internal consistency) adalah reliabilitas yang didapat dengan jalan mengorelasikan dua buah tes dari kelompok yang sama, tetapi diambil dari butir-butir yang bernomor genap untuk tes yang pertama dan butir-butir bernomor ganjil untuk tes yang kedua. Teknik ini sering juga disebut split-half method.
- Koefisien ekuivalen (coefficient of equivalence) adalah jika mengorelasikan dua buah tes yang paralel pada kelompok dan waktu yang sama. Mertode yang digunakan untuk memperoleh koefisien ekuivalen adalah metode dengan menggunakan dua buah bentuk tes yang paralel (equivalen) atau disebut equivalence forms method.
Pengujian Reliabilitas
Pengujian reliabilitas instrumen dapat dilakukan secara eksternal dan
internal. Secara eksternal dilakukan dengan cara tes-retes, equivalen,
dan gabungan. Secara internal dapat diuji dengan menganalisis
konsistensi butir-butir yang ada pada instrument.
Reliabilitas Eksternal
a) Tes-Retes
Secara sederhana tes-retest dapat diartikan: Test-retest is an
obvious to estimate the reliability of a test is to the same group of
individuals on two occasions and correlate the two sets of scores.
Dilakukan dengan cara mencobakan instrumen beberapa kali pada
responden. Jadi dalam hal ini instrumennya sama, respondennya sama, dan
waktunya yang berbeda. Reliabilitas diukur dari koefisien korelasi
antara percobaan pertama dengan yang berikutnya.
b) Ekuivalen
Pengujian reliabilitas instrument dengan cara ini cukup dilakukan
sekali, tetapi instrumennya dua, pada responden yang sama, waktu sama,
instrumen berbeda. Reliabilitas instrument dihitung dengan cara
mengkorelasikan antara data instrumen yang satu dengan data instrumen
yang dijadikan equivalen. Peneliti mengkorelasikan hasil-hasil secara
bergantian dari tes yang dilakukan pada individu yang sama. Jika dua
bentuk dilakukan pada waktu yang sama, hasil koefisien reliabilitas
disebut dengan koefisien ekivalen
c) Gabungan (Split-Half)
Pengujian reliabilitas ini dilakukan dengan cara mencobakan dua
instrumen yang equivalen itu beberapa kali ke responden yang sama. Jadi
cara ini gabungan dari kedua cara diatas. Reliabilitas instrumen
dilakukan dengan mengkorelasikan dua instrumen, setelah itu
dikorelasikan pada pengujian kedua, dan selanjutnya dikorelasikan secara
silang.
Reliabilitas Internal
Teknik perhitungannya tergantung pada banyaknya belahan, bentuk, serta
sifat alat ukurnya. Beberapa teknik yang sering digunakan untuk
menentukan koefisien reliabilitas dengan metode tes tunggal ini antara
lain: Formula-formula Kuder Richardson (KR20 dan KR21), Formula
Spearman-Brown, Formula Rulon, Formula Alpha, Formula C. Hoyt, Formula
Analisis Varians, Formula Kristof, Formula Flanagan, dan sebagainya.
A. Rumus Spearman Brown
Rumus yang digunakan dalam hal ini adalah rumus Spearman-Brown
(Arikunto, Rumus Flanagan Rumus Flanagan memiliki syarat diantaranya
data yang digunakan merupakan instrumen dengan skor 1 dan 0 jumlah
butir pertanyaan genap. Langkah: skor-skor dikelompokkan menjadi dua
berdasarkan belahan bagian soal, ganjil-genap.
B. Flanagan
B. Flanagan
Reliabilitas pada formula Flanagan tidak didasarkan pada ada tidaknya
korelasi antara belahan I dengan belahan II. Dasar dari formula Flanagan
adalah jumlah kuadrat deviasi (varians) pada tes belahan I, jumlah
kuadrat (varians) deviasi pada tes belahan II, dan jumlah kuadrat
deviasi (varians) skor total.
C. Rumus Rulon
Rumus Rulon (belah dua Awal-Akhir). Bila menggunakan rumus yang
tergolong pada teknik belah dua ada 2 persyaratan yang harus dipenuhi,
yaitu butir pertanyaan harus genap dan antara belahan pertama dan kedua
harus seimbang. Menurut Rulon reliabilitas dapat dipandang dari adanya
selisih skor yang diperoleh oleh responden pada belahan pertama dengan
belahan kedua. Selisih tersebut yang menjadi sumber variasi error
sehingga bila dibandingkan dengan variasi skor akan dapat menjadi dasar
untuk melakukan estimasi reliabilitas tes.
faktor-faktor yang mempengaruhi reabilitas suatu penelitian.
Dalam mengestimasi reliabilitas tes ada beberapa faktor yang dapat
mempengaruhi reliabilitas tes, sehingga tes tersebut tidak reliabel.
Pada umumnya, dalam pendidikan reliabilitas sebuah tes dipengaruhi oleh
adanya perbedaan individual. Terkadang reliabilitas dipengaruhi oleh
faktor yang permanen ataupun faktor yang terjadi karena faktor sementara
seperti karena kelelahan, menerka, atau pengaruh latihan.(Sumarna
Selanjutnya, (Donald, dkk.), menggambarkan faktor-faktor yang turut
mempengaruhi reliabilitas instrumen penelitian:
Kesimpulan
Validitas dan reliabilitas merupakan syarat pokok bagi alat ukur untuk
mengukur variabel-variabel yang ingin diukur penelitian. Validitas
digunakan untuk mengetahui ketepatan dan kecermatan suatu instrumen
tes/item pertanyaan yang diberikan. Item yang valid adalah item yang
dapat mengukur apa yang hendak diukur. Sedangkan . Reliabilitas merujuk
pada ketetapan/keajegan alat tersebut dalam menilai apa yang
diinginkan, artinya kemampuan alat tersebut digunakan akan memberikan
hasil yang relatif sama.
Validitas suatu tesdapat dilihat melalui penalaran (logis) maupun
melalui fakta-fakta empiris. Validitas logis dapat ditinjau dari isi dan
susunan tes, dimana instrumen tes harus linier dengan isi/pelajaran dan
sesuai dengantujuan instruksional khusus yang telah dirumuskan
sebelumnya. Kemudian untuk membuat susunan butir-butir tes yang
dikatakan valid adalah mendasarkannya dengan susunan indikator-indikator
yang telah dirumuskan. Contoh dari validitas logis adalah validitas isi
dan validitas konstruk. Kemudian validitas empiris merupakan validitas
yang dapat diuji secara empiris. Instrumen diuji melalui metode
statistika. Validitas empiris dapat dibagi menjadi dua, yaitu validitas
internal dan validitas eksternal. Validitas internal memperlihatkan
seberapa jauh hasil ukur setiap butir tes konsisten dengan hasil ukur
instrumen secara keseluruhan. Sedangkan validitas eksternal adalah hasil
ukur instrumen atau tes lain diluar instrumen itu sendiri yang menjadi
kriteria. Contoh dari validitas eksternal adalah validitas konkuren
(bandingan) dan validitas prediktif. Sedangkan reliabilitas dibagi
menjadi dua, yaitu: reliabilitas tanggapan(eksternal) dan reliabilitas
konsistensi gabungan item. Reabilitas tanggapan menekankan pada
bagaimana proses penerapan dan penyampaian instrumen sedangkan
reabilitas konsistensi tanggapan item lebih pada pengolahan item bagai
mana hasil yang diperoleh instrumen. Instrumen yang valid dan reliabel
merupakan syarat untuk memperoleh data-data yang valid. Data-data ini
yang kemudian dianalisis dalam rangka mencari kesimpulan penelitian.
Daftar Referensi dan Bacaan
Arifin, Zainal. (2012). Evaluasi Pembelajaran. Bandung: PT. Remaja Rosdakarya
Azwar S. 2014. Psikologi Inteligensi. Yogyakarta
Kerlinger, Fred N. 1973. Asas-Asas Penelitian Behavioral. Yogyakarta: UGM
Sukardi, 2009. Metodologi penelitian pendidikan: kompetensi dan praktiknya Jakarta: Bumi Aksara
Advertisement
Posting Komentar