Uji Validitas dan Reliabilitas Secara Empirik

Evaluasi pendidikan melibatkan banyak kegiatan teknis dalam menentukan metode dan format penilaian yang dapat digunakan untuk mendapatkan informasi yang dibutuhkan. Informasi tersebut diperlukan dalam menafsir dan menetapkan keputusan untuk kepentingan pendidikan. Penilai membutuhkan keterampilan dalam mengidentifikasi dan memahami berbagai macam perspektif penilaian, baik penilaian kontekstual dan proses maupun penilaian hasil. Karena penilaian merupakan pusat kontrol keberhasilan program pendidikan, maka terdapat dua syarat utama yang harus dipenuhi oleh suatu instrumen penilaian, yaitu validitas dan reliabilitas.

Dengan demikian, inti penilaian adalah proses memberikan atau menentukan nilai kepada objek tertentu berdasarkan suatu kriteria tertentu. Proses pemberian nilai tersebut berlangsung, baik dalam bentuk validitas maupun reliabilitas. Validitas mengacu pada keberartian, kebenaran, kemanfaatan, dan kesesuaian skor tes. Validitas merupakan karakteristik suatu tes ketika diujikan pada suatu kelompok peserta tes. Validasi suatu instrumen mencakup pengumpulan data empiris dan argumentasi logis untuk menunjukkan bahwa kesimpulan tertentu adalah tepat. Sedangkan reliabilitas yang berarti konsistensi adalah ciri umum dari suatu instrumen pengukuran dan penilaian pendidikan. Konsistensi tinggi skor instrumen dari suatu pengukuran ke pengukuran berikutnya merupakan ciri terpenting dari instrumen yang berkualitas.

Keberhasilan mengungkapkan variabel yang ingin diukur sebagaimana adanya (objektivitas hasil penilaian) sangat tergantung pada kualitas alat penilaiannya di samping pada cara pelaksanaannya.

Berdasarkan beberapa pernyataan diatas diketahui bahwa mengetahui dan memahami arti dari validitas dan reabilitas dalam penelitian sangatlah penting. Oleh karena itu penulis akan fokus membahas mengenai validitas dan rebilitas dalam suatu penelitian.

Pengertian Pengertian Uji Validitas dan Reliabilitas

Hasil penelitian yang valid bila terdapat kesamaan antara data yang terkumpul dengan data yang sesungguhnya terjadi pada objek yang diteliti. Hasil penelitian yang reliable bila terdapat kesamaan data dalam waktu yang berbeda.

Instrumen yang valid berarti alat ukur yang digunakan untuk mendapatkan data itu valid. Valid berarti instrument tersebut dapat digunakan untuk mengukur apa yang seharusnya diukur. Instrumen yang reliabel adalah instrumen yang bila digunakan beberapa kali untuk mengukur objek yang sama, akan menghasilkan data yang sama.

Dengan menggunakan instrumen yang valid dan reliabel dalam pengumpulan data, maka diharapkan hasil penelitian akan menjadi valid dan reliable. Jadi instrument yang valid dan reliable menjadi syarat mutlak untuk mendapatkan hasil yang valid dan reliable. Hal ini tidak berarti bahwa dengan menggunakan instrumen yang valid danreliabel otomatis hasil penelitian menjadi valid dan reliable, masih ada pengaruh lain seperti objek yang diteliti dan kemampuan peneliti menggunakan instrument dalam mengumpulkan data.

Instrument yang valid harus mempunyai validitas internal dan eksternal. Instrument yang memiliki validitas internal atau rasional, bila kriteria yang ada dalam instrument secara rasional (teoritis) telah mencerminkan apa yang diukur. Jadi kriterianya ada di dalam instrument itu. Instrument yang mempunyai validitas eksternal bila kriteria di dalam instrumen disusun berdasarkan fakta-fakta empiris yang telah ada.

Penelitian yang memiliki validitas internal, bila data yang dihasilkan merupakan fungsi dari rancangan dan instrument yang digunakan. Penelitian yang memiliki validitas eksternal bila hasil penelitian dapat diterapkan pada sampel yang lain, atau hasil penelitian itu dapat digeneralisasikan.

Validitas internal instrumen yang berupa tes mempunyai validitas konstruk dan validitas isi. Sedangkan untuk instrument non tes yang digunakan untuk mengukur sikap cukup memenuhi validitas konstruksi.

Validitas

Pengertian Validitas

Validitas adalah suatu derajat ketepatan/kelayakan instrumen yang digunakan untuk mengukur apa yang akan diukur (Zainal Ariffin.2012). Menurut Sukardi (2013) validitas adalah derajat yang menunjukkan dimana suatu tes mengukur apa yang hendak diukur. Sedangkan menurut Saifuddin Azwar (2014) bahwa validitas mengacu sejauh mana akurasi suatu tes atau skala dalam menjalankan fungsi pengukurannya.

Dari ketiga pendapat diatas dapat disimpulkan bahwa validitas adalah Derajat keetepatan/kelayakan instrumen yang digunakan untuk mengukur apa yang akan diukur serta sejauh mana instrumen tersebut menjalankan fungsi pengukurannya .

Validitas merupakan produk dari validasi. Validasi adalah suatu proses yang dilakukan oleh penyusun atau pengguna instrumen untuk mengumpulkan data secara empiris guna mendukung kesimpulan yang dihasilkan oleh skor instrumen. Sedangkan validitas adalah kemampuan suatu alat ukur untuk mengukur sasaran ukurnya.Dalam mengukur validitas perhatian ditujukan pada isi dan kegunaan instrumen. Validitas terdiri dari validitas internal dan validitas eksternal. Validitas internal meliputi validitas konstruk dan validitas isi, sedangkan validitas eksternal meliputi validitas empiris yang di dalamnya ada validitas kongkuren, validitas prediktif, dan validitas sejenis.

Jenis-jenis Validitas

Validitas terdiri dari validitas internal dan eksternal. Suatu penelitian memiliki validitas internal sepanjang faktor-faktor yang dimanipulasikan (variable bebas) benar-benar berpengaruh terhadap variable tergantung yang diobservasi dalam latar penelitian.

Bila peneliti hanya sekedar mencapai validitas internal, maka nilai praktis penemuannya akan rendah. Sebab tak bisa diberlakukan di luar latar penelitian yang bersangkutan. Untuk itu, perlu pula mencapai validitas eksternal. Dikatakan memiliki validitas eksternal sepanjang hubungan antara variable yang ditemukan dapat digeneralisasikan pada situasi-situasi non penelitian (bisa digeneralisasikan pada latar lain, tritment lain, pengukuran lain, populasi lain).

1) Validitas Internal

Validitas internal adalah sebuah bentuk kesesuaian intrumen yag dikemabngkan berdasarkan konstrak yang telha disusun, Bentuk dan tata bahasa penggunaan instrumen. Validitas internal meliputi validitas konstruk dan validitas isi

a) Validitas konstruk

Validitas konstruk menunjuk kepada asumsi, bahwa alat ukur yang dipakai mengandung satu definisi operasional yang tepat dari suatu konsep teoritis yang dapat diamati dan diukur. Seorang peneliti dalam membahas validitas konstruk, mulai dengan menganalisis unsure-unsur suatu konstruk. Kemudian diberikan penilaian apakah bagian-bagian itu memang logis untuk disatukan menjadi skala yang mengukur suatu konstruk. Langkah terakhir yaitu adalah menghubungkan konstruk yang sedang diamati dengan konstruk lainnya, dan menelusi apa saja dari konstruk pertama mempunyai kaitan dengan unsur-unsur tertentu pada konstruk yang lainnya.

b) Validitas isi

Menunjuk kepada suatu instrumen yang memiliki kesesuaian isi dalam mengukur yang akan diukur. Penentuan suatu alat ukur mempunyai validitas isi, biasanya dapat juga didasari pada penilaian para ahli dalam bidang tersebut.

2) Validitas Eksternal (Validitas Empiris)

Validitas ini biasanya menggunakan teknik statistik, yaitu analisis korelasi. Hal ini disebabkan validitas empiris mencari hubungan antara skor tes dan suatu kriteria tertentu yang merupakan suatu tolok ukur di luar tes yang bersangkutan. Namun, kriteria itu harus relevan dengan apa yang diukur. Ada tiga macam validitas empiris, yaitu: validitas prediktif (predictive validity), validitas kongkuren (concurrent validity), dan validitas sejenis (congruent validity).Validitas prediktif ialah jika kriteria standar yang digunakan adalah untuk meramalkan prestasi belajar murid di masa yang akan datang. Sedangkan validitas konkuren ialah jika kriteria standarnya berlainan. Sebaliknya, jika kriteria standarnya sejenis, maka validitas tersebut disebut validitas sejenis.

Validitas yang ideal tentunya mencakupvaliditas eksternal dan validitas internal, namun biasanya tidak dapat dicakup secara sempurna karena ada faktor-faktor yang dapat mengancam validitas.

Faktor-faktor yang dapat mempengaruhi validitas internal:

1) Kematangan

2) Peristiwa sewaktu-waktu

3) Ujian

4) Pengukuran tak stabil

5) Regresi statistik

6) Pilihan yang berbeda

7) Menguapnya sampel penelitian

Faktor-faktor yang mempengaruhi validitas eksternal

1) Latar penelitian yang buatan

2) Pengaruh placebo-homethorne

3) Kontaminasi

4) Campur tangan tritmen sebelumnya

5) Ujian

6) Pilihan yang bias

Pengujian Validitas

1. Validitas Konstruksi (Konstruk)

Untuk menguji validitas konstruksi, dapat digunakan pendapat dari ahli yaitu setelah instrumen dikonstruksi tentang aspek-aspek yang akan diukur dengan berlandaskan teori tertentu. Setelah itu maka diteruskan dengan uji coba instrumen. Pengujian validitas konstruksi dilakukan dengan analisis faktor, dan mengkorelasikan skor faktor dengan skor total.

2. Validitas Isi

Untuk instrumen berbentuk tes, pengujian validitas isi dapat dilakukan dengan membandingkan antara isi instrumen dengan materi pelajaran yang telah diajarkan. Untuk instrumen yang akan mengukur efektivitas pelaksanaan program, maka pengujian validitas isi dapat dilakukan dengan membandingkan antara isi instrumen dengan isi rancangan yang telah ditetapkan.

Persamaan dalam uji validitas instrument non-test.

Uji validitas yang digunakan dalam penelitian ini adalah validitas konstruk (Construct Validity). Menurut Jack R. Fraenkel (dalam Siregar 2010:163) validitas konstruk merupakan yang terluas cakupannya dibanding dengan validitas lainnya, karena melibatkan banyak prosedur termasuk validitas isi dan validitas kriteria.Pengujian Validitas instrument test.

Penelitian berupa achivement test, memiliki nilai benar – salah, maka pengujian validitas item instrumen dilakukan dengan menggunakan rumus koefisien korelasi biserial. Rumus yang digunakan adalah sebagai berikut:

Keterangan :

rpbi = Koefisien korelasi point biserial yang melambangkan kekuatan korelasi antara variable I dengan variable II, yang dalam hal ini dianggap sebagai Koefisien Validitas Item.

Mp = Skor rata-rata hitung yang dimiliki otel testee, yang untuk butir item yang bersangkutan telah dijawab dengan betul.

Mt = Skor rata-rata dari skor total.

SDt = Deviasi standar dari skor total.

p = Proporsi testee yang menjawab betul terhadap butir item yang sedang diuji validitas itemnya.

q = Proporsi testee yang menjawab salah terhadap buitr item yang sedang diuji validitas itemnya.

3. Validitas Empiris

Validitas empiris instrumen diuji dengan cara membandingkan antara kriteria yang ada pada instrumen dengan fakta-fakta empiris yang terjadi di lapangan. Bila terdapat kesamaan antara criteria dalam instrumen dengan fakta di lapangan, maka dapat dinyatakan instrument tersebut mempunyai validitas yang tinggi. Untuk menguji validitas empiris dapat menggunakan analisis korelasi product-moment dengan angka simpangan.

Nilai r kemudian dikonsultasikan dengan rtabel (rkritis). Bila rhitung dari rumus di atas lebih besar dari rtabel maka butir tersebut valid, dan sebaliknya.

Relibilitas

Pengertian Relibilitas

Reliabilitas diterjemahkan dari kata reliability yang berarti hal yang dapat dipercaya (tahan uji). Sebuah tes dikatakan mempunyai reliabilitas yang tinggi jika tes terebut memberikan data hasil yang ajeg (tetap) walaupun diberikan pada waktu yang berbeda kepada responden yang sama. Hasil tes yang tetap atau seandainya berubah maka perubahan i tu tidak signifikan maka tes tersebut dikatakan reliabel. Oleh karena itu reliabilitas sering disebut dengan keterpercayaan, keterandalan, keajegan, konsistensi, kestabilan, dan sebagainya. Reliabilitas menyangkut masalah ketepatan alat ukur. Ketepatan ini dapat dinilai dengan analisa statistik untuk mengetahui kesalahan ukur. Reliabilitas lebih mudah dimengerti dengan memperhatikan aspek pemantapan, ketepatan, dan homogenitas. Suatu instrumen dianggap reliabel apabila instrumen tersebut dapat dipercaya sebagai alat ukur data penelitian (Fred. N kerlinger, 1973).

Definisi teoretis dari reliabilitas adalah proporsi keragaman skor tes yang disebabkan oleh keragaman sistematis dalam populasi peserta tes. Jika terdapat keragaman sistematis yang lebih besar dalam suatu populasi dibanding dengan populasi lainnya, seperti dalam semua siswa sekolah negeri dibandingkan hanya dengan kelas tertentu, tes akan mempunyai reliabilitas lebih besar untuk populasi yang lebih bervariasi. Reliabilitas adalah karakteristik bersama antara tes dan kelompok peserta tes. Reliabilitas tes bervariasi dari suatu kelompok dengan kelompok lainnya.

Uno, dkk. memberikan penekanan pada pengertian reliabilitas sebagai konsistensi tes. Yaitu, seberapa konsisten skor tes dari satu pengukuran ke pengukuran berikutnya. Reliabilitas merujuk pada ketetapan/keajegan alat tersebut dalam menilai apa yang diinginkan, artinya kemampuan alat tersebut digunakan akan memberikan hasil yang relatif sama.

Sehingga berdasarkan pernyataan-pernyataan diatas dapat disampaikan bahwa, reliabilitas diartikan dengan keajekan (konsistensi) bila mana tes tersebut diuji berkali-kali hasilnya relatif sama, artinya setelah hasil tes yang pertama dengan tes yang berikutnya dikorelasikan terdapat hasil korelasi yang signifikan. Derajat hubungan ini ditunjukkan dengan koefesien reliabilitas yang bergerak dari 0 sampai dengan 1. Jika koefesiennya semakin mendekati 1 maka semakin reliabel dan sebaliknya. Pada umumnya para ahli memberikan standar minimal koefesien reliabilitas sama atau lebih besar dari 0.6.

Dalam pendidikan, kegiatan pengukuran tentunya tidak berhubungan dengan objek fisik seperti ukuran gedung, meja, tinggi badan, dan lain-lain. Kegiatan pengukuran yang lebih sering dilakukan lebih bersifat non fisik, seperti intelegensi, bakat dan minat, perilaku, persepsi siswa, atau hasil belajar siswa. Dan untuk mengukur dimensi tersebut kita memerlukan instrumen tes yang benar-benar reliabel.

Jenis-Jenis Reliabilitas

Kerlinger (1986) mengemukakan reliabilitas dapat diukur dari tiga kriteria, yaitu stability, dependability, dan predictability. Stability menunjukkan keajekan suatu tes dalam mengukur gejala yang sama pada waktu yang berbeda. Dependability menunjukkan kemantapan suatu tes atau seberapa jauh tes dapat diandalkan. Predictability menunjukkan kemampuan tes untuk meramalkan hasil pada pengukuran gejala selanjutnya.

Menurut perhitungan product-moment dari pearson, ada tiga macam reliabilitas, yaitu

Koefisien stabilitas (coefficient of stability) adalah jenis reliabilitas yang menggunakan teknik test and retest, yaitu memberikan tes kepada sekelompok individu, kemudian diadakan pengulangan tes pada kelompok yang sama dengan waktu yang berbeda. Cara memperoleh koefisien stabilitas adalah dengan mengorelasikan hasil tes pertama dengan hasil tes kedua dari kelompok yang sama, tes yang sama, pada waktu yang berbeda.
Koefisien konsistensi internal (coefficient of internal consistency) adalah reliabilitas yang didapat dengan jalan mengorelasikan dua buah tes dari kelompok yang sama, tetapi diambil dari butir-butir yang bernomor genap untuk tes yang pertama dan butir-butir bernomor ganjil untuk tes yang kedua. Teknik ini sering juga disebut split-half method.
Koefisien ekuivalen (coefficient of equivalence) adalah jika mengorelasikan dua buah tes yang paralel pada kelompok dan waktu yang sama. Mertode yang digunakan untuk memperoleh koefisien ekuivalen adalah metode dengan menggunakan dua buah bentuk tes yang paralel (equivalen) atau disebut equivalence forms method.

Pengujian Reliabilitas

Pengujian reliabilitas instrumen dapat dilakukan secara eksternal dan internal. Secara eksternal dilakukan dengan cara tes-retes, equivalen, dan gabungan. Secara internal dapat diuji dengan menganalisis konsistensi butir-butir yang ada pada instrument.

Reliabilitas Eksternal

a) Tes-Retes

Secara sederhana tes-retest dapat diartikan: Test-retest is an obvious to estimate the reliability of a test is to the same group of individuals on two occasions and correlate the two sets of scores. Dilakukan dengan cara mencobakan instrumen beberapa kali pada responden. Jadi dalam hal ini instrumennya sama, respondennya sama, dan waktunya yang berbeda. Reliabilitas diukur dari koefisien korelasi antara percobaan pertama dengan yang berikutnya.

b) Ekuivalen

Pengujian reliabilitas instrument dengan cara ini cukup dilakukan sekali, tetapi instrumennya dua, pada responden yang sama, waktu sama, instrumen berbeda. Reliabilitas instrument dihitung dengan cara mengkorelasikan antara data instrumen yang satu dengan data instrumen yang dijadikan equivalen. Peneliti mengkorelasikan hasil-hasil secara bergantian dari tes yang dilakukan pada individu yang sama. Jika dua bentuk dilakukan pada waktu yang sama, hasil koefisien reliabilitas disebut dengan koefisien ekivalen

c) Gabungan (Split-Half)

Pengujian reliabilitas ini dilakukan dengan cara mencobakan dua instrumen yang equivalen itu beberapa kali ke responden yang sama. Jadi cara ini gabungan dari kedua cara diatas. Reliabilitas instrumen dilakukan dengan mengkorelasikan dua instrumen, setelah itu dikorelasikan pada pengujian kedua, dan selanjutnya dikorelasikan secara silang.

Reliabilitas Internal

Teknik perhitungannya tergantung pada banyaknya belahan, bentuk, serta sifat alat ukurnya. Beberapa teknik yang sering digunakan untuk menentukan koefisien reliabilitas dengan metode tes tunggal ini antara lain: Formula-formula Kuder Richardson (KR20 dan KR21), Formula Spearman-Brown, Formula Rulon, Formula Alpha, Formula C. Hoyt, Formula Analisis Varians, Formula Kristof, Formula Flanagan, dan sebagainya.

A. Rumus Spearman Brown

Rumus yang digunakan dalam hal ini adalah rumus Spearman-Brown (Arikunto, Rumus Flanagan Rumus Flanagan memiliki syarat diantaranya data yang digunakan merupakan instrumen dengan skor 1 dan 0 jumlah butir pertanyaan genap. Langkah: skor-skor dikelompokkan menjadi dua berdasarkan belahan bagian soal, ganjil-genap.

B. Flanagan

Reliabilitas pada formula Flanagan tidak didasarkan pada ada tidaknya korelasi antara belahan I dengan belahan II. Dasar dari formula Flanagan adalah jumlah kuadrat deviasi (varians) pada tes belahan I, jumlah kuadrat (varians) deviasi pada tes belahan II, dan jumlah kuadrat deviasi (varians) skor total.

C. Rumus Rulon

Rumus Rulon (belah dua Awal-Akhir). Bila menggunakan rumus yang tergolong pada teknik belah dua ada 2 persyaratan yang harus dipenuhi, yaitu butir pertanyaan harus genap dan antara belahan pertama dan kedua harus seimbang. Menurut Rulon reliabilitas dapat dipandang dari adanya selisih skor yang diperoleh oleh responden pada belahan pertama dengan belahan kedua. Selisih tersebut yang menjadi sumber variasi error sehingga bila dibandingkan dengan variasi skor akan dapat menjadi dasar untuk melakukan estimasi reliabilitas tes.

faktor-faktor yang mempengaruhi reabilitas suatu penelitian.

Dalam mengestimasi reliabilitas tes ada beberapa faktor yang dapat mempengaruhi reliabilitas tes, sehingga tes tersebut tidak reliabel. Pada umumnya, dalam pendidikan reliabilitas sebuah tes dipengaruhi oleh adanya perbedaan individual. Terkadang reliabilitas dipengaruhi oleh faktor yang permanen ataupun faktor yang terjadi karena faktor sementara seperti karena kelelahan, menerka, atau pengaruh latihan.(Sumarna Selanjutnya, (Donald, dkk.), menggambarkan faktor-faktor yang turut mempengaruhi reliabilitas instrumen penelitian:

Kesimpulan

Validitas dan reliabilitas merupakan syarat pokok bagi alat ukur untuk mengukur variabel-variabel yang ingin diukur penelitian. Validitas digunakan untuk mengetahui ketepatan dan kecermatan suatu instrumen tes/item pertanyaan yang diberikan. Item yang valid adalah item yang dapat mengukur apa yang hendak diukur. Sedangkan . Reliabilitas merujuk pada ketetapan/keajegan alat tersebut dalam menilai apa yang diinginkan, artinya kemampuan alat tersebut digunakan akan memberikan hasil yang relatif sama.

Validitas suatu tesdapat dilihat melalui penalaran (logis) maupun melalui fakta-fakta empiris. Validitas logis dapat ditinjau dari isi dan susunan tes, dimana instrumen tes harus linier dengan isi/pelajaran dan sesuai dengantujuan instruksional khusus yang telah dirumuskan sebelumnya. Kemudian untuk membuat susunan butir-butir tes yang dikatakan valid adalah mendasarkannya dengan susunan indikator-indikator yang telah dirumuskan. Contoh dari validitas logis adalah validitas isi dan validitas konstruk. Kemudian validitas empiris merupakan validitas yang dapat diuji secara empiris. Instrumen diuji melalui metode statistika. Validitas empiris dapat dibagi menjadi dua, yaitu validitas internal dan validitas eksternal. Validitas internal memperlihatkan seberapa jauh hasil ukur setiap butir tes konsisten dengan hasil ukur instrumen secara keseluruhan. Sedangkan validitas eksternal adalah hasil ukur instrumen atau tes lain diluar instrumen itu sendiri yang menjadi kriteria. Contoh dari validitas eksternal adalah validitas konkuren (bandingan) dan validitas prediktif. Sedangkan reliabilitas dibagi menjadi dua, yaitu: reliabilitas tanggapan(eksternal) dan reliabilitas konsistensi gabungan item. Reabilitas tanggapan menekankan pada bagaimana proses penerapan dan penyampaian instrumen sedangkan reabilitas konsistensi tanggapan item lebih pada pengolahan item bagai mana hasil yang diperoleh instrumen. Instrumen yang valid dan reliabel merupakan syarat untuk memperoleh data-data yang valid. Data-data ini yang kemudian dianalisis dalam rangka mencari kesimpulan penelitian.

Daftar Referensi dan Bacaan

Arifin, Zainal. (2012). Evaluasi Pembelajaran. Bandung: PT. Remaja Rosdakarya

Azwar S. 2014. Psikologi Inteligensi. Yogyakarta

Kerlinger, Fred N. 1973. Asas-Asas Penelitian Behavioral. Yogyakarta: UGM

Sukardi, 2009. Metodologi penelitian pendidikan: kompetensi dan praktiknya Jakarta: Bumi Aksara

FileNya

Uji Validitas dan Reliabilitas Secara Empirik