Validitas dan Reliabilitas

Pada penelitian kuantitatif selalu bergantung pada dua alat ukur, yaitu validitas dan reliabilitas. Validitas menunjukkan sejauh mana nilai/ukuran yang diperoleh benar-benar menyatakan hasil pengukuran/pengamatan yang ingin diukur. Sedangkan reliabilitas merupakan indeks yang menunjukkan sejauh mana suatu alat pengukur dapat dipercaya atau dapat diandalkan.

VALIDITAS

Validitas sebuah tes menyangkut apa yang diukur tes dan seberapa baik tes itu bisa mengukur. Validitas sebuah tes memberitahu kita tentang apa yang bisa kita simpulkan dari skor-skor tes. Menilai validitas adalah penting bagi peneliti karena sebagian besar instrumen yang digunakan dalam penyelidikan pendidikan dan psikologis dirancang untuk mengukur konstruksi hipotetis. Pada dasarnya, semua prosedur untuk menentukan validitas tes berkaitan dengan hubungan antara kinerja pada tes dan fakta-fakta lain yang dapat diamati secara independent tentang ciri-ciri prilaku.

Bukti hubungan antara tes dan kriteria yang relevan berfokus pada pertanyaan “Bagaimana kriteria kinerja secara akurat dapat diperkirakan dari nilai pada tes?” Kriteria adalah beberapa hasil penting untuk pengujian. Kriteria harus juga mewakili atribut yang diukur atau yang lain yang akan digunakan.

Yang dimaksudkan dengan koefisien validitas adalah korelasi antara skor tes dan pengukuran kriteria. Karena memberikan indeks numerik tunggal validitas tes, koefisien validitas umumnya digunakan dalam pegangan-pegangan-pegangan tes untuk melaporkan validitas sebuah tes menurut tiap kriteria dari data yang tersedia.

Sebelumnya kita mendeskripsikan sebagai validasi konvergen dan kemudian sebagai validasi diskriminan. Korelasi sebuah tes penalaran kuantitatif dengan nilai-nilai selanjutnya dalam mata pelajaran matematika akan menjadi contoh validasi konvergen. Untuk tes yang sama, validitas diskriminan akan dibuktikan oleh korelasi rendah dan tidak signifikan.

RELIABILITAS

Reliabilitas berarti konsistensi tes mengukur apa yang seharusnya diukur. Realibilitas tes perlu, tetapi tidak memadai sebagai syarat validitas tes. Agar supaya tes valid, maka dia harus reliabel. Namun demikian tes yang reliabel belum tentu valid.

Reabilitas merujuk pada konsitensi skor yang di capai oleh orang yang sama ketika mereka diuji-ulang dengan tes yang sama pada kesempatan yang berbeda, atau dengan seperangkat butir-butir ekuivalen (equivalent items) yang berbeda, atau di bawa kodisi pengujian yang berbeda. Konsep reliabilitas ini mendasari perhitungan kesalahan pengukuran atas skor tunggal, yang bisa kita pakai untuk memprediksi kisaran fluktuasi yang mungkin muncul dalam skor individual sebagai hasil dari faktor-faktor peluang yang tak diketahui atau irrelevan.

Dalam pengertian yang paling luas, reliabilitas tes menunjukkan sejauh mana perbedaan-perbedaan individual dalam skor tes dapat dianggap sebagai disebabkan oleh perbedaan yang sesungguhnya dalam karateristik yang dipertimbangkan dan sejauh mana dapat dianggap disebabkan oleh kesalahan peluang. Untuk menempatkannya dalam istilah yang lebih teknis, ukuran-ukuran reliabilitas tes memungkinkan untuk memperkirakan berapa proporsi dari varians total skor-skor tes yang merupakan varians kesalahan.

Pada dasarnya, koefisien korelasi (r) menyatakan derajat kesesuaian atau hubungan, antara dua perangkat skor. Dengan demikian, jika individu dengan skor top pada variabel 1 juga mendapatkan skor top pada variabel 2, individu nomor dua pada variabel dua dan seterisnya sampai pada individu paling buruk skornya dalam kelompok, lalu akan ada korolasi sempurna pada variabel 1 dan 2. korelasi seperti akan memiliki nilai + 1,00.

Ada tiga kategori koefisien reliabilitas, yaitu :

# Reliabilitas test-Retes

Menggunakan sebuah instrumen, namun diteskan dua kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya indeks reliabilitas. Teknik perhitungan yang digunakan sama dengan yang digunakan yaitu rumus korelasi Pearson.

# Reliabilitas Bentuk-Alternatif

Sejak awal peneliti harus sudah menyusun dua perangkat instrumen yang paralel (ekuivalen), yaitu dua buah instrumen yang disusun berdasarkan satu kisi-kisi. Setiap butir soal dari instrumen yang satu selalu harus dapat dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut diujicobakan semua. Sesudah kedua uji coba terlaksana, maka hasil kedua instrumen tersebut dihitung korelasinya dengan menggunakan rumus product moment (korelasi Pearson). Korelasi antara skor-skor yang didapatakan pada dua bentuk itu merupakan koefisien reliabilitas tes.

# Konsistensi Internal Ukuran Reliabilitas

Reliabilitas Belah-Separuh (Split-Half Reliability).

Peneliti boleh hanya memiliki seperangkat instrumen saja dan hanya diujicobakan satu kali, kemudian hasilnya dianalisis, yaitu dengan cara membelah seluruh instrumen menjadi dua sama besar.

Dilain pihak dalam reliablitas tes-retes dan reliabilitas bentuk-alternatif, tiap skor didasarkan pada jumlah soal penuh pada tes. Jika semua hal sama, semakin panjang sebuah tes, semakin dapat dihandalkan tes itu. Efek yang akan dihasilkan pada koefisiennya dengan memperpanjang atau memperpendek sebuah tes, dapat diperkirakan dengan rumus Spearman-Browon.

Reliabilitas Kuder-Richardson dan koefisien alpha

Untuk mendapatkan reliabilitas, yang juga menggunakan adminitrasi tunggal dari suatu bentuk tunggal, didasarkan pada konsistensi respons terhadap semua butir soal dalam tes. Konsistensi antar soal ini dipengaruhi oleh dua sumber varians kesalahan, yaitu pencuplikan isi (sebagaimana dalam bentuk-alternatif dan reliabilitas belah-separuh), dan heterogenitas dari domain perilaku yang disampelakan.

Reliabilitas Pemberi Skor

Sekarang seharusnya tampak bahwa berbagai jenis reliabilitas yang  berbeda-beda ini bevariasi dalam faktor-faktor yang  ada dibawah varians kesalahan. Faktor-faktor yang  disingkirkan dari ukuran-ukuran varians keslahan meliputi dua jenis, yaitu faktor-faktor yang variansnya harus tetap ada dalam skor karena faktor-faktor itu merupakan bagian dari perbedaan-perbadaan sejati yang  sedang diperhatikan, dan faktor tidak relevan yang  dapat dikendalikan secara eksperimental.

Bentuk akhir dari reliabilitas adalah konsistensi internal yang berfokus pada  konsistensi elemen internal tes. Metode estimasi reliabilitas memerlukan data dari dua sesi tes. Metode konsistensi internal dapat menggunakan data dengan satu tes, dan item harus homogen.

Rumus Kuder-Richardson

Tes yang lebih banyak lebih reliabel dari pada tes jumlahnya kecil, hal ini sesui dengan diterapkan dalam rumus Sperman–Brown. Lebih luas dari itu, digunakan indeks homogenitas skor binari item tes. Metode tersebut disebut metode Kunder-Richardson. Rumus K-R 21 kurang akurat dari pada K-R20.

Rumus Koefisien Alpha

Koefisien Alpha lain yang banyak digunakan ukuran homogenitas adalah koefisien alfa juga disebut Lee Cronbach alpha (1951). Koefisien Alpha memiliki aplikasi yang lebih luas dari pada rumus KR 20 dan hasilnya sama dengan ketika kita menggunakan rumus KR 20. Prosedurnya adalah menemukan varians semua skor individu untuk tiap soal dan kemudian menambahkan varians-varians ini sepanjang semua soal.

Peneliti menggunakan langkah-langkah Cronbach alpha ketika bernilai benar atau salah, seperti skala sikap atau nilai barang tes. Tes essai dapat mengambil berbagai nilai-nilai, misalnya, pada skala sikap Likert individu mungkin menerima skor dari I sampai 5 tergantung pada pilihan mana yang dipilih. Demikian pula, pada tes esai nomor yang berbeda poin mungkin ditugaskan untuk setiap jawaban.

Banyak program yang ada dalam komputer untuk menghitung uji validitas dan reliabilitas, salah satunya adalah program SPSS. Dalam SPSS langkah menentukan butir pertanyaan yang valid dapat dilakukan dengan mudah. Langkahnya adalah sebagai berikut :

Analyse>Scale>ReliabilityAnalisis
Pada bagian Statistic aktifkan kotak cek Item, Scale, Scale if item deleted,
Abaikan pilihan yang lain, klik Continue–OK. Cara baca output:
Lihat pada bagian Item-total statistic pada kolom Corrected Item Total Correlation, nilai-nilai tersebut menunjukkan nilai korelasi butir-butir pertanyaan terhadap skor totalnya. Nilai hitung tersebut dibandingkan dengan r tabel (lihat ditabel dengan terlebih dulu mencari df-nya (derajat kebebasan) sesuai dengan datanya dan asumsi spss akan menggunakan tingkat signifikansi 5%).

Standar Error Pengukuran

Realibilitas atau keandalan dari tes juga dapat dinyatakan dalam kesalahan standar pengukuran, yang memberikan perkiraan rentang variasi dalam rangkaian pengukuran yang berulang. Standard error dari pengukuran adalah indeks variabilitas yang diharapkan dalam memperoleh skor.

***

(Source : Fitriani Nur, Mahasiswa PPs UNM Makassar | Prodi Pendidikan Matematika, 2008)