Reliabilitas : Pengertian, Jenis-jenis dan Metode Pengujian Reliabilitas
A.
Pengertian Reliabilitas
Berikut ini pengertian Reliabilitas
menurut para Ahli:
1. Sugiono (2005)
Pengertian reliabilitas menurut Sugiono
adlah serangkaian pengukuran atau serangkaian alat ukur yang memiliki
konsistensi jika pengukuran yang dilakukan dengan alat ukur itu dilakukan
secara berulang. Reliabilitas tes, merupakan tingkat konsistensi suatu tes,
adalah sejauh mana tes dapat dipercaya untuk menghasilkan skor yang konsisten,
relatif tidak berubah meskipun diteskan pada situasi yang berbeda.
2. Nursalam (2003)
Pengertian reliabilitas menurut Nursalam
adalah kesamaan hasil pengukuran atau pengamatan jika fakta atau kenyataan
hidup tadi diukur atau diamati berulang kali dalam waktu yang berlainan.
3. Sukadji (2000)
Pengertian reliabilitas suatu tes
menurut Sukadji adalah sebarapa besar derajat tes mengukur secara konsisen
sasaran yang diukur. Reliabilitas dinyatakan dalam bentuk angka, biasana
koefiesien.
4. Gronlund dan Linn (1990)
Pengertian reliabilitas menurut Gronlund
dan Linn adalah ketepatan hasil yang diperoleh dari suatu pengukuran.
Pengertian Validitas Dan Reliabilitas
Menurut Para Ahli, Jenis, Prinsip, Cara Menghitung
5. Sugiono (2005) dalam Suharto (2009)
Pengertian reliabilitas menurut Sugiono
adalah serangkaian pengukuran atau serangkaian alat ukur yang memiliki
konsistensi bila pengukuran yang dilakukan dengan alat ukur itu dilakukan
secara berulang.
6. Anastasia dan Susana (1997)
Pengertian reliabilitas menurut
Anastasia dan Susana adalah sesuatu yang merujuk pada konsistensi skor yang
dicapai oleh orang yang sama ketika mereka diuji dengan tes yang sama pada
kesempatan yang berbeda, atau dengan seperangkat butir-butir ekuivalen
(equivalent items) yang berbeda, atau dibawah kondisi pengujian yang berbeda
7. Suryabrata (2004)
Pengertian reliabilitas menurut
Suryabrata adalah sejauh mana hasil pengukuran dengan alat tersebut dapat
dipercaya.
8. Walizer (1987)
Walizer menyebutkan pengertian
Reliability (Reliabilitas) adalah keajegan pengukuran.
9. John M. Echols dan Hasan Shadily
(2003: 475)
John M. Echols dan Hasan Shadily
reliabilitas adalah hal yang dapat dipercaya. Popham (1995: 21) menyatakan
bahwa reliabilitas adalah "...the degree of which test score are free from
error measurement"
10. Masri Singarimbun
Menurut Masri Singarimbun, realibilitas
adalah indeks yang menunjukkan sejauh mana suatu alat ukur dapat dipercaya atau
dapat diandalkan. Bila suatu alat pengukur dipakai dua kali – untuk mengukur
gejala yang sama dan hasil pengukuran yang diperoleh relative konsisten, maka
alat pengukur tersebut reliable. Dengan kata lain, realibitas menunjukkan
konsistensi suatu alat pengukur di dalam pengukur gejala yang sama.
11. Brennan (2001: 295)
Menurut Brennan reliabilitas merupakan
karakteristik skor, bukan tentang tes ataupun bentuk tes.
12. Sumadi Suryabrata (2004: 28)
Menurut Sumadi Suryabrata reliabilitas
menunjukkan sejauhmana hasil pengukuran dengan alat tersebut dapat dipercaya.
Hasil pengukuran harus reliabel dalam artian harus memiliki tingkat konsistensi
dan kemantapan.
Dalam pandangan Aiken (1987: 42) sebuah
tes dikatakan reliabel jika skor yang diperoleh oleh peserta relatif sama
meskipun dilakukan pengukuran berulang-ulang.
Dengan demikian, keandalan sebuah alat
ukur dapat dilihat dari dua petunjuk yaitu kesalahan baku pengukuran dan
koefisien reliabilitas. Kedua statistik tersebut masing-masing memiliki
kelebihan dan keterbatasan (Feldt & Brennan, 1989: 105)
Reliabilitas, atau keandalan, adalah
konsistensi dari serangkaian pengukuran atau serangkaian alat ukur. Hal
tersebut bisa berupa pengukuran dari alat ukur yang sama (tes dengan tes ulang)
akan memberikan hasil yang sama, atau untuk pengukuran yang lebih subjektif,
apakah dua orang penilai memberikan skor yang mirip (reliabilitas antar
penilai). Reliabilitas tidak sama dengan validitas. Artinya pengukuran yang
dapat diandalkan akan mengukur secara konsisten, tapi belum tentu mengukur apa
yang seharusnya diukur.
Dalam penelitian, reliabilitas adalah
sejauh mana pengukuran dari suatu tes tetap konsisten setelah dilakukan
berulang-ulang terhadap subjek dan dalam kondisi yang sama. Penelitian dianggap
dapat diandalkan bila memberikan hasil yang konsisten untuk pengukuran yang
sama. Tidak bisa diandalkan bila pengukuran yang berulang itu memberikan hasil
yang berbeda-beda.
Pengukuran reliabilitas dapat dilakukan
dengan menggunakan berbagai alat statistik (Feldt & Brennan, 1989: 105)
Berdasarkan sejarah, reliabilitas sebuah
instrumen dapat dihitung melalui dua cara yaitu kesalahan baku pengukuran dan
koefisien reliabilitas (Feldt & Brennan: 105). Kedua statistik di atas
memiliki keterbatasannya masing-masing. Kesalahan pengukuran merupakan
rangkuman inkonsistensi peserta tes dalam unit-unit skala skor sedangkan
koefisien reliabilitas merupakan kuantifikasi reliabilitas dengan merangkum
konsistensi (atau inkonsistensi) diantara beberapa kesalahan pengukuran.
Reliabilitas alat ukur tidak dapat
diketahui dengan pasti tetapi dapat diperkirakan. Dalam mengestimasi
reliabilitas alat ukur, ada tiga cara yang sering digunakan yaitu (1)
pendekatan tes ulang, (2) pendekatan dengan tes pararel dan (3) pendekatan satu
kali pengukuran.
Pendekatan tes ulang merupakan pemberian
perangkat tes yang sama terhadap sekelompok subjek sebanyak dua kali dengan
selang waktu yang berbeda. Asumsinya adalah bahwa skor yang dihasilkan oleh tes
yang sama akan menghasilkan skor tampak yang relatif sama. Estimasi dengan
pendekatan tes ulang akan menghasilkan koefisien stabilitas. Untuk memperoleh
koefisien reliabilitas melalui pendekatan tes ulang dapat dilakukan dengan
menghitung koefisien korelasi linear antara distribusi skor subyek pada
pemberian tes pertama dengan skor subyek pada pemberian tes kedua. Pendekatan
tes ulang sangat sesuai untuk mengukur ketrampilan terutama ketrampilan fisik.
B.
Jenis-jenis Reliabilitas
Walizer (1987) menyebutkan bahwa ada dua
cara umum untuk mengukur reliabilitas, yaitu:
1. Relibilitas stabilitas.
Menyangkut usaha memperoleh nilai yang
sama atau serupa untuk setiap orang atau setiap unit yang diukur setiap saat
anda mengukurnya. Reliabilitas ini menyangkut penggunaan indicator yang sama,
definisi operasional, dan prosedur pengumpulan data setiap saat, dan
mengukurnya pada waktu yang berbeda. Untuk dapat memperoleh reliabilitas
stabilitas setiap kali unit diukur skornya haruslah sama atau hampir sama.
2. Reliabilitas ekivalen.
Menyangkut usaha memperoleh nilai
relatif yang sama dengan jenis ukuran yang berbeda pada waktu yang sama.
Definisi konseptual yang dipakai sama tetapi dengan satu atau lebih indicator
yang berbeda, batasan-batasan operasional, paeralatan pengumpulan data, dan /
atau pengamat-pengamat.
Menguji reliabilitas dengan menggunakan
ukuran ekivalen pada waktu yang sama bias menempuh beberapa bentuk. Bentuk yang
paling umum disebut teknik belah-tengah. Cara ini seringkali dipakai dalam
survai.Apabila satu rangkaian pertanyaan yang mengukur satu variable dimasukkan
dalam kuesioner, maka pertanyaan-pertanyaan tersebut dibagi dua bagian persis
lewat cara tertentu. (Pengacakan atau pengubahan sering digunakan untuk teknik
belah tengah ini.) Hasil masing-masing bagian pertanyaan diringkas ke dalam
skor, lalu skor masing-masing bagian tersebiut dibandingkan. Apabila dalam skor
kemudian skor masing-masing bagian tersebut dibandingkan. Apabila kedua skor
itu relatif sama, dicapailah reliabilitas belah tengah.
Reliabilitas ekivalen dapat juga diukur
dengan menggunakan teknik pengukuan yang berbeda. Kecemasan misalnya, telah
diukur dengan laporan pulsa. Skor-skor relatif dari satu indikator macam ini
haruslah sesuai dengan skor yang lain. Jadi bila seorang subyek nampak cemas
pada ”ukuran gelisah” orang tersebut haruslah menunjukkan tingkatan kecermatan
relatif yang sama bila tekanan darahnya yang diukur.
C.
Metode Pengujian Reliabilitas
Tiga tehnik pengujian realibilitas
instrument antara lain :
1. Teknik Paralel (Paralel Form atau
Alternate Form)
Teknik paralel disebut juga tenik
”double test double trial”. Sejak awal peneliti harus sudah menyusun dua
perangkat instrument yang parallel (ekuivalen), yaitu dua buah instrument yang
disusun berdasarkan satu buah kisi-kisi. Setiap butir soal dari instrument yang
satu selalu harus dapat dicarikan pasangannya dari instrumen kedua. Kedua
instrumen tersebut diujicobakan semua. Sesudah kedua uji coba terlaksana, maka
hasil instrumen tersebut dihitung korelasinya dengan menggunakan rumus product
moment (korelasi Pearson).
2. Teknik Ulang (Test Re-test)
Disebut juga teknik ”single test double
trial”. Menggunakan sebuah instrument, namun dites dua kali. Hasil atau skor
pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya indeks
reliabilitas.Teknik perhitungan yang digunakan sama dengan yang digunakan pada
teknik pertama yaitu rumus korelasi Pearson.
Menurut Saifuddin Azwar, realibilitas
tes-retest adalah seberapa besat derajat skor tes konsisten dari waktu ke
waktu. Realibilitas diukur dengan menentukan hubungan antara skor hasil
penyajian tes yang sama kepada kelompok yang sama, pada waktu yang berbeda.
Metode pengujian reliabilitas stabilitas
yang paling umum dipakai adalah metode pengujian tes-kembali (test-retest).
Metode test-retest menggunakan ukuran atau “test” yang sama untuk variable tertentu
pada satu saat pengukuran yang diulang lagi pada saat yang lain. Cara lain
untuk menunjukkan reliabilitas stabilitas, bila kita menggunakan survai, adalah
memasukkan pertanyaan yang sama di dua bagian yang berbeda dari kuesioner atau
wawancara. Misalnya the Minnesota Multiphasic Personality Inventory (MPPI)
mengecek reliabilitas test-retest dalam satu kuesionernya dengan mengulang
pertanyaan tertentu di bagian-bagian yang berbeda dari kuesioner yang panjang.
Kesulitan terbesar untuk menunjukkan reliabilitas stabilitas adalah membuat asumsi bahwa sifat/ variable yang akan diukur memang benar-benar bersifat stabil sepanjang waktu. Karena kemungkinan besar tidak ada ukuran yang andal dan sahih yang tersedia. Satu-satunya faktor yang dapat membuat asumsi-asumsi ini adalah pengalaman, teori dan/atau putusdan terbaik. Dalam setiap kejadian, asumsi ini selalu ditantang dan sulit rasanya mempertahankan asumsi tersebut atas dasar pijakan yang obyektif.
3. Teknik Belah Dua (Split Halve Method)
Disebut juga tenik “single test single
trial”. Peneliti boleh hanya memiliki seperangkat instrument saja dan hanya
diujicobakan satu kali, kemudian hasilnya dianalisis, yaitu dengan cara
membelah seluruh instrument menjadi dua sama besar. Cara yang diambil untuk
membelah soal bisa dengan membelah atas dasar nomor ganjil-genap, atas dasar
nomor awal-akhir, dan dengan cara undian.
Menurut Saifuddin Azwar, realibilitas
ini diukur dengan menentukan hubungan antara skor dua paruh yang ekuivalen
suatu tes, yang disajikan kepada seluruh kelompok pada suatu saat. Karena
reliabilitas belah dua mewakili reliabilitas hanya separuh tes yang sebenarnya,
rumus Spearman-Brown dapat digunakan untuk mengoreksi koefisien yang didapat.
Apa penyebab ketidakandalan?
Ada beberapa sumber ketidakandalan
(unreliability), beberapa di antaranya telah dituangkan. Satu sumber
ketidakandalan yang terbesar adalah ketidaksahihan (invalidity). Berikut ini
adalah daftar periksa (check list) sumber-sumber yang menyebabkannya (Walizer
,1987) :
1. Orang atau unit yang diukur mungkin
telah berubah sejak pengukuran pertama dan kedua. (Tentu saja perubahan dalam
skor, haruslah ditafsirkan bukan sebagai ketidakandalan.)
2. Selama wawancara unit yang sedang
diukur berubah, karena:
a. Pewawancara memperoleh pengalaman
b. Kelelahan pewawancara
c. Subyek mengalami hal-hal yang
menyebabkan penafsiran mereka terhadap pertanyaan-pertanyaan berubah (sebagai
kebalikan dari perubahan seharusnya dari apa yang sedang diukur).
d. Kesalahan-kesalahan diperbuat.
3. Aspek situasi tempat pengukuran
berlangsung mungkin berubah sejak pengukuran pertama dan yang kedua. Hal-hal
seperti waktu (pagi, siang, sore), tempat berlangsungnya pengukuran,
orang-orang yang berada dekat di sekitar yang mungkin mempengaruhi respon
mereka dan sebagainya mungkin berbeda.
4. Pertanyaan-pertanyaan mungkin mendua
artinya, sehingga ditafsirkan secara berbeda pada saat pengisian kuesioner yang
berbeda.
5. Pengkode dan/atau pengamat mungkin
membuat penafsiran sendiri-sendiri.
6. Apa yang nampak sebagai satu teknik
ekivalen sebenarnya tidaklah demikian karena pemilihan pembandingan yang kurang
baik.
7. Terjadi kekeliruan dalam mencatat
hasil pengamatan atau memberi kode-kodenya.
8. Atau mungkin kombinasi
penyebab-penyebab terdahulu.
Sering kita dengar baik dalam kuliah
atau dalam ruang ujian, jawaban mahasiswa terhadap pertanyaan "Apa yang
dimaksud reliabilitas?" seperti ini: "Taraf Kepercayaan, yaitu
seberapa besar tes dapat dipercaya. Tes yang reliabel akan menghasilkan skor
yang relatif sama jika diteskan beberapa kali pada subjek yang sama . Dengan
kata lain seberapa ajeg sebuah tes jika diteskan beberapa kali pada subjek yang
sama di waktu yang berbeda."
Jika demikian adanya, maka secara logis,
satu-satunya cara untuk mengestimasi reliabilitas adalah dengan melakukan
pengetesan paling tidak dua kali pada sekelompok subjek yang sama. Tapi
benarkah begitu?
Pada prakteknya kita mengenal paling
tidak ada 3 pendekatan terhadap estimasi reliabilitas. Dan orang yang
memberikan jawaban seperti di atas juga memilih metode estimasi reliabilitas
yang hanya melakukan 1 kali administrasi tes. Jadi mana tingkat keajegannya?
Reliabilitas seperti yang sering
diucapkan atau ditulis di buku, memiliki arti tingkat kepercayaan. Kita coba
pilah kata ini menjadi Rely dan Ability atau dapat dipercaya. Tapi apa maksud
dari dapat dipercaya ini? Yang dimaksud dapat dipercaya disini adalah seberapa
besar kita bisa mempercayai hasil tes yang kita dapatkan, atau juga seberapa
besar tingkat kesalahan yang muncul ketika seseorang mengerjakan suatu tes.
Semakin besar tingkat kesalahan yang muncul ketika seseorang mengerjakan suatu
tes, hasil yang diperoleh dari tes tersebut makin tidak dapat dipercaya, makin
tidak reliabel.
Misalnya: seseorang dites (tes apa saja,
karena reliabilitas tidak terlalu peduli dengan isu materi yang diteskan)
kemudian memperoleh hasil sebesar 100. Nah jika tes tersebut reliabel, maka
kita bisa yakin bahwa kapasitas orang tersebut memang 100. Atau dengan kata
lain, angka 100 itu diperoleh bukan karena faktor lain selain kapasitas orang
tersebut. Jika angka 100 ini diperoleh lebih banyak karena faktor lain (faktor
lain ini yang disebut error), maka kita akan berkata bahwa tes tersebut tidak
reliabel.
Konsep reliabilitas didasarkan pada
asumsi bahwa dalam tiap pengetesan selalu ada
1. X, skor yang kita peroleh dari hasil
pengetesan (skor Tampak)
2. T, skor yang menggambarkan kapasitas
seseorang yang sesungguhnya (skor Murni)
3. e, faktor lain selain kapasitas yang
juga menyumbang terhadap perolehan X yang disebut juga error.
Dan ketiganya terkait satu sama lain
dalam persamaan seperti ini :
X = T + e
Ini dapat dibaca seperti berikut : dalam
setiap pengetesan, hasil tes yang kita peroleh merupakan fungsi penjumlahan
dari skor Murni dan error. Tes dapat dikatakan reliabel jika Tes menghasilkan
error yang kecil, sehingga hasil tes makin mencerminkan kapasitas yang sebenarnya
(atau X = T ).
Lalu dari mana ide "keajegan"
muncul?
Diasumsikan bahwa nilai T memiliki sifat
ajeg dalam beberapa kali pengukuran pada subjek yang sama. Tapi keajegan ini
hanya ada dalam abstraksi teoretik saja, karena keajegan yang dimaksud di sini
adalah keajegan T jika memenuhi syarat tertentu :
Tiap pengetesan bersifat saling
independen, pengukuran pertama tidak mempengaruhi pengukuran berikutnya. Jadi
anggaplah seseorang dites lalu dihipnotis untuk membuatnya lupa dengan jawaban
dan soal yang telah diberikan.
Kapasitas orang itu sendiri belum
berubah. Jadi keajegan ini hanya mungkin jika setelah dites, orang ini
dimasukkan dalam mesin waktu dan dikembalikan ke keadaannya saat dites pertama
kali.
Mustahil? Ya jelas! maka dari itu ide
mengenai keajegan ini hanya ada dalam abstraksi teoretik.
Namun demikian tentu saja kita tetap
dapat mengestimasi reliabilitas dengan cara melakukan tes berulang lalu
mengkorelasikan hasil tes pertama dengan tes kedua. Dengan mempertimbangkan
beberapa kelemahan dan persyaratannya.
Dari beberapa asumsi yang mendasari
pemikiran mengenai reliabilitas, kemudian diturunkanlah beberapa pendekatan
untuk mengestimasi reliabilitas.
1. Pendekatan Tes-Retes.
Pendekatan ini mengestimasi reliabilitas
tes dengan melakukan tes ulang, kemudian mengkorelasikan hasil tes pertama
dengan hasil tes kedua. Hasil korelasi ini yang merupakan estimasi
reliabilitasnya, sering juga disebut sebagai koefisien stabilitas atau
keajegan. Jadi definisi reliabilitas =keajegan hanya berlaku untuk pendekatan
ini. Tapi tentu saja karena tidak mungkin memenuhi persyaratan di atas,
pendekatan ini memiliki beberapa kelemahan, yaitu:
a. Hanya dapat diterapkan pada tes yang
mengukur konstruk yang bersifat cenderung ajeg, misalnya kepribadian.
b. Estimasi reliabilitas akan
dipengaruhi oleh adanya carry over effect. Maksudnya, jika jarak pengetesan
pertama dan kedua sangat dekat, maka subyek akan cenderung mengingat jawaban
yang diberikan pada pengetesan pertama. Ini membuat makin besarnya kemungkinan
subyek akan memberikan jawaban pada pengetesan kedua yang cenderung sama dengan
jawaban yang diberikan pada pengetesan pertama.Hal ini akan menyebabkan
overestimasi reliabilitas, tes terkesan/ terlihat lebih reliabel daripada yang
sebenarnya.
c. Estimasi reliabilitas juga
dipengaruhi adanya practice effect. Ini terjadi ketika subyek, dalam rentang
waktu antara tes pertama dan kedua, belajar atau berlatih untuk meningkatkan
kapasitasnya, ini terjadi khususnya dalam estimasi reliabilitas tes performansi
maksimal seperti tes prestasi. Practice effect akan menyebabkan underestimasi
reliabilitas, tes terkesan tidak ajeg karena adanya pembelajaran, sehingga
hasil tes kedua akan cenderung lebih baik dari hasil tes pertama.
2. Pendekatan Tes Paralel,
Pendekatan ini mengestimasi reliabilitas
dengan menggunakan dua tes paralel, dua tes yang mengukur hal /konstruk yang
sama, kemudian mengkorelasikan hasil pengetesan dari tes pertama dengan hasil
tes paralelnya. Koefisien korelasi yang didapatkan disebut juga koefisien
ekuivalensi. Namun demikian pendekatan ini sangat jarang (kalaupun ada)
dilakukan karena sulitnya menghasilkan dua tes yang benar-benar paralel.
3. Pendekatan Konsistensi Internal
Pendekatan ini mengestimasi reliabilitas
dengan membelah tes menjadi beberapa bagian, lalu "mengkorelasikan"
bagian-bagian tersebut. "Korelasi" di sini sebenarnya tidak
benar-benar mengkorelasikan bagian-bagian secara harafiah, tapi menggunakan
formula-formula yang dikembangkan untuk mengestimasi reliabilitasnya. Koefisien
yang diperoleh dinamai juga koefisien konsistensi internal. Pendekatan inilah
yang paling sering digunakan selama ini karena lebih praktis dan ekonomis.
Meskipun demikian pendekatan ini tidak dapat mengestimasi error yang
diakibatkan oleh keadaan temporer karena hanya dilakukan satu kali. Jadi
pendekatan ini memang bukan "jawaban terhadap segala masalah" dalam
hal mengestimasi reliabilitas.