Reliabilitas : Pengertian, Jenis-jenis dan Metode Pengujian Reliabilitas

A. Pengertian Reliabilitas

Berikut ini pengertian Reliabilitas menurut para Ahli:

1. Sugiono (2005)

Pengertian reliabilitas menurut Sugiono adlah serangkaian pengukuran atau serangkaian alat ukur yang memiliki konsistensi jika pengukuran yang dilakukan dengan alat ukur itu dilakukan secara berulang. Reliabilitas tes, merupakan tingkat konsistensi suatu tes, adalah sejauh mana tes dapat dipercaya untuk menghasilkan skor yang konsisten, relatif tidak berubah meskipun diteskan pada situasi yang berbeda.

2. Nursalam (2003)

Pengertian reliabilitas menurut Nursalam adalah kesamaan hasil pengukuran atau pengamatan jika fakta atau kenyataan hidup tadi diukur atau diamati berulang kali dalam waktu yang berlainan.

3. Sukadji (2000)

Pengertian reliabilitas suatu tes menurut Sukadji adalah sebarapa besar derajat tes mengukur secara konsisen sasaran yang diukur. Reliabilitas dinyatakan dalam bentuk angka, biasana koefiesien.

4. Gronlund dan Linn (1990)

Pengertian reliabilitas menurut Gronlund dan Linn adalah ketepatan hasil yang diperoleh dari suatu pengukuran.

Pengertian Validitas Dan Reliabilitas Menurut Para Ahli, Jenis, Prinsip, Cara Menghitung

5. Sugiono (2005) dalam Suharto (2009)

Pengertian reliabilitas menurut Sugiono adalah serangkaian pengukuran atau serangkaian alat ukur yang memiliki konsistensi bila pengukuran yang dilakukan dengan alat ukur itu dilakukan secara berulang.

6. Anastasia dan Susana (1997)

Pengertian reliabilitas menurut Anastasia dan Susana adalah sesuatu yang merujuk pada konsistensi skor yang dicapai oleh orang yang sama ketika mereka diuji dengan tes yang sama pada kesempatan yang berbeda, atau dengan seperangkat butir-butir ekuivalen (equivalent items) yang berbeda, atau dibawah kondisi pengujian yang berbeda

7. Suryabrata (2004)

Pengertian reliabilitas menurut Suryabrata adalah sejauh mana hasil pengukuran dengan alat tersebut dapat dipercaya.

8. Walizer (1987)

Walizer menyebutkan pengertian Reliability (Reliabilitas) adalah keajegan pengukuran.

9. John M. Echols dan Hasan Shadily (2003: 475)

John M. Echols dan Hasan Shadily reliabilitas adalah hal yang dapat dipercaya. Popham (1995: 21) menyatakan bahwa reliabilitas adalah "...the degree of which test score are free from error measurement"

10. Masri Singarimbun

Menurut Masri Singarimbun, realibilitas adalah indeks yang menunjukkan sejauh mana suatu alat ukur dapat dipercaya atau dapat diandalkan. Bila suatu alat pengukur dipakai dua kali – untuk mengukur gejala yang sama dan hasil pengukuran yang diperoleh relative konsisten, maka alat pengukur tersebut reliable. Dengan kata lain, realibitas menunjukkan konsistensi suatu alat pengukur di dalam pengukur gejala yang sama.

11. Brennan (2001: 295)

Menurut Brennan reliabilitas merupakan karakteristik skor, bukan tentang tes ataupun bentuk tes.

12. Sumadi Suryabrata (2004: 28)

Menurut Sumadi Suryabrata reliabilitas menunjukkan sejauhmana hasil pengukuran dengan alat tersebut dapat dipercaya. Hasil pengukuran harus reliabel dalam artian harus memiliki tingkat konsistensi dan kemantapan.

Dalam pandangan Aiken (1987: 42) sebuah tes dikatakan reliabel jika skor yang diperoleh oleh peserta relatif sama meskipun dilakukan pengukuran berulang-ulang.

Dengan demikian, keandalan sebuah alat ukur dapat dilihat dari dua petunjuk yaitu kesalahan baku pengukuran dan koefisien reliabilitas. Kedua statistik tersebut masing-masing memiliki kelebihan dan keterbatasan (Feldt & Brennan, 1989: 105)

Reliabilitas, atau keandalan, adalah konsistensi dari serangkaian pengukuran atau serangkaian alat ukur. Hal tersebut bisa berupa pengukuran dari alat ukur yang sama (tes dengan tes ulang) akan memberikan hasil yang sama, atau untuk pengukuran yang lebih subjektif, apakah dua orang penilai memberikan skor yang mirip (reliabilitas antar penilai). Reliabilitas tidak sama dengan validitas. Artinya pengukuran yang dapat diandalkan akan mengukur secara konsisten, tapi belum tentu mengukur apa yang seharusnya diukur.

Dalam penelitian, reliabilitas adalah sejauh mana pengukuran dari suatu tes tetap konsisten setelah dilakukan berulang-ulang terhadap subjek dan dalam kondisi yang sama. Penelitian dianggap dapat diandalkan bila memberikan hasil yang konsisten untuk pengukuran yang sama. Tidak bisa diandalkan bila pengukuran yang berulang itu memberikan hasil yang berbeda-beda.

Pengukuran reliabilitas dapat dilakukan dengan menggunakan berbagai alat statistik (Feldt & Brennan, 1989: 105)

Berdasarkan sejarah, reliabilitas sebuah instrumen dapat dihitung melalui dua cara yaitu kesalahan baku pengukuran dan koefisien reliabilitas (Feldt & Brennan: 105). Kedua statistik di atas memiliki keterbatasannya masing-masing. Kesalahan pengukuran merupakan rangkuman inkonsistensi peserta tes dalam unit-unit skala skor sedangkan koefisien reliabilitas merupakan kuantifikasi reliabilitas dengan merangkum konsistensi (atau inkonsistensi) diantara beberapa kesalahan pengukuran.

Reliabilitas alat ukur tidak dapat diketahui dengan pasti tetapi dapat diperkirakan. Dalam mengestimasi reliabilitas alat ukur, ada tiga cara yang sering digunakan yaitu (1) pendekatan tes ulang, (2) pendekatan dengan tes pararel dan (3) pendekatan satu kali pengukuran.

Pendekatan tes ulang merupakan pemberian perangkat tes yang sama terhadap sekelompok subjek sebanyak dua kali dengan selang waktu yang berbeda. Asumsinya adalah bahwa skor yang dihasilkan oleh tes yang sama akan menghasilkan skor tampak yang relatif sama. Estimasi dengan pendekatan tes ulang akan menghasilkan koefisien stabilitas. Untuk memperoleh koefisien reliabilitas melalui pendekatan tes ulang dapat dilakukan dengan menghitung koefisien korelasi linear antara distribusi skor subyek pada pemberian tes pertama dengan skor subyek pada pemberian tes kedua. Pendekatan tes ulang sangat sesuai untuk mengukur ketrampilan terutama ketrampilan fisik.

B. Jenis-jenis Reliabilitas

Walizer (1987) menyebutkan bahwa ada dua cara umum untuk mengukur reliabilitas, yaitu:

1. Relibilitas stabilitas.

Menyangkut usaha memperoleh nilai yang sama atau serupa untuk setiap orang atau setiap unit yang diukur setiap saat anda mengukurnya. Reliabilitas ini menyangkut penggunaan indicator yang sama, definisi operasional, dan prosedur pengumpulan data setiap saat, dan mengukurnya pada waktu yang berbeda. Untuk dapat memperoleh reliabilitas stabilitas setiap kali unit diukur skornya haruslah sama atau hampir sama.

2. Reliabilitas ekivalen.

Menyangkut usaha memperoleh nilai relatif yang sama dengan jenis ukuran yang berbeda pada waktu yang sama. Definisi konseptual yang dipakai sama tetapi dengan satu atau lebih indicator yang berbeda, batasan-batasan operasional, paeralatan pengumpulan data, dan / atau pengamat-pengamat.

Menguji reliabilitas dengan menggunakan ukuran ekivalen pada waktu yang sama bias menempuh beberapa bentuk. Bentuk yang paling umum disebut teknik belah-tengah. Cara ini seringkali dipakai dalam survai.Apabila satu rangkaian pertanyaan yang mengukur satu variable dimasukkan dalam kuesioner, maka pertanyaan-pertanyaan tersebut dibagi dua bagian persis lewat cara tertentu. (Pengacakan atau pengubahan sering digunakan untuk teknik belah tengah ini.) Hasil masing-masing bagian pertanyaan diringkas ke dalam skor, lalu skor masing-masing bagian tersebiut dibandingkan. Apabila dalam skor kemudian skor masing-masing bagian tersebut dibandingkan. Apabila kedua skor itu relatif sama, dicapailah reliabilitas belah tengah.

Reliabilitas ekivalen dapat juga diukur dengan menggunakan teknik pengukuan yang berbeda. Kecemasan misalnya, telah diukur dengan laporan pulsa. Skor-skor relatif dari satu indikator macam ini haruslah sesuai dengan skor yang lain. Jadi bila seorang subyek nampak cemas pada ”ukuran gelisah” orang tersebut haruslah menunjukkan tingkatan kecermatan relatif yang sama bila tekanan darahnya yang diukur.

C. Metode Pengujian Reliabilitas

Tiga tehnik pengujian realibilitas instrument antara lain :

1. Teknik Paralel (Paralel Form atau Alternate Form)

Teknik paralel disebut juga tenik ”double test double trial”. Sejak awal peneliti harus sudah menyusun dua perangkat instrument yang parallel (ekuivalen), yaitu dua buah instrument yang disusun berdasarkan satu buah kisi-kisi. Setiap butir soal dari instrument yang satu selalu harus dapat dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut diujicobakan semua. Sesudah kedua uji coba terlaksana, maka hasil instrumen tersebut dihitung korelasinya dengan menggunakan rumus product moment (korelasi Pearson).

2. Teknik Ulang (Test Re-test)

Disebut juga teknik ”single test double trial”. Menggunakan sebuah instrument, namun dites dua kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya indeks reliabilitas.Teknik perhitungan yang digunakan sama dengan yang digunakan pada teknik pertama yaitu rumus korelasi Pearson.

Menurut Saifuddin Azwar, realibilitas tes-retest adalah seberapa besat derajat skor tes konsisten dari waktu ke waktu. Realibilitas diukur dengan menentukan hubungan antara skor hasil penyajian tes yang sama kepada kelompok yang sama, pada waktu yang berbeda.

Metode pengujian reliabilitas stabilitas yang paling umum dipakai adalah metode pengujian tes-kembali (test-retest). Metode test-retest menggunakan ukuran atau “test” yang sama untuk variable tertentu pada satu saat pengukuran yang diulang lagi pada saat yang lain. Cara lain untuk menunjukkan reliabilitas stabilitas, bila kita menggunakan survai, adalah memasukkan pertanyaan yang sama di dua bagian yang berbeda dari kuesioner atau wawancara. Misalnya the Minnesota Multiphasic Personality Inventory (MPPI) mengecek reliabilitas test-retest dalam satu kuesionernya dengan mengulang pertanyaan tertentu di bagian-bagian yang berbeda dari kuesioner yang panjang.

Kesulitan terbesar untuk menunjukkan reliabilitas stabilitas adalah membuat asumsi bahwa sifat/ variable yang akan diukur memang benar-benar bersifat stabil sepanjang waktu. Karena kemungkinan besar tidak ada ukuran yang andal dan sahih yang tersedia. Satu-satunya faktor yang dapat membuat asumsi-asumsi ini adalah pengalaman, teori dan/atau putusdan terbaik. Dalam setiap kejadian, asumsi ini selalu ditantang dan sulit rasanya mempertahankan asumsi tersebut atas dasar pijakan yang obyektif.

3. Teknik Belah Dua (Split Halve Method)

Disebut juga tenik “single test single trial”. Peneliti boleh hanya memiliki seperangkat instrument saja dan hanya diujicobakan satu kali, kemudian hasilnya dianalisis, yaitu dengan cara membelah seluruh instrument menjadi dua sama besar. Cara yang diambil untuk membelah soal bisa dengan membelah atas dasar nomor ganjil-genap, atas dasar nomor awal-akhir, dan dengan cara undian.

Menurut Saifuddin Azwar, realibilitas ini diukur dengan menentukan hubungan antara skor dua paruh yang ekuivalen suatu tes, yang disajikan kepada seluruh kelompok pada suatu saat. Karena reliabilitas belah dua mewakili reliabilitas hanya separuh tes yang sebenarnya, rumus Spearman-Brown dapat digunakan untuk mengoreksi koefisien yang didapat.

Apa penyebab ketidakandalan?

Ada beberapa sumber ketidakandalan (unreliability), beberapa di antaranya telah dituangkan. Satu sumber ketidakandalan yang terbesar adalah ketidaksahihan (invalidity). Berikut ini adalah daftar periksa (check list) sumber-sumber yang menyebabkannya (Walizer ,1987) :

1. Orang atau unit yang diukur mungkin telah berubah sejak pengukuran pertama dan kedua. (Tentu saja perubahan dalam skor, haruslah ditafsirkan bukan sebagai ketidakandalan.)

2. Selama wawancara unit yang sedang diukur berubah, karena:

a. Pewawancara memperoleh pengalaman

b. Kelelahan pewawancara

c. Subyek mengalami hal-hal yang menyebabkan penafsiran mereka terhadap pertanyaan-pertanyaan berubah (sebagai kebalikan dari perubahan seharusnya dari apa yang sedang diukur).

d. Kesalahan-kesalahan diperbuat.

3. Aspek situasi tempat pengukuran berlangsung mungkin berubah sejak pengukuran pertama dan yang kedua. Hal-hal seperti waktu (pagi, siang, sore), tempat berlangsungnya pengukuran, orang-orang yang berada dekat di sekitar yang mungkin mempengaruhi respon mereka dan sebagainya mungkin berbeda.

4. Pertanyaan-pertanyaan mungkin mendua artinya, sehingga ditafsirkan secara berbeda pada saat pengisian kuesioner yang berbeda.

5. Pengkode dan/atau pengamat mungkin membuat penafsiran sendiri-sendiri.

6. Apa yang nampak sebagai satu teknik ekivalen sebenarnya tidaklah demikian karena pemilihan pembandingan yang kurang baik.

7. Terjadi kekeliruan dalam mencatat hasil pengamatan atau memberi kode-kodenya.

8. Atau mungkin kombinasi penyebab-penyebab terdahulu.

Sering kita dengar baik dalam kuliah atau dalam ruang ujian, jawaban mahasiswa terhadap pertanyaan "Apa yang dimaksud reliabilitas?" seperti ini: "Taraf Kepercayaan, yaitu seberapa besar tes dapat dipercaya. Tes yang reliabel akan menghasilkan skor yang relatif sama jika diteskan beberapa kali pada subjek yang sama . Dengan kata lain seberapa ajeg sebuah tes jika diteskan beberapa kali pada subjek yang sama di waktu yang berbeda."

Jika demikian adanya, maka secara logis, satu-satunya cara untuk mengestimasi reliabilitas adalah dengan melakukan pengetesan paling tidak dua kali pada sekelompok subjek yang sama. Tapi benarkah begitu?

Pada prakteknya kita mengenal paling tidak ada 3 pendekatan terhadap estimasi reliabilitas. Dan orang yang memberikan jawaban seperti di atas juga memilih metode estimasi reliabilitas yang hanya melakukan 1 kali administrasi tes. Jadi mana tingkat keajegannya?

Reliabilitas seperti yang sering diucapkan atau ditulis di buku, memiliki arti tingkat kepercayaan. Kita coba pilah kata ini menjadi Rely dan Ability atau dapat dipercaya. Tapi apa maksud dari dapat dipercaya ini? Yang dimaksud dapat dipercaya disini adalah seberapa besar kita bisa mempercayai hasil tes yang kita dapatkan, atau juga seberapa besar tingkat kesalahan yang muncul ketika seseorang mengerjakan suatu tes. Semakin besar tingkat kesalahan yang muncul ketika seseorang mengerjakan suatu tes, hasil yang diperoleh dari tes tersebut makin tidak dapat dipercaya, makin tidak reliabel.

Misalnya: seseorang dites (tes apa saja, karena reliabilitas tidak terlalu peduli dengan isu materi yang diteskan) kemudian memperoleh hasil sebesar 100. Nah jika tes tersebut reliabel, maka kita bisa yakin bahwa kapasitas orang tersebut memang 100. Atau dengan kata lain, angka 100 itu diperoleh bukan karena faktor lain selain kapasitas orang tersebut. Jika angka 100 ini diperoleh lebih banyak karena faktor lain (faktor lain ini yang disebut error), maka kita akan berkata bahwa tes tersebut tidak reliabel.

Konsep reliabilitas didasarkan pada asumsi bahwa dalam tiap pengetesan selalu ada

1. X, skor yang kita peroleh dari hasil pengetesan (skor Tampak)

2. T, skor yang menggambarkan kapasitas seseorang yang sesungguhnya (skor Murni)

3. e, faktor lain selain kapasitas yang juga menyumbang terhadap perolehan X yang disebut juga error.

Dan ketiganya terkait satu sama lain dalam persamaan seperti ini :

X = T + e

Ini dapat dibaca seperti berikut : dalam setiap pengetesan, hasil tes yang kita peroleh merupakan fungsi penjumlahan dari skor Murni dan error. Tes dapat dikatakan reliabel jika Tes menghasilkan error yang kecil, sehingga hasil tes makin mencerminkan kapasitas yang sebenarnya (atau X = T ).

Lalu dari mana ide "keajegan" muncul?

Diasumsikan bahwa nilai T memiliki sifat ajeg dalam beberapa kali pengukuran pada subjek yang sama. Tapi keajegan ini hanya ada dalam abstraksi teoretik saja, karena keajegan yang dimaksud di sini adalah keajegan T jika memenuhi syarat tertentu :

 Tiap pengetesan bersifat saling independen, pengukuran pertama tidak mempengaruhi pengukuran berikutnya. Jadi anggaplah seseorang dites lalu dihipnotis untuk membuatnya lupa dengan jawaban dan soal yang telah diberikan.

 Kapasitas orang itu sendiri belum berubah. Jadi keajegan ini hanya mungkin jika setelah dites, orang ini dimasukkan dalam mesin waktu dan dikembalikan ke keadaannya saat dites pertama kali.

Mustahil? Ya jelas! maka dari itu ide mengenai keajegan ini hanya ada dalam abstraksi teoretik.

Namun demikian tentu saja kita tetap dapat mengestimasi reliabilitas dengan cara melakukan tes berulang lalu mengkorelasikan hasil tes pertama dengan tes kedua. Dengan mempertimbangkan beberapa kelemahan dan persyaratannya.

Dari beberapa asumsi yang mendasari pemikiran mengenai reliabilitas, kemudian diturunkanlah beberapa pendekatan untuk mengestimasi reliabilitas.

1. Pendekatan Tes-Retes.

Pendekatan ini mengestimasi reliabilitas tes dengan melakukan tes ulang, kemudian mengkorelasikan hasil tes pertama dengan hasil tes kedua. Hasil korelasi ini yang merupakan estimasi reliabilitasnya, sering juga disebut sebagai koefisien stabilitas atau keajegan. Jadi definisi reliabilitas =keajegan hanya berlaku untuk pendekatan ini. Tapi tentu saja karena tidak mungkin memenuhi persyaratan di atas, pendekatan ini memiliki beberapa kelemahan, yaitu:

a. Hanya dapat diterapkan pada tes yang mengukur konstruk yang bersifat cenderung ajeg, misalnya kepribadian.

b. Estimasi reliabilitas akan dipengaruhi oleh adanya carry over effect. Maksudnya, jika jarak pengetesan pertama dan kedua sangat dekat, maka subyek akan cenderung mengingat jawaban yang diberikan pada pengetesan pertama. Ini membuat makin besarnya kemungkinan subyek akan memberikan jawaban pada pengetesan kedua yang cenderung sama dengan jawaban yang diberikan pada pengetesan pertama.Hal ini akan menyebabkan overestimasi reliabilitas, tes terkesan/ terlihat lebih reliabel daripada yang sebenarnya.

c. Estimasi reliabilitas juga dipengaruhi adanya practice effect. Ini terjadi ketika subyek, dalam rentang waktu antara tes pertama dan kedua, belajar atau berlatih untuk meningkatkan kapasitasnya, ini terjadi khususnya dalam estimasi reliabilitas tes performansi maksimal seperti tes prestasi. Practice effect akan menyebabkan underestimasi reliabilitas, tes terkesan tidak ajeg karena adanya pembelajaran, sehingga hasil tes kedua akan cenderung lebih baik dari hasil tes pertama.

2. Pendekatan Tes Paralel,

Pendekatan ini mengestimasi reliabilitas dengan menggunakan dua tes paralel, dua tes yang mengukur hal /konstruk yang sama, kemudian mengkorelasikan hasil pengetesan dari tes pertama dengan hasil tes paralelnya. Koefisien korelasi yang didapatkan disebut juga koefisien ekuivalensi. Namun demikian pendekatan ini sangat jarang (kalaupun ada) dilakukan karena sulitnya menghasilkan dua tes yang benar-benar paralel.

3. Pendekatan Konsistensi Internal

Pendekatan ini mengestimasi reliabilitas dengan membelah tes menjadi beberapa bagian, lalu "mengkorelasikan" bagian-bagian tersebut. "Korelasi" di sini sebenarnya tidak benar-benar mengkorelasikan bagian-bagian secara harafiah, tapi menggunakan formula-formula yang dikembangkan untuk mengestimasi reliabilitasnya. Koefisien yang diperoleh dinamai juga koefisien konsistensi internal. Pendekatan inilah yang paling sering digunakan selama ini karena lebih praktis dan ekonomis. Meskipun demikian pendekatan ini tidak dapat mengestimasi error yang diakibatkan oleh keadaan temporer karena hanya dilakukan satu kali. Jadi pendekatan ini memang bukan "jawaban terhadap segala masalah" dalam hal mengestimasi reliabilitas.

Iwan Ridwan

Thursday, 26 September 2019

Reliabilitas : Pengertian, Jenis-jenis dan Metode Pengujian Reliabilitas

About Iwan Ridwan

No comments:

Change The Language

Search This Blog

Artikel Populer

Bangun Ruang

Pengumuman

Statistik Tamu

Sebaran Pengunjung

Asal Pengunjung