.post-thumbnail{float:left;margin-right:20px}

Selasa, 10 Juni 2008

Validitas dan Reliabilitas

Dalam setiap penelitian selalu terjadi proses pengumpulan data dan dalam proses pengumpulan data tersebut akan menggunakan satu atau beberapa metode. Jenis metode yang dipilih dan digunakan dalam pengumpulan data, tentunya harus sesuai dengan sifat dan karakteristik penelitian yang dilakukan. Instrumen adalah alat yang digunakan untuk mengumpulkan data-data tersebut.
Instrumen dapat dianalogikan sebagai ujung tombak untuk membidik data dalam sebuah penelitian. Melalui instrumenlah akhirnya terkumpul data yang nantinya diolah menjadi sebuah informasi hasil penelitian. Untuk itulah, perlu kiranya memilih dan merumuskan instrumen secara tepat. Hal ini sejalan dengan ungkapan “garbage tool garbage result”.
 Jadi, pada dasarnya salah satu hal yang mempengaruhi hasil penelitian terletak pada instrumennya. Semakin baik konstruksi sebuah instrumen, maka semakin baik pula data yang berhasil dijaring, begitu pula sebaliknya.
sumber gambar: lukmanreza.blogspot.com

 
PEMBAHASAN

Sebelum diuraikan mengenai seluk beluk instrumen, maka akan diinformasikan terlebih dahulu judul buku yang dibahas dalam tugas ini, antara lain : Manajemen Penelitian (Suharsimi Arikunto), Menyusun dan Mengevaluasi Laporan Penelitian (Soetarlinah Sukadji), Reliabilitas dan Validitas (Saifuddin Azwar), dan Psychological Testing (Anne Anastasi dan Susana Urbina).
A.     Manajemen Penelitian (Suharsimi Arikunto)
1.       Validitas Instrumen (halaman 219)
Validitas adalah keadaan yang menggambarkan tingkat instrumen bersangkutan yang mampu mengukur apa yang akan diukur. Ada dua jenis validitas, yaitu :
a.      Validitas Logis
Apabila instrumen tersebut secara analisis akal sudah sesuai dengan isi dan aspek yang diungkapkan. Instrumen yang sudah sesuai dengan isi dikatakan sudah memiliki validitas isi, sedangkan instrumen yang sudah sesuai dengan aspek yang diukur dikatakan sudah memiliki validitas konstruksi.
b.      Validitas Empiris
2.      Reliabilitas Instrumen (halaman 220 – 222)
Ada tiga teknik untuk menguji reliabilitas instrumen, yaitu :
a.      Teknik Paralel (Paralel Form Atau Alternate Form)
Disebut juga teknik „double test double trial“. Sejak awal peneliti harus sudah menyusun dua perangkat instrumen yang paralel (ekuivalen), yaitu dua buah instrumen yang disusun berdasarkan satu kisi-kisi. Setiap butir soal dari instrumen yang satu selalu harus dapat dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut diujicobakan semua. Sesudah kedua uji coba terlaksana, maka hasil kedua instrumen tersebut dihitung korelasinya dengan menggunakan rumus product moment (korelasi Pearson).
b.      Teknik Ulang (test re-test)
Disebut juga teknik “single test double trial”. Menggunakan sebuah instrumen, namun diteskan dua kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya indeks reliabilitas. Teknik perhitungan yang digunakan sama dengan yang digunakan pada teknik pertama yaitu rumus korelasi Pearson.
c.      Teknik Belah Dua (split halve method)
1)      Disebut juga teknik “single test single trial”.  Peneliti boleh hanya memiliki seperangkat instrumen saja dan hanya diujicobakan satu kali, kemudian hasilnya dianalisis, yaitu dengan cara membelah seluruh instrumen menjadi dua sama besar. Cara yang diambil untuk membelah soal bisa dengan membelah atas dasar nomer ganjil-genap, atas dasar nomer awal-akhir, dan dengan cara undian.
B.     Menyusun dan Mengevaluasi Laporan Penelitian (Soetarlinah Sukadji)
1.       Validitas (halaman 30 – 31)
Validitas adalah derajat yang menyatakan suatu tes mengukur apa yang seharusnya diukur. Validitas suatu tes tidak begitu saja melekat pada tes itu sendiri, tetapi tergantung penggunaan dan subyeknya. Validitas dipecah lagi menjadi berbagai jenis yang akan dijabarkan berikut ini :
a.      Validitas Isi
Adalah seberapa besar derajat tes mengukur representasi isi yang dikehendaki untuk diukur. Validitas aitem berkaitan dengan apakah aitem mewakili pengukuran dalam area isi sasaran yang diukur, dan validitas sampling adalah seberapa baik sampel isi tes mewakili keseluruhan isi sasaran yang diukur. Biasanya dinilai dengan menggunakan pertimbangan pakar.
b.      Validitas Konstruk/Teoretik
Adalah seberapa besar derajat tes mengukur konstruk hipotesis yang dikehendaki untuk diukur. Konstruk adalah perangai yang tidak dapat diamati, yang menjelaskan perilaku. Menguji validitas konstruk mencakup uji hipotesis yang dideduksi dari suatu teori yang mengajukan konstruk tersebut.
c.      Validitas Konkruen
Validitas ini menunjukkan seberapa besar derajat skor tes berkorelasi dengan skor yang diperoleh dari tes lain yang sudah mantap, bila disajikan pada saat yang sama, atau dibandingkan dengan kriteria lain yang valid yang diperoleh pada saat yang sama.
d.      Validitas Prediktif
Adalah seberapa besar derajat tes berhasil memprediksi kesuksesan seseorang pada situasi yang akan datang. Validitas prediktif ditentukan dengan mengungkap hubungan antara skor tes dengan hasil tes atau ukuran lain kesuksesan dalam satu situasi sasaran.
2.      Reliabilitas (halaman 31 – 32)
Reliabilitas suatu tes adalah seberapa besar derajat tes mengukur secara konsisten sasaran yang diukur. Reliabilitas dinyatakan dalam bentuk angka, biasanya sebagai koefisien. Koefisien tinggi berarti reliabilitas tinggi.
Reliabilitas dapat dibagi lagi menjadi :
a.      Reliabilitas Tes Re-Tes
Adalah seberapa besar derajat skor tes konsisten dari waktu ke waktu. Reliabilitas diukur dengan menentukan hubungan antara skor hasil penyajian tes yang sama kepada kelompok yang sama, pada waktu yang berbeda.
b.      Reliabiltas Belah-Dua
Reliabiltas ini diukur dengan menentukan hubungan antara skor dua paruh yang ekuivalen suatu tes, ang disajikan kepada seluruh kelompok pada suatu saat. Karena reliabilitas belah dua mewakili reliabilitas hanya separuh tes yang sebenarnya, rumus Spearman-Brown dapat digunakan untuk mengoreksi koefisien yang didapat.
c.      Reliabilitas Rasional Ekuivalen
Reliabilitas ini tidak ditentukan menggunakan korelasi tetapi menggunakan estimasi konsistensi internal. Reliabilitas ini diukur menggunakan Kuder-Richardson, biasanya Formula-20 (KR-20) atau Formula-21 (KR-21). Kedua rumus ini hanya dapat dipakai untuk tes yang aitem-aitemnya diskor dikotomi, yaitu benar atau salah, 0 atau 1.
d.      Reliabilitas Penyekor/Penilai
Adalah reliabilitas dua (atau lebih) penyekor independen. Reliabilitas ini biasa ditentukan menggunakan teknik korelasi, tetapi juga dapat hanya dinyatakan dalam persentase kesepakatan.

C.     Reliabilitas dan Validitas (Saifuddin Azwar)
1.       Validitas (halaman 45 -  53)
a.      Validitas Isi
Merupakan validitas yang diestimasi lewat pengujian terhadap isi tes dengan analisis rasional atau lewat professional judgement. Pertanyaan yang dicari jawabannya dalam validasi ini adalah “sejauhmana aitem-aitem dalam tes mencakup keseluruhan kawasan isi (dengan catatan tidak keluar dari batasan tujuan ukur) objek yang hendak diukur” atau “sejauhmana isi tes mencerminkan ciri atribut yang hendak diukur”.
Selanjutnya validitas isi terbagi menjadi 2 (dua), yaitu :
1)       Validitas muka (face validity)
Tipe validitas yang paling rendah signifikansinya karena hanya didasarkan pada penilaian terhadap format penampilan (appearance) tes. Apabila penampilan tes telah meyakinkan dan memberikan kesan mampu mengungkap apa yang hendak diukur maka dapat dikatakan bahwa validitas muka telah terpenuhi.
2)       Validitas logik (logical/sampling validity)
Validitas ini menunjuk pada sejauh mana isi tes merupakan representasi dari ciri-ciri atribut yang hendak diukur. Untuk memperoleh validitas logik yang tinggi, suatu tes harus dirancang sedemikian rupa sehingga benar-benar berisi hanya aitem yang relevan dan perlu menjadi bagian tes secara keseluruhan. Penggunaan blueprint sangat membantu tercapainya validitas logik.
b.      Validitas Konstrak
Adalah tipe validitas yang menunjukkan sejauh mana tes mengungkap suatu trait atau konstrak teoritik yang hendak diukurnya (Allen & Yen, 1979).  Pengujian validitas konstrak merupakan proses yang terus berlanjut sejalan dengan perkembangan konsep mengenai trait yang diukur. Hasil estimasi validitas konstrak tidak dinyatakan dalam bentuk suatu koefisien validitas.
Dukungan terhadap adanya validitas konstrak, menurut Magnusson, dapat dicapai melalui beberapa cara antara lain :
1)      Studi mengenai perbedaan diantara kelompok-kelompok yang menurut teori harus berbeda
Apabila teori mengatakan bahwa antara suatu kelompok dengan kelompok lainnya harus memiliki skor yang berbeda.
2)      Studi mengenai pengaruh perubahan yang terjadi dalam diri individu dan lingkungannya terhadap hasil tes
Apabila teori mengatakan bahwa hasil tes dipengaruhi oleh kondisi subjek dikarenakan faktor kematangan.
3)      Studi mengenai korelasi diantara berbagai variabel yang menurut teori mengukur aspek yang sama
Studi ini dapat diperluas dengan mengikutsertakan korelasi antara berbagai skor tes yang mengukur aspek yang berbeda.
4)      Studi mengenai korelasi antaraitem atau antar belahan tes
Interkorelasi yang tinggi antarbelahan dari suatu tes dapat dianggap sebagai bukti bahwa tes mengukur satu variabel satuan (unitary variable).
c.      Validitas Berdasar Kriteria
Menghendaki tersedianya kriteria eksternal yang dapat dijadikan dasar pengujian skor tes. Suatu kriteria adalah variabel perilaku yang akan diprediksikan oleh skor tes atau berupa suatu ukuran lain yang relevan. Untuk melihat tingginya validitas berdasar kriteria dilakukan komputasi korelasi antara skor tes  dengan skor kriteria. Koefisien ini merupakan koefisien validitas bagi tes yang bersangkutan, yaitu rxy, dimana X melambangkan skor tes dan Y melambangkan skor kriteria.
Prosedur validasi berdasar kriteria menghasilkan dua macam validitas, yaitu :
1)       Validitas prediktif, sangat penting artinya bila tes dimaksudkan untuk berfungsi sebagai prediktor bagi performansi diwaktu yang akan datang.
2)       Validitas konkruen, apabila skor tes dan skor kriterianya dapat diperoleh dalam waktu yang sama, maka korelasi antara kedua skor termaksud merupakan koefisien validitas konkruen.
2.      Reliabilitas (halaman 36 – 43)
a.      Pendekatan Tes Ulang (test-retest)
Dilakukan dengan menyajikan tes dua kali pada satu kelompok subjek dengan tenggang waktu diantara kedua penyajian tersebut.  Asumsi yang menjadi dasar dalam cara ini adalah bahwa suatu tes yang reliabel tentu akan menghasilkan skor~tampak yang relatif sama apabila dikenakan dua kali pada waktu yang berbeda.
b.      Pendekatan Bentuk Paralel
Tes yang akan diestimasi reliabilitasnya harus ada paralelnya, yaitu tes lain yang sama tujuan ukurnya dan setara isi aitemnya baik secara kualitas maupun kuantitasnya. Dengan bahasa sederhana dapat dikatakan bahwa kita harus punya dua tes yang kembar. Sebenarnya, dua tes yang paralel hanya ada secara teoritik, tidak benar-benar paralel secara empirik.
Untuk membuat dua tes menjadi paralel, penyusunannya haruslah didasarkan pada satu spesifikasi yang sama. Secara empirik, kemudian dua tes yang paralel itu haruslah menghasilkan mean skor dan varians yang setara dan korelasi yang juga tidak berbeda dengan suatu variabel ketiga. Hanya itulah bukti terpenuhinya sifat paralel antara dua tes yang dapat diperoleh dalam penyusunan tes. Untuk membuktikan bahwa kedua tes menghasilkan dua skor murni yang sama bagi setiap subjek serta memberikan dua varians eror yang sama sebagaimana dituntut oleh teori skor murni klasikal, tidaklah dapat dilakukan.
c.      Pendekatan Konsistensi Internal
Dilakukan dengan menggunakan satu bentuk tes yang dikenakan hanya sekali saja pada sekelompok subjek (single trial administration). Dengan menyajikan satu tes hanya satu kali, maka problem yang mungkin timbul pada dua pendekatan reliabilitas terdahulu dapat dihindari.
Pendekatan reliabilitas konsistensi internal bertujuan melihat konsistensi antaraitem atau antarbagian dalam tes itu sendiri. Untuk itu, setelah skor setiap aitem diperoleh dari sekelompok subjek, tes dibagi menjadi beberapa belahan.
Untuk melihat kecocokan atau konkordansi diantara belahan-belahan tes dilakukan komputasi statistik melalui teknik-teknik korelasi, analisis varians antarbelahan, analisis varians perbedaan skor, dan lain-lainnya.
D.    Psychological Testing (Anne Anastasi dan Susana Urbina)
1.       Validitas (halaman 86 – 101)
a.      Prosedur Deskripsi-Isi
Pada dasarnya melibatkan pengujian sistematik atas isi tes untuk menetukan apakah tes itu mencakup sampel representatif dari domain perilaku yang harus diukur.
Validitas isi janganlah dikacaukan dengan validitas nominal (face validity). Validitas nominal bukanlah validitas dalam pengertian teknis; validitas ini merujuk pada apa yang nampaknya diukur. Validitas nominal berhubungan dengan apakah tes itu “kelihatan valid” bagi peserta tes yang mengikutinya.
Validitas nominal kerap kali dapat diperbaiki dengan merumuskan kembali butir-butir soal tes dalam istilah-istilah yang nampak relevan dan masuk akal dalam lingkungan tertentu dimana tes-tes itu akan digunakan.
b.      Prosedur Prediksi Kriteria
Prosedur validasi prediksi kriteria menunjukkan efektivitas sebuah tes untuk memprediksi kinerja seseorang dalam aktivitas-aktivitas tertentu. Ukuran kriteria yang menjadi tolak ukur validasi skor-skor tes divalidasikan bisa diperoleh pada saat yang hampir sama dengan pemberi skor tes atau setelah suatu interval ditetapkan.
Validitas prediksi kriteria kerapkali digunakan dalam studi-studi validasi lokal, yang padanya efektivitas sebuah tes untuk program tertentu harus dinilai. Validitas prediksi kriteria bisa dicirikan sebagai validitas praktis sebuah tes untuk maksud tertentu.
c.      Prosedur Identifikasi Konstruk
Validitas konstruk suatu tes adalah lingkup sejauhmana tes bisa dikatakan mengukur suatu konstruk atau sifat yang teoritis. Tiap konstruk dikembangkan untuk menjelaskan dan mengorganisir konsistensi-konsistensi respons yang teramati. Konstruk-konstruk tersebut berasal dari hubungan-hubungan tetap antara ukuran-ukuran perilaku. Validasi konstruk membutuhkan akumulasi informasi secara bertahap dari berbagai sumber.
2.      Reliabilitas (halaman 63 – 74)
Reliabilitas merujuk pada konsistensi skor yang dicapai oleh orang yang sama ketika mereka diuji-ulang dengan tes yang sama pada kesempatan yang berbeda, atau dengan seperangkat butir-butir ekuivalen (equivalent items) yang berbeda, atau di bawah kondisi pengujian yang berbeda.
a.      Reliabilitas Tes Retes
Metode paling jelas untuk menemukan reliabilitas skor tes adalah dengan mengulang tes yang sama pada kesempatan kedua. Reliabilitas tes ulang menunjukkan sejauh mana skor pada tes dapat digeneralisasikan untuk berbagai kesempatan yang berbeda; makin tinggi reliabilitasnya, makin rentanlah skor terhadap perubahan sehari-hari yang acak dalam kondisi peserta tes atau lingkungan testing.
b.      Reliabilitas Bentuk Alternatif
Satu cara untuk menghindari kesulitan yang ditemukan dalam reliabilitas tes dan tes ulang adalah melalui penggunaan bentuk-bentuk tes lainnya. Dengan demikian, orang yang sama bisa ditest dengan satu bentuk pada kesempatan pertama dan dengan bentuk lainnya yang ekuivalen pada kesempatan kedua. Korelasi antara skor-skor yang didapatkan pada dua bentuk itu merupakan koefisien reliabilitas tes. Perlu dicatat bahwa koefisien reliabilitas semacam itu adalah ukuran stabilitas temporal dan konsistensi respons terhadap berbagai butir soal contoh (atau bentuk-bentuk tes).
c.      Reliabilitas Belah Separuh (Split-Half Reliability)
Dengan cara ini, dua skor didapatkan untuk setiap orang dengan membagi tes menjadi paruhan-paruhan yang ekuivalen. Jenis reliabilitas ini kadangkala disebut koefisien konsistensi internal, karena hanya dibutuhkan penyelenggaraan tunggal atas satu bentuk tes saja.
Untuk mendapatkan reliabilitas belah-separuh, masalah pertamanya adalah bagaimana membagi tes dalam rangka mendapatkan paruhan-paruhan yang paling ekuivalen.
Efek yang akan dihasilkan pada koefisiennya dengan memperpanjang atau memperpendek sebuah tes, dapat diperkirakan dengan rumus Spearman-Brown, seperti berikut :
 rnn  =        nrtt
        
        1 + (n – 1)rtt
 
  rnn      : koefisien yang diperkirakan
                                      rtt       : koefisien yang diperoleh
                                      n        : jumlah waktu tes diperpanjang/diperpendek
Ketika diterapkan pada reliabilitas belah separuh, rumus ini selalu melibatkan penggandaan panjang tes. Dalam kondisi ini, rumus itu dapat disederhanakan sebagai berikut :
rtt =    2rhh
       1 + rhh
 

                             Untuk rhh adalah korelasi dari tes-tes paruhan
Metode alternatif untuk mendapatkan reliabilitas belah separuh dikembangkan oleh Rulon (1939). Hanya dibutuhkan varians dari perbedaan antara skor-skor tiap orang pada dua tes-tes separuh (SDx2) dan varians skor total (SDd2) dua nilai ini disubstitusikan dalm rumus berikut, yang menghasilkan reliabilitas seluruh tes secara langsung :
 rtt =            SDx2           
                  SDd2
1 –
                                    Menarik    untuk   memperhatikan   hubungan  rumus  ini    
                                 dengan   varians   kesalahan. Perbedaan  apapun antara  
                                 skor-skor     seseorang       pada       dua     tes   paruhan  
                                 menampilkan varians kesalahan atau varians yang tidak relevan. Varians-varians perbedaan-perbedaan ini, dibagi dengan varians skor-skor total, memberikan proporsi varians kesalahan dalam skor-skor itu. Ketika varians skor ini dikurangkan dari 1,00, hasilnya adalah proporsi varians “benar” untuk penggunaan tes tertentu, yang sama dengan koefisien reliabilitas.
d.      Reliabilitas Kuder-Richardson dan Koefisien Alpha
Metode ini didasarkan pada konsistensi respons terhadap semua butir soal dalam tes. Konsistensi antar soal ini dipengaruhi oleh dua sumber varians kesalahan : (1) pencuplikan isi (sebagaimana dalam bentuk alternatif dan reliabilitas belah separuh) ; dan (2) heterogenitas dari domain yang disampelkan. Semakin homogen domainnya, semakin tinggilah konsistensi antar soal.
Dari berbagai rumus yang diturunkan dalam artikel aslinya, rumus yang paling luas diterapkan, umumnya dikenal sebagai “rumus 20 Kuder-Richardson”, adalah sebagai berikut :
rtt =       n        SD t2   Î£pq
          n – 1            SD t2
                                                            rtt         : koefisien reliabilitas seluruh tes
                                                            n          : jumlah soal dalam tes
                                                            SDt      : simpangan baku skor-skor total tes
                                                            p          : proporsi orang-orang yang lulus
q          : proporsi orang-orang yang tidak lulus
Σpq      : hasil tabulasi antara p dan q
Rumus Kuder-Richardson dapat diterapkan pada tes-tes yang soal-soalnya diskor benar atau salah, atau tergantung pada suatu sistem all or none (semua atau tidak sama sekali) lainnya.
e.      Reliabilitas Pemberi Skor
Reliabilitas pemberi skor dapat ditentukan dengan memiliki sampel lembaran tes yang diskor secara terpisah oleh dua penguji. Dengan demikian dua skor yang didapatkan oleh masing-masing peserta tes ini kemudian dikorelasikan dengan cara biasa, dan koefisien korelasi yang dihasilkannya adalah ukuran reliabilitas pemberi skor. Jenis reliabilitas ini umumnya dihitung ketika instrumen-instrumen yang diskor secara subjektif digunakan dalam riset. 


ANALISIS BUKU
Sebuah instrumen yang valid belum tentu reliabel, tetapi instrumen yang reliabel sudah tentu valid. Pernyataan ini menandakan bahwa sebuah validitas dan reliabilitas adalah dua hal yang tidak dapat dipisahkan dalam pengkonstruksian sebuah instrumen, jika ingin dikatakan baik.
Hal tersebut secara implisit tergambar pada benang merah yang menjalin antara keempat buku yang telah diuraikan sebelumnya.
Pada buku karya Suharsimi Arikunto, validitas tidak dibahas secara mendalam bila dibandingkan dengan pembahasan reliabilitasnya, karena yang dibahas hanya tentang validitas logis tanpa dibarengi dengan validitas empiris. Namun, pada reliabilitasnya sudah dibahas mengenai tiga jenis reliabilitas, yaitu validitas paralel, ulang dan belah dua.
Sedikit berbeda dengan yang telah diuraikan Arikunto, pada buku karya Soetarlinah Sukardji, pembahasan mengenai validitas dan reliabilitasnya sudah jauh lebih luas. Karena pada bukunya validitas yang dibahas tidak hanya sekedar validitas logis saja, tetapi juga dibahas mengenai validitas isi, konstruk, konkruen, dan prediktif. Sedangkan pada pembahasan reliabilitasnya sama dengan pada pembahasan Arikunto, tetapi pada Sukardji ditambah dengan adanya reliabilitas rasional ekuivalen dan penyekor/penilai.
Pada buku karya Saifuddin Azwar, pembahasannya lebih mendalam sekali, karena bukunya memang secara khusus membahas tentang validitas  dan reliabilitas. Namun, pada dasarnya yang dibahas juga sama, hanya berbeda dari segi nama dan pengelompokkannya saja.
Tidak jauh berbeda dengan buku Azwar, buku karya Anastasi dan Urbina juga membahas secara luas dan mendalam mengenai validitas dan reliabilitas. Karena buku ini memang berisi tentang bagaimana membuat instrumen tes khususnya untuk tes psikologi. Apalagi didalamnya sudah terdapat rumus cara mencari reliabilitas secara komputasi/statistik.
Setelah melihat dan mengulas dari keempat buku yang sudah dijabarkan, maka dapat ditarik kesimpulan bahwa buku terakhir yaitu Psychological Testing karya Anne Anastasi dan Susana Urbina dapat dikatakan telah merangkum mengenai reliabilitas dari ketiga buku yang telah dijabarkan sebelumnya. Tetapi untuk pembahasan mengenai validitas Saifuddin Azwar lebih baik dan mendalam dibanding dengan Anastasi dan Urbina.
Jadi perumusan validitas dan reliabilitas yang baik dari kedua buku tersebut adalah sebagai berikut :
1.      Validitas secara sederhana dapat dikatakan sebagai sejauh mana sebuah instrumen dapat mengukur hal yang seharusnya diukur. Validitaspun dapat dipilah kembali menjadi beberapa jenis, seperti di bawah ini :
a.       Validitas Isi, selanjutnya validitas isi terbagi menjadi 2 (dua), yaitu :
1)       Validitas muka (face validity)
2)       Validitas logik (logical/sampling validity)
b.      Validitas Konstrak
Adalah tipe validitas yang menunjukkan sejauh mana tes mengungkap suatu trait atau konstrak teoritik yang hendak diukurnya (Allen & Yen, 1979).  Menurut Magnusson, dapat dicapai melalui beberapa cara antara lain :
1)      Studi mengenai perbedaan diantara kelompok-kelompok yang menurut teori harus berbeda
2)      Studi mengenai pengaruh perubahan yang terjadi dalam diri individu dan lingkungannya terhadap hasil tes
3)      Studi mengenai korelasi diantara berbagai variabel yang menurut teori mengukur aspek yang sama
4)      Studi mengenai korelasi antaraitem atau antar belahan tes
c.       Validitas Berdasar Kriteria
Menghendaki tersedianya kriteria eksternal yang dapat dijadikan dasar pengujian skor tes. Suatu kriteria adalah variabel perilaku yang akan diprediksikan oleh skor tes atau berupa suatu ukuran lain yang relevan.
Prosedur validasi berdasar kriteria menghasilkan dua macam validitas, yaitu  validitas prediktif dan konkruen.
2.      Reliabilitas
Reliabilitas merujuk pada konsistensi skor yang dicapai oleh orang yang sama ketika mereka diuji-ulang dengan tes yang sama pada kesempatan yang berbeda, atau dengan seperangkat butir-butir ekuivalen (equivalent items) yang berbeda, atau di bawah kondisi pengujian yang berbeda. Yang terdiri dari :
a.       Reliabilitas Tes Retes
b.      Reliabilitas Bentuk Alternatif
c.       Reliabilitas Belah Separuh (Split-Half Reliability)
d.      Reliabilitas Kuder-Richardson dan Koefisien Alpha
e.       Reliabilitas Pemberi Skor


KESIMPULAN

Kesimpulan yang dapat ditarik dari penjabaran di atas adalah sebagai  berikut :
1.      Validitas adalah sebuah proses yang harus dilalui instrumen agar dapat diketahui apakah instrumen yang sudah dikonstruksi telah mengukur aitem yang seharusnya diukur. Cara mengetahuinya melalui validitas isi (muka dan logik), konstrak, dan kriteria (prediktif dan konkruen).
2.      Reliabilitas adalah sebuah proses yang harus dilalui instrumen untuk mengetahui keandalan atau keajegan dari sebuah instrumen. Dengan kata lain, instrumen yang baik akan menarik jawaban/data yang sama walaupun diberikan di waktu dan kondisi yang berbeda. Cara mengetahuinya melalui reliabilitas tes retes, bentuk alternatif, belah dua, Kuder-Richardson dan koefisien alpha, dan pemberi skor.
3.      Instrumen adalah titik tolak atau salah satu hal utama yang mempengaruhi hasil akhir sebuah penelitian. Oleh karena itu, penggunaan atau pengkonstruksian yang salah akan berimbas pada penarikan data yang salah. Hal tersebut biasa dikenal dengan “garbage tool garbage result”.
4.      Instrumen yang sudah teruji secara validitas belum tentu teruji secara reliabilitas. Namun, bila instrumen tersebut sudah teruji secara reliabilitas, maka secara tidak langsung instrumen tersebut sudah pasti teruji secara validitas. Secara sederhana dapat dirumuskan valid belum tentu reliabel, tetapi reliabel sudah pasti valid.


DAFTAR PUSTAKA 
Anastasi, A & Susana Urbina. Psychological Testing. New Jersey : Prentice-Hall Inc, 1997.
Arikunto, Suharsimi. Manajemen Penelitian. Jakarta : Rineka Cipta, 1995.
Azwar, Saifuddin. Reliabilitas dan Validitas. Yogyakarta : Pustaka Pelajar, 2003.
Sukadji, Soetarlinah. Menyusun dan Mengevaluasi Laporan Penelitian, Jakarta : UI-Press, 2000.

38 komentar:

  1. panjang pisan....baca kesimpulannya ajah ah...

    BalasHapus
  2. kira2... saya narik kesimpulannya bener gak tuh mas ???

    Lebihnya tolong dikembaliin dan kurangnya tolong ditambahkan... ;D

    BalasHapus
  3. Kalo dengan asumsi data/sample yang diujikan semuanya sudah benar, kesimpulan nomor 3 benar, tapi kalo inputnya sudah salah, ya GIGO (Garbage In Garbage Out), kalee.... :)

    BalasHapus
  4. yeah... sepokat....

    tapi itukan berdasarkan asumsi... kalo berdasarkan konsumsi, kira2 kesimpulannya jadi gimana ya ??? hihihihi

    BalasHapus
  5. Wah, ni dia yang ku tunggu2,,

    makasi ya mba,,

    maap baru dibuka,, hehe makasi..makasi,,

    BalasHapus
  6. duh, gimane caranya validitas konstruk itu dan pengujian validitasnya?

    BalasHapus
  7. Pada dasarnya validitas konstruk itu validitas yang mempermasalahkan seberapa jauh item-item yang dibuat mampu mengukur apa yang benar-benar dimaksudkan hendak diukur sesuai dengan konstruk atau konsep khusus atau definisi konseptual yang telah ditetapkan.

    Pengujian validitasnya biasanya melalui expert judgement/panelis [minimal 3 orang].

    Tujuannya gak lain dan tidak bukan untuk mengetahui apakah instrumen yang dibuat dapat digunakan tanpa perbaikan, ada perbaikan, atau sepet2nya nih dirombak total...

    Begitu kire2... :)

    BalasHapus
  8. wuah, makasih jawabannya ^.^ ku bolak balik baca buku, kaga ngerti...satu buku bilang pengujiannya dengan analisis faktor, satu lagi judgment experiment, dll. jadi binun deh hehe

    BalasHapus
  9. analisis faktor itu tahapan selanjutnya stlh expert judgement....

    stlh dapat hasil dr expert [perlu revisi atau nggak], baru diujikan scr empiris kepada responden di lapangan. Yaitu dengan mengkorelasikan skor faktor dengan skor total. Trs hsl rhit dibandingkan dgn r kritis ==> valid apa nggak ?

    Valid pake... nggak buang... hehehe

    BalasHapus
  10. oh gitu ya ^.^ emang harus pake analisis faktor aja ya? ada analisis lain ga, misal analisis butir tuk dipake sebagai pengujian secara empiris? maaf neh nanya mulu..

    BalasHapus
  11. Btk instrumennya apaan ? trs yg mau diukur apa ?

    BalasHapus
  12. instrumennya berupa angket dgn pake skala likert. Yg mau diukur adalah derajat kecemasan dan bentuk strategi penanggulangan stress.

    Oleh karena itu aku pake validitas konstruk. Nah, setelah penjabaran dari kerangka konstruk itu dah beres. metode pengujiannya berupa apa ya? ku baca d litelatur itu adanya cuma analisis faktor aja, dimana mengkorelasikan item2 di satu faktor, dsb, dsb, namun ku pakenya kayanya analisis butir deh tapi ga punya alasannya apa..trz pake rumus rank spearman? *jadi bimbingan dot com gini*

    BalasHapus
  13. oooo... likert...

    gpp... yang mba pake ntu buat ngelihat konsistensi internal secara empirik dari item kan ? Yang jelas masalah konsep dah dilihat mll expert judgement. Untuk memperkuat alasan dihubungin dengan konsistensi atau validitas internal item aja... kira2 gitu

    Sukses ye...

    Btw, nguli dimana mba ?

    BalasHapus
  14. di psikologi unisba, mba ^.^ yup, kemarin ternyata dikasih tau pembimbing kalo validitas itu dibagi 2 yaitu analisisis kualitatif (melalui validitas konstruk) terus sama analisisi kuantitatif (korelasi antar item dengan skor total)

    Nah, pertanyaan berikutnya adalah bagaimana cara melihat alat ukur/instrumen kita vaid atau ga? dueeennkkk...q bingung lagi. adakah caranya?

    BalasHapus
  15. lah kan dah dibahas sblmnya... di materi postingan jg ada... :)

    BalasHapus
  16. apa... bersemut merah ???? gak gatel plus bentol2 mba ??? hehehe

    BalasHapus
  17. A Very good summary.
    Namun ada kesalahan statemen dibawah judul ANALISIS BUKU yaitu "Sebuah instrumen yang valid belum tentu reliabel, tetapi instrumen yang reliabel sudah tentu valid". Kesalahan yang sama tampak juga pada Kesimpulan nomor 4.
    Seharusnya pernyataannya adalah " Sebuah instrumen yang valid tentu reliabel, tetapi instrumen yang reliabel belum tentu valid".
    Di samping itu, pernyataan valid harus difahami dalam konteks interpretasi skor bukan instrumennya, sehingga istilah tes yang valid sebenarnya adalah tes yang mampu menghasilkan skor yang valid.
    Terimakasih,
    SA

    BalasHapus
  18. Tulisan ini sangat mendukung banget buat blog saya. Sy pasti segera add ke blog sy sbg referensi. datang ya ke blog sy di http://datamanipspss.blogspot.com datang ya ke blog saya

    BalasHapus
  19. thanks utk posting ini...
    tapi saya blum mengerti bgmn menjelaskan validitas isi dengan reliabilitasnya.
    Mohon penjelasan lebih lanjut yaa..
    THanks before

    BalasHapus
  20. Secara Statistik, bilamana instrumen itu dikatakan Reliabel..? (terutama untuk uji dengan KR-20/KR-21). Adakah Acuan bahwa dikatakan Reliabel bila r hitung > r tabel, sebagaimana dalam Validitas...? Ataukah berapapun nilai/angkanya, ya segitu pula reliabilitasnya...?

    Mohon Pejelasan, Terima Kasih.

    BalasHapus
  21. yops, sama aja dengan validitas. Untuk melihat reliabel atau gaknya instrumen adalah apakah r hitung > r tabel. Parameter yg dgunakan adalah tabel F atau tabel r untuk yang product moment

    BalasHapus
  22. bahasa mudahnya dari validitas isi adalah apakah konten yang ada dalam instrumen sudah sesuai dengan hal yang ingin diukur. Co. mau mengukur masalah motivasi, maka butir2 dalam instrumen ya mesti tentang motivasi.
    Makanya dalam validitas isi, tidak ada besaran dalam statistiknya. Valid atau nggaknya biasanya dilihat dari kisi-kisi instrumen yang dibuat. Apakah butir2 instrumen yang dibuat sudah proporsional dalam mengukur tiap indikator.


    Reliabilitas ==> ajeg, relatif stabil. dengan kata lain, suatu hasil pengukuran dapat dipercaya apabila dalam beberapa kali pelaksanaan pengukuran terhadap subyek yang sama, diperoleh hasil pengukuran yang relatif sama. Dengan catatan, selama aspek yang diukur dalam diri subyek memang belum berubah.

    maaf, lama banget dijawabnya...

    BalasHapus
  23. terima kasih sangat pak untuk apresiasi dan pelurusannya. Sangat tersanjung saya dengan kunjungan bapak ke blog saya ini. Sekali lagi terima kasih...

    BalasHapus
  24. Wah...agus niy,bisa sambilBelajar lagi.

    Kirimi materiMetlit yang laen dong....!!!!

    BalasHapus
  25. But...ada pendapat kalo reliabilitas itu berpatokan dengan pendapat bahwa bila nilai reliabilitas lebih dari 6.000, maka dapat dikatakan mempunyai reliabilitas yg tinggi.

    Benarkah pendapat ini...????

    BalasHapus
  26. mas agus semarang?

    Pendapatnya siapa? 1 aj reliabilitasnya dah tinggi kok, ngapain jg pakai teori yg > 6 (jk mmg ad teori yg dmkn) :D parsimoni-lah (klo ad teori yg sm efektifnya, mk plh yg lbh simple)

    *sy blm prnh bc teori yg tsb*

    BalasHapus
  27. mba, sy mau tanya dong, pengertian 7 teknik yang digunakan dalam estimasi reliabilitas, yaitu teknik belah dua, Rumus Rulon, Rumus Flanagan, Teknik KR-20, teknik KR-21, teknik analisis varian, dan koefisien alpha, itu apa ya?? di atas cuma dijelaskan beberapa saja..
    makasih sebelumnya mba'..:)

    BalasHapus
  28. semua yg kamu sampaikan biasa digunakan untuk hitung reliabilitas, kecuali analisis varian.
    1. teknik belah dua (splithalf) > biasa digunakan untuk hitung reliabilitas dari butir yang dikotomi ( 1 0). dalam penghitungannya, instrumen dibagi ke dalam 2 bagian. cara pembagiannya, bisa dengan cara dipisahkan antara butir ganjil dan genap atau dengan lgsg dibagi 2 dari jumlah seluruh butir
    2. Rulon sama dengan spithalf, dalam artian, pada proses penghitungannya sama2 menggunakan pilahan. hanya bedanya klo rulon perhitungan akhirnya adlh menggunakan variansi dari selisihnya
    3. flanagan, lebih panjang ngitungnya... hehe
    4. KR-20 dan KR-21 sama aja secara fungsi. Bedanya KR-20 lebih dahulu ditemukan formulanya drpd KR-21. selain itu dari hasil penghitungan, KR-20 hslnya lebih akurat dibanding KR-21
    5. alpha biasa digunakan u menghitung data dgn jenis politomi, contoh: skor 1 - 5

    Analisis varian: untuk menguji beda mean dgn data lbh dr 2 kel

    demikianlah... klo msh kurang jelas, silakan baca buku terkait aja ya :)

    BalasHapus
  29. makasih banyak ya mba, sangat membantu..:)

    BalasHapus
  30. sami2 ya... lagi buat skripsi ya mba? :)

    BalasHapus
  31. hehe..gag mba, dapat tugas dari dosen dsuruh cari pengertian 7 teknik d'atas itu.. :D

    BalasHapus
  32. ooooo... kuliah dmn? jd chat dimari deh tuh :D*

    BalasHapus
  33. hehe iya,,gag pa2 lah mba, biar rame juga blog nya :D
    univ.45 makassar mba :D , mba sndiri masih kuliah?

    BalasHapus
  34. hehe... jauh nian. alhamdulillah msh bs kuliah :D

    BalasHapus
  35. alhamdulillah kalo begitu mba :D
    mang mba nya kuliah dmn??

    BalasHapus
  36. Do you need Personal Loan?
    Business Cash Loan?
    Unsecured Loan
    Fast and Simple Loan?
    Quick Application Process?
    Approvals within 4 Hours?
    No Hidden Fees Loan?
    Funding in less than 72hrs
    Get unsecured working capital?
    Email us: fastloanoffer34@gmail.com
    Whats-app us on +918929509036

    BalasHapus

Dilarang keras berkomentar yang mengandung unsur saru dan sarkas