Monday, September 5, 2011

Kualitas Alat Evaluasi

BAB I
PENDAHULUAN
A. Latar Belakang
Bertitik tolak dari pendapat Galton Russefendi, 1980 : 53), bahwa dalam suatu kelompok individu siswa) yang tidak dipilih secara khusus mewakili karakteristik tertentu yang frekuensinya berdistribusi normal. Begitu pula kepandaian dalan suatu mata pelajaran tertentu. Salah satu cara untuk memperbaiki proses belajar mengajar yang paling efektif ialah dengan jalan mengevaluasi hasil belajar yang diperoleh dari proses belajar mengajar itu sendiri. Dengan kata lain, hasil tes itu kita olah sedemikian rupa sehingga dari hasil pengolahan itu dapat diketahui komponen-komponen manakah dari proses balajar mengajar yang masih lemah.
Untuk mendapatkan hasil evaluasi yang baik tentunya diperlukan alat evaluasi yang kualitasnya baik pula. Alat evaluasi yang baik dapat ditinjau dari hal-hal berikut ini, yaitu: validitas, daya pembeda, derajat kesukaran, efektivitas option, obyektivitas, dan praktikabilitas.
B. Rumusan Masalah
1.Bagaimana suatu tes hasil belajar dikatakan baik ?
2. Hal-hal apa yang mempengaruhi kualitas suatualat evaluasi ?

C. Tujuan Penulisan
1. Agar kita dapat menentukan kualitas suatu alat evaluasi yang baik.
2. Agar kita dapat mengetahui hal-hal apa saja yang mempengaruhi kualitas atau evaluasi sehingga dapat dikatakan baik
BAB II
PEMBAHASAN

Keberhasilan mengungkapkan hasil belajar dan proses belajar siswa sebagaimana adanya (objektivitas hasil penilaian)sangat bergantung pada kualitas alat penilainya disamping pada cara pelaksanaannya. Suatu alat evaluasi yang baik akan mencerminkan kemampuansebenarnya dari testi yang dievaluasi dan bisa membedakan yang pandai (diatas rata-rata), dan siswa yang kemampuannya sedang(pada kelompok rata-rata), dan siswa yang kemampuannya kurang (dibawah rata-rata), sehingga penyebaran skor atau nilai evaluasi tersebut berdistribusi normal).
A. Validitas
Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Suatu tes atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila alat tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya penhukuran tersebut. Tes yang menghasilkan data yang tidak relevan dengan tujuan pengukuran dikatakan sebagai tes yang memiliki validitas rendah.
Validitas suatu instrumen selalu bergantung kepada situasi dan tujuan khusus penggunaan instrumen tersebut. Suatu tes yang valid untuk satu situasi mungkin tidak valid untuk situasi yang lain. Sebagai contoh : menilai kemampuan siswa dalam matematika dan diberikan soal dengan kalimat yang panjang dan berbelit-belit sehingga sukar ditangkap maknanya. Akhirnya siswa tidak dapat menjawab karena tidak memahami pertanyaannya. Contoh lain adalah menilai kemampuan berbicara, tetapi ditanyakan tentang tata bahasa atau kesusastraan seperti puisi atau sajak. Penilaian tersebut tidak tepat (valid). Validitas tidak berlaku universal sebab bergantung pada situasi dan tujuan penilaian. Oleh sebab itu keabsahannya tergantung pada sejauh mana ketepatan alat evaluasi itu dalam melaksanakan fungsinya. Dengan demikian suatu alat evaluasi disebut valid jika ia dapat mengevaluasi dengan tepat sesuatu yang dievaluasi.
Validitas berdasarkan pelaksanaannya dapat dikelompokkan ke dalam dua jenis yaitu:
B.Validitas Teoritik
Validitas teoritik atau validitas logik adalaah validitas alat evaluasi yang dilakukan berdasarkan pertimbangan (judgement) teoritik atau logika yang dilakukan oleh para ahli atau orang yang dianggap ahli. Ada tiga macam validitas yang termasuk kedalam validitas teoritik ini yaitu :
Validitas Isi (Content Validity)
Validitas ini suatu alat evolusi artinya ketepatan alat tersebut ditinjau dari segi materi yang dievaluasikan, yaitu materi (bahan) yang dipakai sebagai alat evaluasi tersebut yang merupakan sampel representative dari pengetahuan yang harus diakui.
Validitas Muka (Face Validity)
Validitas muka suatu alat evolusi disebut pula validitas bentuk soal (pertanyaan, pernyataan, suruhan) atau validitas tampilan, yaitu keabsahan susunan kalimat atau kata-kata dalam soal sehingga jelas pengertiannya atau tidak menimbulkan tafsiran lain.
Validitas Konstruksi Psikologik (Construct Validity)
Pada umumnya alat evaluasi yang sering menyangkut validitas konstruksi ini berkenaan dengan aspek sikap, kepribadian, motivasi, minat, dan bakat.
Validitas Kriterium
Validitas ini diperoleh dengan melalui observasi atau pengalaman yang bersifat empirik, kriterium itu diperlukan untuk menentukan tinggi-rendahnya koefisien validitas alat evaluasi yang dibuat melalui perhitungan korelasi. Ada dua macam validitas yang termasuk ke dalam validitas kriterium ini, yaitu :
Validitas Banding (Concurrent Validity)
Validitas seringkali disebut validitas bersama. Misalnya alat evaluasi yang diselidiki va;iditasnya adalah tes matematika buatan guru (kita) dengan menggunakan kriterium nilai rata-rata harian atau nilai tes sumatif yang telah ada, dengan asumsi hasil evaluasi yang digunakan untuk kriterium itu telah mencerminkan kemampuan siswa sebenarnya. Kedua tes tersebut diberikan kepada subjek (siswa) yang sama. Apabila kedua nilai atau skor itu berkorelasi tinggi, maka tes yamh kita buat itu memiliki validitas yang tinggi pula.
Validitas Ramal (Predictive Validity)
Sebuah alat evaluasi dikatakan memiliki validitas ramal yang baik jika ia mempunyai kemampuan untuk meramalkan hal-hal yang akan terjadi dimasa akan datang.
Cara menentukan tingkat (indeks) validitas kriterium adalah dengan menghitung koefisien korelasi antara alat evaluasi yang akan diketahui validitasnya dengan alat ukur lain yang telah dilaksanakan dan diasumsikan telah memiliki validitas yang tinggi (baik). Cara mencari koefisien validitas dapat digunakan tiga macam cara yaitu :
1. Korelasi produk moment memakai simpangan.
2. Korelasi produk moment memakai angka dasar (raw score)
3. Korelasi metode (rank method correlation)
Faktor-faktor yang mempengaruhi validitas
Dalam hubungannya dengan kegiatan belajar mengajar matematika, faktor-faktor berikut ini akan dapat mengurangi fungsi pokok uji sesuai dengan yang diharapkan sehingga bisa merendahkan validitas alat evaluasi :
a. Petunjuk yang tidak jelas.
Petunjuk yang kurang jelas tentang hal-hal yang harus dilakukan oleh peserta uji (testi) cenderung akan mengurangi validitas.
b. Pembendaharaan kata dan struktur yang sukar
Terlalu banyak penggunaan kata yang kurang dikenal dan struktur kalimat yang berbelit-belit akan mengukur kemampuan berbahasa atau aspek intelegensi dari pada tingkah laku murid (testi) dalam aspek tertentu, misalnya matematika atau materi pelajaran yang lain. Oleh karena itudapat mengurangi validitas.
c. Penyusunan soal yang kurang baik.
Terutama dalam penyajian soal tipe objektif, sering kali kalimat yang disajikan memberi petunjuk pada jawaban yang benar atau tidak benar, sehingga jawabaannya mudah ditebak tanpa harus memahami konsep yang terkandung dalam soal itu.
d. Kekaburan
Pertanyaan yang kurang jelas maknanya atau bisa ditafsirkan dengan makna lain dapat membingungkan peserta tes, sehingga ia menjawab salah bukan karena tidak memahami konsep dalam soal tersebut, tetapi karena ketidak jelasan soal tersebut. Kekaburan sering kali membingungkan siswa yang pandai dari pada siswa yang kurang pandai.
Derajat kesukaran soal yang tidak cocok
Penyajian soal-soal yang sangat sukar akan mengakibatkan hasil yang jelek bagi kebanyakan atau bahkan semua peserta tes atau kebanyakan mendapat nilai baik. Hal ini bisa membedakan kemamouan siswa yang satu dengan yang lainnya. Dengan perkataan lain kemampuan siswa dalam aspek tertentu tidak terungkap sesuaidengan keadaan sebenarnya, oleh karena itu validitasnya rendah.
a. Materi tes tidak representatif
Jika kita menyajikan soal tes sedikit maka materi yang disajikan dalam tes itu tidak akan mewakili bahan pelajaran yang telah disajikan dan dipelajari siswa, sehingga faktor keberuntungan akan berperan. Siswa yang kebetulan mempelajari konsep yang sama dengan soal yang disajikan akan bisa megerjakan tes itu, sebaliknya jika ia lebih mendalami konsep lain yanh tidak disajikan dalam soal tes akan mendapat hasil tidak baik.
b. Pengaturan soal yang kurang tepat
Penyajian soal hendaknya disusun dariyang mudah menuju pada soal-soal yang sukar. Penempatan soal-soalyang sukar pada nomor-nomor awal dan energy untuk menjawab soal itu saja. Sehingga untuk mengerjakan soal lainnya sudah lelah dan waktunya bisa kepepet dan gugup.
c. Pola jawaban yang dapat diidentifikasi
Penempatan jawaban dalam soal tipe objektif menurut pola tertentu akan mendorong siswa untuk menebak jawaban, sehingga konsep dalam soal tidak dipikirkan lagi

B. Reabilitas
Reabilitas merupakan penerjemahan dari kata Reability yang mempunyai asal kata rely dan ability. Pengukuran yang memiliki reabilitas tinggi disebut sebagai pengukuran yang reliabel (reliable) walaupun reabilitas mempunyai berbagai nama lain seperti kepercayaan, keterandalan, kestabilan, konsistensi, dan sebagainya, namun ide pokok yang terkandung dalam konsep reabilitas adalan sejauh mana hasil suatu pengukuran dapat dipercaya.
Hasil pengukuran dapat dipercaya hanya apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subjek yang sama diperoleh hasil yang relatif sama, selama aspek yang diukur dalam diri subjek memang belum berubah. Dalam hal ini, relatif yang dimaksudkan tidak tepat sama, tetapi mengalami perubahan yang tak berarti (tidak signifikan)dan bisa diabaikan. Perubahan hasil evaluasi ini disebabkan adanya unsur pengalaman dari peserta tes dan kondisi lainnya.
Dari uaraian diatas dapat dipahami bahwa prinsip reliabilitas akan menyangkut pertanyaan : “ seberapa jauhkah pengukuran yang dilakukan cecara berulang kali terhadap subjek atau sekelompok subjek yang sama, memberikan hasil-hasil yang relatif tidak mengalami perubahan “. Bila hasil yang diperoleh selalu sama (setidak-tidaknya mendekati sama). Maka dapat dikatakan bahwa alat pengukur berupa tes tersebut telah memiliki reabilitas yang tinggi. Jadi perinsip reabilitas menghendaki adanya keakuratan dari hasil pengukuran yang berulang-ulang terhadap seorang subjek atau sekelompok subjek yang sama. Dengan catatan subjek-subjek yang diukur itu tidak mengalami perubahan.
Estimasi terhadap tingginya reabilitas dapat dilakukan melalui berbagai metode pendekatan. Masing-masing metode pendekatan dikembangkan sesuai dengan sifat dan fungsi alat ukur yang bersangkutan dengan mempertimbangkan dengan mempertimbangkan pula segi-segi praktisnya. Terdapat tiga macam pendekatan realibilitas yaitu :
1. Pendekatan tes ulang (test-retest)
Dalam pendekatan ini dilakukan dengan menyajikan tes dua kali pada satu kelompok subjek dengan tenggang waktu diantara kedua kajian tersebut. Asumsi yang menjadi dasar dalam cara ini adalah bahwa suatu tes yang reliabel tentu akan menghasilkan skor tampak yang relatif sama apabila dikenakan dua kali pada waktu yang berbeda. Semakin besar variasi perbedaan skor subjek antara kedua pengenaan itu berarti semakin sulit untuk mempercayai bahwa tes itu memberikan hasil ukur konsisten.
2. Pendekatan Bentuk Paralel (paralel-forms)
Tes bentuk paralel adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran, dan susunan tetapi butir-butir soalnya berbeda. Dengan bahasa sederhana dapat dikatakan bahwa kita harus punya dua tes yang kembar. Sebenarnya, dua tes yang paralel hanya ada secara teoritik, tidak benar-benar paralel secara empirik.
Pendekatan ini dilakukan dengan memberikan sekaligus dua bantuk tes yang paralel satu sama lain, kepada sekelompaok subjek. Dalam pelaksanaannya, kedua tes paralel itu dapat digabungkan terlebih dahulu seakan-akan merupakan suatu bentuk tes semula dipisahkan kembali untuk diberi skor masing-masing, sehingga diperoleh dua distribusi skor.
3. Pendekatan Tes Tunggal
Pendekatan tes tunggal dalam estimasi reliabilitas dimaksudkan, antara lain, untuk menghindari masalah-masalah yang biasaanya ditimbulkan oleh pendekatan tes-ulang dan oleh pendekatan bentuk paralel. Dalam menggunakan pendekatan ini prosedurnya hanya memerlukan satu kali pengenaan sebuah tes pada sekelompok individu sebagai subjek (single trial administration). Oleh karena itu pendekatan ini mempunyai nilai praktis dan efisiensi yang tinggi. Dengan hanya satu kali tes pengenaan tes akan diperoleh satu distribusi skor tes dari kelompok subjek bersangkutan.
Analisis data untuk pendekatan tes tunggal bisa dibagi kedalam dua macam teknik, yaitu :
1.1.Teknik Belah Dua
Dalam menentukan reabilitas suatu perangkat tes (evaluasi) dengan menggunakan teknik belah dua, dilakukan dengan jalan membelah alat evaluasi tersebut menjadi dua bagian yang sama (relatif sama), sehingga masing-massing tes memiliki dua macam skor. Salah satu syarat yang harus dipenuhi untuk teknik belah dua ini adalah jumlah soal dalam perangkat harus genap, supaya kedua bagian itu jumlah soalnya sama.
Teknik belah dua ini bisa dilakukan dengan dua cara, yaitu :
a.Pembelahan menurut nomor (soal) ganjil dan nomor genap atau disingkat Metode Ganjil-Genap. Misalkan suatu perangkat tes terdiri dari 20 butir soal, maka kelompok belahan pertama terdiri dari skor-skor untuk nomor 1, 3, 5, 7, 9, 11, 13, 15, 17, dan 19 sedangkan untuk kelompok kedua terdiri dari 2, 4, 6, 8, 10, 12, 14, 16, 18, 20.
b.Pembelahan menurut nomor urut yang disebut dengan metode awal-akhir. Misal perangkat tes terdiri dari 20 butir soal, maka kelompok bahan pertama terdiri dari skor-skor untuk nomor 1 sampai dengan 10 dan kelompok belahan kedua terdiri dari skor-skor untuk nomor 11 sampai dengan 20.
Untuk menentukan koefisien reliabilitas suatu alat evaluasi dengan teknik belah dua, ada tiga macam teknik perhitungan yaitu :

c.Formula Sperman-Brown
Prinsip penggunaan formula Sperman-Brown adalah dengan menghitung koefisien korelasi diantara kedua belahan sebagai koefisien reabilitas bagian (setengan) dari alat evaluasi tersebut, yang dinotasikan dengan r 11/12 untuk menghitungnya digunakan rumus produk moment dari karl person, yaitu :
r 11/12

Dengan n = banyak subjek
X¬1 = Kelompok data belahan pertama
X¬2 = kelompok data belahan kedua
Untuk menghitung koefisien reliabilitas alat evaluasi keseluruhan (satu perangkat), Sperman-Brown) mengemukakan rumus

c. Formula Flangan
Dalam penggunaan formula Flanangan tidak perlu memperhatikan syarat kesetaraan antara kedua belahan, karena formulanya tidak didasarkan atas nuilai korelasi antara kedua belahan tes, melainkan didasarkan atas varians masing-masing belahan dan varians totalnya.
Untuk menghitung koefisien reabilitas tes digunakan formula
........
d. Formula Rulon
Formula Rulon didasarkan atas konsep perbedaan antara skor subjek pada belahan pertama da kedua, yang dipandang sebagai kekeliruan dari proses evaluasi. Dengan demikian varians yang diperhitungkan adalah varians perbedaan skor kedua belahan itu, yaitu varians galat (error variance) adapun rumus yang digunakan adalah :

e. Teknik Non Belah Dua
Teknik non belah dua ini dikemukakan oleh Kuder dan Richardson. Mereka berpendapat bahwa teknik belah dua kurang baik dalam mencari koefisien reabilitas, sebab bisa dilakukan dengan cara berbeda sehingga menghasilkan nilai yang berbeda pula. Disamping itu dalam pelaksanaannya, teknik belah-dua sulit sekali memperoleh dua belahan yang setara satu sama lain. Untuk menghindari hal tersebut, Kuder dan Richardson mengemukakan cara untuk menghitung koefisien reabilitas tanpa membelah alat evaluasi menjadi dua bagian, tetapi membagi alat evaluasi menurut banyaknya butir soal yang disajikan, yaitu dengan cara menganalisis masing-masing soal itu.
Dalam teknik non belah-dua, Kuder dan Richardson mengemukakan dua buah rumus dalam menghitung koefisien reabilitas, yaitu :

Faktor-Faktor yang Mempengaruhi Reabilitas
Faktor-faktor yang mempengaruhi reabilitas alat evaluasi adalah sebagai berikut :
a.Panjang Tes
Pada umumnya makin panjang tes (butir soal makin banyak), makin tinggi pula reabilitasnya. Hal ini disebabkan karena tes yang butir soalnya lebih banyak akan memuat cukup banyak kemampuan kognitif siswa yang dapat diungkapkan.
b.Kondisi testi
Suatu tes yang dicobakan kepda peserta tes yang beraneka ragam kemampuannya akan menghasilkan skor yang heterogen, sehingga varians skor yang diperoleh akan besar. Hal ini akan mempengaruhi nilai koefisien reliabilitas sehingga menjadi lebih tinggi.
c.Kesukaran tes
Materi tes yang terlalu mudah atau sulit cenderung merendahkan reliabilitas. Hal ini disebabkan karena skor yang diperoleh siswa untuk soal yang terlalu sulit atau terlalu mudah berkelompok pada skor tinggi atau skor rendah, jadi sebaran skornya terbatas. Dalam kondisi ini, Perbedaan individual kecil sehingga koefisien reliabilitas cenderung rendah.
d.Pelaksanaan tes
Faktor yang bersifat administratif dalam melaksanakan tes akan mempengaruhi hasil tes, sehingga secara langsung akan mempengaruhi pula derajat reliabilitas tes tersebut, contoh :
Petunjuk yang diberikan sebelum tes dimulai, akan memberikan ketenangan kepada para peserta tes dalaam mengerjakan tes.
Pengawas yang tertib akan mempengaruhi hasil yang diberikan oleh siswa terhadap tes. Bagi siswa-siswa tertentu adanya pengawasan yang terlalu ketat menyebabkan rasa jengkel dan tidak dapat dengan leluasa mengerjakan tes.
Suasana lingkungan dan tempat tes yang akan mempengaruhi hasil tes.
Daya pembeda (Discriminating Power)
Daya pembeda adalah sebuah butir soal yang menyatakan seberapa jauh kemampuan butir soal tersebut mampu membedakan antara testi yang mengetahui jawabannya dengan benar dengan testi yang tidak menjawab soal tersebut (atau testi yang menjawab salah). Dengan kata lain daya pembeda butir soal adalah kemampuan butir soal itu untuk yang membedakan antara testi (siswa) yang pandai atau berkemampuan tinggi dengan siswa yang bodoh.
Pengertian tersebut didasarkan pada asumsi Galton bahwa suatu perangkat alat tes yang baik harus bisa membedakan antara siswa yang pandai, rata-rata, dan yang bodoh karena dalam suatu kelas biasanya terdiri dari ketiga kelompok tersebut.

No comments:

Post a Comment