Pengukuran&Penilaian

Posted: 05/03/2010 in Penilaian&Pengukuran
Tags:

Matapelajaran :   Pengukuran dan Penilaian

JAMINAN KUALITI

PRO-FOMA KURSUS ( Rangka Kursus )

Fakulti Pendidikan
Jabatan Praktik Mengajar
Program Diploma Perguruan Ugama Lepasan Ijazah
Kod Kursus PD 5215
Tajuk Kursus Pengukuran dan Penilaian
Jenis Kursus Wajib Fakulti
Jam Kredit 3 (2+1)
Kehadiran 100%
Isi Kandungan Kursus Cakupan kursus ini adalah seperti berikut: Jenis-jenis dan fungsi berbagai jenis ujian serta kebaikan dan kekurangan setiap jenis, merancang dan membina ujian, kepentingan taksonomi objektif pelajaran di dalam pembinaan ujian, jadual spesifikasi ujian, konsep statistik bagi membantu memahami tajuk-tajuk:  skala pengukuran, menginterpretasi dan melapor skor ujian, analisis item, kebolehpercayaan dan teori ujian klasik, kesahan ujian. Tajuk berikutnya ialah pendekatan rujukan norma dan kriteria dan konsep ujian prestasi.
Hasil Pembelajaran Kursus ini merupakan kursus pengenalan Penilaian dan Pengukuran formal di bilik darjah. Setelah mengikuti kursus ini, adalah diharapkan pelajar-pelajar:a. akan memperolehi pengetahuan dan kemahiran asas dalam bidang ini dan boleh mengaplikasinya dalam situasi sebenar di bilik darjah,b. boleh mengenalpasti masalah-masalah yang berkaitan,         c. mempunyai minat untuk terus mendalami dalam bidang ini untuk kepentingan diri dan masyarakat keseluruhan.
Penilaian

  1. Ujian pertengahan semester.
  2. Kerja kursus.
  3. Peperiksaan bertulis

Jumlah

30%30%40%

100%

PDG 2204 (2)/PD 5215 (3) Pengukuran dan Penilaian

Kuliah 1: 20 Jan 2009.

  1. Pengenalan konsep penilaian: Penilaian sebahagian daripada pengajaran/pembelajaran. Semasa kita mengajar kita sentiasa menilai murid.
  2. Penilaian formal dan tidak formal: penilaian pendidikan formal melibatkan aktiviti membina soalan, memarkah kertas jawapan, menyemak kualiti ujian dan lain-lain. Kursus ini hanya melibatkan penilaian formal.
  3. Ada berbagai cara mengkelaskan ujian, satu daripadanya ialah dari segi sama ada ujian itu objektif atau subjektif. Ujian objektif bermaksud pemarkahannya objektif.
  4. Dalam setiap profesion terdapat satu perkara pokok yang menjadi ‘bahan’ untuk dinilai. Dalam profesion kejuruteraan ‘bahan’ ialah mungkin kualiti bahan binaan, dalam profesion perundangan ‘bahan’ ialah mungkin kecekapan penyelesaian kes-kes mahkamah, dalam profesion pertanian ‘bahan’ ialah kualiti hasil pertanian contohnya kualiti padi, dalam profesion perguruan ‘bahan’ ialah pencapaian pelajar. Setiap guru akan sentiasa berminat mengenai status pencapaian muridnya.
  5. Dalam penilaian pendidikan ada dua model penilaian sebagai panduan guru. Model pertama penilaian melalui perbandingan antara individu pengambil ujian. Model ini mementingkan kedudukan individu berdasarkan pangkatan (ranking) sesama mereka. Adakah murid ‘A’ lebih baik daripada murid ‘B’, murid ‘B’ lebih baik daripada murid ‘C’ dan seterusnya. Model kedua berdasarkan kriteria yang telah ditetapkan oleh penilai, adakah pencapaian murid baik atau tidak baik berdasarkan kepada satu kriteria yang telah ditetapkan oleh guru.  Dua model penilaian inilah yang selalu diperaktikkan oleh guru di mana mungkin guru sendiri tidak menyedarinya yang mereka sedang menggunakan model pertama atau kedua dalam kerja-kerja memeriksa dan menggred ujian murid.
  6. Oleh kerana markah ujian melibatkan angka, guru tidak dapat lari daripada memahami konsep statistik terutamanya min (mean), varian (variance) dan sisihan lazim atau sisihan piawai (standard deviation).  Kalau guru mengajar dua kelas A dan B di mana setiap kelas terdapat 30 orang murid, guru boleh mengetahui prestasi muridnya melalui skor yang diperolehi. Kalau markah murid kelas A tersebar daripada 0 hingga markah penuh 100 dan kalau semua murid kelas B mendapat 40 markah setiap seorang maka guru boleh mengatakan sesuatu mengenai kebolehan muridnya dengan mencari nilai min dan sisihan lazim bagi setiap kelas. Min ialah purata atau ‘average’. Untuk mengira min, semua markah dicampur dan dibahagi dengan bilangan  murid.
  7. Dalam contoh di atas katakan murid kelas A minnya 50. Kelas B minnya sudah tentu 40. Oleh itu kita boleh katakan prestasi murid kelas A lebih baik daripada kelas B daripada segi min. Tetapi kalau daripada segi sisihan lazimnya mungkin kelas B lebih baik kerana semua murid mendapat 40 markah.
  8. Dalam contoh di atas sisihan lazim bagi kelas B ialah kosong kerana setiap murid mendapat markah yang sama. Bagi kelas A sisihan lazimnya boleh dikira. Apa makna sisihan lazim? Iaitu purata tersisihnya setiap skor daripada min. Untuk mengira sisihan lazim: setiap skor di tolak min,hasilnya  diganda dua, hasilnya dijumlahkan, jumlah tersebut di bahagi dengan bilangan murid.  Kalau sisihan daripada min tidak diganda dua, hasil jumlah sisihan ini akan menjadi kosong.

5(2) = 5 (x-7)(2)

N

2 = Sisihan Lazim (Standred Variation)

Varian: Purata sisihan ganda dua dari Mean

Anology: sain Tulin

Perbezaan dalam mengukur meja: kesalahan / ralat / errois

  1. 5 kaki
  2. 4.3 kaki
  3. 4.7 kaki

Setiap orang akan lari dari kebenaran yang sebenar dalam mengukur (quantify): score sebenar.

Sebab alat / sebab mata / sebab tempat mengukur dan lain-lain.

Dr. Mokhtar Ismail

PDG 2204 (2)/PD 5215 (3) Pengukuran dan Penilaian

Kuliah 1: 20 Jan 2009.

  1. Pengenalan konsep penilaian: Penilaian sebahagian daripada pengajaran/pembelajaran. Semasa kita mengajar kita sentiasa menilai murid.
  2. Penilaian formal dan tidak formal: penilaian pendidikan formal melibatkan aktiviti membina soalan, memarkah kertas jawapan, menyemak kualiti ujian dan lain-lain. Kursus ini hanya melibatkan penilaian formal.
  3. Ada berbagai cara mengkelaskan ujian, satu daripadanya ialah dari segi sama ada ujian itu objektif atau subjektif. Ujian objektif bermaksud pemarkahannya objektif.
  4. Dalam setiap profesion terdapat satu perkara pokok yang menjadi ‘bahan’ untuk dinilai. Dalam profesion kejuruteraan ‘bahan’ ialah mungkin kualiti bahan binaan, dalam profesion perundangan ‘bahan’ ialah mungkin kecekapan penyelesaian kes-kes mahkamah, dalam profesion pertanian ‘bahan’ ialah kualiti hasil pertanian contohnya kualiti padi, dalam profesion perguruan ‘bahan’ ialah pencapaian pelajar. Setiap guru akan sentiasa berminat mengenai status pencapaian muridnya.
  5. Dalam penilaian pendidikan ada dua model penilaian sebagai panduan guru. Model pertama penilaian melalui perbandingan antara individu pengambil ujian. Model ini mementingkan kedudukan individu berdasarkan pangkatan (ranking) sesama mereka. Adakah murid ‘A’ lebih baik daripada murid ‘B’, murid ‘B’ lebih baik daripada murid ‘C’ dan seterusnya. Model kedua berdasarkan kriteria yang telah ditetapkan oleh penilai, adakah pencapaian murid baik atau tidak baik berdasarkan kepada satu kriteria yang telah ditetapkan oleh guru.  Dua model penilaian inilah yang selalu diperaktikkan oleh guru di mana mungkin guru sendiri tidak menyedarinya yang mereka sedang menggunakan model pertama atau kedua dalam kerja-kerja memeriksa dan menggred ujian murid.
  6. Oleh kerana markah ujian melibatkan angka, guru tidak dapat lari daripada memahami konsep statistik terutamanya min (mean), varian (variance) dan sisihan lazim atau sisihan piawai (standard deviation).  Kalau guru mengajar dua kelas A dan B di mana setiap kelas terdapat 30 orang murid, guru boleh mengetahui prestasi muridnya melalui skor yang diperolehi. Kalau markah murid kelas A tersebar daripada 0 hingga markah penuh 100 dan kalau semua murid kelas B mendapat 40 markah setiap seorang maka guru boleh mengatakan sesuatu mengenai kebolehan muridnya dengan mencari nilai min dan sisihan lazim bagi setiap kelas. Min ialah purata atau ‘average’. Untuk mengira min, semua markah dicampur dan dibahagi dengan bilangan  murid.
  7. Dalam contoh di atas katakan murid kelas A minnya 50. Kelas B minnya sudah tentu 40. Oleh itu kita boleh katakan prestasi murid kelas A lebih baik daripada kelas B daripada segi min. Tetapi kalau daripada segi sisihan lazimnya mungkin kelas B lebih baik kerana semua murid mendapat 40 markah.
  8. Dalam contoh di atas sisihan lazim bagi kelas B ialah kosong kerana setiap murid mendapat markah yang sama. Bagi kelas A sisihan lazimnya boleh dikira. Apa makna sisihan lazim? Iaitu purata tersisihnya setiap skor daripada min. Untuk mengira sisihan lazim: setiap skor di tolak min,hasilnya  diganda dua, hasilnya dijumlahkan, jumlah tersebut di bahagi dengan bilangan murid.  Kalau sisihan daripada min tidak diganda dua, hasil jumlah sisihan ini akan menjadi kosong.

Dr. Mokhtar Ismail

PDG 2204 (2)/PD 5215 (3) Pengukuran dan Penilaian

Kuliah 2: 27 dan 30 Jan 2010.

1.  Empat istilah penting yang berkait dengan kursus ini ialah penilaian, pengukuran, ujian dan pentaksiran. Masing-masing membawa maksud yang berbeza.

2. Dalam setiap aktiviti pengukuran terdapat dua komponen, iaitu ‘alat’ atau instrumen pengukur dan ‘benda’ yang diukur atau atribut. Contohnya:

‘Alat’ pengukur ‘Benda’ yang diukur  (atribut)
1 Pita pengukur Panjang meja
2 Thermometer Suhu
3 Mesin penimbang Berat gula
4 Speedometer Kelajuan kereta
5 Item-item ujian Pencapaian/kecerdasan

3. Dalam contoh di atas alat 1 hingga 4 berhubung dengan sains tulen dan alat 5 berhubung dengan sains sosial. Dalam sains sosial pengukuran lebih berkait dengan ‘minda’ manusia, oleh itu memerlukan peraturan berbeza dari segi pengukuran berbanding sains tulen.

4. Pengukuran bermakna memberi angka kepada sesuatu atribut. Oleh itu pengukuran adalah objektif. Sebaliknya penilaian adalah subjektif. Penilaian=pengukuran + nilai.

5. Pentakasiran pula adalah sama erti dengan penilaian, tetapi ada juga buku yang mengatakan berbeza, iaitu pentaksiran lebih luas daripada penilaian.

6. Pengukuran atribut di dalam bidang sains sosial termasuk pendidikan berbeza daripada pengukuran di dalam bidang sains tulin kerana pengukuran di dalam pendidikan adalah tidak terus. Contohnya untuk mengukur pencapaian pelajar: guru perlu membina ujian, murid menjawab ujian, guru memarkah atau menskor ujian, akhir sekali barulah murid diberi tahu skor mereka. Sebaliknya untuk mengukur berat, kita boleh terus melihat angka yang memberi tahu berat kita apabila berdiri di atas mesin penimbang.

7. Oleh kerana kesukaran di dalam proses pengukur pencapaian pelajar, guru perlu merancang ujian mereka di dalam kelas. Terdapat empat langkah utama di dalam merancang ujian: (a) menentukan tujuan ujian, (b) membina jadual spesifikasi, (c) memilih jenis-jenis item yang sesuai, dan (d) membuat pertimbangan di dalam memilih item yang sesuai (muka 128 buku saya).

8. Satu ciri di dalam jadual spesifikasi ialah taksonomi objektif pengajaran domain kognitif (muka 106 buku saya). Taksonomi bermaksud pengkelasan. Taksonomi bertujuan untuk memandu pembina ujian mengagak kesukaran item ujian binaannya. Contohnya: item ujian peringkat ‘APLIKASI’ adalah dijangka lebih sukar daripada item ujian peringkat ‘PENGETAHUAN’ (lihat nota Taksonomi Bloom).

PDG 2204 (2)/PD 5215 (3) Pengukuran dan Penilaian

Kuliah 3: 03 dan 06 Feb 2010.

1. Tyler (1991) menyatakan empat perkara yang perlu dilakukan semasa pengajaran: bermula daripada penyediaan objektif pengajaran, menyemak dan mengorganisasi pengalaman murid, dan seterusnya menilai pencapaian mereka. Penilaian merupakan komponen penting dalam pengajaran.

2. Yang terlibat di dalam pengajaran ialah proses perubahan tingkah laku yang di antaranya melibatkan pemikiran pelajar: daripada tidak tahu kepada tahu tentang perkara yang diajar. Kalau semasa mula mengajar kita menetapkan objektif, maka sama juga apabila mula menguji perlu dimulakan dengan objektif pengujian. Biasanya objektif pengujian berbeza daripada objektif pengajaran. Contohnya tujuan ujian ialah untuk  mendiagnos kelemahan pelajar, untuk mengasingkan pelajar mengikut kebolehan, untuk mengetahui kesediaan mereka sebelum diajar tajuk baharu.

3. Ada empat langkah penting dalam merancang ujian: menentukan tujuan ujian, membina jadual spesifikasi, memilih item ujian yang sesuai, membina item berkenaan.

4. Jadual spesifikasi ialah satu ‘blueprint’ yang mempunyai maklumat tentang topik-topik ujian serta pada aras mana item ujian ditanya berdasarkan taksonomi objektif pengajaran. Jadual ini penting kepada guru dalam mempastikan ujian yang dibina adalah sah dari segi isi atau konten.

5. Ujian boleh dikelasifikasi kepada berbagai jenis iaitu dimulakan dengan ujian kertas & pensil dan ujian prestasi. Bagi ujian kertas & pensil terdapat ujian objektif dan subjektif. Bagi ujian prestasi pula terdapat ujian berorientasikan proses dan produk. Setiap jenis ada kekuatan dan kelemahan masing-masing dari aspek pelaksanaannya.

6. Untuk menganalisis skor ujian, pengetahuan ilmu statistik diperlukan. Tiga operator penting: min, varian dan sisihan piawai (lazim) telah dibincang menggunakan contoh mudah iaitu sebaran kekerapan bagi Kelas A (saiz sampel ialah 5, min=3, varian=2), Kelas B (saiz sampel ialah 5, min=3, varian=0) dan Kelas C (saiz sampel ialah 10, min=2.5). Geraf bagi sebaran kekerapan kelas A, B dan C telah dibincang.  Konsep sisihan piawai juga dibincang, iaitu punca ganda dua varian.

7. Apa relevannya min dan varian dalam pengukuran? Kalau panjang sebuah meja ingin diukur, dengan sekali ukur (katakan 5 kaki) menggunakan tape belum tentu panjang meja adalah tepat. Untuk lebih tepat perlu diukur banyak kali (mungkin oleh pengukur berbeza), dan dari semua bacaan panjang tersebut dicari min. Maka min panjang meja inilah yang lebih tepat. Oleh itu dalam contoh ini terdapat variasi dalam bacaan panjang meja, yang digambarkan oleh nilai varian seperti contoh kelas A dan C di atas. Oleh itu dalam konteks ukuran meja di atas, varian yang terhasil merupakan ralat pengukuran. Adalah mustahil untuk mendapati tiada ralat (varian=0) dalam pengukuran seperti di dalam contoh kelas B di atas. Kalau disamakan tape dengan ujian yang dibina oleh guru kerana kedua-duanya alat pengukur, maka tertulah wujud variasi atau varian di kalangan skor yang diperolehi oleh murid. Variasi atau varian akan wujud dan tidak dapat dielakkan. Oleh itu ralat pengukuran sentiasa akan wujud apabila guru memberi skor ujian kepada murid yang digambarkan oleh nilai varian, sama seperti variasi dalam mengukur panjang meja.

PDG 2204 (2)/PD 5215 (3) Pengukuran dan Penilaian

Kuliah 4: 10 dan 13 Feb 2010.

1. Dari segi teori pengukuran apabila satu benda diukur, di dalam ukuran itu terdapat skor benar dan skor ralat (selisihan). Contohnya kalau panjang sebuah meja diukur menggunakan satu pita pengukur didapati panjangnya ialah 5 kaki, mengikut teori ini nilai panjang yang diperolehi dengan sekali ukur dinamakan skor dapatan. Di dalam ukuran 5 kaki ini terdapat skor benar dan skor ralat. Oleh itu untuk mendapat panjang yang tepat, disebut skor benar, panjang meja ini perlu diukur banyak kali mungkin 100 atau 1000 kali. Apa yang terhasil ialah variasi di dalam skor dapatan, dan kalau dicari min bagi skor dapatan ini maka terhasillah skor benar atau panjang benar meja tersebut. Persamaan teori ujian klasik ialah X=T+E di mana X skor dapatan , T skor benar, E skor ralat.

2. Analogi di atas boleh digunakan kepada murid apabila guru memberi ujian. Dari segi teori, seorang murid boleh diuji banyak kali untuk mencari skor benarnya, tetapi dari segi praktik tidak dapat dilakukan. Apa yang boleh dilakukan ialah meneliti apa yang berlaku apabila sekumpulan murid mengambil satu ujian pada satu masa. Oleh itu perlu dicari cara untuk menyatakan sebanyak mana komponen skor benar di dalam skor dapatan yang diperolehi oleh sekumpulan murid yang mengambil satu ujian tersebut. Kalau lagi banyak komponen skor benar di dalam skor dapatan di dalam keputusan sebuah ujian maka dikatakan ujian ini tinggi kebolehpercayaannya dan sebaliknya. Kebolehpercayaan ialah nisbah atau peratus sebanyak mana skor benar yang terdapat di dalam skor dapatan.

3. Untuk memahami makna kebolehpercayaan yang dihasilkan oleh satu keputusan ujian yang diambil oleh sekumpulan murid maka konsep matrik ‘orang x item’ perlu difahami. Apabila sekumpulan murid mengambil ujian, hasilnya boleh ditabulasi dalam bentuk matrik seperti di dalam contoh 1 di bawah:

Contoh 1:  Corak Respons 26 murid yang mengambil satu ujian 50 item

Murid Item Ujian Aras Kebolehan Murid
1 2 3 4 5 . . . . . . . . . . . 48 49 50
1 Murid A 0 0 1 0 1 . . . . . . . . . . . 0 0 1
2 Murid B 1 1 0 0 0 . . . . . . . . . . . 1 1 1
3 Murid C 0 1 1 1 0 . . . . . . . . . . . 1 0 0
.
.
.
25 Murid Y 0 0 1 0 1 . . . . . . . . . . . 0 0 0
26 Murid Z 1 1 0 0 0 . . . . . . . . . . . 1 0 0
Aras Kesukaran Item (p)
Varian Item (pq)
Indeks Deskrimi-nasi Item (D)

Di dalam matrik di atas tiga sifat item yang akan mempengaruhi kebolehpercayaan ujian ialah aras kesukaran item (p) atau min bagi item, varian item (pq), dan indeks deskriminasi item (D). Kita akan bincang bagaimana tiga sifat ujian ini mempengaruhi kebolehpercayaan ujian setelah kita tahu apa dia kebolehpercayaan ujian dengan lebih dekat lagi.

4. Apabila murid menjawab sebuah ujian yang dibina dengan baik, terdapat keserasian antara kebolehan murid dan kesukaran item. Murid yang pandai akan dapat menjawab soalan yang sukar dan sebaliknya murid yang lemah tidak dapat menjawab soalan yang sukar. Oleh itu perlu wujud perhubungan respon antara satu item dangan item yang lain. Untuk memahami kebolehpercayaan dengan lebih dekat satu lagi konsep yang perlu dipelajari selain daripada tiga sifat ujian di atas ialah konsep perhubungan atau korelasi (r).

5. Konsep perhubungan adalah penting untuk menerangkan ciri-ciri di antara sepasang item ujian dan antara satu item dengan jumlah skor (atau indeks deskriminasi item). Perhubungan itu dinyatakan dalam satu statistik bernama kovarian iaitu: . Kita telah berbincang dalam kelas bagaimana mengira kovarian menggunakan contoh mudah seperti di bawah menggunakan skor (X) dan skor (Y). Contohnya 5 orang murid A, B, C, D dan E mengambil ujian Matematik (X) dan ujian Sains (Y) di mana markah penuh ialah 5. Pasangan skor oleh setiap murid ialah seperti berikut:

(X) (Y)

A         1          1

B          2          2

C          3          3

D         4          4

E          5          5

PDG 2204 (2)/PD 5215 (3) Pengukuran dan Penilaian

Kuliah 5: 17 dan 20 Feb 2010.

Kebolehpercayaan Ujian (Test Reliability)

Katakan 5 orang calon A, B, C, D dan E mengambil ujian 2 item dan keputusannya adalah seperti Contoh 1 berikut:

A         1          1

B          1          1

C          1          1

D         1          1

E          1          1

Tidak banyak yang boleh diperkatakan tentang keputusan ujian ini selain daripada mengatakan semua calon mendapat jumlah markah yang sama iaitu 2 kerana setiap calon mendapat betul di dalam kedua-dua item. Begitu juga dengan keputusan oleh F, G, H, I dan J di dalam Contoh 2 di bawah, tidak banyak yang boleh diperkatakan mengenainya, kerana semua calon gagal.

A         0          0

B          0          0

C          0          0

D         0          0

E          0          0

Bagi matrik keputusan ujian 2 item Contoh 3 di bawah, ada banyak maklumat yang boleh didapati, kerana terdapat calon yang betul dan salah bagi item tertentu.

A         0          1

B          1          1

C          0          0

D         1          0

E          1          1

Soalnya bagaimana untuk mengkuantifikasi maklumat itu dan berdasarkan maklumat itu boleh kita menyatakan sama ada ujian ini bolehpercaya atau tidak, atau ada atau tidak ketekalan antara orang dan item iaitu daripada segi kebolehan orang dan kesukaran item. Contohnya adakah orang pandai boleh menjawab soalan yang sukar, dan orang lemah cuma boleh menjawab soalan yang mudah.

Konsep kebolehpercayaan boleh menjawab soalan di atas. Kebolehpercayaan ialah setakat mana wujudnya komponen skor benar di dalam skor dapatan.  Bagaimana untuk mengukur atau mengkuantifikasi komponen skor benar dan skor dapatan? Inilah yang menjadi persoalan yang penting. Di dalam ilmu statistik, maklumat asas mengenai perhubungan antara skor murid boleh diukur menggunakan konsepsum of square atau SS. Kalau kita ada sekumpulan skor, kita boleh mengira berapa banyak SStotal (SS jumlah) bagi kumpulan skor ini. Caranya dengan mengira sisihan setiap skor daripada minnya, diganda dua dan dijumlahkan. Hasilnya dipanggil SStotal . Ini adalah permulaan mengira perkaitan SStotal dengan SS yang lain bergantung kepada model yang kita pilih.

Di dalam model kita iaitu berhubung matrik ‘orang x item’, andaian kita ialah apabila orang menjawab item ujian, tentu wujud perkaitan kebolehan mereka merentasi item berkenaan. Model yang relevan ialah pengukuran berulang (repeated measure) ke atas respon oleh calon yang menjawab soalan ujian. Oleh itu SStotal boleh dikaitkan dengan SSrows, SScolumn dan SSerror iaitu hubungannya seperti berikut:

Di mana item ialah untuk column, person ialah untuk rows dan residual untuk error. Istilah digunakan mengikut kesesuaian iaitu dalam konteks mana model digunakan. Bagi kita dalam bidang pengukuran pendidikan, rows menggambarkan orang dan column menggambarkan item. Bagi error, boleh juga disebut residual.

Bagi data di dalam contoh 3 di atas, kita telah mengira SStotal dengan cara mengira min bagi 10 angka tersebut, kemudian dikira sisihan setiap skor daripada min, hasilnya diganda dua setiap satu, hasil ganda dua setiap satu dijumlahkan. Jumlahnya dipanggil SStotal. Nilai yang dikira ialah 2.4.

Bagi SSrows atau SSperson nilainya dikira dengan cara mencari min bagi setiap row, kemudian min bagi min setiap row dikira, seterusnya sisihan min setiap row dengan min row dicari dan diganda setiap satu, sisihan ganda dua tersebut dijumlahkan. Hasilnya didapati 0.7 dan terpaksa didarab dua, kerana terdapat dua column angka, oleh itu hasil akhir ialah 1.4.

Bagi SScolumn atau SSitem pula, nilainya dikira dengan cara yang sama dengan SSrows dan hasilnya didapati 0, kerana min bagi setiap column adalah sama. Namun begitu hasil tersebut perlu didarab dengan 5 kerana terdapat 5 rows.

Persamaan di atas boleh ditunjuk dengan angka seperti berikut:

2.4 = (0)5 + (0.7)2 +

Seperti yang kita pelajari di dalam kelas, varian ialah SS dibahagi dengan N. Dari segi penggunaannya varian yang dikira cara ini dikatakan biased. Dalam contoh 3 di atas, terdapat 10 angka di mana kita mengira SS dengan menggunakan setiap angka, tetapi angka yang ke sepuluh itu sebenarnya sudah diketahui nilainya kerana nilai min sudah diketahui. Oleh itu yang benar-benar bebas ialah 9 angka sahaja. Oleh itu untuk mengira varian, pembawahnya ialah 9 atau N-1 di mana N-1 dipanggil degree of freedom.

Bagi model di atas kita mengira varian menggunakan degree of freedom sebagai pembawah. Varian dalam bentuk ini dipanggil Mean Square atau MS. Oleh itu MS ialah SS dibahagi dengan degree of freedom. Dengan menggunakan konsep MS maklumat di dalam persamaan di atas boleh ditabulasi di dalam satu jadual yang dipanggil Jadual ANOVA (Analysis of Variance). Gunanya jadual ini ialah untuk melihat komponen-komponen yang dibincang di atas dan seterusnya untuk menganggar nilai kebolehpercayaan bagi data di dalam contoh 3 di atas.

Jadual ANOVA

Sumber                       SS                        df                             MS

Orang  (rows)        1.4                          4                          0.35

Item   (columns)    0.0                         1                            0

Residual                    1.0                         4                          0.25

Jumlah                      2.4                          9

Kebolehpercayaan ( ):

Copyright @ Mokhtar Ismail 2010

PDG 2204 (2)/PD 5215 (3) Pengukuran dan Penilaian

Kuliah 6: 24 dan 27 Feb 2010.

Kebolehpercayaan Ujian (Test Reliability)

Satu model lagi mengira kebolehpercayaan ialah KR20. Mengikut model ini dalam satu matrik ‘orang x item’, varian bagi jumlah skor adalah bersamaan dengan jumlah varian bagi setiap item dan juga jumlah  kovarian bagi pasangan item-item. Sebagai contoh terdapat ujian dua item yang diambil oleh lima orang murid di mana matrik ‘orang x item’ ialah seperti Contoh 3 Kuliah 5.

A         0          1

B          1          1

C          0          0

D         1          0

E          1          1

Kebolehpercayaan ialah indeks untuk menganggar setakat mana varisi di dalam jumlah skor calon disumbangkan oleh ralat sistematik dan ralat rawak. Ralat sistemtik contohnya ialah kebolehan calon dan ralat rawak pula timbul daripada faktor luar jangka yang wujud semasa ujian dijalankan seperti kesalahan menginterpretasi kehendak ujian kerana kelemahan item ujian itu sendiri, atau kerana arahan di dalam kertas ujian yang mengelirukan, dan lain-lain.

Di dalam model di atas, ralat rawak adalah dianggar berdasarkan variasi di dalam setiap item, atau varian item, manakala ralat sistematik dianggar berdasarkan variasi yang wujud kerana terdapat kovarian di antara item-item. Oleh kerana setiap item menyumbang kepada jumlah skor atau skor dapatan, oleh itu setiap varian item dan kovarian menyumbang kepada varian skor dapatan atau varian jumlah skor. Di dalam teori klasik, skor dapatan adalah disumbangkan oleh skor benar dan skor ralat seterusnya varian skor dapatan disumbangkan oleh varian skor benar dan varian skor ralat. Dari segi persamaan: X=T+E dan .

Reliability atau Kebolehpercayaan

Formula di atas merujuk kepada matrik ‘orang x item’. Nama yang diberi kepada formula ini ialah Alpha Crombach untuk data bukan dichotomous dan KR20 untuk data dichotomous. Dari segi konsep, Alpha Crombach dan KR20 adalah sama. Untuk mengguna formula ini tiga perkara perlu diketahui: bilangan item, jumlah varian item dan varian jumlah skor.  Formula kebolehpercayaan Alpha adalah refleksi kepada teori ujian klasik  . Kebolehpercayaan sebenarnya nisbah jumlah kovarian item-item kepada varian jumlah skor, atau satu tolak ‘nisbah varian ralat kepada varian jumlah skor’.

Bagi matrik ‘orang x item’ di atas, min jumlah skor ialah 1.2. Varian jumlah skor ialah 0.56. Jumlah varian item ialah 0.48. Didapati 2 x kovarian item 1 dan 2 ialah 0.08. Perhubungan yang penting ialah 0.48+0.08=0.56.

Mengaplikasi formula kebolehpercayaan:

Reliability atau Kebolehpercayaan

=  atau

=   0.29

Copyright @ Mokhtar Ismail 2010

Kolej Universiti Perguruan Ugama Seri Begawan, Semester 2, 2009/2010

Rubrik Penskoran Laporan Cadangan Ujian Prestasi

Kod Kursus:____________________

Nama:______________________________________________________________Bil. Pend.______________

Kriteria Penilaian Skala
1 Keunikan TAJUK ujian prestasi 0 1 2 3 4 5
Tidak relevan kepada pengajaran Biasa tetapi tidak  mungkin dapat dilaksana

kan

Biasa tetapi sukar dilaksana

kan

Biasa dan relevan kepada pengajaran Unik dan relevan kepada pengaja

ran

Sangat unik dan relevan kepada pengajaran
2 Cara PERSEMBAHAN: Konteks (KT), Tugas-Tugas (TT)

dan Rubrik Penskoran (RP)

0 1 2 3 4 5
Tidak relevan dengan tajuk Kurang keserasian serta bahasa sangat lemah Kurang keserasian tetapi bahasa boleh di terima Ada keserasian  antara KT, TT, RP Ada keserasian  KT, TT, RP dan

bahasa adalah baik

Semua aspek persemba

han adalah cemerlang

3 PEMBINAAN Tugas-Tugas (tasks) 0 1 2 3 4 5
Tidak relevan dengan tajuk Tidak lengkap Lengkap kurang menepati tujuan ujian Lengkap menepati tujuan ujian Lengkap dan kreatif Lengkap dan unik
4 Cara RUBRIK PENSKORAN dipersembahkan 0 1 2 3 4 5
Tiada rubrik penskoran Tidak lengkap Lengkap kurang menepati tujuan ujian Lengkap menepati tujuan ujian Lengkap dan kreatif Lengkap dan unik
5 Perbincagan mengenai KEBOLEHPERCAYAAN

DAN KESAHAN

0 1 2 3 4 5
Tiada perbincangan Kurang tepat tetapi ada cubaan untuk memberi makna Kurang tepat tetapi ada makna di dalam perbinca

ngan

Tepat berdasar

kan tujuan ujian

Tepat berdasar

kan tujuan serta ada

cadangan membina

Tepat dan lengkap dari segi makna dan tahap kualiti cadangan
6 RUJUKAN yang telah dibuat

*Kalau ada senarai rujukan yang diberi tetapi tiada konten rujukan tersebut di dalam laporan awda, rujukan itu tidak dikira

0 1 2 3 4 5
Tiada rujukan Satu rujukan dan konten rujukan ada di dalam laporan Dua rujukan dan konten rujukan ada di dalam laporan Tiga rujukan dan konten rujukan ada di dalam laporan Empat rujukan dan konten rujukan ada di dalam laporan Lebih daripada empat rujukan dan konten rujukan ada di dalam laporan

Dr. Mokhtar Ismail                                             08 April 2010                                    Jumlah Markah:_______/30

Tarikh menghantar : 24/4/2010

Comments are closed.