Title: FCE3900 PENYELIDIKAN PENDIDIKAN ALAT UKUR PENYELIDIKAN
1FCE3900 PENYELIDIKAN PENDIDIKANALAT UKUR
PENYELIDIKAN
2OBJEKTIF
- Memahami maksud alat pengukuran dalam
penyelidikan. - Menggunakan alat pengukuran dalam penyelidikan
pendidikan.
3Jenis Alat Ukur atau Instrumen Kajian
- Ujian
- mengukur prestasi maksimum
- Skala/Inventori
- mengukur pemeringkatan ciri-ciri subjek (contoh
Minnesota Multiphasic Personality Inventory,
Myers-Briggs Type Indicator) - Soal Selidik
- mendapatkan maklumat daripada N yang besar
- Lain-lain
- teknik sosiometrik teknik projektif (contoh
Thematic Apperception Test, Roscharch Inkblot
Test)
4Ujian
- Satu set rangsangan (soalan atau kenyataan) untuk
mendapatkan respons subjek berasaskan pemarkahan. - Bagi mengukur penguasaan pelajar dalam sesuatu
mata pelajaran, bidang, kemahiran, kecerdasan
atau bakat. - Tahap penguasaan pelajar dikuantifikasikan dengan
memberi markah kepada jawapan yang diberi.
5Ujian
6Jenis-jenis Ujian
- Ujian Pencapaian.
- Ujian Kecerdasan (mental, emosi rohani).
- Ujian Prestasi.
- Ujian Kecekapan.
- Ujian Bakat.
- Ujian Personaliti, Sikap dan Minat.
7Ujian Pencapaian
- Mengukur secara khusus sejauh mana pelajar
menguasai isi sesuatu mata pelajaran yang diajar - Mempersoalkan apa yang pelajar telah belajar
- Penguasaan isi mata pelajaran berlaku dalam
sesuatu tempoh sama ada selepas sesuatu sesi
pelajaran, satu minggu, setengah semester atau
sepanjang semester. - Boleh digunakan untuk menilai keberkesanan
pengajaran guru. - Ada ujian binaan guru dan ujian piawai
8- Merancang Ujian Pencapaian
- Mengenal pasti objektif.
- Menentukan kandungan ujian.
- Menentukan jenis item (subjektif / objektif).
- Menentukan bilangan item.
- Menentukan paras kesukaran.
9Ujian Kecerdasan
- Mengukur kebolehan pelajar menyesuaikan diri
dengan persekitaran. - Kecerdasan melibatkan proses menakul persekitaran
bagi menyelesaikan masalah. - Memberi tumpuan kepada prestasi umum pelajar.
- Jenis Kecerdasan mental, kecerdasan emosi dan
kecedasan rohani.
10Ujian Prestasi
- Menghendaki pelajar melakukan aktiviti yang
diperlukan - ujian kertas pensil digunakan untuk mengelak
berlakunya tekaan, dan untuk memberi penekanan
terhadap fakta - Memberi rangsangan kepada pelajar untuk
memperkenal dan mengembangkan aktiviti pemikiran
dan taakulan berasaskan kurikulum yang diajar - Teknik folio, rakaman
- Contoh prestasi dalam kursus tertentu
11Ujian Kecekapan
- Mengukur kemahiran dan kecekapan dalam melakukan
sesuatu tugas yang dipelajari - Contoh kecekapan melukis, melakar reka bentuk
bangunan, kecekapan memasak, kecekapan berlari,
dan sebagainya.
12Ujian Bakat
- Digunakan untuk membuat telahan tentang kebolehan
pelajar belajar pada masa hadapan - Bakat merujuk kepada apa yang pelajar boleh
belajar - Contoh Ujian Bakat Bermain Bola Sepak, Ujian
Bakat Seni
13Ujian Personaliti
- Digunakan bagi memahami tingkah laku pelajar
khususnya sikap dan motivasi mereka - Mengukur kewujudan keadaan atau trait dalaman
seseorang (introvert/ekstrovert) - Ujian sikap mengukur kepercayaan yang mendorong
pelajar memberikan gerak balas terhadap sesuatu
rangsangan - Ujian minat mengukur kecenderungan seseorang
pelajar melakukan sesuatu perkara atau terhadap
sesuatu bidang.
14Skala atau Inventori
15Skala atau Inventori
- Untuk mengukur pemboleh ubah kualitatif yang
berbentuk gagasan seperti ciri tingkah laku,
minat, sikap, dan personaliti yang dapat diukur
secara kuantitatif. - Digunakan dalam ujian personaliti, ujian sikap,
dan persepsi.
16Soal Selidik
17Soal Selidik
- Digunakan bagi mendapatkan maklumat umum tentang
fakta, kepercayaan, kehendak, status sosio
ekonomi, latar belakang pelajar, pendapatan atau
tahap pendidikan. - Terdiri daripada jenis jawapan dibina, dan
jawapan dipilih. - Soal Selidik boleh dipos atau diberi secara
langsung kepada subjek.
18- Ciri-ciri soal selidik yang baik
- Berasaskan kepada objektif dan definisi operasi.
- Disemak dengan pengalaman sorotan berkaitan.
- Tentukan kesesuaian soalan atau pernyataan.
- Soalan tidak prejudis.
- Nyatakan soalan atau pilihan jawapan dengan
jelas. - Jawapan ikhlas.
- Soalan tidak memesong/memaksa subjek.
- Tempoh menjawab minimum.
- Disusun secara psikologi mudah ke susah.
19Soal Selidik Pos
- Digunakan untuk bilangan subjek yang ramai dan
pelbagai. - Penyelidik perlu memastikan pulangan tinggi
dengan cara - Nyatakan kepentingan soal selidik kepada subjek.
- Sertakan surat pengenalan (tujuan dan nilai
penyelidikan) dan surat sokongan (pihak
berwibawa). - Sertakan sampul jawapan bersetem yang dan
beralamat sendiri. - Pastikan kesesuaian masa menjawab.
- Soalan dan maklumat diperlukan mudah, jelas dan
ringkas. - Format menarik.
- Lakukan usaha memastikan pulangan tinggi dengan
minimumkan kesukaran subjek menjawab,
menghantarkan surat ingatan, soal selidik
gantian, dan surat penghargaan dan maklum balas
jika perlu.
20Temu Bual
21Temubual
- Melibatkan penyelidik dan subjek hadir sama.
- Kaedah tertua.
- Soalan dibina untuk merangsang maklumat.
- Kekuatan
- kerjasama, interaksi secara langsung dan aktif.
- Mudah suai, mengikut situasi subjek.
- Hubungan lebih erat, jawapan lebih tepat.
- Kelemahan
- Memerlukan masa, tenaga dan kos yang tinggi.
- Dipengaruhi oleh personaliti subjek dan
penyelidik. - Pengaruh faktor luaran keletihan, kebosanan,
membuang masa, kebolehan merekod, kurang
pengetahuan tentang kajian, sikap dsb.
22Pemerhatian
23Pemerhatian
- Memerhati tingkah laku berdasarkan pemboleh ubah
yang dikenal pasti seperti masa berbeza akan
menyebabkan tingkah laku berbeza. - Perlu dikenalpasti tingkah laku secara ekslusif
(tidak ada pertindanan tingkah laku) dan
extensive (kenal pasti kemungkinan kejadian semua
tingkah laku). - Peranan penyelidik sebagai pemerhati.
- Aktiviti penyelidik adalah melihat, mendengar dan
merekod. - Penyelidikan bernilai tinggi jika dilakukan
secara objektif.
24Jenis Pemerhatian
- Pemerhatian turut serta
- Penyelidik berada dalam unit sosial subjek dan
bergaul dengan subjek tetapi tidak mempengaruhi
subjek. - Penyelidik dan subjek lebih mengenali.
- Masalah yang timbul adalah reaksi subjek
- Jawapan tepat jika subjek bereaksi positif.
- Jawapan kurang tepat jika subjek bereaksi
negatif. - Sukar mencatatkan tingkah laku Isu penerimaan
dan penolakan subjek, isu perasaan seperti
simpati, hilang keobjektifan ketika merekod
maklumat.
25- Pemerhatian tidak turut serta
- Penyelidik berada di luar unit sosial yang
dicerap. - Penyelidik tidak mencampuri tingkah laku subjek.
- Maklumat lebih dipercayai kerana kurang
dipengaruhi oleh reaksi subjek, perasaan dan
simpati penyelidik. - Kesan sampingan berlaku jika subjek dan unit
sosial sedar akan kehadiran penyelidikan sebagai
pemerhati.
26Pembinaan Instrumen
27Prinsip Pembinaan Instrumen Kajian
- Berpandukan objektif penyelidikan.
- Berasaskan definisi operasi pemboleh ubah.
- Tentukan sama ada jawapan dibina dan atau
dipilih. - Tentukan kesesuaian bilangan.
- Tentukan kesesuaian aras kesukaran.
- Tentukan kesesuaian aras diskriminasi.
- Tentukan kesesuaian kebolehpercayaan.
- Mudah tadbir.
- Mudah tafsir.
28Soal Selidik
- Digunakan bagi mendapatkan maklumat.
- Ciri-ciri soal selidik yang baik
- Berasaskan kepada objektif dan definisi operasi.
- Disemak dengan pengalaman dan sorotan berkaitan.
- Tentukan kesesuaian soalan atau pernyataan.
- Soalan tidak prejudis.
- Nyatakan soalan atau pilihan jawapan dengan
jelas. - Pilihan jawapan saling ekslusif dan habisan.
- Jawapan ikhlas.
- Soalan tidak memesong atau memaksa subjek.
- Tempoh menjawab minimum.
- Disusun secara psikologi mudah ke susah.
29Langkah Membentuk Instrumen Kajian
- Senaraikan pembolehubah yang ingin dikaji dan
rujuk teori dan model berkaitan dengan
pembolehubah yang dikaji. - Bina Jadual Penentuan Indeks Pengukuran.
- Jalankan ujian-pra.
- Rujuk pakar dalam bidang berkenaan.
- Jalankan ujian atau kajian rintis (pilot
test/study).
30Jadual Penentuan Indeks Pengukuran
Jenis instrumen Soal Selidik Jenis Item aneka
Pilihan Pembolehubah Pemikiran Kreatif
Bil. Sub-Indeks (Pemikiran kreatif) Bil. Item
1. Keaslian 7
2. Kelancaran 6
3. Penghuraian 7
Jumlah item 20 Jumlah item 20 Jumlah item 20
31KESAHAN (VALIDITY)
32Validity refers to the degree in which our test
or other measuring device is truly measuring what
we intended it to measure.
KESAHAN (VALIDITY)
Sejauh mana alat mengukur apa yang ia sepatutnya
ukur
33Kesahan ialah sejauhmanakah dapatan kajian atau
data yang dikumpul dapat memberikan penjelasan
yang bermakna kepada kajian yang dilakukan (Ary
et. al (2005)
Kesahan bermaksud kebolehan ujian mengukur apa
yang sepatutnya diukur, Youngman Eggleston,
1982 Sax Newton, 1997)
Kesahan sesuatu alat pengukuran merujuk kepada
sejauh manakah alat yang digunakan mengukur data
yang dikehendaki untuk mencapai objektif kajian
(Mohd Majid Konting, 1990)
34Kesahan ialah sejauhmanakah dapatan kajian atau
data yang dikumpul dapat memberikan penjelasan
yang bermakna kepada kajian yang dilakukan (Ary
et. al (2005)
Kesahan sesuatu alat pengukuran merujuk kepada
sejauh manakah alat yang digunakan mengukur data
yang dikehendaki untuk mencapai objektif kajian
(Mohd Majid Konting, 1990)
35Based on Internal Structure
Construct (determination of the significance,
meaning, purpose, and use of the scores)
Kesahan Gagasan
Tiga Aspek Kesahan
Based on Relations to Other Variables
Based on content
Kesahan Kriteria
Kesahan Kandungan
Criterion-referenced (scores are a predictor of
an outcome or criterion they are expected to
predict)
Content (representative of all possible questions
that could be asked)
Content validation is usually carried out by
experts
Concurrent Evidence
Predictive Evidence
36Menurut Fraenkel Wallen (1996) kesahan boleh
dibuktikan melalui beberapa kaedah seperti
kesahan isi kandungan (content validity), kesahan
telahan (predictive validity), kesahan serentak
(concurrent validity) dan kesahan gagasan
(construct validity)
37Evidence Based on Content
Kesahan Kandungan(Content Validity)
- Sejauh mana alat merangkumi kandungan sesuatu
bidang. - Matlamat utama ialah untuk memastikan semua isi
dan kandungan bidang yang diukur menggambarkan
bidang tersebut. - Berdasarkan kepada skop dan objektif dan
kandungan sesuatu bidang yang dikaji. - Pendapat pakar atau penilai luar diperlukan bagi
menilai kesesuaian butiran bagi domain yang
dipilih.
38Content validity
- is concerned with a tests ability to include or
represent all of the content of a particular
construct. The question 1 1 ___ may be a
valid basic addition question. Would it
represent all of the content that makes up the
study of mathematics? It may be included on a
scale of intelligence, but does it represent all
of intelligence? The answer to these questions
is obviously no. To develop a valid test of
intelligence, not only must there be questions on
math, but also questions on verbal reasoning,
analytical ability, and every other aspect of the
construct we call intelligence. There is no easy
way to determine content validity aside from
expert opinion.
39Content validity
- Do the items appear to represent the thing you
are trying to measure? - Does the set of items underrepresented the
constructs content (i.e., have you excluded any
important content areas or topics?) - Do any of the items represent something other
than what you are trying to measure (i.e., have
you included any irrelevant items?)
40Content validity
- Sebelum sesuatu instrumen itu dikatakan mempunyai
kesahan kandungan, lima syarat ini perlu
dipenuhi - Bidang kandungan mestilah dinyatakan dalam bentuk
tingkah laku yang secara umum diterima maknanya. - Bidang mestilah dihuraikan dengan jelas.
- Bidang mestilah relevan dengan tujuan penggunaan
ujian. - Hakim-hakim yang berkelayakan mestilah bersetuju
bahawa bidang telah disampel secara mencukupi.
41Kesahan Gagasan(Construct Validity)
Evidence Based on Internal Structure
- To measure several components or dimensions of a
construct. - Use Factor Analysis to analyzes correlations
among test items and tells you the number of
factors present. Its tell you whether the test is
unidimensional or multidimensional. - Unidimensional all the item measure are single
construct. - Multidimensional different set of item tap
different construct or different component of a
broader construct.
42 Internal Structure
- Factor analysis tell you how many dimensions or
factors your test items represent. - Also can obtain a measure of test homogeneity
(i.e., the degree to which the different items
measure the same construct or trait) - Use coefficient alpha (Alpha Cronbach) for the
test of homogeneity. - If the alpha is low (e.g., lt.70) for the test,
then some items might be measuring different
constructs or some items might be bad. - Examine the items that are contributing to your
low coefficient alpha and consider eliminating or
revising them.
43Based on Relations to Other Variables
Kesahan Kriteria (Criterion Validity)
- Obtained by relating your test scores to a
relevant criterion. - A criterion is the standard or benchmark that you
want to predict accurately on the basis of scores
from your test. - Sejauh mana kaitan antara alat dengan kriteria
luaran yang berkecuali (sama ada item mengukur
kriteria yang hendak diukur). - Ditentukan dengan analisis korelasi antara dua
set markah. - Calculate correlation coefficients for the study
of validity validity coefficients.
44Concurrent Validity
- Concurrent Validity refers to a measurement
devices ability to vary directly with a measure
of the same construct or indirectly with a
measure of an opposite construct. It allows you
to show that your test is valid by comparing it
with an already valid test. Administering the
focal test and criterion test at approximately
the same point in time (i.e., concurrently) and
then correlating the two set of scores. If the
two sets of scores highly correlated, you have
concurrent evidence.
e.g.
A new test of adult intelligence, for example,
would have concurrent validity if it had a high
positive correlation with the Wechsler Adult
Intelligence Scale since the Wechsler is an
accepted measure of the construct we call
intelligence. An obvious concern relates to the
validity of the test against which you are
comparing your test. Some assumptions must be
made because there are many who argue the
Wechsler scales, for example, are not good
measures of intelligence.
45Predictive Validity
- Obtain predictive evidence of validity by
measuring your participants at one point in time
on your test and then, at a future time,
measuring them on the criterion measure. - Take more time and effort than concurrent
evidence, but it can provide superior evidence
that your test does what you want it to do.
- In order for a test to be a valid screening
device for some future behavior, it must have
predictive validity. The SAT is used by college
screening committees as one way to predict
college grades. The GMAT is used to predict
success in business school. And the LSAT is used
as a means to predict law school performance.
The main concern with these, and many other
predictive measures is predictive validity
because without it, they would be worthless
46Reliability is synonymous with the consistency of
a test, survey, observation, or other measuring
device. Imagine stepping on your bathroom scale
and weighing 140 pounds only to find that your
weight on the same scale changes to 180 pounds an
hour later and 100 pounds an hour after that.
Base on the inconsistency of this scale, any
research relying on it would certainly be
unreliable. Consider an important study on a new
diet program that relies on your inconsistent or
unreliable bathroom scale as the main way to
collect information regarding weight change.
Would you consider their results accurate?
KEBOLEH PERCAYAAN (RELIABILITY)
47Kebolehpercayaan
- Sejauh mana instrumen mengukur dengan tekal apa
yang hendak diukur. - Scores from measuring variables that are stable
and consistent
48Test-retest Reliability
Types of Reliability
Internal Consistency Reliability
Equivalent Forms Reliability
49Test-Retest Reliability
Merujuk kepada ketekalan atau stabiliti markah
ujian jika dilakukan pada masa yang berbeza.
Contoh Ujian diberikan kepada 100 individu untuk
satu masa dan diulangi pada masa berlainan. Dua
set markah ini dikorelasikan. Sekiranya individu
memperoleh markah tertinggi dalam ujian 1 juga
memperolehi markah tertinggi dalam ujian 2,
begitu juga individu yang mendapat markah
terendah dalam ujian 1 juga mendapat markah
terendah dalam ujian, maka dikatakan mempunyai
korelasi yang tinggi. Oleh itu soalan ujian
tersebut mempunyai kebolehpercayaan yang tinggi.
50Equivalent Forms Reliability
- Refers to the consistency of a group of
individuals scores on two equivalent forms of a
test designed to measure the same characteristic. - Menggunakan satu alat yang dibina dan satu lagi
yang piawai. - Ditadbir ke atas subjek yang sama dan pada masa
yang sama atau masa yang lain. - Equivalent form means that two tests are
constructed so that they are identical in every
way except for the specific items asked on the
test. - This means that they have the same number of
items, the items are the same difficulty level,
the item measure the same construct, and the test
is administered, scored, and interpreted in the
same way. - The two set of scores are than correlated. If
this reliability coefficient to be very high and
positive, that is the individuals who do well on
the first form of the test should also do well on
the second form, and individuals who performed
poorly on the first form of the test should
perform poorly on the second test.
51Internal Consistency Reliability
- Internal consistency refers to how consistently
the items on a test measure a single construct or
concept. - The test-retest methods of assessing reliability
are general methods that can be used with just
about any test. - Internal consistency measures are convenient and
are very popular with researchers because they
require one group of individuals to take the test
one time. - Two indexes of internal consistency
- Split half reliability
- Coefficient alpha
52Split-half reliability
- Splitting a test into two equivalent halves and
then assessing the consistency of the scores
across the two halves of the test. - Divide the test into halves and correlate the
scores from the two halves. - Compute the correlation between scores on the two
halves of the test using Spearman-Brown formula. - The low correlation indicates that the test was
unreliable, a high correlation indicates that the
test was reliable.
53Coefficient alpha
- Lee Cronbach 1951) developed coefficient alpha..
Alpha Cronbach - Coefficient alpha tells you the degree to which
the items are interrelated. - Rule of thumb
- At a minimum, greater than or equal to .07 for
research purposes and somewhat greater than that
value (e.g. .09) for clinical testing purposes.
54Validity and reliability
55Sekiranya pekali kebolehpercayaan rendah???
56Meningkatkan Kebolehpercayaan
- Pernyataan item mestilah jelas dan tepat.
- Arahan mestilah jelas dan ringkas.
- Item hendaklah bentuk sejenis.
- Situasi dan masa pengukuran hendaklah piawai,
serupa dan terkawal. - Elakkan gangguan ke atas subjek.
- Elakkan kebimbangan subjek dengan memberi jaminan
keselamatan dan kerahsiaan ke atas maklumat yang
diberi.
57Fasa terakhir tinjauan sebelum pengumpulan data
bermula.
Ujian Rintis
Matlamatnya adalah untuk mencari masalah dalam
soal selidik, termasuk soalan yang lemah, arahan
yang tidak lengkap dan item yang sukar dijawab.
58Garis panduan ujian rintis
Tidak boleh gunakan kumpulan fokus sebenar.
Untuk kajian baharu, lakukan dua kali ujian
rintis.
Jumlah responden tidak ditentukan dengan tepat,
dicadangkan sekurang-kurangnya 25 orang, lebih
baik antara 50 75 orang.
59Procedures for Administering the Data Collection
Develop standard written procedures for
administering an instrument
Obtain permission to collect and use public
documents
Train researchers to collect observational data
- Respect individuals and sites during data
gathering (ethics)
60What Permissions Are NeededObtaining Permission
Institutional or organizational (e.g., school
district)
Site-specific (e.g., secondary school)
Individual participants
Parents of participants who are not considered
adults
Campus approval (e.g., university or college) and
Institutional Review Board (IRB)
61Kesahan
- Sejauh mana alat mengukur apa yang ia sepatutnya
ukur. - Tiga Aspek
- Kesahan Gagasan
- Kesahan Kandungan
- Kesahan Kriteria
62Kesahan Kandungan
- Sejauh mana alat merangkumi kandungan sesuatu
bidang. - Matlamat utama ialah untuk memastikan semua isi
dan kandungan bidang yang diukur menggambarkan
bidang tersebut. - Berdasarkan kepada skop dan objektif dan
kandungan sesuatu bidang yang dikaji. - Jika kandungan luas, perlu persampelan kandungan.
- Bina Jadual Penentuan bagi mengenalpasti
domain-domain yang hendak diukur. - Pendapat pakar atau penilai luar diperlukan bagi
menilai kesesuaian butiran bagi domain yang
dipilih.
63Kesahan Gagasan
- Sejauh mana alat menghasilkan gerak balas yang
mewakili gagasan (sikap, motivasi) yang diukur. - Walau pun berbentuk abstrak, terdapat ciri atau
kesan daripada kewujudan atau ketidak wujudan
sesuatu gagasan pendidikan (diukur secara tak
langsung berasaskan kesan atau ciri yang terhasil
daripada gagasan). - Contoh Minat terhadap matematik adalah terdiri
daripada bilangan latihan, tempoh masa membuat
latihan matematik dan sebagainya. - Analisis faktor digunakan bagi membina alat ukur
gagasan.
64Kesahan Kriteria
- Sejauh mana kaitan antara item alat dengan
kriteria luaran yang berkecuali (sama ada butir
mengukur kriteria yang hendak diukur). - Ditentukan dengan analisis korelasi antara dua
set markah (markah alat dibina dengan alat
kriteria). - Kriteria Serentak kriteria yang ditunjukkan pada
masa yang sama dengan pengukuran. Misalnya,
kebolehan semasa bermain muzik. - Kriteria Jangkaan kriteria yang ditunjukkan pada
masa hadapan selepas pengukuran. Misalnya,
kebolehan bermain muzik pada suatu masa hadapan
selepas pengukuran dilakukan.
65KEBOLEH PERCAYAAN(RELIABILITY)
66Kebolehpercayaan
- Sejauh mana alat mengukur dengan tekal apa yang
hendak diukur. - Keboleh percayaan alat ukur adalah ketekalan alat
mengukur pemboleh ubah atau gagasan. - Variasi atau perubahan yang wujud antara dua
pengukuran dengan menggunakan alat ukur yang sama
merupakan aspek yang penting dalam menentukan
ketekalan alat ukur.
67Cara menentukan kebolehpercayaan alat ukur
- Indeks Kebolehpercayaan
- Merupakan pekali yang menunjukkan ketekalan
sesuatu alat ukur. - Ditentukan dengan menggunakan pekali korelasi
antara dua set respons (markah) yang diperolehi
hasil daripada gerak balas subjek terhadap alat
ukur. - Kaedah menguji kebolehpercayaan
- 1. Kaedah Bahagi Dua (Split-half)
- 2. Kaedah Uji dan Uji Kembali (Test-retest)
- 3. Kaedah Bentuk Setara (Equavalent Form)
681. Kaedah Bahagi Dua
- Alat ukur yang sama ditadbirkan hanya sekali ke
atas subjek (hanya uji sekali). - Respons pada butir yang bernombor ganjil
diasingkan daripada butir yang bernombor genap. - Kedua-dua set markah dikorelasikan.
- Pekali korelasi yang positif dan teguh antara dua
set markah menunjukkan indeks kebolehpercayaan
yang tinggi. - Gunakan formula Spearman-Brown, Kuder Richardson
dan Alpha Cronbach untuk mendapatkan pekali
korelasi.
69Pekali Alpha Cronbach (a)
- Digunakan untuk mengukur ketekalan dalaman dan
homogeniti. - Bergantung kepada ketekalan prestasi individu
dari satu butir ke satu butir yang lain (darjah
persetujuan terhadap butir-butir pernyataan). - Pekali Alpha Cronbach adalah berasaskan kepada
sisihan piawai alat ukur dan sisihan piawai
butir-butir yang berlainan. -
-
70 Pekali alpha berasaskan kepada sisihan piawai
alat ukur dan sisihan piawai butir yang berlainan
712. Kaedah Uji dan Uji Kembali
- Ujian yang sama ditadbirkan dua kali kepada
respondens yang sama, pada masa yang berlainan. - Dua set markah itu dikorelasikan.
- Pekali korelasi Indeks keboleh percayaan.
723. Kaedah Bentuk Setara (Equavalent Forms)
- Digunakan apabila ada kemungkinan subjek akan
ingat respons pada ujian pertama. - Menggunakan satu alat yang dibina dan satu lagi
yang piawai. - Kedua-dua alat setara dari segi kandungan (isi
kandungan dan tahap kesukaran) tetapi berbeza
dari segi penyampaian. - Ditadbir ke atas subjek yang sama dan pada masa
yang sama atau masa yang lain. - Markah dua alat dikorelasikan dan hasil korelasi
adalah sama dengan pekali kestabilan kesetaraan.
73Meningkatkan Kebolehpercayaan
- Pernyataan butir mestilah jelas dan tepat.
- Arahan mestilah jelas dan ringkas.
- Butir hendaklah bentuk sejenis.
- Situasi dan masa pengukuran hendaklah piawai,
serupa dan terkawal. - Elakkan gangguan ke atas subjek.
- Elakkan kebimbangan subjek dengan memberi jaminan
keselamatan dan kerahsiaan ke atas maklumat yang
diberi.
74Ujian Rintis
75- Fasa terakhir tinjauan sebelum pengumpulan data
bermula. - Matlamatnya adalah untuk mencari masalah dalam
soal selidik, termasuk soalan yang lemah, arahan
yang tidak lengkap dan item yang sukar dijawab.
76Garis panduan ujian rintis
- Jumlah responden tidak ditentukan dengan tepat,
dicadangkan sekurang-kurangnya 25 orang, lebih
baik antara 50 75 orang. - Untuk kajian baru, lakukan dua kali ujian rintis.
- Tidak boleh gunakan kumpulan fokus sebenar.
77Pengumpulan Data
78SEKIANTERIMA KASIH