Transcript SUNU 3

+
Ölçme ve Değerlendirme
Yrd.Doç.Dr. Kerem KILIÇER
+
Güvenirlik
Güvenirlik, bir ölçme aracıyla aynı koşullarda tekrarlanan
ölçümlerde elde edilen değerlerin kararlılığının bir
göstergesidir.

Güvenirlik, ölçme aracının ölçme
sonuçlarını hata karıştırmadan ölçme
yapabilmesidir.

Kısaca güvenirlik, ölçme aracının
ölçülecek özelliği doğru ölçmesidir.

Güvenilir bir ölçme aracı aynı özellikle ilgili olarak arka
arkaya yapılan ölçümlerde yaklaşık olarak aynı sayısal sonucu
verir.

+
Güvenirlik
Güvenilir bir ölçme aracı aynı özellikle ilgili olarak arka
arkaya yapılan ölçümlerde yaklaşık olarak aynı sayısal
sonucu verir.

Güvenirlik için ölçme aracı tesadüfi hatalardan arınık
olması gerekmektedir.

Güvenirlik katsayısı (rx) 0,00 ile 1,00 arasında değer
alan bir korelasyon katsayısıdır.

Güvenirlik katsayısı 1’e yaklaştıkça güvenirlik yüksek,
0’a yaklaştıkça güvenirlik düşük olarak değerlendirilir.

+
Geçerlik ve Güvenirlik
Bir ölçme aracının güvenilir olması geçerli olduğu
anlamına gelmeyebilir.


Bir test geçerli olmasa da güvenilir olabilir.

Güvenirlik geçerlik için gerekli fakat yeterli değildir.
Bu nedenle geçerlik güvenirliği de kapsayan ölçme
araçlarının önemli teknik özelliğidir.

+
Güvenirlik
Güvenirlik bir korelasyon (iki değişken arasındaki ilişki
yada bağıntı ölçüsü) katsayısı olduğu için elde edilen
güvenirlik katsayısı iki uygulamadan benzer sonuçlar
elde edildiğini ya da uygulamaların farklılaşmadığını
gösterir.

Korelasyon katsayısının 1 olması hatasız ölçüm
yapıldığını gösterir. Hatasız ölçüm yapmak olanaksız
olduğu için sosyal bilimlerde 0,60-0,65 değerin
üzerindeki güvenirlik katsayıları güvenilir olarak
değerlendirilmektedir.

+
Güvenirlik Türleri
Eğitimde en fazla tercih edilen güvenirlik belirleme
yöntemleri şunlardır;

A- TEST TEKRAR TEST YÖNTEMİ
B- EŞDEĞER (PARELEL) FORMLAR YÖNTEMİ
C- TESTİ YARILAMA YÖNTEMİ
D- KR-20 VE KR-21 YÖNTEMİ
E- CRONBACH ALFA YÖNTEMİ
D- PUANLAYICI GÜVENİRLİĞİ
+
Güvenirlik Türleri
(Test Tekrar Test Yöntemi)
Bir testin aynı gruba farklı zamanlarda iki kez
uygulanması ve bu iki uygulama arasındaki ilişki
(kararlılık/tutarlılık) düzeyinin belirlenmesidir.

İki uygulama arasındaki süre ölçülen özelliğe bağlı
olarak değişmektedir. Ancak süre ne çok kısa ne de çok
uzun olmamalıdır.

Süre çok kısa olursa cevaplayıcılar soruları
hatırlayacağı için ölçüm sonuçları hatalı olur. Eğer süre
çok uzun olursa cevaplayıcılarda meydana gelebilecek
değişim güvenirliği olumsuz etkiler.

+
Güvenirlik Türleri
(Test Tekrar Test Yöntemi)

Örnek1:
Bir öğretmen Fransızca kelime bilgisini yoklayan bir test
hazırlamış bunu birkaç hafta arayla öğrencilere iki kez
uygulamıştır. Bu iki uygulamadan elde edilen puanlar
arasındaki korelasyon 0,80 olarak hesaplanmıştır.

Örnek2:
Bir öğretmen geliştirdiği “Ölçme Değerlendirme Dersine
Tutum” ölçeğini bir ay arayla Eğitim Fakültesi Formasyon
Eğitimi Spor Yönetimi bölümü öğrencilerine iki kez
uygulamış ve iki uygulama arasında 0,95 olarak
bulunmuştur.
+
Güvenirlik Türleri
(Eşdeğer Formlar Yöntemi)
Bir testin oluşturulan eşdeğer formuyla birlikte aynı
gruba aynı veya farklı zamanlarda uygulanması ve bu iki
uygulama arasındaki ilişki (eşdeğerlik) düzeyinin
belirlenmesidir.

Hazırlanacak iki form nicelik (soru sayısı), nitelik
(kapsamı) ve istatistiki özellikleri (madde güçlük,
ayırtedicilik, ortalama, standart sapma vb.) olarak aynı
olması gerekmektedir.

Kısaca hazırlanacak teste ait iki form “tek yumurta
ikizleri” gibi birbirine tıpa tıp benzemelidir.


En önemli avantajı aynı anda uygulanabilmesidir.
+
Güvenirlik Türleri
(Paralel Formlar Yöntemi)

Örnek:
Bir öğretmen hazırladığı soru sayısı, niteliği ve ölçtüğü
davranışlar bakımından aynı olan iki farklı Bilgisayar
becerileri başarı testini final sınavı öncesi Mühendislik
Fakültesi Bilgisayar Mühendisliği bölümü 1. sınıf
öğrencilerine aynı anda uygulamış ve bu iki uygulama
arasındaki korelasyon 0,73 olarak hesaplanmıştır.
+
Güvenirlik Türleri
(Testi Yarılama Yöntemi)
Bir testin iki eş değer parçaya bölünerek tek gruba
uygulanması ve uygulama sonucunda bireylerin iki
eşdeğer parçadan aldıkları puanlar arasındaki ilişki (iç
tutarlılık) düzeyinin belirlenmesidir.

En güçlü yanı tek bir öğrenci grubu ve tek bir form
gerektirir.

Ancak oluşturulan iki parçanın birbiriyle paralel ve
eşdeğer olması gerekmektedir?

En çok kullanılan iki yarıya bölme işlemi testteki tek
sayılı soruların çift sayılı sorularla karşılaştırılmasıdır.

+
Güvenirlik Türleri
(Testi Yarılama Yöntemi)

Örnek:
Bir öğretmen hazırlamış olduğu 100 soruluk Türkçe başarı
testine ait tek rakamlı soruları bir grup, çift rakamlı
soruları bir grup olarak almış ve öğrencilerin iki gruptan
aldıkları toplam puanlar arasındaki korelasyonu
hesaplayarak 0,75 bulmuştur. (Testin tamamı 0,86)
NOT: Testi yarılama yöntemiyle elde edilen güvenirlik
testin yarısına ait güvenirlik düzeyidir. Bu nedenle testin
tamamının güvenirliği Spearman-Brown veya Rulon
formülüyle belirlenir.
+
Güvenirlik Türleri
(KR-20 ve KR-21Yöntemi)
Maddelerinin tamamı aynı özelliği ölçen ve doğru-yanlış
olarak sınıflandırılan bir testin tek bir uygulama sonucunda elde
edilen iç tutarlık katsayısıdır.

Kuder- Richardson yöntemi olarak da adlandırılır. Doğru
cevaplara 1, yanlış ve boş cevaplara 0 puan verilerek işlem
yapılır.

Bu yöntem ölçme aracının iç tutarlılığı ile ilgili olduğu için
bulunan katsayı iç tutarlık katsayısı olarak adlandırılır.

+
Güvenirlik Türleri
(KR-20 ve KR-21Yöntemi)
Eğer;

Maddelerin puanları eşitse (Her soru 5 puan)

Soruların güçlük düzeyleri farklı ise
Düzeltme formülü kullanılmamışsa (Dört yanlış bir
doğruyu götürmüyorsa)

KR-20
Eğer;

Maddelerin puanları farklı ise

Soruların güçlük düzeyleri birbirine yakınsa (0,45-0,55)
Düzeltme formülü kullanılmış ise (Dört yanlış bir
doğruyu götürüyorsa)

KR-21
+
Güvenirlik Türleri
(Cronbach Alfa Yöntemi)
Bir testin bir kez uygulanması ve testte yer alan maddelerin
birbirleriyle uyumuna bakılarak testin güvenirliğini kestirme
yöntemidir.

Cronbach alfa yöntemiyle bir ölçme aracında yer alan x tane
maddenin homojen bir yapı oluşturup oluşturmadığı test edilir.

KR-20 yönteminin daha genişletişmiş bir versiyonu olarak
kabul edilmektedir.

+
Güvenirlik Türleri
(Cronbach Alfa Yöntemi)
Cronbach
alfa yöntemiyle testteki matematiksel olarak tüm
olası yarı formlarının korelasyonlarının ortalamasıdır.
Cronbach alfa yöntemiyle ölçme aracı bir defa kullanıldığı ve
analizlerde bu maddelerin birbirleriyle ilişkisi incelendiği için
elde edilen değer iç tutarlılık katsayısı olarak kabul edilir.

Özellikle eğitimde kullanılan tutum, kişilik veya davranış
ölçeklerinde cronbach alfa (α) güvenirlik katsayısı
hesaplanmaktadır.

+
Güvenirlik Türleri
(Puanlayıcı Güvenirliği)
Puanlayıcı güvenirliği, ölçmeyi yapan kışının veya
araştırmacının güvenirlik düzeyinin belirlenmesidir.

Puanlayıcı güvenirliği için farklı istatistiksel teknikler
(korelasyon, kappa istatistiği vb.) kullanılabilir.


Bunun için;
puanlayıcı tekse, bir gruptan topladığı verileri bir süre sonra
tekrar puanlar ve elde edilen değerler arasındaki ilişkiye bakar.
 birden fazla puanlayıcı varsa, bir gruptan toplanan veriler
birbirinden bağımsız olarak farklı puanlayıcılar tarafından puanlanır.
Puanlayıcılar arası korelasyon yüksek ise güvenirlik yüksek kabul
edilir.

+
Güvenirliği Etkileyen Faktörler
 Testte
yer alan soru sayısı
 Test
uygulanan grubun özelliği
 Test
türü
 Testin
 Testi
güçlük düzeyi
cevaplama süresi
 Testin
uygulandığı ortam
 Testin
anlaşılırlığı
+
Güvenirliği Artırmak için
Yapılabilecekler
Soru
sayısını artırmak
Soruları
açık ve anlaşılır olarak hazırlamak
Sınavları
uygun ortamda yapmak
Öğrencilere
Soruları
yeterli zaman vermek
öğrencilerin seviyesine uygun hazırlamak
Birçok
puanlayıcıya puanlatmak
Kopya
çektirmemek
Soruları
orta güçlükte hazırlamak
Objektif
puanlanan ölçme araçlarını tercih etme
+
KPSS-2010
+
KPSS-2010
+
KPSS-2012
+
KPSS-2013
+
KPSS-2013
+
Kullanışlılık
Kullanışlılık
ölçme aracının geliştirilmesinin, çoğaltılmasının,
uygulanmasının, cevaplanmasının ve puanlanmasının kolay ve
ekonomik olmasıdır.

Bir ölçme aracının kullanışlı olması için;

Hazırlanmasının kolay olması,
Ekonomik
olması,

Puanlamasının pratik olması,

Uygulama süresinin kısa olması,

Uygun bir yönergesinin olması,

Ölçme işlemini yapan kişiden istenen becerinin az olması gerekmektedir.
+
KPSS-2012