Korelasyon ve Nonparametrik testler (B.Ulu)

Download Report

Transcript Korelasyon ve Nonparametrik testler (B.Ulu)

Korelasyon
Parametrik Olmayan Testler
Fatma Betül ULU
İçerik

Korelasyon
- Basit Korelasyon (Pearson Korelasyon Katsayısı)
- Kısmi Korelasyon

Parametrik Olmayan Testler
-Tek Örneklem Kay-Kare Testi
-İki Değişken Kay-Kare Testi
-İlişkisiz Ölçümler İçin Mann Whitney U Testi
-İlişkisiz Ölçümler İçin Kruskal Wallis H Testi
-İlişkili Ölçümler İçin Wilcoxon İşaretli Sıralar Testi
Korelasyon




Olaylar arasındaki ilişkilerin açıklanmasıdır.
Deneklerin ya da bireylerin iki değişkene ait değerlerine sahip
olunduğunda, iki değişken arasındaki ilişkiyi bulmak için
korelasyon teknikleri kullanılır.
Örneğin, üniversite giriş puanı ile performans arasındaki ilişkiyi
incelemek isteyen biri “üniversite giriş puanı yüksek olan
öğrenciler üniversitede daha mı başarılı olur?” sorusunun yanıtını
arayabilir.
Değişkenler arasındaki ilişkinin incelenmesi, değişkenlerin ölçme
yapısına, dağılımın özelliklerine, aralarındaki ilişkinin doğrusal
olup olmamasına, değişken sayısına ve kontrol durumuna bağlı
olarak farklı istatiksel teknikler kullanılarak yapılmaktadır.
Basit Korelasyon: Pearson Korelasyon
Katsayısı




İki değişken arasındaki ilişki bulunur.
Pearson korelasyon katsayısı, iki değişkenin de
sürekli olmasını ve değişkenlerin birlikte normal
dağılım göstermesini gerektirmektedir.
Spearman Brown Sıra Farkları korelasyon katsayısı
değişkenler normal dağılım göstermiyorsa kullanılır.
Değişkenlere ait değerlerin puan yerine sıra değeri
olarak verildiği durumlarda da sıra farkları
korelasyon katsayısı kullanılır.
Pearson Korelasyon Katsayısı,
a)Kuvvet (düşük – orta – yüksek)
b) Yön (pozitif – negatif)
c) Açıklanan Varyans (determinasyon
katsayısı)
d) İstatiksel Anlamlılık
e) Pratik Anlamlılık açısından yorumlanabilir.

Korelasyon Katsayısının,



1.00 olması :
Mükemmel pozitif ilişki
-1.00 olması:
Mükemmel negatif ilişki
0.00 olması:
İlişki yok



0.70 – 1.00:
yüksek
0.70 – 0.30:
orta
0.30 – 0.00:
düşük


Açıklanan varyans, değişkenlerden birinde gözlenen
değişkenliğin ne kadarının diğer değişken tarafından
açıklandığını yorumlamada kullanılır ve korelasyon
sayısının karesine eşittir.
Yapılan bir test işleminde korelasyon katsayısı
düşük olmasına karşılık anlamlı çıkabilir ya da
yüksek düzeyde bir korelasyon katsayısı anlamlı
çıkmayabilir. Bu durum büyük ölçüde puanların
toplandığı örneklem sayısına bağlıdır.
Analiz için İşlem Adımları
Bir kurumda görev yapan personlein iş doyumu ile yaş, gelir ve
denetim odağı puanları arasındaki ilişki araştırılıyor.
“Personelin iş doyumu ile yaşı arasında anlamlı bir ilişki var mıdır?”
1.
2.
Analyze / Correlate / Bivariate komutunu seçin.
“Bivariate Correlation penceresinde
a)yaş ve doyum değişkenini “variables” a taşıyın
b) “Correlation Coefficients” kısmında “Pearson” seçin
c) OK
Yaş ve Doyum Arasındaki İlişki
Korelasyonu (output)
Yaş
Doyum
Yaş
Pearson Correlation
Sig (2 tailed)
N
1.00
,
30
.716
.00
30
Doyum
Pearson Correlation
Sig (2 tailed)
N
.716
.00
30
1.00
,
30


İş doyumu ile yaş arasında yüksek düzeyde pozitif yönlü
bir ilişki vardır. r=0.716 p .01 yani yaş arttıkça iş doyumu
artmaktadır.
Determinasyon katsayısı=0.51 dikkate alındığında, iş
doyumundaki toplam varyansın %51’nin yaştan kaynaklandığı
söylenebilir.
Kısmi Korelasyon Katsayısı
İki değişken arasındaki ilişki, salt bu iki değişkenden
kaynaklanabileceği gibi, bu değişkenlerle ilişkili olan m tane
değişkenden de kaynaklanabilir.
 Kısmi korelasyon iki değişken arasındaki ilişkiyi, bu değişkenlerle
ilişkili olan bir ya da birkaç tane değişkeni kontrol ederek
hesaplanmasını sağlar.
 Kısmi korelasyonun hesaplanması için:
1) aralarında ilişkinin miktarı bulunacak değişkenlerin ve bu
değişkenlerdeki varyanslarının sabitleneceği, kontrol edileceği
dışsal değişkenlerin sürekli olması
2) Değişkenlerin normal dağılım göstermesi gerekmektedir.

Analiz İçin İşlem Adımları
Denetim odağı puanları kontrol edildiğinde
personelin iş doyumu ile yaşı arasında anlamlı bir
ilişki var mıdır?
1.
Analyze/ Correlate / Partial.. Seçin
2.
Partial Correlation penceresinde
a) yaş ve doyum değişkenlerini “variables” kutusuna
taşıyın.
b)denetim değişkenini “ controlling for” kutusuna
aktarın
c) OK

Denetim Odağı Kontrol Edildiğinde Yaş ve
Doyum Arasındaki Korelasyon
Partial Correlation Coeffcients
Controlling for… Denetim
Yaş Doyum
Yaş
1.000 .429
(0) (27)
P= ,
P= .022
Doyum
.4249 1.00
(27)
(0)
P= .022 P= ,

Denetim puanları
kontrol edildiğinde
(sabit tutulduğunda)
yaş ile iş doyumu
arasında orta düzeyde,
pozitif ve anlamlı bir
ilişki olduğu
bulunmuştur. r=0.425 p
.05
Tek Örneklem Kay Kare Testi




Bir değişkenin düzeylerine giren birey ya da nesnelerin anlamlı
bir farklılık gösterip göstermediğini test eden tek örneklem için
uygulanır.
Test gerçekte, değişkenin her bir kategorisinde gözlenen
sayıların, kategoriler için beklenen sayılardan farkının
anlamlılığını inceler.
Gözlenen ve beklenen değerler arasındaki fark azaldıkça, yani
birimlerin kategorilere olan dağılımının uyum düzeyi arttıkça,
hesaplanan kaykare istatistiğinin anlamlı çıkma olasılığı
düşecektir.
Bu testin kullanılabilmesi için, beklenen değeri beşten küçük olan
kategori sayısının, toplam kategori sayısının %20’sini aşmaması
ve tüm kategorilerde bu değerin birden büyük olması gerekir.
Analiz için İşlem Adımları

1.
2.
3.
“ çocukların tercih ettikleri oyun türleri
arasında anlamlı farklılık var mıdır?”
Analyze/ Nonparametric Tests/ Chi Square
komutunu seçin.
Sol üst kısımdaki “oyun” değişkenini “test
variable list” kutusuna atın.
OK
Tercih edilen oyun türlerine göre oynama sıklıklarının
karşılaştırılmasına ilişkin kaykare testi sonuçları
Fiziksel
Kup
Dramati
k
Total



Observed
N
Expected
N
Residual
11
7
2
20
6.7
6.7
6.7
4.3
.3
-4.7
Oyun
Chi Square
Df
Asymp. Sig
11’i fiziksel, 7’si küp, 2’si dramatik türden oyun
oynamıştır.
Çocukların tercih ettikleri oyun türleri arasında
gözlenen fark anlamlı bulunmuştur. X=6.10
p .05
6.100
2
.047
İki Değişken İçin Kay-Kare Testi
İki sınıflamalı değişken arasında anlamlı bir ilişki olup olmadığını
test eder.
 İki değişken arasında ilişkinin olması, bir değişkenin
düzeylerindeki cevapların, diğer değişkenin düzeyinde
farklılaştığını gösterir.
 Analiz, biri sınıflamalı, diğeri sıralamalı olan iki değişken arasında
anlamlı bir ilişkinin olup olmadığını test etmek için de kullanılır.
 Kaykare testinde a) sd=1 olan 2x2 lik ya da
b) sd 1 olan AXB lik çapraz bir tablo söz konusu olabilir.

2x2’lik bir tabloda (sd=1) gözeneklerden birinde beklenen
değerin 5’ten küçük olması durumunda Fisher’ın Tam Olasılık
Testi kullanılır


1.
2.
3.
Serbestlik derecesi birden büyükse, beklenen değeri 5’ten
küçük gözenek sayısı %20’yi aşıyorsa ve araştırmacının denek
sayısını arttırması imkansız ise, üç farklı seçenek vardır.
İlgili satır ya da sütunun düzeylerinde mantıklı ise birleştirme
yapılır. Bu birleştirme ile gözeneklerdeki gözlem sayıları artırılır
ve bunun sonucu olarak da beklenen değerler alınabilir.
Birleştirme “RECODE” komutu ile yapılır.
Beklenen değerin 5’ten küçük olduğu gözenekleri azaltmak
amacıyla, satır ya da sütunun ilgili düzeyleri analiz dışı
bırakılabilir. Bunun için data view ekranında, “ missing value”
olarak tanımlanması gerekir.
İlk iki çözüm uygun değilse, yorumlar, çapraz tablo üzerinden
sadece frekans ve yüzdeler kullanılarak yapılır.
Analiz için İşlem Adımları



“ personelin kurumdaki çalışma kıdemi ile disiplin suçlarının
nedenlerine ilişkin görüşleri arasında anlamlı bir ilişki var mıdır?”
1. Analyze/ Descriptive Statics/Crosstabs..
2. Crosstabs’da kıdem değişkenini Rows’a ve disiplin değişkenini
Column’a aktarın.
a)”cells” i tıkla
- Percentages kısmında Row’u seç (satır yüzde, column seçilirse
sütun top)
- Continue
b)”statics” i tıkla
- chi square seç
- continue
Kıdem ve Disiplin Değişkenleri Kaykare Test Sonuçları
Disiplin
1.00
2.00
yoğun
Ast ust
iletisimsizl stres
ik
Kıdem
3.00
mevzuat
eksikliği
total
1.00
Count
% within
kıdem
20
%33.9
11
%18.6
28
%47.5
59
%100
2.00
Count
% within
kıdem
19
%33.9
9
16.1
28
%50.0
56
%100
3.00
Count
% within
kıdem
1
%5.0
8
%40
11
%55.
7
%100
4.00
Count
% within
kıdem
14
%51.9
5
%18.5
8
%29.6
20
%100
Chi square test
Pearson Chi Square
Likehood Ration
Linear by Linear
Association
N of Valid Cases
Value
df
Asym Sig
14.159
6
.028
15.897
.980
6
.014
1
.322
162
Personelin Mesleki Kıdemlerine Göre Disiplin Suçlarının
Nedenlerine İlişkin Görüşler- Kaykare Sonuçları
Ast üst
Yoğun
iletişimsizl stres
iği
Mevzuat
Bilgi
Eksikliği
Toplam
5 yıl ve daha
az
N
%
20
33.9
11
18.6
28
47.5
59
100.0
6 – 10 yıl
N
%
19
33.9
9
16.1
28
50.0
56
100
11 – 15 yıl
N
%
1
5.0
8
40.0
11
55.0
20
100
16 yıl ve üstü
N
%
14
51.9
5
18.5
8
29.6
27
100
Toplam
N
%
54
33.3
33
20.4
75
46.3
162
100
Mann Whitney U Testi







İki ilişkisiz örneklemden elde edilen puanların birbirinden anlamlı bir
şekilde farklılık gösterip göstermediğini test eder.
Bu test iki ilişkisiz grubun, ilgilenilen değişken bakımından evrende
benzer dağılımlara sahip olup olmadığını test eder.
Analizde ilk olarak iki ilişkisiz örnekleme ait puanlara, gruba
bakmaksızın en küçükten en yüksek puana doğru sıra sayıları verilir.
En küçük puana, en küçük sıra sayısı olan 1 değeri verilerek en yüksek
puana doğru sıralama yapılır.
Analiz, iki gruba ait puanların sıra sayıları toplarını temel alır.
Elde edilen sıra toplamları, grup büyüklüklerine bölünerek grupların sıra
ortalamaları bulunur.
“x programına katılan öğrencilerin iletişim becerileri, böyle bir programa
katılmayan öğrencilere göre anlamlı bir şekilde yüksek midir?”
Analiz için İşlem Adımları






1. Analyze/non Parametric Test/2
Independent test
2. Two Independent Test listesinden
A) “iletişim”i test variables list’e at
B) “Grup” u Grouping variable at
Define Groupsa tıklayarak (1 ve2) olarak
tanımla.
C)Continue
Mann Whitney Test
İletişim
Grup
N
Mean Rank
Sum of
Ranks
Deney
Kontrol
Total
7
7
14
9.86
5.14
69.00
36.00
İletişim
Mann Whitney U
Wilcoxon W
Z
Asymp. Sig
Exact Sig
8.00
36.00
-2.11
.035
.038
Grup
n
Sıra
Ortalaması
Sıra
Toplamı
U
p
Deney
7
9.86
69.0
8.0
.035
Konrol
7
5.14
36.0
Kruskal Wallis H- testi






Kruskal Wallis tekniği, ilişkisiz iki ya da daha çok örneklem
ortalamasının birbirlerinden anlamlı farklılık gösterip test eder.
Analizde k tane örneklemin bir bağımlı değişkene ait puanları
karşılaştırılır.
Bu test bağımlı değişkenin en az sıralama ölçeğinde, gözlemlerin
birbirinden bağımsız olması gerektirir.
Analiz, “puanların grup değişkenine göre oluşturulan her bir alt
grupta normal dağılım ve varyanslarının eşitliği varsayımlarını
gerektirmediği için tek yönlü varyans analizine alternatif bir
tekniktir.
Bu işlem parametrik bir test olan ANOVA’nın normallik
varsayımının karşılanmadığı durumlarda önerilir.
“öğrencilerin okuma becerileri, alınan eğitim programına göre
anlamlı farklılık göstermekte midir?”
okuma
yöntem
N
Mean Rank
A
B
C
4
4
4
2.50
6.75
10.25
okuma
Chi Square
Df
Asymp. Sig.
9.269
2
.010
Yöntem
n
Sıra
Ort.
sd
x2
p
Anlamlı
fark
A
4
2.50
2
9.26
.010
C – A,
C–B
B
4
6.75
C
4
10.25
B-A
Wilcoxon İşaretli Sıralar Testş




Wilcoxon işaretli sıralar testi ilişkili iki ölçüm setine
ait fark puanlar arasındaki farkın anlamlılığını test
etmek amacıyla kullanılır.
Bu test, ilişkili iki ölçüm setine ait fark puanşarının
yönünün yanı sıra miktarlarını da dikkate alır.
Wilcoxon işaretli sıralar testi, bağımlı değişkenin en
az sıralama ölçeğinde olmasını, gözlem çiftlerinin
birbirinden bağımsız olmasını gerektirir.
“çocukların konuşma becerileri, uygulanan X
programı sonrasında anlamlı bir şekilde artmıştır?”
Son test
ontest
Grup
N
Mean
Rank
Sum of
Ranks
Negative Ranks
Positive Ranks
Ties
Total
1
6
1
8
2.00
4.33
2.00
26.00
Sontest öntest
Z
Asymp.Sig.
-2.058
0.040
Son test
ön test
n
Sıra
ort
Sıra top
z
p
Negatif
sıra
Pozitif
sıra
Eşit
1
2.00
2.00
2.05
0.40
6
4.33
26.00
1
-
-