İstatistik-1 Doç.Dr. Cem S. Sütçü Marmara Üniversitesi İletişim Fakültesi Bilişim A.B.D. [email protected] Temel Kavramlar Veri kelimesi Latince’de “gerçek”, “reel” anlamına gelen “datum” kelimesine karşılık gelmektedir.

Download Report

Transcript İstatistik-1 Doç.Dr. Cem S. Sütçü Marmara Üniversitesi İletişim Fakültesi Bilişim A.B.D. [email protected] Temel Kavramlar Veri kelimesi Latince’de “gerçek”, “reel” anlamına gelen “datum” kelimesine karşılık gelmektedir.

İstatistik-1

Doç.Dr. Cem S. Sütçü Marmara Üniversitesi İletişim Fakültesi Bilişim A.B.D.

[email protected]

Temel Kavramlar

Veri kelimesi Latince’de “gerçek”, “reel” anlamına gelen “datum” kelimesine karşılık gelmektedir. “Data” olarak kullanılan kelime ise “datum” kelimesinin çoğuludur.

Her ne kadar kelime anlamı olarak gerçeklik temel alınsa da her veri mutlaka somut gerçeklik göstermez. Kavramsal anlamda veri, kayıt altına alınmış her türlü olay, durum, fikirdir. Bu anlamıyla değerlendirildiğinde çevremizdeki her nesne bir veri olarak algılanabilir.

2

Temel Kavramlar

BİLGELİK BİLGİ ENFORMASYON VERİ

3

Temel Kavramlar

Bilgelik (Wisdom) ulaşılmaya çalışılan noktadır ve bu kavramların zirvesinde yer alır. Bilgilerin kişi tarafından toplanıp bir sentez haline getirilmesiyle ortaya çıkan bir olgudur. Yetenek, tecrübe gibi kişisel nitelikler birer bilgelik elemanıdır.

Bilgi (Knowledge), bu süreçteki üçüncü aşamadır. Enformasyonun alıcı için taşıdığı anlamdır. Diğer bir deyişle alıcının bir fonksiyonudur. Enformasyonun, bilgiye dönüşmesi, bireyin onu algılaması, özümsemesi ve sonuç çıkarmasıyla gerçekleşir. Dolayısıyla bireyin algılama yeteneği, yaratıcılık, deneyim gibi kişisel nitelikleri de bu süreci doğrudan etkilemektedir.

Enformasyon (Information), veri kavramının tanımından yola çıkıldığında, piramiddeki ikinci basamaktır. Yani verilerin ilişkilendirilmiş, düzenlenmiş, işlenmiş halidir. Bu haliyle enformasyon, potansiyel olarak içinde bilgi barından bir veri halindedir.

Veri, oldukça esnek bir yapıdadır. Temel olarak varlığı bilinen, işlenmemiş, ham haldeki kayıtlar olarak adlandırılırlar. Bu kayıtlar ilişkilendirilmemiş, düzenlenmemiş yani anlamlandırılmamışlardır. Ancak bu durum her zaman geçerli değildir. İşlenerek farklı bir boyut kazanan bir veri, daha sonra bu haliyle kullanılmak üzere kayıt altına alındığında, farklı bir amaç için veri halini koruyacaktır.

4

Bilimsel Araştırma

Araştırma yapmadan önce en temel olan, araştırılacak bir sorunun (bir hipotezin) varlığıdır.

H

o

: Sıfır Hipotezi H

1

: Alternatif Hipotez

5

Bilimsel Araştırma

Daha sonra bu sorunun ne kadar anlam taşıdığı, yani olası cevabın diğer hangi yeni soruları ve araştırmaları gündeme getireceği, pratik kullanım alanlarının neler olduğu, bilgi birikimine (knowledge) ne kadar katkıda bulunacağı, aynı hipotezin daha önce yeterli derecede araştırılıp araştırılmadığı, bulunan sonuçların tutarlılığı gibi sorular gündeme getirilmelidir.

6

Bilimsel Araştırma

Bilimsel bir merak ve bu merakın tatmini, söz konusu soruların yeterince cevaplanamadığı durumlarda günümüzde artık destek bulmamakta ve yayımlanma şansını zorlukla yakalayabilmektedir.

7

Bilimsel Araştırma

Bundan sonraki aşama ise soru/hipotezin nasıl test edileceğidir. Kullanılacak yöntemin bilimsel (yani tekrar test edilebilir, diğer araştırmacılar ve klinisyenler tarafından anlaşılabilir, matematiksel geçerliliği mutabık olunan istatistiksel yöntemlerle incelenmiş) olması gereklidir.

8

Bilimsel Araştırma

Araştırmanın nasıl yapılacağı (uygun finansal destek, denek sayısı, ortam, vs.) daha sonra sorulacak bir sorudur. Yani araştırma sorusunun bilimsel olarak geçerli bir yöntemle nasıl test edileceği sorusunun cevabı aranmadan başlanan çalışmalar pek çok açıdan sıkıntılarla karşılaşacaktır.

9

Bilimsel Araştırma

Bu sıkıntılara örnek olarak; seçilen anket/ görüşme yöntemi/ labaratuar testi/ ilaç dozu vs. sonradan değiştirilmesi, çalışma deseninin bozulması (yeniden başlama), denek sayısı ve/veya finans desteğinin yetmemesi, tanıların yanlış konması, sonuçlara etki eden kofaktörlerin unutulması, eksik data toplanması, zaman ve motivasyon kaybı, araştırmanın bitmemesi ve asla yayımlanmaması vs. sayılabilir. 10

Bilimsel Araştırma

Öncelikle yapılması gereken

tanımlanmasıdır. Bilimsel düşüncenin temelinde neden değişkenlerimizin sonuç ilişkisi yatar. Neredeyse tüm bilimsel araştırmalar da bu ilişkiyi inceler. Sonuç yani

bağımlı değişken

(

bağımsız değişken

) etkilenir. pek çok faktörden 11

Bilimsel Araştırma

İdeal araştırma, araştırdığı faktörler dışındaki değişkenlerin sabit tutulduğu araştırmadır. Fakat bunu gerçekleştirmek imkansızdır. Bu sebeple ideale en yakın araştırma incelediği faktörler dışındaki değişkenleri mümkün olduğunca hesaba katar. Araştırmalarda

faktör (bağımsız değişken)

sayısı arttıkça denek sayısının artması gerekir ve kullanılan istatistiksel yöntem değişir.

12

İstatistik

İstatistik, verilerin toplanması, organize edilmesi, özetlenmesi, sunulması, analiz edilmesi ve bu verilerden bir sonuca varılabilmesi ile ilgili olarak kullanılan bilimsel metodlar topluluğudur. 13

İstatistik

Uygun istatistik yöntemin seçilmesi için değişkenlerin ölçüm özellikleri iyi belirlemek gerekir. Kategorik değişkenlere, sayısal değişkenlerde uygulanabilecek istatistik yöntemleri uygulamak gibi hatalara düşmemek için, bu özellik çok önemlidir. 14

Ölçekler

İsimsel, Kalitatif (Nominal) Ölçekler Sıralı (Ordinal) Ölçekler Aralık (Interval) Ölçekler Oransal (Ratio) Ölçekler 15

İstatistiksel Yöntemler

Betimsel (Tanımsal) İstatistik Yöntemleri – Merkezi Eğilim Ölçüleri – Dağılım (Değişim) Ölçüleri Çıkarımsal İstatistik Yöntemleri – Farkların önemli olup olmadığının incelendiği teknikler (Parametrik ve Nonparametrik Testler).

– İlişki saptama ve eldeki verilerin kestirim yapabilme gücünü test eden teknikler (Regresyon ve Korelasyon Analizi). 16

UYGUN İSTATİSTİKSEL ANALİZ YÖNTEMİNİN SEÇİMİ

Bu aşamaya gelmeden;

1.

Araştırma soru/hipotezimiz var.

2.

3.

Araştırma hipotezi bilimsel bir anlam ve değer taşıyor.

Daha önceki literatür bilgileri incelenmiş, sorunun cevabı araştırılmamış ya da yeterince aydınlatılamamışsa;

Şu soruların cevapları aranmalıdır:

1.

Araştırma bir farklılık araştırması mı yoksa bir ilişkisellik araştırması mı olacaktır?

2.

3.

Verilerin ölçekleri ne türdedir?

Çalışmada kaç hasta/denek grubu vardır?

4.

5.

6.

Bağımsız değişkenlerimiz (faktörlerimiz) bir tane mi yoksa daha fazla mıdır?

Veri gruplarımız bağımlı (grup içi/repeated) mı yoksa bağımsız mıdır?

Sayısal verilerin dağılımı normal midir?

17

Merkezi Eğilim Ölçüleri

Aritmetik Ortalama

: Değerlerin toplamının denek sayısına bölünmesiyle elde edilir. Sayısal değişkenler için merkezi eğilim ölçütüdür. Ordinal değişkenler için kullanılamaz. Aşırı değerlerden etkilenir. Uç değerleri değerlendirme dışı tutan ya da uç değerlere daha az ağırlık veren kareli ortalama veya geometrik ortalama uç değerlerin etkisini azaltmak için kullanılabilir.

Ortanca =Orta değer=Median:

Küçükten büyüğe ya da büyükten küçüğe doğru sıralandığında, tam ortadaki deneğin değeridir. Denek sayısı çiftse, ortadaki iki deneğin ortalamaları alınır. Ordinal veriler için en iyi merkezi dağılım ölçütüdür. Aşırı değerlerden etkilenmez. Nominal değerler için uygun değildir.

Tepe değeri = Mod:

Değişkenler içinde en fazla görülen, en çok tekrarlanan değerdir. Tıpta nadir kullanılan bir merkezi eğilim ölçütüdür. Ordinal ve sayısal değişkenlerde kaba bir merkezi eğilim ölçütü olarak kullanılabilir. Nominal veriler için uygun bir merkezi eğilim ölçütüdür.

18

Dağılım (Değişim) Ölçüleri

Farklı grupların merkezi eğilim ölçütleri aynı olduğu halde, gruplar birbirlerinden çok farklı olabilir. Bu nedenle merkezi eğilim ölçütleri yanında, yayılma ölçütleri de çok önemlidir.

Değer aralığı

= Genişlik = Range: En basit yaygınlık ölçüsüdür. En küçük ve en büyük değer arasındaki farktır. Örnek büyüklüğü ile artma eğilimi vardır. Ortalama gibi, uç değerlerden çok etkilenir. En uçtaki iki değer arasında kalan değerler hakkında bilgi vermez.

Standart sapma ve varyans

: Tüm değerlerin dağılımı ile bilgi verirler. Tüm değerler eşitse, her ikisi de sıfıra eşittir. Değerler arasında farklar arttıkça standart sapma (Ss) ve varyans büyür. Standart sapma değişken değerlerinin ortalamanın etrafındaki yayılmasını temsil eden bir yayılma ölçütüdür. Ss’ nın karesine varyans adı verilir. Merkezi eğilim ölçütü olarak ortalama kullanıldığında, yayılma ölçütü olarak da standart sapma kullanılır. Dağılım özelliği ne olursa olsun, değerlerin en az % 75’i ortalama ± 2Ss içinde yer alır. Normal dağılım gösteren değişken değerleri için aşağıdaki kurallar geçerlidir : – 1.

Değerlerin % 67’si ortalama ± 1 Ss içindedir.

– 2.

– 3.

Değerlerin % 95’i ortalama ± 2 Ss içindedir.

Değerlerin % 99’u ortalama ± 3 Ss içindedir.

19

20

Dağılım (Değişim) Ölçüleri

Standart hata:

Aynı evrenden seçilecek, ya da seçilmesi mümkün olan aynı büyüklükteki örneklemlerin ortalamalarının dağılmasına ortalamanın örneklem dağılımı denir. Ortalamanın örneklem dağılımının ölçütü ortalamanın standart hatası (standard error of mean = SEM)’ dır.

Çalışmaya alınan örneklemin dağılma özellikleri verilmek isteniyorsa, doğru olanı Ss’nın verilmesidir. Çünkü, SEM örneklemdeki deneklerin dağılması ile ilgili olmadığı için, çalışma grubunun değişkenliğini göstermez. Çalışma gruplarındaki ortalamaların karşılaştırıldığı grafiklerde ise SEM kullanılması daha doğrudur.

Değişim katsayısı [coefficient of variation (CV)]:

ortalamaya oranının yüzde olarak ifadesidir. Birimleri farklı olan değişkenlerin yayılmalarını karşılaştırmak için değişim katsayıları kullanılır. Değişim katsayısı, standart sapmanın 21

Grafiksel Gösterimler

Histogramlar 22

Grafiksel Gösterimler

Eğiklik (Skewness) Sağa eğik (skewed right) ve sola eğik (skewed left) 23

Grafiksel Gösterimler

Basıklık (Kurtosis) Eğri A: Dik, Eğri B: Normal Eğri C: Basık 24