veri analizi bölüm 1-2

Download Report

Transcript veri analizi bölüm 1-2

VERİ ANALİZİ YL
GİRİŞ
BÖLÜM:1-2
İSTATİKSEL KAVRAMLAR VE UYGULAMA ALANLARI
Az sayıda analiz yapıldığı için artı ve eksi değerler birbirine eşit olmayabilir. Analiz
sonuçlarından üç tanesi ortalama değerden (45,60) küçükken, bir tanesi büyüktür.
Bu şekilde az sayıdan oluşan analiz sonuçlarında ortalama değer yerine orta değer
kullanılması daha uygundur (iki analiz hariç). Ancak bunu tayin etmek bir tecrübe
işidir. Alınan sonuçların doğru değerine popülasyon ortalaması, ortalama değere de
numune ortalaması da denir.
ORTA DEĞER


Analiz sonuçlarının, doğru değerin altında ve üstünde eşit
olarak dağılması teorisinden hareketle, bir analizin sonucu
orta değer olarak ta verilebilir ve M ile gösterilir. Orta değer
M’yi bulmak için analiz sonuçları, en küçükten en büyüğe
doğru sıraya konur ve sıranın ortasına düşen sonuç orta
değer olarak alınır. Tek sayıdaki analiz sonuçlarından orta
değer bir tane iken çift sayıdaki analiz sonuçlarından iki tane
orta değer olarak alınır. Bakır analizi sonucunda bulunan orta
değer, yüzde 45,32 dir.
Analiz sonucu ortalama değerle verildiğinde, üç analiz sonucu
ortalama değerin altında kalacaktır. Bu nedenle az sayıda
analiz verildiği zaman ortalama değer yerine orta değer
alınması daha anlamlıdır (iki analiz hariç).
NOT: Bir analizde sistematik bir hata (bias) yoksa
ortalama ve orta değerler aynıdır veya birbirine çok
yakındır.
 ÖRNEK: Bir krom madenindeki krom tayini edilmiş ve
yüzde olarak 20,15; 20,30; 20,18; 20,27 ve 20,20
bulunmuştur. Buna göre ortalama ve orta değerini
bulunuz.
Ortalama değer :
%
20,22
Orta değer :
%
20,20

İki değer birbirine çok yakın olduğu için analizde sistematik
bir hata (bias) yoktur. Ancak bakır alaşım analizi örneğinde
aynı şeyi söylemek mümkün değildir. Bias vardır.



NOT: Ortalama değerin çok yakın olduğu için, analizde
bulunan bütün değerlerin temsil edilmesidir. Bu
bakımdan orta değerden daha iyidir. Ancak bir grup
analizden bir tanesinin gruptan sapmasından çok
etkilenir. Böyle durumlarda orta değere daha çok
güvenilir.
Örneğin: verilen bir numune üzerine 3 analiz yapılmış
ve analiz sonuçlarından biri ötekilerden çok sapmış
ise çok sapanı atıp kalan iki sonucun ortalamasını
almak yerine, üçüncü orta değerini almak daha uygun
olur. Böyle durumlarda bazen bir iki analiz daha yapılır
ve böylece çok sapan değerin ortalama üzerindeki
etkisi azaltılır.
NOT: ikili analizler(paralel analizler)bir sonucu
ikincisiyle kontrol etmek için yapılır.
KESİNLİK VE DOĞRULUK





Kesinlik ve doğruluk farklı iki kavramdır. Bir analizde bulunan sonuçların birbirine
yakınlığına kesinlik denir. Kesinliğin ölçüsü, bir analizde alınan sonuçların ortalama
değerinden(orta değerden) farklıdır. Bu farklılığın küçük olması, kesinliğe o kadar
yakındır anlamındadır. Doğruluğu tanımlamak için ise elde edilen doğru değerin
bulunması (veya doğru kabul edilen değerin bulunması) gerekir. Böyle bir sonuç
yoksa bulunan sonuçların doğruluğundan bahsedilmez.
Doğruluk, doğru değer ile bir analizde bulunan ortalama değerin arasındaki farktır
(Doğru değer ve analiz ortalama değer farkı). Dolayısı ile kesinlikle doğruluk arasında
bir bağlantı yoktur.
Örneğin; saf nikotinik asit içerisinde azot yüzdesi, doğru kabul edilen değerdir. Buna
göre analiz için verilen bu madde içerisindeki azot yüzdesi hesaplanır. Bu işlem
(ölçme işlemi bir kaç kez yapılır, ne kadar ölçme işlemi n artarsa o kadar
mümkündür). Analiz sonuçları ile doğru kabul edilen değer karşılaştırılır. Analizde
alınan sonuçların ortalaması bulunur. Alınan sonuç ile doğru değerin karşılaştırılması
analiz için
(doğruluğu için) bize bir fikir verir.
İstatistikçi için doğru değer, sonsuz sayıda analiz sonuçlarında hesaplanan değerdir.
Tek analizde, kesinlikten söz etmek mümkün değildir ama hatadan söz edilebilir.
Çünkü her analizde bir hata payı vardır.
KESKİNLİĞİN BELİRTİLME ŞEKİLLERİ






a) Dağılım
b) Sapma, ortalama sapma ve bağıl ortalama sapma
c) Variyans
d) Standart sapma ve bağıl standart sapma (RSD)
Dağılım: Bir analizde elde edilen sonuçların en büyüğü ile en
küçüğü arasındaki farka "dağılım" denir. Dağılım "b" veya "W"
ile gösterilir.
Bakır analizinde verilen analiz sonuçlarının dağılımı b=w= %
46,62- %45,13 = %1.49 Cu’dır. Buna karşılık krom
cevherinde verilen örnekteki dağılım %0,15 kromdur. Dağılım
ne kadar küçükse, yapılan analizin keskinliği o kadar iyidir.
Dağılım boyutludur (gramla, mL vs ile gösterilir). Dağılım iyi
bir kesinlik (sonucudur) ölçüsüdür ve bazen standart
sapmanın hesaplanmasında kullanılır.
Örnek: Analizci tarafından bir parti amonyak çözeltisi üzerinde
yapılan tekrar deneylerinden alınan sonuçlar ( gerçek değer veya
doğru değer 15,1' dir) aşağıdavverilmiştir.
NOT: Uygulamalar daha sonra verilecektir.
Yukarıda verilen, sonsuz sayıda analiz sonucunda (popülasyon) elde edildiği kabul
edilen bir varyanstır. Onun için de σ2 ile gösterilmiştir. Pratikte σ2 yi elde etmek
mümkün olmaz. Çünkü günlük işlemde yapılan analiz sayısı genelde 3-5 ile sınırlıdır.
Bu nedenle böyle 3-5 analiz sonucundan elde edilen varyans σ2 ile değil S2 ile
gösterilir. Bunun hesaplanmasında
Örnek: Bir gölden tutulan balıkların 5 tanesi numune olarak alınmış ve bunlar da
atomik absorbsiyon spektroskopisi ile civa tayini yapılmıştır. Bu tayinlerde bulunan
sonuçlar aşağıda verilmiştir. Balıklarda yapılan bu ölçümlerin harman standart
sapmasını hesaplayınız.
Standart Sapmanın Dağılımından Hesaplanması
Standart sapma dağılımından da hesaplanabilir.
s = k. Dağılım
k kat sayısına dağılım faktörü denir ve değeri analiz sayısına bağlıdır.
Analiz sayısı
Dağılım faktörü
2
0.89
3
0.59
4
0.49
5
0.43
6
0.40
7
0.37
8
0.35
9
0.34
10
0.33
örnek: Bir analizde yüzde olarak 29.13, 29.25, 29.30 değerleri elde edilmiştir
Dağılım (b) : 29,30 - 29,13 = % 0,17
Dağılım faktörü (k) : 0,59 (üç analiz için )
Güven Aralığı ve Güven Seviyeleri
Birçok deney yapılır ve bunların ortalama ve standart sapması hesaplanırsa µ
ve σ değerleri bulunur. Bu şekilde bulunan (değerler)doğru değer ve standart
sapma en güvenilir değerlerdir. Çünkü yapılması gereken sayıda deney ve
ölçme yapılmıştır. Aynı metotla bir deney yapılırsa bu deneyle bulunan
sonucun doğru değer µ den artı veya eksi ne kadar uzak olduğu standart
sapmadan yararlanılarak bulunur. İstatistiksel olarak bulunan bu tek sonucun
doğru değer µ den %68,3 olasılıkla en çok ±1 σ kadar uzakta %96 olasılıkla en
çok ±2 σ kadar uzakta %99,7 olasılıkla ±3 σ kadar uzakta %99,9 olasılıkla
±3,29 σ kadar uzakta bulunur.