Előadás fóliák: MA.03

Download Report

Transcript Előadás fóliák: MA.03

Mérés és adatgyűjtés
Mérési hibák
Mingesz Róbert
2015.02.23.
Hibaterjedés
2
A mérési hiba terjedése
• Mért mennyiségek: hibával terheltek
• A belőlük számolt mennyiségek is hibával lesznek
terhelve
• Az eredmény általános megadása:
𝑞 = 𝑞 ± ∆𝑞
∆𝑞 =?
4
Egy változó esetén
𝑥 = 𝑥 ± ∆𝑥 , 𝑞(𝑥)
d𝑞
∆𝑞 =
d𝑥
∙ ∆𝑥
𝑥=𝑥
5
Több változó esetén
• A vizsgált mennyiség több mért mennyiségtől függ:
𝑞 = 𝑞 𝑥, 𝑦, ⋯
• Minden egyes mennyiség hibája növeli a
végeredmény hibáját
• Egymástól független hibák esetén: szórásnégyzetek
adódnak össze:
∆𝑞
2
= ∆𝑞𝑥
2
+ ∆𝑞𝑦
2
+⋯
6
Hibaterjedés több változó esetén
∆𝑞
∆𝑞
2
∆𝑞 =
𝜕𝑞
=
𝜕𝑥
𝜕𝑞
𝜕𝑥
2
= ∆𝑞𝑥
2
+ ∆𝑞𝑦
2
∆𝑥
2
𝑥=𝑥,𝑦=𝑦
2
∆𝑥
𝑥=𝑥,𝑦=𝑦
2
𝜕𝑞
+
𝜕𝑦
𝜕𝑞
+
𝜕𝑦
2
+⋯
2
∆𝑦
2
+⋯
𝑥=𝑥,𝑦=𝑦
2
∆𝑦
2
+⋯
𝑥=𝑥,𝑦=𝑦
𝜕𝑦
Parciális derivált:
𝜕𝑥
7
Példa
𝑚 = 3,21 kg ± 0,05 kg
m
m
𝑣 = 7,31 ± 0,11
s
s
1
𝐸mozgási = 𝑚𝑣 2
2
𝐸mozgási =?
8
Megoldás
• Az átlagérték:
1
1
2
𝐸m = ∙ 𝑚𝑣 = ∙ 3,21 ∙ 7,312 J ≈ 85,7649 J
2
2
• A hibaterjedés:
∆𝐸m =
𝜕𝐸m
𝜕𝑚
2
𝑚=𝑚,𝑣=𝑣
𝜕𝐸m
2
∆𝑚 +
𝜕𝑣
2
∆𝑣
2
𝑚=𝑚,𝑣=𝑣
𝜕𝐸m 𝑣 2 𝜕𝐸m
=
,
= 𝑚𝑣
𝜕𝑚
2 𝜕𝑣
9
Megoldás
∆𝐸m =
∆𝐸m =
2
2
𝑣
2
∆𝑚
2
+ 𝑚𝑣
2
7,312
∙ 0,052 + 3,21 ∙ 7,31
4
∆𝑣
2
2
∙ 0,112 J
∆𝐸m ≈ 2,906377 J
• A végeredmény:
𝐸𝑚 = 85,76 J ± 2,91 J
10
A mérési adatok feldolgozása
11
Elemi műveletek
• Adatok regisztrálása → lajstrom
• Számlálás → N
• Rangsorolás:
• sorba rendezés
• sorszám hozzárendelése
• Összegzés
• Középérték
13
Követelmények a középértékkel szemben
• Legyen a mért adatok maximuma és minimuma
között
• Egyszerű módszerrel számolható
• Könnyen értelmezhető
• Ne legyen érzékeny a kiugró adatokra (robosztus)
14
Számtani átlag
1
𝑥𝑁 =
𝑁
𝑁
𝑥𝑖
𝑖=1
• Súlyozott átlag:
1
𝑥𝑁 =
𝑁
𝑤𝑖′
=
𝑁
𝑤𝑖′ 𝑥𝑖
𝑖=1
𝑤𝑖
𝑁
𝑖=1 𝑤𝑖
15
Mozgóátlag
• Időben változó mennyiségek átlagolása
• Utolsó N adat figyelembevétele:
𝑥𝑁
1
𝑘 =
𝑁
𝑘
𝑥𝑖
𝑖=𝑘−𝑁+1
16
Felejtő átlag
𝑥𝑁
1
𝑘 =
𝑁
𝑘
𝑤 𝑘 − 𝑖 𝑥𝑖
𝑖=−∞
1 𝜏−1
𝑤 𝑖 = 𝜏
𝜏
0
𝑖
ha 𝑖 ≥ 0
ha 𝑖 < 0
• Tipikus számolás rekurzív képlettel:
𝑥𝑁
1
𝜏−1
𝑘 = ∙ 𝑥𝑘 +
∙ 𝑥𝑁 𝑘 − 1
𝜏
𝜏
17
További átlagok
• Négyzetes átlag
𝑥12 + ⋯ 𝑥𝑁2
𝑁
𝑥𝑞 =
• Mértani átlag (geometriai átlag)
𝑥𝑞 =
𝑁
𝑥1 ∙ ⋯ ∙ 𝑥𝑁
• Harmonikus átlag
𝑥ℎ =
𝑁
1
1
+
⋯
+
𝑥1
𝑥𝑁
18
Momentumok
• r-ed rendű momentum:
𝑚𝑟 =
𝑁
𝑟
𝑥
𝑖=1 𝑖
𝑁
• Első rendű momentum: átlag
• Centrális momentum: átlagtól való távolság
𝑚𝑟 =
𝑁
𝑖=1
𝑥𝑖 − 𝑥𝑁
𝑁
𝑟
19
Módusz és Medián
• Módusz: A leggyakrabban előforduló érték
• Medián: sorba rendezett mérési eredmények
esetén a középen lévő érték
páros mérési szám esetén a két középső eredmény
átlaga
• Érzéketlen a kiugró adatokra
20
Példa
• Egy cégnél 10 alkalmazott van foglalkoztatva,
mindegyik 100 eFt-os bért kap havonta.
• A cégnek két főnöke van, mindketten 5 MFt-ot
keresnek havonta.
• Mennyi az „átlag” bér?
21
Átlagbér – számtani közép
• Számtani közép
10 ∙ 100 eFt + 2 ∙ 5 MFt
𝑏𝑁 =
= 425 eFt
12
• Medián
𝑏6 + 𝑏7
= 100 eFt
2
22
Kvantilisek - osztópontok
• medián: két részre osztja a mérési adatokat
• tercilis: három részre osztja a mérési adatokat
két osztópont van
• kvartilis: negyedel
három osztópont van
• kvintilis: ötödöl
• decilis: tizedel
• percentilis: századol
23
Szóródás
• Szóródás terjedelme (pk-pk érték)
𝑇 = 𝑥max − 𝑥min
• Interkvantilis terjedelem
az alsó és a felső kvantilis különbsége
• Átlagos abszolút eltérés
• Szórás
• elméleti (ismerjük a tényleges értéket)
• tapasztalati
24
Mérési adatok ábrázolása
25
Doboz ábra (Box plot)
26
Jelek ábrázolása
HIBÁS ÁBRÁZOLÁS
27
Pontgrafikon
28
Leolvasást követő vonallal
29
Görbített vonal – nem jó!
HIBÁS ÁBRÁZOLÁS
30
Függvények illesztése
31
Függvény illesztése
• Mérés:
• két vagy több, egymástól függő fizikai mennyiség
𝑦 = 𝑓(𝑥, 𝑎, 𝑏, ⋯ )
• (𝑥1 , 𝑦1 ), (𝑥2 , 𝑦2 ), ... – mért értékek
• 𝑎 , 𝑏 – ismeretlen paraméterek
32
Paraméterek meghatározása
• függvény illesztése ⇒ becslés a paraméterekre
• Módszerek
•
•
•
•
papíron, szemre
Monte Carlo módszerek
genetikus algoritmusok
analitikus:
• Legkisebb négyzetek módszere
• Maximum-likelihood-módszer
• közelítő megoldások (iterációs módszer)
• ...
33
Illesztés hibája
∆𝑦 = 𝑦𝑖 − 𝑓 𝑦𝑖 , 𝑎, 𝑏, ⋯
34
Legkisebb négyzetek módszere
• Cél: hibaösszeg minimalizálása
szélsőérték keresése
𝑁
𝑆 𝑎, 𝑏, ⋯ =
𝑁
∆𝑦𝑖
𝑖=1
2
=
𝑦𝑖 − 𝑓 𝑦𝑖 , 𝑎, 𝑏, ⋯
2
𝑖=1
𝑆 𝑎, 𝑏, ⋯ = min
35
Egyenes illesztése
• Egyenes egyenlete:
𝑦 =𝑎∙𝑥+𝑏
36
Szélsőérték keresése
𝑁
𝑆 𝑎, 𝑏 =
𝑦𝑖 − 𝑎 ∙ 𝑥𝑖 + 𝑏
2
= min
𝑖=1
• elsőrendű deriváltak nullák:
𝜕𝑆(𝑎, 𝑏)
=
𝜕𝑎
𝜕𝑆(𝑎, 𝑏)
=
𝜕𝑏
𝑁
2 𝑦𝑖 − 𝑎 ∙ 𝑥𝑖 + 𝑏
−𝑥𝑖 = 0
2 𝑦𝑖 − 𝑎 ∙ 𝑥𝑖 + 𝑏
−1 = 0
𝑖=1
𝑁
𝑖=1
37
A legjobb illesztés paraméterei
1
𝑥𝑁 =
𝑁
𝑁
𝑖=1
1
𝑥𝑖 , 𝑦𝑁 =
𝑁
𝑁
𝑦𝑖
𝑖=1
𝑏 = 𝑦𝑁 − 𝑎 ∙ 𝑥𝑁
1
𝑁
𝑎=
𝑁
𝑖=1 𝑥𝑖
1
𝑁
∙ 𝑦𝑖 − 𝑥𝑁 ∙ 𝑦𝑁
𝑁
2
𝑥
𝑖=1 𝑖
− 𝑥𝑁 2
38
Korrelációs együttható (R)
• Az illeszkedés jóságát adja meg:
• 0: nincs lineáris összefüggés a mennyiségek között
• 1: tökéletesen illeszkedik az egyenes
𝑅2
=
𝑁
𝑖=1
𝑁
𝑖=1
2
𝑥𝑖 − 𝑥𝑁 ∙ 𝑦𝑖 − 𝑦𝑁
𝑥𝑖 − 𝑥𝑁 2 𝑁
𝑖=1 𝑦𝑖 − 𝑦𝑁
2
39
Origón átmenő egyenes illesztése
• Pl: Ohm törvény: a tengelymetszet ≡ 0
• 𝑏 ≡0 ⇒𝑦 =𝑎∙𝑥
𝑁
𝑆 𝑎 =
𝜕𝑆(𝑎, )
=
𝜕𝑎
𝑦𝑖 − 𝑎 ∙ 𝑥𝑖
2
= min
𝑖=1
𝑁
2 𝑦𝑖 − 𝑎 ∙ 𝑥𝑖
−𝑥𝑖 = 0
𝑖=1
1
𝑎=𝑁
1
𝑁
𝑁
𝑖=1 𝑥𝑖
∙ 𝑦𝑖
𝑁
2
𝑥
𝑖=1 𝑖
40
Nemlineáris illesztés
• A legkisebb négyzetek módszere működhet
• Probléma: az adatok mérési hibája nem állandó
41
Nemlineáris illesztés: súlyfüggvény
𝑁
𝑆 𝑎, 𝑏, ⋯ =
𝑤𝑖 𝑦𝑖 − 𝑓 𝑦𝑖 , 𝑎, 𝑏, ⋯
2
= min
2
= min
𝑖=1
• Ha ismerjük a szórást
𝑁
𝑆 𝑎, 𝑏, ⋯ =
𝑖=1
1
2 𝑦𝑖 − 𝑓 𝑦𝑖 , 𝑎, 𝑏, ⋯
𝜎𝑦𝑖
42
Linearizálás
• A függvényünket átalakítjuk úgy, hogy egyenest
tudjunk illeszteni
• Pl.: illesztendő függvény:
𝑦 = 𝑎𝑥 2
• mérve: 𝑥𝑖 , 𝑦𝑖
• ismeretlen pareméter: 𝑎
• Keresett függvény:
𝑌 =𝐴∙𝑋+𝐵
• 𝑋 =? , 𝑌 =? (a mért adatokból kiszámítható)
43
Linearizálás
𝑦 = 𝑎∙𝑥
𝑌 = 𝑦 ;𝑋 = 𝑥 ;𝐴 = 𝑎
𝑦 = 𝑎 ∙ 𝑥2
𝑌 = 𝑦 ; 𝑋 = 𝑥2
44
Hipotézisvizsgálat
45
Megoldandó feladat:
• Tejüzem:
joghurtok töltési mennyisége megfelel-e az
előírásoknak.
• Előírás:
• átlag: 200 ml
• szórás: 2%
• szignifikanciaszint: 3%
• 20 mérés átlaga: 196 ml
46
Hipotézisvizsgálat
• A felállított hipotézisek helyességének vizsgálata
véletlen mintákra alapozva
• Cél: van egy feltételezett érték, azt vizsgáljuk, hogy
az megfelel-e a valóságnak
• A minta:
• támogatja a hipotézist
• szignifikánsan ellentmond neki
• Eljárás: statisztikai próbák
47
A hipotézisvizsgálat lépései I.
• Hipotézis megfogalmazása
• Nullhipotézis (H0)
ennek a helyességéről akarunk megbizonyosódni
• Alternatív hipotézis (H1)
szemben áll a nullhipotézissel
• Próbafüggvény konstruálása
𝑇(𝑥1 , 𝑥2 , ⋯ )
• Ha H0 helyes, a próbafüggvény ismert eloszlást követ
48
A hipotézisvizsgálat lépései II.
• Elfogadási (E) és kritikus (K) tartomány felállítása a
próbafüggvény értékeire
• Ha H0 igaz:
P 𝑇 ∈𝐸 =1−𝛼
P 𝑇∈𝐾 =𝛼
• 𝛼: szignifikanciaszint
• 1 − 𝛼: megbízhatóság
49
A hipotézisvizsgálat lépései III.
• A próbafüggvény konkrét értékének kiszámítása
• Döntés:
• H0 elfogadása és H1 elutasítása
𝑇∈𝐸
• H0 elutasítása és H1 elfogadása
𝑇∈𝐾
50
Elkövethető hibák
H0 igaz
H0 nem igaz
H0-t elfogadjuk
helyes döntés
𝑝 =1−𝛼
másodfajú hiba
𝑝=𝛽
H0-t elvetjük
elsőfajú hiba
𝑝=𝛼
helyes döntés
𝑝 =1−𝛽
• α: szignifikanciaszint, ennek értékét tudjuk
szabályozni → kiszámítható kockázat
• β: annak a valószínűsége, hogy elfogadjuk H0-t,
pedig nem igaz
• Ha α-t csökkentjük, β nő
51
Példa nullhipotézis választására
• H0 : nem érdemes befektetni
• H1 : érdemes befektetni
H0-t elfogadjuk
Nem fektetünk be
H0-t elvetjük
Befektetünk
H0 igaz
nem érdemes
befektetni
helyes döntés
új lehetőség
keresése
𝑝 =1−𝛼
elsőfajú hiba
anyagi csőd
𝑝=𝛼
H0 nem igaz
érdemes
befektetni
másodfajú hiba
kihagyott
lehetőség
𝑝=𝛽
helyes döntés
⇒ haszon
𝑝 =1−𝛽
52
Statisztikai próbák
• Próbák típusai
• Egyoldali próbák
(kisebb, nagyobb)
• Kétoldali próbák
(benne van-e az intervallumon)
• Minták száma
• Egy mintás próbák
• Két mintás próbák
• Több mintás próbák
53
Vizsgálat célja
• Várható érték tesztelése
• Szórás tesztelése
• Arány tesztelése
• Illeszkedésvizsgálat
• Függetlenség vizsgálat
54
Egymintás µ-próba (z-próba)
• A várható érték megegyezik-e a megadott µ0
értékkel:
• H0: a populáció átlaga = µ0
• H1: a populáció átlaga ≠ µ0
• Normális eloszlás, σ ismert
• Próbafüggvény:
𝑥 − 𝜇0
𝑧= 𝜎
𝑁
55
Elfogadási tartomány
𝑧 ≤ 𝑧1−𝛼
2
56
Példa egymintás µ próbára
• Tejüzem: joghurtok töltési mennyisége megfelel-e az
előírásoknak.
• Előírás:
• átlag: 200 ml
• szórás: 2%
• szignifikanciaszint: 3%
• 20 mérés átlaga: 196 ml
57
Megoldás
𝑥 = 196 ml , 𝜇0 = 200 ml , 𝜎 = 200 ml ∙ 0,02 = 4 ml
• próbafüggvény:
𝑥 − 𝜇0
𝑧= 𝜎
= −4,472
𝑁
• az elfogadási tartomány
−𝑧1−𝛼
2
= −2,17
⇒ a H0 hipotézist elutasítjuk:
az átlagos töltési mennyiség nem felel meg az
előírásoknak
58
Egymintás t-próba
• A várható érték megegyezik-e a megadott µ0 értékkel
• Normális eloszlás, σ ismeretlen
• Próbafüggvény:
𝑥 − 𝜇0
𝑡= ∗
𝜎𝑁−1
𝑁
• Elfogadási tartomány:
𝑡 ≤ 𝑡1−𝛼 (𝑁 − 1)
2
59
További próbák
• Kétmintás T próba: két minta értékének
azonosságának összehasonlítása
• szórás ismeretlen
• a szórások megegyeznek/nem egyeznek meg
• Kétmintás, páros T próba: az egyes megfigyelések
párba állíthatók (előtte-utána)
• χ2-próba: variancia (szórás) tesztelése
• F-próba: varianciák egyenlősége
60
A próbákkal kapcsolatos nehézségek
• H0 megfelelő megválasztása
• Félreértelmezhető
• Ha a próbát többször elvégezzük, hibás eredményre
juthatunk
pl: gyógynövény hatékonysága (5%
szignifikanciaszint)
• 19 negatív eredmény ⇒ nincs publikálva
• 1 pozitív eredmény ⇒ publikálva
61
Bayes-módszer
62
Bayes-tétel
P 𝐵|𝐴 P 𝐴
P 𝐴|𝐵 =
P 𝐵
• 𝐴 – egy hipotézis
• 𝐵 – egy megfigyelhető esemény, befolyásolja az A-ba
vetett hitünket
• P 𝐴 – az 𝐴 hipotézis a priori valószínűsége
• P 𝐴|𝐵 – a posteriori valószínűség: ha 𝐵 bekövetkezik, az
mennyire befolyásolja az 𝐴-ba vetett hitünket
63
Bayes-tétel
P 𝐵|𝐴 P 𝐴
P 𝐴|𝐵 =
P 𝐵
• P 𝐵|𝐴 – ha a hipotézis igaz, mi a valószínűsége, hogy 𝐵 -t
megfigyeljük
• P 𝐵 – a 𝐵 esemény megfigyelésének valószínűsége (a
hipotézis igazságától függetlenül)
P 𝐵 = P 𝐵|𝐴 P 𝐴 + P 𝐵|𝐴′ P 𝐴′ + ⋯
𝐴′: alternatív hipotézis
64
Példa 1
• Egy iskolában:
• 60 % fiú
• 40 % lány
• A lányok fele nadrágot, a másik fele szoknyát hord
• Ha egy nadrágos diákot látunk, mi a valószínűsége,
hogy lány?
65
Megoldás
• Hipotézis: 𝐴 – a megfigyelt diák lány
• Megfigyelés: 𝐵 – nadrágot hord
P 𝐵|𝐴 = 0,5
P 𝐴 = 0,4
P 𝐵 = P 𝐵|𝐴 P 𝐴 + P 𝐵|¬𝐴 P ¬𝐴 =
= 0,5 ∙ 0,4 + 1 ∙ 0,6 = 0,8
P 𝐵|𝐴 P 𝐴
0,5 ∙ 0,4
P 𝐴|𝐵 =
=
= 0,25
P 𝐵
0,8
• Annak a valószínűsége, hogy lány: 25 %
66
Példa: Hamis pozitív teszt
• Ha a páciens beteg, a teszt az esetek 99 %-ban
helyes eredményt ad
• Ha a páciens nem beteg, a teszt az esetek 5 %-ban ad
hamis pozitív eredményt
• Csak minden 1000. tesztelt ember beteg
• A teszt eredménye pozitív.
• Mi a valószínűsége, hogy a páciens beteg?
67
Megoldás
• Hipotézis: 𝐴 – a páciens beteg
• Megfigyelés: 𝐵 – a teszt pozitív eredményt adott
P 𝐵|𝐴 = 0,99
P 𝐴 = 0,001
P 𝐵 = P 𝐵|𝐴 P 𝐴 + P 𝐵|¬𝐴 P ¬𝐴 =
= 0,99 ∙ 0,001 + 0,05 ∙ 0,999 = 0,05094
P 𝐵|𝐴 P 𝐴
0,99 ∙ 0,001
P 𝐴|𝐵 =
=
= 0,019
P 𝐵
0,05094
68
Eredmény
Pozitív teszt ⇒
• A páciens beteg: 1,9 %
• A páciens mégsem beteg (hamis pozitív): 98 %
69
... vége ...
Köszönöm a figyelmet
70