Föreläsning 3 732G81 Statistik [email protected] Dagens föreläsning • Population vs. Stickprov • Läges och spridningsmått • Kombinatorik o • Permutationer och kombinationer Sannolikhetslära o o o Oberoende och disjunkta händelser Bayes sats Satsen om total sannolikhet 732G81

Download Report

Transcript Föreläsning 3 732G81 Statistik [email protected] Dagens föreläsning • Population vs. Stickprov • Läges och spridningsmått • Kombinatorik o • Permutationer och kombinationer Sannolikhetslära o o o Oberoende och disjunkta händelser Bayes sats Satsen om total sannolikhet 732G81

Föreläsning 3
732G81
Statistik
[email protected]
1
Dagens föreläsning
•
Population vs. Stickprov
•
Läges och spridningsmått
•
Kombinatorik
o
•
Permutationer och kombinationer
Sannolikhetslära
o
o
o
Oberoende och disjunkta händelser
Bayes sats
Satsen om total sannolikhet
732G81
2
Population
-
Den (oftast teoretiska) mängd enheter som vi vill dra
slutsatser om.
-
Kan anses vara ändlig eller oändlig.
-
Ex: 50-åriga tallar i Sverige (variabel höjd)
HIV-smittade i världen (variabel dödlighet)
Ekonomistudenter vid LiU (variabel studiemotivation)
732G81
3
Stickprov
-
Den fysiska mängd observationer som vi har data från.
-
Bör vara ett slumpmässigt och representativt urval från
den större bakomliggande populationen.
-
Ex: Talldungen på Campus?
HIV-smittade på gayklubbar i Stockholm?
Ekonomistudenter på denna föreläsning?
732G81
4
Lägesmått och spridningsmått
Illustrerat med programmet R
#Generera 1000 dataobservationer från en normalfördelning med
#medelvärde 40 och standardavvikelse 2.
data1 <- rnorm(1000,40,2)
#Generera 1000 dataobservationer från en normalfördelning med
#medelvärde 50 och standardavvikelse 10.
data2 <- rnorm(1000,50,10)
732G81
5
Lägesmått och spridningsmått
Illustrerat med programmet R
#Plotta ett histogram var för data 1 och data 2
#(med 25 staplar).
hist(data1,25,xlim=c(1,100))
hist(data2,25,xlim=c(1,100))
Histogram of data2
150
50
100
Frequency
60
40
0
0
20
Frequency
80
100
200
Histogram of data1
0
20
40
60
80
100
0
data1
20
40
60
data2
732G81
6
80
100
Lägesmått och spridningsmått
Illustrerat med programmet R
#Checka att medel och standardavvikelse stämmer
mean(data1)
40.02254
sd(data1)
1.972034
mean(data2)
50.2357
sd(data2)
10.20776
732G81
7
Kombinatorik
Permutationer
Permutationer när alla element är olika:
Visa att mängden S = {1,2,3,4} har 24 möjliga permutationer:
(1,2,3,4), (1,2,4,3), (1,4,2,3), … , och (4,3,2,1)
𝑃𝑛𝑘
𝑛!
4!
24
=
=
=
= 24
𝑛−𝑘 !
4−4 !
1
732G81
8
Kombinatorik
Permutationer
Permutationer när alla element är olika:
På hur många sätt kan två värden väljas ut ur S = {1,2,3,4}:
(1,2), (1,3), (1,4), (2,1), (3,1), (4,1), … , och (4,3)
Olika ordning
𝑃𝑛𝑘
𝑛!
4!
24
=
=
=
= 12
𝑛−𝑘 !
4−2 !
2
732G81
9
Kombinatorik
Permutationer
Permutationer när vissa element är lika:
Hur många åttasiffriga nummer kan bildas av
S = {1,2,3,4,1,2,3,4} (varje siffra ska ingå två gånger) :
𝑘 ,𝑘 ,
𝑃𝑛 1 2
𝑛!
8!
40320
=
=
=
= 2520
𝑘1 ! 𝑘2 ! 𝑘3 ! 𝑘4 ! 2! 2! 2! 2!
16
732G81
10
Kombinatorik
Kombinationer
Kombinationer utan upprepning:
Visa att mängden S = {1,2,3,4} bara kan kombineras en gång
utan upprepning:
(1,2,3,4) anses vara samma som (1,2,4,3), … , och (4,3,2,1)
𝑃𝑛𝑘
𝑛!
4!
24
=
=
=
=1
𝑘! 𝑛 − 𝑘 ! 4! 4 − 4 ! 24
732G81
11
Kombinatorik
Kombinationer
Kombinationer utan upprepning:
Vilka par kan väljas ut ur S = {1,2,3,4}:
(1,2), (1,3), (1,4), (2,1), (3,1), (4,1), … , och (4,3)
Anses vara samma
𝑃𝑛𝑘
𝑛!
4!
24
=
=
=
=6
𝑘! 𝑛 − 𝑘 ! 2! 4 − 2 !
4
732G81
12
Kombinatorik
Kombinationer
Kombinationer med upprepad dragning:
Vilka par kan väljas ut ur S = {1,2,3,4}, givet att varje siffra
kan bilda ett par med sig själv:
(1,1), (1,2), (1,3), (1,4), … , och (4,4)
𝑃𝑛𝑘 =
𝑛+𝑘−1 !
4 + 2 − 1 ! 120
=
=
= 10
𝑘! 𝑛 − 1 !
2! 4 − 1 !
12
732G81
13
Sannolikhetslära
Definitioner
•
Utfallsrummet för könet på ett barn är
S = {F,P}
•
Sannolikheten för att få ett barn med ett visst kön är
P(F) = P(P) = ½
•
Utfallsrummet för könet på två barn är
S = {(F,F),(F,P),(P,F),(P,P)}
•
Sannolikheten för var och en av dessa utfall är
P((X,Y)) = ¼
732G81
14
Sannolikhetslära
Händelser och union
•
Könet på två barn i samma familj är oberoende
(F hänt så kan P hända) händelser och kan därför inte
vara disjunkta (F hänt så kan inte P hända)
•
Definiera två nya händelser
E = {(F,F),(F,P)} dvs första barnet av två är en flicka
F = {(F,F),(P,F)} dvs andra barnet av två är en flicka
•
Unionen mellan E och F E ∪ F dvs händelsen att
antingen det första eller det andra barnet är en flicka
𝑃 E ∪ F = 𝑃 E + 𝑃 F − 𝑃 E ∩ F = 0.5 + 0.5 − 𝑃 F, F
=¾
Snittet mellan E och F
732G81
15
Sannolikhetslära
Betingade sannolikheter
•
Vad är sannolikheten för två flickor
𝑃 F, F = 𝑃 F ∙ 𝑃 F = 0.5 ∙ 0.5 = 0.25
•
En familj har två barn. Vad är den betingade sannolikheten
att båda barnen är flickor givet att minst en av dem är det
Låt I = 𝑃 F, F och J = minst en är flicka
𝑃 𝐼𝐽 =
𝑃 𝐼∩𝐽
𝑃 𝐽
=
𝑃 F,F
𝑃{ F,F , F,P , P,F }
732G81
16
=
0.25
0.75
=
1
3
Sannolikhetslära
Bayes sats
•
•
•
Ett test på ett laboratorium har 95% effektivitet i att
detektera en sjukdom när sjukdomen verkligen existerar.
Testet resulterar dock också i 1% felaktiga positiva resultat
när friska personer testas.
Om 0.5% av befolkningen verkligen har sjukdomen, vad är
sannolikheten att en individ har sjukdomen givet att testet
är postivt?
732G81
17
Sannolikhetslära
Bayes sats
•
Låt 𝐷 beteckna händelsen att en person har sjukdomen
och 𝐸 händelsen att testet är positivt. Den eftersökta
sannolikheten är 𝑃 𝐷 𝐸 och erhålls mha Bayes sats
𝑃 𝐷𝐸 =
=
𝑃 𝐷∩𝐸
𝑃 𝐸
=
𝑃 𝐸𝐷 𝑃 𝐷
𝑃 𝐸 𝐷 𝑃 𝐷 +𝑃 𝐸 𝐷𝑐 𝑃 𝐷𝐶
0.95 0.005
95
=
≈ 0.323
0.95 0.005 + 0.01 0.995
294
Bara 32 procent av de som fått positivt testresultat har
sjukdomen.
732G81
18
Tips om ytterligare information
•
Hemsida med exempel på permutationer (eng.
permutations) och kombinationer (eng. combinations)
http://www.artofproblemsolving.com/Wiki/index.php/Combinat
orics/Introduction
•
•
Skillnaden på disjunkta (eng. disjoint) och oberoende
(eng. independent) händelser beskrivs i följande video:
http://www.youtube.com/watch?v=hqgZF3H0lxM
Bra exempel på Bayes sats (eng. Bayes theorem)
finns bl a på: http://www.kevinboone.net/bayes.html
732G81
19