Föreläsning 1

Download Report

Transcript Föreläsning 1

Matematisk Statistik
◮
◮
◮
Matematisk statistik är “slumpens matematik”.
Började som en beskrivning av spel, chansen att få olika utfall. Brevväxling mellan Fermat och
Pascal 1654.
Modern matematisk statistik är ovärderlig i all naturvetenskap, ingenjörsvetenskap,
ekonomi, medicin, ....
Matematisk statistik - Slumpens matematik
◮
◮
Sannolikhetsteori: Matematisk teori/modellering av verkligheten, med användande av slump.
Modellerna innehåller ofta okända, s.k. parametrar
Statistikteori: Matematisk teori för hur man drar slutsatser om de okända parametrarna.
Grundläggande sannolikhetsteori
Grundläggande begrepp
◮
◮
◮
Utfall - resultatet av ett slumpmässigt försök ω1, ω2, . . ..
Utfallsrum - mängden av alla möjliga utfall, Ω.
Händelse - en samling av utfall, en delmängd av utfallsrummet, A, B, . . ..
Några elementära beteckningar
◮
◮
ω ∈ A, betyder att elementärhändelsen ω ligger i A.
A ⊂ B, betyder att A är en delmängd av B. Beskriver “Om A inträffar så inträffar också B”.
Två exempel med tärningskast
Exempel
Kast av en tärning.
◮ Utfallsrum - Ω = {1, 2, 3, 4, 5, 6}.
◮ Händelsen “minst en 4:a” är A = {4, 5, 6}.
◮ Händelsen “högst en 5:a” är B = {1, 2, 3, 4, 5}.
◮ Händelsen “3:a” är C = {3}.
Några samband:
◮ C ⊂ B, dvs “Om vi får en 3:a så får vi högst en 5:a”.
◮ Om ω = 1 så ω ∈ B.
Exempel
Kast av två tärningar
◮ Utfallsrum
Ω = {(1, 1), (1, 2), . . . , (6, 6)}
= {(i , j) : i = 1, . . . 6, j = 1, . . . , 6}.
◮
◮
Det finns 36 st. utfall.
“Summan är högst 3” är händelsen D = {(1, 1), (1, 2), (2, 1)}.
“Vi får en 6:a i första kastet” är händelsen E = {(6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)}.
Mängdoperationer och illustration med hjälp av Venn-diagram
Om man har ett utfallsrum och en samling delmängder kan man relatera dem till varandra och göra
operationer på dem. “Boolsk algebra”.
◮
◮
◮
◮
◮
◮
◮
Ω. Utfallsrummet, grundmängden. Innehåller alla möjliga utfall.
∅. Tomma mängden {}. Innehåller inga utfall. “En omöjlig händelse”.
A. Händelse, delmängd av Ω.
A∗ . Komplementära händelsen till A, “inte A”.
A ∪ B. Unionen av A och B. “A eller B inträffar”.
A ∩ B. Snittet av A och B. “Både A och B inträffar”.
A ∩ B = ∅. A och B är disjunkta. “Snittet av A och B är en omöjlig händelse”. “A och B
kan inte inträffa samtidigt”.
Illustration av kast med en tärning, forts
◮
◮
◮
◮
◮
A ∩ B = {4, 5}.
A ∪ B = Ω.
B ∩ C = C = {3}.
Observera att det gäller allmänt att A1 ⊂ A2 ⇒ A1 ∩ A2 = A1 och A1 ∪ A2 = A2 .
A ∩ C = ∅. “Vi kan inte samtidigt få både 3:a och minst 4:a”.
Formell definition av sannolikhet
Om A är en händelse vill vi kunna tala om “sannolikheten för att A inträffar”.
Definition
(Kolmogorov 1933) En sannolikhet P är en funktion på mängden av händelser sådan att
◮ 0 ≤ P(A) ≤ 1.
◮ P(Ω) = 1.
◮ Om A1 , A2 , . . . är en ändlig eller uppräkneligt oändlig sekvens av parvis disjunkta händelser,
dvs Ai ∩ Aj = ∅ om i 6= j, så gäller att P(A1 ∪ A2 ∪ . . .) = P(A1 ) + P(A2 ) + . . ..
Speciellt gäller att om A och B är disjunkta så P(A ∪ B) = P(A) + P(B).
Räkneregler för sannolikheter
Av definitionen följer
◮ P(A∗ ) = 1 − P(A).
◮ För godtyckliga A och B gäller
P(A ∪ B) = P(A) + P(B) − P(A ∩ B).
Hur ska man tolka sannolikheten?
0.0
0.2
0.4
0.6
0.8
1.0
Frekvenstolkningen av en sannolikhet: Om A är en händelse och man gör ett försök n ggn, där
antingen A eller A∗ kan inträffa, så är
Antalet ggn A inträffar
n
ungefär P(A) om n är väldigt stort. Detta är en i själva verket en matematisk sats (“Stora talens
lag”).
Figuren visar relativa frekvensen av “krona” vid slantsingling med korrekt mynt.
0
200
400
600
800
1000
Den klassiska sannolikhetsdefinitionen för diskreta utfallsrum
Om Ω består av m möjliga utfall och alla utfall är lika sannolika, säger man att man har en
likformig sannolikhetsfördelning. Alltså
Ω = {ω1, . . . ωm }
och P(ωi ) = 1/m för alla i = 1 0 . . . , m. Om då A består av g stycken av utfallen ω1 , . . . , ωm är
’
det klart att
1
1
+ ...+
summa av g termer
m
m
g
=
.
m
P(A) =
Detta kallas för den “klassiska sannolikhetsdefinitionen”. Observera att ingen definition! Det är en
speciell fördelning.
Exempel på likformig fördelning
Exempel
Dra ett kort ur en kortlek. Vad är sannolikheten att det är ett hjärter? Det finns 52 kort alla lika
sannolika. Alltså har vi en likformig sannolikhetsfördelning. A = { draget kort är hjärter} innehåller
13 av de möjliga utfallen. Alltså är P(A) = 13/52 = 1/4.
Betingad sannolikhet
Om man vet att man befinner sig på en delmängd av utfallsrummet, begränsas ju antalet möjliga
utfall. Hur ska man räkna med sannolikheter då?
Definition
Om A och B är händelser och P(B) > 0 definieras den betingade sannolikheten för A givet B som
P(A|B) =
P(A ∩ B)
.
P(B)
Exempel
Kast av tärning. Ω = {1, . . . , 6}. Vi antar att tärningen är rättvis och då är den likformiga
sannolikhetsfördelningen en bra modell. Alltså har alla utfall slh 1/6. Låt B = {1, 3, 5}, “udda
utfall” och A = {1}. Då är
P(A ∩ B)
P(B)
P(A)
=
P(B)
1/6
=
3/6
1
= .
3
P(A|B) =
Satsen om total sannolikhet och Bayes sats
Satsen om total sannolikhet
Ibland är det svårt att direkt räkna ut en sannolikhet pga att händelsen är komplicerad/komplex.
Då kan man ofta använda “satsen om total sannolikhet”:
Anta att vi har n st händelser H1, . . . , Hn sådana att
◮ H1 ∩ Hj = ∅ om i 6= j.
◮ Ω = H1 ∪ . . . ∪ Hn .
Då gäller att för varje händelse A
P(A) =
n
X
P(A|Hi )P(Hi ).
i=1
Bayes sats
Om man vill vända på betingningen kan man använda Bayes sats: Under ovanstående villkor
P(Hi |A) =
P(A|Hi )P(Hi )
.
P(A)
Exempel på användning av Bayes sats och satsen om total sannolikhet
Exempel
På vissa cigarrpaket kan man läsa att “9 av 10 som drabbas av strupcancer är rökare”.
Befolkningsdata (2005): 49% av befolkningen är män, av männen röker 13.9 %, av kvinnorna röker
18%. Sannolikheten att drabbas strupcancer är 1%,
1. Vad är sannolikheten att en slumpmässigt vald person är rökare?
2. Vad är sannolikheten att få strupcancer om man är rökare?
Oberoende händelser
Om P(A|B) = P(A) så innebär detta att P(A) inte ändras om B har inträffat. Genom att använda
definitionen av betingad sannolikhet kan man skriva detta som P(A ∩ B) = P(A)P(B) (men då
bara om P(B) > 0!). Mera generellt gör vi:
Definition
Vi säger att händelserna A och B är oberoende om
P(A ∩ B) = P(A)P(B)
Exempel
Kasta två tärningar. Låt
A = första tärningen är sexa
B = summan är sju
C = summan är åtta.
Vilka av paren A,B eller A,C eller B,C är oberoende?
Beräkning sannolikheter för många oberoende händelser: alla, ingen eller
någon
Om vi har n st oberoende händelser A1 , . . . , An är sannolikheten att
◮ alla inträffar
P(A1 ∩ . . . ∩ An ) = P(A1 ) · . . . · P(An ),
◮
ingen inträffar
P(A∗1 ∩ . . . A∗n ) = P(A∗1 ) · . . . · P(A∗n ),
◮
någon inträffar
P(A1 ∪ . . . ∪ An ) = 1 − P(A∗1 ∩ . . . ∩ A∗n ).
Oberoende och disjunkta
Inte samma sak!