Föreläsning 3 732G81 Statistik [email protected] Dagens föreläsning • Population vs. Stickprov • Läges och spridningsmått • Kombinatorik o • Permutationer och kombinationer Sannolikhetslära o o o Oberoende och disjunkta händelser Bayes sats Satsen om total sannolikhet 732G81
Download ReportTranscript Föreläsning 3 732G81 Statistik [email protected] Dagens föreläsning • Population vs. Stickprov • Läges och spridningsmått • Kombinatorik o • Permutationer och kombinationer Sannolikhetslära o o o Oberoende och disjunkta händelser Bayes sats Satsen om total sannolikhet 732G81
Föreläsning 3 732G81 Statistik [email protected] 1 Dagens föreläsning • Population vs. Stickprov • Läges och spridningsmått • Kombinatorik o • Permutationer och kombinationer Sannolikhetslära o o o Oberoende och disjunkta händelser Bayes sats Satsen om total sannolikhet 732G81 2 Population - Den (oftast teoretiska) mängd enheter som vi vill dra slutsatser om. - Kan anses vara ändlig eller oändlig. - Ex: 50-åriga tallar i Sverige (variabel höjd) HIV-smittade i världen (variabel dödlighet) Ekonomistudenter vid LiU (variabel studiemotivation) 732G81 3 Stickprov - Den fysiska mängd observationer som vi har data från. - Bör vara ett slumpmässigt och representativt urval från den större bakomliggande populationen. - Ex: Talldungen på Campus? HIV-smittade på gayklubbar i Stockholm? Ekonomistudenter på denna föreläsning? 732G81 4 Lägesmått och spridningsmått Illustrerat med programmet R #Generera 1000 dataobservationer från en normalfördelning med #medelvärde 40 och standardavvikelse 2. data1 <- rnorm(1000,40,2) #Generera 1000 dataobservationer från en normalfördelning med #medelvärde 50 och standardavvikelse 10. data2 <- rnorm(1000,50,10) 732G81 5 Lägesmått och spridningsmått Illustrerat med programmet R #Plotta ett histogram var för data 1 och data 2 #(med 25 staplar). hist(data1,25,xlim=c(1,100)) hist(data2,25,xlim=c(1,100)) Histogram of data2 150 50 100 Frequency 60 40 0 0 20 Frequency 80 100 200 Histogram of data1 0 20 40 60 80 100 0 data1 20 40 60 data2 732G81 6 80 100 Lägesmått och spridningsmått Illustrerat med programmet R #Checka att medel och standardavvikelse stämmer mean(data1) 40.02254 sd(data1) 1.972034 mean(data2) 50.2357 sd(data2) 10.20776 732G81 7 Kombinatorik Permutationer Permutationer när alla element är olika: Visa att mängden S = {1,2,3,4} har 24 möjliga permutationer: (1,2,3,4), (1,2,4,3), (1,4,2,3), … , och (4,3,2,1) 𝑃𝑛𝑘 𝑛! 4! 24 = = = = 24 𝑛−𝑘 ! 4−4 ! 1 732G81 8 Kombinatorik Permutationer Permutationer när alla element är olika: På hur många sätt kan två värden väljas ut ur S = {1,2,3,4}: (1,2), (1,3), (1,4), (2,1), (3,1), (4,1), … , och (4,3) Olika ordning 𝑃𝑛𝑘 𝑛! 4! 24 = = = = 12 𝑛−𝑘 ! 4−2 ! 2 732G81 9 Kombinatorik Permutationer Permutationer när vissa element är lika: Hur många åttasiffriga nummer kan bildas av S = {1,2,3,4,1,2,3,4} (varje siffra ska ingå två gånger) : 𝑘 ,𝑘 , 𝑃𝑛 1 2 𝑛! 8! 40320 = = = = 2520 𝑘1 ! 𝑘2 ! 𝑘3 ! 𝑘4 ! 2! 2! 2! 2! 16 732G81 10 Kombinatorik Kombinationer Kombinationer utan upprepning: Visa att mängden S = {1,2,3,4} bara kan kombineras en gång utan upprepning: (1,2,3,4) anses vara samma som (1,2,4,3), … , och (4,3,2,1) 𝑃𝑛𝑘 𝑛! 4! 24 = = = =1 𝑘! 𝑛 − 𝑘 ! 4! 4 − 4 ! 24 732G81 11 Kombinatorik Kombinationer Kombinationer utan upprepning: Vilka par kan väljas ut ur S = {1,2,3,4}: (1,2), (1,3), (1,4), (2,1), (3,1), (4,1), … , och (4,3) Anses vara samma 𝑃𝑛𝑘 𝑛! 4! 24 = = = =6 𝑘! 𝑛 − 𝑘 ! 2! 4 − 2 ! 4 732G81 12 Kombinatorik Kombinationer Kombinationer med upprepad dragning: Vilka par kan väljas ut ur S = {1,2,3,4}, givet att varje siffra kan bilda ett par med sig själv: (1,1), (1,2), (1,3), (1,4), … , och (4,4) 𝑃𝑛𝑘 = 𝑛+𝑘−1 ! 4 + 2 − 1 ! 120 = = = 10 𝑘! 𝑛 − 1 ! 2! 4 − 1 ! 12 732G81 13 Sannolikhetslära Definitioner • Utfallsrummet för könet på ett barn är S = {F,P} • Sannolikheten för att få ett barn med ett visst kön är P(F) = P(P) = ½ • Utfallsrummet för könet på två barn är S = {(F,F),(F,P),(P,F),(P,P)} • Sannolikheten för var och en av dessa utfall är P((X,Y)) = ¼ 732G81 14 Sannolikhetslära Händelser och union • Könet på två barn i samma familj är oberoende (F hänt så kan P hända) händelser och kan därför inte vara disjunkta (F hänt så kan inte P hända) • Definiera två nya händelser E = {(F,F),(F,P)} dvs första barnet av två är en flicka F = {(F,F),(P,F)} dvs andra barnet av två är en flicka • Unionen mellan E och F E ∪ F dvs händelsen att antingen det första eller det andra barnet är en flicka 𝑃 E ∪ F = 𝑃 E + 𝑃 F − 𝑃 E ∩ F = 0.5 + 0.5 − 𝑃 F, F =¾ Snittet mellan E och F 732G81 15 Sannolikhetslära Betingade sannolikheter • Vad är sannolikheten för två flickor 𝑃 F, F = 𝑃 F ∙ 𝑃 F = 0.5 ∙ 0.5 = 0.25 • En familj har två barn. Vad är den betingade sannolikheten att båda barnen är flickor givet att minst en av dem är det Låt I = 𝑃 F, F och J = minst en är flicka 𝑃 𝐼𝐽 = 𝑃 𝐼∩𝐽 𝑃 𝐽 = 𝑃 F,F 𝑃{ F,F , F,P , P,F } 732G81 16 = 0.25 0.75 = 1 3 Sannolikhetslära Bayes sats • • • Ett test på ett laboratorium har 95% effektivitet i att detektera en sjukdom när sjukdomen verkligen existerar. Testet resulterar dock också i 1% felaktiga positiva resultat när friska personer testas. Om 0.5% av befolkningen verkligen har sjukdomen, vad är sannolikheten att en individ har sjukdomen givet att testet är postivt? 732G81 17 Sannolikhetslära Bayes sats • Låt 𝐷 beteckna händelsen att en person har sjukdomen och 𝐸 händelsen att testet är positivt. Den eftersökta sannolikheten är 𝑃 𝐷 𝐸 och erhålls mha Bayes sats 𝑃 𝐷𝐸 = = 𝑃 𝐷∩𝐸 𝑃 𝐸 = 𝑃 𝐸𝐷 𝑃 𝐷 𝑃 𝐸 𝐷 𝑃 𝐷 +𝑃 𝐸 𝐷𝑐 𝑃 𝐷𝐶 0.95 0.005 95 = ≈ 0.323 0.95 0.005 + 0.01 0.995 294 Bara 32 procent av de som fått positivt testresultat har sjukdomen. 732G81 18 Tips om ytterligare information • Hemsida med exempel på permutationer (eng. permutations) och kombinationer (eng. combinations) http://www.artofproblemsolving.com/Wiki/index.php/Combinat orics/Introduction • • Skillnaden på disjunkta (eng. disjoint) och oberoende (eng. independent) händelser beskrivs i följande video: http://www.youtube.com/watch?v=hqgZF3H0lxM Bra exempel på Bayes sats (eng. Bayes theorem) finns bl a på: http://www.kevinboone.net/bayes.html 732G81 19