Transcript Exempel
Förelasning 1 Kursintroduktion Statistiska undersökningar Tabeller och diagram Spridning, lådagram 1 Kursintroduktion Kursupplägget Föreläsningar Datorlabbar med MINITAB (behöver ej lämnas in) Lektionsserie på slutet av kursen Examination Ett projekt Skriftlig salstenta Kurslitteratur Boken: ”Statistiska metoder” av Körner och Wahlgren, upplaga 2:5 Extra material på webbsidan: www.ida.liu.se/~732G60/, se ”Kursplan” Staristiska metoder 2012 2 Statistik i livet – ett exempel Staristiska metoder 2012 3 Statistik i livet – ett exempel Staristiska metoder 2012 4 Ett exempel till Staristiska metoder 2012 5 Statistiska undersökningar För att beskriva samband eller förändringar i ett system gör man statistiska undersökningar Typer –ett slags fördelning Kvalitativa (beskrivande) Befolkningens storlek Partisympatiundersökning Kvantitativa (analytiska) Djupare analyser: signifikanta förändringar, statisktiska felmarginaler, kartlägga samband Staristiska metoder 2012 6 Statistiska undersökningar Hur data samlas in Experiment Totalundersökningar Hur andelen friska beror på dosen av läkemedlet Företag: Skicka frågor till alla anställda Urvalsundersökningar Företag: Skicka frågor till en del anställda och göra allmänna slutsatser som grunder sig på deras svar Staristiska metoder 2012 7 Termer som används i undersökningsteorin Målpopulation: den population som vi vill undersöka Rampopulation: den population som vi faktiskt kan undersöka Urvalsram: (eventuellt) register över rampopulationen Stickprov: (slumpmässigt) urval av enheter från rampopulationen Urvalsenhet: de enheter som blivit utvalda i stickprovet Staristiska metoder 2012 8 Termer som används i undersökningsteorin Exempel. Opinionsundersökning av kvinnor i Sverige via telefon Alla kvinnor i Sverige Alla kvinnor som har telefon hemma Telefonlista Utvalda kvinnor Ett telefonnummer Staristiska metoder 2012 9 Variabler och observationer Datamaterialet samlas ofta i form av tabell PatientNum Kön Cig/ vecka Vikt Antal rum i lägenheten 10234 M 10 53.5 2 10235 K 28.5 80.9 3 10236 ? 0 68.4 6 … … … Variabler (PatientNum, Röker, Vikt) Observationer (rader) Här beskrivs varje observation med 5 variabler Staristiska metoder 2012 10 Variabler Indelning Kvalitativa eller kategorivariabler (Kön, region, Parti) Kvantitativa Diskreta (Antal rum i lägenheten) Kontinuerliga (Vikt, Temperatur, CIG/Vecka) Skalor Nominalskala (för kvalitativa) Ordinalskala :jämförelse men inte +-*/ (Storlek =S, M, L, XL) Intervallskala: jämförelse, ?, - men inte / (Temperatur i C) Saknar absoluta nollpunkten Kvotskala (Höjd, Vikt) Absoluta nollpunkten finns Staristiska metoder 2012 11 Mjukvaran Vi använder Minitab Visa hur: Öppna Skapa projekt and worksheet Importera data Menyer Enkelt diagram Spara projekt Staristiska metoder 2012 12 Presentation av kvalitativa data Exempel (antalet valda) Vi räknar frekvenser och presenterar dem med hjälp av en frekvenstabell (2 variabler) Staristiska metoder 2012 13 Presentation av kvalitativa data Cirkeldiagram Staristiska metoder 2012 14 Korstabeller Tvåvägsindelad frekvenstabell med absoluta frekvenserna Exempel Attitydundersökning på ett företag Visa två diagram med grupperade staplar med olika ordning Staristiska metoder 2012 15 Korstabeller Relativa frekvenser Staristiska metoder 2012 16 Formler K1 K2 Total R1 A B A+B R2 C D C+D Total A+C B+D A+B+ C+D Procent i kolumner Procent i rader K1 K1 K2 Total R1 A/(A+B)* B/(A+B) 100% 100 *100 R2 C/(C+D) *100 D/(C+D )*100 K2 100% Staristiska metoder 2012 17 R1 A/(A+C)* B/(B+D)* 100 100 R2 C/(A+C)* D/(B+D)* 100 100 Total 100% 100% Kvantitativa variabler Stolpdiagram (få olika värden) Exempel: Fördelning av åldrar i en grupp Staristiska metoder 2012 18 Kvalitativa variabler Histogram (många olika värden) Vi kan i princip använda för vårt datamaterial Tekniken: 1. Bestäm startpunkt 2. Bestäm stolpvidd 3. Räkna stolpens höjder 4. Rita diagram Staristiska metoder 2012 19 Beskrivande mått Mått som beskriver ett datamaterial Lägesmått Typvärde Median Medelvärde Spridningsmått Variationsområde Variationsvidd Kvartiler, Percentiler Standardavvikelse Staristiska metoder 2012 20 Medelvärde och typvärde Se exempel Om en kolumn, x x n Om envägsindelad frekvenstabell, fx X n Typvärde = det vanligaste eller mest frekventa värdet i datamaterialet Staristiska metoder 2012 21 Medianen Se exempel Mittobservationens variabelvärde när observationer är ordnade i storleksordning Om n är udda tal Om n är jämnt tal xm x( n1) / 2 xn / 2 xn / 21 xm 2 Staristiska metoder 2012 22 Spridningsmått Variationsområde Intervall mellan minsta och största iobservationen Variationsvidd Största-minsta obs Staristiska metoder 2012 23 Kvartiler och percentiler Mål att dela datamaterialet i 4 nästan lika delar Q1 betecknar första kvartilen (ca 25%) Medianen betecknar mitten (50%) Q3 betecknar tredje kvartilen (ca 75%) Hur räkna ut Q1 och Q3 1. Dividera datamaterialet i 2 lika delar. Om antalet obs är udda, inkludera medianen i båda delar 2. Q1 är medianen av vänstersidan 3. Q3 är medianen av högersidan Kvartilavstånd Q3-Q1 Percetil ; ex: 13-e percentil (n*0.13)-e observationen Staristiska metoder 2012 24 Lådagram Punkter: Uteliggare (punkter <Q1-1.5*kvartilavstånd) Max(minvärde, Q1-1.5*kvarilavstånd) Q1 Medianen Q3 Min(maxvärde, Q3+1.5*kvarilavstånd) Uteliggare (punkter> Q3+1.5*kvarilavstånd) Staristiska metoder 2012 25 Standardavvikelssen Standardavvikelsen = mått på datamaterialets spridning kring medelvärdet (större s större spridning) 1 2 eller s x x n 1 Staristiska metoder 2012 26 n s x2 x 2 n 1 Normalfördelningen Oftast histogrammet påminner normalfördelningen N(μ,σ) Staristiska metoder 2012 27 Normalfördelning – intressanta fakta 68% observationer är mellan 95% observationer är mellan Variationsvidd=4*s x s, x s x 2 s, x 2 s Används för att kontrollera att uträknat s är ett rimligt värde (fel i beräkningar?) Staristiska metoder 2012 28 Läsa hemma Boken, kap 1-3 Staristiska metoder 2012 29