Lathund och övningar till (fd SPSS) PASW

Download Report

Transcript Lathund och övningar till (fd SPSS) PASW

Lathund och övningar till
(fd SPSS)
PASW statistics 18
för Biomedicinska
analytikerprogrammet
Umeå Universitet
Ylva Hedberg Fransson
Senaste uppdatering: 2011-10-05
Innehållsförteckning
Inledning till lathunden ____________________________________________________ 3
Inledning till steg 1-2 ______________________________________________________ 3
Projektbeskrivning 1 ______________________________________________________ 3
Steg 1: att komma igång ____________________________________________________ 4
Starta pasw, öppna och spara en fil ___________________________________________ 4
Så här läggs data in i pasw_________________________________________________ 5
Förtydligande av variabelnamn _____________________________________________ 6
Steg 2: lära känna data _____________________________________________________ 8
Case summarizes _______________________________________________________ 8
Frekvenstabeller (frequencies) _____________________________________________ 10
Beskrivande statistik (medelvärde, sd, kurtosis, skewness mm) ________________________ 11
Histogram ___________________________________________________________ 12
Histogram – bearbetning av diagrammet ______________________________________ 14
Inledning till steg 3-4 ______________________________________________________ 15
Projektbeskrivning 2 ______________________________________________________ 15
Steg 3: att göra grupperingar och koda variabler ____________________________________ 16
Att göra grupper med recode _______________________________________________ 16
Att koda variabler ______________________________________________________ 17
Bestämma cut off värden för gruppindelning med kvartiler __________________________18
Att gruppera kvartiler med recode ___________________________________________ 19
Steg 4: att kontrollera att gruppindelningar är korrekt_______________________________ 20
Crosstabs ___________________________________________________________ 20
Summarize cases _______________________________________________________ 21
Scatter (punktdiagram) _________________________________________________ 23
Scatter – bearbetning av diagrammet ________________________________________ 24
Inledning till steg 5-8 _____________________________________________________ 25
Projektbeskrivning 3 _____________________________________________________ 25
Steg 5: korrelationsanalys __________________________________________________ 26
Steg 6: korstabeller med chi-2-test och fischers exakta test____________________________ 27
Steg 7: boxplot _________________________________________________________ 29
Boxplot med en kontinuerlig variabel ________________________________________ 29
Boxplot med flera kontinuerliga variabler ______________________________________ 31
Steg 8: statistiska analyser associerade med boxplot ________________________________ 32
Mann whitney u-test ___________________________________________________ 32
Kruskall wallis-test ____________________________________________________ 33
Inledning till steg 9-11 ____________________________________________________ 34
Projektbeskrivning 4 _____________________________________________________ 34
Steg 10: att utföra beräkningar i pasw med compute ________________________________ 35
Steg 10: att utföra beräkningar i pasw med compute ________________________________ 35
Steg 11: att göra tabeller i word ______________________________________________ 36
Inledning till steg 12-13 ___________________________________________________ 38
Projektbeskrivning 5 _____________________________________________________ 38
Steg 12: select cases ______________________________________________________ 39
Steg 13: överlevnadsanalys med kaplan-meier _____________________________________ 41
Steg 14: tips och trix som underlättar databearbetningen _____________________________ 43
Tips i data view-fönstret _________________________________________________ 43
Tips i chartfönster _____________________________________________________ 43
Tips i output _________________________________________________________ 43
Register ______________________________________________________________ 44
2
Inledning till lathunden
För att lära sig hur PASW (tidigare kallat SPSS) fungerar så är det optimala att själv jobba med
programmet. Tanken med lathundens utformning är att du själv ska kunna utföra alla moment utifrån
anvisningarna.
Lathunden är baserad på en studie med fiktiva data för att illustrera olika applikationer av
programmet. Studien byggs på allt eftersom och de olika delarna bygger på varandra. Dessa beskrivs
fortlöpande i de så kallade Projektbeskrivningarna. I dem finns uppgifter om vilka data som finns i
PASW-filen samt vilka variabler som kommer att skapas under de olika avsnitten. Efter en
projektbeskrivning följer olika moment, benämnda Steg, som beskriver hur olika applikationer utförs.
I anslutning till varje projektbeskrivning finns en inledning som beskriver syftet med de steg den
innefattar.
Inledning till Steg 1-2
I Steg 1 är syftet att du ska bekanta dig med programmet, lära dig hur man öppnar och sparar filer
samt hur data läggs in och hur variabler namnges.
I steg 2 är syftet att du ska lära känna dina data, med detta avses att du ska få kännedom om hur
värdena varierar, utföra beräkningar av beskrivande statistik samt göra histogram.
Projektbeskrivning 1
Material
24 personer ingick i studien. Provernas identitet har avkodats och numrerats med löpnummerna
U133-U156. Kapillärprover har analyserats.
Metod
Koncentrationen glukos har analyserats hos patienterna/försökspersonerna (härefter beskrivs de som
patienter eller personer). Analyserna har utförts med två olika analysinstrument, HemoCue och Gluco
Sure Plus. Referensvärde: 6,3 mmol/L.
Variabler i PASW
löpnr: patientens löpnr anges i första kolumnen.
glukosh: glukoskoncentrationer analyserade med HemoCue.
glukosg: glukoskoncentrationer analyserade med Glucos Sure Plus.
3
Steg 1: Att komma igång
Starta PASW, öppna och spara en fil
1. Startmenyn => Alla program (i vissa datorer står det bara program) => SPSS Inc => PASW Statistics
18 => PASW Statistics 18.
2. Programmet startas. En ruta med olika alternativ blir synlig, välj Type in data (finns till höger). Om
du redan har en fil som du vill använda så väljer du den istället. Välj OK.
3. För att variablerna ska visas på samma sätt som i denna lathund kontrollera följande inställningar;
Edit => options, se bild nedan. Kontrollera att Display names och File samt Points är markerade.
Avsluta med att klicka Apply (en ruta blir synlig på skärmen, tryck OK) och bekräfta med OK. För att
dessa inställningar ska gälla krävs det att du stänger programmet och startar det igen.
Tips! I de fall ens datafil innehåller många variabler kan det vara en fördel att markera Alphabetical
istället för File. Detta gör att variablerna visas i alfabetisk ordning i stället för kronologisk ordning. Det
kan vara en fördel att alla variabler som handlar om samma sak ligger bredvid varandra då man ska
göra analyser. Det går givetvis att flytta variablerna i Data View (mer om detta senare) så att de
variabler som hör ihop ligger bredvid varandra.
4. Om du har startat programmet och glömt att välja fil så öppnas en fil så här: File => open => data
(om du vill ha ditt dataset med rådata) eller Output (om du vill ha din redovisningsfil med dina
resultat, mer om detta senare). Välj den mapp och fil du vill öppna.
5. För att spara filen: File => save. Om du har skapat en egen (namnlös) fil eller vill spara filen under
ett annat namn så väljer du istället save as. Spara filen som .sav.
4
Så här läggs data in i PASW
I PASW används ett rutnät, Data View,
där alla data skrivs in.
Kolumnerna innehåller olika variabler
(=det man har studerat) och varje rad
motsvarar en patient.
Variablerna i detta fall står för följande;
Första variabeln (var00001) innehåller
patienternas löpnr. Om datorn inte
accepterar texten, ta bort U och skriv
bara löpnumret.
Andra variabeln (var00002) innehåller
de glukoskoncentrationer som erhölls av
Hemo Cue analyserna.
Tredje kolumnen (var0003) innehåller
de koncentrationer som mättes med
Gluco Sure Plus.
Så här tolkas siffrorna i rad 10; Patient
U142 hade glukoskoncentrationerna 6,2
mmol/L med HemoCue och 8,7 mmol/L
med Glukos Sure Plus.
Din arbetsuppgift:
Mata in uppgifterna enligt tabellen och
spara din fil på t.ex. ett USB-minne.
5
Förtydligande av variabelnamn
Längst ned på sidan med rutnätet finns följande flik;
Klicka på Variable View. Nu öppnas ett nytt fönster som ser ut så är;
I detta fönster finns alla inställningar om de variabler som har matats in i det första rutnätet (Data
View). En stor skillnad mot Data View är att i Variable View så är varje variabel på en rad. I detta
exempel så är variabeln VAR0001 löpnr. De två andra variablerna är glukoskoncentration.
Din arbetsuppgift:
Gå in i läget Variable View och gör nedanstående justeringar, avsluta med att spara din fil.
I kolumnen Name döps Var00001 till löpnr eftersom det bättre speglar innehållet i denna variabel.
Ändra även namnen på variabel 0002 och 0003, se bild nedan.
I kolumnen Type anges vad det är för typ av text i variabeln. I detta fall är löpnr string dvs både siffror
och bokstäver, medan de andra variablerna enbart är siffror dvs numeriska. Om det tidigare inte gick
att skriva U före löpnumret så borde det gå med dessa inställningar, prova att gå tillbaka till Data View
och ändra så att bokstaven U syns i löpnr-kolumnen.
I kolumnen Width väljs hur bred kolumnen ska vara, här gör vi inga ändringar.
I kolumnen Decimals väljs antalet decimaler som ska visas i Data View. Variablen löpnr innehåller
bara text (=string) varför inga decimaler kan anges. Noggrannheten för glukosbestämningen är en
decimal, därför ändras 2 till 1.
I kolumnen Label skrivs en förklaringstext till variabeln. Denna text syns endast i tabeller och
diagram, den är inte nödvändig att fylla i men ökar förståelsen väldigt mycket.
I kolumnen Align anger man om data ska vara centrerat eller inte. Här väljer vi Left på första
variabeln, men låter de övriga vara Right.
I kolumnen Measure anger du Nominal för variabler som är text, Scale för kontinuerliga variabler
och Ordinal för grupperade variabler. I detta fall är löpnr nominal och de övriga scale.
6
Gå tillbaka till Data View, den sidan har nu ändrats till följande utseende;
Nu har variabelnamnen ändrats till
dessa som är betydligt lättare att
förstå.
Antalet decimaler har också ändrats.
Avsluta Steg 1 med att spara filen.
7
Steg 2: Lära känna data
Då alla data är inlagda i PASW är det bra att kontrollera att inmatningen gjordes korrekt. Det är lätt
hänt att trycka på 7 istället för 4 eller att missa ett kommatecken. För att stämma av om resultaten
verkar OK kan nedanstående analyser vara lämpliga att göra.
Case summarizes
Syfte
För att skapa en överblick över alla mätvärden. Detta gör det möjligt att på ett snabbt och enkelt sätt ta
reda på om något mätvärde saknas.
Din arbetsuppgift:
Välj; Analyze => Reports => Case summaries.
Följande fönster öppnas.
Markera variabelnamnet, klicka
på knappen med pilen i mitten så
att variabeln flyttas till rutan
bredvid. Flytta alla tre variablerna till rutan Variables.
Om det är många mätvärden så
kan man välja en begränsning, så
att t.ex. endast de första 100
syns. Den inställningen är
standard. Man kan ta bort
begränsningen eller ändra
antalet fall den ska visa.
Ibland innehåller databasen
mycket mätdata, men en del är
kanske inte fullständiga, då kan
man välja att bara vissa de fall
som man har mätvärden på.
Detta görs genom att bocka för
denna ruta. I vårt exempel så har
vi inga sådana värden, därför påverkar inte detta vår sammanställning. Ett exempel då när denna
funktion kan användas är om t.ex. tre glukosvärden saknas pga att patienterna inte gick att sticka
och en lista görs på dessa parametrar med förbockad ”Show only valid cases” så kommer dessa 3
patienter att automatiskt utgå ur tabellen.
Avsluta med att klicka OK.
Tolkning av erhållna resultat – Case summarizes
En ny fil kallad Output bildas. I den visas analyser och diagram. Denna fil sparas separat och får
efternamnet .spo. På vänster sida av skärmen finns ett fält som visar innehållet i Output-filen, det
liknar layouten som finns över mapparna i utforskaren. Själva resultaten med figurer och tabeller visas
på högra delen av skärmen. För att bearbeta ett diagram dubbelklickar man med vänster musknapp på
diagrammet.
8
Resultatet som erhålls utgörs av två tabeller. Den första tabellen, se nedan, ger en översikt på hur
många fall som ingår i studien, detta anges såväl i absoluta tal som i procent. Dessutom anges antalet
bortfall (exkluderade fall) samt totalt (dvs inkluderade + exkluderade fall).
Den andra tabellen ger en överblick över
mätvärdena i de valda variablerna. I detta
exempel erhålls samma information i Data View
eftersom filen innehåller så få mätvärden och
variabler. Denna funktion är dock bra då man
jobbar med stora databaser. Tänk dig att du har
en fil med 250 patienter och på dessa har du 75
olika variabler, då är det bra att kunna
sammanställa några av variablerna på detta sätt.
Tolkning
Av tabellen framgår det att samtliga 24 patienter och analysresultat är inlagda i databasen.
9
Frekvenstabeller (Frequencies)
Syfte
För att skapa en översikt av sina värden. I detta fall önskas en överblick av variabeln glukosh för att se
om det är flera patienter som har samma glukoskoncentration.
Variabelkriterier
Minst en variabel, grupperad eller kontinuerlig. I detta fall används glukosh.
Din arbetsuppgift:
Välj; Analyze => Descriptive Statistics => Frequencies.
Följande fönster öppnas. Markera då variabelnamnet och klicka på pilen i mitten. Den valda
variabeln flyttas till det högra fönstret. Upprepa
detta med alla variabler du vill analysera. I
detta fall väljs endast glukosh.
Kontrollera att rutan för ”Display frequency
tables” är markerad.
Klicka OK.
Tolkning av erhållna resultat
Den övre tabellen anger att det finns 24
mätvärden i variabeln och att inga värden saknas.
Den undre tabellen anger vilka glukoskoncentrationer det är som ingår i variabeln, därefter
hur många patienter det är som har respektive
koncentration, hur många % det utgör samt valid
och cumulative %.
Ur den undre tabellen framgår det att glukoskoncentrationerna 5,6; 6,2 och 8,0 detekterades i
två personer, resterande värden är unika dvs de
har detekterats hos endast en person.
För att ta reda på vilka prover det är som t.ex. har
koncentrationen 5,6 mmol/L kan Case
Summaries (se föregående sida) användas.
10
Beskrivande statistik (medelvärde, SD, kurtosis, skewness mm)
Syfte
Genom att beräkna grundläggande statistik erhålls kunskaper om materialets fördelning, variation,
anpassning till normalfördelning mm.
Din arbetsuppgift:
Välj; Analyze => Descriptive Statistics => Descriptives.
Följande fönster öppnas.
Markera både glukosh och glukosg,
klicka på pilen så att de flyttas till den
högra rutan. Tips! Genom att hålla
Ctrl-knappen nere och klicka på båda
variablerna så kan de flyttas samtidigt.
Klicka därefter på options.
Ett nytt fönster öppnas, här väljs de
beräkningar som önskas. Det går t.ex.
att välja Kurtosis och Skewness, om
man är intresserad av de analyserna
(det är mått på om värdena är normalfördelade).
Välj de analyser som är förbockade i
bilden till höger. Klicka därefter på
Continue. Då kommer det tidigare
fönstret upp igen, klicka OK.
Tolkning av erhållna resultat
Ur tabellen utläses att antalet patienter är 24, att glukoskonc. varierar mellan 4,0 – 10,3 mmol/L
med HemoCue medan variationen för Gluco Sure Plus är 4,7-12,4 mmol/L. Medelvärdena är 6,9
mmol/L respektive 8,2 mmol/L. Standardavvikelsen (Std Dev.) är 1,9 respektive 2,3.
11
Histogram
Syfte
För att studera spridningen på värdena.
Din arbetsuppgift:
Välj; Graphs => Chart Builder => En ruta kommer upp, om du följt anvisningarna i avsnittet
”Förtydligande av variabelnamn” väljer du OK. Om inte så måste du gå till Variable View och göra
uppdateringar där.
Ett fönster enligt nedan öppnas. Gör så här; 1) Välj histogram, 2) Markera det första diagrammet i
översta raden, håll vänster musknapp nertryckt och drag diagrammet till rutan ovanför, släpp musknappen. Element Properties dyker nu upp. Här kan man t.ex. välja att åskådliggöra normalkurvan
eller ändra stilen (Bar style) på staplar till t.ex. streck. 3) Välj sedan glukosh, drag den till x-axeln.
Klicka OK.
3
2
1
12
Tolkning av erhållna resultat
Så här ser diagrammet ut.
Y-axeln visar antalet
patienter i varje intervall.
X-axeln visar grupperna för
glukoskoncentration.
Observera att här anges
den text vi tidigare angav
under Label i Variable
View. Detta är alltså inte
variabelns namn.
Till höger om diagrammet
finns lite statistik.
Studera fördelningen! I
detta fall finnas det inget
värde som är mycket högre
eller ett intervall där det
finns ovanligt många fall.
Det är viktigt att kontrollera att N = 24 för att se att alla mätvärden finns med. Detta är särskilt
viktigt vid mer avancerade analyser där en viss del av materialet har utvalts för att analyseras
separat, mer om detta i ”Select cases”. Det går också att utläsa medelvärde samt
standardavvikelsen.
13
Histogram – bearbetning av diagrammet
Syfte
För att bättre illustrera de resultat som erhållits kan det vara en fördel att ändra layouten på
diagrammet.
Din arbetsuppgift:
Dubbelklicka på diagrammet i output-filen => Chart Editor öppnas. I detta fönster kan diagrammet
modifieras på olika sätt. Gör följande ändringar;
Dölj statistiken: Options =>
Hide Legends.
Byt text på axlarna: ändra
till glukos och antal genom att
klicka på texten.
Redigera texten på
axlarna: dubbelklicka på
texten, ändra enligt bilden till
höger. Ändra även typsnitt till
georgia, 12 pt samt välj grön
färg på texten.
Byt stapelfärg: dubbelklicka
på stapeln, fönstret Properties
öppnas, Klicka på fliken Fill &
Border, välj grön färg på
staplarna. Avsluta med Apply.
Ändra skalan: dubbelklicka
på x-axeln. Välj fliken Scale:
välj att diagrammet ska gå
från 2 till 13 samt att varje del
i skalan (=Major Increment)
ska vara 1 steg. Välj 2 pt
tjocklek på axlarna.
Justera skalstrecken: dubbelklicka på x-axeln. Välj fliken Labels and ticks. Ta bort de stora skalstrecken
och välj att de små ska vara på utsidan av skalan.
Lägg in normal kurva: Klicka på
och välj att normalkurvan ska synas i diagrammet. Genom
Options => Hide Legend döljer du textrutan med linjens förklaring.
Markera bakgrunden och byt färg genom att välja vit. Se till att även rutan runt diagrammet
försvinner.
Ser nu din bild ut som den som finns här i kompendiet?
14
Inledning till Steg 3-4
Innan mer avancerade statistiska analyser utförs är det en fördel att gruppera kontinuerliga variabler.
Steg 3 beskriver hur grupperingar görs i PASW och i Steg 4 kontrolleras att gruppindelningen gjorts på
ett korrekt sätt. Det är inte nödvändigt att göra alla moment som visas i Steg 4, men olika sätt passar
vid olika tillfällen.
Det/de gränsvärde/n som delar materialet i olika grupper kallas cut-off värde. Många gånger motsvarar detta värde referensintervall. I exemplet i denna lathund görs två olika grupperingar. Den första
är en gruppering i två grupper utifrån referensvärdet (6,3 mmol/L) medan den andra grupperingen
delar in materialet i fyra lika stora grupper, så kallade kvartiler. Se mer om detta under rubriken Nya
variabler nedan.
Projektbeskrivning 2
Material
Samma som tidigare: 24 patienter ingick i studien. Patienternas identitet har avkodats och proverna
har numrerats med löpnummer; U133-U156. Kapillärprover har analyserats.
Metod
Samma som tidigare: Koncentrationen glukos har analyserats hos patienterna. Analyserna har utförts
med två olika analysinstrument, HemoCue samt Gluco Sure Plus. Referensvärde: 6,3 mmol/L.
Variabler i PASW
Variabler sedan tidigare;
löpnr: patientens löpnr anges i första kolumnen.
glukosh: glukoskoncentrationer analyserade med HemoCue apparaten.
glukosg: glukoskoncentrationer analyserade med Glucos Sure Plus apparaten.
Variabler som produceras under följande del av lathunden; 2 grupper (referensvärde)
Nu förkortas glukos till gluk, 5:e bokstaven står för vilken metod glukoskoncentrationen är analyserad
med och 2gr står för att variabeln är består av två grupper. Cut off = 6,3 mmol/L. Grupperna kommer
att numreras med 1 och 2, följande gäller; grupp 1: <6,3 mmol/L och grupp 2: > 6,3 mmol/L. Detta ger
variabelnamnen glukh2gr och glukg2gr.
4 grupper (kvartiler)
På samma sätt som ovan kommer de ursprungliga variablerna att indelas i kvartiler. För cut off –
värden – se kommande beräkningar. Kodning: 1: 1:a kvartilen, 2: 2:a kvartilen, 3: 3:e kvartilen och 4:
4:e kvartilen. Variabelnamnen blir glukh4gr och glukg4gr.
Anledningen till att vi väljer så konstiga förkortningar på variablerna är att variabelnamnen endast får
bestå av 8 tecken. Det gäller att hitta på ett system som gör det möjligt att läsa ut vad en variabel står
för utan att behöva gå till Data View och Variable View.
I Variable View finns en kolumn – Measure, där anges att textvariabler t.ex. Löpnr ska vara nominal,
kontinuerliga variabler t.ex. glukosh ska vara scale och grupperade variabler t.ex. glukh2gr ska vara
ordinal.
15
Steg 3: Att göra grupperingar och koda variabler
Att göra grupper med Recode
Syfte
Att koda om värden och att göra grupper. I detta exempel ska två grupper skapas för att skilja de
patienter med normal glukoskoncentration från de som överstiger referensvärdet på 6,3 mmol/L.
Din arbetsuppgift:
Välj; Transform => Recode into Different Variables.
OBS! Det är viktigt att välja Different eftersom det ger en ny variabel med grupperingen medan Same
Variables ersätter ursprungsvariabeln med den grupperade variabeln. Detta resulterar alltså i att man
förlorar variabeln med rådata.
Variablerna finns längst till vänster.
Markera den variabel som ska
grupperas, klicka på pilen i mitten så
att variabeln flyttas till fönstret med
Input Variable. Längst till höger finns
mottagaren dvs den variabel som ska
skapas. Då du har flyttat en variabel
till Input Variable så aktiveras Output
Variable.
Flytta glukosh till Input variabel samt
skriv in den nya variabelns namn,
glukh2gr, i Output Variable. Klicka på
Change. Nu ändras texten i rutan i
mitten. Där står nu att glukosh ska
göras om till glukh2gr.
1
3
2
4
För att gå vidare klickar man på Old
and New Values.
Fönstret består av två delar, till
vänster behandlas Old Value dvs den
kontinuerliga variabeln och till höger
New Value dvs gruppindelningen. 1)
Ange referensvärdet (6,3) i delen
Lowest through-datorn kollar
automatiskt vilket värde det är som
är lägst och från det värdet till 6,3 av
de kontinuerliga värdena ska bilda 2)
grupp 1 i New Value, klicka på 3) Add.
4) Skriv sedan 6,3 i through highest
delen. Datorn väljer då automatiskt
värdena från 6,3 till det högsta värdet,
till grupp 2.
2
1
3
4
5) Om du har gjort rätt så ska det stå
så här i rutan; Avsluta med Continue
=> OK
16
5
Resultat
Nu har en ny variabel bildats. Denna heter
glukh2gr. De med 1,00 har en normal glukoskoncentration och de patienter indelade i
grupp 2 är de med förhöjda glukosnivåer.
Din arbetsuppgift:
Gör om samma sak för glukosg-variabeln. De valda gränserna från den förra grupperingen ligger kvar,
eftersom cut off värdet är det samma så går det bra att ”återanvända” dem. Den nya variabeln ska
också grupperas som 1 och 2.
Att koda variabler
Syfte
I exemplet ovan kallas grupperna för 1 och 2. Än så länge minns vi vad de står för, men inte så länge
till… För att hjälpa vårt minne så omkodas de genom att de får förklaringar i klartext.
Din arbetsuppgift:
Gå till Variable View.
Ändra till 0 decimaler.
Skriv in en förklaringstext i
kolumnen med Label.
Klicka i rutan under Values =>
nytt fönster. Här anges värdena
för variabeln och vad de står för.
I detta fall är 1= normalt. (det är
bra att förtydliga genom att även
ange referensvärdet, se exempel).
=> Add (texten flyttas till den
vita rutan). Upprepa definitionen
av 2:an. Avsluta med OK. Gör
sen samma sak med glukg2gr.
Resultat
Öppna Data View, här syns
förklaringarna i rutnätet. Man
kan skifta mellan att illustrera
detta med siffror eller förklaringar genom att klicka på
knappen som pilen pekar på.
Prova att klicka på den och se
vad som händer.
Kom ihåg att spara filen med de
nya variablerna.
17
Bestämma cut off värden för gruppindelning med kvartiler
Syfte
I vissa fall finns inget referensvärde och det kan vara svårt att veta hur man ska gruppera proverna. En
allmänt vedertagen lösning är att dela materialet i lika stora delar, vanligtvis i 4 delar – så kallade
kvartiler. Detta innebär att prov med lägst koncentration hamnar i en grupp, osv. Detta gör att 25 % av
proven hamnar i varje grupp. För att kunna göra en gruppindelning med kvartiler måste cut off värden
för grupperna beräknas.
Din arbetsuppgift:
Välj; Analyze =>Descriptives Statistics => Frequencies
Välj de aktuella variablerna,
flytta dem till Variabelrutan.
Avmarkera frekvenstabellen,
den är inte intressant nu. Det
kommer upp ett meddelande
om att inga analyser är valda,
klicka OK och sedan på
Statistics.
I Statistics-fönstret väljs den
gruppindelning som önskas, i
detta fall kvartiler.
Om önskemålet hade varit ett
annat antal grupper så markeras
Cut points for och så anges det
antalet grupp man önskar.
Som synes kan även grundläggande statistik samt
skewness och kurtosis beräknas
här. Då markeras de önskade
beräkningarna.
Klicka Continue => OK
18
Resultat
I output erhålls en tabell med
följande data. N Valid och missing
visar att 24 patienter ingår i båda
variablerna och att ingen saknas.
Percentilerna 25, 50 och 75 är
kvartilgränserna q1-q3.
Tolkning
Längst ned i tabellen framgår cut off värdena för de 4 kvartilerna. I klartext innebär detta att referensvärdena för de olika kvartilerna blir;
Kvartil
1 (0-25%)
2 (25-50%)
3 (50-75%)
4 (75-100%)
HemoQue (mmol/L)
Från minvärdet till 5,5
5,5 – 7,0
7,0 – 8,4
8,4 till maxvärdet
Gluco Sure Plus (mmol/L)
Från minvärdet – 6,2
6,2 - 8,3
8,3 - 9,7
9,7 till maxvärdet
Att gruppera kvartiler med recode
Syfte
Att koda om värden och att göra grupper. I detta exempel ska två kontinuerliga variabler indelas i
kvartiler. Cut off värderna finns angivna ovan.
Din arbetsuppgift:
Utförligare beskrivning för detta moment finns under rubriken ”Att göra grupper med Recode”.
Välj; Transform => Recode into Different Variables. Välj glukosh som Input Variable och döp Output
Variable till glukh4gr, klicka på change.
Se till att alla gamla inställningar är
borttagna. Inställningarna för kvartil 1
och 4 görs på samma sätt som tidigare.
För kvartil 2 och 3 måste min och
maxvärdena dvs range för gruppen
anges.
Om du har gjort rätt så ska det stå så
här i rutan; Avsluta med Continue =>
OK. Gör sedan samma sak för glukg4gr
(kom ihåg att radera de gamla inställningarna och anv. rätt cut off-värden).
Avsluta med att koda om variablerna i Variable View + lägg till label. Kontrollera och
ändra så att följande inställningar i ”Variable View” är gjorda i Measure kolumnen:
löpnr – nominal, gukosh och glukosg – scale och de övriga ordinal.
19
Steg 4: Att kontrollera att gruppindelningar är korrekt
Crosstabs
Syfte
För att kontrollera att alla värden har hamnat i rätt grupp kan flera olika analyser göras. Ett sätt är att
göra en korstabell. Denna heter Crosstabs i PASW.
Variabelkriterier
Minst två variabler krävs. Variablerna måste vara grupperade.
Din arbetsuppgift:
Välj; Analyze =>Descriptives Statistics => Crosstabs
Välj glukh4gr och glukh2gr, flytta
dem genom att markera dem och
klicka sen på ”pilknapparna”.
OBS! Den variabel som står i den
övre rutan återfinns sedan i
tabellens rader, den undre
variabeln kommer att stå i
kolumnerna.
Klicka på OK
Resultat
I output erhålls två tabeller.
Den övre är en översikt om
antalet prover som ingår i
analysen. Den undre kan se
ut som denna. Texten är den
som är inskriven under Label
i Variable View.
Tolkning
I den vänstra kolumnen framgår det att alla med normalt glukos har hamnat i kvartil 1 och 2. Vidare
framgår det att alla i kvartil 3 och 4 ska vara förhöjda. Vi vet att cut offen för glukh2gr är 6,3 samt att
kvartil 2 har intervallet 5,5-7,0,.
I totalkolumnen finner vi att det inte är lika många i alla grupper, det förväntade antalet är 6. För att
studera om något värde har hamnat galet så kan man göra en Case Summaries, se nästa sida.
20
Summarize Cases
Syfte
Denna typ av tabell nyttjas för att se vilka prover det är som ligger i respektive grupp och att
kontrollera att gruppindelningen har skett på ett korrekt sätt. I det föregående momentet fann vi att
glukh4gr innehåller 6+7+6+5 patienter. Vi vill nu ta reda på varför det är denna fördelning och inte 6 i
varje grupp, vilket vore det naturliga.
Variabelkriterier
En parameter som finns både som kontinuerlig och grupperad variabel. Vi använder oss dessutom av
variabeln med löpnr för att kunna identifiera de olika patientproverna.
Din arbetsuppgift:
Välj; Analyze =>Reports => Case Summaries
I detta fönster anges vilka
variabler det är som ska
analyseras. Antag att vi vill veta
vilka patienter det är som ingår i
de olika grupperna samt vilken
glukoskoncentration de har.
Välj glukh4gr som Grouping
Variable och glukosh och löpnr
som Variables.
Klicka på OK
Resultat och tolkning
Tabellen i output filen, se nästa sida, visar att HemoQue variablen utgörs av fyra grupper – kvartiler
samt cut off värdena. Det framgår att det är totalt 6 patienter i första gruppen, längst till höger syns
löpnumrerna för de patienter som ingår i gruppen. I grupp 2 ingår 7 patienter, här framgår det att 2
patienter (U135 och U 141) har 5,6 mmol/L, dvs de har samma koncentration och ligger närmast cut
off värdet. Det går inte att skilja dessa två från varandra och sätta dem i olika grupper, detta resulterar
i att det blir en extra patient i denna grupp. Detta gör också att det bara blir 5 i kvartil 4.
21
22
Scatter (Punktdiagram)
Syfte
Ett annat sätt att kontrollera att gruppindelningen är rätt är att studera de kontinuerliga variablerna i
ett punktdiagram och markera de olika grupperna i diagrammet.
Variabelkriterier
Tre variabler krävs. Två variabler ska vara kontinuerliga, samt en grupperad variabel som är
grupperad utifrån en av de två kontinuerliga variablerna.
Din arbetsuppgift:
Välj; Graphs => Chart Builder => OK
1. Välj Scatter/Dot
2. Välj Grouped Scatter
3
3. Välj de variabler som ska
illustreras med diagrammet.
4. Avsluta med OK
2
1
4
Resultat och tolkning
Kvartil 1 illustreras i blått,
enligt förklaringen till höger
om diagrammet. Vi vet att
cut offen ska vara 5,5. Genom
att läsa av skalan på x-axeln
så ser vi gränsen mellan
kvartil 1 och 2 går vid ca 5,5.
Denna gruppering är alltså
rätt gjord. De övriga kvartiler
bedöms på samma sätt.
Ur diagrammet utläses även
att grupperna är intakta dvs
inget prov har ”fel färg”.
23
Scatter – bearbetning av diagrammet
Syfte
För att illustrera de resultat som erhållits kan det vara en fördel att ändra layouten på diagrammet.
Din arbetsuppgift:
Dubbelklicka på diagrammet i output-filen så att diagrammet visas i ett chart fönster. Diagrammet kan
bearbetas på liknande sätt som histogrammet.
Gör följande modifieringar;
Byt bakgrundsfärg: Dubbelklicka på bakgrunden, Fönstret Properties och Fill & Borders öppnas,
Byt till vit bakgrund alt. ingen bakgrund alls => Apply.
Ta bort linjerna runt diagrammet: I fönstret Properties och Fill & Borders, Byt till vita linjer runt
diagrammet => Apply.
Ta bort ”Figure Legend”: markera förklaringsrutan => Options => Hide Legend.
Modifiera cirklarna i diagrammet: dubbelklicka på cirklarna => Fönstret Properties – Markers
öppnas. Välj en storlek 8 samt tjocklek 2 på linjerna. Byt form på cirklarna till en stjärnliknande form.
Ändra typsnitt genom att dubbelklicka på texten. Ändra typsnitt till Verdana samt 10 punkter,
normal = (ej fet stil).
Ändra skalorna:
dubbelklicka på ena axeln
=> i fönstret Properties
väljs fliken Labels& ticks.
Välj att Major ticks ska
vara genomgående och
minor ticks endast på
utsidan. På fliken Scale
anpassas axlarna så att
båda utgår från 0 och
max är 13, ange Major
Increment till 1. Under
Number Format väljs 0
decimaler och på Lines
väljs Wieght 1.0.
Referenslinje: Options
=> X-axis Reference
Line: ange 6,3 som
referens. Upprepra för yaxeln.
Om du har gjort rätt ska
diagrammet se ut som det
till höger.
24
Inledning till Steg 5-8
Det är ofta intressant att studera om olika variabler korrelerar till varandra. Detta kan göras med olika
statistiska analyser. I steg 5 beskrivs hur korrelationsanalys av kontinuerliga variabler utförs. I många
studier används variabler som inte kan vara kontinuerliga, t.ex. kön och diagnos, i dessa fall görs
korstabeller, steg 6. Ytterligare ett sätt att analysera data är då man vill studera hur en kontinuerlig
variabel varierar i olika grupper, steg 7. I steg 8 beskrivs de statistiska test som testar om resultaten
erhållna i steg 7 är signifikanta.
Projektbeskrivning 3
Material
Samma som tidigare: 24 patienter ingick i studien. Patienternas identitet har avkodats och proverna
har numrerats med löpnummer; U133-U156. Kapillärprover har analyserats.
Nytt: I denna del läggs information om ev. diabetesdiagnos vid provtagningen in i databasen.
Metod
Samma som tidigare: Koncentrationen glukos har analyserats hos patienterna. Analyserna har utförts
med två olika analysinstrument, HemoCue samt Gluco Sure Plus. Referensvärde: 6,3 mmol/L.
Variabler i PASW
Variabler sedan tidigare;
löpnr
glukosg
glukosh
glukh2gr
glukg2gr
glukh4gr
Variabler som produceras under följande del av lathunden;
diagnos
Din arbetsuppgift:
I samband med provtagningen ställdes
frågor om patienten hade diabetes.
Uppdatera din fil med denna information.
Detta gör du lämpligen genom att infoga en
tom kolumn mellan löpnr och glukosh. Den
nya information är grupperad och där 0 är
frisk (dvs inte har diabetes) medan 1 är
diabetes. Mata in dessa värden i din egen
fil. Den nya variabeln heter diagnos.
Uppdatera sedan label och values i Variable
View.
25
glukg4gr
Steg 5: Korrelationsanalys
Syfte
För att undersöka om det finns en korrelation mellan två variabler kan korrelationsanalyser göras. I
detta fall är frågan om de två metoderna för att mäta glukos ger samma resultat.
Variabelkriterier
Minst två kontinuerliga variabler krävs.
Din arbetsuppgift:
Välj; Analyze => Correlate => Bivariate
Välj de kontinuerliga variablerna, enligt
bilden.
Välj statistiskt test; Pearson och Spearman.
Om man har mindre material eller om det
inte är normalfördelat bör spearman väljas.
Det går att välja antingen två- eller ensidigt
test. Oftast används two-tailed.
Avsluta med OK.
Resultat
Två tabeller erhålls, den
övre visar Pearsons test,
den undre Spearmans.
Tabellerna tolkas på
samma sätt.
Tabellen får fyra fält, varav
den övre högra delen är
spegelvänd mot den undre
vänstra delen. På
diagonalen jämförs
variablerna mot sig själva,
därför erhålls ingen
korrelation där.
För att se om variablerna
korrelerar studeras
korrelationskoefficienten
(0,956 resp. 0,941), pvärdet är 0,000 dvs <
0,001 för båda testen och
antalet patienter är 24.
26
Tolkning
I detta fall är korrelationskoefficienten 0,96 samt 0,94. Om detta värde hade varit 1 hade alla värden
överensstämt perfekt. P-värdena är < 0,001 i båda testerna. Slutsatsen är att resultaten från de två
apparaterna överenstämmer.
Steg 6: Korstabeller med Chi-2-test och Fischers exakta test
Syfte
Då två variabler är grupperade kan en korstabell göras för att analysera om variablerna korrelerar med
varandra. I detta fall vill vi studera om glukoskoncentrationen analyserad med HemoQue är olika hos
friska jämfört med diabetespatienterna.
Variabelkriterier
Två grupperade variabler krävs.
Din arbetsuppgift:
Välj; Analyze =>Descriptives Statistics => Crosstabs
Välj att variabeln diagnos ska
visas som rader och glukh2gr som
kolumner.
Om tabellen är större än 2X2
celler så måste Fischer´s exakta
test väljas manuellt. Det finns
under Exact => Exact. Det går att
sätta en time limit för
beräkningarna om tabellen är
väldigt stor, för det mesta går
beräkningarna dock snabbt.
Välj Statistics och markera
Chi-square. => Continue. => OK.
27
Resultat
I output erhålls två tabeller.
Den övre visar på fördelningen i
de olika cellerna. Majoriteten
(7/10) av de friska har normala
värden och en minoritet (3/14) av
diabetespatienterna har förhöjda
glukosvärden.
Är skillnaden signifikant?
Enligt den undre tabellen syns det
att skillnaden är signifikant.
Pearson p-värde är 0,017,
Fischer´s exakta två-sidiga test är
0,035.
Tolkning
Resultatet av dessa analyser visar att de med diagnosen diabetes har signifikant högre glukosoncentioner. Det analyserade materialet är inte normalfördelat, därför bör fischer´s exakta test användas.
28
Steg 7: Boxplot
Boxplot med en kontinuerlig variabel
Syfte
För att illustrera spridningen av en kontinuerlig variabel och kunna jämföra två olika grupper kan en
boxplot göras. I detta fall undersöks det om diabetespatienterna har högre glukoskoncentration (mätt
med HemoQue) jämfört med de friska personerna.
Variabelkriterier
Två variabler krävs, en grupperad och en kontinuerlig.
Din
arbetsuppgift:
Välj; Graphs =>
Chart Builder =>
Boxplot. => se
figuren till höger.
29
Resultat
Resultatet
visas i en
boxplot där
kvartilerna är
markerade.
Värdet för
medianen
visas som ett
grovt streck i
boxen.
Vid en stor
skillnad i
median är det
mer troligt att
skillnaden är
signifikant.
Tolkning
Så här tolkas boxplotens olika delar:
4:e kvartilen
Max
3:e kvartilen
Median
2:a kvartilen
Min
1:a kvartilen
Det nygjorda diagrammet tolkas så här: glukosvärdena hos diabetespatienterna är högre eftersom den
högra boxen ligger högre. Frågan är om skillnaden mellan grupperna är signifikant, detta testas i nästa
steg.
30
Boxplot med flera kontinuerliga variabler
Syfte
För att illustrera spridningen av flera kontinuerliga variabler och kunna jämföra olika grupper kan en
boxplot göras. I detta fall illustreras variationer av glukoskoncentrationer analyserade med HemoQue
och Gluco Sure Plus hos friska och diabetespatienter.
Variabelkriterier
Minst tre variabler krävs, en grupperad och minst två kontinuerliga.
Din arbetsuppgift:
Välj; Graphs => Legacy Dialogs
=> Boxplot => Clusters +
summaries for separate variables
=> define.
Välj sedan enligt bilden, avsluta
med OK.
Resultat
Resultatet visas i en boxplot.
Analyserna gjorda med
HemoQue syns som blåa
boxar medan de från Gluco
Sure Plus är gröna.
Tolkning
I diagrammet syns det att den ”gröna metoden” är generellt högre, det framgår även att diabetespatienterna har högre glukoskoncentrationer än de friska. Medianerna och spridningen skiljer sig på
ett sätt att man kan anta att skillnaden i koncentration är signifikant mellan grupperna. För att
bekräfta det måste dock Mann Whitney U-test beräknas för respektive grupp.
31
Steg 8: Statistiska analyser associerade med boxplot
Mann Whitney U-test
Syfte
Mann Whitney U-test görs för att beräkna om den skillnad som syns i en boxplot är signifikant eller
inte. I detta fall vill vi veta om det är signifikant högre glukoskoncentrationer hos diabetespatienterna
än hos de friska personerna.
Variabelkriterier
Två variabler, en grupperad och en kontinuerlig.
Din arbetsuppgift:
Välj: Analyze => Nonparametric Tests
=> Legacy Dialogs =>2 independent
Samples => inställningar enligt bilden.
Kontrollera att Mann Whitney U testet
är markerat.
Diagnos följs av (??). Nu måste
grupperna som ska testas definieras,
klicka på Define Groups.
Ange koderna för de grupper som
ska testas; 0 för de friska och 1 för de
med diabetes. => Continue.
Observera att det nu står diagnos (0
1) istället som grouping variable.
Avsluta med OK.
Resultat
I output erhålls två tabeller.
Den övre visar antalet
patienter i varje grupp samt
mean rank och sum of ranks.
Den undre tabellen anger att
p-värdet är 0,004.
32
Tolkning
Sum of ranks i den övre tabellen anger att glukoskoncentrationerna är högre i diabetesgruppen.
I den undre tabellen står det att det är en signifikant skillnad, med andra ord, diabetespatienterna har
signifikant högre glukoskoncentration än de friska individerna.
Kruskall Wallis-test
Syfte
För kontrollera om en kontinuerlig variabel t.ex. glukosh varierar i olika grupper (fler än 2) t.ex.
glukg4gr.
Variabelkriterier
Två variabler krävs, en kontinuerlig och en gruppera (i > 2 grupper).
Din arbetsuppgift:
Välj: Analyze => Nonparametric Tests
=> Legacy Dialogs => K independent
Samples => inställningar enligt bilden.
Definiera ”Grouping variable” enligt
den indelning som finns på databladet.
I detta fall vill vi studera alla kvartiler,
därför väljs (1 4).
Resultat
I output erhålls två tabeller.
De tolkas på samma sätt som
tabellerna vid Mann Whitney
U-testet, se ovan.
Tolkning
Om p-värdet är signifikant, som i detta fall (p=0,001), så innebär det att minst en grupp skiljer sig
statistiskt från de övriga. För att veta vilken eller vilka grupper det är måste Mann Whitney U-test
beräknas för respektive grupp.
33
Inledning till Steg 9-11
Ibland vill man göra beräkningar i PASW baserade på sina mätdata. Ett exempel på detta kan vara om
man räknar med pengar, att man har en variabel med värden exklusive moms och att man vill
multiplicera de värdena med 1,25 för att få dem inklusive moms. I denna lathund kommer respektive
persons medelvärdet för de två analysmetoderna att beräknas.
PASW är ett program för att beräkna statistik, undersöka om det finns samband mellan olika variabler,
göra diagram för illustrationer mm. Tyvärr så är PASW inte ett program med ”publiceringsfärdiga”
illustrationer. För att bearbeta diagram finns ganska stora möjligheter i Chart-fönstrena, se mer om
detta under Layoutmodifieringar. Vad det gäller tabeller är dessa dock inte alls färdiga utan man måste
”sättas ihop” i word. För att få en bra och överskådlig tabell måste data från flera olika tabeller i PASW
sättas samman och dessutom ska tabellen i word förtydligas med lämpliga namn på kolumner och
rader. I steg 10 visas hur en tabell kan göras i word. I steg 11 beskrivs olika tips och trix som kan
underlätta databearbetningen.
Projektbeskrivning 4
Material
Samma som tidigare: 24 patienter ingick i studien. Patienternas identitet har avkodats och proverna
har numrerats med löpnummer; U133-U156. Kapillärprover har analyserats och information om ev.
diabetesdiagnos vid provtagningen finns inlagt i databasen.
Metod
Samma som tidigare: Koncentrationen glukos har analyserats hos patienterna. Analyserna har utförts
med två olika analysinstrument, HemoCue samt Gluco Sure Plus. Referensvärde: 6,3 mmol/L.
Variabler i PASW
Variabler sedan tidigare;
löpnr
glukosh
glukosg
glukh2gr
glukg2gr
glukh4gr
glukg4gr
diagnos
Nya variabler;
Beräkning av medelvärde. I denna variabel läggs glukoskoncentrationerna från de två analyserna
samman och divideras med 2 för att erhålla respektive persons medelvärde. Den nya variabeln döps
till: glukosm.
34
Steg 10: Att utföra beräkningar i PASW med Compute
Syfte
För att utföra beräkningar i PASW används en funktion som heter Compute. I detta exempel ska
respektive persons medelvärdet för de två analyserna av glukoskoncentation att beräknas. Detta görs
genom att glukoskoncentrationerna från de två analyserna läggs samman och divideras med 2. Den
nya variabeln döps till glukosm.
Variabelkriterier
Inga generella variabelkriterier finns, annat än att de variabler som krävs för respektive beräkning
måste finnas i datafilen.
Din arbetsuppgift:
Välj; Transform =>
Compute Variable.
Börja med att namnge
målvariablen, dvs
Target Variable.
Lägg sedan in formeln
för beräkningen i
rutan för Numeric
Expression, obs!
ibland krävs det
parenteser för delar av
formeln.
Avsluta med OK.
Resultat
Variabeln glukosm
har bildats, till höger
i Data View. Gå till
Variable view och
skriv in vad variabeln
innehåller dvs ange
att det är medelvärdet från de två
analyserna.
Kontrollera att det
verkar stämma, det är
lätt att skriva fel
formel i Compute,
tex att göra scatters
eller korrelationsanalys.
35
Steg 11: Att göra tabeller i word
Syfte
För att illustrera sina resultat kan en tabell vara mycket illustrativ. De tabeller som erhålls i PASW är
dock inte färdiga för att direkt kopiera och lägga in i word. För att göra en överskådlig och lättolkad
tabell måste olika uppgifter från flera ställen användas för att skapa en tabell. I detta fall ska en tabell
som visar på andelen individer som har diagnosen diabetes vid provtagning i relation till om
glukoskoncentrationen är normal eller inte samt p-värdet ingå i tabellen.
Variabelkriterier
I detta fall behövs tre variabler; glukosh2gr, glukosg2gr samt diagnos.
Din arbetsuppgift:
Första skapas två korstabeller med diagnos som kolumnvariabel och glukos som rader. Välj att chi-två
test ska beräknas. Utifrån dessa plockas sedan den relevanta informationen till en tabell.
Resultat
Tabellerna till höger erhålls
i PASW. De markerade
värden används sedan till
att skapa en tabell.
36
Din arbetsuppgift
Starta Word och skapa en tabell med 6 rader och 5 kolumner. Mata in siffrorna;
Hemo Cue
Gluco Sure
Plus
Normal
Förhöjd
Normal
Förekomst av…
Ej diabetes
7
3
5
Diabetes
3
11
2
Förhöjd
5
12
p-värde
0,02
0,06
Bearbeta tabellen för att ge den en snyggare layout, det gör den mer lättläst;






Skriv en tabelltext över tabellen som förklarar vad tabellen visar. Denna tabelltext ska inte
innehålla resultat utan vara till stöd för förståelsen, gärna ganska kort.
I vissa fall kan det öka läsförståelsen om celler sammanfogas och en gemensam rubrik för flera
kolumner skrivs.
Välj uttryck/benämningar som gör tabellen lättläst.
I tabeller tas stödlinjerna bort, de linjer som ska vara kvar är den som är överst i tabellen samt
under översta samt sista raden, se tabellen nedan.
Justera t.ex. texten så att den blir högerjusterad där så är lämpligt.
Lägg in fotnötter om det underlättar förståelsen av tabellen.
Det färdiga resultatet skulle kunna se ut så här;
Tabell 1: Glukoskoncentrationer analyserades i kapillärt blod med Hemo Cue och Gluco
Sure Plus hos 24 försökspersoner. Tidigare eventuell diabetesdiagnos noterades vid
provtagningen.
Förekomst av diabetes vid provtagning
Analysinstrument
Glukosnivå*
Hemo Cue
Normal
7
3
Förhöjd
3
11
Normal
5
2
Förhöjd
5
12
Gluco Sure Plus
Ej diabetes
Diabetes
*) Beslutsgränsen för normala glukoskoncentrationer var 6,3 mmol/L.
#) Chi-två test
37
p-värde#
0,02
0,06
Inledning till Steg 12-13
I vissa fall är det en fördel att kunna studera en del av sina mätdata för sig. Antag att du vill veta vilka
individer det är som har förhöjd glukoskoncentration men som inte har diagnosen diabetes. Hur du
gör detta beskrivs i steg 12.
I en del studier vill man studera hur en markör t.ex. glukoskoncentrationen påverkar en grupp
individers överlevnad. I steg 13 jämförs två gruppers överlevnad med hjälp av Kaplan-Meier. Båda
grupperna har förhöjda glukoskoncentrationer, men den ena gruppen (diabetesgruppen) har fått
behandling för sjukdomen, medan den andra gruppen inte har gjort några förändringar. Frågan är om
behandlingen har gett dem en längre överlevnad.
Projektbeskrivning 5
Material
Samma som tidigare: 24 patienter ingick i studien. Patienternas identitet har avkodats och proverna
har numrerats med löpnummer; U133-U156. Kapillärprover har analyserats och information om ev.
diabetesdiagnos vid provtagningen finns inlagt i databasen.
Metod
Samma som tidigare: Koncentrationen glukos har analyserats hos patienterna. Analyserna har utförts
med två olika analysinstrument, HemoCue samt Gluco Sure Plus. Referensvärde: 6,3 mmol/L.
Variabler i PASW
Variabler sedan tidigare;
löpnr
glukosg
glukosh
glukh2gr
glukg2gr
glukh4gr
Nya variabler;
Två nya variabler behövs för att kunna beräkna överlevnad.
Variabeln tid avser den tid, mätt i år, som har gått sedan
proverna togs. Variabeln status avser om respektive individ
levde (=0) eller hade dött (=1) vid tidpunkten för den senaste
uppföljningen.
Din arbetsuppgift:
Lägg in följande data i din fil: Notera att lever kodas som 0
och död som 1, förklara detta i values i Variable view.
38
glukg4gr
diagnos
glukosm
Steg 12: Select cases
Syfte
Att kunna studera en del av sina mätdata för sig. Antag att du vill veta vilka individer det är som har
förhöjd glukoskoncentration, men som inte har diagnosen diabetes. Vi vill även veta vilken medelkoncentration av glukos de har.
Variabelkriterier
I detta fall behövs variablerna; löpnr, diabetes och glukosm.
Din arbetsuppgift:
Välj Data => Select Cases => Markera andra
alternativet uppifrån dvs If condition is satisfied
=> klicka på If… = ställ upp ekvationen för de
prover du vill välja. I detta fall vill vi ha de med
glukosm >6,3 mmol/L samt diagnos = 0, se bild.
Om man har glömt om frisk är 0 eller 1 så kan
man högerklicka på variabelnamnen och välja
Variable information, då ser man bland annat
hur variabeln är grupperad.
Avsluta med=> continue => OK
Resultat:
De fall som är bortvalda har markerats med strykta radnummer, det har även tillkommit en variabel
som anger om respektive prov är selekterat eller inte. För att få en lista enligt ovan – se nästa sida.
39
Din arbetsuppgift för summering:
Välj Analyze ?> Reports => Case summarizes.
Välj variabler enligt bilden.
Klicka på knappen statistics och rensa den högra
rutan genom att markera Number of cases och
klicka på pilen så att den hamnar i rutan till
vänster. => Continue
Avsluta med OK.
Resultat:
Sammanställningen erhålls i tabellform. Till
vänster ses löpnr och till höger respektive
persons medelkoncentration av glukos.
40
Steg 13: Överlevnadsanalys med Kaplan-Meier
Syfte
Att studera hur en markör t.ex. glukoskoncentrationen påverkar en grupp individers överlevnad. Här
jämförs två gruppers överlevnad. Båda grupperna har förhöjda glukoskoncentrationer, men den ena
gruppen (diabetesgruppen) har fått behandling för sjukdomen, medan den andra gruppen inte har
gjort några förändringar. Frågan är om behandlingen har gett dem en längre överlevnad.
Variabelkriterier
För att kunna göra en kaplan-meier behövs en tidsvariabel, en med status där 1= död samt den
grupperade variabeln man vill utvärdera.
Din arbetsuppgift:
Börja med att välja de fall som är Glukosm >=6,3
mmol/L, se select cases.
Välj Analyze => Survival => Kaplan Meier.
Gör följande inställningar: Välj tid och
statusvariabler. För status måste event
definieras dvs du måste tala om för datorn vilket
värde i variabeln det är som motsvarar död, gör
detta genom att klicka på Define Event => Single
value = 1 (se bild).
Välj Compare factors => Log rank
Välj Options, gör ändringar enligt bilden.
41
Resultat:
Resultatet redovisas med både tabeller
och en figur. Tabellerna visar att det
totalt ingår 16 individer, av dessa har 7
dött (events). Sig. i den nedre tabellen
visar att p-värdet är 0,271 dvs ingen av
grupperna har signifikant kortare
överlevnadstid. Man ska dock beakta
att material är litet.
Detta är ett Kaplan-Meier diagram.
1.0 vid y-axeln anger att vid tiden 0 år
efter provtagning lever 100%. För varje
lodrätt streck i diagrammet har minst
en individ avlidit. Om kurvorna följs åt
och dessutom korsar varandra så kan
man utgå från att det inte än någon
signifikant skillnad mellan grupperna.
Om hela gruppen istället analyseras
och om variabeln glukosh2gr används
som factor så erhåller vi resultatet som
syns till höger.
Nu är p-värdet 0,015 vilket innebär att
det är en statistisk skillnad mellan
grupperna. Studeras diagrammet så
framgår det tydligt att det är den gröna
kurvan, dvs de med förhöjd
glukoskoncentration som har sämst
prognos.
Ur diagrammet kan man också utläsa
att av de individer som vid testtillfället
hade förhöjd glukoskoncentration har
50% dött ca 43 år senare. (se pilen i
diagrammet)
42
Steg 14: Tips och trix som underlättar databearbetningen
Tips i Data View-fönstret
Recall recently used dialogs: Genväg till senast utförda analyser.
Goto case/variable: Sökhjälp för att hoppa till en viss rad eller kolumn/variabel.
Variables: Här finns en samlad översikt om de olika variablerna, man ser labels,
gruppindelningar mm, bra komplement till Variable View.
Insert case: Lägg in nya fall.
Insert Variable: Lägg in nya variabler.
Select case: genväg till funktionen där man selekterar/väljer/filtrerar fall.
Value Labels: pendlar mellan att visa kodningen samt vad kodningen står för t.ex. 0
och 1 alternativt frisk och diabetes.
Tips i Chartfönster
Genväg till Properties: justering av X- respektive Y-axeln.
Infoga referenslinje, på X- eller Y-axeln.
Infoga textruta i diagrammet
Infoga Y-axeln även till höger i diagrammet
Vrida diagrammet: variablerna på axlarna byter plats
Tips i Output
Gå till senaste output
43
Register
K
A
Kaplan Meier ................................................. 40
Kaplan-Meier ................................................. 45
Korrelationsanalys ......................................... 27
Korstabell ....................................... Se Crosstabs
Korstabeller.................................................... 28
Kruskall Wallis-test ....................................... 34
Kurtosis ..................................................... 12, 19
Kvartiler .......................................................... 19
Alfabetisk ordning av variabelnamn ................ 5
Att gruppera kvartiler.................................... 20
Att göra grupperingar..................................... 17
Att koda variabler ........................................... 18
Att komma igång .............................................. 5
Att lägga in data i SPSS .................................... 6
Att utföra beräkningar i SPSS ........................ 36
B
L
Beskrivande statistik ...................................... 12
Boxplot............................................................30
Boxplot med en kontinuerlig variabel............30
Boxplot med flera kontinuerliga variabler ..... 32
Boxplotens kvartiler ....................................... 31
Label ..................................................................7
Layoutmodifieringar ........................... 15, 25, 47
Lära känna data ............................................... 9
M
C
Mann Whitney U-test .................................... 33
Material ............................................................ 4
Measure...................................................... 7, 20
Medelvärde ..................................................... 12
Median ............................................................ 31
Metod ............................................................... 4
Case summaries................................................ 9
Chi-2-test ........................................................28
Compute ......................................................... 36
Crosstabs .................................................. 21, 28
Cut off ............................................................. 19
N
D
Name .................................................................7
Numeric Expression ...................................... 36
Data View...................................................... 6, 7
Decimals ........................................................... 7
Descriptives .................................................... 12
Dialog recall .................................................... 47
Display frequency table ................................... 11
O
Options............................................................. 5
Output .............................................................. 9
F
Fischers exakta test ................................. 28, 29
Frekvenstabeller .............................................. 11
Frequencies ............................................... 11, 19
Förtydligande av variabelnamn ....................... 7
P
Pearson .......................................................... 27
Projektbeskrivning 1 ........................................ 4
Projektbeskrivning 2....................................... 16
Projektbeskrivning 3...................................... 26
Projektbeskrivning 4...................................... 35
Projektbeskrivning 5 ...................................... 40
Punktdiagram .................................... Se Scatter
G
glukosm .......................................................... 36
Grupperingar ................................................. 20
R
H
Recode ....................................................... 17, 20
Histogram ....................................................... 13
Histogram – bearbetningar ........................... 15
S
I
Scatter ............................................................ 24
Scatter – bearbetningar ................................. 25
SD .................................................................... 12
Select case ...................................................... 47
Select cases............................................... 40, 42
Skewness ................................................... 12, 19
Spara en fil ....................................................... 5
Spearman ....................................................... 27
spo .................................................................... 9
Inledning till lathunden ................................... 4
Inledning till Steg 1-2 ....................................... 4
Inledning till Steg 12-13 ................................ 40
Inledning till Steg 3-4..................................... 16
Inledning till Steg 5-8..................................... 26
Inledning till Steg 9-11 ................................... 35
Insert case....................................................... 47
Insert Variable ................................................ 47
44
Variabler
glukh2gr och glukg2gr ............................... 16
glukh4gr och glukg4gr ............................... 16
glukosm ..................................................... 35
löpnr, glukosh och glukosg ......................... 4
status .......................................................... 41
tid ................................................................ 41
Variables ........................................................ 47
Width ................................................................7
Starta PASW ..................................................... 5
Summarize Cases ........................................... 22
T
Tabeller i word................................................38
Tips i Chart-fönstret ....................................... 47
Tips i Data View-fönstret ............................... 47
Tips i Output-fönstret .................................... 47
Type .................................................................. 7
Ö
V,W
Öppna en fil...................................................... 5
Överlevnadsanalys (Kaplan-Meier)......... 40, 45
Value Labels ................................................... 47
Variable View.................................................... 7
45