(Test parametrici)

Download Report

Transcript (Test parametrici)

Unità 7

Test parametrici

Test t di Student

Analisi della varianza ad una via

Confronti multipli

1

TEST

t

DI STUDENT

In medicina capita spesso di volere confrontare i valori di una variabile casuale continua misurati su due campioni non molto numerosi.

Esempio:  si vogliono confrontare i valori di colesterolo su un gruppo di individui prima e dopo una particolare dieta;  si vogliono confrontare due terapie diverse a partire da due campioni.

In questi casi viene spesso impiegato (

anche erroneamente

) il

test t di Student

.

Esso è di fatto è il più classico (ed abusato) test di tipo parametrico .

2

Il test

t

di Student si può impiegare per confrontare le medie di due campioni, quando

si può in primo luogo supporre che la variabile casuale che si vorrà analizzare sia distribuita in maniera gaussiana

.

In particolare il test segue procedimenti di calcolo differenti a seconda che si analizzino due campioni di dati appaiati (ad esempio rilevazioni ante-post) o due campioni di dati indipendenti e quindi anche di diversa numerosità.

3

Test t di Student per dati appaiati

Si ipotizzi che e che

y 1

,

y 2

,

x 1

, ….,

x 2

,

y n

….,

x n

siano le osservazioni del gruppo 1 siano le corrispondenti osservazioni nel gruppo 2, di modo che ciascuna osservazione alla corrispondente osservazione

y i

.

x i

sia appaiata (Esempio stesso campione prima e dopo la terapia).

Si calcolino le differenze

d i

=

x i

y i

con

i

= 1,2, ….,n.

PREMESSE:

1.

I valori d

i

sono distribuiti in modo gaussiano

(non è indispensabile che i valori originali seguano la distribuzione normale);

2.

le varie d

i

sono indipendenti l’una dall’altra

.

4

CALCOLO:

 si calcoli la media differenze

d i

; m e la deviazione standard s delle  si calcoli l’ errore standard della media

ES

s

/

n

;   il valore scelto il

t

è calcolato come livello di

t

m ES

significatività α , 

m n

;

s

l’ipotesi nulla potrà essere rifiutata con calcolato con p< α (differenza significativa) se il l’equazione precedente supererà in

valore

t

assoluto

quello indicato nella tabella del corrispondenza a

n

–1 gradi di libertà .

t

di Student in La seguente per

Tabella 1

riporta i valori critici del t di Student

test monodirezionale

e

bidirezionale

.

5

Tabella 1 – Valori critici della distribuzione t di Student per un test bilaterale o monolaterale

(area nelle due code) (area in una coda)

.

N.B. Si noti che, quando il numero dei gradi di libertà (e quindi la numerosità delle osservazioni) aumenta, i valori critici di

t

tendono a quelli corrispondenti della curva di Gauss standardizzata.

6

ESERCIZIO 1:

La tabella sotto riporta i valori di temperatura corporea in °C misurati su 6 pazienti al momento della somministrazione di un presunto antitermico e tre ore dopo. Valutare gli effetti del farmaco utilizzando il test

t

di Student bidirezionale.

m

= 0,92 °C s = 0,393 °C

t

 0 , 92 0 , 393 6  5 , 74 7

Dalla Tabella 1 con 5 gradi di con libertà il valore critico tabellare α = 0,01 è (

per il test bidirezionale

)

t

0,01 = 4,032

.

Quindi, essendo il

t

calcolato uguale a

5,74

, le differenze fra prima e dopo la somministrazione del farmaco sono significative con p<0,01.

8

ESERCIZIO 2:

La tabella sotto riporta i valori di VEMS (volume espiratorio massimo nel primo secondo) in litri misurata su un gruppo di 5 asmatici prima e dopo un broncodilatatore. Valutare gli effetti del farmaco usando il test

t

di Student bidirezionale.

m

= – 0,8 / 5= – 0,16 litri s = 0,114 litri

t

  0 , 16 0 , 114 5   3 , 14 Dalla Tabella 1 con 4 gradi di libertà i valori critici tabellari sono (

per il test bidirezionale

)

t

0,05 =2,776 e

t

0,02 =3,747 e quindi 0,02 < p < 0,05.

9

Esercizio 2 risolto usando il software GraphPad

10

11

12

Test t di Student per campioni indipendenti

Si voglia verificare popolazioni, stimate mediante due campioni indipendenti numerosità

n

1 e

n

2 l’ipotesi nulla che le medie di due di , siano uguali.

PREMESSE:

1.

I dati seguono in modo accettabile una distribuzione normale; 2.

i dati sono indipendenti; 3.

le deviazioni standard per le due popolazioni sono uguali

(in generale diciamo che il rapporto tra la deviazione standard maggiore e quella minore non

è maggiore di 2). 13

CALCOLO:

 si calcolino le medie

m

1 e

m

2 dei due campioni;  si calcolino le deviazioni standard campioni;

s

1 e

s

2  il valore

t

è calcolato come : dei due

t

m

1 

m

2 (

n

1  1 )

n s

2 1 1  

n

2 (

n

 2 2  1 )

s

2 2

n n

1 1 

n

2

n

2  scelto il livello di essere rifiutata con significatività α , p< α l’ipotesi nulla potrà (differenza significativa) se il

t

calcolato con l’equazione precedente supererà in

valore assoluto

Tabella 1) quello indicato nella tabella del in corrispondenza a

t

di Student (ancora

n

1 +

n

2 –2 gradi di libertà .

14

ESERCIZIO 1:

La tabella a lato riporta i valori di pressione arteriosa sistolica in un campione di 7 individui ipertesi trattati con un farmaco antipertensivo e quelli misurati in un gruppo di controllo.

Valutare gli effetti del farmaco utilizzando il test

t

di Student bidirezionale.

t

 152 , 1  177 , 5 6   9 , 512  2 7   6 5   9 , 354  2  2 7  6 7  6   4 , 83 15

Dalla Tabella 1 con 11 gradi di con libertà il valore critico tabellare α = 0,001 è (

per il test bidirezionale

)

t

0,001 = 4,437.

Quindi, essendo il t calcolato uguale a – 4,83, si può rifiutare l’ipotesi nulla (uguaglianza delle medie) con p<0,001.

16

Esercizio risolto con GraphPad

17

18

ANALISI DELLA VARIANZA

Il concetto di fonti di variabilità

Il valore misurato di una grandezza può variare per diverse cause.

Esempi di queste cause possono essere:  gli individui in cui la grandezza viene misurata individuale); (variabilità   i tempi in cui viene effettuata la misura (variabilità temporale); le sollecitazioni a cui la grandezza farmaco); è sottoposta (ad esempio un  gli strumenti con cui viene effettuata la misura.

Nell’analisi della varianza vengono prese in considerazione una o più

fonti di variabilità principale

da testare contro quella che, di volta in volta, viene considerata la

fonte di variabilità residua

.

Si calcola la varianza delle fonti di variabilità principale e la si divide per la varianza della fonte residua.

Questo rapporto si chiama F

.

19

ANALISI DELLA VARIANZA A UNA VIA

Un caso particolare varianza a una via.

dell’analisi della varianza è l’analisi della In questo caso

principale si considera una sola fonte di

, mentre tutte le altre fonti di

variabilità

variabilità sono considerate come fonti residue.

Un classico confrontare esempio si più trattamenti: ha quando si vogliono i campioni A, B, C e D sono stati sottoposti a trattamenti diversi e si vuole verificare se i risultati ottenuti con i diversi trattamenti non differiscono fra loro (ipotesi nulla) o almeno uno dei trattamenti differisce dagli altri (ipotesi alternativa).

20

L’analisi della varianza a una via può essere vista quindi come una generalizzazione del test t di Student per campioni indipendenti a più di due gruppi.

Essa parte quindi da test

t

premesse analoghe

di Student per campioni indipendenti.

a quelle fatte per il L'ipotesi alla base dell'analisi della varianza è che dati sia possibile scomporre la varianza in due componenti:

l

gruppi,  

varianza interna ai gruppi

(anche detta “

within

”);

varianza tra i gruppi

(“

between

”).

La ragione che spinge a compiere tale distinzione è la convinzione, da parte del ricercatore, che determinati fenomeni trovino spiegazione in caratteristiche proprie del gruppo di appartenenza.

21

CALCOLO:

Indicati con

l

il numero dei campioni presi in esame (ad esempio gruppi rispettivamente a diverso trattamento), con

m

i

e

n

i

la media e il numero di osservazioni del campione i-esimo e con

m

complessivo di osservazioni e

n

la media generale ed il numero , il procedimento relativo all’analisi della varianza ad un via può essere riassunto nei seguenti passi:

1.

si calcola la devianza fra gruppi definita come

B

 

l

1

n i

(

m i

m

) 2

2.

si calcola quindi la varianza fra i gruppi data da

V

l B

 1 22

3.

indicati con calcola la devianza

x i d i

gli elementi del campione i-esimo, si del gruppo i-esimo come

d i

  1

n i

(

x i

m i

) 2

4.

si calcola la devianza entro i gruppi

W

 

l

1

d i

(

D

=

B

+

W

sarà la devianza totale)

5.

si calcola la varianza entro i gruppi  

n W

l

23

6.

il rapporto F è dato da

F

V

7.

di

F

si distribuisce seguendo la

distribuzione F con l – 1 gradi libertà per il numeratore e n l per il denominatore

. I valori critici di questa distribuzione corrispondenti al 95 ° e ad 99° percentile sono riportati rispettivamente in Tabella 2 e Tabella 3.

Se il valore di

F

calcolato supera il valore tabulare di

F

corrispondente al 95 ° percentile si può rifiutare l’ipotesi nulla con probabilità di errore inferiore al 5% (e quindi almeno uno dei trattamenti ha fornito un risultato diverso dagli altri con p<0,05).

Se il valore calcolato di corrispondente al

F

supera anche il valore tabulare 99 ° percentile , la probabilità di errore connessa al rigetto dell’ipotesi nulla sarà inferiore all’1% .

24

Distribuzione F

(Fisher-Snedecor) 25

Tabella 2

- Rapporto

F

: 95 ° percentile.

26

Tabella 3

- Rapporto

F

: 99 ° percentile.

27

ESERCIZIO 1:

In un esperimento sull’inibizione della crescita dei tumori nel topo mediante trattamenti con due preparati (A e B) si sono ottenuti i pesi di tumori dopo una settimana dal trapianto in tre gruppi di 7, 4, 5 topini tenuti rispettivamente come controllo, sotto trattamento A e sotto trattamento B.

Sulla risultati base dei ottenuti, mostrati in tabella, si valuti l’efficacia dei trattamenti utilizzando l’analisi della varianza ad una via.

28

Soluzione

Gruppo di controllo: Gruppo trattato con A: Gruppo trattato con B: media = 34,71 cg media = 24,0 cg media = 35,60 cg dev. std.

dev. std.

= 9,759 cg = 6,272 cg dev. std.

= 6,189 cg Devianza fra gruppi = 370,8 cg 2 gradi di libertà = 2

Varianza tra gruppi = 185,4 cg 2

Devianza entro gruppi = 842,6 cg 2 gradi di libertà = 13

Varianza entro gruppi = 64,82 cg 2

Devianza totale = 1213 cg 2

F = 185,4 / 64,82 = 2,86

a cui corrisponde

p = 0,09346

29

30

N.B.

Anche utilizzando la Tabella 2 si giunge alla conclusione che le differenze non sono significative e che, con i dati a disposizione, non si può affermare che l’uno o l’altro dei due preparati anticancerosi sia efficace.

Infatti il rapporto F ottenuto (2,86) è minore di quello in Tabella 2 con 2 e 13 gradi di libertà al livello del 5% (3,81).

31

ESERCIZIO 2:

Le ciambelle assorbono della quantità variabili di grassi a seconda modalità di cottura. È stato condotto un esperimento che prevede l’utilizzo di tre tipi di grassi: olio di semi di arachide, olio di mais e strutto. I dati relativi alla statistica descrittiva sono riportati in tabella sotto.

L’olio di semi di arachide e l’olio di mais sono grassi insaturi, mentre lo strutto è un grasso saturo. Si determini se la quantità di grassi assorbita dipende dal tipo di grasso utilizzato.

32

Soluzione

Devianza tra gruppi  6  ( 72  73 ) 2  6  ( 85  73 ) 2  6  ( 62  73 ) 2  1596

g

2 Devianza entro gruppi  5  ( 13 , 34 ) 2  5  ( 7 , 77 ) 2  5  ( 8 , 22 ) 2  1529

g

2 33

CONFRONTI MULTIPLI

Avendo impiegato avere fissato

α

l’analisi della varianza ad una via dopo = 0,05, un valore calcolato del rapporto

F

superiore al 95 ° percentile indica che

almeno un gruppo

si differenzia dagli altri con

p

< 0,05.

Se si vuole sapere fare

test t multipli quanti e quali

siano diversi si possono fra le varie coppie di campioni.

Per tenere conto del fatto che si stanno facendo confronti multipli, correzioni al livello di si applicheranno significatività.

opportune

Un semplice metodo, ad hoc, consiste

correzione di Bonferroni

.

nell’applicare la 34

N.B.

Tale correzione viene, in generale, utilizzata quando è necessario eseguire molti test di ipotesi con lo stesso database.

ciascuno con Infatti, eseguendo un gran numero di test,

α

= 0,05, alcuni test forniranno un risultato positivo anche in assenza di qualunque effetto reale.

IMPORTANTE test L’uso della correzione di Bonferroni porta a

più conservativi

rispetto a quelli che tengono sotto controllo l’errore relativo ad ogni singolo controllo (ossia

si possono non evidenziare differenze significative anche se le differenze sono presenti

).

Esistono altri test

meno conservativi

, basati su altro tipo di considerazioni, per effettuare confronti multipli dopo avere eseguito un’analisi della varianza ad un via (per esempio, il metodo di

Tukey

, di

Duncan

, di

Student-Newmann-Keuls

).

35

L’idea alla base della correzione di Bonferroni è che, se si esegue un

numero di test di significatività pari a c

, per ottenere un livello complessivo di errore di Tipo I pari ad semplicemente dichiarare che ciascun test

α

, si deve sarà significativo se il valore ottenuto di

p

sarà minore di

α / c

.

Esempio.

Avendo prefissato

α

=

0,05

, se si vogliono verificare

5

ipotesi in un solo esperimento (diciamo 5 diversi trattamenti contro un controllo), non si accetterà un risultato come significativo se il valore di

p

nei vari test non è minore di

0,01

.

Questo modo di procedere non è esente da critiche, trattandosi di un aggiustamento molto grossolano.

Anche se la correzione di Bonferroni porta ad un test molto conservativo, essa

può essere un utile invito alla cautela e a smorzare gli entusiasmi, quando si esegue un gran numero di test!

36

Osservazione

La correzione di Bonferroni è un’approssimazione della correzione di Sidak . Con la correzione di Sidak la formula da impiegare effettuando

c

confronti è la seguente: 

t

 1  ( 1   ) 1

c

dove

α t

avere un è il valore da utilizzare in ogni test di confronto livello complessivo di errore di Tipo I pari a

α

.

se si vuole Se α « 1 si può ritenere valida la seguente approssimazione del primo ordine ( ≈ )   1  ( 1  

t

)

c

 1  ( 1 

c

 

t

 ....) 

c

 

t

da cui si ottiene la correzione di Bonferroni 

t

 

c

37

Esempio 1:

calcolo diretto (da

α

a

α t

)

Esempio 2:

calcolo inverso (da

α t

a

α

) Nelle seguenti diapositive sono riportati alcuni esempi di calcolo della uno o probabilità (

valutata secondo Sidak

) che più test forniscano un valore di p < 0,05 quando si eseguono confronti multipli.

Il calcolo è fatto utilizzando il software “ GraphPad ”.

38

39

40

41