Transcript scarica qui

FORMULARIO DI STATISTICA
PROF. ANGELA MONTANARI
1. Notazione
j
n
i
k
g
G
ni
Ni
fi
Fi
wi
hi
xi−1 — xi
x̂i
indica
indica
indica
indica
indica
indica
indica
indica
indica
indica
indica
indica
indica
indica
la generica unità statistica
il numero di unità statistiche osservate
la generica modalità di un carattere
il numero di modalità di un carattere
il generico gruppo
il numero di gruppi
la frequenza assoluta della modalità i-esima
la frequenza assoluta cumulata della modalità i-esima
la frequenza relativa della modalità i-esima
la frequenza relativa cumulata della modalità i-esima
l’ampiezza della classe i-esima
la densità di frequenza della classe i-esima
la generica modalità di un carattere espresso secondo modalità intervallare
il valore centrale della classe xi−1 —xi
2. Valori medi
• Mediana di un carattere X espresso in modalità intervallare
mc = xi−1 +
n
2
− Ni−1
(xi − xi−1 )
ni
dove
? xi−1 è l’estremo inferiore della classe mediana
? (xi − xi−1 ) è l’ampiezza della classe mediana
? ni è la numerosità della classe mediana
? Ni−1 è la frequenza cumulata della classe che precede la classe mediana.
• Media aritmetica di un carattere X per un protocollo
Pn
j=1 xj
x̄ =
n
• Media aritmetica di un carattere X per una distribuzione di frequenza
Pk
k
X
i=1 xi ni
x̄ =
=
xi f i
n
i=1
• Media aritmetica di un carattere X espresso in modalità intervallare
Pk
k
x̂i ni X
x̄ = i=1
=
x̂i fi
n
i=1
3. Proprietà della media aritmetica
Pn
(1) Identità di somma: j=1 xj = nx̄
(2) Nullità della somma algebrica degli scarti dalla media aritmetica:
1
Pn
j=1 (xj
− x̄) = 0
2
PROF. ANGELA MONTANARI
(3) Minimo della somma del quadrato degli scarti dalla media aritmetica:
Pn
j=1 (xj
− x̄)2 = min
(4) Associatività:
x̄ =
G
X
x̄g ng
=
n
g=1
x̄1 n1 + . . . + x̄G nG
n
(5) Equivarianza rispetto a traslazioni e a cambiamenti di scala:
x∗j = a + bxj
x̄∗ = a + bx̄
⇒
4. Misure di variabilità
• Range: xmax − xmin
• Intervallo interquartile: q3 − q1
• Devianza di un carattere X per un protocollo
n
n
X
X
Dev(X) =
(xj − x̄)2 =
x2j − nx̄2
j=1
j=1
• Varianza di un carattere X per un protocollo
Dev(X)
n
• Scarto Quadratico Medio di un carattere X per un protocollo
p
SQM (X) = sx = V ar(X)
V ar(X) = s2x =
• Devianza di un carattere X per una distribuzione di frequenza
Dev(X) =
k
X
2
(xi − x̄) ni =
i=1
k
X
xi 2 ni − nx̄2
i=1
• Varianza di un carattere X per una distribuzione di frequenza
k
V ar(X) =
s2x
k
k
k
X
X
1X
1X 2
=
(xi − x̄)2 ni =
xi ni − x̄2 =
(xi − x̄)2 fi =
x2i fi − x̄2
n i=1
n i=1
i=1
i=1
• Scarto Quadratico Medio di un carattere X per una distribuzione di frequenza
v
v
v
v
u k
u k
u k
u k
u1X
uX
u1X
uX
SQM (X) = sx = t
xi 2 fi − x̄2
(xi − x̄)2 ni = t
xi 2 ni − x̄2 = t (xi − x̄)2 fi = t
n i=1
n i=1
i=1
i=1
• Devianza di un carattere X espresso in modalità intervallare
Dev(X) =
k
k
X
X
(x̂i − x̄)2 ni =
x̂2i ni − nx̄2
i=1
i=1
• Varianza di un carattere X espresso in modalità intervallare
k
V ar(X) = s2x =
k
k
k
X
X
1X 2
1X
(x̂i − x̄)2 ni =
x̂i ni − x̄2 =
(x̂i − x̄)2 fi =
x̂2i fi − x̄2
n i=1
n i=1
i=1
i=1
• Scarto Quadratico Medio di un carattere X espresso in modalità intervallare
v
v
v
v
u k
u k
u k
u k
u1X
u1X
uX
uX
t
t
t
2
SQM (X) = sx =
(x̂i − x̄)2 ni =
x̂i ni − x̄2 =
(x̂i − x̄)2 fi = t
x̂2i fi − x̄2
n i=1
n i=1
i=1
i=1
• Coefficiente di Variazione
CV =
sx
x̄
FORMULARIO DI STATISTICA
3
5. Scomposizione della Devianza
• Scomposizione della Devianza di Y in Devianza Entro e Tra i gruppi per una distribuzione di
frequenza doppia:
u X
v
X
Dev(Y )EN T RO =
(yih − ȳh )2 nih
Dev(Y )T RA =
Dev(Y ) =
i=1 h=1
v
X
(ȳh − ȳ)2 n0h
h=1
u X
v
X
(yih − ȳ)2 nih = Dev(Y )EN T RO + Dev(Y )T RA
i=1 h=1
6. Misure di associazione
• ChiQuadro
χ2 =
u X
v
X
(nih − n∗ih )2
n∗ih
i=1 h=1
• Tchuprov
s
T =
χ2
p
n (u − 1)(v − 1)
• Eta Quadro
η2 =
• Codevianza
Dev(Y )T RA
Dev(Y )
n
n
X
X
Codev(X, Y ) =
(xj − x̄)(yj − ȳ) =
xj yj − nx̄ȳ
j=1
j=1
• Covarianza
Pn
Covar(X, Y ) = sxy =
j=1 (xj
− x̄)(yj − ȳ)
=
n
Pn
j=1
xj y j
n
− x̄ȳ
• Coefficiente di correlazione lineare
Codev(X, Y )
sxy
r=p
=
sx sy
Dev(X)Dev(Y )
• Coefficiente di regressione lineare e intercetta
Codev(X, Y )
sxy
sy
b1 =
= 2 =r
Dev(X)
sx
sx
b0 = ȳ − b1 x̄
• Scomposizione della Devianza di Y in Devianza di Regressione e Devianza di Dispersione per un
modello di regressione lineare
n
X
Dev(Y )REGR =
(yj∗ − ȳ)2 = b21 Dev(X)
Dev(Y )DISP =
j=1
n
X
j=1
(yj −
yj∗ )2
=
n
X
e2j
j=1
Dev(Y ) = Dev(Y )REGR + Dev(Y )DISP
• Indice di determinazione lineare
Dev(Y )DISP
Dev(Y )REG
R2 =
=1−
= r2
Dev(Y )
Dev(Y )