Transcript scarica qui
FORMULARIO DI STATISTICA PROF. ANGELA MONTANARI 1. Notazione j n i k g G ni Ni fi Fi wi hi xi−1 — xi x̂i indica indica indica indica indica indica indica indica indica indica indica indica indica indica la generica unità statistica il numero di unità statistiche osservate la generica modalità di un carattere il numero di modalità di un carattere il generico gruppo il numero di gruppi la frequenza assoluta della modalità i-esima la frequenza assoluta cumulata della modalità i-esima la frequenza relativa della modalità i-esima la frequenza relativa cumulata della modalità i-esima l’ampiezza della classe i-esima la densità di frequenza della classe i-esima la generica modalità di un carattere espresso secondo modalità intervallare il valore centrale della classe xi−1 —xi 2. Valori medi • Mediana di un carattere X espresso in modalità intervallare mc = xi−1 + n 2 − Ni−1 (xi − xi−1 ) ni dove ? xi−1 è l’estremo inferiore della classe mediana ? (xi − xi−1 ) è l’ampiezza della classe mediana ? ni è la numerosità della classe mediana ? Ni−1 è la frequenza cumulata della classe che precede la classe mediana. • Media aritmetica di un carattere X per un protocollo Pn j=1 xj x̄ = n • Media aritmetica di un carattere X per una distribuzione di frequenza Pk k X i=1 xi ni x̄ = = xi f i n i=1 • Media aritmetica di un carattere X espresso in modalità intervallare Pk k x̂i ni X x̄ = i=1 = x̂i fi n i=1 3. Proprietà della media aritmetica Pn (1) Identità di somma: j=1 xj = nx̄ (2) Nullità della somma algebrica degli scarti dalla media aritmetica: 1 Pn j=1 (xj − x̄) = 0 2 PROF. ANGELA MONTANARI (3) Minimo della somma del quadrato degli scarti dalla media aritmetica: Pn j=1 (xj − x̄)2 = min (4) Associatività: x̄ = G X x̄g ng = n g=1 x̄1 n1 + . . . + x̄G nG n (5) Equivarianza rispetto a traslazioni e a cambiamenti di scala: x∗j = a + bxj x̄∗ = a + bx̄ ⇒ 4. Misure di variabilità • Range: xmax − xmin • Intervallo interquartile: q3 − q1 • Devianza di un carattere X per un protocollo n n X X Dev(X) = (xj − x̄)2 = x2j − nx̄2 j=1 j=1 • Varianza di un carattere X per un protocollo Dev(X) n • Scarto Quadratico Medio di un carattere X per un protocollo p SQM (X) = sx = V ar(X) V ar(X) = s2x = • Devianza di un carattere X per una distribuzione di frequenza Dev(X) = k X 2 (xi − x̄) ni = i=1 k X xi 2 ni − nx̄2 i=1 • Varianza di un carattere X per una distribuzione di frequenza k V ar(X) = s2x k k k X X 1X 1X 2 = (xi − x̄)2 ni = xi ni − x̄2 = (xi − x̄)2 fi = x2i fi − x̄2 n i=1 n i=1 i=1 i=1 • Scarto Quadratico Medio di un carattere X per una distribuzione di frequenza v v v v u k u k u k u k u1X uX u1X uX SQM (X) = sx = t xi 2 fi − x̄2 (xi − x̄)2 ni = t xi 2 ni − x̄2 = t (xi − x̄)2 fi = t n i=1 n i=1 i=1 i=1 • Devianza di un carattere X espresso in modalità intervallare Dev(X) = k k X X (x̂i − x̄)2 ni = x̂2i ni − nx̄2 i=1 i=1 • Varianza di un carattere X espresso in modalità intervallare k V ar(X) = s2x = k k k X X 1X 2 1X (x̂i − x̄)2 ni = x̂i ni − x̄2 = (x̂i − x̄)2 fi = x̂2i fi − x̄2 n i=1 n i=1 i=1 i=1 • Scarto Quadratico Medio di un carattere X espresso in modalità intervallare v v v v u k u k u k u k u1X u1X uX uX t t t 2 SQM (X) = sx = (x̂i − x̄)2 ni = x̂i ni − x̄2 = (x̂i − x̄)2 fi = t x̂2i fi − x̄2 n i=1 n i=1 i=1 i=1 • Coefficiente di Variazione CV = sx x̄ FORMULARIO DI STATISTICA 3 5. Scomposizione della Devianza • Scomposizione della Devianza di Y in Devianza Entro e Tra i gruppi per una distribuzione di frequenza doppia: u X v X Dev(Y )EN T RO = (yih − ȳh )2 nih Dev(Y )T RA = Dev(Y ) = i=1 h=1 v X (ȳh − ȳ)2 n0h h=1 u X v X (yih − ȳ)2 nih = Dev(Y )EN T RO + Dev(Y )T RA i=1 h=1 6. Misure di associazione • ChiQuadro χ2 = u X v X (nih − n∗ih )2 n∗ih i=1 h=1 • Tchuprov s T = χ2 p n (u − 1)(v − 1) • Eta Quadro η2 = • Codevianza Dev(Y )T RA Dev(Y ) n n X X Codev(X, Y ) = (xj − x̄)(yj − ȳ) = xj yj − nx̄ȳ j=1 j=1 • Covarianza Pn Covar(X, Y ) = sxy = j=1 (xj − x̄)(yj − ȳ) = n Pn j=1 xj y j n − x̄ȳ • Coefficiente di correlazione lineare Codev(X, Y ) sxy r=p = sx sy Dev(X)Dev(Y ) • Coefficiente di regressione lineare e intercetta Codev(X, Y ) sxy sy b1 = = 2 =r Dev(X) sx sx b0 = ȳ − b1 x̄ • Scomposizione della Devianza di Y in Devianza di Regressione e Devianza di Dispersione per un modello di regressione lineare n X Dev(Y )REGR = (yj∗ − ȳ)2 = b21 Dev(X) Dev(Y )DISP = j=1 n X j=1 (yj − yj∗ )2 = n X e2j j=1 Dev(Y ) = Dev(Y )REGR + Dev(Y )DISP • Indice di determinazione lineare Dev(Y )DISP Dev(Y )REG R2 = =1− = r2 Dev(Y ) Dev(Y )