1453120539-La distribuzione normale

Download Report

Transcript 1453120539-La distribuzione normale

La distribuzione normale
La distribuzione normale
• Oltre le distribuzioni di frequenza relative a un numero finito di
casi si possono utilizzare distribuzioni con un numero di casi
infinitamente grande
• Misurazioni di una stessa grandezza variano tra loro ma le
differenze tra misure e indice di riferimento (x) più sono elevate
e meno sono frequenti
• Se distribuiamo per classi le misurazioni di una stessa
grandezza l’istogramma che ne deriva è rappresentato da curve
continue esprimibili attraverso equazioni matematiche
• La distribuzione normale è una di queste curve
La distribuzione normale
• Oltre le distribuzioni di frequenza relative a un numero finito di
casi si possono utilizzare distribuzioni con un numero di casi
infinitamente grande
• Misurazioni di una stessa grandezza variano tra loro ma le
differenze tra misure e indice di riferimento (x) più sono elevate
e meno sono frequenti
• Se distribuiamo per classi le misurazioni di una stessa
grandezza l’istogramma che ne deriva è rappresentato da curve
continue esprimibili attraverso equazioni matematiche
• La distribuzione normale è una di queste curve
La forma della curva normale
• L’area di ogni rettangolo rappresenta la proporzione di casi che
cade nella classe
• L’area compresa sotto la curva continua all’interno di ogni
classe data può essere uguagliata all’area del rettangolo
corrispondente
• Con l’aumentare del numero dei rettangoli la somma delle aree
dei rettangoli stessi si avvicina sempre di più all’area sottesa
alla curva continua completa
• Considerato che la somma delle aree dei rettangoli corrisponde
a una unità questo sarà vero anche per l’area sottesa alla curva
continua costruita
Caratteristiche della curva normale
• L’ascissa del punto di massimo è pari alla media (μ) e coincide
con mediana e moda
• L’ordinata del punto di massimo varia al variare di DS (σ)
• È asintotica all’asse x( quanto più ci si allontana dalla media
tanto più la curva si avvicina all’asse x
• È simmetrica rispetto alla retta parallela all’asse y e passante
per l’ascissa del punto massimo
• L’area racchiusa dalla curva è =1
• L’area racchiusa dalla curva, dall’asse x e dalle due ordinate in
corrispondenza di due punti x1 e x2 dà la percentuale di casi
compresi nell’intervallo (x1, x2), posta l’area sottesa alla curva
pari a 100
Le aree sottese alla curva normale
• Spesso è necessario determinare la proporzione di casi
che ricadono entro un dato intervallo
Proprietà della curva normale
l’area sottesa alla porzione di curva che vi è tra le media
e una ordinata posta a una distanza data, determinata in
termini di unità di deviazione standard, è costante
Importanza della deviazione standard
• Se le osservazioni seguono una distribuzione normale
l’intervallo compreso tra
(x  1 DS) include circa il 68% delle osservazioni
(x

2 DS) include circa il 95% delle osservazioni
(x  3 DS) include circa il 99% delle osservazioni
σ è uno dei due parametri ( con x /μ) che caratterizza la
distribuzione normale (Gaussiana)
Si consideri ad esempio che la statura media di una popolazione di
sesso maschile e di età adulta sia di 170 cm. con deviazione
standard di 10 cm.
• La legge di Gauss mi dice che il 95% circa di questa
popolazione avrà una statura compresa entro i limiti
170  20, cioè 150 e 190 cm.
• Ne deriva che nel 5% della stessa popolazione la statura
sarà inferiore o superiore a tali limiti
• Essendo la curva simmetrica si avrà il 2,5% della
popolazione avrà una statura inferiore a 150 cm. e il
2,5% avrà una statura superiore a 190 cm.
Curve normali
• La posizione nel piano della curva normale e la sua forma
dipendono dalla media (μ) e dalla DS ( σ)
• Ognuno di questi parametri può assumere infiniti valori,
esistono nel piano infinite curve normali
• Al variare della media (parametro di posizione)la curva trasla (si
sposta nel piano parallelamente a se stessa lungo l’asse x,
conservando la stessa forma)
• Al variare di σ (parametro di dispersione) la curva cambia
forma: si appiattisce se σ cresce e si restringe quando σ
decresce
Standardizzazione della curva normale
• Non è necessario che le distanze dalla media siano
sempre multipli esatti della deviazione standard
• E’ sempre possibile determinare l’area sottesa alla
porzione di curva delimitata da due ordinate
• È possibile trasformare ogni curva normale in modo da
permettere di calcolare il numero di casi sottostante ogni
porzione della curva mediante l’uso di una tabella
Distribuzione gaussiana standardizzata
• Per agevolare il ricercatore la variabile x viene trasformata in una
nuova variabile Z

xx
z
s
• Mentre la distribuzione di X è normale con media X
e D.S., quella della nuova variabile è normale con media 0 e
D.S. 1
• La distribuzione standardizzata presenta il vantaggio di consentire la
predisposizione di tabelle che permettono di calcolare porzioni di
area della distribuzione e di stabilire la probabilità statistica di
riscontrate valori in relazione a determinati valori Z
Curva standardizzata
quale proporzione di casi ricade nell’intervallo 50 e 65?
• Una distribuzione normale,
media 0 e D.S 1 viene
indicata come curva
standardizzata e Z è il valore
standardizzato
• Una Z di valore 1,5 indica
che la distanza tra l’ordinata
è a 1,5 D.S. dalla media
• Esistono tabelle che
riportano per tutti le ordinate
della curva standardizzata
qual è la proporzione di area
sottesa

xx
z
s
65  50
z
 1,5
10
Utilizzo della tavola normale
• I valori di z sono riportati nella prima colonna a sinistra e
nella riga posta in alto
• Le prime due cifre di z si leggono sulla colonna, l’ultima
sulla prima riga.
• I vari numeri riportati nella tabella individuano la
proporzione dell’area che è sottesa alla curva delimitate
da un lato dalla media e dall’altro dall’ordinata z
Esempio precedente
uno z di valore 1,5 indica che l’ordinata è a 1,5 D.S.
dalla media
l’area delimitata dai punti (z=1,5) è 0,4332
Aree sottese alla curva normale
Z
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,0 0000 0040
0,1 0398 0438
0,2 0793 0832
......................
................
1,0 3413 3438
1,1 3643 3665
..........................
...................
1,5 4332 4345
.....................
1,9 4713 4719
2,0 4773
4778
..........
................
2,5 4938 4940
...............
........
0080
0478
0871
0120
0517
0910
0159
0557
0948
0199
0596
0987
0239
0636
1026
0279
0675
1064
0319 0359
0714 0753
1103 1141
3461
3686
3485
3718
3508
3729
3531
3749
3554
3770
3577
3790
3599 3621
3810 3830
4357
4370
4382 4394
4406
4418
4430
4726
4783
4732
4788
4738 4744
4793 4798
4750
4803
4756
4808
4761 4767.........
4812 4817
4941
4943
4945 4946
4948
4949
4951
4441
4952
Utilizzo della tavola normale
• Data una distribuzione con X=168 e D.S.=12
• Trovare la proporzione di casi inferiori o uguali (≤ )a 143
143  168
25
z

 2,08
12
12
143
168
Utilizzo della tavola normale
• Nella tabella normale si legge che l’area compresa tra la media e
uno
z = 2,08 è di 0,4812
• Considerata la simmetria della curva l’area a destra della media
deve essere = 0,5
• L’area tratteggiata si ottiene sottraendo il valore trovato sulla tabella
dal totale dell’area alla sinistra della media
• (percentuale di casi ≤ 143)= 0,5000 – 0,4812 = 0,0188
• Meno del 2% dei casi hanno un valore minore o uguale a 143