Variabili Aleatorie - Dipartimento di Scienze Statistiche e Matematiche

Download Report

Transcript Variabili Aleatorie - Dipartimento di Scienze Statistiche e Matematiche

Luigi Augugliaro
Statistica 2
Esercitazioni
Dott. Luigi Augugliaro1
1
Dipartimento di Scienze Statistiche e Matematiche “S. Vianelli”,
Università di Palermo
ricevimento:
lunedı̀ ore 15-17
mercoledı̀ ore 15-17
e-mail: [email protected]
http://dssm.unipa.it/augugliaro
(Dipartimento
1 / 59
di S
Variabile aleatoria
Nello studio degli esperimenti casuali, spesso oggetto di interesse è una funzione
degli eventi aleatori.
Ad esempio, nell’esperimento casuale lancio di due dadi possiamo essere
interessati alla funzione somma dei valori ottenuti, piuttosto che sapere quale
sequenza si sia realizzata. Le funzioni definite sullo spazio campionario a valori
reali sono note come variabili aleatorie o casuali.
Definizione
Si definisce variabile aleatoria, denotata con X , una qualsiasi funzione misurabile
definita sullo spazio campionario a valori reali, formalmente
Luigi Augugliaro
X : S → R.
(Dipartimento
2 / 59
di S
Rappresentazione grafica
Luigi Augugliaro
(Dipartimento
3 / 59
di S
Se indichiamo con Ei un generico evento dello spazio campionario, la variabile
aleatoria X assumerà il valore
X (Ei ) = xi .
La relazione precedente consente di definire la probabilità sui valori assunti dalla
variabile aleatoria X , più formalmente, la probabilità che la variabile aleatoria X
assuma il valore xi è definita nel seguente modo:
P(X (Ei ) = xi ) = P(Ei ).
Notazione: Nel seguito verrà omessa la dipendenza della variabile aleatoria
dall’evento aleatorio Ei ; in questo caso la definizione precedente può essere scritta
come
P(X = xi ) = p(xi ) = P(Ei ).
Luigi Augugliaro
(Dipartimento
4 / 59
di S
Esempio. Si consideri l’esperimento casuale consistente nel lancio di tre monete
equilibrate. Se indichiamo con X il numero di teste che si ottengono, allora X è
una variabile aleatoria che può assumere i valori 0,1,2 e 3 (dominio della variabile
aleatoria).
Le probabilità associate ai valori del dominio di X sono le seguenti:
Luigi Augugliaro
P(X = 0)
= P({C , C , C }) = 1/8
P(X = 1)
= P({T , C , C } ∪ {C , T , C } ∪ {C , C , T }) = 3/8
P(X = 2)
= P({T , T , C } ∪ {T , C , T } ∪ {C , T , T }) = 3/8
P(X = 3)
= P({T , T , C } ∪ {T , C , T } ∪ {C , T , T }) = 1/8
(Dipartimento
5 / 59
di S
Esempio. Supponiamo di lanciare ripetutamente una moneta fino a quando non
appare per la prima volta la faccia testa. Se denotiamo con X il numero di lanci
necessari affinché appaia per la prima volta la faccia testa, si deduce che X
è una variabile aleatoria che assume i valori 1, 2, . . . (variabile aleatoria discreta)
con probabilità
Luigi Augugliaro
P(X = 1)
= P(T ) = 0.5
P(X = 2)
= P({C , T }) = 0.5 · 0.5 = 0.52
P(X = 3)
= P({C , C , T }) = 0.5 · 0.5 · 0.5 = 0.53
P(X = 4)
= P({C , C , C , T }) = 0.5 · 0.5 · 0.5 · 0.5 = 0.54
P(X = 5)
= P({C , C , C , C , T }) = 0.5 · 0.5 · 0.5 · 0.5 · 0.5 = 0.55
..
.
(Dipartimento
6 / 59
di S
Esempio. Si consideri un’urna contenente 5 palline nere e 3 palline bianche. Si
estraggono con reinserimento 4 palline e si indichi con X il numero di palline nere
estratte. In questo caso X è una variabile aleatoria che assume valori nell’insieme
discreto {0, 1, . . . , 4} con probabilità
x 4−x
4
5
5
P(X = x) =
1−
x
8
8
Esempio. Si consideri un’urna contenente 5 palline nere e 5 palline bianche. Si
estraggono senza reinserimento 4 palline e si indichi con X il numero di palline nere
estratte. In questo caso X è una variabile aleatoria che assume valori nell’insieme
discreto {0, 1, . . . , 4} con probabilità
5 5
Luigi Augugliaro
P(X = x) =
x
4−x
10
4
(Dipartimento
7 / 59
di S
Uno strumento fondamentale per lo studio del comportamento di una generica
variabile aleatoria è la funzione di ripartizione definita come
F (x) = P(X ≤ x).
Si dimostra che la funzione di ripartizione soddisfa le seguenti proprietà
i. F (x) è una funzione non decrescente, ovvero se x1 < x2 allora F (x1 ) ≤ F (x2 )
ii. limx→+∞ F (x) = 1
iii. limx→−∞ F (x) = 0
vi. La funzione di ripartizione è continua a destra, ovvero
Luigi Augugliaro
lim F (x) = F (x0 ).
x→x0+
(Dipartimento
8 / 59
di S
Variabili aleatorie discrete
Definizione
Sia X una variabile aleatoria e si indichi con D il suo dominio (insieme di valori
che X può assumere). Diremo che X è una variabile aleatoria discreta se D è un
insieme discreto, ovvero contiene al più un’infinità numerabile di valori.
Definizione
Si definisce funzione di distribuzione di probabilità (denotata con p(·)) la funzione
che associa ad ogni x appartenete al dominio di X la corrispondente probabilità
ovvero:
p(x) = P(X = x).
Si dimostra che ogni funzione di distribuzione di probabilità soddisfa le seguenti
proprietà:
Luigi Augugliaro
X
p(x) ≥
0
p(x)
1
=
∀ x ∈ D;
x∈D
(Dipartimento
9 / 59
di S
Quando X è una variabile aleatoria discreta, la funzione di ripartizione può essere
definita tramite la funzione di distribuzione di probabilità nel seguente modo:
X
X
F (x0 ) = P(X ≤ x0 ) =
P({X = x}) =
p(x)
x≤x0
x≤x0
Esempio. Si consideri l’esperimento casuale consistente nel lancio di tre monete
equilibrate. Se indichiamo con X il numero di teste che si ottengono, allora X è
una variabile aleatoria che può assumere i valori 0,1,2 e 3 (dominio della variabile
aleatoria). La funzione di distribuzione e di ripartizione della variabile aleatoria X
sono le seguenti:
Luigi Augugliaro
X
0
1
2
3
p(x)
F (x)
1
8
3
8
3
8
1
8
1
8
4
8
7
8
8
8
(Dipartimento
10 / 59
di S
I momenti e funzione generatrice dei momenti
Analogamente a quanto fatto per le distribuzioni di frequenza, anche per le distribuzioni di probabilità è possibile definire degli indici di sintesi
Definizione
Sia X una variabile aleatoria con dominio D. Si definisce valore atteso di X , la
quantità
X
E (X ) = µ =
x · p(x)
x∈D
Osservazione: il valore atteso può essere visto come una media aritmetica ponderata con pesi dati dalla funzione di distribuzione di probabilità.
Esempio
X p(x) F (x)
1
1
0
8
8
1
2
3
Luigi Augugliaro
3
8
3
8
1
8
4
8
7
8
8
8
1
3
3
1
E (X ) = µ = 0· +1· +2· +3· = 1.5
8
8
8
8
(Dipartimento
11 / 59
di S
Esercizio. Si consideri l’esperimento casuale lancio di un dado e si indichi con X la
variabile aleatoria che associa ad ogni faccia il valore riportato. Calcolare il valore
atteso.
Soluzione. In questo caso il dominio di X è definito come D = {1, 2, 3, 4, 5, 6}
e la funzione di distribuzione di probabilità è definita come p(x) = 1/6, ovvero
probabilità costante per ogni possibile valore di X . Si ricava che
1
1
1
1
1
1
+2· +3· +4· +5· +6·
6
6
6
6
6
6
1
= (1 + 2 + 3 + 4 + 5 + 6) · = 3.5
6
E (X ) = µ =
1·
Note: gli esempi precedenti mostrano una proprietà importante del valore atteso:
in generale µ non è un elemento del dominio di X .
Luigi Augugliaro
(Dipartimento
12 / 59
di S
Proprietà del valore atteso
Si definisce degenere una variabile aleatoria che assume un valore constante,
diciamo x0 , con probabilità 1, ovvero p(x0 ) = 1. In questo caso
E (X ) = x0 · p(x0 ) = x0 · 1 = x0
Si consideri la trasformata lineare Y = a + bX , dove a e b sono delle costanti note.
In questo caso
X
E (Y ) = E (a + bX ) =
(a + bx)p(x) =
Luigi Augugliaro
x
=
X
ap(x) +
bx p(x) = a
x∈D
x∈D
|
X
{z
=E (a)
}
|
X
x∈D
{z
=E (bX )
p(x) + b
X
xp(x) =
x∈D
}
= a + bE (X )
(Dipartimento
13 / 59
di S
Il valore atteso costituisce un caso particolare di quelli che sono noti in letteratura
come momenti.
Definizione
Sia X una variabile aleatoria discreta con dominio D. Si definisce momento teorico
di ordine r ed origine m la quantità
X
µm,r = E [(X − m)r ] =
(x − m)r · p(x).
x∈D
Quando m = µ = E (X ), allora parleremo di momento teorico centrato di ordine
r e semplificheremo la notazione con la seguente
X
(x − µ)r · p(x).
µr = E [(X − µ)r ] =
x∈D
Quando m = 0, allora parleremo di momento teorico di ordine r e semplificheremo
la notazione con la seguente
X
µ0r = E (X r ) =
x r · p(x).
Luigi Augugliaro
x∈D
(Dipartimento
14 / 59
di S
Dalla definizione si ricava che, se m = 0 ed r = 1 allora
X
µ01 = E [(X − 0)1 ] =
x · p(x) = E (X ) = µ,
x∈D
ovvero il valore atteso di X può essere definito come il momento teorico di ordine
1.
Fra i vari momenti centrati di una variabile aleatoria, quello che utilizzeremo per la
costruzione di un indice mediante il quale misurare la variabilità di X è il momento
teorico centrale di ordine 2, chiamato anche varianza e denotato con il simbolo σ 2 :
X
(x − µ)2 · p(x).
σ 2 = µ2 = E [(X − µ)2 ] =
x∈D
La radice quadrata della varianza è chiamata deviazione standard ed è denotata
σ.
Luigi Augugliaro
(Dipartimento
15 / 59
di S
Esempio
X p(x)
1
0
8
1
2
3
Luigi Augugliaro
3
8
3
8
1
8
F (x)
1
8
4
8
7
8
8
8
E (X )
=
1.5
V (X )
=
(0 − 1.5)2 ·
3
1
+ (1 − 1.5)2 · +
8
8
3
1
+(2 − 1.5)2 · + (3 − 1.5)2 · = 0.75
8
8
(Dipartimento
16 / 59
di S
La formula utilizzata per il calcolo della varianza può essere semplifica utilizzando
le proprietà del valore atteso introdotte in precedenza, ovvero:
V (X )
=
=
E [(X − µ)2 ] = E (X 2 + µ2 − 2µX ) =
E (X 2 ) + E (µ2 ) − E (2µX ).
Poiché E (X ) = µ è una costante si ricava che E (µ2 ) = µ2 ; inoltre
E (2µX ) = 2µE (X ) = 2µ · µ = 2µ2 ,
quindi, l’espressione precedente può essere scritta come
Luigi Augugliaro
V (X ) = E (X 2 ) +µ2 − 2µ2 = µ02 − µ2 .
| {z } | {z }
=µ02
=−µ2
(Dipartimento
17 / 59
di S
La precedente relazione può essere ottenuta utilizzando la formula per il calcolo
della varianza per variabili aleatorie discrete, ovvero:
Luigi Augugliaro
V (X )
= E [(X − µ)2 ] = E (X 2 + µ2 − 2µX ) =
X
=
(x 2 − µ2 − 2µx)p(x) =
x∈D
=
X
x 2 · p(x) +
x∈D
= E (X 2 ) +µ2
| {z }
=µ02
X
µ2 p(x) −
x∈D
X
p(x) −2µ
2µx · p(x) =
x∈D
X
x∈D
x∈D
| {z }
|
=1
X
x · p(x) =
{z
=E (X )=µ
}
= µ02 + µ2 − 2µ · µ =
= µ02 − µ2
(Dipartimento
18 / 59
di S
Esempio
X
0
p(x)
3
1
8
3
8
3
8
1
8
Totale
1
1
2
Luigi Augugliaro
X · p(x)
0
X 2 · p(x)
0
3
8
6
8
3
8
3
2
3
8
12
8
9
8
3
E (X )
=
V (X )
= µ02 − µ2 = 3 − 1.52 = 0.75
1.5
(Dipartimento
19 / 59
di S
Proprietà della varianza
Si consideri la trasformata Y = a + bX e la sua varianza, ovvero
V (Y ) = σY2
=
E {[Y − E (Y )]2 } = E {a + bX − [a + bE (X )]2 } =
=
E [a + bX − a − bE (X )]2 = E [bX − bE (X )]2 =
=
b 2 E [X − E (X )]2 = b 2 V (X ) = b 2 σX2
Dall’ultima equazione si ricava che
Luigi Augugliaro
σY = |b|σX .
(Dipartimento
20 / 59
di S
Sia X una variabile aleatoria e g (·) una funzione con domino contenente DX . In
questo caso l’applicazione della funzione g alla variabile aleatoria X , ovvero g (X )
definisce una nuova variabile aleatoria la quale verrà denotata con g (X ).
Il valore atteso della variabile aleatoria g (X ) è definito come
X
E [g (X )] =
g (x)p(x).
x∈DX
Note: I momento teorici di ordine r costituiscono un caso particolare della precedente espressione; i momenti teorici di ordine r si ottengono ponendo
Luigi Augugliaro
g (·) = (·)r .
(Dipartimento
21 / 59
di S
Fra le infinite possibili funzioni di variabili aleatorie, la funzione generatrice dei
momenti svolge un ruolo centrale a causa della sua relazione con i momenti teorici
di ordine r .
Definizione
Sia X una variabile aleatoria con D e si consideri la funzione g (X ) = e t·X . Si
definisce funzione generatrice dei momenti, denotata con m(t), il valore atteso
della funzione g (X ) ovvero:
X
m(t) = E (e t·X ) =
e t·x p(x)
Luigi Augugliaro
x∈D
(Dipartimento
22 / 59
di S
Si dimostra che le derivate successive della funzione generatrice dei momenti valutate nel punto t = 0 sono uguali ai momenti teorici di ordine r , ovvero
dm(0)
=
dt
d2 m(0)
=
dt 2
..
. =
dr m(0)
=
dt r
..
. =
E (X ) = µ
E (X 2 ) = µ02
..
.
E (X r ) = µ0r
..
.
In altri termini, i momenti teorici di ordine r possono essere calcolati tramite derivate
successive della funzione generatrice di momenti (valutate in t = 0).
Luigi Augugliaro
(Dipartimento
23 / 59
di S
Famiglie parametriche di distribuzioni
Molte funzioni di distribuzione di probabilità dipendono, oltre che dal valore x,
anche da uno o più quantità dette parametri della distribuzione. Per questo
motivo utilizzeremo la notazione p(x; θ) dove il parametro θ può essere:
i. scalare, in questo caso il parametro θ è una sola quantità;
ii. vettoriale, in questo caso il parametro θ è un vettore di k parametri:
θ = (θ1 , θ2 , . . . , θk )T .
L’insieme dei valori assumibili dal parametro θ è denotato con il simbolo Θ ed è
definito spazio parametrico.
Luigi Augugliaro
(Dipartimento
24 / 59
di S
Definizione
Si definisce famiglia parametrica di distribuzioni l’insieme di tutte le possibili funzioni
di distribuzioni di probabilità individuabili al variare del parametro θ nello spazio
parametrico, ovvero:
F = {p(x; θ) : θ ∈ Θ}.
Note: la relazione che esiste tra la funzione di distribuzione di probabilità p(x; θ) e
il parametro θ è di natura biunivoca, ovvero per ogni valore di θ esiste una ed una
sola distribuzione di probabilità p(x; θ) e viceversa.
Luigi Augugliaro
(Dipartimento
25 / 59
di S
Famiglie parametriche di distribuzioni per variabili aleatorie
discrete
Distribuzione uniforme discreta
Definizione
Diremo che la variabile aleatoria X , con dominio D = {1, . . . , N}, si distribuisce
come una uniforme discreta di parametro N, e scriveremo X ∼ U(N), se la
funzione di distribuzione di probabilità può essere espressa nel seguente modo:
(
1/N se x ∈ D
p(x) = p(x; N) =
0
altrimenti,
dove il parametro N è un numero intero positivo (lo spazio parametrico coincide
con l’insieme dei numeri naturali N).
Luigi Augugliaro
(Dipartimento
26 / 59
di S
Se X si distribuisce come un’uniforme discreta di parametro N, allora
E (X ) =
N +1
2
e
V (X ) =
N2 − 1
12
Dimostrazione
E (X )
=
N
X
x · p(x) =
x=1
V (X )
N
X
x·
x=1
N
1 X
1
1
=
x = (1 + 2 + · · · + N) =
N
N x=1
N
=
1 N(N + 1)
N +1
=
N
2
2
=
E (X 2 ) − E (X )2 = E (X 2 ) −
(N + 1)2
4
Notando che
E (X 2 )
=
N
X
x 2 · p(x) =
x=1
=
x=1
x2 ·
N
1
1 X 2
1
=
x = (12 + 22 + · · · + N 2 ) =
N
N x=1
N
1 N(N + 1)(2N + 1)
(N + 1)(2N + 1)
=
N
6
6
si ricava che
Luigi Augugliaro
N
X
V (X ) =
(N + 1)(2N + 1)
(N + 1)2
N2 − 1
−
=
.
6
4
12
(Dipartimento
27 / 59
di S
La variabile aleatoria uniforme discreta è associata a tutti gli esperimenti casuali i
cui esisti, denotato con N, sono equiprobabili:
lancio di una moneta (N = 2);
lancio di un dado (N = 6);
lancio di una biglia nella roulette (N = 37);
etc.
Luigi Augugliaro
(Dipartimento
28 / 59
di S
Distribuzione di Bernoulli
Definizione
Diremo che la variabile aleatoria X , con dominio D = {0, 1}, si distribuisce come una Bernoulli di parametro π (e scriveremo X ∼ Ber (π)) se la funzione di
distribuzione di probabilità può essere espressa nel seguente modo:
(
π x (1 − π)1−x se x ∈ D
p(x) = p(x; π) =
0
altrimenti.
In questo caso lo spazio parametrico Θ è uguale all’intervallo [0; 1].
Luigi Augugliaro
(Dipartimento
29 / 59
di S
Se X si distribuisce come una Bernoulli, allora
E (X ) = π
e
V (X ) = π(1 − π).
Dimostrazione
Per dimostrare le precedenti identità faremo ricorso alla funzione generatrice dei
momenti della variabile aleatoria di Bernoulli.
Determinazione della funzione generatrice dei momenti
Luigi Augugliaro
m(t) = E (e t·X )
=
1
X
e t·x p(x) =
x=0
t·0 0
= e
=
π (1 − π)
1 − π + πe
1
X
e t·x π x (1 − π)1−x =
x=0
1−0
+ e t·1 π 1 (1 − π)1−1 =
t
(Dipartimento
30 / 59
di S
Calcolo della derivata della funzione generatrice dei momenti
Dalla proprietà della funzione generatrice dei momenti si ricava che, per calcolare il valore atteso
di una variabile aleatoria distribuita secondo una Bernoulli, è necessario calcolare la derivata
prima di m(t) nel punto t = 0.
d(1 − π + πe t )
dm(t)
=
= πe t .
dt
dt
Utilizzando l’identità
dm(0)
= πe 0 = π,
dt
si ricava che E (X ) = π. Per calcolare la varianza di X , utilizziamo le identità
E (X ) =
Poiché
V (X )
=
E (X 2 ) − E (X )2 = E (X 2 ) − π 2
E (X 2 )
=
d2 m(0)
.
dt 2
d2 m(t)
dπe t
=
= πe t ,
dt 2
dt
si ricava che
E (X 2 ) = πe 0 = π,
quindi
Luigi Augugliaro
V (X ) = π − π 2 = π(1 − π).
(Dipartimento
31 / 59
di S
I precedenti risultati possono essere ottenuti ricorrendo alle definizione di E (X ) e
V (X ), ovvero:
Luigi Augugliaro
E (X )
=
0 · p(0; π) + 1 · p(1; π) = p(1; π) = π 1 (1 − π)1−1 = π
V (X )
=
E (X 2 ) − E (X )2 = E (X 2 ) − π 2 =
=
02 · p(0; π) + 12 · p(1; π) − π 2 =
=
p(1; π) − π 2 = π − π 2 = π(1 − π)
(Dipartimento
32 / 59
di S
La variabile aleatoria di Bernoulli è associata a quelle che sono note come “prove
di Beronulli”, ovvero esperimenti casuali con 2 soli possibili esiti: “successo” ed
“insuccesso”. La variabile aleatoria di Bernoulli associa valore 1 all’evento successo
e valore 0 all’evento insuccesso. In questo caso il parametro π soddisfa le seguenti
indentità
P({successo}) = p(1) = π 1 (1 − π)1−1 = π
ovvero il parametro π è uguale alla probabilità dell’evento successo.
Esempi di prove di Bernoulli sono
i. il lancio di una moneta;
ii. l’estrazione di una pallina da un’urna contenente palline di due colori diversi;
iii. etc.
Luigi Augugliaro
(Dipartimento
33 / 59
di S
Distribuzione Binomiale
Definizione
Diremo che la variabile aleatoria X , con dominio D = {0, 1, . . . , N}, si distribuisce
come una Binomiale di parametri N e π (e scriveremo X ∼ Bin(N, π)) se la funzione
di distribuzione di probabilità può essere espressa nel seguente modo:
( N
x
N−x
se x ∈ D
x π (1 − π)
p(x) = p(x; N, π) =
0
altrimenti.
In questo caso lo spazio parametrico è definito nel seguente modo Θ = N × [0, 1].
Se X si distribuisce secondo una Binomiale di parametri N e π, allora
E (X ) = Nπ
e
V (X ) = Nπ(1 − π).
Note: la variabile aleatoria di Bernoulli è un caso particolare della variabile Binomiale ottenuta quanto il parametro N è uguale ad uno.
Luigi Augugliaro
(Dipartimento
34 / 59
di S
Per dimostrare che E (X ) = Nπ e che V (X ) = Nπ(1 − π) utilizzeremo la funzione generatrice dei
momenti.
Step 1: definizione della funzione generatrice dei momenti.
Dalla definizione di funzione generatrice dei momenti si ricava che
m(t) = E (e tX )
=
N
X
x=0
=
e tx
N N X
N tx x
e π (1 − π)N−x =
π x (1 − π)N−x =
x
x
x=0
N X
N
N X
N
x=0
x=0
( e t π )x (1 − π )N−x =
x |{z} | {z }
a
b
x
ax b N−x
La precedente espressione può essere semplificando ricordando la formula dello sviluppo del binomio
di Newton, ovvero:
N X
N x N−x
(a + b)N =
a b
,
x
x=0
da cui si ricava che la funzione generatrice dei momenti di una variabile aleatoria Binomiale è
definita nel seguente modo:
Luigi Augugliaro
m(t) = (a + b)N = (e t π + 1 − π)N .
(Dipartimento
35 / 59
di S
Step 2: calcolo delle derivate della funzione generatrice dei momenti.
dm(t)
dt
d2 m(t)
dt 2
Luigi Augugliaro
= Nπe t (e t π + 1 − π)N−1 ,
= N(N − 1)(e t π + 1 − π)N−2 (πe t )2 + Nπe t (e t π + 1 − π)N−1 .
(Dipartimento
36 / 59
di S
Step 3: calcolo dei momenti teorici di ordine 1 e 2.
I momenti teorici di ordine 1 (valore atteso) e di ordine 2 vengono ricavati dalle
precedenti definizione ponendo uguale a zero la variabile t:
dm(0)
dt
= Nπe 0 (e 0 π + 1 − π)N−1 = Nπ · 1(1 · π + 1 − π)N−1 =
= Nπ1N−1 = Nπ = µ01
d2 m(0)
dt 2
= N(N − 1)(e 0 π + 1 − π)N−2 (πe 0 )2 + Nπe 0 (e 0 π + 1 − π)N−1 =
= N(N − 1)π 2 + Nπ = N 2 π 2 − Nπ 2 + Nπ
=
= N 2 π 2 + Nπ(1 − π) = µ02
Step 4: calcolo del valore atteso e della varianza.
Il valore atteso e la varianza della variabile aleatoria Binomiale si ricavano
utilizzando le seguenti identità:
E (X )
V (X )
Luigi Augugliaro
dm(0)
= µ01 = Nπ
dt
= µ02 − µ2 = N 2 π 2 + Nπ(1 − π) − (Nπ)2 = Nπ(1 − π).
=
(Dipartimento
37 / 59
di S
Legame con la variabile aleatoria di Bernoulli
La variabile aleatoria Binomiale deriva dalla replicazione dell’esperimento di Bernoulli. Formalmente: si consideriamo N prove di Bernoulli indipendenti ed identicamente distribuite tali che la probabilità dell’evento successo sia sempre uguale
a π. Denotata con Xi la variabile aleatoria associata all’i-esima prova di Bernoulli,
allora la variabile aleatoria definita come
X = X1 + X2 + . . . + XN =
N
X
Xi = numero di successi su N prove
i=1
si distribuisce secondo una Binomiale di parametri N e π.
Luigi Augugliaro
(Dipartimento
38 / 59
di S
Esempio: la roulette è un gioco d’azzardo di origine italiana introdotto in Francia
nel XVIII secolo consistente in un disco diviso in 37 settori numerati da 0 a 36.
Supponendo che il croupier lanci 10 palline consecutivamente, calcolare:
i. la probabilità che 3 palline cadano in un settore riportante un valore compreso
tra 0 e 10, estremi compresi;
ii. la probabilità che al più 2 palline cadano in un settore riportante un valore
compreso tra 10 e 20, estremi compresi;
Luigi Augugliaro
(Dipartimento
39 / 59
di S
Soluzione
Sulla base della descrizione precedente di ricava che la variabile aleatoria X si distribuisce come
una binomiale con parametro n = 10, ovvero il numero di lanci.
i) Dalla descrizione dell’esperimento casuale si ricava che il parametro p della distribuzione di
probabilità della variabile aleatoria binomiale è uguale alla probabilità che una pallina cadano in
un settore riportante un valore compreso tra 0 e 10, estremi compresi, quindi, utilizzando la
definizione classica di probabilità, si ricava
p=
11
≈ 0, 30,
37
da cui si ricava che
10
· 0, 3x · 0, 710−x .
x
Sulla base del risultato precedente si ricava che
10
10!
P(X = 3) =
· 0, 33 · 0, 77 =
· 0, 33 · 0, 77
3
3!7!
10 · 9 · 8 · 7!
=
· 0, 33 · 0, 77 = 120 · 0, 33 · 0, 77 = 0, 27
3!7!
Luigi Augugliaro
P(X = x) =
(Dipartimento
40 / 59
di S
ii) Dalla descrizione dell’esperimento casuale si ricava che siamo interessati al calcolo della
seguente probabilità
P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2).
In questo caso il parametro p è uguale alla probabilità che una pallina cada in un settore
riportante un valore compreso tra 10 e 20, estremi compresi, quindi, mediante la definizione
classica di probabilità si ricava
11
≈ 0, 30,
p=
37
da cui si ricava che
10
P(X = 0) =
· 0, 30 · 0, 710 = 0, 710 ≈ 0, 03;
0
10
P(X = 1) =
· 0, 31 · 0, 79 = 10 · 0, 31 · 0, 79 ≈ 0, 12;
1
10
P(X = 2) =
· 0, 32 · 0, 78 = 45 · 0, 32 · 0, 78 ≈ 0, 23;
2
Sulla base dei risultati precedenti si ricava che
Luigi Augugliaro
P(X ≤ 2) = 0, 03 + 0, 12 + 0, 27 = 0, 38.
(Dipartimento
41 / 59
di S
Esempio: si consideri un mazzo di 52 carte e l’esperimento casuale consistente
nell’estrarre con reinserimento 10 carte. Sulla base della descrizione dell’esperimento
il candidato calcoli la probabilità che:
(a) delle 10 carte estratte 2 siano di cuori;
(b) delle 10 carte estratte almeno 2 siano di cuori;
(c) delle 10 carte estratte al più 2 siano di cuori.
Luigi Augugliaro
(Dipartimento
42 / 59
di S
Soluzione:sulla base della descrizione precedente di ricava che la variabile aleatoria X si distribuisce
come una binomiale con parametri n = 10, ovvero il numero di carte estratte con reinserimento,
e p = 1/4, ovvero la probabilità di estrarre una carta di cuori. Quindi
P(X = x) =
10
· 0, 25x · 0, 7510−x .
x
(a)
P(X = 2)
=
=
10
10!
· 0, 252 · 0, 758 =
· 0, 252 · 0, 758
2!8!
2
10 · 9 · 8!
· 0, 252 · 0, 758 = 45 · 0, 252 · 0, 758 = 0, 28
2!8!
(b)
Luigi Augugliaro
P(X ≥ 2)
=
1 − P(X ≤ 1) = 1 − (P(X = 0) + P(X = 1))
(Dipartimento
43 / 59
di S
Dato che
P(X = 0)
=
P(X = 1)
=
=
10
· 0, 250 · 0, 7510 = 0, 7510 ≈ 0, 06
0
10
10 · 9!
· 0, 251 · 0, 759
· 0, 251 · 0, 759 =
1! · 9!
1
10 · 0, 251 · 0, 759 ≈ 0.19
si ricava che
P(X ≥ 2) ≈ 1 − P(X ≤ 1) = 1 − (0, 06 + 0, 19) = 0, 75.
(c)
Luigi Augugliaro
P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2) ≈ 0, 06 + 0, 19 + 0, 28 = 0, 53
(Dipartimento
44 / 59
di S
Distribuzione Ipergeometrica
Definizione
Diremo che la variabile aleatoria X , con dominio D = {0, 1, . . . , n}, si distribuisce
come una Ipergeometrica di parametri M ∈ N, K (interro non negativo minore o
uguale a M) e n (intero positivo minore o uguale a M) (e scriveremo che X ∼
H(M, K , n) se la funzione di distribuzione di probabilità può essere espressa nel
seguente modo:
 K M−K
 ( x )( n−x ) se x ∈ D
(Mn )
p(x) = p(x; M, K , n) =
0
altrimenti.
Se X si distribuisce secondo una Ipergeometrica di parametri M, K , n allora:
Luigi Augugliaro
E (X ) = n
K
M
V (X ) = n
K M −K M −n
M M M −1
(Dipartimento
45 / 59
di S
La variabile aleatoria Ipergeometrica è associata ad esperimenti simili a quelli utilizzati per definire la variabile aleatoria Binomiale; si dispone di un insieme iniziale
(urna, mazzo di carte, etc) contenete M elementi diversi. L’insieme è diviso in
due sottogruppi (palline bianche/nere, carte di cuori/non cuori, assi/non assi, etc)
di numerosità K (il primo gruppo) ed M − K (il secondo gruppo). Se si estrae
senza reinserimento (in blocco) un campione di n elementi dall’insieme iniziale, la
funzione di distribuzione di probabilità della variabile ipergeometrica consente di
calcolare la probabilità che nel campione vi siano esattamente x elementi del primo
gruppo.
Luigi Augugliaro
(Dipartimento
46 / 59
di S
Esempio. Per assemblare un sistema elettrico, si prendono a caso 6 componenti
da un cassetto contenente 20 componenti usati. Il sistema montato funziona solo
se tra i 6 componenti estratti, quelli guasti non sono di più di 2. Se nel cassetto
vi sono 15 componenti funzionanti e 5 guasti, qual è la probabilità che il sistema
funzioni?
Luigi Augugliaro
(Dipartimento
47 / 59
di S
Soluzione. Per poter calcolare la probabilità richiesta è necessario identificare i
valori dei parametri che specificano la distribuzione ipergeometrica, ovvero M, K ed
n.
Dalla descrizione dell’esperimento casuale si deduce che l’insieme iniziale (cassetto),
da cui vengono estratti senza reinserimento gli elementi (componenti del sistema),
contiene M = 20 elementi i quali vengono distinti in due gruppi: funzionanti e
non funzionanti. Se indichiamo con X il numero di elementi guasti presenti nel
campione di numerosità n = 6 si deduce che il primo gruppo (gli elementi guasti) ha numerosità K = 5 mentre il secondo gruppo (gli elementi funzionanti) ha
numerosità M − K = 15.
Dato che il sistema funziona se vengono estratti al più 2 elementi difettosi, si ricava
che la probabilità richiesta può essere calcolata nel seguente modo
Luigi Augugliaro
P(X ≤ 2)
=
=
P(X = 0) + P(X = 1) + P(X = 2) =
5 15
5 15
5 15
0
6 +
20
6
1
5 +
20
6
2
4
20
6
≈ 0.8687.
(Dipartimento
48 / 59
di S
Esercizio. Un’urna contiene 15 palline di cui 3 palline bianche, 5 nere e 7 rosse. Calcolare la probabilità che un campione casuale di 3 palline estratte senza
reinserimento contenga:
i. tutte palline bianche;
ii. almeno una pallina ossa;
iii. almeno due palline nere.
Esercizio. Sei persone vengono estratte a caso da un gruppo costituito da 12
uomini e 8 donne. Calcolare la probabilità che il il gruppo selezionato contenga:
i. solamente un uomo;
ii. solamente una donna;
iii. un ugual numero di uomini e donne.
Luigi Augugliaro
(Dipartimento
49 / 59
di S
Distribuzione di Poisson
Definizione
Diremo che la variabile aleatoria X , con dominio D = {0, 1, . . .}, si distribuisce come
una Poisson di parametro λ (e scriveremo X ∼ P(λ)) se la funzione di distribuzione
di probabilità può essere espressa nel seguente modo:
( x −λ
λ e
se x ∈ D
x!
p(x) = p(x; λ) =
0
altrimenti.
In questo caso lo spazio parametrico è costituito da tutti i possibili valori reali
strettamente maggiori di zero (λ ≥ 0).
Se X si distribuisce secondo una Poisson di parametro λ, allora
Luigi Augugliaro
E (X ) = λ
e
V (X ) = λ
(Dipartimento
50 / 59
di S
Per dimostrare le precedenti identità, faremo ricorso alla funzione generatrice dei momenti di una
variabile aleatoria di Poisson.
Dalla definizione di funzione generatrice dei momenti si ricava che:
m(t)
=
E (e t·X ) =
+∞
X
e t·x p(x; λ) =
x=0
=
e −λ
+∞
X
x=0
(λe t )x
x!
+∞
X
x=0
e t·x
λx e −λ
=
x!
.
Ponendo λe t = k, la precedente espressione può essere riscritta come
m(t) = e −λ
+∞
X
x=0
kx
.
x!
L’espressione precedente può essere semplificata ricordando che, tramite lo sviluppo in serie di
Taylor della funzione esponenziale nel punto 0, è verificata l’identità
ek =
+∞
X
x=0
kx
,
x!
e quindi possiamo ricavare la formula della funzione generatrice dei momenti della variabile
aleatoria di Poisson:
t
m(t) = e −λ e k = e k−λ = e λe −λ .
Luigi Augugliaro
(Dipartimento
51 / 59
di S
Per calcolare E (X ), determiniamo la derivata prima di m(t) = e λe
utilizziamo l’identità E (X ) = dm(0)/dt.
t
−λ
e poi
Applicando le regole di derivazione delle funzioni composte si ricava:
t
t
t
t
dm(t)
de λe −λ
d(λe t − λ)
=
= e λe −λ ·
= e λe −λ λe t = λe λe −λ e t ,
dt
dt
dt
quindi
Luigi Augugliaro
λ·1−λ=0
=1
z }| { z}|{
0
dm(0)
E (X ) =
= λ e| λe{z− λ} e 0 = λ · 1 · 1 = λ.
dt
e 0 =1
(Dipartimento
52 / 59
di S
Per determinare la variance di X utilizziamo l’identità V (X ) = E (X 2 ) − E (X )2 , e quindi
utilizziamo il metodo della funzione generatrice dei momenti per determinare E (X )2 tramite
l’identità
d2 m(t)
E (X 2 ) =
.
dt 2
Per calcolare la derivata seconda della funzione generatrice dei momenti osserviamo che la
derivata prima può essere scritta come
t
dm(t)
= λ e λe −λ e t = λ · m(t) · e t ,
| {z }
dt
=m(t)
quindi la derivata seconda può essere calcolata tramite la la regola di derivazione del di funzioni,
ovvero:
Luigi Augugliaro
d2 m(t)
dt 2
=
=
=
=
d dm(t)
d(λ · m(t) · e t )
=
=
dt
dt
dt
dm(t) t
de t
dm(t) t
λ
e + m(t)
=λ
e + m(t)e t =
dt
dt
dt
dm(t)
t
λ
+ m(t) e = λ λm(t)e t + m(t) e t =
dt
λ(λe t + 1)m(t)e t = λ(λe t + 1)e λe
t
−λ t
e .
(Dipartimento
53 / 59
di S
Dal risultato precedente si ricava che
E (X 2 ) =
0
d2 m(0)
= λ(λe 0 + 1)e λe −λ e 0 = λ(λ + 1) = λ2 + λ.
dt 2
e quindi
Luigi Augugliaro
V (X ) = E (X 2 ) − E (X )2 = λ2 + λ − λ2 = λ.
(Dipartimento
54 / 59
di S
Distribuzione geometrica
Definizione
Diremo che la variabile aleatoria X , con dominio D = {0, 1, . . .}, si distribuisce come una
Geometrica (o Pascal) di parametro π ∈ (0, 1] (e scriveremo X ∼ G (π)) se la funzione di
distribuzione di probabilità può essere espressa nel seguente modo:
(
π(1 − π)x se x ∈ D
p(x) = p(x; λ) =
0
altrimenti.
In questo caso lo spazio parametrico è costituito da tutti i valori compresi nell’intervallo
(0, 1].
Se X è distribuita come una variabile aleatoria geometrica di parametro π, si dimostra che
E (X ) =
1−π
π
e
V (X ) =
1−π
.
π2
Osservazione
La variabile aleatoria di Pascal è strettamente legata ad una successione di prove di Bernoulli stocasticamente indipendenti dove il parametro π è la probabilità che si verifichi l’evento successo in una generica prova. Formalmente x rappresenta il numero di insuccessi
osservati prima di ottenere il primo successo.
Luigi Augugliaro
(Dipartimento
55 / 59
di S
Per dimostrare le precedenti identità faremo ricorso alla funzione generatrice dei momenti della
variabile aleatoria di Pascal.
Dalla definizione di funzione generatrice dei momenti si ricava che:
m(t)
=
E (e t·X ) =
+∞
X
e t·x p(x; π) =
x=0
+∞
X
e t·x π(1 − π)x = π
x=0
+∞
X
[(1 − π)e t ]x .
x=0
Ponendo k = (1 − π)e t , la precedente espressione può essere riscritta come
m(t) = π
+∞
X
kx
x=0
L’espressione precedente può essere semplificata ricordando che, tramite lo sviluppo in serie di
Taylor della funzione f (x) = (1 − x)−1 nel punto 0, è verificata l’identità:
+∞
X
k x = (1 − k)−1
x=0
da cui si ricava
Luigi Augugliaro
m(t) =
π
.
1 − (1 − π)e t
(Dipartimento
56 / 59
di S
Per calcolare E (X ), determiniamo la derivata prima di m(t) = π(1−(1−π)e t )−1 e poi utilizziamo
l’identità E (X ) = dm(0)/dt.
Applicando le usuali regole di derivazione si ricava:
dm(t)
dt
=
=
dπ(1 − (1 − π)e t )−1
d(1 − (1 − π)e t )−1
=π
dt
dt
t
t −2 d(1 − (1 − π)e )
−π(1 − (1 − π)e )
dt
|
{z
}
=−(1−π)e t
=
π)e t
π(1 −
.
(1 − (1 − π)e t )2
Dal precedente risultato si ricava che:
Luigi Augugliaro
E (X ) =
dm(0)
π(1 − π)e 0
π(1 − π)
1−π
=
=
=
.
dt
(1 − (1 − π)e 0 )2
π2
π
(Dipartimento
57 / 59
di S
Per calcolare la varianza utilizziamo le relazioni
V (X ) = E (X 2 ) − E (X )2
d2 m(t)
dt 2
Luigi Augugliaro
e
E (X 2 ) =
d π(1 − π)e t (1 − (1 − π)e t )−2
=
dt
d2 m(0)
.
dt 2
d e t (1 − (1 − π)e t )−2
= π(1 − π)
=

 de t
d(1 − (1 − π)e t )−2

π(1 − π) 
·(1 − (1 − π)e t )−2 + e t
 dt
dt
|{z}
|
{z
}
=e t
=
π(1 − π)e t
=
dt



=

=2(1−π)e t (1−(1−π)e t )−3
1
2(1 − π)e t
.
+
(1 − (1 − π)e t )2
(1 − (1 − π)e t )3
(Dipartimento
58 / 59
di S
Dal precedente risultato si ricava
E (X 2 )
=
=
=
1
2(1 − π)e 0
+
(1 − (1 − π)e 0 )2
(1 − (1 − π)e 0 )3
1
2(1 − π)
π(1 − π)
2(1 − π)
π(1 − π)
+
=
1
+
=
π2
π3
π2
π
(1 − π) π + 2 − 2π
(1 − π)(2 − π)
=
π
π
π2
π(1 − π)e 0
quindi
Luigi Augugliaro
V (X )
=
=
(1 − π)(2 − π)
(1 − π)2
−
=
π2
π2
2
2
(2 + π − 3π) − (1 + π − 2π)
1−π
=
π2
π2
(Dipartimento
59 / 59
di S