Simulazione 2

Download Report

Transcript Simulazione 2

` di Roma Tor Vergata
Laurea Triennale in Biotecnologie, Universita
Statistica
Anno accademico: 2013-2014. Titolare del corso: Claudio Macci
Simulazione 2
STATISTICA DESCRITTIVA.
D1) Abbiamo i seguenti dati: 12, 5, 4, 20, 30. Trovare il primo quartile.
D2) Abbiamo i seguenti dati raggruppati in classi
classi
(120, 200] (200, 400] (400, 600]
percentuali
80
10
10
Trovare la mediana.
D3) Abbiamo i seguenti dati:
xi 0 1 2 3
yi 2 3 3 1
Trovare dal retta di regressione di y rispetto a x.
`
PROBABILITA.
D4) Si lanciano due dadi equi. Calcolare la probabilit`a di ottenere due numeri uguali sapendo che
la somma dei due numeri ottenuti `e 10.
D5) Abbiamo un’urna con 4 palline bianche e 4 nere. Si estraggono a caso tre palline, una alla volta
e senza reinserimento. Calcolare la probabilit`a di ottenere al pi`
u due palline bianche.
D6) Siano X1 , . . . , X100 variabili aleatorie indipendenti e con la stessa distribuzione (i.i.d.), tutte
con media 1 e varianza 4. Calcolare P (60 < X1 + · · · + X100 < 70) con l’approssimazione normale.
D7) Sia X una variabile aleatoria con distribuzione esponenziale di parametro λ = 2. Calcolare
P (X < 3).
2
D8) Sia X una variabile aleatoria con densit`a f (x) = 25
x1(0,5) (x). Calcolare E[X].
STATISTICA INFERENZIALE.
D9) Abbiamo un campione casuale di 100 elementi estratto da una popolazione normale di media
incognita µ e varianza nota 400. La media campionaria `e 60. Trovare l’intervallo di confidenza per
µ al livello α = 0.95.
D10) Abbiamo un campione casuale di 81 elementi estratto da una popolazione normale di media
incognita µ e varianza incognita. La media campionaria `e 40 e la varianza campionaria corretta `e
324. Trovare l’intervallo di confidenza per µ al livello α = 0.99.
D11) Abbiamo un campione casuale di 100 elementi estratto da una popolazione normale di media
incognita µ e varianza nota 121. La media campionaria `e 11. Si consideri il test per l’ipotesi
H0 : µ ≥ 12 contro H1 : µ < 12 al livello α = 0.05.
D12) I dati di un campione casuale sono raggruppati come segue:
X\Y
x1
x2
y1
y2
110 90
90 110
Sottoporre a test, al livello α = 0.05, l’ipotesi di indipendenza.
1
Cenno alle soluzioni (Ogni segnalazione di errori o sviste (sempre possibili) `e gradita)
D1) Si ordinano i dati: 4, 5, 12, 20, 30. Si ha n = 5 e p = 0.25, da cui np = 1.25, che non `e intero, e
k = [np] = 1. Allora il valore richiesto `e il (k + 1)-simo, cio`e il secondo (tra quelli ordinati) che `e 5.
80
D2) La mediana `e del tipo 120 + x perch´e appartiene alla prima classe; inoltre 200−120
x = 50, da
cui segue x = 50 (con alcuni calcoli) e quindi la mediana `e 120 + 50 = 170.
2
2
2 +32
7
2
2
D3) Si ha x
¯ = 0+1+2+3
¯2 = 45 , y¯ = 2+3+3+1
= 64 = 23 , x2 = 0 +1 +2
= 14
= 94 ,
4
4
4 = 2 , sx = x − x
4
0·2+1·3+2·3+3·1
3
xy =
¯y¯ = − 8 . La retta di regressione richiesta `e y = ax + b con
= 3, sxy = xy − x
4
sxy
3
9
3 3
27
a = s2 = − 10 e b = y¯ − a¯
x = 4 + 10 2 = 54
20 = 10 .
x
1
. Si chiede P (A|B)
D4) Si ha Ω = {(i, j) : i, j ∈ {1, . . . , 6}} e ciascun punto di Ω ha probabilit`a 36
dove A = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)} e
1/36
1
B = {(4, 6), (5, 5), (6, 4)}, e quindi A ∩ B = {(5, 5)}. In conclusione P (A|B) = P P(A∩B)
(B) = 3/36 = 3 .
D5) La probabilit`
a richiesta `e P (X ≤ 2) dove X `e la v.a. che conta il numero di palline bianche
(4 )(4 )
4
13
estratte. Allora P (X ≤ 2) = 1 − P (X = 3) = 1 − 3(8 )0 = 1 − 56
= 52
56 = 14 .
3
√ √100 −100·1 < 70−100·1
√ √
< X1 +···+X
D6) Si ha P (60 < X1 +· · ·+X100 < 70) = P
Φ(−30/20)−
4 100
4 100
Φ(−40/20) = 1 − Φ(3/2) − (1 − Φ(2)) = Φ(2) − Φ(1.5) = 0.97725 − 0.93319 = 0.04406.
3
−6
D7) Si ha P (X < 3) = 0 2e−2x dx = [−e−2x ]x=3
x=0 = 1 − e .
3
5 2
5 2
2 x x=5
2
2
125
10
D8) Si ha E[X] = 0 x 25
xdx = 25
0 x dx = 25 [ 3 ]x=0 = 25 · 3 = 3 .
60−100·1
√ √
4 100
√
= 60 ± 1.96 · 2 = (56.08, 63.92).
D9) Si ha x
¯n ± z 1+α √σn = 60 ± z0.975 √400
100
2
sn
D10) Si ha x
¯n ± t 1+α (n − 1) √
= 40 ± t0.995 (81 − 1)
n
2
√
√324
81
= 40 ± 2.63870 · 2 = (34.7226, 45.2774).
n −12
√ la statistica del test, la regione critica `
D11) Detta z = x¯σ/
e del tipo z
n
10
11−12
Nel nostro caso z = √121/√100 = − 11 = −0.91 e quindi si accetta H0 .
< −z1−α = −z0.95 = −1.65.
D12) La tabella con i valori teorici (ottenuti con i totali di riga e colonna della tabella assegnata, e
che coincidono con quelli della tabella seguente) `e
X\Y
y1
y2 Totale
x1
100 100
200
x2
100 100
200
Totale 200 200
400
Sono tutti valori maggiori di 5 e quindi il test di indipendenza `e applicabile. Detta Q la statistica
del test, la regione critica `e del tipo Q > χ21−α ((r − 1)(s − 1)) = χ20.95 ((2 − 1)(2 − 1)) = 3.84146.
2
2
2
2
Nel nostro caso Q = (100−110)
+ (100−90)
+ (100−90)
+ (100−110)
=
100
100
100
100
rifiuta l’ipotesi di indipendenza.
2
100+100+100+100
100
= 4 e quindi si