Transcript 14/02/14

Esame di Metodi Statistici \ Probabilità, distribuzioni e regressione multipla 14.02.14
COGNOME ___________NOME ____________Matr. ________Firma_____________
Barrare le caselle corrispondenti:
□ Prof. De Martini
□ Prof. Pasquazzi
□ Prof.ssa Greselin
□ II° parziale MS: es: 3 e 4, T: b
□ II° parziale MS: es: 3 e 4, T: b
□ Metodi Stat. 8cfu: tutto
□ Metodi Stat. 8cfu: tutto
□ PDRM 4,5/6cfu es: 1, 2 e 3
□ PDRM 4,5/5cfu: es: 1, 2 e 3
□ PDRM 4,5/5cfu: es: 1, 2 e 3
Attenzione: Il presente foglio deve essere compilato immediatamente alla consegna. Deve inoltre essere
riconsegnato alla fine dell’esame. Lo studente deve fornire i diversi passaggi dei calcoli eseguiti e i
commenti richiesti. E' vietato l'uso di calcolatrici programmabili o con funzione di agenda elettronica.
TEORIA:
1) Domanda di teoria.
2) Domanda di teoria.
ESERCIZI:
1) Uno studio medico ha rilevato su un campione di 100 pazienti (con età compresa tra 30 e 70 anni) la
pressione sanguigna X1 (espressa in mmhg), l’età X2 (in anni), il numero medio di ore di attività fisica
in una settimana X3 ed il numero medio giornaliero di ore di sonno X4. Di seguito è riportata la
matrice di varianze e covarianze ricavata dai dati.
Cov(Xi, Xj)
X1
X2
X3
X4
X1
363,64
237,76
-24,04
-0,88
X2
X3
X4
253,74
-18,60
-1,54
3,17
0,54
1,10
Medie
140,83
45,08
3,44
6,96
a) Si determinino e si commentino i parametri del piano ai minimi quadrati che spiega il valore della
pressione sanguigna X1 in funzione dell’età X2 e del numero medio di ore di attività fisica X3.
b) Si valuti la bontà di adattamento del piano ottenuto al punto a).
c) Si calcoli il coefficiente di correlazione parziale r12.3 e lo si confronti con il corrispettivo
coefficiente di correlazione grezzo.
d) Si valuti il miglioramento in termini di varianza spiegata nel passaggio dal piano descritto al punto
a) all’iperpiano ottenuto aggiungendo la variabile esplicativa X4 sapendo che r14.3 = 0,347 e
r24.3 = 0,172. Si commenti il risultato ottenuto.
CONTINUA SUL RETRO
2) Sia data la seguente funzione:
3
=
2
0
−1
1
0≤
<0
≥
<
a) Si ricavi il valore del parametro k che rende F(x) una funzione di ripartizione per una v.c. continua
X.
b) Si ricavi la funzione di densità di X e se ne tracci il grafico.
c) Si ricavi il valore di X che viene superato con probabilità pari a 0,75.
d) Si ricavi la funzione generatrice dei momenti di X e da essa si ricavi il valore della funzione
generatrice dei momenti di
Y =
3
+ 2X
4
.
3) Al fine di valutare l’interesse per le notizie presenti su un blog, un’indagine tiene conto del numero X
di accessi effettuati in un’ora. Si assuma che X sia una variabile casuale di Poisson con varianza pari a
7.
a) Si valuti la probabilità che in mezz’ora vi siano più di 3 accessi al blog.
b) Si calcoli la probabilità che passino più di 10 minuti senza accessi.
In un’altra indagine sono stati selezionati 5 siti internet per i quali le frequenze d’accesso possono
essere ritenute variabili casuali indipendenti e identicamente distribuite alla variabile casuale X.
c) Si calcoli la probabilità che 3 dei siti osservati ricevano 4 accessi in mezz’ora.
d) Sapendo che almeno 2 siti hanno ricevuto 4 accessi in mezz’ora, si calcoli la probabilità che solo
un altro sito abbia ricevuto 4 accessi in mezz’ora.
4) E’ noto che il peso X (in gr) di una confezione di pasta in uscita da un macchinario segue la legge
normale con valore atteso e scarto quadratico medio entrambi ignoti.
a) Supponendo che = 6gr, si determini il numero di confezioni di pasta che occorre esaminare
affinché la probabilità che la media campionaria si discosti da per più di 1gr sia pari a 0,01.
I pesi
rilevati in un campione di
quantità di sintesi:
∑
= 30 confezioni di pasta hanno dato luogo alle seguenti
= 14.999,8,
∑
%
= 7.500.907.
b) Si calcoli una stima per la varianza % basata su uno stimatore corretto.
c) Si calcoli l’intervallo di confidenza al 99% per .
Esame di Metodi Statistici \ Probabilità, distribuzioni e regressione multipla 14.02.14
COGNOME ___________NOME ____________Matr. ________Firma_____________
Barrare le caselle corrispondenti:
□ Prof. De Martini
□ Prof. Pasquazzi
□ Prof.ssa Greselin
□ II° parziale MS: es: 3 e 4, T: b
□ II° parziale MS: es: 3 e 4, T: b
□ Metodi Stat. 8cfu: tutto
□ Metodi Stat. 8cfu: tutto
□ PDRM 4,5/6cfu es: 1, 2 e 3
□ PDRM 4,5/5cfu: es: 1, 2 e 3
□ PDRM 4,5/5cfu: es: 1, 2 e 3
Attenzione: Il presente foglio deve essere compilato immediatamente alla consegna. Deve inoltre essere
riconsegnato alla fine dell’esame. Lo studente deve fornire i diversi passaggi dei calcoli eseguiti e i
commenti richiesti. E' vietato l'uso di calcolatrici programmabili o con funzione di agenda elettronica.
TEORIA:
1) Domanda di teoria.
2) Domanda di teoria.
ESERCIZI:
1) Le seguenti tabelle riportano alcune quantità di sintesi riguardo agli ultimi 10 progetti finanziati da un
venture capitalist. Le variabili prese in considerazione per ciascun progetto sono:
X1 = importo finanziato (in milioni di Euro)
X2 = durata prevista del finanziamento al momento della concessione (in mesi)
X3 = punteggio attribuito al progetto in fase di valutazione prima di concedere il finanziamento (il
punteggio è compreso tra 1 e 100)
Variabile X1
X2
X3
Media 1,33 22,40 68,90
Scarto quadratico medio 0,52 11,73 18,73
Coefficienti di correlazione lineare:
rij
X1
X2
X3
X1
1,000
0,348
0,589
X2
X3
1,000
0,227
1,000
a) Si ricavino i parametri del piano ai minimi quadrati che spiega l’importo finanziato X1 in funzione
della durata prevista X2 e del punteggio X3.
b) Si valuti la bontà d’adattamento del piano mediante un indice opportuno e si commenti il valore
dell’indice utilizzato.
c) Si calcolino i parametri della retta ai minimi quadrati che spiega l’importo finanziato X1 in
funzione del punteggio X3. Si confronti il coefficiente angolare della retta con il corrispondente
coefficiente di regressione parziale del piano ricavato al punto a).
d) Si valuti il miglioramento della bontà d’adattamento ai dati nel passaggio dalla retta del punto c) al
piano del punto a) comparando l’ordine di grandezza dei residui.
CONTINUA SUL RETRO
2) Il 10% delle lampadine vendute da un’azienda proviene dal lotto di produzione A, il 40% dal lotto di
produzione B ed il restante 50% dal lotto di produzione C. E’ noto che le percentuali di pezzi
difettosi nei tre lotti sono rispettivamente pari al 5%, 3% ed all’1%.
a) Si calcoli la probabilità che una lampadina scelta a caso tra quelle vendute dall’azienda sia
difettosa.
b) Sapendo che la lampadina scelta è difettosa, qual è la probabilità che provenga dal lotto A?
c) Si calcoli la probabilità che tra 5 lampadine scelte a caso ve ne siano al più 2 provenienti dal lotto
A.
d) Si calcoli la probabilità che tra 50 lampadine scelte a caso ve ne siano al più 20 provenienti dal
lotto A.
3) E’ noto che la durata di un determinato tipo di Hard Disk per Server segue la legge esponenziale con
media pari a 8 anni.
a) Calcolare la probabilità che un Hard Disk abbia una durata superiore a 10 anni.
b) Sapendo che un Hard Disk è già in funzione da 10 anni, qual è la probabilità che rimanga in
funzione per almeno altri 10 anni?
c) Calcolare la durata minima raggiunta dal 90% degli Hard Disk.
d) Qual è la legge di probabilità della variabile casuale che descrive la durata complessiva di due
Hard Disk? Si scriva l’espressione formale della funzione di densità e si motivi.
4)
Un addetto al controllo della qualità ha esaminato un campione di 1000 chiavette USB in uscita da
un processo produttivo. 34 delle chiavette USB esaminate sono difettose. Sia p l’ignota percentuale
di chiavette USB difettose prodotte dal processo.
a) Calcolare l’intervallo di confidenza al 99% per l’ignoto valore di p. Si commenti il significato
dell’intervallo ottenuto.
b) Sfruttando l’informazione campionaria, si determini la numerosità campionaria necessaria
affinché l’ampiezza dell’intervallo di confidenza del punto a) sia inferiore a 0,01.
c) Quante chiavette USB bisognerebbe esaminare per essere certi che l’ampiezza dell’intervallo di
confidenza del punto a) sia inferiore a 0,01?