Tentamen i Statistisk inferensteori 15 mars 2013, kl. 9

Download Report

Transcript Tentamen i Statistisk inferensteori 15 mars 2013, kl. 9

STOCKHOLMS UNIVERSITET
MATEMATISKA INSTITUTIONEN
Avd. Matematisk statistik
MT 5003
TENTAMEN
15 mars 2013
Tentamen i Statistisk inferensteori
15 mars 2013, kl. 9-14
Martin Sköld, tel. 16 45 62, [email protected].
Miniräknare. Formelsamling på tentamens sista sidor.
Återlämning: Meddelas på kurshemsida och via e-post.
Examinator:
Tillåtna hjälpmedel:
Resonemang skall vara tydliga och lätta att följa. Eventuella regularitetsvillkor
kan antas vara uppfyllda och begöver ej speciceras närmare. Varje korrekt och
fullständigt löst uppgift ger 10 poäng. För betyg A-E krävs 25 poäng på Del 1
sammanräknat med eventuella bonuspoäng, samt att följande gränser uppnås
på Del 2:
A
25
B
19
C
13
D
7
E
0
Del 1
Rayleigh-fördelningen används bland annat för att modellera vindhastigheter
och svarar mot en uppdelning av vinden i två ortogonala riktningskomponenter
som är normalfördelade med väntevärde 0 och samma varians.
Låt x = (x1 , . . . , xn ) vara en realisering av X = (X1 , . . . , Xn ), en vektor av
n oberoende Rayleigh(θ)-fördelade stokastiska variabler.
Uppgift 1
a) Visa att familjen av fördelningar för X , θ > 0, utgör en exponentialfamilj.
b) Bestäm moment- (baserat på första momentet x¯) och maximum-likelihood
skattarna av θ.
c) Avgör om skattarna i b) är tillräckliga (sucient) för θ.
Uppgift 2
a) Bestäm Fisherinformationen I(θ) i X .
b) Bestäm apriorifördelningen för θ enligt Jereys princip (Jerey's prior) och
visa att motsvarande aposteriorifördelning är en invers Gammafördelning.
Uppgift 3
a) Bestäm den asymptotiska fördelningen för ML-skattaren.
b) Antag att n = 100, vilket kan anses tillräckligt stort för att asymptotiska
resultat gäller med god noggrannhet. Testa hypotesen H0 : θ = 1 mot
1
H1 : θ 6= 1 på nivån 5% med lämpligt (valfritt) asymptotiskt test givet att
θˆ = 1.3.
c) Bestäm den asymptotiska fördelningen för moment-skattaren.
Del 2
Uppgift 4
Livslängden i timmar hos en typ av elektroniska komponenter kan antas beskrivas av en stokastisk variabel X . Komponenterna inspekteras dagligen och
byts ut då de är trasiga. För att skatta p = P (X > 24), sannolikheten att en
nyinstallerad komponent överlever till nästa inspektion, mäts livslängden hos
50 oberoende komponenter. Dessa livslängder betecknas x1 , . . . , x50 .
a) Låt pˆ beteckna andelen observerade livslängder som är större än 24, d.v.s.
50
1 X
1{xi > 24}, där 1{x > 24} =
pˆ =
50 i=1
(
1
0
om x > 24
om x ≤ 24.
Bestäm medelkvadratfelet (mean squared error) för skattaren pˆ.
b) Antag nu att X är Exponential(θ)-fördelad och bestäm maximum-likelihood
skattaren p˜ av p = Pθ (X > 24).
c) Jämför de båda skattarnas varianser då θ = 24, givet att stickprovsstorleken är stor och att antagandet om exponentialfördelning är korrekt.
Uppgift 5
Ett mer exibelt alternativ till att modellera livslängder utgörs av Weibullfördelningen. Fördelningen bär namn efter Wallodi Weibull som var professor i
teknisk fysik på KTH.
a) För vilka av följande tre situationer, där θ betecknar den okända parametern, utgör familjen av Weibull-fördelningar en exponentialfamilj:
θ = (λ, k), θ = λ (k känd/x), θ = k (λ känd/x)?
Låt nu x = (x1 , . . . , xn ) vara en realisering av X = (X1 , . . . , Xn ), en vektor av
n oberoende W eibull(λ, k)-fördelade stokastiska variabler.
b) Bestäm en tillräcklig (sucient) och fullständig (complete) statistika för
λ i fallet där k känt.
c) Beskriv hur man kan konstruera ett kondensintervall för λ med approximativ täckningsgrad 95% i fallet där båda parametrarna är okända. Det
nns inget explicit uttryck för maximum-likelihood skattaren av θ = (λ, k),
ˆ k)
ˆ till scoremen du kan anta att du har en numerisk lösning θˆ = (λ,
ekvationen V (θ, x) = 0. Stickprovsstorleken kan antas vara stor.
2
Uppgift 6
Genotypfrekvenserna av (AA,Aa,aa) i en population fördelar sig som p = (p1 , p2 , p3 ),
där (p1 , p2 ) ∈ [0, 1]2 och p3 = 1−p1 −p2 . Då en population benner sig i genetisk
jämvikt, gäller enligt Hardy-Weinbergs lag att p = (θ2 , 2θ(1 − θ), (1 − θ)2 ) för
något θ ∈ [0, 1].
I en stor population undersöks 1000 slumpmässigt valda individer med resultatet att antalen (AA,Aa,aa) fördelar sig som (x1 , x2 , x3 ). Detta kan ses som
en observation av (X1 , X2 , X3 ) ∼ M ultinomial(1000, p1 , p2 , p3 ) med (p1 , p2 , p3 )
som ovan. För att avgöra om populationen benner sig i genetisk jämvikt vill
vi testa H0 : (p1 , p2 ) ∈ Θ0 , där Θ0 = {(θ2 , 2θ(1 − θ)), 0 < θ < 1} mot
H1 : (p1 , p2 ) ∈ [0, 1]2 , (p1 , p2 ) ∈
/ Θ0 .
a) Bestäm likelihood-kvot statistikan för att testa H0 mot H1 .
b) Antag vi observerar (x1 , x2 , x3 ) = (430, 334, 236). Testa hypotesen på nivån 5% med ett (asymptotiskt) likelihood-kvot test.
Lycka till!
Användbara fördelningar
Normalfördelningen
Täthetsfunktion:
−∞ < µ < ∞, 0 < σ < ∞.
X ∼ N (µ, σ 2 ),
p(x; µ, σ) = √
(x − µ)2 exp −
,
2σ 2
2πσ 2
1
−∞ < x < ∞.
E(X) = µ, V (X) = σ 2 .
Några approximativa kvantiler för N (0, 1):
P (X > 2.58) = 0.005, P (X > 2.33) = 0.01, P (X > 1.96) = 0.025, P (X > 1.64) = 0.05.
Rayleighfördelningen
Täthetsfunktion:
X ∼ Rayleigh(θ),
p(x; θ) =
E(X) =
0 < θ < ∞.
x2 x
exp −
,
θ
2θ
0 < x < ∞.
p
θπ/2, V (X) = (4 − π)θ/2.
Inversa Gammafördelningen
Täthetsfunktion:
X ∼ InvGamma(α, β),
p(x; α, β) =
β
β α −α−1
x
exp − ,
Γ(α)
x
α > 0, β > 0.
x ≥ 0.
E(X) = β/(α − 1) då (α > 1), V (X) = β 2 /((α − 1)2 (α − 2)) då α > 2.
3
k = 1, 2, 3, . . ..
χ2 -fördelningen X ∼ χ2 (k),
Täthetsfunktion:
p(x; k) =
x
1
k/2−1
x
exp
− ,
2
2k/2 Γ(k/2)
x ≥ 0.
E(X) = k , V (X) = 2k .
Några approximativa kvantiler:
k = 1;
P (X > 3.84) = 0.05
k = 10;
P (X > 18.3) = 0.05
k = 100; P (X > 124) = 0.05
X ∼ Exponential(θ),
Exponentialfördelningen
Täthetsfunktion:
p(x; θ) =
x
1
exp − ,
θ
θ
θ > 0.
x ≥ 0.
E(X) = θ, V (X) = θ2 .
Weibullfördelningen
Täthetsfunktion:
X ∼ W eibull(λ, k),
p(x; λ, k) =
λ > 0, k > 0.
x k k x k−1
exp −
,
λ λ
λ
x ≥ 0.
E(X) = λΓ(1 + 1/k), V (X) = λ2 (Γ(1 + 2/k) − Γ(1 + 1/k)2 ).
Binomialfördelningen
Sannolikhetsfunktion:
X ∼ Binomial(n, p),
p(x; n, p) =
0 ≤ p ≤ 1, n = 1, 2, . . ..
n x
p (1 − p)n−x ,
x
x = 0, 1, . . . , n.
E(X) = np, V (X) = np(1 − p).
(X1 , . . . , Xk ) ∼ M ultinomial(n, p1 , . . . , pk ),
i=1 pi = 1, n = 1, 2, . . ..
Multinomialfördelningen
0 ≤ pi ≤ 1, i = 1, . . . , k,
Sannolikhetsfunktion:
Pk
p(x1 , . . . , xk ; n, p1 , . . . , pk ) =
xi = 0, 1, . . . , n, i = 1, . . . , k,
Pk
i=1
xi = n.
E(Xi ) = npi , V (Xi ) = npi (1 − pi ), i = 1, . . . , k.
4
n!
px1 · · · pxkk ,
x1 ! · · · xk ! 1