Formelsamling

Download Report

Transcript Formelsamling

Formelsamling i TDAT2001 Realfag for dataingeniører
Grunnleggende formler i sannsynlighetsregningen
Generell addisjonssetning
P( A  B)  P( A)  P( B)  P( A  B)
Betinget sannsynlighet
P( A | B) 
Gen. multiplikasjonssetning
P( A  B)  P( B)  P( A | B)
Total sannsynlighet
P( A  B)
P( B)
P( A  B)  P( A)  P( B | A)
r
P( A)   P( Bi )  P( A |Bi )
i 1
Bayes lov
A og B uavhengige
P( B | A) 
P( B)  P( A | B)
P( A)
P( A  B)  P( A)  P( B)
P( A | B)  P( A) P( B | A)  P( B)
Kombinatorikk
Antall forskjellige utvalg når s enheter trekkes fra en populasjon på N enheter
Ordnet utvalg, med tilbakelegging
Ns
Ordnet utvalg, uten tilbakelegging
N s  N ( N  1)( N  s  1) 
Uordnet utvalg, uten tilbakelegging
 N  N s
N!
  

s!
s!( N  s)!
s
N!
( N  s)!
Generelt om sannsynlighetsfordelinger for 1 variabel
Fordelingsfunksjon
Punktsannsynlighet (diskret)/
Sannsynlighetstetthet(kontinuerlig)
F ( x)  P( X  x)
P(a  X  b)  F (b)  F (a)
Diskrete fordelinger
Kontinuerlige fordelinger
p( x)  P( X  x)
F ( x)   p(u )
ux
Forventning
  E ( X )   xp ( x)
x
E[ g ( X )]   g ( x) p( x)
f ( x)  F ' ( x)
x
F ( x) 
 f (u)du


  E ( X )   xf ( x)dx


E[ g ( X )] 
x
Varians
 2  Var ( X )  E[( X   )2 ]  E( X 2 )   2
Standardavvik
  SD( X )  Var ( X )
 g ( x) f ( x)dx

Generelt om sannsynlighetsfordelinger for 2 variable
Simultanfordeling for X og Y
P[( X  x)  (Y  y)
Forventning
E[ g ( X , Y )]   g ( x, y)  P[( X  x)  (Y  y)]
Kovarians
Cov( X ,Y )  E[( X   X )(Y  Y )]  E( XY )   X Y
Cov( X , Y )
 ( X ,Y ) 
x
Korrelasjonskoeffisient
y
 X Y
Regler for forventning og varians
E(aX  b)  aE( X )  b
E ( X1  X 2 )  E ( X1 )  E ( X 2 )
Var (aX  b)  a 2Var ( X )
Var ( X 1  X 2 )  Var ( X 1 )  Var ( X 2 ) når X 1 og X 2 er uavhengige
Var ( X 1  X 2 )  Var ( X 1 )  Var ( X 2 )  2Cov(X1 , X 2 ) når X 1 og X 2 ikke er uavhengige
Spesielle diskrete sannsynlighetsfordelinger
Binomisk fordeling
X er bin (n, p)
n
P( X  x)    p x (1  p) n  x
 x
Hypergeometrisk fordeling
X er hypergeom ( N , M , n)
M  N  M 
   

x   n  x 

P( X  x) 
N
 
n
Poissonfordeling
X er Po ( )
Uniform fordeling
x
e 
x!
1
P( X  x) 
k
X  [ x1 , x2 , xk ]
P( X  x ) 
E ( X )  np
Var ( X )  np(1  p)
M
N
E ( X )  n
 
Var ( X ) 
E( X )  
Var ( X )  
E( X ) 
1 k
 xi
k i 1
Var ( X ) 
1
k
X  [1,2, k ]
P( X  x) 
E( X ) 
N n
n (1   )
N 1
1 k 2 1 k 
xi 
 xi   k 
k i 1
i 1

2
1 k
k 1
i

k i 1
2
1 k 2  k  1
(k  1)(k  1)
i 
 

k i 1
12
 2 
2
Var ( X ) 
Spesielle kontinuerlige sannsynlighetsfordelinger
Eksponensialfordeling
T er eksp( )
f (t )  e
 t
for t  0
E (T ) 
1

Var (T ) 
1
2
F (t )  1  e  t for t  0
Normalfordeling
Standard:
Rektangulærfordeling
X er N (  , 2 )
U er N (0,1)
P(U  u )  G (u )
G (u )  1  G (u )
X er R( ,  )
f ( x) 
1
for   x  
 
Generell:
E( X ) 
F ( x)  P( X  x)  G (
 
2
1
Var ( X )  (    ) 2
12
x

)
Tilnærminger
Sentralgrensesetningen (gjelder
alle fordelinger)
Dersom X1, X2, …,Xn er uavhengige og identisk fordelte stokastiske variable med
2
forventning μ og varians σ , så er for store verdier av n (n>=30)
X1  X 2    X n  N (n , n 2 )
og
1
2
X  ( X1  X 2    X n )  N ( , )
n
n
Sammenheng mellom spesielle
fordelinger
hypergeometrisk(N,M,n)
n
 0.10
N
n (1   )  10
n
 0.10
N
N(μ,σ2)
np(1  p)  10
  10
bin(n,p)
Po(λ)
n  50
p  0.15
Punktestimering av forventning μ og varians
Punktestimator for forventning
Punktestimator for varians
̂  X 
S2 

1 n
 Xi
n i 1
n
1
( X i  X )2

n  1 i 1
E ( ˆ )  
Var ( ˆ ) 
2
E (S )  
2
n
2
n
2
1
( X i2  n X )
n  1 i 1
Korrelasjon
Empirisk korrelasjonsfaktor
R
S XY
S X SY
S X2 
2
1 n
1 n 2
2
(
X

X
)

Xi  X


i
n i 1
n i 1
SY2 
2
1 n
1 n 2
2
(
Y

Y
)

Yi  Y


i
n i 1
n i 1
S XY 
1 n
1 n
(
X

X
)(
Y

Y
)

 i
 X iYi  X Y
i
n i 1
n i 1
Intervallestimering og hypotesetesting
Modell
(Tilnærmet) (1-α)100%
konfidensintervall for
forventningen μ
Målemodellen, σ kjent,
normalfordelte
observasjoner eller et
stort antall observasjoner
(n>=30)
X u  / 2 

n
Testobservator for H0
Kommentar
H 0 :   0
Utvalgsstørrelse når vi
ønsker et
konfidensintervall med
feilmargin d:
U 0
X  0

er N (
n
Målemodellen, σ ukjent,
normalfordelte
observasjoner
X t  / 2, n 1
Poissonmodell, vha
normaltilnærming
ˆ u / 2  ˆ
H 0 :   0
S
n
T 0
X  0
S
n
H 0 :   0
ˆ  0
U 0
  0
,1)

n
 u  
n    /2 
 d 
2
Når H0 er sann, er T0 tfordelt med n-1
frihetsgrader
̂  X
0
Binomisk modell, vha
normaltilnærming
pˆ u / 2 
Hypergeometrisk modell,
vha normaltilnærming
ˆ u
 / 2
pˆ (1  pˆ )
n
H 0 : p  p0
pˆ  p0
U 0
p0 (1  p0 ) / n
H 0 :   0
ˆ   0
U 0
 0 (1   0 ) / n
ˆ(1  ˆ)
n
pˆ 
X
n

M
N
ˆ 
X
n
Regresjonsmodellen
Forutsetninger
Minste kvadraters
estimator
n par observasjoner av x
og Y: (x1,y1),…(xn,Yn)
n
M   ( x i  x)
2
Y1,…Yn er uavhengige og
normalfordelte stokastiske
variable x1,…xn er kjente tall
ˆ1 
i 1
Estimert
regresjonslinje
Intervallestimering
og hypotese-testing
når σ er kjent
1
M
n
 ( xi  x)Yi 
i 1
E (Yi )  0  1 xi Var (Yi )   2
i  1,2,n
ˆ1 er N ( 1 ,
2
M
)
1 n
( xiYi  n xY )
M i 1
ˆ0  Y  ˆ 1 x
2
ˆ
 0 er N (  0 ,
nM
Testobservator for β1:
1  10
U 0 er N (
,1)
/ M
n
x
i 1
2
i
Yˆ  ˆ0  ˆ1 x
Konfidensintervall for β1:
ˆ1  u / 2

M
U0 
ˆ1  
/ M
0
1
)