Transcript Wyk??ad 5

Tomasz Szumlak, WFiIS, 12/04/2013
1
Splotem dwóch funkcji f(t) i g(t) jest funkcja (f * g)(t):
powyżej zdefiniowaliśmy tzw. konwolucję jednostronną
Niezbędne narzędzie dla zastosowań takich jak, obróbka obrazów,
cyfrowe przetwarzanie sygnałów, analiza obwodów, …, statystyka
Zacznijmy od przykładu, wybierzmy: f(t) = sin(t), g(t) = cos(t)
2
Dla treningu: f(t) = e-at, g(t) = e-bt ile wynosi (f * g)(t)?
Własności splotu
Przemienność
Łączność
Rozdzielność
3
Dlaczego jesteśmy zainteresowani splotem w statystyce?
(przypominamy sobie co wiemy o zamianie zmiennych):
Załóżmy, że dane są dwie ciągłe Z.L. (X, Y), R.G.P. dany jest jako f(X, Y)
Definiujemy dwie nowe zmienne losowe, U oraz V, dane przez U=U(X, Y)
i V=V(X, Y) – odwzorowanie to można również odwrócić, czyli można
również wyrazić X i Y jako funkcje U oraz V: X=X(U, V) i Y=Y(U, V)
Wiemy, że R.G.P. dla pary (U, V) można wyrazić jako:
lub
4
Rozważmy następujący przykład, gdy poszukujemy Z.L. U = X + Y
Możemy przyjąć:
Wykonując rachunki explicite:
R.G.P. dla zmiennej V dany jest więc jako:
Splot!
Lub, jeżeli Z.L. są niezależne:
5
Dalej możemy również wyznaczyć rozkład prob.
Oraz, odpowiednio dla zmiennych niezależnych:
Przykład powyższy, gdzie poszukiwaliśmy rozkładu zmiennej V = X + Y
zajmuje doniosłe miejsce w statystyce (w szczególności ważne dla
nas!), równie ciekawe są przypadki: V=X/Y oraz V=XY
Jeżeli zmienna X opisuje wielkość poszukiwaną to zmienną Y możemy
zinterpretować jako „zakłócenia” związane z pomiarem (efekty
aparaturowe). Tak więc, dokonując obserwacji w wyniku otrzymujemy
zmienną losową będącą splotem wielkości poszukiwanej (X) oraz
zaburzeń związanych z techniką pomiaru (ukryte w zmiennej Y)
6
Definiując prob. często używamy diagramów Venna – pomysł – prob. można
nadać, w wielu przypadkach, elegancką interpretację geometryczną.
Np. strzelamy do tarczy, prob. trafienia w region o powierzchni K1 jest do
niego proporcjonalne – jedyny problem to normalizacja, możemy np.
założyć, że trafienie gdziekolwiek w cel (pow. K) wynosi 1
A – trafienie w obszar K1, P(A) = K1/K
7
Jako przykład rozpatrzmy grę w strzałki („darts”)
Interesuje nas prob. trafienia w obszar
tarczy pomiędzy r i r+dr
R.G.P. (dlaczego?) można przyjąć jako:
Gdzie a, jest promieniem tarczy, zakładamy,
że nie ma przypadków, kiedy strzałka nie
trafia w tarczę!
Normalizacja, daje nam c=3/2a
8
9
Definiując pojęcia Z.L. oraz R.G.P. zakładaliśmy, że znamy postać
funkcyjną rozkładu tej zmiennej
W ogólności nie jest to prawda – w praktyce, bardzo często nie jesteśmy
w stanie określić dokładnej postaci funkcji R.G.P. – możemy jedynie
wyznaczyć ograniczoną liczbę parametrów takiego rozkładu.
Parametry te, są zawsze wyznaczane na drodze eksperymentalnej
Jednym z najważniejszych parametrów opisowych, znanym w statystyce
jest wartość oczekiwana, zwana również wartością średnią.
Załóżmy, że badamy dyskretną Z.L. przyjmującą wartości:
dla której, funkcja R.G.P. zdefiniowana jest jak poniżej:
10
Wówczas, wartość oczekiwaną E[X] (), wyznacza się z zależności:
Jeżeli, zmienna losowa X posiada rozkład płaski, wówczas prob. Pojawienia
się jakiejkolwiek wartości Z.L. jest jednakowa, mamy wówczas:
W tym przypadku E[X] nazywana jest średnią arytmetyczną.
Poprzez analogię, dla ciągłej Z.L. wartość średnią wyznaczamy z zależności:
Wartość średnia dla ciągłej Z.L. istnieje, gdy powyższa całka jest zbieżna!
11
Przykład
Gra polega na rzucie symetryczną kostką do gry. Gracz wygrywa 20 PLN gdy wypada
dwa oczka, 40 PLN gdy wypada 4 oczka, płaci 30 PLN gdy wypada 6 oczek. Pozostałe
możliwości nie przynoszą zysku bądź straty. Ile wynosi przewidywana wygrana?
Załóżmy, że naszą zmienną losową będzie ilość pieniędzy jakie możemy wygrać:
Oczewkiwana wygrana wynosi więc:
Wniosek: stawka wejściowa powinna wynosić 5 PLN
Uwaga: zwykle, wartość średnia jest liczbą mianowaną! Jeżeli mierzymy średnicę
pręta to wynik podajemy w mm, itp., itd..
12
Przykład
Dla poniżej zdefiniowanej funkcji R.G.P. zmiennej losowej X wyznacz E[X]
Wartość oczekiwana nazywana jest często miarą tendencji centralnej
funkcji R.G.P. dla zmiennej losowej X
Formułę definiującą E[X] możemy uogólnić w następujący sposób:
Analogiczne równanie może zostać zapisana również dla dyskretnej Z.L.
13
Własności (wybrane) wartości średniej E[X]
1) E[cX] = cE[X], gdzie c jest dowolną stałą
2) E[X ± Y] = E[X] ± E[Y]
3) E[XY] = E[X]E[Y], dla niezależnych Z.L. X i Y
Np. dla równości 2) mamy:
14
Następną wielkością stosowaną do opisu R.G.P. jest wariancja, V[X], którą
dla Z.L. X definiujemy jak poniżej:
Wariancja jest nieujemną wielkością, której dodatni pierwiastek nazywamy
odchyleniem standardowym, 
Mamy, odpowiednio dla dyskretnych i ciągłych Z.L.
Istnieje,
jeżeli całka
jest skończona
Jeżeli Z.L. X pochodzi z rozkładu płaskiego (analogia do E[X]), to:
15
Przykład
Dla funkcji zdefiniowanej na stronie 13 wyznaczymy V[X]
Wariancję możemy interpretować jako miarę rozrzutu (rozmycia) Z.L. X
wokół jej wartości średniej 
„Małe” V[X]
„Duże” V[X]
16
Własności (wybrane) wariancji
1)
2)
3)
Np. własność 1):
Ważna transformacja związana z wartością średnią  oraz odchyleniem
standardowym  - Z.L. standaryzowana: X  X*
Dla tak zdefiniowanej zmiennej mamy:
„Jednostka
standardowa”
17
Jedno z najważniejszych twierdzeń statystyki, dotyczące ogólnych własności Z.L.
ciągłych bądź dyskretnych, posiadających skończone wartości średniej, , oraz
odchylenia standardowego, 
Twierdzenie (nierówność Czebyszewa)
Załóżmy, że Z.L. (ciągła bądź dyskretna) posiada skończone wartości dla  oraz ,
jeżeli  jest dowolną liczbą większą od zera, to prawdziwe jest poniższa formuła:
Przykład
Załóżmy, że wybraliśmy k = 2:
Powiemy:
prob. tego, że wartość zmiennej losowej różni się od jej wartości średniej o więcej
niż dwa odchylenia standardowe jest mniejsza bądź równa 0.25
Tw. Czebyszewa kluczowe dla zastosowań statystyki w opracowaniu pomiarów
18