Właściwości średniej arytmetycznej
Download
Report
Transcript Właściwości średniej arytmetycznej
Właściwości średniej
arytmetycznej
Właściwości średniej arytmetycznej
Wartość średniej
arytmetycznej nie
ulega zmianie, jeśli
wszystkie wagi
pomnożymy przez
liczbę stałą c:
n .x (cn ).x
n (c n )
i
i
i
i
i
i
x
Właściwości średniej arytmetycznej
Jeżeli zbiorowość (populację) liczącą n elementów
podzielimy na r podgrup (podpopulacji) o liczebnościach
w1, w2, w3,…….wr, wówczas średnia arytmetyczna całej
zbiorowości (populacji) jest równa średniej ważonej
średnich arytmetycznych ( gdzie j = 1,2,…r) podgrup
(podpopulacji), z wagami wj :
x
r
k
n x
i 1
k
i
n
i 1
i
i
w
j 1
j
xj
r
w
j 1
j
Właściwości średniej arytmetycznej
Jeśli zmniejszymy każdy wariant cechy xi
o stałą c, to średnia arytmetyczna też
ulegnie zmniejszeniu o stałą c:
n ( x c) x c
n
i
i
i
Właściwości średniej arytmetycznej
Jeśli pomnożymy każdy wariant cechy xi
przez stałą c, to nowa średnia
arytmetyczna będzie c – krotnością
średniej pierwotnej:
n .(c x ) c x
n
i
i
i
Właściwości średniej arytmetycznej
Jeśli od każdego wariantu xi odejmiemy
średnią arytmetyczną wówczas suma tych
różnic jest równa zeru:
n ( x x) 0
i
i
Powyższą własność formułujemy często w
innej formie: suma odchyleń od średniej
arytmetycznej jest równa zeru:
( x x ) 0
i
Właściwości średniej arytmetycznej
Średnia arytmetyczna zawiera się między
krańcowymi wartościami cechy:
xmin x xmax
Właściwości średniej arytmetycznej
Średnia arytmetyczna zachowuje sumę
wartości cechy:
x n x n
i
i
i
Właściwości średniej arytmetycznej
Wartość liczbowa średniej arytmetycznej
ma takie samo miano jak badana cecha
Właściwości średniej arytmetycznej
Suma kwadratów odchyleń
wartości zmiennych badanej
cechy od średniej arytmetycznej
rozkładu jest najmniejsza
( x x )
i
Oznacza to, że suma kwadratów
odchyleń poszczególnych
wartości zmiennych badanej
cechy od jakiejkolwiek innej
wartości zmiennej rozkładu,
różnej od średniej, będzie
zawsze większa
2
min
Ograniczenia
w stosowaniu
średniej arytmetycznej
Niejednokrotnie średnia arytmetyczna nie
może być uznana za wielkość
reprezentatywną dla całego danego
zbioru, w sensie wyrażania tendencji
centralnej, jej wartość poznawcza jest
niewielka (lub nawet żadna), a niekiedy
wprowadza po prostu w błąd
Ograniczenia w stosowaniu średniej arytmetycznej
A. W przypadku, gdy przedziały klasowe są
otwarte (górny i dolny lub jeden z nich).
a) gdy liczebności przedziałów otwartych
są stosunkowo nieliczne, można je zamknąć i
umownie ustalić środek przedziału;
b) gdy udział liczebności przedziałów
otwartych w ogólnej sumie liczebności jest
znaczny, rezygnujemy z obliczania średniej
Ograniczenia w stosowaniu średniej arytmetycznej
B. Gdy największe liczebności skupiają się
zdecydowanie wokół najniższych lub najwyższych
wartości cechy (szereg jest skrajnie asymetryczny).
Mężczyźni w wieku produkcyjnym, bierni zawodowo,
według wieku
23,52
25
21,04
20
%
15
9,59
10
10,69
6,73
4,87
5
4,3
2,73
2,84
35
40
3,69
0
20
25
30
45
wiek w latach
50
55
60
65
Ograniczenia w stosowaniu średniej arytmetycznej
C. Wartość poznawcza średniej jest żadna,
wówczas, gdy ustalamy średnią ze
zbiorów niejednorodnych
Ograniczenia w stosowaniu średniej arytmetycznej
D. Obliczanie średniej mija się z celem również
w tych szeregach, które dają rozkłady z
kilkoma skupiskami dominującymi (są to tzw.
szeregi wielomodalne)
Rys. Rozkład dwumodalny
W większości przypadków rozkłady cech mierzalnych
(zwanych zmiennymi) charakteryzują się pewną tendencja
centralną, która polega na tym, że w miarę wzrostu
liczebności (częstości) zmniejszają się różnice pomiędzy
wartościami zmiennej a wartością centralną.
Rozkłady, które nie odpowiadają temu warunkowi, nie
powinny być opisywane za pomocą wartości średniej.
rozkłady skrajnie asymetryczne
Średnia
geometryczna
Średnią geometryczną n liczb jest
pierwiastek stopnia n z iloczynu tych liczb.
Wykorzystywana jest
do badania
zbiorowości, w
g
których wartości
jednostek są
przedstawiane w
liczbach względnych
x n x1 x2 ... xn
Mediana
Mediana odpowiada środkowi zbioru
danych, w którym to zbiorze wartości
cechy uporządkowano kolejno od
najmniejszej do największej (czyli wg.
rosnącej wartości cechy).
jeśli liczba obserwacji n jest liczbą
nieparzystą, mediana jest wartością
środkowej obserwacji:
M ( x) x ( n1)
2
jeśli liczba obserwacji n jest liczbą
parzystą, mediana jest średnią z dwóch
wartości środkowych obserwacji:
x n x n2
M ( x)
2
2
2
medianę M(X) można zdefiniować jako taką wartość
cechy, że prosta pionowa przechodząca przez nią dzieli
obszar pod krzywą na dwie równe części
w praktyce medianę obliczamy w sytuacji, gdzie jedna
lub kilka wartości leży daleko od środka zbioru
mediana ma często zastosowanie w ekonomii w
rozkładach dochodów
Uwaga!!!
mediana ma sens tylko wtedy, gdy zbiór danych jest
uporządkowany rosnąco lub malejąco.
przykład
Sprzedaż filmowych kaset video ma ograniczenia
czasowe (na ekrany wchodzą coraz to nowsze filmy
i „stare” szybko schodzą z ekranów kin).
Właściciel musi decydować rozsądnie, z jakimi
filmami nabyć taśmy.
W tej sytuacji miary: - średnia i mediana – nie będą
jemu pomocne.
Zamiast tego, właścicielowi potrzebna jest wiedza
na temat, które filmy są najbardziej popularne i
cieszą się największym zainteresowaniem, a zatem
które filmy prawdopodobnie będą sprzedawać się
najlepiej.
Dominanta (moda)
charakterystyczne własności dominanty
dominanta znajduje zastosowanie wówczas, gdy
chcemy jedną liczbą wyrazić wartość cechy
najbardziej typową i najczęściej występującą
istnieje możliwość stosowania dominanty w
przypadku analizy cech mierzalnych i
niemierzalnych
dla cechy niemierzalnej dominantą jest ten
wariant cechy, która ma największą częstość
występowania w badanej zbiorowości
dominanta jest jedyną miarą przeciętną, która
można wyznaczyć dla cech niemierzalnych
charakterystyczne własności dominanty
jest również możliwe - dla dużych liczebności i
odpowiadającym im różnym wartościom - więcej
niż jedna dominanta (moda);
zbiór z 2-oma modami nazywamy dwumodalnym,
zbiory z 3-ema modami trzymodalnymi;
zbiory mające powyżej 3 mód zwą się
wielomodalnymi;
w diametralnie różnym przypadku, gdy każda
wartość w zbiorze występuje tylko raz – zbiór nie
ma mody.
w przypadku, kiedy wartości zmiennej
pogrupowane są w szereg rozdzielczy sposób
wyznaczanie dominanty (mody) w oparciu o jej
definicję nie może być zastosowany
analizując liczebności poszczególnych klas
można określić przedział wartości cechy, który
dominuje w badanej zbiorowości. Nie wiadomo
jednak, która wartość dominuje w badanej
zbiorowości
dominantę (modę) wyznacza się wówczas w
sposób przybliżony poprzez interpolację jej
wartości z przedziału klasowego
metoda obliczania dominanty
Metoda interpolacyjna polega na obliczeniu dominanty
według wzoru:
nD nD1
D( x ) D x 0
hD
(nD nD1 ) (nD nD1 )
wD wD1
D( x ) D x 0
hD
(wD wD1 ) (wD wD1 )
lub:
gdzie:
Dx0 - dolna granica przedziału dominującego;
n D - liczebność (częstości względne) przedziału dominującego;
nD-1 - liczebność (częstości względne) przedziału poprzedzającego
przedział dominujący;
nD+1 - liczebność (częstości względne) przedziału następującego po
przedziale dominującym;
hD - rozpiętość przedziału dominującego.
Uwaga!!!
obliczając dominantę (modę) należy pamiętać o tym,
że:
w szeregu rozdzielczym może występować jedno
wyraźnie zaznaczone maksimum (tzn. rozkład
empiryczny jest jednomodalny);
przedział dominanty (mody) oraz dwa sąsiadujące z
nim przedziały muszą mieć takie same rozpiętości
(szerokości);
jeśli dominanta w szeregu rozdzielczym występuje w
skrajnych przedziałach klasowych, wówczas nie
oblicza się jej wg. wzoru interpolacyjnego
Średnie pozycyjne
wyższych rzędów
W statystyce często używane są:
percentyle – dzielimy całkowitą
liczebność na 100 części
decyle – całkowitą liczebność dzielimy
na 10 części
kwartyle – całkowitą liczebność dzielimy
na 4 części
k-ty percentyl zbioru danych
uporządkowanych rosnąco jest to wartość x
mająca tę własność, że k procent
liczebności zbioru leży na lub poniżej
wartości x
Kwartyle
Kwartyle to takie wartości cechy Q1, Q2 i
Q3 , że ¼ obserwacji leży poniżej Q1 , ¼
powyżej Q3 , ¼ obserwacji leży między
Q1 a medianą a ¼ obserwacji leży
między medianą a Q3 .
Wielkość Q1 zwana jest kwartylem
dolnym a Q3 kwartylem górnym.