Właściwości średniej arytmetycznej

Download Report

Transcript Właściwości średniej arytmetycznej

Właściwości średniej
arytmetycznej
Właściwości średniej arytmetycznej
 Wartość średniej
arytmetycznej nie
ulega zmianie, jeśli
wszystkie wagi
pomnożymy przez
liczbę stałą c:
 n .x   (cn ).x
 n  (c n )
i
i
i
i
i
i
x
Właściwości średniej arytmetycznej
 Jeżeli zbiorowość (populację) liczącą n elementów
podzielimy na r podgrup (podpopulacji) o liczebnościach
w1, w2, w3,…….wr, wówczas średnia arytmetyczna całej
zbiorowości (populacji) jest równa średniej ważonej
średnich arytmetycznych ( gdzie j = 1,2,…r) podgrup
(podpopulacji), z wagami wj :
x
r
k
n x
i 1
k
i
n
i 1
i
i

w
j 1
j
xj
r
w
j 1
j
Właściwości średniej arytmetycznej
 Jeśli zmniejszymy każdy wariant cechy xi
o stałą c, to średnia arytmetyczna też
ulegnie zmniejszeniu o stałą c:
 n ( x  c)  x  c
n
i
i
i
Właściwości średniej arytmetycznej
 Jeśli pomnożymy każdy wariant cechy xi
przez stałą c, to nowa średnia
arytmetyczna będzie c – krotnością
średniej pierwotnej:
 n .(c x )  c x
n
i
i
i
Właściwości średniej arytmetycznej
 Jeśli od każdego wariantu xi odejmiemy
średnią arytmetyczną wówczas suma tych
różnic jest równa zeru:
n ( x  x)  0
i
i
 Powyższą własność formułujemy często w
innej formie: suma odchyleń od średniej
arytmetycznej jest równa zeru:

( x  x )  0
i
Właściwości średniej arytmetycznej
 Średnia arytmetyczna zawiera się między
krańcowymi wartościami cechy:
xmin  x  xmax
Właściwości średniej arytmetycznej
 Średnia arytmetyczna zachowuje sumę
wartości cechy:
x  n  x  n
i
i
i
Właściwości średniej arytmetycznej
 Wartość liczbowa średniej arytmetycznej
ma takie samo miano jak badana cecha
Właściwości średniej arytmetycznej
 Suma kwadratów odchyleń
wartości zmiennych badanej
cechy od średniej arytmetycznej
rozkładu jest najmniejsza
( x  x )
i
 Oznacza to, że suma kwadratów
odchyleń poszczególnych
wartości zmiennych badanej
cechy od jakiejkolwiek innej
wartości zmiennej rozkładu,
różnej od średniej, będzie
zawsze większa
2
 min
Ograniczenia
w stosowaniu
średniej arytmetycznej
 Niejednokrotnie średnia arytmetyczna nie
może być uznana za wielkość
reprezentatywną dla całego danego
zbioru, w sensie wyrażania tendencji
centralnej, jej wartość poznawcza jest
niewielka (lub nawet żadna), a niekiedy
wprowadza po prostu w błąd
Ograniczenia w stosowaniu średniej arytmetycznej
A. W przypadku, gdy przedziały klasowe są
otwarte (górny i dolny lub jeden z nich).


a) gdy liczebności przedziałów otwartych
są stosunkowo nieliczne, można je zamknąć i
umownie ustalić środek przedziału;
b) gdy udział liczebności przedziałów
otwartych w ogólnej sumie liczebności jest
znaczny, rezygnujemy z obliczania średniej
Ograniczenia w stosowaniu średniej arytmetycznej
B. Gdy największe liczebności skupiają się
zdecydowanie wokół najniższych lub najwyższych
wartości cechy (szereg jest skrajnie asymetryczny).
Mężczyźni w wieku produkcyjnym, bierni zawodowo,
według wieku
23,52
25
21,04
20
%
15
9,59
10
10,69
6,73
4,87
5
4,3
2,73
2,84
35
40
3,69
0
20
25
30
45
wiek w latach
50
55
60
65
Ograniczenia w stosowaniu średniej arytmetycznej
C. Wartość poznawcza średniej jest żadna,
wówczas, gdy ustalamy średnią ze
zbiorów niejednorodnych
Ograniczenia w stosowaniu średniej arytmetycznej
D. Obliczanie średniej mija się z celem również
w tych szeregach, które dają rozkłady z
kilkoma skupiskami dominującymi (są to tzw.
szeregi wielomodalne)
Rys. Rozkład dwumodalny
 W większości przypadków rozkłady cech mierzalnych
(zwanych zmiennymi) charakteryzują się pewną tendencja
centralną, która polega na tym, że w miarę wzrostu
liczebności (częstości) zmniejszają się różnice pomiędzy
wartościami zmiennej a wartością centralną.
 Rozkłady, które nie odpowiadają temu warunkowi, nie
powinny być opisywane za pomocą wartości średniej.

rozkłady skrajnie asymetryczne
Średnia
geometryczna
Średnią geometryczną n liczb jest
pierwiastek stopnia n z iloczynu tych liczb.
 Wykorzystywana jest
do badania
zbiorowości, w
g
których wartości
jednostek są
przedstawiane w
liczbach względnych
x  n x1  x2  ... xn
Mediana
 Mediana odpowiada środkowi zbioru
danych, w którym to zbiorze wartości
cechy uporządkowano kolejno od
najmniejszej do największej (czyli wg.
rosnącej wartości cechy).
 jeśli liczba obserwacji n jest liczbą
nieparzystą, mediana jest wartością
środkowej obserwacji:
M ( x)  x ( n1)
2
 jeśli liczba obserwacji n jest liczbą
parzystą, mediana jest średnią z dwóch
wartości środkowych obserwacji:
x n  x n2
M ( x) 
2
2
2

medianę M(X) można zdefiniować jako taką wartość
cechy, że prosta pionowa przechodząca przez nią dzieli
obszar pod krzywą na dwie równe części

w praktyce medianę obliczamy w sytuacji, gdzie jedna
lub kilka wartości leży daleko od środka zbioru

mediana ma często zastosowanie w ekonomii w
rozkładach dochodów


Uwaga!!!
mediana ma sens tylko wtedy, gdy zbiór danych jest
uporządkowany rosnąco lub malejąco.
 przykład
 Sprzedaż filmowych kaset video ma ograniczenia
czasowe (na ekrany wchodzą coraz to nowsze filmy
i „stare” szybko schodzą z ekranów kin).
Właściciel musi decydować rozsądnie, z jakimi
filmami nabyć taśmy.
W tej sytuacji miary: - średnia i mediana – nie będą
jemu pomocne.
Zamiast tego, właścicielowi potrzebna jest wiedza
na temat, które filmy są najbardziej popularne i
cieszą się największym zainteresowaniem, a zatem
które filmy prawdopodobnie będą sprzedawać się
najlepiej.
Dominanta (moda)
charakterystyczne własności dominanty




dominanta znajduje zastosowanie wówczas, gdy
chcemy jedną liczbą wyrazić wartość cechy
najbardziej typową i najczęściej występującą
istnieje możliwość stosowania dominanty w
przypadku analizy cech mierzalnych i
niemierzalnych
dla cechy niemierzalnej dominantą jest ten
wariant cechy, która ma największą częstość
występowania w badanej zbiorowości
dominanta jest jedyną miarą przeciętną, która
można wyznaczyć dla cech niemierzalnych
charakterystyczne własności dominanty




jest również możliwe - dla dużych liczebności i
odpowiadającym im różnym wartościom - więcej
niż jedna dominanta (moda);
zbiór z 2-oma modami nazywamy dwumodalnym,
zbiory z 3-ema modami trzymodalnymi;
zbiory mające powyżej 3 mód zwą się
wielomodalnymi;
w diametralnie różnym przypadku, gdy każda
wartość w zbiorze występuje tylko raz – zbiór nie
ma mody.
 w przypadku, kiedy wartości zmiennej
pogrupowane są w szereg rozdzielczy sposób
wyznaczanie dominanty (mody) w oparciu o jej
definicję nie może być zastosowany
 analizując liczebności poszczególnych klas
można określić przedział wartości cechy, który
dominuje w badanej zbiorowości. Nie wiadomo
jednak, która wartość dominuje w badanej
zbiorowości
 dominantę (modę) wyznacza się wówczas w
sposób przybliżony poprzez interpolację jej
wartości z przedziału klasowego
metoda obliczania dominanty
 Metoda interpolacyjna polega na obliczeniu dominanty
według wzoru:
nD  nD1
D( x )  D x 0 
 hD
(nD  nD1 )  (nD  nD1 )
wD  wD1
D( x )  D x 0 
 hD
(wD  wD1 )  (wD  wD1 )

lub:




gdzie:
Dx0 - dolna granica przedziału dominującego;
n D - liczebność (częstości względne) przedziału dominującego;
nD-1 - liczebność (częstości względne) przedziału poprzedzającego
przedział dominujący;
nD+1 - liczebność (częstości względne) przedziału następującego po
przedziale dominującym;
hD - rozpiętość przedziału dominującego.


Uwaga!!!
obliczając dominantę (modę) należy pamiętać o tym,
że:
 w szeregu rozdzielczym może występować jedno
wyraźnie zaznaczone maksimum (tzn. rozkład
empiryczny jest jednomodalny);
 przedział dominanty (mody) oraz dwa sąsiadujące z
nim przedziały muszą mieć takie same rozpiętości
(szerokości);
 jeśli dominanta w szeregu rozdzielczym występuje w
skrajnych przedziałach klasowych, wówczas nie
oblicza się jej wg. wzoru interpolacyjnego
Średnie pozycyjne
wyższych rzędów
 W statystyce często używane są:
 percentyle – dzielimy całkowitą
liczebność na 100 części
 decyle – całkowitą liczebność dzielimy
na 10 części
 kwartyle – całkowitą liczebność dzielimy
na 4 części
 k-ty percentyl zbioru danych
uporządkowanych rosnąco jest to wartość x
mająca tę własność, że k procent
liczebności zbioru leży na lub poniżej
wartości x
Kwartyle
 Kwartyle to takie wartości cechy Q1, Q2 i
Q3 , że ¼ obserwacji leży poniżej Q1 , ¼
powyżej Q3 , ¼ obserwacji leży między
Q1 a medianą a ¼ obserwacji leży
między medianą a Q3 .
 Wielkość Q1 zwana jest kwartylem
dolnym a Q3 kwartylem górnym.