dr hab. Dariusz Piwczyński, prof. nadzw. UTP Nauka poświęcona metodom badania zjawisk masowych.
Download ReportTranscript dr hab. Dariusz Piwczyński, prof. nadzw. UTP Nauka poświęcona metodom badania zjawisk masowych.
Slide 1
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 2
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 3
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 4
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 5
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 6
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 7
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 8
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 9
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 10
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 11
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 12
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 13
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 14
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 15
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 16
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 17
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 18
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 19
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 20
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 21
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 22
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 23
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 24
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 25
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 26
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 27
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 28
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 29
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 30
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 31
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 32
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 33
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 34
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 35
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 36
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 37
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 38
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 39
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 40
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 41
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 42
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 43
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 44
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 45
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 46
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 47
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 48
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 49
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 50
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 51
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 52
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 53
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 54
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 55
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 56
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 57
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 58
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 59
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 60
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 61
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 62
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 2
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 3
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 4
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 5
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 6
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 7
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 8
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 9
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 10
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 11
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 12
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 13
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 14
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 15
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 16
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 17
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 18
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 19
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 20
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 21
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 22
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 23
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 24
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 25
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 26
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 27
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 28
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 29
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 30
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 31
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 32
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 33
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 34
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 35
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 36
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 37
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 38
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 39
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 40
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 41
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 42
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 43
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 44
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 45
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 46
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 47
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 48
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 49
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 50
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 51
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 52
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 53
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 54
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 55
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 56
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 57
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 58
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 59
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 60
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 61
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61
Slide 62
dr hab. Dariusz Piwczyński,
prof. nadzw. UTP
Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.
2
Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?
3
Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?
http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html
Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?
Szeregi czasowe
Dzietność kobiet w latach 1960-2008
Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.
9
Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.
Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.
10
Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.
11
Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.
12
Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13
ilościowe
jakościowe
14
Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.
15
tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.
16
Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.
17
Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów
18
dziecko
Apgar
masa
dlugosc
mleko
jaja
ospa
piers
kodPiers
matka
1
6
2400
49
10
9
0
3
1
31
2
10
3750
55
7
7
0
6
1
22
3
9
4050
54
7
7
0
3
1
23
4
10
4000
55
11
7
0
10
1
22
5
8
3300
53
2
7
0
1
1
22
6
7
3200
52
12
8
0
36
1
33
7
9
3850
55
7
7
0
6
1
25
19
Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!
20
nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)
21
Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)
22
pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka
23
Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.
24
Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.
25
Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.
26
Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.
27
Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.
Gatunek:
Carabus
Carabus
Carabus
Carabus
Carabus
auratus
cancellatus
granulatus
hortensis
violaceus
28
jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.
29
30
Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.
31
Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi ,
Parametry
Statystyki
Średnia
x
Wariancja
2
s2
Odchylenie
standardowe
s
32
Miary położenia i zmienności, podział
33
Podział miar statystycznych,
miary asymetrii i koncentracji
Asymetria rozkładu:
◦ skośność
Koncentracja rozkładu:
◦ kurtoza
34
KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.
35
x
1
N
N
x
i 1
i
x1 x 2 ... x N
N
gdzie:
N – liczba wszystkich jednostek,
xi – wartość cechy u i-tej jednostki.
36
Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n
wi – wagi przypisane poszczególnym obserwacjom.
x
w
i
xi
i 1
n
w
i
i 1
Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.
x
16 14 3 18
16,8
5
37
Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.
38
x
1
k
x
N
i 1
i
ni
x 1 n 1 x 2 n 2 ... x k n k
N
gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy
39
40
zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.
41
42
xH
N
N
1
gdzie:
xi – wartość cechy,
i 1 x i
N – liczebność odnosząca się do wartości cechy xi.
Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.
43
W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?
xH
1000
120
3000
1000
150
1000
120
100
44
xG
N
x 1 x 2 ... x N
Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45
xH xG x
46
jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl
1
l
ln
N
xi
i 1
a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:
e
xl
co jest równoznaczne z obliczeniem średniej geometrycznej
47
POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.
48
Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.
49
Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.
50
Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.
51
Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?
52
Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).
53
Q
Q 3 Q1
2
54
przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N
md
xi x
i 1
N
55
Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
x i x
s
2
N
i 1
N 1
xi
i 1
2
x
N
N
N
s
2
i 1
N 1
2
xi
i 1
N
N
s
2
x
2
2
N
i 1
N
56
s
s
2
Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57
Vx
Sx
x
100
cv
s
100
x
Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.
58
Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.
59
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma
Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083
lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28
Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92
Kwartyle
Q1 = 0,10
Me = (0,24 +
+ 0 ,37) / 2 = 0,305
Q3 = 0,63
60
61