dr hab. Dariusz Piwczyński, prof. nadzw. UTP  Nauka poświęcona metodom badania zjawisk masowych.

Download Report

Transcript dr hab. Dariusz Piwczyński, prof. nadzw. UTP  Nauka poświęcona metodom badania zjawisk masowych.

Slide 1

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 2

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 3

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 4

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 5

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 6

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 7

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 8

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 9

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 10

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 11

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 12

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 13

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 14

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 15

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 16

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 17

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 18

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 19

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 20

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 21

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 22

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 23

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 24

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 25

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 26

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 27

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 28

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 29

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 30

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 31

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 32

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 33

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 34

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 35

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 36

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 37

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 38

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 39

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 40

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 41

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 42

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 43

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 44

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 45

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 46

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 47

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 48

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 49

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 50

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 51

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 52

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 53

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 54

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 55

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 56

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 57

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 58

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 59

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 60

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 61

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61


Slide 62

dr hab. Dariusz Piwczyński,
prof. nadzw. UTP



Nauka poświęcona metodom badania zjawisk
masowych. Polega na systematyzowaniu,
obserwowaniu cech ilościowych i jakościowych
oraz przedstawieniu wyników w postaci
zestawień tabelarycznych, wykresów, posługuje
się rachunkiem prawdopodobieństwa.

2



Z ilu pomiarów należy obliczyć średnią?
Ilu pomiarów należy użyć, aby mieć do tej
średniej zaufanie? Ile winniczków powinniśmy
poddać kontroli masy ciała?

3



Czy istnieje różnica między grubością rogówki
przed założeniem szkieł kontaktowych a w 4.
tygodniu ich noszenia?

http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html



Czy kobiety i mężczyźni w równym stopniu lubią
słodycze?



Szeregi czasowe

Dzietność kobiet w latach 1960-2008





Dział matematyki zajmujący się metodami
wnioskowania o prawach prawdopodobieństwa
rządzących danym zjawiskiem na podstawie
obserwacji tego zjawiska.
Statystyka matematyczna zajmuje się
badaniem własności zbiorów na podstawie
znajomości własności ich części.

9





Zbiorowość statystyczna, zbiór dowolnych
elementów, nieidentycznych z punktu
widzenia badanej cech. Z reguły jest ona dla
nas niedostępna w całości do badań, jednak
nas interesuje.

Przykład: zbiór wszystkich osobników
gatunku Ślimak winniczek, Kret.

10



Podzbiór populacji generalnej, który podlega
bezpośrednio badaniu ze względu na
rozpatrywaną cechę, co pozwala na
wyciągnięcie wniosków o kształtowaniu się
wartości cechy w całej populacji generalnej.

11





Powinna w jak najlepszy sposób oddawać
strukturę populacji.
Najprostszym przykładem takiej próby jest
próba losowa prosta, otrzymywana jest, gdy
każdy element populacji ma taką samą
szansę dostania się do próby.

12








Cecha, a wartości tej cechy poszczególnych
elementów populacji to realizacja zmiennej.
Zmienna losowa może przyjmować z
określonym prawdopodobieństwem każdą
z wartości należących do wyszczególnionego
zbioru, np. rzut kostką do gry – zmienna
losowa, czyli cecha może przyjmować dowolną
wartość ze zbioru od 1 do 6.
Każdej wartości zmiennej losowej możemy
przyporządkować jej prawdopodobieństwo
wystąpienia.
Zmienna losowa = cecha = zmienna
13




ilościowe
jakościowe

14





Wynik zjawiska lub procesu, który daje się
wyrazić ilościowo (za pomocą liczb).
Cechy ilościowe oznaczane są za pomocą
liter: X, Y, Z.

15





tzw. dyskretne. W badaniach biologicznych
cechy skokowe wyrażane są za pomocą
liczb naturalnych. Na ogół przyjmują one
kilka lub kilkanaście wartości liczbowych.
Ich modelami matematycznymi są zmienne
losowe skokowe.
Przykład – liczba urodzonych dzieci.

16



Przyjmują wszystkie wartości z pewnego
przedziału liczbowego liczb rzeczywistych.
Ich modelami matematycznymi są zmienne
losowe ciągłe, często ich rozkład
prawdopodobieństwa jest zbliżony do
rozkładu normalnego.

17



Cechy, których nie możemy zapisać w postaci
liczby, np. kolor oczu, barwa włosów

18

dziecko

Apgar

masa

dlugosc

mleko

jaja

ospa

piers

kodPiers

matka

1

6

2400

49

10

9

0

3

1

31

2

10

3750

55

7

7

0

6

1

22

3

9

4050

54

7

7

0

3

1

23

4

10

4000

55

11

7

0

10

1

22

5

8

3300

53

2

7

0

1

1

22

6

7

3200

52

12

8

0

36

1

33

7

9

3850

55

7

7

0

6

1

25

19



Zanim rozpoczniemy analizę statystyczną
konieczne jest ustalenie skali, w jakiej
wyrażana jest nasza cecha!!!

20





nominalna – porządek właściwie dowolny,
np.: rasa zwierzęcia, siedlisko, forma
spędzania wolnego czasu    
nominalna dychotomiczna, np. płeć, stan
zdrowia („CHORY, ZDROWY”)

21



Wartościom cechy można przypisać rangi. Musi
zatem istnieć możliwość logicznego
uporządkowania wartości zmiennej.
Przykład: wykształcenie osoby (podstawowe,
zawodowe, średnie, wyższe), stan finansów
(zły, średni, dobry, bardzo dobry)

22




pozwala uporządkować wartości zmiennej,
zakłada się, że dotyczy zbioru liczb
rzeczywistych, np. wzrost, wydajność mleka

23



Polega na przyporządkowaniu każdej
wartości zmiennej losowej
prawdopodobieństwo jej wystąpienia.

24



Postępowanie, które służy weryfikacji
istniejącego stanu wiedzy lub pozyskaniu
nowych informacji. Polega ono na
rozpoczęciu i obserwowaniu pewnego
zjawiska w warunkach kontrolowanych.

25



Roślina lub zwierzę poddane działaniu
danego poziomu czynnika doświadczalnego
i w odniesieniu, do której prowadzimy
obserwację cechy ilościowej, będącej
odpowiedzią na działanie czynnika.

26



Rodzaj zmiennej, która jest kontrolowana
w doświadczeniu i która jest przyczyną
kształtowania się cech zjawisk dotyczących
głównie zwierząt, roślin czy środowiska,
w którym bytują.

27



Określone przez badacza warianty czynnika,
w ramach których zamierza się prowadzić
obserwacje nad kształtowaniem się
interesujących nas cech.

Gatunek:
 Carabus
 Carabus
 Carabus
 Carabus
 Carabus

auratus
cancellatus
granulatus
hortensis
violaceus
28





jednoczynnikowe W jednym czasie
analizujemy wpływ jednego czynnika na
cechy ilościowe roślin lub zwierząt,
wieloczynnikowe W jednym czasie badamy
wpływ wielu czynników na cechy ilościowe
roślin lub zwierząt.

29

30







Pewne funkcje wartości pomiarowych służące
do wyznaczenia przybliżonych wartości
parametrów statystycznych. Należy do nich, m.
in.: mediana, średnia arytmetyczna.
Statystyki dotyczą populacji próbnej.
Oznaczane są literami łacińskimi.
Statystyka elementarna zajmuje się
obliczaniem statystyk.

31






Parametry charakteryzują rozkład badanej
cechy w populacji generalnej.
Dotyczą populacji generalnej!
Oznaczane są literami greckimi , 
Parametry

Statystyki

Średnia



x

Wariancja

2

s2

Odchylenie
standardowe



s
32

Miary położenia i zmienności, podział

33

Podział miar statystycznych,
miary asymetrii i koncentracji


Asymetria rozkładu:
◦ skośność



Koncentracja rozkładu:
◦ kurtoza

34



KLASYCZNE
pozwalają określić, gdzie w zbiorze wartości
liczbowych znajdują się wartości badanej
cechy, tym samym pozwalają na
umiejscowienie rozkładu cechy.

35

x 

1
N

N

x
i 1

i



x1  x 2  ...  x N
N

gdzie:
 N – liczba wszystkich jednostek,
 xi – wartość cechy u i-tej jednostki.

36



Stosowana wtedy, gdy poszczególnym
obserwacjom przypisujemy wagi związane z
ich znaczeniem.
n

wi – wagi przypisane poszczególnym obserwacjom.

x 

w

i

xi

i 1
n

w

i

i 1

Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I
kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy
egzaminowi wagę 3, a kolokwium wagę 1.

x 

16  14  3  18

 16,8

5
37







Jest to taka wartość zmiennej, która
podstawiona na miejsce wszystkich
poszczególnych wartości nie zmieni ich sumy
Suma odchyleń poszczególnych wartości od
średniej arytmetycznej jest równa zero.
Suma kwadratów odchyleń poszczególnych
wartości zmiennej od średniej arytmetycznej
jest najmniejsza w porównaniu z sumami
kwadratów odchyleń od jakiejkolwiek innej
liczby w szeregu.

38

x 

1

k

x

N
i 1

i

 ni 

x 1  n 1  x 2  n 2  ...  x k  n k
N

gdzie:
N – liczba wszystkich jednostek,
ni - liczba jednostek posiadających i-tą wartość
cechy,
k – liczba klas,
xi – i-ta wartość cechy

39

40



zawiera pomiary pogrupowane na klasy.
W ramach szeregu rozdzielczego tworzone są
przedziały klasowe oraz zliczana jest liczba
pomiarów w każdym przedziale klasowym.

41

42

xH 

N
N



1

gdzie:
 xi – wartość cechy,
i 1 x i
 N – liczebność odnosząca się do wartości cechy xi.
 Średnia harmoniczna jest odwrotnością średniej
arytmetycznej z odwrotności elementów próby!
 Stosowana m.in. w analizie wariancji układów
nieortogonalnych (nieproporcjonalnych - przy nierównej
ilości osobników w grupach). Nie można jej obliczyć, gdy
jakaś wartość cechy równa się „0” lub jest ujemna.
 W badaniach, w których obserwowana jest wydajność w
czasie – rozkład cechy odbiega od symetrycznego, ma
przebieg hiperboliczny.

43



W gospodarstwie produkującym jaja
stwierdzono, że pierwsze 1000 jaj
pozyskiwano z prędkością 120 jaj/tydzień,
drugi 1000 z prędkością 150 jaj/tydzień, a
ostatni 1000 z prędkością 100 jaj/tydzień.
Jaka była średnia wydajność tygodniowa w
okresie, w którym uzyskano 3000 jaj?

xH 

1000
120



3000
1000
150



1000

 120

100
44

xG 




N

x 1  x 2  ...  x N

Stosowana, gdy jedna z wartości skrajnych
zmiennej bardzo różni się od pozostałych (duże
rozproszenie wartości skrajnych),
w takim przypadku średnia geometryczna
bardziej prawidłowo scharakteryzuje położenie
danej cechy w szeregu liczbowym niż średnia
arytmetyczna.
Miara popularna w badaniach
mikrobiologicznych, zmienne posiadają
rozkłady prawostronne.
45

xH  xG  x

46



jest równoznaczne z obliczeniem średniej
arytmetycznej:
xl 

1

l

ln

N

xi

i 1

a następnie powrót do oryginalnej skali pomiaru poprzez
transformację:

e

xl
co jest równoznaczne z obliczeniem średniej geometrycznej

47



POZYCYJNE
wskazują wartość cechy, która odgrywa w
szeregu szczególną rolę, np. dzieli szereg na
dwie połowy. Punktem wyjścia do ich
określenia jest uporządkowanie szeregu
liczbowego, konieczna jest przy tym
znajomość liczebności.

48




Zwana wartością szczytowa, modą, wartością
modalną.
Jest to taka wartość zmiennej, która
występuje w populacji największą ilość razy.
Jest najbardziej typowa dla danego zjawiska.
Jednak nie należy jej obliczać, gdy rozkład
danej cechy nie posiada jednego, wyraźnie
zaznaczonego maksimum liczebności.
Wartość modalna wyznacza szczyt krzywej
liczebności. Pozwala scharakteryzować
populację pod względem jej typowości.

49





Są to takie wartości cechy, które pozwalają
podzielić uporządkowany szereg liczbowy na
4 części.
Kwartyl drugi dzieli szereg na połowy, zwany
jest też medianą. Jeśli liczebności ćwiartek są
liczbami parzystymi, to wartość kwartyli
obliczamy jako średnią arytmetyczną z
wartości kończących i rozpoczynających
kolejne ćwiartki. W szeregu nieparzystym
medianę stanowi środkowy wyraz szeregu.

50



Kwartyle stosujemy w odniesieniu do cech
jakościowych trudno mierzalnych, w
badaniach mikrobiologicznych przy
określaniu średniej liczby drobnoustrojów.

51



Problem, jaki wiąże się z powyższym
zagadnieniem, to odpowiedź na pytanie: jak
bardzo poszczególne wartości cechy różnią
się od siebie?

52





Najprostsza miara zmienności.
Jest to tzw. obszar zmienności, określa on
całkowitą zmienność cechy.
Obliczany jest z poniższego wzoru:
Ox=xmax-xmin
Rozstęp jest traktowany jedynie jako wstępna
miara zmienności z oczywistych względów
(opieramy się jedynie o wartości skrajne).

53

Q 

Q 3  Q1
2

54



przeciętne odchyleniem poszczególnych
wartości zmiennej (xi) od średniej
arytmetycznej.
N


md 

xi  x

i 1

N

55





Wariancja jest średnią z kwadratów różnic
średniej arytmetycznej od poszczególnych
wartości cechy. W przypadku małych prób
(poniżej 30) suma kwadratów dzielona jest
przez N-1, w przeciwnym zaś przypadku
przez N.
Wariancja jest miarą, która nie posiada
interpretacji.
2
 x i  x 

s 
2

N

i 1

N 1



 xi 
 i 1

2
x 
N
N

N


s 
2

i 1

N 1

2



 xi 
 i 1

N

N


s 
2

x 
2

2

N

i 1

N
56

s


s

2

Jest to liczba mianowana. Pozwala ona określić
typowy obszar zmienności wartości cechy.
Wskazuje ono, o jaką wartość poszczególne
wartości cechy odbiegają przeciętnie od średniej
arytmetycznej. Im większe odchylenie
standardowe, tym poszczególne obserwacje są
bardziej oddalone od średniej arytmetycznej, tym
większe jest rozproszenie próby. Mówi się, że
próba jest mało wyrównana.
57

Vx 



Sx
x

 100

cv 

s

 100

x

Miary względnego zróżnicowania
Stosowana w sytuacji, gdy badane zjawisko
mierzone jest w różnych jednostkach miary
lub kształtuje się na niejednakowym
poziomie przeciętnym.

58



Badano stężenie jonów żelaza (mg/l) w
dopływie do stawu wodnego. W tym celu
wykonano 30 prób (tab. ). Oblicz podstawowe
miary położenia klasyczne i pozycyjne oraz
miary zmienności w zakresie badanej cechy.

59

lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Suma

Szereg nieuporządkowany
x
x2
0,10
0,01
0,40
0,16
0,14
0,02
0,10
0,01
0,47
0,22
0,10
0,01
0,10
0,01
1,10
1,21
0,10
0,01
0,13
0,02
0,84
0,71
0,08
0,01
0,09
0,01
1,09
1,19
0,14
0,02
0,42
0,18
0,63
0,40
0,37
0,14
0,20
0,04
0,12
0,01
0,60
0,36
0,50
0,25
0,09
0,01
1,16
1,35
1,83
3,35
0,77
0,59
0,37
0,14
2,92
8,53
0,24
0,06
0,11
0,01
15,3100
19,0083

lp
12
13
23
1
4
6
7
9
30
20
10
3
15
19
29
18
27
2
16
5
22
21
17
26
11
14
8
24
25
28

Szereg uporządkowany
lp'
x
1
0,08
2
0,09
3
0,09
4
0,10
5
0,10
6
0,10
7
0,10
8
0,10
9
0,11
10
0,12
11
0,13
12
0,14
13
0,14
14
0,20
15
0,24
16
0,37
17
0,37
18
0,40
19
0,42
20
0,47
21
0,50
22
0,60
23
0,63
24
0,77
25
0,84
26
1,09
27
1,10
28
1,16
29
1,83
30
2,92

Kwartyle

Q1 = 0,10

Me = (0,24 +
+ 0 ,37) / 2 = 0,305

Q3 = 0,63

60

61