Transcript Wyklad 3

Wykład 3
Sparametryzowane
rodziny funkcji
Funkcjeżetworzone
przez
przyrodę
Na poprzednim wykładzie mówiłam,
istnieją funkcje
tworzone
przez przyrodę. Istnieją one
w takim samym sensie w jakim istnieją populacje nieskończone złożone z osobników
istniejących i tych które mogłyby zaistnieć w danych warunkach środowiska. Jest to takie
same istnienie jak istnienie punktu materialnego poruszającego się swobodnie w próżni,
punktu o zerowych wymiarach czy nieskończonej płaszczyzny o zerowej grubości.
Warunki środowiska
Mierzalne cechy środowiska dają przedział liczbowy (każda z tych liczb określa jakieś
warunki środowiska), a każdej z tych liczb przyporządkowany jest rozkład cechy
populacji, jaka w takich warunkach środowiska mogłyby zaistnieć. Z rozkładem tym
wiążemy jedna wartość charakteryzująca w określony sposób rozkład i uzyskujemy
funkcję.
Takie patrzenie na przyrodę pozwala na badanie wpływu określonych
warunków środowiska
Cechy populacji
(wiadomo, że nie jesteśmy w stanie określić wszystkich warunków, a co więcej próba
określenia wszystkich cech środowiska niczemu by nie służyła) i traktowanie żyjącej
populacji jako jednej z wielu, które mogłyby w określonych warunkach zaistnieć. Jest to
tworzenie wiedzy, która poprzez swoją ogólność może mieć zastosowanie w różnych
Rozkład
środowiskach dla różnych populacji.
cecha
cechy
Jakie są funkcje tworzone przez przyrodę? Dla danych warunków środowiska określonych
środowiska
liczbami (np. stężeniem azotu w glebie) populacja
tam żyjąca mogłaby się cechować
populacji
określonym rozkładem jakiejś cechy (np. długościami pędów, które tworzyłyby określony
rozrzut wokół pewnej wartości średniej). Małe zmiany warunków środowiska dawałyby
minimalne zmiany rozkładu określonej cechy
populacji, a zatem i określone
Charakterystyka
cecha
charakterystyki rozkładu niewiele różniłyby się od siebie. Funkcja przyporządkowująca
rozkładu
cechy
cechom
środowiska określona charakterystykę
rozkładu
(np. średnią długość pędu) po
środowiska
pierwsze istnieje, po drugie jest tworzona populacji
przez warunki środowiska i zakodowaną w
genach osobników odpowiedź populacji na te warunki, po trzecie byłaby ciągła i
różniczkowalna.
Sparametryzowane rodziny funkcji rzeczywistych
Funkcje liniowe: f(x)=ax+b
Funkcje tworzone przez przyrodę nie muszą wyrażać się jakimkolwiek wzorem
Rodzina
funkcji określona
dlajewszystkich
par liczb
(a,b)ℝ2określonymi wzorami, co
matematycznym,
ale można
przybliżać funkcjami
wyrażanymi
wynika z twierdzenia Weierstrassa. Posługujemy się wtedy sparametryzowanymi
rodzinami funkcji, które są niczym innym jak zbiorem wszystkich funkcji o określonym
n-1+...+a x+a
wzorze, w którym
zastępujące pewne liczby.
Wielomiany:
f(x)=awystępują
xn+a xparametry
n
n-1
1
0
Typowe rodziny funkcji pokazane wyświetlone na tablicy są dobrze wam znane z lekcji n+1
Rodzina
funkcji określona dla wszystkich nℕ i ciągów (an,an-1,...,,a1,a0) ℝ
matematyki.
Sparametryzowane rodziny funkcji mogą być mniej lub bardziej obszerne, w tym sensie, że te
n tych bardziej
n -1
mniej obszerne zawierają asięx w
obszernych.
Funkcje liniowe zawierają się

a
x

...

a
x

a
n
n
1
1
0
Funkcje
wymierne:
w rodzinie
wielomianów,
zawierają się w rodzinie funkcji wymiernych.
f(x)  a wielomiany
k
k -1
Czasem w pracy posługujemy
b k x się
 bjakąś
x
 ...  bfunkcji
k -1 rodziną
1 x  b 0nie mającą ogólnie przyjętej
nazwy.funkcji
Rozważanie
szczególnej
rodziny funkcji
wymaga
jej zdefiniowania
pracy –n+1
Rodzina
określona
dla wszystkich
nℕ
i ciągów
(an,an-1,...,,aw
1,a0) ℝ
wystarczy podanie wzoru z parametrami.
Przy poszukiwaniu funkcji „tworzonych przez przyrodę” posługujemy się rodzinami funkcji w
których jest możliwie mało parametrów
– najczęściej jeden lub dwa. Zrobimy przegląd
2 określona
Rodzina
paraboli:
f(x)=ax
wszystkich
aℝ
różnych najczęściej spotykanych rodzin funkcji wdla
pracach
biologicznych.
Rodzina hiperboli: f(x)=a/x określona dla wszystkich aℝ
Funkcje potęgowe i pierwiastkowe
f(x)=xm
Y
Y
Potęgi znane są wszystkim ze szkoły. Najlepiej znane jest podnoszenie do potęgi wyrażającej
się
liczbą naturalną
j jest to
mnożenie
liczby z tyle razydodatnich
na ile wskazuje
Dziedziną
funkcji
jest
zbiórprzez
liczbsiebie
rzeczywistych
ℝ+to
potęga. Możemy to robić dla dowolnych liczb rzeczywistych x, ujemnych i dodatnich.
Potęga wyrażająca się ułamkiem m/n (gdzie m i n są liczbami naturalnymi) – to
m=
3 2 x1.5podniesionej
1
2
pierwiastek
stopnia nm=10
z liczby
do m-tej2 potęgi. Symbol pierwiastkowania
-0.1
zastąpić zawsze można symbolem potęgi
0.666 (w pracach biologicznych stosuje się symbol
pierwiastka
w zasadzie tylko dla pierwiastków
kwadratowych,
pisanych bez 2). -0.333
1.5
1.5
0.5
-0.5
Pierwiastkować można liczby dodatnie
i 0. Można rozważać potęgowanie do liczb
0.333
-0.666przy
ujemnych
i pokazana na dole formuła
w biologii, przykładowo
0.1jest często stosowana
1
1
zapisie jednostek (coś na sekundę pisze się mnożąc jednostkę tego „coś” przez s-1-1, coś
-1.5
na m2 pisze się mnożąc przez m-2).
0.5
0.5
-2
Czasami posługując się funkcjami potęgowymi biolog musi je przekształcać. Służą do-3
tego
wzory 0podane na tablicy.
0
-10
0
0.5
1
1.5
2
0
0.5
1
1.5
2
X
X
1
x
m
m
 x
x
m
1
 m
x
x m   x m x
(xy) m  x m y m
Rodzina funkcji potęgowych
f(x)=axm dla a i m
Dziedziną funkcji jest +
Zbiorem wartości funkcji jest + (dla a>0) albo - (dla a<0)
- rosnące szybciej od y=x gdy m>1
- rosnące wolniej od y=x gdy m<1
Y
Rodzina funkcji potęgowych wyraża się podanym wzorem. Są tu dwa
parametry rzeczywiste,
y=ax0.5
10 m jest ujemna) lub funkcje
które dają funkcje podobne do hiperbolicznych (gdy liczba
a=5
Funkcje
gdy a>0
i m>0
8
rosnącerosnące
od 0 w różnym
tempie
(co pokazano na poprzedniej
tablicy).
y=ax-0.5
a=4
6
a=3
Funkcje potęgowe używane są do przybliżania przebiegu takich
procesów, które:
4 a=2
1.
a=1
rozpoczynają się od 0 a potem rosną zmieniając tempo2wzrostu
0
2. Funkcje
rozpoczynają
się od
, a>0
a potem
maleją do zera
malejące
gdy
i m<0
0
0.5
Podobne do funkcji hiperbolicznych.
1.5
2
1.5
2
X
Y
0
Gdy a<0 mamy zwierciadlane odbicie
funkcji f(x)=-axm względem osi 0X
1
0
-2
-4
-6
-8
-10
0.5
1
a=-1
a=-2
a=-3
a=-4
a=-5
y=ax-0.5
y=ax0.5
X
Funkcje wykładnicze i logarytmiczne
f(x)=mx
f(x)=logmx
określone dla m> 0
określone dla m >0 i m 0m
Funkcja logarytmiczna jest odwrotnością funkcji wykładniczej, logm(mx)=x
Y
Y
Funkcje wykładnicze
są dość
podobne do funkcji potęgowych, tyle że należy zamienić
x
m=5
y=logmx
y=m
2
5
miejscami
parametr z argumentem.
Funkcje
logarytmiczne
są odwrotne do potęgowych.
m=2
4
m=2
1 0<m<1. Dla m=1 jest to funkcja
Funkcje wykładnicze są rosnące dla m>1 i malejące dla
stała.
3
m=10
Są to funkcje przyjmujące wyłącznie
m=1.5wartości dodatnie
0
2
m=0.1
Funkcje logarytmiczne są rosnące dla m>1 i malejące dla 0<m<1. Dla m=1 funkcja
1
m=1
-1
logarytmiczna nie istnieje. Są to funkcje określone dla zbioru liczb dodatnich.m=0.5
0
m=0.5
-2
m=0.1
-2
-1
0
1
2
0
X
0.5
1
1.5
2
X
Dziedziną funkcji wykładniczej jest cały zbiór liczb rzeczywistych, z
zbiorem wartości zbiór liczb rzeczywistych dodatnich.
Dziedziną funkcji logarytmicznej jest zbiór liczb rzeczywistych dodatnich a
zbiorem wartości zbiór liczb rzeczywistych
Wzory dla funkcji wykładniczych i logarytmicznych
Choć przekształcanie wzorów matematycznych nie jest w biologii standardem, zdarza się, że
biolog w swojej pracy musi przekształcić jakieś wzory z potęgami i logarytmami.
Dla funkcji wykładniczych
Dla funkcji logarytmicznych
Napisane tu podstawowe zależności nie wyczerpują wszystkich twierdzeń dotyczących
y które zdarzyło się mnie osobiście
tych funkcji,
logm ( xywykonywać
)  logm x w
 różnych
logm y
m x  y ale
 msąx mtymi,
pracach. Ważne jest też aby zapamiętać, że nie ma wzoru ułatwiającego potęgowanie i
logarytmowanie
( m x ) y  sumy
m xy dwóch liczb lub wyrażeń. log x a  a log x
m
m
x x
Dość istotny jest wzór
że logarytm o pewnej podstawie można przekształcić przez
log x
( m ) x  mpokazujący,

pomnożenie przez pewną stałą na logarytm o innej
podstawie.
logm x  Można zatem posługiwać
się logarytmami o ustalonych z góry podstawach. W naukach
przyrodniczych
przyjęły się
log
 m
następujące logarytmy:
1.
o podstawie 2: log2x
2.
o podstawie równej stałej e=2.71828... , tzw. logarytm naturalny: ln(x)
3.
o podstawie równej 10: log10x lub log(x)
x
Związek między funkcjami
wykładniczymi i logarytmicznymi
log m m  x
m
logm x
x
Rodzina funkcji wykładniczych
f(x)=ambx dla a, b i m+
Rodzina funkcji wykładniczych pozornie zawiera trzy różne parametry. Ale ponieważ m=elnm to
ambx=ae(blnm)x. Liczby blnm
przebiegają funkcji
cały zbiór liczb
rzeczywistych
i można je zastąpić
Dziedziną
jest

jednym parametrem o tej własności. Rodzina funkcji wykładniczych jest zatem
Zbiorem wartości jest +
dwuparametrowa.
Wystarczy
rozpatrywać
dwuparametrową:
Stosowanie
stałej e jakorodzinę
uniwersalnej
podstawy funkcji logarytmicznych jest standardem w
Y
Y
biologii i inne podstawy używane bx
są znacznie rzadziej (pojawia się czasem 2x, częściej
f(x)=ae
dla a, b
10x). Czasem też funkcje wykładnicze nazywa się exponentialnymi. W pracach
anglosaskich stosowana jest nazwa funkcji exp(x),
co oznacza po prostu ex i należy to
x
e =exp(x)
zapamiętać. Nazwa expUWAGA!!!
jest uniwersalna, pojawia
się w programach komputerowych,
tekstach naukowych, czasem w prasie.
.exp(bx) dla a, b
f(x)=a
Funkcje wykładnicze są monotoniczne (rosnące dla a>0, malejące dla a<0, stałe dla a=0), dla
x=0 przyjmują
b. Przybliżają procesy,
które są określone
a=3 a=2
1.5 1 dla2wartości
y=ae0.5x wartość równą
5 b=-2 -1 -1.5
5
ujemnych i dodatnich, ale mają zawsze wartości dodatnie oraz takie, które są określone
a=1.5
4
4
wprawdzie
tylko dla wartości dodatnich
ale rozpoczynają
się dla określonej różnej od zera
3 (np. procent osobników przeżywających3 dany czas – zaczyna się od 100 a wraz
wartości
a=1
y=2ebx
z upływem
czasu maleje do 0).
2
2
a=0.5
1
1
0
a=0.1
0
-2
-1
0
1
2
-2
X
-1
0
X
1
2
Rodzina funkcji logarytmicznych
f(x)=aln(x)+b dla a, b
Dziedziną funkcji jest +
Rodzina funkcji logarytmicznych
przypomina
rodzinę funkcji
liniowych, z tym tylko, że parametr
Zbiorem
wartości
jest

x jest tu logarytmowany. Powoduje to, że funkcje te zmieniają tempo wzrostu (spadku) na
wolniejsze (zwalniają).
Y
Y
Stosowane są w biologii dla procesów:
4 y=2lnx+b
y=alnx+2
a=5
b=2
b=1
10
1. przyjmujących wartości dodatnie i malejące do 0 albo rosnące od 0 dla pewnego b=0
2
b=-1
a=2
większego5od 0 argumentu
b=-2
0
2. przyjmujących
dowolne wartości rzeczywiste, których0 wzrost (spadek) przebiega
a=-2
początkowo
-5 szybko, a potem zwalnia.
-2
a=-5
-10
-4
0
1
2
3
4
5
0
X
1
2
3
X
4
5
Rodzina funkcji logistycznych
f(x)=1/(1+exp(-(ax+b))) dla a, b
Dziedziną funkcji jest 
Funkcje logistyczne należą do grupy funkcji o kształcie „esowatym” i stosowane są wszędzie
tam, gdy zbór wartości
funkcji jest
ograniczony
ze względu
na swoją definicję (np. są nimi
Zbiorem
wartości
przedział
(0,1)
prawdopodobieństwa). Wydawałoby się, że wstawiony znak - w mianowniku przy
potędze liczby e, jest niepotrzebny. Nie mniej taka notacja powoduje, że przebieg funkcji
logistycznej f(x) można kojarzyć z przebiegiem funkcji liniowej y=ax+b. Gdy a>0 to
b= -2
a=1
1
1
funkcja liniowa
y=ax+b oraz funkcja
logistyczna
rosną.
Gdy
a<0
obie
te
funkcje
b= -1 maleją.
a=0.5
Y
Y
b= 0
0.75
0.75
Rodzina funkcji logistycznych ma szereg uogólnień związany z rozważaniem b=
trzeciego
1
b=
2
0.5 A>0, tak aby wartości
0.5się od 0 do A. Często tez rozważa
parametru
funkcji mieściły
się
a=0.1
a=
-0.1
funkcje
dane takim samym wzorem, jak funkcje
0.25
0.25logistyczne, ale nie koniecznie
a= -0.5
obustronnie ograniczone. Uzyskuje
logistyczna zapisana jest w postaci
a= -1 się je, gdy funkcja
0
0 .
f(x)=A/(1+b exp(-ax))) i rozważany będzie parametr b<0.
-5 -3 -1funkcji
1 3logistycznych
5
-5 -3 -1 1 rodzina
3 5 funkcji
Ciekawym uogólnieniem X
jest czteroparametrowa
X
.
m
Richardsa: f(x)=1/(1+b exp(-ax)) obejmująca większość „esowatych” funkcji
rozważanych dla opisu wzrostu (długości, objętości, masy) osobników: funkcji
Bertalanfy’ego (m=2/3) i Gompertza
(m0).
Uogólnienia:
f(x)=A/(1+exp(-(ax+b)))
dla A +, a, b
f(x)=A/(1+b.exp(-ax))
dla A +, a, b
f(x)=A/(1+b.exp(-ax))m dla A +, a, b, m
Rodzina funkcji normalnych
 (x  m ) 2 
1
+
dla m,
 w biologii,
f ( x ) są
 chyba najczęściej
exp 
Funkcje normalne
używane
choć s
czasem ich użytkownicy nie

2s one
s sprawy.
2
zdają sobie z tego
Przybliżają

 gęstości rozkładu większości zmiennych
Y
Y
„pomiarowych” np. długości
jakiś organów,
masy, objętości,
i
Dziedziną
funkcji
jest  stężeńpierwiastków
1
 innych.
związków niezbędnych do budowy materii żywej (tzw. fizjologicznych)
0, i szeregu


wartości
przedział
Zmienne te obok tego, że Zbiorem
mają wartości
rzeczywiste
(mowa o wielkościach
bez
 s 2  błędu
pomiarowego) to jeszcze charakteryzują się pewną średnią wartością, najczęstszą
wartością wokół której można spodziewać
rozrzutu.
s= 1 się pewnego
s=
0.5
1 m= 1
-2 -1 0 związane
1 2
Używanie 0.4
funkcji m=
normalnych
jest ze stosowaniem
0.8 w pracach testów 0.5
0.7 p
parametrycznych. Przypominam, że testy służą do0.6
wyliczania stopnia istotności
0.3
1
służącego do oceny zdań pojawiających się w wynikach pracy. Testy parametryczne
0.4
1.5
będą0.2
przerabiane na statystyce, jako że pojawiają się bardzo często w pracach
0.2
2
0.1
biologicznych.
Należy przy tym pamiętać, że wiąże się to z określonym patrzeniem
na
0
przyrodę.
0
-5 rozkładów
-3 -1granicznych
1
3 dla 5
-5 pojawiają
-3
-1 się w1probabilistyce
3
5 jako gęstości
Funkcje normalne
X
X
innych rozkładów, przy wyliczaniu
gęstości rozkładu błędu przypadkowego, w prawach
wielkich liczb i innych twierdzeniach, o których będzie jeszcze mowa. Uzasadnia to
patrzenie na rozkłady wielu wielkości pomiarowych, jako na rozkłady normalne, nawet
Pole powierzchni
obszaru
między
wykresem,
a osią podczas
0X jest gdy
zawsze
równe
1 !!!
wtedy gdy przybliżamy
nimi
wielkości
zawsze dodatnie,
rozkład
normalny
określony jest dla wszystkich liczb rzeczywistych .
Rodziny funkcji trygonometrycznych
f(x)=bcos(ax)=bsin(ax-/2) dla a, b
Dziedziną funkcji jest 
Zbioremsię
wartości
[-b,b] funkcje sinus i
Funkcje trygonometryczne pojawiające
w biologii przedział
– to przede wszystkim
cosinus służące do przybliżania procesów zmieniających się cyklicznie (wielkości
zmieniających się w cyklu dobowym lub rocznym). Bardzo rzadko używa+się funkcji
f(x)=tg(ax+b)=ctg(ax+b-/2)
dla a,
b to tangent (tak
tangens i cotangens.
Warto jednak zapamiętać, że tangens
po angielsku
samo jak styczna) i w krajach angielskojęzycznych stosowany jest czasem skrót tan.
   2b   2b 
,
Dziedziną
funkcji(tzw.
jestfunkcje
przedział


Funkcje odwrotne do
trygonometrycznych
cyklometryczne)
to arcussinus
2
a
2
a


(arcsin), arcuscosinus (arccos),
arcustangens
(arctg,
Zbiorem
wartości
jestatan)
 i arcuscotangens (arcctg,
Y
Y
acotan). Funkcji arctg używa się czasem tak, jak funkcji logistycznych – do przybliżania
procesów o ograniczonym zbiorze wartości, których wykres wygląda jak rozciągnięte S.
y=sin(x/)
y=tg(x/)
1
10
0.5
5
0
-0.5
0
-1
-5
0
20
40
-10
X
-5 -3 -1 1
3
5
Inne rodziny funkcji
 (ln x  m ) 2 

f ( xlub
) bardziej złożonymi
exp  wzorami definiuje
Rodzina
funkcjirodzin
lognormalnych
Bardzo
wiele różnych
funkcji danych mniej
się

2
s
x
s
2


dla gęstości rozkładów zmiennych ciągłych. Jedną z nich jest rodzina
funkcji 
1
0.8
Y
logarytmiczno-normalnych określona tylko dla wartości dodatnich. Inne powstają poprzez
wyliczanie
0.6 rozkładu zmiennych o znanym rozkładzie (np. normalnym) przekształconych w
s= 1
odpowiedni sposób.
0.4
m= 0 0.5 1 1.5 2
W modelowaniu procesów biologicznych pojawiają się jeszcze inne rodziny funkcji.
0.2 jednym z mechanizmów regulacyjnych populacji jest zmniejszenie się
Przykładowo
średniej liczby
jednorazowo rodzonych potomków przez samicę przy zmniejszeniu się
0
zasobów w środowisku przypadających na jednego osobnika populacji. Zmniejszenie to
0
5
10
15
20
jest liniowe, ale nie może być
mniejsze
od
zera.
Dla opisania tego procesu używam
X
rodziny funkcji danych podanym wzorem. Są to funkcje prawie liniowe, ale przy
f (x)  ln(
 exp(ax  b))
dochodzenia
do 0 o
zaginają
się i zmierzają
do10.
Rodzina
funkcji
wzorze:
Średnia wielkość
miotu
Wykonany przegląd najbardziej typowych rodzin funkcji nie wyczerpuje wszystkich funkcji
8
pojawiających się w biologii. Zawsze też można zdefiniować
swoją własną rodzinę, np.
2
.
cos (1+exp(ax)) albo ln(10+a cos(x)), itd. Sparametryzowanych
rodzin funkcji jest
6
nieskończenie wiele. Jest ich nieskończenie wiele nawet
wtedy gdy ograniczymy się do
4
rodzin mających jeden parametr.
2
0
0
1
2
Ilość zasobów
3
4
Stosowanie rodzin funkcji danych wzorami w biologii
1. Wybór funkcji z wybranej rodziny do zobrazowania zależności
między
zmiennymi
Funkcje dane
wzorami pojawiają się w biologii często i zawsze są to przedstawiciele jakiejś
arbitralnie wybranej rodziny funkcji, których parametry zostały w odpowiedni sposób
wyliczone. Pokazanie funkcyjnej zależności pewnej charakterystyki zmiennej od innych
zmiennych (tzw. czynnikowych) umożliwia
wyliczanie
tej charakterystyki
dla
Relacja miedzy
X iwartości
Y uzyskana
na podstawie badań
zadanych wartości zmiennych czynnikowych. W praktyce jest to robione dość rzadko.
Najczęściej odpowiedni wzór jest traktowany jako wynik badań. Teoretycznie może on
Funkcja
pokazująca
jak średnie (lub
zbiorcze
być wykorzystany w innych pracach,
ale częściej
jest weryfikowany
lub inna
uzupełniany.
charakterystyki) rozkładów Y zależy od X
W niektórych pracach pojawiają wzory opisujące zależność zmiennych od siebie wyposażone
w parametry, którym nadaje się pewna wartość biologiczną. Zastosowanie takich wzorów
umożliwia wyliczenie wzorów funkcji opisującej przebieg zależności pokrewnych.
Większej liczby przekształceń należy dokonać przy tworzeniu modeli procesów
biologicznych. Zawsze jednak punktem wyjściowym są funkcyjne opisy jakiejś zależności
2. Do
zobrazowania
przebiegu
wynikającej
z
zmiennych
od siebie i najczęściej
są to zależności
wybory jakiś rodzin
funkcji.
przekształcenia wyznaczonej wcześniej funkcji z parametrami (np.
tempa wzrostu/spadku zależności między zmiennymi)
3. Do utworzenia modelu funkcjonowania zjawisk biologicznych
Stosowanie w biologii rodzin funkcji danych wzorami
Wybór sparametryzowanej rodziny
funkcji do opisu jakiejś zależności
Operowanie wzorami w biologii zawsze rozpoczyna się od założenia, że pewien proces
przebiega zgodnie z pewną funkcja wybraną z góry założonej sparametryzowanej
rodziny funkcji. Czasem podpieramy się przy tym literaturą (ktoś po prostu wcześniej
Przekształcenie
używał takiej rodziny funkcji).
Jest to taki etapfunkcji
analizy przyrody, w którym dokonuje się
i wyznaczenie
nowej
pewnych założeń. Nie ma sposobu
by dowieść,
że założenia te są słuszne. Całe więc
dalsze rozumowanie polegające
na dopasowaniu danych do któregoś przedstawiciela
zależności
wybranej rodziny funkcji, albo przekształcanie funkcji tak by wyprowadzić wzory dla
innych zmiennych, ma charakter logicznej implikacji:
Jeżeli założymy, że dany proces przebiega zgodnie z funkcjami ...., to .....
Dopasowanie funkcji do
danych (wyznaczenie
wartości parametrów tak aby
uzyskać funkcje najlepiej
dopasowana do danych)
czasami
Wielokrotne przekształcenia
sparametryzowanych funkcji
i utworzenie modelu
funkcjonowania jakiegoś
procesu
Zobrazowanie zależności zmiennych od siebie
1. Wybór sparametryzowanej
rodziny funkcji
Określenie
kryterium
Jednym z elementów pracy biologa jest dopasowanie 2.
danych
do jakiejś
funkcji wybranej z
arbitralnie określonej rodziny. Co to znaczy?
najlepszego dopasowania
Dane w postaci wyników pomiarów dwóch zmiennych X i Y tworzą na wykresie jakąś chmurę
punktów. Funkcje z wybranej rodziny cechują się jakąś zmiennością kształtu i niektóre są
3. Wyznaczenie parametrów, dla
lepiej, inne gorzej dopasowane do danych. Czasami widać, że niektóre rodziny funkcji nie
którychalefunkcje
zadanej
rodziny
zupełnie odpowiadają rozkładowi punktów na wykresie,
wiele z zrodzin
funkcji
ma
kryterium
najlepszegosię
przedstawicieli przebiegających bardzo podobniespełniają
o wykresach
wręcz nakładających
na przedstawicieli rodzin innych funkcji. Jaką rodzinę
funkcji wybrać?
dopasowania
Kolejna rzecz, która wpływa na ostateczny wynik – to kryterium najlepszego dopasowania
funkcji do danych. Można ich wymyślić bardzo wiele, ale na szczęście przyjęło się tylko
jedno.
Kryteria
wyboru sparametryzowanej
funkcji do
Przy wyborze
sparametryzowanej
rodziny funkcji kierujemy się rodziny
fizycznymi własnościami
analizowanych zmiennych.
Większość zmiennych
fizycznych
jak masa ciała,
opisu zależności
zmiennych
od(takich
siebie
długość, temperatura, prawdopodobieństwo) ma ograniczony zbiór wartości. Gdy
uzależniamy zmiany wartości takich zmiennych od wartości innej zmiennej – najlepiej jest
1. Zgodność
z fizycznymi
własnościami
zmiennych
(jeżelisięzmienne
mogą
wybrać rodzinę
funkcji mających
zawsze wartości
mieszczące
w odpowiednim
przyjmować
tylkoteżwartości
dodatnie
niejednej
używamy
funkcji
przyjmujących
przedziale. Często
wiemy, że
zależność
zmiennej
od drugiej
ma charakter
monotoniczny.
Ograniczamy się wtedy do takiej rodziny funkcji, które są monotoniczne.
wartości ujemne)
W najlepszej sytuacji są ci, którzy operują rodziną funkcji wynikającą z modelu
funkcjonowania
jakiegośwłasnością
zjawiska. Jest
to jednak dość
rzadkie.od siebie (jeżeli jedna
2. Zgodność
z fizyczną
zależności
zmiennych
zmienna
może- to
powodować
tylko wzrost/spadek
wartości
drugiej zmiennej
Innego
typu kryteria
mała liczba parametrów
lub ich fizyczna
interpretowalność.
Wymóg
ten stoi najczęściej
sprzeczności z trzema pierwszymi kryteriami. Najłatwiej
stosujemy
funkcjew monotoniczne)
interpretować parametry funkcji liniowych, ale funkcje liniowe są nieograniczone. W
3. Zgodność
z modelem
funkcjonowania
zjawiska
praktyce zatem
stosuje się
głównie kryteriumjakiegoś
6. Robi się
dokładnie to, co zrobili już inni,
co zostało opublikowane w pracach naukowych, a wiec zaakceptowane przez
4. Mała
liczba iparametrów
recenzentów
redakcję pisma naukowego. Oczywiście takie postępowanie nie jest
obowiązkowe. Wszelkie nowe pomysły, na lepszy od stosowanego do tej pory opis
5. Taki
charakter
parametrów,
można
imstudentów
było nadać
interpretację
zależności
zmiennych
od siebie,aby
są w
pracach
jak najbardziej
wskazane.
biologiczną (np. przy stosowaniu rodziny funkcji liniowych y=ax+b parametr
Szybkość współczesnych komputerów powoduje, że często można wyznaczyć najlepiej
adopasowane
jest tempem
wzrostu/spadku
jednej
zmiennej
od drugiej)
funkcje
pochodzące zzależności
różnych rodzin.
Wydaje
się zatem,
że wybranie
funkcji której przedstawiciel najlepiej pasuje do danych, jest jakimś kryterium
6. rodziny
Rodziny
funkcji, które były stosowane przez innych badaczy w
wyboru sparametryzowanej rodziny funkcji. Nie jest to żadne kryterium. Po pierwsze, nie
opublikowanych
pracach
jesteśmy wstanie wykryć
w ten sposób prawdziwej funkcji stosowanej przez przyrodę. Po
drugie, nie ma możliwości przejrzenia wszystkich sparametryzowanych rodzin funkcji –
7. Przejrzenie
kilku rodzinwiele.
funkcji
i wybranie
takiej,
dla której
uzyskuje
się
bo jest ich nieskończenie
W dodatku
dla każdej
wybranej
rodziny
funkcji można
najlepsze
wg. przyjętego
kryterium
zdefiniowaćdopasowanie
inną rodzinę, której
przedstawiciele
są jeszcze lepiej dopasowani do danych.
Kryteria najlepszego dopasowania
Kryteria najlepszego dopasowania powinny byś oparte o odległości punktów od wykresu
funkcji i być określone taka formułą (funkcja wieloczynnikową F), która względem
Suma odległości danych wyrażonych w
pojedynczego argumentu (przy ustalonych wartościach pozostałych) jest funkcja
postaci punktów od wykresu funkcji
rosnącą. Funkcji takich jest bardzo dużo.
była jak najmniejsza
Kolejny problem polega na określeniu co rozumiemy przez odległość punktu od wykresu
funkcji. Najprostsze stwierdzenie, że jest to minimalna odległość punktu od tego wykresu
– daje dość skomplikowaną procedurę obliczeniową.
Odległości można
wyznaczać
Suma kwadratów
odległości
danych
biorąc pod uwagę rzuty pionowe lub poziome punktów na wykres funkcji.
wyrażonych w postaci punktów od
Każda z funkcji F oraz przyjęty rodzaj wyliczania odległości
nieco była
inne funkcje
wybrane z
wykresudaje
funkcji
jak najmniejsza
ustalonej rodziny jako spełniające warunek najlepszego dopasowania.
W naukach przyrodniczych przyjęło się określanie odległości jako długość rzutów pionowych
Inne definicje w oparciu o funkcje
Różne
sposoby
definiowania
punktów
na wykres
funkcji i funkcja F równa sumie kwadratów tych odległości. Ten
F(r1rodziny
,...,rn) rosnące
wzroście
sposób wyznaczania
najlepiej przy
dopasowana
do każdej
odległości
punktówparametrów
od wykresufunkcji z danej
danych nazywa się metodą najmniejszych kwadratów.
Jejrstosowanie
ma swoje
odległości
1,...,rn
funkcji
statystyczne uzasadnienie (wyznaczone w ten sposób funkcje są najlepszym
przybliżeniem tzw. regresji
n n i dlatego nazywane są często regresjami).
SK
S
K

(f a(,bf a(,xb i()x
i )y2i ) 2
i )y
osiąga
osiąga
minimum
minimum
Z metodą najmniejszych kwadratów
wiąże się także
wskaźnik
dopasowania funkcji do danych
i 1 i 1
nazywany wsp. determinacji lub kwadratem wsp. korelacji. Dla najlepiej dopasowanej
SK
SK
2 jest
2
miara
funkcji z danej rodziny
Metoda
stosowana
jest przy wyliczaniu
y y- śre
- ta
śre
dnia
dnia miara
RR


1
1od
nmaksymalny.
n
tzw. trendów w Excelu.
dopasowania
dopasowania
( y(iyi 
y )y ) 2

i 1i 1
Przykład 1
Zimowy ciężar ciała
[g]
Zimowy ciężar ciała
[g]
Kość skokowa u ptaków wróblowatych rośnie tylko w pierwszych dwóch-trzech tygodniach
życia i zależy od warunków panujących w okresie pisklęcym ptaków. Mierząc w okresie
zimowym
długość kości skokowej i ciężar
całego
ptaka możemy pokazać jak okres
y = 0.6348x
+ 10.436
25
pisklęcy
Na wykresach pokazane są
R2osobników.
= 0.3966
24 istotnie wpływa na ciężar dorosłych
wyniki
złowionych
w czasie
Różne
rodziny
funkcji
23 ważeń i pomiarów 76 mazurków (Passer montanus)
noclegów
w
budkach
w
okresie
od
grudnia
do
lutego.
Chce
za
pomocą
funkcji
pokazać
22
i
metoda
najmniejszych
y = 0.0142x6 - 1.5763x5 +
jak długość
kości skokowej wiąże się ze średnim
ciężarem ptaków. Nie mam żadnej
21
72.535x4 - 1776.7x3 +
kwadratów
gwarancji,
że jest to funkcja liniowa. Zastosowanie
wielomianów
stopnia szóstego daje mi
20
24430x2 - 178801x +
funkcję15cechującą
dopasowaniem.
Ale
wahania tej funkcji nie potrafiłabym w
544167
17 się lepszym
19
21
żaden sposób uzasadnić. Funkcja liniowa pozwala
mi na stwierdzenie, że przy zmianie
R2 = 0.4272
Długość
kości
skokowej
[mm]
długości kości skokowej o 1mm zimowy ciężar ptaków wzrośnie średnio o 0.6g.
Interpretacja przebiegu wielomianu byłaby bardzo skomplikowana i nie wzbudzałaby
wiarygodności
(w końcu mamy tylko trochę zbadanych ptaków i pomiary z dokładnością
28
do 0.5mm i 0.01g, a wyciągamy wnioskiy =dla
całej
populacji i dokładnych wartości).
0.6348x
+ 10.436
26
R2 = 0.3966
Zastosowanie
innych
kryteriów
najlepszego
dopasowania
dla funkcji
liniowych
daje
funkcje
Rodziny
funkcji
liniowych
24
znacznie różniące się od siebie. Różowym kolorem zaznaczono
uzyskaną
przy
i różneprostą
kryteria
dobrego
22
1.6005x - 7.2947 od wykresu funkcji ma mieć wartość
warunku, że suma kwadratów odległościy =poziomych
dopasowania
funkcji
20
minimalną.
Przy stosowaniu takiego kryterium
że wzrost długości skoku o
R2 =twierdziłabym,
0.3966
15
19 ciężaru
21 zimowego mazurków o 1,6g.
1mm wiąże
się 17
ze wzrostem
Długość kości skokowej [mm]
Przykład 2
Opad materii organicznej
-2 -1
g.m .y
Na wykresie przedstawiono masę materii organicznej opadającą w ciągu roku na ziemię w
lasach sosnowych występujących od górnej granicy występowania
sosen
(w Finlandii) po
Różne kryteria
dopasowania
rejony Polski. Ponieważ wiadomo z literatury, że tempo opadu materii organicznej
wzrasta z północy na południe, do opisania zależności między masą materii organicznej
600
spadającej
na ziemię, a szerokością geograficzną zastosowano rodzinę funkcji
n
wykładniczych:
y=b.exp(ax).
500
2
Rodzina
400funkcji wykładniczych ma te własność, że
ln(y)=ln(b
300 .exp(ax))=ln(b)+ln(exp(ax))=ln(b)+ax=ax+ln(b)
 (axi  ln(b)  ln(y i ))
i 1
osiąga minimum
Zależność
200 między zlogarytmowanymi wartościami masy materii organicznej, a szerokością
-0.08x
geograficzną jest liniowa. Możemy
wyliczyć
współczynniki regresji liniowej między tymi
y = 32971e
R2 = 0.81
100
-0.06x
wielkościami. Współczynnikya= jest
nachylenia regresji, a
8617erówny
R2współczynnikowi
= 0.64
n
0
współczynnik
b wyliczymy za pomocą funkcji exp od wyrazu wolnego tej regresji.
Rzecz
2
(
b
e
xp(
ax
)

y
)
i
ikwadratów.
70 że takie
65 postępowanie
60
55 jest stosowaniem
50
w tym,
nie
metody najmniejszych
i 1
Funkcja wyliczona
właściwą
metodą najmniejszych kwadratów
ma inne wartości
Szereokość
geograficzna
parametrów.
osiąga minimum

W programach takich jak Excel czy arkusz kalkulacyjny Open-Office przy wyliczaniu trendów
na wykresach stosowane są różne przekształcenia zmiennych, tak aby stosowana
rodzina funkcji stała się liniowa i dopiero dla takich zmiennych wyliczana jest regresja.
Należy pamiętać, że nie jest to to samo, co metoda najmniejszych kwadratów
zastosowana dla nieliniowych rodzin funkcji.
Na koniec pozostaje wyjaśnienie
jak wyliczamy
regresje. regresji
Przede wszystkim należy pogodzić się
Metody
wyliczania
z tym, że w biologii nie jest ważna znajomość wzorów i sposobów ich wyprowadzania dla
określonych wielkości i charakterystyk, ale poprawność ich wyliczania. Mamy teraz do
Regresja
liniowa
(wzory)
dyspozycji
komputery
i obowiązuje was umiejętność wyliczania regresji zarówno liniowych
n pomocą
jaki nnieliniowych
odpowiednich programów. Liniowe regresje wyliczyć jest
  n  za

n  x i y i     x i   y i 
n
n
parametrów a i b. Wzory istnieją także dla regresji
najłatwiej
– są
dla
1  wzory
i 1
i 1 wyprowadzone
i 1







b

y

a
x
a


i
i

2
n
n
n
wielomianowych
i
są
to
już
wszystkie
funkcje
o tej własności.
i 1
 i 1



2 
n  x i     x i 
i 1
  i 1 pozostałych

Parametry wszystkich
regresji nieliniowych wyznacza się metodami numerycznymi.
Oznacza to, że po przyjęciu jakiś wartości początkowych dla parametrów za pomocą
odpowiedniego algorytmu wylicza się kolejne parametry tak aby suma kwadratów odchyleń
danych od funkcji była mniejsza, dla nich znowu kolejne parametry itd. Postępuje się tak
Regresja
nieliniowa
(metodyodchyleń
numeryczne)
dotąd, dokąd
suma kwadratów
danych od funkcji przestaje się zmniejszać.
kilka algorytmów wyliczania parametrów, przy czym metoda Gaussa-Newtona jest
1. Istnieje
Metoda
największego spadku
Uwaga!!!
poprawionym algorytmem największego spadku, metoda Levenberga-Marquardta jest
algorytmem Gaussa-Newtona. Poprawki
te polegały
i wyłącznie na
2. poprawionym
Metoda Gaussa-Newtona
Należy
znaleźćtylko
przybliżone
zwiększeniu szybkości uzyskiwania wyniku, ale jego wartość pozostawała taka sama.
wartości parametrów!!!
3.
Metoda
Levenberga-Marquardta
Uwaga, metody te polegają na wyliczaniu minimum lokalnego, zależą zatem od wartości
początkowych wprowadzonych parametrów. Bywa, że trzeba rozważyć kilka zestawów
wartości początkowych aby wykryć rzeczywiste minimum. Są też takie złośliwe rodziny
funkcji Wszystkie
(tzw. K-funkcje),
dla
których suma
kwadratów
odchyleń
danych od funkcji ma
te
metody
dają
ten
sam
wynik!!!
nieskończenie wiele minimów lokalnych. Wynik stosowania opisanych metod jest inny za
każdym wprowadzeniem parametrów początkowych. Wtedy pozostaje już tylko wyliczanie
sumy kwadratów odchyleń danych od funkcji przy krokowych zmianach wartości
parametrów i wybieranie takiego zestawu parametrów dla której suma ta była najmniejsza.
Robi się to oczywiście za pomocą programów komputerowych.