Transcript Wyklad 3
Wykład 3 Sparametryzowane rodziny funkcji Funkcjeżetworzone przez przyrodę Na poprzednim wykładzie mówiłam, istnieją funkcje tworzone przez przyrodę. Istnieją one w takim samym sensie w jakim istnieją populacje nieskończone złożone z osobników istniejących i tych które mogłyby zaistnieć w danych warunkach środowiska. Jest to takie same istnienie jak istnienie punktu materialnego poruszającego się swobodnie w próżni, punktu o zerowych wymiarach czy nieskończonej płaszczyzny o zerowej grubości. Warunki środowiska Mierzalne cechy środowiska dają przedział liczbowy (każda z tych liczb określa jakieś warunki środowiska), a każdej z tych liczb przyporządkowany jest rozkład cechy populacji, jaka w takich warunkach środowiska mogłyby zaistnieć. Z rozkładem tym wiążemy jedna wartość charakteryzująca w określony sposób rozkład i uzyskujemy funkcję. Takie patrzenie na przyrodę pozwala na badanie wpływu określonych warunków środowiska Cechy populacji (wiadomo, że nie jesteśmy w stanie określić wszystkich warunków, a co więcej próba określenia wszystkich cech środowiska niczemu by nie służyła) i traktowanie żyjącej populacji jako jednej z wielu, które mogłyby w określonych warunkach zaistnieć. Jest to tworzenie wiedzy, która poprzez swoją ogólność może mieć zastosowanie w różnych Rozkład środowiskach dla różnych populacji. cecha cechy Jakie są funkcje tworzone przez przyrodę? Dla danych warunków środowiska określonych środowiska liczbami (np. stężeniem azotu w glebie) populacja tam żyjąca mogłaby się cechować populacji określonym rozkładem jakiejś cechy (np. długościami pędów, które tworzyłyby określony rozrzut wokół pewnej wartości średniej). Małe zmiany warunków środowiska dawałyby minimalne zmiany rozkładu określonej cechy populacji, a zatem i określone Charakterystyka cecha charakterystyki rozkładu niewiele różniłyby się od siebie. Funkcja przyporządkowująca rozkładu cechy cechom środowiska określona charakterystykę rozkładu (np. średnią długość pędu) po środowiska pierwsze istnieje, po drugie jest tworzona populacji przez warunki środowiska i zakodowaną w genach osobników odpowiedź populacji na te warunki, po trzecie byłaby ciągła i różniczkowalna. Sparametryzowane rodziny funkcji rzeczywistych Funkcje liniowe: f(x)=ax+b Funkcje tworzone przez przyrodę nie muszą wyrażać się jakimkolwiek wzorem Rodzina funkcji określona dlajewszystkich par liczb (a,b)ℝ2określonymi wzorami, co matematycznym, ale można przybliżać funkcjami wyrażanymi wynika z twierdzenia Weierstrassa. Posługujemy się wtedy sparametryzowanymi rodzinami funkcji, które są niczym innym jak zbiorem wszystkich funkcji o określonym n-1+...+a x+a wzorze, w którym zastępujące pewne liczby. Wielomiany: f(x)=awystępują xn+a xparametry n n-1 1 0 Typowe rodziny funkcji pokazane wyświetlone na tablicy są dobrze wam znane z lekcji n+1 Rodzina funkcji określona dla wszystkich nℕ i ciągów (an,an-1,...,,a1,a0) ℝ matematyki. Sparametryzowane rodziny funkcji mogą być mniej lub bardziej obszerne, w tym sensie, że te n tych bardziej n -1 mniej obszerne zawierają asięx w obszernych. Funkcje liniowe zawierają się a x ... a x a n n 1 1 0 Funkcje wymierne: w rodzinie wielomianów, zawierają się w rodzinie funkcji wymiernych. f(x) a wielomiany k k -1 Czasem w pracy posługujemy b k x się bjakąś x ... bfunkcji k -1 rodziną 1 x b 0nie mającą ogólnie przyjętej nazwy.funkcji Rozważanie szczególnej rodziny funkcji wymaga jej zdefiniowania pracy –n+1 Rodzina określona dla wszystkich nℕ i ciągów (an,an-1,...,,aw 1,a0) ℝ wystarczy podanie wzoru z parametrami. Przy poszukiwaniu funkcji „tworzonych przez przyrodę” posługujemy się rodzinami funkcji w których jest możliwie mało parametrów – najczęściej jeden lub dwa. Zrobimy przegląd 2 określona Rodzina paraboli: f(x)=ax wszystkich aℝ różnych najczęściej spotykanych rodzin funkcji wdla pracach biologicznych. Rodzina hiperboli: f(x)=a/x określona dla wszystkich aℝ Funkcje potęgowe i pierwiastkowe f(x)=xm Y Y Potęgi znane są wszystkim ze szkoły. Najlepiej znane jest podnoszenie do potęgi wyrażającej się liczbą naturalną j jest to mnożenie liczby z tyle razydodatnich na ile wskazuje Dziedziną funkcji jest zbiórprzez liczbsiebie rzeczywistych ℝ+to potęga. Możemy to robić dla dowolnych liczb rzeczywistych x, ujemnych i dodatnich. Potęga wyrażająca się ułamkiem m/n (gdzie m i n są liczbami naturalnymi) – to m= 3 2 x1.5podniesionej 1 2 pierwiastek stopnia nm=10 z liczby do m-tej2 potęgi. Symbol pierwiastkowania -0.1 zastąpić zawsze można symbolem potęgi 0.666 (w pracach biologicznych stosuje się symbol pierwiastka w zasadzie tylko dla pierwiastków kwadratowych, pisanych bez 2). -0.333 1.5 1.5 0.5 -0.5 Pierwiastkować można liczby dodatnie i 0. Można rozważać potęgowanie do liczb 0.333 -0.666przy ujemnych i pokazana na dole formuła w biologii, przykładowo 0.1jest często stosowana 1 1 zapisie jednostek (coś na sekundę pisze się mnożąc jednostkę tego „coś” przez s-1-1, coś -1.5 na m2 pisze się mnożąc przez m-2). 0.5 0.5 -2 Czasami posługując się funkcjami potęgowymi biolog musi je przekształcać. Służą do-3 tego wzory 0podane na tablicy. 0 -10 0 0.5 1 1.5 2 0 0.5 1 1.5 2 X X 1 x m m x x m 1 m x x m x m x (xy) m x m y m Rodzina funkcji potęgowych f(x)=axm dla a i m Dziedziną funkcji jest + Zbiorem wartości funkcji jest + (dla a>0) albo - (dla a<0) - rosnące szybciej od y=x gdy m>1 - rosnące wolniej od y=x gdy m<1 Y Rodzina funkcji potęgowych wyraża się podanym wzorem. Są tu dwa parametry rzeczywiste, y=ax0.5 10 m jest ujemna) lub funkcje które dają funkcje podobne do hiperbolicznych (gdy liczba a=5 Funkcje gdy a>0 i m>0 8 rosnącerosnące od 0 w różnym tempie (co pokazano na poprzedniej tablicy). y=ax-0.5 a=4 6 a=3 Funkcje potęgowe używane są do przybliżania przebiegu takich procesów, które: 4 a=2 1. a=1 rozpoczynają się od 0 a potem rosną zmieniając tempo2wzrostu 0 2. Funkcje rozpoczynają się od , a>0 a potem maleją do zera malejące gdy i m<0 0 0.5 Podobne do funkcji hiperbolicznych. 1.5 2 1.5 2 X Y 0 Gdy a<0 mamy zwierciadlane odbicie funkcji f(x)=-axm względem osi 0X 1 0 -2 -4 -6 -8 -10 0.5 1 a=-1 a=-2 a=-3 a=-4 a=-5 y=ax-0.5 y=ax0.5 X Funkcje wykładnicze i logarytmiczne f(x)=mx f(x)=logmx określone dla m> 0 określone dla m >0 i m 0m Funkcja logarytmiczna jest odwrotnością funkcji wykładniczej, logm(mx)=x Y Y Funkcje wykładnicze są dość podobne do funkcji potęgowych, tyle że należy zamienić x m=5 y=logmx y=m 2 5 miejscami parametr z argumentem. Funkcje logarytmiczne są odwrotne do potęgowych. m=2 4 m=2 1 0<m<1. Dla m=1 jest to funkcja Funkcje wykładnicze są rosnące dla m>1 i malejące dla stała. 3 m=10 Są to funkcje przyjmujące wyłącznie m=1.5wartości dodatnie 0 2 m=0.1 Funkcje logarytmiczne są rosnące dla m>1 i malejące dla 0<m<1. Dla m=1 funkcja 1 m=1 -1 logarytmiczna nie istnieje. Są to funkcje określone dla zbioru liczb dodatnich.m=0.5 0 m=0.5 -2 m=0.1 -2 -1 0 1 2 0 X 0.5 1 1.5 2 X Dziedziną funkcji wykładniczej jest cały zbiór liczb rzeczywistych, z zbiorem wartości zbiór liczb rzeczywistych dodatnich. Dziedziną funkcji logarytmicznej jest zbiór liczb rzeczywistych dodatnich a zbiorem wartości zbiór liczb rzeczywistych Wzory dla funkcji wykładniczych i logarytmicznych Choć przekształcanie wzorów matematycznych nie jest w biologii standardem, zdarza się, że biolog w swojej pracy musi przekształcić jakieś wzory z potęgami i logarytmami. Dla funkcji wykładniczych Dla funkcji logarytmicznych Napisane tu podstawowe zależności nie wyczerpują wszystkich twierdzeń dotyczących y które zdarzyło się mnie osobiście tych funkcji, logm ( xywykonywać ) logm x w różnych logm y m x y ale msąx mtymi, pracach. Ważne jest też aby zapamiętać, że nie ma wzoru ułatwiającego potęgowanie i logarytmowanie ( m x ) y sumy m xy dwóch liczb lub wyrażeń. log x a a log x m m x x Dość istotny jest wzór że logarytm o pewnej podstawie można przekształcić przez log x ( m ) x mpokazujący, pomnożenie przez pewną stałą na logarytm o innej podstawie. logm x Można zatem posługiwać się logarytmami o ustalonych z góry podstawach. W naukach przyrodniczych przyjęły się log m następujące logarytmy: 1. o podstawie 2: log2x 2. o podstawie równej stałej e=2.71828... , tzw. logarytm naturalny: ln(x) 3. o podstawie równej 10: log10x lub log(x) x Związek między funkcjami wykładniczymi i logarytmicznymi log m m x m logm x x Rodzina funkcji wykładniczych f(x)=ambx dla a, b i m+ Rodzina funkcji wykładniczych pozornie zawiera trzy różne parametry. Ale ponieważ m=elnm to ambx=ae(blnm)x. Liczby blnm przebiegają funkcji cały zbiór liczb rzeczywistych i można je zastąpić Dziedziną jest jednym parametrem o tej własności. Rodzina funkcji wykładniczych jest zatem Zbiorem wartości jest + dwuparametrowa. Wystarczy rozpatrywać dwuparametrową: Stosowanie stałej e jakorodzinę uniwersalnej podstawy funkcji logarytmicznych jest standardem w Y Y biologii i inne podstawy używane bx są znacznie rzadziej (pojawia się czasem 2x, częściej f(x)=ae dla a, b 10x). Czasem też funkcje wykładnicze nazywa się exponentialnymi. W pracach anglosaskich stosowana jest nazwa funkcji exp(x), co oznacza po prostu ex i należy to x e =exp(x) zapamiętać. Nazwa expUWAGA!!! jest uniwersalna, pojawia się w programach komputerowych, tekstach naukowych, czasem w prasie. .exp(bx) dla a, b f(x)=a Funkcje wykładnicze są monotoniczne (rosnące dla a>0, malejące dla a<0, stałe dla a=0), dla x=0 przyjmują b. Przybliżają procesy, które są określone a=3 a=2 1.5 1 dla2wartości y=ae0.5x wartość równą 5 b=-2 -1 -1.5 5 ujemnych i dodatnich, ale mają zawsze wartości dodatnie oraz takie, które są określone a=1.5 4 4 wprawdzie tylko dla wartości dodatnich ale rozpoczynają się dla określonej różnej od zera 3 (np. procent osobników przeżywających3 dany czas – zaczyna się od 100 a wraz wartości a=1 y=2ebx z upływem czasu maleje do 0). 2 2 a=0.5 1 1 0 a=0.1 0 -2 -1 0 1 2 -2 X -1 0 X 1 2 Rodzina funkcji logarytmicznych f(x)=aln(x)+b dla a, b Dziedziną funkcji jest + Rodzina funkcji logarytmicznych przypomina rodzinę funkcji liniowych, z tym tylko, że parametr Zbiorem wartości jest x jest tu logarytmowany. Powoduje to, że funkcje te zmieniają tempo wzrostu (spadku) na wolniejsze (zwalniają). Y Y Stosowane są w biologii dla procesów: 4 y=2lnx+b y=alnx+2 a=5 b=2 b=1 10 1. przyjmujących wartości dodatnie i malejące do 0 albo rosnące od 0 dla pewnego b=0 2 b=-1 a=2 większego5od 0 argumentu b=-2 0 2. przyjmujących dowolne wartości rzeczywiste, których0 wzrost (spadek) przebiega a=-2 początkowo -5 szybko, a potem zwalnia. -2 a=-5 -10 -4 0 1 2 3 4 5 0 X 1 2 3 X 4 5 Rodzina funkcji logistycznych f(x)=1/(1+exp(-(ax+b))) dla a, b Dziedziną funkcji jest Funkcje logistyczne należą do grupy funkcji o kształcie „esowatym” i stosowane są wszędzie tam, gdy zbór wartości funkcji jest ograniczony ze względu na swoją definicję (np. są nimi Zbiorem wartości przedział (0,1) prawdopodobieństwa). Wydawałoby się, że wstawiony znak - w mianowniku przy potędze liczby e, jest niepotrzebny. Nie mniej taka notacja powoduje, że przebieg funkcji logistycznej f(x) można kojarzyć z przebiegiem funkcji liniowej y=ax+b. Gdy a>0 to b= -2 a=1 1 1 funkcja liniowa y=ax+b oraz funkcja logistyczna rosną. Gdy a<0 obie te funkcje b= -1 maleją. a=0.5 Y Y b= 0 0.75 0.75 Rodzina funkcji logistycznych ma szereg uogólnień związany z rozważaniem b= trzeciego 1 b= 2 0.5 A>0, tak aby wartości 0.5się od 0 do A. Często tez rozważa parametru funkcji mieściły się a=0.1 a= -0.1 funkcje dane takim samym wzorem, jak funkcje 0.25 0.25logistyczne, ale nie koniecznie a= -0.5 obustronnie ograniczone. Uzyskuje logistyczna zapisana jest w postaci a= -1 się je, gdy funkcja 0 0 . f(x)=A/(1+b exp(-ax))) i rozważany będzie parametr b<0. -5 -3 -1funkcji 1 3logistycznych 5 -5 -3 -1 1 rodzina 3 5 funkcji Ciekawym uogólnieniem X jest czteroparametrowa X . m Richardsa: f(x)=1/(1+b exp(-ax)) obejmująca większość „esowatych” funkcji rozważanych dla opisu wzrostu (długości, objętości, masy) osobników: funkcji Bertalanfy’ego (m=2/3) i Gompertza (m0). Uogólnienia: f(x)=A/(1+exp(-(ax+b))) dla A +, a, b f(x)=A/(1+b.exp(-ax)) dla A +, a, b f(x)=A/(1+b.exp(-ax))m dla A +, a, b, m Rodzina funkcji normalnych (x m ) 2 1 + dla m, w biologii, f ( x ) są chyba najczęściej exp Funkcje normalne używane choć s czasem ich użytkownicy nie 2s one s sprawy. 2 zdają sobie z tego Przybliżają gęstości rozkładu większości zmiennych Y Y „pomiarowych” np. długości jakiś organów, masy, objętości, i Dziedziną funkcji jest stężeńpierwiastków 1 innych. związków niezbędnych do budowy materii żywej (tzw. fizjologicznych) 0, i szeregu wartości przedział Zmienne te obok tego, że Zbiorem mają wartości rzeczywiste (mowa o wielkościach bez s 2 błędu pomiarowego) to jeszcze charakteryzują się pewną średnią wartością, najczęstszą wartością wokół której można spodziewać rozrzutu. s= 1 się pewnego s= 0.5 1 m= 1 -2 -1 0 związane 1 2 Używanie 0.4 funkcji m= normalnych jest ze stosowaniem 0.8 w pracach testów 0.5 0.7 p parametrycznych. Przypominam, że testy służą do0.6 wyliczania stopnia istotności 0.3 1 służącego do oceny zdań pojawiających się w wynikach pracy. Testy parametryczne 0.4 1.5 będą0.2 przerabiane na statystyce, jako że pojawiają się bardzo często w pracach 0.2 2 0.1 biologicznych. Należy przy tym pamiętać, że wiąże się to z określonym patrzeniem na 0 przyrodę. 0 -5 rozkładów -3 -1granicznych 1 3 dla 5 -5 pojawiają -3 -1 się w1probabilistyce 3 5 jako gęstości Funkcje normalne X X innych rozkładów, przy wyliczaniu gęstości rozkładu błędu przypadkowego, w prawach wielkich liczb i innych twierdzeniach, o których będzie jeszcze mowa. Uzasadnia to patrzenie na rozkłady wielu wielkości pomiarowych, jako na rozkłady normalne, nawet Pole powierzchni obszaru między wykresem, a osią podczas 0X jest gdy zawsze równe 1 !!! wtedy gdy przybliżamy nimi wielkości zawsze dodatnie, rozkład normalny określony jest dla wszystkich liczb rzeczywistych . Rodziny funkcji trygonometrycznych f(x)=bcos(ax)=bsin(ax-/2) dla a, b Dziedziną funkcji jest Zbioremsię wartości [-b,b] funkcje sinus i Funkcje trygonometryczne pojawiające w biologii przedział – to przede wszystkim cosinus służące do przybliżania procesów zmieniających się cyklicznie (wielkości zmieniających się w cyklu dobowym lub rocznym). Bardzo rzadko używa+się funkcji f(x)=tg(ax+b)=ctg(ax+b-/2) dla a, b to tangent (tak tangens i cotangens. Warto jednak zapamiętać, że tangens po angielsku samo jak styczna) i w krajach angielskojęzycznych stosowany jest czasem skrót tan. 2b 2b , Dziedziną funkcji(tzw. jestfunkcje przedział Funkcje odwrotne do trygonometrycznych cyklometryczne) to arcussinus 2 a 2 a (arcsin), arcuscosinus (arccos), arcustangens (arctg, Zbiorem wartości jestatan) i arcuscotangens (arcctg, Y Y acotan). Funkcji arctg używa się czasem tak, jak funkcji logistycznych – do przybliżania procesów o ograniczonym zbiorze wartości, których wykres wygląda jak rozciągnięte S. y=sin(x/) y=tg(x/) 1 10 0.5 5 0 -0.5 0 -1 -5 0 20 40 -10 X -5 -3 -1 1 3 5 Inne rodziny funkcji (ln x m ) 2 f ( xlub ) bardziej złożonymi exp wzorami definiuje Rodzina funkcjirodzin lognormalnych Bardzo wiele różnych funkcji danych mniej się 2 s x s 2 dla gęstości rozkładów zmiennych ciągłych. Jedną z nich jest rodzina funkcji 1 0.8 Y logarytmiczno-normalnych określona tylko dla wartości dodatnich. Inne powstają poprzez wyliczanie 0.6 rozkładu zmiennych o znanym rozkładzie (np. normalnym) przekształconych w s= 1 odpowiedni sposób. 0.4 m= 0 0.5 1 1.5 2 W modelowaniu procesów biologicznych pojawiają się jeszcze inne rodziny funkcji. 0.2 jednym z mechanizmów regulacyjnych populacji jest zmniejszenie się Przykładowo średniej liczby jednorazowo rodzonych potomków przez samicę przy zmniejszeniu się 0 zasobów w środowisku przypadających na jednego osobnika populacji. Zmniejszenie to 0 5 10 15 20 jest liniowe, ale nie może być mniejsze od zera. Dla opisania tego procesu używam X rodziny funkcji danych podanym wzorem. Są to funkcje prawie liniowe, ale przy f (x) ln( exp(ax b)) dochodzenia do 0 o zaginają się i zmierzają do10. Rodzina funkcji wzorze: Średnia wielkość miotu Wykonany przegląd najbardziej typowych rodzin funkcji nie wyczerpuje wszystkich funkcji 8 pojawiających się w biologii. Zawsze też można zdefiniować swoją własną rodzinę, np. 2 . cos (1+exp(ax)) albo ln(10+a cos(x)), itd. Sparametryzowanych rodzin funkcji jest 6 nieskończenie wiele. Jest ich nieskończenie wiele nawet wtedy gdy ograniczymy się do 4 rodzin mających jeden parametr. 2 0 0 1 2 Ilość zasobów 3 4 Stosowanie rodzin funkcji danych wzorami w biologii 1. Wybór funkcji z wybranej rodziny do zobrazowania zależności między zmiennymi Funkcje dane wzorami pojawiają się w biologii często i zawsze są to przedstawiciele jakiejś arbitralnie wybranej rodziny funkcji, których parametry zostały w odpowiedni sposób wyliczone. Pokazanie funkcyjnej zależności pewnej charakterystyki zmiennej od innych zmiennych (tzw. czynnikowych) umożliwia wyliczanie tej charakterystyki dla Relacja miedzy X iwartości Y uzyskana na podstawie badań zadanych wartości zmiennych czynnikowych. W praktyce jest to robione dość rzadko. Najczęściej odpowiedni wzór jest traktowany jako wynik badań. Teoretycznie może on Funkcja pokazująca jak średnie (lub zbiorcze być wykorzystany w innych pracach, ale częściej jest weryfikowany lub inna uzupełniany. charakterystyki) rozkładów Y zależy od X W niektórych pracach pojawiają wzory opisujące zależność zmiennych od siebie wyposażone w parametry, którym nadaje się pewna wartość biologiczną. Zastosowanie takich wzorów umożliwia wyliczenie wzorów funkcji opisującej przebieg zależności pokrewnych. Większej liczby przekształceń należy dokonać przy tworzeniu modeli procesów biologicznych. Zawsze jednak punktem wyjściowym są funkcyjne opisy jakiejś zależności 2. Do zobrazowania przebiegu wynikającej z zmiennych od siebie i najczęściej są to zależności wybory jakiś rodzin funkcji. przekształcenia wyznaczonej wcześniej funkcji z parametrami (np. tempa wzrostu/spadku zależności między zmiennymi) 3. Do utworzenia modelu funkcjonowania zjawisk biologicznych Stosowanie w biologii rodzin funkcji danych wzorami Wybór sparametryzowanej rodziny funkcji do opisu jakiejś zależności Operowanie wzorami w biologii zawsze rozpoczyna się od założenia, że pewien proces przebiega zgodnie z pewną funkcja wybraną z góry założonej sparametryzowanej rodziny funkcji. Czasem podpieramy się przy tym literaturą (ktoś po prostu wcześniej Przekształcenie używał takiej rodziny funkcji). Jest to taki etapfunkcji analizy przyrody, w którym dokonuje się i wyznaczenie nowej pewnych założeń. Nie ma sposobu by dowieść, że założenia te są słuszne. Całe więc dalsze rozumowanie polegające na dopasowaniu danych do któregoś przedstawiciela zależności wybranej rodziny funkcji, albo przekształcanie funkcji tak by wyprowadzić wzory dla innych zmiennych, ma charakter logicznej implikacji: Jeżeli założymy, że dany proces przebiega zgodnie z funkcjami ...., to ..... Dopasowanie funkcji do danych (wyznaczenie wartości parametrów tak aby uzyskać funkcje najlepiej dopasowana do danych) czasami Wielokrotne przekształcenia sparametryzowanych funkcji i utworzenie modelu funkcjonowania jakiegoś procesu Zobrazowanie zależności zmiennych od siebie 1. Wybór sparametryzowanej rodziny funkcji Określenie kryterium Jednym z elementów pracy biologa jest dopasowanie 2. danych do jakiejś funkcji wybranej z arbitralnie określonej rodziny. Co to znaczy? najlepszego dopasowania Dane w postaci wyników pomiarów dwóch zmiennych X i Y tworzą na wykresie jakąś chmurę punktów. Funkcje z wybranej rodziny cechują się jakąś zmiennością kształtu i niektóre są 3. Wyznaczenie parametrów, dla lepiej, inne gorzej dopasowane do danych. Czasami widać, że niektóre rodziny funkcji nie którychalefunkcje zadanej rodziny zupełnie odpowiadają rozkładowi punktów na wykresie, wiele z zrodzin funkcji ma kryterium najlepszegosię przedstawicieli przebiegających bardzo podobniespełniają o wykresach wręcz nakładających na przedstawicieli rodzin innych funkcji. Jaką rodzinę funkcji wybrać? dopasowania Kolejna rzecz, która wpływa na ostateczny wynik – to kryterium najlepszego dopasowania funkcji do danych. Można ich wymyślić bardzo wiele, ale na szczęście przyjęło się tylko jedno. Kryteria wyboru sparametryzowanej funkcji do Przy wyborze sparametryzowanej rodziny funkcji kierujemy się rodziny fizycznymi własnościami analizowanych zmiennych. Większość zmiennych fizycznych jak masa ciała, opisu zależności zmiennych od(takich siebie długość, temperatura, prawdopodobieństwo) ma ograniczony zbiór wartości. Gdy uzależniamy zmiany wartości takich zmiennych od wartości innej zmiennej – najlepiej jest 1. Zgodność z fizycznymi własnościami zmiennych (jeżelisięzmienne mogą wybrać rodzinę funkcji mających zawsze wartości mieszczące w odpowiednim przyjmować tylkoteżwartości dodatnie niejednej używamy funkcji przyjmujących przedziale. Często wiemy, że zależność zmiennej od drugiej ma charakter monotoniczny. Ograniczamy się wtedy do takiej rodziny funkcji, które są monotoniczne. wartości ujemne) W najlepszej sytuacji są ci, którzy operują rodziną funkcji wynikającą z modelu funkcjonowania jakiegośwłasnością zjawiska. Jest to jednak dość rzadkie.od siebie (jeżeli jedna 2. Zgodność z fizyczną zależności zmiennych zmienna może- to powodować tylko wzrost/spadek wartości drugiej zmiennej Innego typu kryteria mała liczba parametrów lub ich fizyczna interpretowalność. Wymóg ten stoi najczęściej sprzeczności z trzema pierwszymi kryteriami. Najłatwiej stosujemy funkcjew monotoniczne) interpretować parametry funkcji liniowych, ale funkcje liniowe są nieograniczone. W 3. Zgodność z modelem funkcjonowania zjawiska praktyce zatem stosuje się głównie kryteriumjakiegoś 6. Robi się dokładnie to, co zrobili już inni, co zostało opublikowane w pracach naukowych, a wiec zaakceptowane przez 4. Mała liczba iparametrów recenzentów redakcję pisma naukowego. Oczywiście takie postępowanie nie jest obowiązkowe. Wszelkie nowe pomysły, na lepszy od stosowanego do tej pory opis 5. Taki charakter parametrów, można imstudentów było nadać interpretację zależności zmiennych od siebie,aby są w pracach jak najbardziej wskazane. biologiczną (np. przy stosowaniu rodziny funkcji liniowych y=ax+b parametr Szybkość współczesnych komputerów powoduje, że często można wyznaczyć najlepiej adopasowane jest tempem wzrostu/spadku jednej zmiennej od drugiej) funkcje pochodzące zzależności różnych rodzin. Wydaje się zatem, że wybranie funkcji której przedstawiciel najlepiej pasuje do danych, jest jakimś kryterium 6. rodziny Rodziny funkcji, które były stosowane przez innych badaczy w wyboru sparametryzowanej rodziny funkcji. Nie jest to żadne kryterium. Po pierwsze, nie opublikowanych pracach jesteśmy wstanie wykryć w ten sposób prawdziwej funkcji stosowanej przez przyrodę. Po drugie, nie ma możliwości przejrzenia wszystkich sparametryzowanych rodzin funkcji – 7. Przejrzenie kilku rodzinwiele. funkcji i wybranie takiej, dla której uzyskuje się bo jest ich nieskończenie W dodatku dla każdej wybranej rodziny funkcji można najlepsze wg. przyjętego kryterium zdefiniowaćdopasowanie inną rodzinę, której przedstawiciele są jeszcze lepiej dopasowani do danych. Kryteria najlepszego dopasowania Kryteria najlepszego dopasowania powinny byś oparte o odległości punktów od wykresu funkcji i być określone taka formułą (funkcja wieloczynnikową F), która względem Suma odległości danych wyrażonych w pojedynczego argumentu (przy ustalonych wartościach pozostałych) jest funkcja postaci punktów od wykresu funkcji rosnącą. Funkcji takich jest bardzo dużo. była jak najmniejsza Kolejny problem polega na określeniu co rozumiemy przez odległość punktu od wykresu funkcji. Najprostsze stwierdzenie, że jest to minimalna odległość punktu od tego wykresu – daje dość skomplikowaną procedurę obliczeniową. Odległości można wyznaczać Suma kwadratów odległości danych biorąc pod uwagę rzuty pionowe lub poziome punktów na wykres funkcji. wyrażonych w postaci punktów od Każda z funkcji F oraz przyjęty rodzaj wyliczania odległości nieco była inne funkcje wybrane z wykresudaje funkcji jak najmniejsza ustalonej rodziny jako spełniające warunek najlepszego dopasowania. W naukach przyrodniczych przyjęło się określanie odległości jako długość rzutów pionowych Inne definicje w oparciu o funkcje Różne sposoby definiowania punktów na wykres funkcji i funkcja F równa sumie kwadratów tych odległości. Ten F(r1rodziny ,...,rn) rosnące wzroście sposób wyznaczania najlepiej przy dopasowana do każdej odległości punktówparametrów od wykresufunkcji z danej danych nazywa się metodą najmniejszych kwadratów. Jejrstosowanie ma swoje odległości 1,...,rn funkcji statystyczne uzasadnienie (wyznaczone w ten sposób funkcje są najlepszym przybliżeniem tzw. regresji n n i dlatego nazywane są często regresjami). SK S K (f a(,bf a(,xb i()x i )y2i ) 2 i )y osiąga osiąga minimum minimum Z metodą najmniejszych kwadratów wiąże się także wskaźnik dopasowania funkcji do danych i 1 i 1 nazywany wsp. determinacji lub kwadratem wsp. korelacji. Dla najlepiej dopasowanej SK SK 2 jest 2 miara funkcji z danej rodziny Metoda stosowana jest przy wyliczaniu y y- śre - ta śre dnia dnia miara RR 1 1od nmaksymalny. n tzw. trendów w Excelu. dopasowania dopasowania ( y(iyi y )y ) 2 i 1i 1 Przykład 1 Zimowy ciężar ciała [g] Zimowy ciężar ciała [g] Kość skokowa u ptaków wróblowatych rośnie tylko w pierwszych dwóch-trzech tygodniach życia i zależy od warunków panujących w okresie pisklęcym ptaków. Mierząc w okresie zimowym długość kości skokowej i ciężar całego ptaka możemy pokazać jak okres y = 0.6348x + 10.436 25 pisklęcy Na wykresach pokazane są R2osobników. = 0.3966 24 istotnie wpływa na ciężar dorosłych wyniki złowionych w czasie Różne rodziny funkcji 23 ważeń i pomiarów 76 mazurków (Passer montanus) noclegów w budkach w okresie od grudnia do lutego. Chce za pomocą funkcji pokazać 22 i metoda najmniejszych y = 0.0142x6 - 1.5763x5 + jak długość kości skokowej wiąże się ze średnim ciężarem ptaków. Nie mam żadnej 21 72.535x4 - 1776.7x3 + kwadratów gwarancji, że jest to funkcja liniowa. Zastosowanie wielomianów stopnia szóstego daje mi 20 24430x2 - 178801x + funkcję15cechującą dopasowaniem. Ale wahania tej funkcji nie potrafiłabym w 544167 17 się lepszym 19 21 żaden sposób uzasadnić. Funkcja liniowa pozwala mi na stwierdzenie, że przy zmianie R2 = 0.4272 Długość kości skokowej [mm] długości kości skokowej o 1mm zimowy ciężar ptaków wzrośnie średnio o 0.6g. Interpretacja przebiegu wielomianu byłaby bardzo skomplikowana i nie wzbudzałaby wiarygodności (w końcu mamy tylko trochę zbadanych ptaków i pomiary z dokładnością 28 do 0.5mm i 0.01g, a wyciągamy wnioskiy =dla całej populacji i dokładnych wartości). 0.6348x + 10.436 26 R2 = 0.3966 Zastosowanie innych kryteriów najlepszego dopasowania dla funkcji liniowych daje funkcje Rodziny funkcji liniowych 24 znacznie różniące się od siebie. Różowym kolorem zaznaczono uzyskaną przy i różneprostą kryteria dobrego 22 1.6005x - 7.2947 od wykresu funkcji ma mieć wartość warunku, że suma kwadratów odległościy =poziomych dopasowania funkcji 20 minimalną. Przy stosowaniu takiego kryterium że wzrost długości skoku o R2 =twierdziłabym, 0.3966 15 19 ciężaru 21 zimowego mazurków o 1,6g. 1mm wiąże się 17 ze wzrostem Długość kości skokowej [mm] Przykład 2 Opad materii organicznej -2 -1 g.m .y Na wykresie przedstawiono masę materii organicznej opadającą w ciągu roku na ziemię w lasach sosnowych występujących od górnej granicy występowania sosen (w Finlandii) po Różne kryteria dopasowania rejony Polski. Ponieważ wiadomo z literatury, że tempo opadu materii organicznej wzrasta z północy na południe, do opisania zależności między masą materii organicznej 600 spadającej na ziemię, a szerokością geograficzną zastosowano rodzinę funkcji n wykładniczych: y=b.exp(ax). 500 2 Rodzina 400funkcji wykładniczych ma te własność, że ln(y)=ln(b 300 .exp(ax))=ln(b)+ln(exp(ax))=ln(b)+ax=ax+ln(b) (axi ln(b) ln(y i )) i 1 osiąga minimum Zależność 200 między zlogarytmowanymi wartościami masy materii organicznej, a szerokością -0.08x geograficzną jest liniowa. Możemy wyliczyć współczynniki regresji liniowej między tymi y = 32971e R2 = 0.81 100 -0.06x wielkościami. Współczynnikya= jest nachylenia regresji, a 8617erówny R2współczynnikowi = 0.64 n 0 współczynnik b wyliczymy za pomocą funkcji exp od wyrazu wolnego tej regresji. Rzecz 2 ( b e xp( ax ) y ) i ikwadratów. 70 że takie 65 postępowanie 60 55 jest stosowaniem 50 w tym, nie metody najmniejszych i 1 Funkcja wyliczona właściwą metodą najmniejszych kwadratów ma inne wartości Szereokość geograficzna parametrów. osiąga minimum W programach takich jak Excel czy arkusz kalkulacyjny Open-Office przy wyliczaniu trendów na wykresach stosowane są różne przekształcenia zmiennych, tak aby stosowana rodzina funkcji stała się liniowa i dopiero dla takich zmiennych wyliczana jest regresja. Należy pamiętać, że nie jest to to samo, co metoda najmniejszych kwadratów zastosowana dla nieliniowych rodzin funkcji. Na koniec pozostaje wyjaśnienie jak wyliczamy regresje. regresji Przede wszystkim należy pogodzić się Metody wyliczania z tym, że w biologii nie jest ważna znajomość wzorów i sposobów ich wyprowadzania dla określonych wielkości i charakterystyk, ale poprawność ich wyliczania. Mamy teraz do Regresja liniowa (wzory) dyspozycji komputery i obowiązuje was umiejętność wyliczania regresji zarówno liniowych n pomocą jaki nnieliniowych odpowiednich programów. Liniowe regresje wyliczyć jest n za n x i y i x i y i n n parametrów a i b. Wzory istnieją także dla regresji najłatwiej – są dla 1 wzory i 1 i 1 wyprowadzone i 1 b y a x a i i 2 n n n wielomianowych i są to już wszystkie funkcje o tej własności. i 1 i 1 2 n x i x i i 1 i 1 pozostałych Parametry wszystkich regresji nieliniowych wyznacza się metodami numerycznymi. Oznacza to, że po przyjęciu jakiś wartości początkowych dla parametrów za pomocą odpowiedniego algorytmu wylicza się kolejne parametry tak aby suma kwadratów odchyleń danych od funkcji była mniejsza, dla nich znowu kolejne parametry itd. Postępuje się tak Regresja nieliniowa (metodyodchyleń numeryczne) dotąd, dokąd suma kwadratów danych od funkcji przestaje się zmniejszać. kilka algorytmów wyliczania parametrów, przy czym metoda Gaussa-Newtona jest 1. Istnieje Metoda największego spadku Uwaga!!! poprawionym algorytmem największego spadku, metoda Levenberga-Marquardta jest algorytmem Gaussa-Newtona. Poprawki te polegały i wyłącznie na 2. poprawionym Metoda Gaussa-Newtona Należy znaleźćtylko przybliżone zwiększeniu szybkości uzyskiwania wyniku, ale jego wartość pozostawała taka sama. wartości parametrów!!! 3. Metoda Levenberga-Marquardta Uwaga, metody te polegają na wyliczaniu minimum lokalnego, zależą zatem od wartości początkowych wprowadzonych parametrów. Bywa, że trzeba rozważyć kilka zestawów wartości początkowych aby wykryć rzeczywiste minimum. Są też takie złośliwe rodziny funkcji Wszystkie (tzw. K-funkcje), dla których suma kwadratów odchyleń danych od funkcji ma te metody dają ten sam wynik!!! nieskończenie wiele minimów lokalnych. Wynik stosowania opisanych metod jest inny za każdym wprowadzeniem parametrów początkowych. Wtedy pozostaje już tylko wyliczanie sumy kwadratów odchyleń danych od funkcji przy krokowych zmianach wartości parametrów i wybieranie takiego zestawu parametrów dla której suma ta była najmniejsza. Robi się to oczywiście za pomocą programów komputerowych.