Analisi di dati ecologici in R - Associazione Successione Ecologica

Download Report

Transcript Analisi di dati ecologici in R - Associazione Successione Ecologica

Analisi di dati ecologici in R: modelli lineari generalizzati e loro estensioni In ecologia sempre più spesso ci troviamo di fronte dati complessi, che le normali tecniche d’inferenza statistica (quali ad esempio l’ANOVA e la regressione lineare) non sono in grado di analizzare in maniera adeguata. Tali procedure statistiche non possono essere impiegate perché ad esse sottostanno vincoli (come l’omogeneità delle varianze, la normalità e l’indipendenza delle osservazioni), che, se violati invalidano i risultati dell’analisi. Metodi di analisi più complessi, come i Generalized Linear Models (GLM) consentono di analizzare dati in cui la distribuzione della variabile di risposta si discosta dalla normalità. L’utilizzo dei GLM è tuttavia ristretto ai casi in cui la relazione tra variabile predittiva e variabile di risposta sia lineare. A tale scopo modelli come i Generalized Additive Models (GAM) possono essere impiegati nel caso non si conosca la relazione esistente tra variabile predittiva e variabile di risposta. Tali modelli, estendono il campo d’impiego dei GLM utilizzando funzioni levigate non parametriche (smoothers o splines). Tutte le tecniche di analisi finora menzionate si basano su un assunto fondamentale ai fini dell’esito di un test: le osservazioni siano tra loro indipendenti (non autocorrelate). Tuttavia, in molti casi, i dati ecologici presentano una qualche forma di non-­‐indipendenza spaziale e/o temporale (dovuta ad esempio ad autocorrelazione tra misure ripetute nel tempo negli stessi siti). I Mixed Effect Models (MEM) si presentano come i candidati ideali analizzare dati con osservazioni autocorrelate. Essi presentano una parte fissa (fixed effects) la quale include tutte le variabili predittive di cui lo sperimentatore intende stimare l’effetto, e una parte casuale (random effects) in cui sono inclusi tutti i termini casuali e i termini responsabili dell’eterogeneità, quali l’autocorrelazione tra le osservazioni. Infine, I Generalized Additive Mixed Models (GAMM) sono il risultato dell’unione delle potenzialità dei GAM e dei M&M e risultano indicate per dati che mostrano sovradispersione e correlazione, tipici di studi spaziali o temporali basati su disegni di campionamento gerarchizzati. Questa classe di modelli permette di modellizzare in maniera flessibile la dipendenza funzionale tra la variabile di risposta a una o più covariate, utilizzando una regressione non parametrica che tiene anch’essa conto della correlazione tra le osservazioni.