Transcript 460 Ko
Introduction
• L’écologie est l'étude scientifique des interactions entre les organismes vivants et le
milieu, et des organismes vivants entre eux dans les conditions naturelles. C'est
l'étude des mécanismes et processus qui expliquent la distribution et l'abondance des
organismes.
• L'écosystème est un système
• Un système est un ensemble d'éléments en interaction dynamique, organisé en
fonction d'un but, ou encore (selon l'encyclopedia universalis) un système est un
"ensemble de phénomènes et d'événements interdépendants que l'on extrait du monde
extérieur par une démarche intellectuelle arbitraire, en vue de traiter cet ensemble
comme un tout". La référence au "monde extérieur" implique qu'aucun système réel
n'est isolé mais qu'il est au contraire lui-même un élément d'un système plus vaste.
Au sein d’un système, il est possible de distinguer plusieurs échelles d’observation
dans l’espace et dans le temps. A chaque échelle d’observation correspond une
catégorie d’interactions, la multiplicité des échelles est une des difficultés majeures de
l’analyse des écosystèmes, la variabilité spatiale et l’instabilité temporelle étant une
caractéristique essentielle des écosystèmes.
Un plan d’échantillonnage implique le choix d’un certain (ou d’un certain nombre de)
sous-système (s) comme objet d’étude. La délimitation des sous-systèmes est
généralement arbitraire et peut poser problème et une stratégie d’échantillonnage ne
peut faire abstraction des interactions entre sous-systèmes.
Objectifs scientifiques de l’écologie
La science a pour objectifs :
1/ d’organiser les connaissances de manière
systématique en s’efforçant de découvrir les relations
entre structures, phénomènes et processus,
2/ de proposer des hypothèses explicatives sur les
conditions dans lesquelles se produisent certains
événements, hypothèses qui peuvent être testées,
c’est-à-dire infirmées ou confirmées.
Démarche proposée par Underwood (1990) :
observations : mise en évidence de patterns sur la base de séquences d’observations : explication
du phénomène observé ;
modèles : le chercheur fournit une ou plusieurs explications plausibles (modèles), sous
forme mathématique ou non ;
hypothèses (prédictions, déductions) : le modèle explicatif doit être capable de fournir
des prédictions ;
preuve ou réfutation : évaluation de la validité des prédictions, un cas contradictoire
suffit pour réfuter une hypothèse ;
test (expérimentation) : l’objectif est d’essayer de réfuter les prédictions du modèle
proposé, confrontation des prédictions avec des observations (mesures expériementales) ;
conclusions : si l’hypothèse est vérifiée, le modèle est retenu et éventuellement amélioré, si
elle est réfutée, le modèle est rejeté.
Modèle : moyen de synthèse des éléments de connaissance concernant un système. La qualité du
modèle dépend de la qualité des connaissances sur les éléments du système et des données
disponibles.
Problèmes de l’échantillonnage dans des systèmes complexes
1/ la complexité des systèmes naturels est telle que nous ne pouvons en avoir qu’une
image approximative, limitée à une ou plusieurs échelles d’observation ;
2/ un échantillon est un fragment d’un ensemble prélevé pour juger de cet ensemble :
problème de la représentativité de l’échantillon, fortement liée au type de système
étudié et aux objectifs de l’étude ;
3/ Il doit y avoir adéquation entre les questions posées, les moyens mis en œuvre pour
y répondre, le choix des variables (quantitatives, qualitatives – présence/absence
d’espèces, génotypes, couleurs…) à étudier et le traitement mathématique des
données: mise en place d’une stratégie d’échantillonnage ; les solutions choisies
seront une traduction des questions explicitement ou implicitement posées, ou ce qui
revient au même, des types de réponses attendues.
Définitions
1/ les variables que l’on choisit d’étudier sont généralement appelées descripteurs
écologiques ; mais il est très courant en écologie statistique de conserver le terme
variable, celle-ci pouvant être qualitative (et dans ce cas comporter plusieurs
modalités) ou quantitative ;
2/ le terme distribution est réservé aux distributions de probabilité ou de fréquence au
sens statistique ;
3/ le terme répartition est utiliser pour désigner les dispersions spatio-temporelles des
organismes ou des descripteurs ;
4/ le plus souvent, l’existence d’une répartition à une certaine échelle implique qu’une
description observée en un point rend probable, en un point voisin, une description
peu différente : cette similarité locale dans l’espace ou persistance dans le temps est
appelée contagion spatio-temporelle ; un échantillonnage réalisé en un certain nombre
de stations régulièrement réparties ne saurait fournir une série de descriptions
indépendantes les unes des autres puisque la connaissance de l’une d’elle informe sur
les probabilités d’observation des autres.
5/ L’échantillonnage doit pouvoir conduire à l’estimation des propriétés de la
« population échantillonnée » au sens statistique. « La meilleure estimation » d’un
paramètre se définit comme celle qui est exempte de biais et qui possède la plus petite
variance pour le type d’échantillonnage pratiqué.
Traceurs – Indicateurs – Descripteurs
Traceurs : substance utilisée pour identifier et suivre l’eau dans ses déplacements, évaluation des
temps moyens de séjour dans les karsts ou les aquifères, évaluation de l’écoulement (ex :
fluorescéine).
Indicateurs (bio-indicateurs) : espèces végétales ou animales qui, par suite de leurs
particularités écologiques, sont l’indice précoce de modifications abiotiques ou biotiques de
l’environnement : exemples : utilisation de certains organismes aquatiques (Oligochètes,
Mollusques, larves d’insectes …) pour déterminer la qualité des eaux (Plécoptères, Ephémères,
Trichoptères, chironomes) : utilisation pour calculer des indices biotiques.
Descripteurs de fonctionnement et de l’évolution des écosystèmes : il s’agit d’éléments du
biotope ou de la biocénose dont les fluctuations qualitatives ou quantitatives nous renseignent sur
la réalisation d’un phénomène complexe. Le choix des descripteurs se fonde sur trois critères :
—
la nature de l’information transmise : l’information doit porter sur les processus majeurs
qui interviennent dans l’évolution des écosystèmes ;
—
la capacité de mémorisation des descripteurs : elle dépend à la fois du temps de réponse des
organismes et de l’intervalle de temps pendant lequel cette réponse peut être décelée (par
exemple, les restes d’organismes conservés dans les sédiments non remaniés, comme les
Cladocères, restituent les successions écologiques à des échelles historiques – décennies,
siècles) ;
— le coût d’acquisition de l’information : une diminution du coût permet d’augmenter le
nombre de cas étudiés.
Choix d’un plan d’échantillonnage
Conceptualisation
théorie
Motivations économiques
(gestion des ressources)
Objectifs scientifiques
Objectifs pratiques
Problématique de l’étude
Contraintes techniques
Contraintes mathématiques
Contraintes
Contraintes naturelles
Choix
Variables à
étudier
Echelles
spatio-temporelles
Méthodes de traitement
des données
Planification de l’échantillonnage
(nombre et disposition spatio-temporelle des échantillons, précision des mesures, etc…)
Analyse et interprétation des résultats
Utilisation des résultats
Point de départ : choix des objectifs
Problématique
Un échantillonnage optimal est inséparable d’une conceptualisation précise
Le plan d’échantillonnage reflète alors dans une large mesure les hypothèses
de travail concernant le fonctionnement et l’évolution des systèmes
écologiques
Délimitation du sous-système
Programme de suivis spatio-temporels longs (problème lié à la définition des
objectifs et à l’analyse des données)
Différentes étapes
Délimitation du sous-système
Programme de suivis spatio-temporels longs (problème lié à la définition des
objectifs et à l’analyse des données)
Choix des variables ou descripteurs
Descripteurs qualitatifs
Descripteurs semi-quantitatifs
Descripteurs quantitatifs
Choix des échelles d’observation
Descripteurs qualitatifs
Les réalisations distinctes sont des catégories définies sans assignation d’une
« mesure » ni même d’un caractère permettant de les ordonner les uns par rapport aux
autres. On parle de variables qualitatives comportant des modalités différentes, le
nombre de modalités pouvant être différent suivant les variables.
Variable 1
Variable 2
Variable p
Enregistrement 1
1
2
1
Enregistrement 2
2
1
3
Enregistrement 3
3
1
3
Enregistrement 4
1
1
2
Enregistrement n
1
2
4
Descripteurs semi-quantitatifs
Ils sont définis par l’existence d’une relation d’ordre. On sait si une réalisation est
« plus petite » ou « plus grande » qu’une autre, sans pour autant qu’il soit possible de
mesurer une distance entre deux étas distincts.
Exemple :
Stades de développement d’une espèce,
Stades de succession d’un peuplement naturel le long d’un gradient spatio-temporel ;
Cotations d’abondance : « très rares », « rares », …, « abondants », « très abondants »
Descripteurs quantitatifs
Ils sont définis comme des quantités véritables, pour lesquelles on peut déterminer des
rapports et des différences. Cette définition s’applique à un très grand nombre de
descripteurs utilisés en écologie et qui mesurent des abondances, des masses, des
fréquences, des quantités d’énergie, des quantités d’information …
Espèce 1
Espèce 2
Espèce p
Enregistrement 1
0
25
0
Enregistrement 2
62
81
13
Enregistrement 3
3
34
89
Enregistrement 4
43
567
4
Enregistrement n
215
234
57
Nombre de variables nécessaires
En général, on s’attachera à ne conserver que les variables qui ont un rôle
déterminant (ou structurant) dans le jeu de données. Il est souvent nécessaire
d’effectuer un traitement statistique pour identifier ces variables.
Plus le nombre de variables sera important, plus le nombre de relevés devra être
grand. On a donc intérêt à limiter le nombre de variables ( et de modalités dans le
cas de variables qualitatives).
Choix des échelles d’observation
Le choix des échelles se présente de façon différente selon que :
Il découle d’une analyse préalable du système, dans laquelle les échelles
fonctionnelles et discontinues s’imposent avec évidence.
Aucune analyse préalable n’a fait apparaître d’échelles privilégiées. On se trouve
devant un continuum d’échelles possibles, sans qu’a priori aucune soit plus
signifiante que l’autre. Le choix des échelles d’observation est alors délibéré et
fait partie de « l’acte d’échantillonnage » qui interviendra sur l’image obtenue.
Stratification de l’échantillonnage
Lorsque le domaine spatio-temporel que l’on échantillonne est complexe et
structuré, on le divise en « strates », ce qui est déjà une première analyse du
système. Ces strates peuvent être divisées en sous-strates divisées à leur
tour, on aboutit à un échantillonnage hiérarchisé.
Les critères de définition des strates statistiques sont aussi nombreux que les descripteurs.
Les procédés de stratification appartiennent à 2 catégories principales :
Les uns sont préalables à tout échantillonnage sensu stricto et procèdent
d’une vision du « paysage » obtenue soit par examen macroscopique, soit
par une connaissance antérieure ou une documentation sur le cadre. Une
partition est ainsi d’emblée réalisée, fondée sur l’existence de zones
directement tranchées (suivant le climat, la nature du substrat, la
géomorphologie etc…).
Les autres consistent à diviser le milieu sur la base d’une étude
préalable de la répartition des descripteurs retenus, ou de stratificateurs
distincts de ces derniers.
Notion d’échantillon représentatif
Cas de l’étude de la composition floristique ou faunistique :
Dans ce cas, un échantillon est réputé significatif quand il contient « la
plupart » des espèces du peuplement.
Une technique utilisée pour savoir si l’échantillon est représentatif
consiste à augmenter progressivement l’aire ou le volume échantillonnés,
en notant chaque fois le nombre d’espèces nouvelles rencontrées, jusqu’à
ce qu’on obtienne un palier indiquant que le nombre d’espèces recensées
ne croît plus.
Nombre
d’espèces
Taille de l’échantillon
ou nombre d’échantillons
Dans la pratique, une asymptote n’est jamais atteinte car dans la majorité
des cas, le nombre d’espèces est proportionnel au logarithme de l’aire
parcourue.
Principales méthodes
Définitions relatives à l’échantillonnage
L’élément ou unité d’échantillonnage est une entité concrète comme un individu,
un objet…
Un échantillon est une collection d’éléments prélevés dans la population
statistique selon un processus aléatoire.
Un échantillon est qualifié d’aléatoire ou de représentatif de la population
statistique lorsque chaque élément de la population a une probabilité connue et
différente de 0 d’appartenir à l’échantillon.
Un plan d’échantillonnage est un protocole de sélection des éléments de la
population statistique en vue d’obtenir un échantillon aléatoire. Le plan est conçu
pour estimer avec le maximum de précision et le minimum d’effort un ou
plusieurs paramètres de la population.
Une population statistique est une entité généralement composite, par exemple
une population biologique, sur laquelle doivent porter les conclusions d’une
étude.
Un estimateur est une expression mathématique qui mesure, à partir des
données de l’échantillon, un paramètre de la population statistique, (exemple :
estimateur de la moyenne).
Quand le nombre d’échantillons est grand, l’utilisation des statistiques permet
une réduction des données par le calcul de paramètres :
- de position : moyenne
- de dispersion : variance, écart type, coefficient de variation…
Une estimation correspond à la valeur prise par un estimateur pour un
échantillon particulier.
L’efficacité se définit comme l’inverse de la variance de l’estimateur. A effort
d’échantillonnage constant, les plans les plus efficaces fournissent les
estimations les plus précises.
Echantillonnage aléatoire simple
Définition
L’échantillonnage aléatoire simple est une méthode qui consiste à prélever au hasard et
de façon indépendante n unités d’échantillonnage d’une population de N éléments.
Chaque élément de la population possède la même probabilité de faire partie d’un
échantillon de n unités et chacun des échantillons possibles de tailles n, possède la même
probabilité d’être constitué. Les prélèvements doivent tous être de même taille. La strate
doit être parfaitement délimitée.
Cette méthode devrait s’appliquer quand aucun autre plan ne peut être utilisé. Cependant
il faut connaître ou dresser la liste complète et sans répétition des éléments de la
population : ceci est souvent difficile dans le cas de l’échantillonnage des espèces
sauvages.
Echantillonnage systématique
Définition
L’échantillonnage systématique est une technique qui consiste à tirer au hasard un iième
élément, situé entre le premier et le pième de la population puis à prélever
systématiquement le (i+p)ième, (i+2p)ième, (i+3p)ième, …, (i+(n-1)p)ième élément de la
population.
L’échantillon est alors réparti uniformément sur toute la population.
Contrairement à l’échantillonnage aléatoire simple, les unités ne sont pas prélevées de
façon indépendante puisque le choix du premier élément détermine la composition de
tout l’échantillon.
L’échantillonnage systématique est utile:
Quand les éléments de la population se présentent naturellement les uns à la suite des
autres et qu’aucun phénomène périodique n’affecte directement ou indirectement le
caractère étudié.
Pour répartir spatialement des stations d’échantillonnage ponctuelles ou des itinéraireséchantillons, dans la mesure où aucun phénomène périodique ne peut affecter le
caractère étudié.
Pour répartir dans le temps les relevés d’observations. Il faut tenir compte des rythmes
saisonniers, circadiens et autres, en choisissant une période p égale à celle des cycles
dont on veut éliminer l’effet et nettement inférieure à celle des cycles dont on veut
étudier l’effet.
Echantillonnage stratifié
Définition
L’échantillonnage stratifié est une technique qui consiste à subdiviser une population
hétérogène en sous-populations ou « strates » plus homogènes, mutuellement exclusives
et collectivement exhaustives. La population hétérogène d’effectif N est ainsi découpée
en k strates plus homogènes d’effectif Nh de telle sorte que N=N1+N2+…+Nh+…+Nk. Un
échantillon indépendant est par la suite prélevé au sein de chacune des strates en
appliquant un plan d’échantillonnage au choix de l’écologiste.
Deux questions :
Comment construire les « strates » ?
Quels efforts et plans d’échantillonnage adopter dans chacune des strates ?
Interaction entre objet analysé et échantillonnage
Au hasard
variance=moyenne
Sur-dispersion
contagion
Sous-dispersion
variance>moyenne
variance<moyenne
Diversité spécifique et indices de diversité
Intérêt des divers indices : comparaison globale de peuplements différents (ou du même
peuplement à des moments différents).
Deux indices majeurs :
· Simpson
1
Is
2
p
i
avec pi
· Shannon
H ' pi log2 pi
ni
N
N = somme des effectifs des S espèces du peuplement
ni = effectif de l'espèce i
pi = abondance relative de l'espèce i dans le peuplement
· Is varie de 1 (une seule espèce présente) à S (toutes les espèces présentes ont même
abondance)
· H' varie de 0 à log S
Place du traitement des données
Problème
(hypothèses)
Problématique
Echantillonnage
Analyse des données
Conclusion
conception
inférence
rétroaction
Méthodes multivariées
variables
Les grandes familles d’analyse
Variables qualitatives
D2
D3
D4
Station 1
D1
Variables quantitatives
D5
D4
Analyse en composantes principales
D5
D1
D2
D3
D4
D5
Station 3
relevés
D3
Station 2
D1
D2
Analyse des correspondances multiples
Tables de contingence
Analyse factorielle des correspondances
Suivi physico-chimique Rhône
39 individus- dates de prélèvements (1983-1984)
15 variables physico-chimiques
02/02
16/08
22/02
23/08
14/03
30/08
19/04
06/09
03/05
12/09
09/05
19/09
18/05
26/09
24/05
03/10
31/05
10/10
07/06
18/10
16/06
24/10
22/06
31/10
28/06
07/11
05/07
14/11
11/07
21/11
19/07
28/11
26/07
05/12
01/08
19/12
09/08
26/12
02/01
1-Ta Température de l'air (°C )
2-Te Température de l'eau (°C)
1
6-Tr
-1
10-Su
3-Co Conductivité (mS/cm)
1
-1
4-pH potentiel Hyrogène (pH)
9-mg
5-Ox Saturation en oxygène (%)
6-Tr Transparence (cm)
7-Dt Dureté totale (mg/l CaCO3)
11-No
8-Dc Dureté calcique (mg/l Ca++)
2-Te
3-Co
9-mg Magnésium (mg/l Mg++)
10-Su Sulfates (mg/l x10)
11-No Azote nitrique (mb/l)
12-Ta TAC (mg/l HCO3-)
13-Ms Mat. en suspension (mg/l)
7-Dt
8-Dc
4-pH
C-Ta
14-Mo Mat. organique (mg/l)
15-Ch
15-Ch Chlorophyle a (mg/l)
5-Ox
13-Ms
14-Mo
1-Ta
Modélisation, reconstitution des données à partir du premier facteur de l’analyse
1-Ta
2-Te
3-Co
4-pH
5-Ox
6-Tr
7-Dt
8-Dc
9-mg
10-Su
11-No
12-Ta
5.1
32
370
-2.7
13-Ms
14-Mo
15-Ch
Modélisation, reconstitution des données à partir des deux premiers facteurs de l’analyse
1-Ta
2-Te
3-Co
4-pH
5-Ox
6-Tr
7-Dt
8-Dc
9-mg
10-Su
11-No
12-Ta
5.1
32
370
-2.7
13-Ms
14-Mo
15-Ch