Incertitude, risque et apprentissage
Download
Report
Transcript Incertitude, risque et apprentissage
Incertitude, risque
et apprentissage
ECO8071 – Charles Séguin
Inspiré en partie de notes de Larry Karp et Christian
Traeger
1
2
L’INCERTITUDE, qu’est-ce?
Ne pas connaître la valeur d’un élément?
Ne pas connaître la probabilité d’un événement?
Ne pas avoir conscience de la possibilité d’un événement?
Un exemple : lancer une pièce de monnaie en l’air
Qu’est-ce qui est incertain?
Est-ce risqué?
3
CATÉGORISATION de l’incertain
Incertitude :
Je connais toutes les
possibilités;
Je représente la
vraisemblance de leur
occurrence par des
probabilités.
1
2
1
2
4
CATÉGORISATION de l’incertain
Incertitude
Ambiguïté et flou :
?
Je connais toutes les
possibilités;
Je ne peux représenter la
vraisemblance de leur
occurrence par des
probabilités uniques.
?
5
CATÉGORISATION de l’incertain
Incertitude
Ambiguïté et flou
Inconscience :
Je ne connais pas toutes
les possibilités.
?
Nous allons nous concentrer
sur l’incertitude.
6
INCERTITUDE et RISQUE
Lancer une pièce est-il risqué?
Parier sur le résultat du lancé d’une pièce est-il risqué?
Il y a risque lorsque l’objectif (utilité, profit, etc.) d’un agent est
incertain.
L’incertitude d’un élément affectant l’utilité d’un agent expose
cet agent au risque.
7
REPRÉSENTATION de
l’incertitude
Variable aléatoire :
Une variable dont les valeurs possibles sont associées à des
probabilités.
Probabilité :
Nombre entre 0 et 1 qui mesure la vraisemblance;
La somme des probabilités des valeurs d’une variable aléatoire est 1.
Pile ou face : R Î {Pile, Face} r1 = Pile r2 = Face Pr(r1 ) = 0, 5 Pr(r2 ) = 0, 5
Parier 100 $ sur pile : P Î {100,-100} r1 =100 r2 = -100 Pr(r1 ) = 0, 5 Pr(r2 ) = 0, 5
8
DISTINCTIONS importantes ou
non
Incertitude
Fondamentale :
La variable est aléatoire
indépendamment de la
perception de l’agent;
(Purement) stochastique.
Perceptive :
Certaines limitations de
l’agent rendent la
variable aléatoire;
Incertitude (propre).
Probabilité
Objective :
Tirée de données
statistiques ou d’un
raisonnement logique.
Subjective :
Représente les croyances
de l’agent;
Il peut y avoir des
probabilités subjectives
différentes pour le même
événement.
9
ESPÉRANCE et UTILITÉ ESPÉRÉE
Espérance :
Somme des valeurs d’une
variable aléatoire
pondérée par leurs
probabilités;
Pari : E(P) = 0, 5´100 + 0, 5´ (-100) = 0
Utilité espérée :
Somme de l’utilité des
valeurs d’une variable
aléatoire pondérée par
leurs probabilité
Pari : EU(P) = 0, 5´U(x,100)+ 0, 5´U(x,-100)
10
APPRENTISSAGE
Concept dynamique;
Consiste à mettre à jour les probabilités d’une variable aléatoire
avec des informations nouvelles;
Après que la pièce soit retombée :
Quels sont les probabilités?
Vas-tu parier 100 $ sur pile?
L’apprentissage peut influencer une décision risquée.
11
TYPES d’Apprentissage
Surprise (Naïf) :
L’apprentissage n’est pris
en compte qu’une fois
qu’il s’est produit.
Anticipé (Sophistiqué) :
L’apprentissage est pris en
compte avant qu’il se
produise.
Passif :
L’apprentissage est
exogène aux décisions de
l’agent.
Actif :
L’apprentissage est
affecté par les décision
de l’agent.
12
Un exemple simple (décision
binaire)
2 périodes;
Décision : construire un barrage ou pas (irréversible);
Bénéfices : un barrage génère des bénéfices de 10M $ par
période;
Coûts : un barrage dénature la rivière sur laquelle il est construit,
ce qui génère des coûts incertains de 3M $ ou 35M $ avec
probabilités égales (peu importe le moment de construction);
L’objectif du décideur est de maximiser l’espérance des
bénéfices nets des coûts.
13
Exemple simple
SANS APPRENTISSAGE
Doit-on construire et quand?
Période 1
oui
Période 2
1
1
E BN =10 +10 - ´ 3- ´ 35 =1
2
2
Déjà fait
Construire
non
Bénéfices nets espérées
oui
1
1
E BN =10 - ´ 3- ´ 35 = -9
2
2
Construire
non
E BN = 0
14
Exemple simple
AVEC APPRENTISSAGE ANTICIPÉ
Si j’anticipe que je vais connaître la valeur des coûts avec
certitude à la période 2?
Période 1
oui
Période 2
35
App.
Déjà fait
3
Déjà fait
Espérance
BN = 20 - 35 = -15
1
Construire
non
Bénéfices nets
35
App.
Cons.
3
Cons.
BN = 20 - 3 =17
oui
BN =10 -35 = -25
non
oui
BN = 0
BN =10 -3 = 7
non
BN = 0
3, 5
15
Exemple simple
apprentissage NON-anticipé
Que se passe-t-il à la période 1 si le décideur n’anticipe pas qu’il
apprendra la vraie valeur des dommages à la rivière?
Décision identique à l’absence d’apprentissage.
Est-ce toujours le cas?
Non…
16
Valeur d’OPTION (quasi)
Dans l’exemple précédent, l’apprentissage augmente la valeur
maximale de l’objectif (ex ante);
La différence entre la valeur de l’objectif ex ante avec
apprentissage anticipé et sans apprentissage anticipé est la
valeur d’option;
Dans le cas de notre exemple, la valeur d’option d’attendre
d’apprendre avant de décider de construite ou non le barrage
est de 2,5M $.
La valeur d’option peut-elle être négative?
17
Deuxième exemple
(décision CONTINUE)
Un problème de changements climatiques :
Deux périodes : i Î {1, 2}
Niveau d’émission dans la période i : xi
Incertitude sur les dommages : S Î {1,3} Pr(S =1) = 0, 5 Pr(S = 3) = 0, 5
é2
ù
2
2
Objectif : E êå( 5xi - xi ) - S(x1 + x2 ) ú
ë i=1
û
Quel est le niveau optimal d’émission sans apprentissage?
Réponse : x1 = x2 = 0, 5
Objectif maximisé : 2,5
18
Deuxième exemple
APPRENTISSAGE NON-ANTICIPÉ
Décision sans apprentissage à la période 1 et décision
contingente à la période 2.
Période 1
Période 2
S =1
x2 =1
Objectif
ex post
Objectif espéré
4
0, 5´ 4 + 0, 5´1, 75 = 2,875
x1 = 0, 5
S=3
x2 = 0, 25
1, 75
19
Deuxième exemple
APPRENTISSAGE ANTICIPÉ
Décision contingente à la période 2 utilisée pour résoudre les
émissions de la période 1.
Période 1
Objectif espéré
Période 2
25
x2 = 26
» 0, 96
x1 = 15
26 » 0, 58
x1 = ?
S =1
x2 =
S=3
x2 =
5 - 2x1
4
5 - 6x1
8
70
x2 = 256
» 0, 27
» 2,885
20
Prudence
L’anticipation de l’apprentissage ne diminue pas
nécessairement les actions irréversibles optimales précédents
l’apprentissage;
Cela dépend de la nature du problème, du type
d’apprentissage et de la prudence du décideur;
La prudence caractérise les préférences du décideur par
rapport à un changement de niveau de risque;
Si le risque augmente dans une période, un décideur préférera
transférer de la richesse vers cette période si il est prudent;
Un décideur est prudent si la troisième dérivé de sa fonction
d’utilité (objectif) est positive.
21
Principe de précaution
Qu’est-ce?
Définition de la Convention-Cadre des Nations Unies sur les
Changements Climatiques :
Lorsqu’il y a risque de dommages irréversibles ou importants, le
manque de certitude scientifique complète ne devrait pas justifier de
repousser des mesures efficientes pour prévenir la dégradation de
l’environnement.
Que pensez-vous de cette définition?
Peut-elle aider à faire des choix?
22
Résolution PARTIELLE de
l’incertitude
Les exemples précédents ont considérés uniquement une
résolution complète de l’incertitude.
Qu’est-ce qu’une résolution partielle?
Prenez le dernier exemple. Si au lieu d’apprendre la valeur de S,
le décideur modifiait les probabilités attribués à chacune des
réalisations de S.
Avec probabilités égales, le décideur peut apprendre que :
a:
Pr(S =1) = 34 Pr(S = 3) = 14
b:
Pr(S =1) = 14 Pr(S = 3) = 43
23
Apprentissage ACTIF
L’apprentissage est actif lorsque le décideur peut influencer
l’arrivée d’information.
Cela implique souvent un arbitrage entre quête d’information et
coûts.
Revenons à notre exemple de changements climatiques
(résolution complète de l’incertitude):
Supposons que la résolution complète de l’incertitude est incertaine
et que cette incertitude dépend des émissions de la première
période;
Avec probabilité p(x1 ) j’apprends avec certitude la valeur de S, sinon
je n’apprends rien, et p'(x1 ) > 0.
24
Incertitude avec INFÉRENCE
BAYÉSIENNE
Théorème de Bayes :
En mots : sachant les probabilités inconditionnelles des événements A
et B, ainsi que la probabilité conditionnelle de B si A a déjà été
observé, quelle est la probabilité de A conditionnelle à l’observation
de B?
Pr(B A)´ P(A) Pr(A Ç B)
Pr(A
B)
=
=
En math :
Pr(B)
Pr(B)
Pour l’apprentissage :
Le décideur a ex ante une distribution a priori de la variable aléatoire;
L’observation d’un signal fournira de l’information sur cette variable
et permettra d’établir une distribution a posteriori;
Dans les deux premiers exemples avec distributions discrètes, le signal
donnait une information parfaite sur la variable aléatoire, ce qui
impliquait une distribution a posteriori où une seule valeur avait une
probabilité de 1.
25
Distributions conjuguées
Un truc de modélisation pour utiliser l’inférence bayésienne, les
distributions conjuguées.
Si la probabilité postérieure appartient à la même famille que
l’antérieure, cette dernière est la conjuguée de la distribution
conditionnelle du signal.
Pr(A B) =
Pr(B A)´ Pr(A)
Pr(B)
=
Pr(B A)´ Pr(A)
ò éëPr(B A)´ Pr(A)ùû dA
Si Pr(A) est la conjuguée antérieure de Pr(B A), alors la distribution Pr(A)
appartient à la même famille que Pr(B A) .
Exemple : si le signal est distribué conditionnellement Poisson et
que A est distribué Gamma, alors A conditionnel au signal est
aussi distribué Gamma (signal dist. selon binomiale négative).
26
Distributions conjuguées
EXEMPLE
Revenons encore à l’exemple de changement climatique.
S peut prendre les valeurs entières s Î {0,1, 2,...} ;
S ~ Pois(l )
l ~ G(a, g )
Quel est le signal?
Sur quoi apprend-t-on?
Qu’est qui est fondamentalement incertain?