Transcript CHAP 1. Les critères de décision en univers non mesurable
CHAP 1.
Les critères de décision en univers non mesurable
1- Le critère de Laplace
•
Fonction de valorisation :
– Évaluer la moyenne des résultats de chaque action.
V a j
1
n e i e i
e n e
1
R a j
,
e i
•
Critère de choix :
– Choisir l’action dont la moyenne est la plus élevée.
a
* arg max
a j
Exemple d’application
Actions\états a 1 a 2 a 3 e 1 20 5 40
V a
1
V a
2
V a
3 1 4 1 1 4 20 40 25 40 100 46 , 25 4 5 30 50 125 52 , 5 50 75 0 41 , 25 e 2 25 30 50 e 3 40 50 75 e 4 100 125 0 arg max
a j
a
*
a
2
a
2
a
1
a
3
Critique du critère de Laplace :
• Critère de la raison insuffisante – Car tout se passe comme si on cherchait à maximiser une espérance mathématique de gain comme si on était dans un univers
risqué
et
équiprobable
.
2- Le critère du MaxiMax
• •
Fonction de valorisation :
– Déterminer le résultat maximum que peut rapporter chaque action.
V a j
Critère de choix :
sup
a j
,
e i e i
– Choisir l’action dont la fonction de valorisation est la plus élevée
a
* arg max
a j
Exemple d’application
Actions\états a 1 a 2 a 3 e 1 20 5 40 e 2 25 30 50 e 3 40 50 75 e 4 100 125 0
V a
1
V a
2
V a
3 sup sup sup 20 ; 5 ; 40 ; 25 30 ; 50 ; ; 40 50 ; 75 ; 125 ; 100 0 100 125 75 arg max
a j
a
*
a
2
Critique du critère du MaxiMax :
• Critère trop optimiste – En effet, en utilisant le critère du MaxiMax, l’agent se comporte comme un optimiste qui ne voit que la possibilité de gagner le plus possible en omettant les possibilités de gain inférieur.
3- Le critère de WALD ou MaxiMin
•
Fonction de valorisation :
– Déterminer le résultat minimum que peut rapporter chaque action.
V a j
inf
e i
j i
, •
Critère de choix :
–Choisir l’action dont la fonction de valorisation est la plus élevée.
a
* arg max
a j
Exemple d’application
Actions\états a 1 a 2 a 3 e 1 20 5 40 e 2 25 30 50 e 3 40 50 75 e 4 100 125 0
V a
1
V a
2
V a
3 inf inf inf 20 ; 5 ; 40 ; 25 30 ; 50 ; ; 40 50 ; 75 ; 125 ; 100 0 0 5 20 arg max
a j
a
*
a
1
Critique du critère de WALD
• Critère trop pessimiste – En effet, en utilisant le critère de WALD, l’agent se comporte comme un pessimiste qui se dit : «
je n’ai pas de chance donc je vais choisir l’action qui a le plus grand résultat minimum : je suis certain d’avoir au moins ce minimum
».
4- Le critère d’HURWICZ
• •
Fonction de valorisation :
– Déterminer une fonction prenant en compte le pire des résultats avec la probabilité a et le meilleur résultat avec la probabilité (1 a .
V a j
a .
inf
e i
a j
,
e i
( 1 a ) sup
e i
a j
,
e i
Critère de choix :
–Choisir l’action dont la fonction de valorisation est la plus élevée.
a
* arg max
a j
Exemple d’application
Actions\états a 1 a 2 a 3 e 1 20 5 40 e 2 25 30 50 e 3 40 50 75 e 4 100 125 0
V a
1 a .
20 ( 1 a ) 100 100 80 .
a
V a
2
V a
3 a .
5 ( 1 a ).
125 125 120 .
a a .
0 ( 1 a ).
75 75 75 .
a
L’action a 1 est préférée si : 100 80 .
a 100 80 .
a 125 120 .
a 75 75 .
a a a 5 8 5 L’action a 2 est préférée si : 125 125 120 .
a 120 .
a 100 80 .
a 75 75 .
a a a 5 8 10 9 Optimisme 0 L’action a 3 est préférée si : 75 75 75 .
a 75 a 100 125 80 .
a 120 .
a a a 5 10 9 a*=a 2 5 8 Pessimisme a*=a 1 1
Remarques sur le critère d’HURWICZ :
• Généralisation du choix d’un agent qui ne serait ni complètement optimiste, ni complètement pessimiste. – Si a =0, l’agent est résolument optimiste – Si a =1, l’agent est résolument pessimiste • L’agent doit connaître son degré d’optimisme a !
5- Le critère de SAVAGE
•
Fonction de valorisation :
– On détermine une fonction de regret qui mesure le manque à gagner en n’ayant pas choisi la « bonne action » pour chaque état de la nature.
V a j
e i e i
n
1 sup
a j
a j
,
e i
R a j
,
e i
•
Critère de choix :
–Choisir l’action dont la fonction de regret est la plus faible.
a
* arg min
a j
Exemple d’application
Actions\états a 1 a 2 a 3 e 1 20 5 40 e 2 25 30 50 e 3 40 50 75 e 4 100 125 0
V a
1
V a
2
V a
3 40 40 40 20 50 25 75 40 125 100 105 5 50 40 50 30 75 50 75 50 125 75 125 125 0 80 125
6- Le critère MOYENNE-VARIABILITE
•
Fonction de valorisation :
– La fonction de valorisation est caractérisée par un couple composé par la moyenne de l’action et sa variabilité..
moy
j
j
sup
e i
1
n e i e i
n
1
a j
,
e i
a j
,
e i e i j
,
e i
Critère de choix n° 1 :
a k
a l
si
moy moy
( (
a a k k
) )
moy
( ou
a l
) et bien (
a k moy
(
a l
) et (
a k
) ) (
a l
(
a l
) )
Cette règle de comparaison est assez restrictive : Elle ne prend pas en considération le fait qu’une forte variabilité compensée par une forte moyenne puisse être intéressante.
Donc ce critère ne fonctionne pas toujours : il faut le compléter
Exemple d’application
Actions\états a 1 a 2 a 3 e 1 20 5 40
moy
1 1 1 100 4 20 20 25 80 40 100 46 , 25
moy
2 2 1 125 4 5 5 30 120 50 125 52 , 5
moy
3 3 1 75 4 40 0 50 75 75 0 41 , 25 e 2 25 30 50 e 3 40 50 75 e 4 100 125 0
Pas de décision possible !
Critère de choix n° 2 :
a k
a l
si
moy
a
k k
moy
l l
Cette règle consiste à mesurer le pourcentage de moyenne par unité de variabilité.
La meilleur stratégie sera celle qui aura la plus grande moyenne par unité de variabilité
Application du critère n°2 :
moy
1 1 46 , 80 25
moy
a
1
a
1 0 , 5781
moy
a
2 2 52 120 , 5
moy
a
2
a
2 0 , 4375
moy
3 3 41 , 25 75
moy
a
3
a
3 0 , 55
a
1
a
3
a
2
Critère de choix n° 3 :
a k
a l
si
moy
a
k
k
moy
l
l
Cette règle apporte une notion de déplacement mesuré par le Taux Marginal de Substitution entre la moyenne et la variabilité.
On peut donc changer de stratégie à condition que le taux d’échange soit assez élevé.
Il faut toujours tester deux actions de telle façon que le numérateur et le dénominateur soient positifs
Application du critère n°3 : Comparaison de a 1
a
2
a
1
et de a 2
si
moy
a
2 2
moy a
1 1 52 , 5 46 , 25 120 80 0 , 15625
Comparaison de a 2
a
2
a
3
et de a 3
si
moy
a
2 2
moy a
3 3 52 , 5 41 , 25 120 75 0 , 25
Comparaison de a 1
a
1
et de a 3
a
3 si
moy
a
1 1
moy
a
3 3 46 , 25 41 , 25 80 75 1
a
1
a
2
a
3
0,15625 0,25 1
a
2
0,15625
a
1
0,25
a
1
1
a
3