CHAP 1. Les critères de décision en univers non mesurable

Download Report

Transcript CHAP 1. Les critères de décision en univers non mesurable

CHAP 1.

Les critères de décision en univers non mesurable

1- Le critère de Laplace

Fonction de valorisation :

– Évaluer la moyenne des résultats de chaque action.

V a j

 1

n e i e i

  

e n e

1

R a j

,

e i

Critère de choix :

– Choisir l’action dont la moyenne est la plus élevée.

a

*  arg max  

a j

Exemple d’application

Actions\états a 1 a 2 a 3 e 1 20 5 40

V a

1

V a

2

V a

3    1 4 1 1 4   20 40  25  40  100   46 , 25    4  5  30  50  125   52 , 5  50  75  0   41 , 25     e 2 25 30 50 e 3 40 50 75 e 4 100 125 0  arg max  

a j

a

* 

a

2

a

2 

a

1 

a

3

Critique du critère de Laplace :

• Critère de la raison insuffisante – Car tout se passe comme si on cherchait à maximiser une espérance mathématique de gain comme si on était dans un univers

risqué

et

équiprobable

.

2- Le critère du MaxiMax

• •

Fonction de valorisation :

– Déterminer le résultat maximum que peut rapporter chaque action.

V a j

Critère de choix :

 sup  

a j

,

e i e i

– Choisir l’action dont la fonction de valorisation est la plus élevée

a

*  arg max  

a j

Exemple d’application

Actions\états a 1 a 2 a 3 e 1 20 5 40 e 2 25 30 50 e 3 40 50 75 e 4 100 125 0

V a

1

V a

2

V a

3    sup sup sup   20 ; 5 ;  40 ; 25 30 ; 50 ; ; 40 50 ; 75 ; 125 ; 100 0       100 125 75       arg max  

a j

a

* 

a

2

Critique du critère du MaxiMax :

• Critère trop optimiste – En effet, en utilisant le critère du MaxiMax, l’agent se comporte comme un optimiste qui ne voit que la possibilité de gagner le plus possible en omettant les possibilités de gain inférieur.

3- Le critère de WALD ou MaxiMin

Fonction de valorisation :

– Déterminer le résultat minimum que peut rapporter chaque action.

V a j

 inf

e i

 

j i

, •

Critère de choix :

–Choisir l’action dont la fonction de valorisation est la plus élevée.

a

*  arg max  

a j

Exemple d’application

Actions\états a 1 a 2 a 3 e 1 20 5 40 e 2 25 30 50 e 3 40 50 75 e 4 100 125 0

V a

1

V a

2

V a

3  inf  inf  inf   20 ; 5 ;  40 ; 25 30 ; 50 ; ; 40 50 ; 75 ; 125 ; 100 0       0 5 20       arg max  

a j

a

* 

a

1

Critique du critère de WALD

• Critère trop pessimiste – En effet, en utilisant le critère de WALD, l’agent se comporte comme un pessimiste qui se dit : «

je n’ai pas de chance donc je vais choisir l’action qui a le plus grand résultat minimum : je suis certain d’avoir au moins ce minimum

».

4- Le critère d’HURWICZ

• •

Fonction de valorisation :

– Déterminer une fonction prenant en compte le pire des résultats avec la probabilité a et le meilleur résultat avec la probabilité (1 a .

V a j

 a .

inf

e i

 

a j

,

e i

 ( 1  a ) sup

e i

 

a j

,

e i

Critère de choix :

–Choisir l’action dont la fonction de valorisation est la plus élevée.

a

*  arg max  

a j

Exemple d’application

Actions\états a 1 a 2 a 3 e 1 20 5 40 e 2 25 30 50 e 3 40 50 75 e 4 100 125 0

V a

1  a .

20  ( 1  a ) 100  100  80 .

a

V a

2

V a

3  a .

5  ( 1  a ).

125  125  120 .

a  a .

0  ( 1  a ).

75  75  75 .

a

L’action a 1 est préférée si : 100  80 .

a 100  80 .

a  125  120 .

a  75  75 .

a    a a  5 8  5 L’action a 2 est préférée si :   125 125  120 .

a  120 .

a  100  80 .

a  75  75 .

a      a a  5 8  10 9 Optimisme 0 L’action a 3 est préférée si :  75   75  75 .

a 75 a   100 125  80 .

a  120 .

a    a a  5  10 9    a*=a 2 5 8 Pessimisme a*=a 1 1

Remarques sur le critère d’HURWICZ :

• Généralisation du choix d’un agent qui ne serait ni complètement optimiste, ni complètement pessimiste. – Si a =0, l’agent est résolument optimiste – Si a =1, l’agent est résolument pessimiste • L’agent doit connaître son degré d’optimisme a !

5- Le critère de SAVAGE

Fonction de valorisation :

– On détermine une fonction de regret qui mesure le manque à gagner en n’ayant pas choisi la « bonne action » pour chaque état de la nature.

V a j

e i e i

 

n

 1   sup

a j

 

a j

,

e i

R a j

,

e i

  •

Critère de choix :

–Choisir l’action dont la fonction de regret est la plus faible.

a

*  arg min  

a j

Exemple d’application

Actions\états a 1 a 2 a 3 e 1 20 5 40 e 2 25 30 50 e 3 40 50 75 e 4 100 125 0

V a

1

V a

2

V a

3     40  40  40    20   50  25   75  40   125  100   105 5   50 40   50   30   75 50   75   50   125 75   125   125  0    80 125

6- Le critère MOYENNE-VARIABILITE

Fonction de valorisation :

– La fonction de valorisation est caractérisée par un couple composé par la moyenne de l’action et sa variabilité..

moy

 

j

  

j

  sup

e i

1

n e i e i

 

n

 1

   

a j

,

e i

 

a j

,

e i e i j

,

e i

Critère de choix n° 1 :

a k

a l

si  

moy moy

( (

a a k k

) )  

moy

( ou

a l

) et bien  (

a k moy

(

a l

) et  (

a k

) )    (

a l

 (

a l

) )

Cette règle de comparaison est assez restrictive : Elle ne prend pas en considération le fait qu’une forte variabilité compensée par une forte moyenne puisse être intéressante.

Donc ce critère ne fonctionne pas toujours : il faut le compléter

Exemple d’application

Actions\états a 1 a 2 a 3 e 1 20 5 40

moy

  1    1   1 100 4   20 20   25 80  40  100   46 , 25

moy

  2    2   1 125 4   5 5   30 120  50  125   52 , 5

moy

  3    3   1 75 4   40 0   50  75 75  0   41 , 25 e 2 25 30 50 e 3 40 50 75 e 4 100 125 0

Pas de décision possible !

Critère de choix n° 2 :

a k

a l

si

moy

a

 

k k

moy

    

l l

Cette règle consiste à mesurer le pourcentage de moyenne par unité de variabilité.

La meilleur stratégie sera celle qui aura la plus grande moyenne par unité de variabilité

Application du critère n°2 :

moy

   1   1   46 , 80 25   

moy

a

    1

a

1  0 , 5781

moy

a

    2 2   52 120 , 5   

moy

a

    2

a

2  0 , 4375

moy

   3   3   41 , 25  75   

moy

a

    3

a

3  0 , 55

a

1 

a

3 

a

2

Critère de choix n° 3 :

a k

a l

si

moy

  

a

k

k

moy

   

l

 

l

 

Cette règle apporte une notion de déplacement mesuré par le Taux Marginal de Substitution entre la moyenne et la variabilité.

On peut donc changer de stratégie à condition que le taux d’échange soit assez élevé.

Il faut toujours tester deux actions de telle façon que le numérateur et le dénominateur soient positifs

Application du critère n°3 : Comparaison de a 1

a

2 

a

1

et de a 2

si

moy

  

a

2 2 

moy a

1   1  52 , 5  46 , 25 120  80  0 , 15625  

Comparaison de a 2

a

2 

a

3

et de a 3

si

moy

  

a

2 2 

moy a

3   3  52 , 5  41 , 25 120  75  0 , 25  

Comparaison de a 1

a

1 

et de a 3

a

3 si

moy

  

a

1 1  

moy

a

3   3  46 , 25  41 , 25 80  75  1  

a

1

a

2

a

3

0,15625 0,25 1

a

2

0,15625

a

1

0,25

a

1

1

a

3