version ppt - Julien Diard`s homepage

Download Report

Transcript version ppt - Julien Diard`s homepage

Cours 3
Julien Diard
Laboratoire de Psychologie et NeuroCognition – CNRS
UE Cognition bayésienne
11/01/2012
http://diard.wordpress.com
[email protected]
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
1
Plan des cours
1. Introduction à la Programmation Bayésienne :
incomplétude, incertitude
2. Programmation bayésienne : exemple détaillé,
taxonomie des classes de modèles probabilistes
3. Distributions usuelles, Programmation bayésienne
des robots
4. Modélisation bayésienne de la perception et de
l’action
5. Comparaison bayésienne de modèles
6. Compléments : inférence, apprentissage, principe
d’entropie
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
2
Plan
• Résumé + questions !
• « Vocabulaire » mathématique :
distributions usuelles
• Programmation Bayésienne des Robots
: exemples
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
3
Probability Theory As
Extended Logic
• Probabilités
« fréquentistes »
– Une probabilité est
une propriété
physique d’un objet
– Axiomatique de
Kolmogorov, théorie
des ensembles
–
• Probabilités
« subjectives »
E.T. Jaynes (1922-1998)
– Référence à un état de
connaissance d’un sujet
• P(« il pleut » | Jean),
P(« il pleut » | Pierre)
• Pas de référence à la
limite d’occurrence d’un
événement (fréquence)
• Probabilités
conditionnelles
– P(A | π) et jamais P(A)
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
4
Règles de calcul
• Règle du produit
 Théorème de Bayes
Reverend Thomas Bayes
(~1702-1761)
• Règle de la somme
 Règle de marginalisation
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
5
Bayesian Program = Description + Question
Description
•
Variables
•
Decomposition
•
Parametrical Forms or Recursive Question
Preliminary Knowledge p
Identification
Experimental Data d
Question
Program
Specification
Inference
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
6
Water treatment unit example
• Water treatment unit
– Bayesian Program
• Learn parameters
• Water treatment center
(importance of Conditional
Independence Hypotheses)
– Use the Bayesian
Program
• Questions and inference
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
7
Taxonomie des classes de
modèles probabilistes
• Réseaux bayésiens
• Réseaux bayésiens
dynamiques
• Filtres bayésiens
• Modèles de Markov
Cachés
• Filtres de Kalman
• Processus de
décision markovien
(partiellement
observable)
• …
(Bessière 03, Diard, CIRAS, 03)
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
8
Plan
• Résumé + questions !
• « Vocabulaire » mathématique :
distributions usuelles
• Programmation Bayésienne des Robots
: exemples
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
9
Uniforme, uniforme par intervalle
Support continu
!
Support discret
P(X) = 0 hors du support
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
10
Dirac, functional Dirac
• Support discret
– Plus délicat en continu
• somme à 1, support de taille 0 : valeur infinie
• Fonction d, Kronecker, Dirac
• Dirac fonctionnel P(X | Y) = d x=f(Y) (X)
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
11
Dirac, functional Dirac
• Sommer sur un Dirac
– 0.P(x1) + 0.P(x2) + 1.P(x3) + 0.P(x4) + …
• Inverser un Dirac
– Chercher x3…
P(E | B) = d(E)
E
D
F
C
 Mélange d’algorithmes
et de Programmes Bayésiens
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
A
B
12
Histogramme, lois de succession de Laplace
• Variables X, k cas, x1, x2, …, xk
• Chaque cas xi observé ni fois
• Total des cas n1 + … + nk = N
• Histogramme :
– Problème des cas jamais observés
• Loi de succession de Laplace :
– N = 0  uniforme
– N >> 0  histogramme
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
13
Gaussienne
• Domaine : !
• Distribution gaussienne,
normale
• Cas 1D
• Cas 2D
• Cas ND μ N-vector, Σ NxN symétrique
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
14
Laplace
•
• Distribution
« heavy tailed »
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
15
von Mises
• Domaine circulaire !
• μ direction moyenne
• λ paramètre de
concentration λ ≥ 0
• I0(λ) modified Bessel
function of the first kind
and order 0
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
16
Autres distributions courantes
• Beta, Poisson, Dirichlet
• Mixture de Gaussiennes
• Jones-Pewsey (2005) distributions
– von Mises
– Cardioid
– Wrapped Cauchy
• Wrapped Gaussian
• …
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
17
Plan
•
•
•
•
Résumé + questions !
Taxonomie des classes de modèles probabilistes
« Vocabulaire » mathématique : distributions usuelles
Programmation Bayésienne des Robots : exemples
–
–
–
–
–
–
–
Apprentissage de comportements réactifs
Fusion capteurs
Reconnaissance d’objets, de la base
Combinaison de comportements
Apprentissage de séquences de comportements
Intégration : tâche de veilleur de nuit
Autres applications : ADAS, CAD, learning sensorimotor
trajectories, Bayesian action selection and attention focusing, …
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
18
Learning Reactive Behaviors
Khepera Robot
• Avoiding Obstacle
• Contour Following
• Piano mover
• Phototaxy
• etc.
Lebeltel, O., Bessière, P., Diard, J. & Mazer, E. (2004) Bayesian Robot Programming; Autonomous Robots, Vol. 16, p. 49-79
Lebeltel, O. (1999) Programmation bayésienne des robots; Thèse INPG
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
19
Pushing Objects
dir=0
dir
pr
ox
2
3
1
dir=-10
4
0
5
-
+
rot
7
dir=+10
6
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
20
dir=0
Pushing Objects
dir
•
Variables
ox
pr
Specification
dir=-10
Dir  Prox Vrot
Description
5
dir=+10
+
rot
7
6
 PDir | d  p   PProx | d  p   PVrot | Dir Pr ox  d  p 

•

0
Decomposition
PDir Prox Vrot | d  p 

3
4
-
Parametrical Forms
PDir Prox | d  p   Uniform
PVrot | Dir Prox  d  p   Gaussians
 Preliminary Knowledge p
Identification
Question
Program
•
2
1
•
Joystick Remote Control  Experimental Data d1
PDir Prox Vrot | d1 p 

Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
21
dir=0
Pushing Objects
dir
•
Variables
ox
pr
Specification
dir=-10
Dir  Prox Vrot
Description
5
dir=+10
+
rot
7
6
 PDir | d  p   PProx | d  p   PVrot | Dir Pr ox  d  p 

•

0
Decomposition
PDir Prox Vrot | d  p 

3
4
-
Parametrical Forms
PDir Prox | d  p   Uniform
PVrot | Dir Prox  d  p   Gaussians
 Preliminary Knowledge p
Identification
Question
Program
•
2
1
•
Joystick Remote Control  Experimental Data d1
PDir Prox Vrot | d1 p 

Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
22
dir=0
Pushing Objects
dir
•
Variables
ox
pr
Specification
dir=-10
Dir  Prox Vrot
Description
•
dir=+10
+
rot
7
Parametrical Forms
PDir Prox | d  p   Uniform
PVrot | Dir Prox  d  p   Gaussians
 Preliminary Knowledge p
•
Joystick Remote Control  Experimental Data d1
PDir Prox Vrot | d1 p 
Utilization

5
6
 PDir | d  p   PProx | d  p   PVrot | Dir Pr ox  d  p 


0
Decomposition
PDir Prox Vrot | d  p 

3
4
-
Identification
Question
Program
•
2
1
PVrot | Dir  d   Prox  p d1 p 
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
23
Pushing Objects
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
24
dir=0
Contour Following
dir
•
Variables
ox
pr
Specification
dir=-10
Dir  Prox Vrot
Description
•
dir=+10
+
rot
7
Parametrical Forms
PDir Prox | d  p   Uniform
PVrot | Dir Prox  d  p   Gaussians
 Preliminary Knowledge p
•
Joystick Remote Control  Experimental Data d
PDir Prox Vrot | d1 p 
Utilization

5
6
 PDir | d  p   PProx | d  p   PVrot | Dir Pr ox  d  p 


0
Decomposition
PDir Prox Vrot | d  p 

3
4
-
Identification
Question
Program
•
2
1
PVrot | Dir  d   Prox  p d1 p 
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
25
Contour Following
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
26
Pushing vs Following
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
27
Plan
•
•
•
•
Résumé + questions !
Taxonomie des classes de modèles probabilistes
« Vocabulaire » mathématique : distributions usuelles
Programmation Bayésienne des Robots : exemples
–
–
–
–
–
–
–
Apprentissage de comportements réactifs
Fusion capteurs
Reconnaissance d’objets, de la base
Combinaison de comportements
Apprentissage de séquences de comportements
Intégration : tâche de veilleur de nuit
Autres applications : ADAS, CAD, learning sensorimotor
trajectories, Bayesian action selection and attention focusing, …
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
28
Sensor Fusion
• Objective
Source lumineuse
• Find the position of a light
source
ThetaL
• Difficulty
– No sensor to directly measure
the position of the light
source
tL
s
Di
Lmi
• Solution
– Model of each sensor
– Fusion of the 8 models
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
29
Model of a Light Sensor
Description
– Variables
ThetaL, DistL, Lmi
– Decomposition
PThetaL DistL 500
LmiLmi
| di  p Sensor
 PThetaL DistL400
| p Sensor  PLmi | ThetaL DistL  di  p Sensor
300
– Parametrical Forms200
180
PThetaL DistL | p Sensor
  Uniform
0
100

P
30 d
Lmi | ThetaL DistL
i
 p Sensor  Gaussians
20
 Preliminary KnowledgeDistL
psensor 10
Identification

Question
Program
Specification
-90
90
0
ThetaL
0 -180
– A priori specification
Utilization
PThetaL | Lmi  li di  p Sensor,PDistL | Lmi  li di  p Sensor
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
30
Model of a Light Sensor (2)
Bayesian Inference: Inverse Problem
Description:
PThetaL DistL  Lmi | di  p Sensor
 PThetaL DistL | p Sensor  PLmi | ThetaL DistL  di  p Sensor
Question 1:
PThetaL | lmi  di  p Sensor


1
  Plmi | ThetaL  DistL  di  p Sensor
Z Distl
Question 2:
PDistL | lmi  di  p Sensor



1
  Plmi | ThetaL  DistL  di  p Sensor
Z ThetaL
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
31
Model of a Light Sensor (3)
P(ThetaL | Lmi )
P(DistL | Lmi )
300)
500)
450)
15)
200)
(Lmi = 475)
45)
100)
0.50
P(ThetaL | Lmi Cp_li)
0.37
0.37
0.25
0.25
0.12
0.12
0.12
0.12
0.00
0.00
-180-135
-45
-180-135 -90
-90 -45
0.00
0.00
0
0
45
45
P(DistL | Lmi Cp_li)
0.50
90
170
90 135
135 170
0
0
5
5
10
10
15
15
20
20
Notion of ambiguity
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
32
25
25
Sensor Fusion Model
Description
– Variables
ThetaL, DistL, Lm0, …, Lm7
– Decomposition (Conditional Independance Hypothesis)
PThetaL DistL  Lm0 ... Lm7 | p Fusion
7
 PThetaL DistL | p Fusion   PLmi | ThetaL DistL  p Fusion
– Parametrical Forms
i 0
PThetaL DistL | p Fusion  Uniform

PLmi | ThetaL DistL  p Fusion  PLmi | ThetaL DistL  di  p Sensor
Identification
Question
Program
Specification

– No free parameters
Utilization
PThetaL | lm0 ... lm7  p Fusion,PLm3 | lm2  lm4 ThetaL p Fusion
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
33
7
1
PThetaL Lm0...Lm7 Cp_SL    PLmi ThetaL DistL Cp_li.
Z DistL i 0
Lm2 = 391
0.50
(capteurlum -10°)
Lm3 = 379
P(ThetaL | Lm2 Cp_l2)
0.50
0.37
0.37
0.25
0.25
0.12
0.12
0.00
0.50
P(ThetaL | Lm3 Cp_l3)
0.00
-180
Lm1 = 480
(capteurlum 10°)
-90 -45
0
45
90
170
-180
-90 -45
0
45
90
(capteurlum -50°)
170
Lm4 = 430
P(ThetaL | Lm1 Cp_l1)
0.50
0.37
(capteurlum 50°)
P(ThetaL | Lm4 Cp_l4)
0.37
0.25
0.25
Tetha = 10, Dist = 20
0.12
0.12
1.00
0.00
-180
-90 -45
0
45
90
170
P(ThetaL | Lm0..Lm7 Cp_SourceL)
0.00
0.75
-180
-90 -45
0
45
90
170
0.50
Lm0 = 509
(capteurlum -90°)
Lm5 = 503
(capteurlum 90°)
0.25
0.50
P(ThetaL | Lm0 Cp_l0)
0.50
0.00
0.37
-180
-90 -50 -101 0 50 90
170
0.37
0.25
0.25
0.12
0.12
0.00
-180
P(ThetaL | Lm5 Cp_l5)
0.00
-90 -45
0
45
90
170
Lm7 = 511
0.50
-180
(capteurlum -170°)
Lm6 = 511
P(ThetaL | Lm7 Cp_l7)
0.50
0.37
0.37
0.25
0.25
0.12
0.12
0.00
Julien Diard — LPNC-CNRS
-180
-90 -45
-90 -45
0
(capteurlum 170°)
P(ThetaL | Lm6 Cp_l6)
0.00
0
45
90
170
-180
-90 -45
0
45
90
170
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
34
45
90
170
Sensor Fusion: diagnostic
(Theta = -10, Dist=10)
0.05
P(Lm3 | Lm2 Lm4 Theta Cp_SourceL)
0.04
0.03
0.01
0.00
100
150 170
250
200
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
35
perception
Sensor Fusion
stimulus
S1
S2
Sn
V
S1
• Perception
S2
Sn
sensations
– Un problème inverse (Poggio, 1984)
• Modèle bayésien
– Inversion + hypothèse d’indépendance
conditionnelle
– PS1S2 ...SnV | C
 PV | CPS1 |VCPS2 |VC...PSn |VC
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
36
?
V
Perception
modeling
perception
cf. cours 4
stimulus
S1
S2
Sn
V
S1
• Perception
S2
Sn
sensations
– Un problème inverse (Poggio, 1984)
• Modèle bayésien
– Inversion + hypothèse d’indépendance
conditionnelle
– PS1S2 ...SnV | C
 PV | CPS1 |VCPS2 |VC...PSn |VC
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
37
?
V
Plan
•
•
•
•
Résumé + questions !
Taxonomie des classes de modèles probabilistes
« Vocabulaire » mathématique : distributions usuelles
Programmation Bayésienne des Robots : exemples
–
–
–
–
–
–
–
Apprentissage de comportements réactifs
Fusion capteurs
Reconnaissance d’objets, de la base
Combinaison de comportements
Apprentissage de séquences de comportements
Intégration : tâche de veilleur de nuit
Autres applications : ADAS, CAD, learning sensorimotor
trajectories, Bayesian action selection and attention focusing, …
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
38
Object recognition,
novelty detection
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
39
Object Recognition (Model)
Description
•
Variables
•
Decomposition (Conditional Independance Hypothesis)
Nlt, Nrt, Per, Llsl, O = {0, 1, 2, …}
PO  Nrt  Nlt  Per  Llsl | d  p 
 PO | d  p   PNrt | O  d  p   PNlt | O  d  p 
•
 PPer | O  d  p   PLlsl | O  d  p 
Parametrical Forms
PO | d C  Uniform


Question
Program
Specification
Identification
•
Identification of the Laplace succession laws and Gaussians
Utilization
PO | nlt nrt  per llsl  d  p 
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
40
Object Recognition (Question)
PO | nlt nrt  per llsl  d  p 

Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
41
Object Recognition (Result)
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
42
Home recognition
Specification
•
Variables
Description
Question
Program
Lm0,…, Lm7, Px0, …, Px7, Base
•
Decomposition (Conditional Independance Hypothesis)
•
Parametrical Forms
Identification
•
Learning of the Gaussians
Utilization
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
43
Bayesian Maps
Diard, J. (2003) La carte bayésienne : Un modèle probabiliste hiérarchique pour la navigation en robotique mobile; PhD thesis, INPG
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
44
Plan
•
•
•
•
Résumé + questions !
Taxonomie des classes de modèles probabilistes
« Vocabulaire » mathématique : distributions usuelles
Programmation Bayésienne des Robots : exemples
–
–
–
–
–
–
–
Apprentissage de comportements réactifs
Fusion capteurs
Reconnaissance d’objets, de la base
Combinaison de comportements
Apprentissage de séquences de comportements
Intégration : tâche de veilleur de nuit
Autres applications : ADAS, CAD, learning sensorimotor
trajectories, Bayesian action selection and attention focusing, …
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
45
Comportement phototaxie
Spécification
– Variables
Description
– Décomposition
• P(Lum Vrot | C-photo) = P(Lum | C-photo) P(Vrot | Lum C-photo)
– Formes paramétriques
• P(Lum | C-photo)  Uniforme
• P(Vrot | Lum C-photo)  Gaussiennes
1.00
0.80
Identification
P(Vrot | Lum)
0.60
0.40
Question
Programme
• Lum : {-170, -90, -45, -10, +10, +45, +90, +170}, 8
• Vrot : [-10..+10], 21
– A priori
0.20
0.00
-10
Utilisation
-8
170
-6
-4
-2
Vrot
90
0
2
4
– P(Vrot | [Lum=l] C-photo)
-45
6
8
-90
10
-170
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
46
10
-10
45
Lum
Homing Behavior
Description
•
Variables
•
Decomposition
PDir Prox ThetaL H Vrot | p Homing 
Dir, Prox, ThethaL, Vrot
H : {a, p} [H=a] : avoid, [H=p] : phototaxy
 PDir Prox ThetaL | p Homing  PH | Prox  p Homing 
•


Question
Program
Specification



 PVrot | Dir Prox ThetaL H  p Homing 
Parametrical Forms and Recursive Questions
PDir Prox ThetaL| p Homing  Uniform
PH | Prox  p Homing  f Prox
PVrot | Dir Prox ThetaL H  a  p Homing 
 PVrot | Dir Prox  p Avoidance 
PVrot | Dir  Prox ThetaL  H  p  p Homing 
 PVrot | ThetaL  p Phototaxy 
Utilization
PVrot | dirt  proxt lumt  p Homing 
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
47
Homing Behavior
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
48
Identification de P(H | Prox)
P(H | Dir Prox Lum Vrot)
P(Vrot | Dir Prox Lum H)
=
 H P(Vrot | Dir Prox Lum H)
P([H = e] | Dir Prox Lum Vrot)
P([H = p] | Dir Prox Lum Vrot)
Khep era
1
P(Vrot | Dir Prox C - évit)
Z
1
=
P(Vrot | Lum C - photo)
Z
=
ob stacle
source
lumineuse
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
49
Identification de P(H | Prox)
• Propagation de P(H | Dir Prox Lum Vrot)
• Exemple
– P([H=e] | Dir Prox Lum Vrot) = 0,82
– P([H=p] | Dir Prox Lum Vrot) = 0,18
– Création de 82 données <e, proxt >
18 données <p, proxt >
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
50
Apprentissage
hiérarchique :
résultat
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
51
Plan
•
•
•
•
Résumé + questions !
Taxonomie des classes de modèles probabilistes
« Vocabulaire » mathématique : distributions usuelles
Programmation Bayésienne des Robots : exemples
–
–
–
–
–
–
–
Apprentissage de comportements réactifs
Fusion capteurs
Reconnaissance d’objets, de la base
Combinaison de comportements
Apprentissage de séquences de comportements
Intégration : tâche de veilleur de nuit
Autres applications : ADAS, CAD, learning sensorimotor
trajectories, Bayesian action selection and attention focusing, …
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
52
Platform: Unreal Tournament
Le Hy, R., Arrigoni, A., Bessière, P. & Lebeltel, O. (2004) Teaching Bayesian Behaviours to Video Game Characters; Journal of Robotics and Autonomous
Systems, Vol. 14 pp. 177-185
Le Hy, R. (2007) Programmation bayésienne d’avatars dans les jeux vidéos; PhD thesis, INPG
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
53
Bayesian Bot
Specification
Description
• Perception: L Life, W Weapon, FW Foe Weapon, N Noise,
FN Foe Number, PW Proximity Weapon,
PL Proximity Life
• State: St, St+1 {Attack, Weapon Search, Life Search, Exploration,
Escape, Danger Detection}
• Decomposition
P(St St+1 L W FW N FN PW PL)
= P(St) P(St+1 | St) P(L | St+1) P(W | St+1) P(FW | St+1)
P(N | St+1) P(FN | St+1) P(PW | St+1) P(PL | St+1)
• Parametric Forms
Tables
Question
Program
• Variables
Identification
Utilization
• Playing: P(St+1 |St L W FW N FN PW PL)
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
54
Table P(St+1 | St)
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
55
Learning by selection
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
56
Learning by demonstration
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
57
Result
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
58
Learned P(St+1 | St)
Manually
written
Learned
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
59
Learned P(WF | St+1)
WF foe weapon
A attack
RA weapon search
RV recherche vie
Ex exploration
Fu fuite
DD danger detection
Manually
written
Learned
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
60
Learned P(N | St+1)
N Noise
A attack
RA weapon search
RV recherche vie
Ex exploration
Fu fuite
DD danger detection
Specified
Table
Learned
with Game
Sound
Learned without
sound (boolean
sound)
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
61
Performance
Similar score (± 10%)
40% inferior
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
62
Plan
•
•
•
•
Résumé + questions !
Taxonomie des classes de modèles probabilistes
« Vocabulaire » mathématique : distributions usuelles
Programmation Bayésienne des Robots : exemples
–
–
–
–
–
–
–
Apprentissage de comportements réactifs
Fusion capteurs
Reconnaissance d’objets, de la base
Combinaison de comportements
Apprentissage de séquences de comportements
Intégration : tâche de veilleur de nuit
Autres applications : ADAS, CAD, learning sensorimotor
trajectories, Bayesian action selection and attention focusing, …
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
63
Nightwatchman Task
Question :

P 
Vrot Vtrans

P M | s  p Watchman
px0 ..px7 lm0 ..lm7 veille
feu obj?

eng tach_t - 1 td_t - 1 tempo tour
p Watchman.
dir prox dirG proxG vtrans_c

dnv mnv mld per

Solution :
P(Vrot Vtrans | px0 px1 … lm7 veille feu … per)

∑ThetaL
DistL Td Tach H Base
P(…)
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
64
Nightwatchman Task

P Vrot Vtrans


Answer!

1
Z

Td
T hetaL
H
px0 ..px7 lm0 ..lm7 veille
feu obj?

eng tach_t - 1 td_t - 1 tempo tour
p Watchman
dir prox dirG proxG vtrans_c

dnv mnv mld per


 

Tach

p Moove 

PTd

td_t
1
tempo
tour







 

Base


 

P
Tach
veille
feu obj? p Task 
  
 




T ach 
 

eng tach_t - 1






Base


px0 ...px7

 

p Base 


P Base

lm0
...lm7







  PThetaL DistL lm0 ..lm7 p Fusion 
DistL
P H prox p Homing

 
H Td ThetaL
P
Vrot
Vtrans


dir prox dirG proxG vtrans_c
 


Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
65









.







p Watchman 

Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
66
Decision
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
67

P Vrot Vtrans



1
Z

Td
T hetaL
H
px0 ..px7 lm0 ..lm7 veille
feu obj?

eng tach_t - 1 td_t - 1 tempo tour

p
Watchman
dir prox dirG proxG vtrans_c
dnv mnv mld per


 

Tach

p Moove 

PTd

td_t - 1 tempo tour


 



 

Base


 

  
P Tach veille feu obj? p Task 

T ach 
 
eng tach_t - 1







Base


px0 ...px7

 

p Base 


P Base

lm0 ...lm7

 




  PThetaL DistL lm0 ..lm7 p Fusion 
DistL
P H prox p Homing

 
H Td ThetaL
PVrot Vtrans
dir prox dirG proxG vtrans_c
 











.







p Watchman 

• Inférence exacte
– sommation, propagation des
incertitudes
• Inférence approximée
– décisions intermédiaires (tirage
de points), propagation d’une
partie des incertitudes
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
68
Nightwatchman Task: Result
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
69
Plan
•
•
•
•
Résumé + questions !
Taxonomie des classes de modèles probabilistes
« Vocabulaire » mathématique : distributions usuelles
Programmation Bayésienne des Robots : exemples
–
–
–
–
–
–
–
Apprentissage de comportements réactifs
Fusion capteurs
Reconnaissance d’objets, de la base
Combinaison de comportements
Apprentissage de séquences de comportements
Intégration : tâche de veilleur de nuit
Autres applications : ADAS, CAD, learning sensorimotor
trajectories, Bayesian action selection and attention focusing, …
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
70
Bayesian
Occupancy
Filter for ADAS
Objectif : évitement d’obstacle
Pas de soucis d’identification et
de tracking des cibles
Coué, C., Pradalier, C., Laugier, C., Fraichard, T. & Bessière, P. (2006) Bayesian Programming multi-target tracking: an automotive application; IJRR
(International Journal of Robotic Research); Vol. 25, N° 1, pp. 19-30
Coué, C. (2003) Fusion d’information capteur pour l’aide à la conduite automobile; PhDF thesis, INPG
Coué, C. (2003) Fusion d’information capteur pour
Julien
DiardPhDF
— thesis,
LPNC-CNRS
l’aide à la conduite
automobile;
INPG
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
71
Illustration (1 sensor - 1 object)
z = (5, 2, 0, 0)
P([Ec=1] | z c)
c = [x, y, 0, 0]
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
72
Illustration (1 sensor - 1 object)
z = (5, 2, 0, 0)
P([Ec=1] | z c)
c = [x, y, 0.8, -1.0]
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
73
Illustration (1 sensor - 1 object)
• Occupied space
• Free space
• Nonobservable space
• Occulted space
P([Ec=1] | z c)
c = [x, y, 0, 0]
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
74
Multi-target: illustration
z1 = (8.3, -4, 0, 0)
z2 = (7.3, 1.9, 0, 0.8)
z3 = (5, 3, 0, 0)
P([Ec=1] | z1 z2 z3 c)
c = [x, y, 0, 0]
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
75
Multi-target: illustration
z1 = (8.3, -4, 0, 0)
z2 = (7.3, 1.9, 0, 0.8)
z3 = (5, 3, 0, 0)
P([Ec=1] | z1 z2 z3 c)
c = [x, y, 0, 0.8]
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
76
Illustration (2 sensors - 3 objects)
z1,1 = (5.5, -4, 0, 0) z1,2 = (5.5, 1, 0, 0)
z2,1 = (11, -1, 0, 0) z2,2 = (5.4, 1.1, 0,0)
P([Ec=1] | z1,1 z1,2 z2,1 z2,2 c)
c = [x, y, 0, 0]
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
77
Results - 1
No filter
Bayesian filter
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
78
Results - 2
No filter
Bayesian filter
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
79
Application 1 – Cycab control
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
80
Application 2 - ADAS
Entrée video, produit les zones d’intérêt
BOF
Cibles dans
le BOF
(Simule le regard
du conducteur)
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
81
Application 3
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
82
Application 4 – multi-camera
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
83
Bayesian CAD system
Mekhnacha, K. (1999) Méthodes
probailistes bayésiennes pour la prise en
compte des incertitudes géométriques :
Applications à la CAO robotique; PhD
thesis, INPPG
Mekhnacha, K., Mazer, E. & Bessière,
P. (2001) The design and
implementation of a Bayesian CAD
system; Advanced Robotics, Vol. 15,
N° 1
Mekhncha, K., Mazer, E. & Bessière,
P. (2000) A Robotic CAD system using
a Bayesian Framework; Best Paper
Award IEEE/IROS; Vol 3, pp. 15971604
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
84
Kinematic Chains
AXE 1
ROBOT
P(Q)
AXE 2
AXE 3
P(Q)
AXE 2
AXE 3
P(Q)
O(Q) = 0
C(Q) < 0
GRIPPER
AXE 1
GRIPPER
TABLE
P(Q)
EDGE 1
C(Q) < 0
ROBOT
PART
PART
EDGE 1
TABLE
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
85
Uncertainty Elipsoid
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
86
Insertion
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
87
Kinematic Inversion
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
88
Robot navigation
Pradalier, C., Hermosillo, J., Koike, C.,
Braillon, C., Bessière, P. & Laugier, C. (2005)
The CyCab: A car-like robot navigating
autonomously and safely among pedestrians;
Robotics and Autonomous Systems
Pradalier, C. (2005) Navigation
intentionelle d’un robot mobile; PhD
thesis, INPG
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
89
Robot navigation
Programmation proscriptive
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
90
Robot navigation
Trajectory learning and replay
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
91
Plan
•
•
•
•
Résumé + questions !
Taxonomie des classes de modèles probabilistes
« Vocabulaire » mathématique : distributions usuelles
Programmation Bayésienne des Robots : exemples
–
–
–
–
–
–
–
Apprentissage de comportements réactifs
Fusion capteurs
Reconnaissance d’objets, de la base
Combinaison de comportements
Apprentissage de séquences de comportements
Intégration : tâche de veilleur de nuit
Autres applications : ADAS, CAD, learning sensorimotor
trajectories, Bayesian action selection and attention focusing, …
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
92
Bayesian Approach to Action
Selection and Attention Focusing
Koike, C. (2005) Bayesian approach to Action Selection and Attention Focusing:
Application in Autonomous Robot Programming; PhD thesis; INPG
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
93
Early development of speech:
Orofacial imitation
Serkhane, J., Schwatrz, J-L. & Bessière, P. (2005) Building a talking bay robot: a contribution to the study of speech acquisition and
evolution; Interaction studies, Vol. 6 N° 2, pp. 253-286
Serkhane, J. (2005) Apprentissage Bayésien Intersensoriel de structure phonologique par un androïde bébé; PhD thesis UJF
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
94
Early development of speech:
Orofacial imitation
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
95
Cost Evaluation
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
96
Merci de votre attention !
Questions ?
Julien Diard — LPNC-CNRS
Cours EDISCE/EDMSTII - M2R Sciences Cognitives, « Cognition bayésienne » — 2012
97