Soutenance_These_Herve_Goeau_25_05_09

Download Report

Transcript Soutenance_These_Herve_Goeau_25_05_09

Structuration de collection d’images
par apprentissage actif crédibiliste
Hervé Goëau
25 mai 2009
1
Motivations
Valoriser des fonds de collections d’images
Plan
Introduction
Modélisation de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Conclusion
•
•
Contexte INA : Photothèque
Contexte « grand public » : collections personnelles de photographies
Bateaux
Plage
Montagnes
Famille
2
Systèmes existants
1. Manuel
Plan
Introduction
Modélisation de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Conclusion
+expressivité, ergonomie
- fastidieux
2. Automatique
+ productivité
- satisfaction
3. Semi-automatique
+ expressivité, contrôle utilisateur
- peut être fastidieux
3
Objectifs et contraintes
Plan
• Semi-automatique
Introduction
Modélisation de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Conclusion
• Collections vierges
• Satisfaction totale de l’utilisateur
- Capturer ses intentions
- Diminuer sa charge de travail
• Une ou plusieurs catégories par image
4
Proposition
Plan
Introduction
Modélisation de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Conclusion
Utilisateur
Choix d’une stratégie
de sélection
Images
non
étiquetées
Modélisation
et synthèse de
la
connaissance
Etats de
connaissance
Interactions
Sélection
active
d’images
Liste(s)
d’images
Interface
homme
machine
Etiquetages
Images
étiquetées
Nouvel état des étiquettes
5
Plan
Introduction
Modélisation
de la
connaissance
Modélisation et synthèse de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Conclusion
6
Problématique
?
Ø
Plan
Introduction
Modélisation
de la
connaissance
« éléphants »
?
Sélection active
d’images
Interface et
démonstration
Evaluations
Conclusion
?
« monuments »
?
« plages »
7
Contenus visuels
Non étiquetée u
Étiquetée lq
Plan
Introduction
Modélisation
de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Conclusion
Descriptions couleurs, orientations
Croyance que u appartient à la même classe de lq ?
Fossé sémantique?
Appartenances multiples?
Combinaisons ?
8
Fonction de croyances (1/3)
Plan
Modèle des Croyances Transférables [Smets94]
Introduction
Modélisation
de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Conclusion
Cadre de discernement :
Espace puissance :
conflit
doute
Distribution de masses (KnnEv [Denoeux95]) :
9
Fonction de croyances (2/3)
Plan
Adaptation locale des fonctions de croyances
Introduction
Modélisation
de la
connaissance
1
Sélection active
d’images
Interface et
démonstration
Evaluations
Conclusion
C1
Knn « négatifs »
0
0
Paramètre f : croyance aux frontières des classes
0,5
1
10
Fonction de croyances (3/3)
Paramètre f : gestion des croyances aux frontières des classes
Plan
Introduction
Modélisation
de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Conclusion
u
11
Combinaison de témoignages
• Règle de combinaison conjonctive
Plan
Introduction
Modélisation
de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Conclusion
• Problème : masse sur la proposition
?
12
Transfert de masses
Plan
Introduction
Modélisation
de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Conclusion
13
Multi-classe
• produit des cadres de discernement « locaux »
Plan
Introduction
Modélisation
de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Conclusion
Exemple pour 2 classes : 4 hypothèses
Combinaison des distributions de masses l’opérateur « d’extension
vide » [Smets93]
14
Multi-descripteur
Plan
Introduction
Modélisation
de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Conclusion
15
Modélisation de la connaissance : bilan
Plan
Extension du KnnEv
Introduction
Modélisation
de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Conclusion
•
•
•
•
connaissance détaillée :
Appartenance une ou plusieurs classes
Non appartenances
Doutes et conflit
Adaptation locale
16
Plan
Introduction
Modélisation de la
connaissance
Sélection active d’images
Sélection
active d’images
Interface et
démonstration
Evaluations
Conclusion
17
Apprentissage actif
Plan
Introduction
Modélisation de la
connaissance
Sélection
active d’images
Interface et
démonstration
Evaluations
Conclusion
« Vérité
Modèle
t0terrain
idéal »
•
Classer les échantillons les plus « informatifs »
18
Apprentissage actif
Stratégie 1
Stratégie 2
Plan
Introduction
Modélisation de la
connaissance
Sélection
active d’images
Interface et
démonstration
Evaluations
Conclusion
t0
t4
t3
t2
t1
•
Classer les échantillons les plus « informatifs »
• Pour l’apprentissage
Adéquation ?
• Pour l’utilisateur
19
Stratégies de sélections
Plan
Introduction
Modélisation de la
connaissance
Transformation pignistique [Smets05]
Sélection
active d’images
Interface et
démonstration
Evaluations
Conclusion
Hypothèses :
- positives
- rejet en distance
- ambigües
locales
globale
20
Stratégie du plus positif
Plan
Introduction
Modélisation de la
connaissance
Sélection
active d’images
Interface et
démonstration
Evaluations
Conclusion
Recherche des
étiquettes les plus
probables
Premiers sélectionnés
Derniers sélectionnés
21
Stratégie du plus rejeté en distance
Plan
Introduction
Modélisation de la
connaissance
Sélection
active d’images
Interface et
démonstration
Evaluations
Conclusion
Exploration de
nouveaux
contenus visuels
Premiers sélectionnés
Derniers sélectionnés
22
Stratégie du plus localement ambigu
Plan
Introduction
Modélisation de la
connaissance
Sélection
active d’images
Interface et
démonstration
Evaluations
Conclusion
Désambigüisation
des classes 2 à 2
Premiers sélectionnés
Derniers sélectionnés
23
Sélection active d’images : bilan
Plan
Introduction
Modélisation de la
connaissance
Sélection
active d’images
Interface et
démonstration
Evaluations
Conclusion
Expression des stratégies usuelles avec le MCT
Stratégies complémentaires pour identifier et
cerner les classes
24
Plan
Introduction
Modélisation de la
connaissance
Sélection active
d’images
Interface homme-machine
Interface et
démonstration
Evaluations
Conclusion
25
Proposition automatique d’étiquette(s)
Plan
Introduction
Modélisation de la
connaissance
Sélection active
d’images
Exemple à 3 classes
Interface et
démonstration
Evaluations
Conclusion
sans rejets
distance
Etiquetage avec
rejet en ambigüité
ou étiquetage multiple avec
sans rejets
rejet en distance
26
Interface et démonstration
Plan
Introduction
Modélisation de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Conclusion
27
Plan
Introduction
Modélisation de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Evaluations
Conclusion
28
Classification automatique et multi-étiquetage
Plan
Introduction
Modélisation de la
connaissance
Sélection active
d’images
Interface et
démonstration
scene-classification [Boutell04]
6 classes Corel
1,08 étiquettes/image
1211 apprentissage / 1196 test
Evaluations
Conclusion
29
Caractérisation des stratégies (1/3)
Plan
5x100 images Corel
Classes visuellement homogènes
Introduction
Modélisation de la
connaissance
Sélection active
d’images
Interface et
démonstration
Effort de l’utilisateur
Evaluations
Nombre final de mauvaises propositions
Conclusion
40
Evolution
30
20
Rand
MP
10
0
1
51 101 151 201 251 301 351 401 451
Sélection
30
Caractérisation des stratégies (2/3)
Introduction
Modélisation de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Conclusion
Nombre de mauvaises
étiquettes accumulées
Plan
45
40
35
30
25
20
15
10
5
0
MP
MR
MLA2
1 51 101 151 201 251 301 351 401 451
Sélection
f = 0,4
31
Caractérisation des stratégies (3/3)
Introduction
Modélisation de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Conclusion
Nombre de mauvaises
étiquettes accumulées
Plan
45
40
35
30
25
20
15
10
5
0
MP
MR
MLA2
1 51 101 151 201 251 301 351 401 451
Sélection
f = 0,7
32
Combinaison avec des métadonnées
Plan
Introduction
Modélisation de la
connaissance
Sélection active
d’images
Interface et
démonstration
Combinaison avec des informations imprécises et partielles
Ex : date de prise de cliché
1820 photographies, 24 appareils, 6 événements temporels
Evaluations
Conclusion
Préparatifs
Séance photos
Mairie
Cérémonie
Soirée
Lendemain
33
Combinaison avec des métadonnées
Plan
Introduction
Modélisation de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Conclusion
34
Evaluation avec utilisateur
Plan
Introduction
Modélisation de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Conclusion
Documentaliste responsable de la Photothèque Ina
Méthodologie « penser à haute voix » [Nielson92]
Téléfilm Borgia
↗ Une même classe avec contenus visuels différents
↗ Réorganisation à volonté des classes
↗ Prise en main de l’interface
↗ Adéquation avec usage
↘ Prise en main des stratégies non immédiate
Suggestions :
- Vue d’ensemble pour initialisation des classes
- Hiérarchie
35
Conclusion
Plan
Introduction
Modélisation de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Conclusion
Verrous levés :
• Satisfaction totale
• Peu d’échantillons
• Multi-étiquetage
• Tout type de collections d’images
Cadre de formalisation :
• Classification, stratégies, décisions
• Modélisation du doute et du conflit
• Echelle
Souplesse :
• Gestion des classes : modification/création/suppression à la volé
• Ajout de nouveaux descripteurs de contenus et métadonnées
Prototype : tests opérationnels
36
Perspectives (1/3)
Plan
•
Introduction
Modélisation de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Conclusion
•
Optimisations et autres tests :
-
Adaptation automatique des fonctions de croyances
-
Descripteurs (locaux) et métriques
-
Classifieurs de base
Semi-supervisé :
-
Structuration partielle de très grandes bases d’images
-
Structuration de vidéos
37
Perspectives (2/3)
Plan
Introduction
Modélisation de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Conclusion
Combinaison/alternance de stratégies
plus de propositions correctes
améliorer le confort de l’utilisateur
Nombre de mauvaises étiquettes accumulées
•
50
45
40
35
MP
30
MR
25
1 MR, X MP
1_MR_MP_While
20
StrategyId
15
10
5
0
1
26
51
76
101
126
151
Sélection
38
Perspectives (3/3)
•
Plan
Introduction
Modélisation de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Organisations hiérarchiques
Formalisation de « sur-classes » et « sous-classes »
Multi-étiquetage sur différents niveaux hiérarchiques
Conclusion
39
Plan
Introduction
Modélisation de la
connaissance
Sélection active
d’images
Interface et
démonstration
Evaluations
Merci pour votre attention
Conclusion
40
Compléments
41
DESCRIPTEURS MPEG7 (1/2)
5x100 images Corel
Descripteurs standards (Rummager )
Stratégie du plus rejeté en distance MR
k=5,f=0.7,distance de Bhattacharya
Descripteur
Hrgb
Hhsv
Cced
Scd
Cfct
Hlab
Hluv
Horient
MPEG7cld
MPEG7ehd
MPEG7scd
Nombre de corrections final
33
33
35
35
37
39
46
54
58
68
399
42
DESCRIPTEURS MPEG7 (2/2)
5x100 images Corel
Descripteurs standards (Rummager )
Stratégie du plus rejeté en distance MR
k=5,f=0.7,distance de Bhattacharya
40
35
30
25
MPEG7CLD+MPEG7EHD
20
Horient+Hrgb
cced+cfct
15
10
5
0
1
101
201
301
401
43
Fusion précoce et tardive
84
82
80
Performance (%)
fusion précoce
78
Performance (%)
fusion tardive
76
74
Or.+Hsv Or.+Lab Or.+Luv Or.+Rgb
0,8
0,7
0,6
Non spécificité
moyenne fusion
précoce
0,5
0,4
Non spécificité
moyenne fusion
tardive
0,3
0,2
0,1
44
0
Or.+Hsv Or.+Lab Or.+Luv Or.+Rgb
Réglage automatique du paramètre f
Influence du paramètre f
Transformation d’étiquettes
PT3
PT4
PT6
47
Structuration de vidéos (1/4)
48
Structuration de vidéos (2/4)
Structuration de vidéos (3/4)
Structuration de vidéos (4/4)
Stratégie orientée classe
Vue locale
52
Stratégie orientée classe
Vue globale
53