EGC2011_04052010

Download Report

Transcript EGC2011_04052010

1
EGC 2011 - Brest
Comité de Pilotage - 5 mai 2010
Président du CO : Ali Khenchaf
Président du CP : Pascal Poncelet
Plan










Calendrier et Lieu
Proposition de Président d’Honneur
Principes pour le Comité de programme
Conférenciers invités
Thèmes
Tutoriaux, Ateliers
Comité d’organisation
Affiche, Site Web
Organisation
Montant des inscriptions et budget prévisionnel
2
Calendrier Prévisionnel



Lieu :
Brest, Ensieta
Date :
25 janvier-28 janvier 2011
Président d'Honneur de la conférence :

Jiawei Han ou Jian Pei (Simon Fraser University) ?

Président du comité de programme : Pascal Poncelet

Président du comité d'organisation : Ali Khenchaf
Proposition des principes du comité de programme académique par le président : 5 mai
2010
Mise en place du Comité de Programme définitif : fin mai 2010 - 11 juin 2010
Rédaction de l’appel à communication : mai 2010
Nomination des médiateurs et des responsables ateliers, tutoriaux : Début juin





Mise en ligne du site EGC 2011 : à partir du mardi 1 juin 2010
1er appel à communication : jeudi 3 juin 2010 diffusion sur les listes de diffusion EGC, Gazette
BDA, IC, DBWORLD, …

Budget prévisionnel : 7 juin 2010

3
Calendrier Prévisionnel








Date limite de réception des résumés de communication académique : vendredi 24 septembre 2010
Appel aux membres du CP pour biding : lundi 27 septembre 2010
Fin de remise des biding : vendredi 1 octobre 2010
Premières affectations des papiers et discussions avec les modérateurs : du lundi 4 au vendredi 8 octobre
2010
Date limite de réception des articles : vendredi 8 octobre 2010 (FIRM DEADLINE)
Affectation des papiers au membres du CP : lundi 11 octobre 2010 - mardi 12 octobre 2010
Date de proposition des tutoriels et ateliers (à faire par deux responsables) : vendredi 15 octobre 2010
Date de proposition de démonstrations de logiciels (à faire par un responsable) : vendredi 15 octobre 2010
4
Calendrier Prévisionnel

















Discussion (par mail) avec le comité de pilotage des tutoriels et ateliers : à partir de lundi 18 octobre 2010
Date d'acceptation des tutoriels et ateliers : vendredi 22 octobre 2010
Date d’acceptation des démonstrations de logiciels : vendredi 22 octobre 2010
Appel à com pour les ateliers : vendredi 22 octobre 2010
Retour des évaluations papiers : jeudi 11 novembre (1 mois pour évaluer les papiers)
Réunion du Comité de Programme : Paris - jeudi 18 novembre – vendredi 19 novembre 2010
Etablissement des sessions et établissement du programme : jeudi 18 novembre – vendredi 19 novembre 2010
(lors du Comité de Programme)
Notification des résultats aux auteurs : vendredi 19 novembre 2010 – samedi 20 novembre 2010
Rediffusion de l’appel à communications des ateliers pour les articles refusés : à partir du 20 novembre 2010
Mise sur le site de la liste des papiers acceptés : vendredi 19 novembre 2010 – samedi 20 novembre 2010
Sélection des meilleurs papiers potentiels pour les prix : (par mail) du 22 novembre au 3 décembre 2010
Version finale des papiers : vendredi 3 décembre 2010
Envoi au meilleur papier de la possibilité de faire un poster (après réception du papier pour vérification
qu’il n’y ait pas de problème) : lundi 6 décembre 2010
Mise sur le site du programme détaillé de la conférence avec présidents de session : lundi 6 décembre 2010
Mise sur le site du programme des ateliers et tutoriels : vendredi 17 décembre 2010
Vérification des papiers et élaboration du document imprimable : du vendredi 3 au vendredi 17 décembre
2010
Remise document imprimable : 17 décembre 2010
5
Questions ?




Création d’une sélection spéciale de papiers jeunes
chercheurs ? Prix associé ? Intégration dans la
conférence ?
Réponse : création d’une catégorie jeune chercheur
avec un prix de 500 euros pour le meilleur papier.
Définir ce qu’est un jeune chercheur
Création d’une sélection spéciale de papiers industriels
? Prix associé ? Intégration dans la conférence ?
Réponse : Existe plutôt dans la catégorie applications.
Le CP doit veiller à ce qu’il s’agisse bien d’un papier
d’industriel lors de la sélection
6
Proposition du Président d’Honneur











Contacter J. Han pour savoir s’il ne veut pas être président d’honneur sinon :
Jian Pei
Associate Professor of Computing Science at Simon Fraser University
DBLP : 171 - 36 articles avec Jiawei Han
20 KDD, 12 ICDE, 13 SIGMOD, 11 TKDE, 7 ICDM, 2 DMKD, WWW, CIKM, SDM
Google scholar :
FP-growth (frequent patterns) : cité 3367 fois
Prefix Span (Sequential patterns) : cité 769 fois
CMAR : multiple class association rule : cité 546 fois
Web logs : cité 369 fois
Data stream : cité 271 fois
7
Proposition du Président d’Honneur


Bioinformatics and health-informatics (18): microarray data clustering, phenotype mining,
informative gene discovery, quasi-clique mining, disease association
Data mining
 Applications (32): software engineering, sensor networks, digital library, RFID, data
cleaning
 Change detection (7): changing region detection, distribution change detection, gradient
analysis
 Classification (11): concept drifting, associative classification
 Clustering (16): pattern-based clustering, density-based clustering, interactive clustering
 Frequent pattern mining (24): pattern-growth methods, frequent closed pattern mining,
mining with constraints, approximate and compressed patterns
 Graph and structure mining (12): partial orders, quasi-cliques, mining large graph databases
 Preference mining (4): mining preferences and preference based ranking
 Sequential pattern mining (22): pattern-growth methods, mining with constraints,
multidimensional/approximate patterns, mining time series

8
Proposition du Président d’Honneur









Database query answering (8): top-k/ranking quries, indexes
Data stream processing (14): answering ad hoc aggregate queries, data cubes on streams,
concept-drifting
Data warehousing and OLAP (24): semantic OLAP and quotient cube, gradient analysis,
skyline cubes
Information retrieval (7): citation recommendation, topic evolvement, query suggestion,
automatic crawling
Privacy preservation and security (20): k-anonymity, privacy preservation against
adversarial data mining, trustworthy data storage and query answering
Spatial, multidimensional, and multimedia databases (18): skyline analysis, co-location
patterns, image annotation, similarity search
Uncertainty and probabilistic databases (13): probabilistic skylines, typicality, probability
threshold ranking queries
Web data processing, analysis and mining (15): page farms, spam detection, web data
extraction, web log mining
Miscellanies (1)
9
Proposition de comité de programme

Conserver les membres d’EGC 2010 « qui ont bien réalisé” le travail. Voir avec Jean Marc Petit
pour valider la liste. Eventuellement Jean Gabriel Ganascia

Attention : Pour le planning il est prévu un retour des évaluations le 11 novembre et un CP le
18/19 novembre. Si problème d’évaluation il faut que le Comité de Pilotage puisse remplacer les
personnes dont le rapport n’a pas été fait. Objectif : au moins 3 rapporteurs par article pour le CP.
Ajouter de nouvelles personnes jeunes »/internationales :
Mathieu Roche, Fouille de Données Textuelles
Sandra Bringay, Santé et Fouille
Osmar Zaïne
Toon Calders
Ricardo Gavalda
João Gama, Flux de données
Torben Pedersen, OLAP Mining
Albert Biffet, WEKA + structures complexes
Eyke Hüllermeir, Classification, Fuzzy, Preference Learning
Chedy Räissy
Marc Plantevit













Conserver les modérateurs pour aider à répartir les papiers et aider à la sélection des meilleurs 10
articles (cf. thématique)
Conférenciers invités








João Gama - Flots de données
Eyke Hüllermeir - Fuzzy systems and Mining
Ricardo Baeza-Yates - Modern Information Retrieval
Fosca Gionnetti - Mobilité Privacy GeoKDD
Marie Francine Moes - Opinion Mining
DGA - Interopérabilité, système de systèmes
Ne retenir que 4 maximum 5 conférenciers invités
Un conférencier invité peut faire un tutoriel.
11
Thèmes

















Algorithmes de fouille de données (supervisés, semi-supervisés et non supervisés)
Algorithmes de fouille de données robustes au passage à l’échelle
Cadre théorique pour la fouille de données
Fouille de données de motifs (associations, séquences, graphes, arbres, ..)
Fouille de données multidimensionnelles
Données spatio-temporelles
Donnes semi-structurées et textuelles
Détection d’outlier, d’inattendus et détection d’anomalies
Algorithmes de fouilles distribués et parallèles
Fouille de comportements d’utilisateurs et de données de retour
Préservation de la vie privée et de l’anonymat
Fouille dynamique de données
Langages de requêtes déclaratifs pour la fouille de données
Apprentissage topologique, variétés mathématiques
Programmation logique et par contraintes
Méthodes statistiques en fouille de données
Recherche de similarité en fouille de données
12
Thèmes











Extraction et gestion de connaissances dans des domaines émergents
Flux de données, réseaux de capteurs, mobilité, données RFID
Données ubiquitaires, intelligence ambiance
Réseaux sociaux, communauté
Web Sémantique
Fouille de données d’opinions
Fouille de données de textes particulières : depêches, twitter
Commerce électronique, systèmes de recommandations, publicité en ligne
Algorithmes pour les données issues de la santé, de la chimie, de la biologie, de la
pharmacologie ou de l’environnement
Algorithmes de fouille de données antagoniste, sécurité
Fouille de données multimédia
13
Thèmes











Aspects méthodologiques de l’extraction et de la gestion de connaissances
Prétraitement des données, réduction de dimensionnalité, sélection et modification de
caractéristiques
Intégration et indexation de données pour la fouille de données, fusion de sources
diverses
Prise en compte d’ontologies ou de l’expertise dans le processus d’ECD
Modélisation de l’utilisateur dans le processus
Post traitement des connaissances
Qualité des données et des connaissances
Automatisation du processus d’ECD
Visualisation et interaction homme-machine
Plateformes et systèmes pour l’ECD
Intégration de données (entrepôts OLAP, médiation, …)
14
Thèmes











Expériences/Systèmes d’EGC sur des domaines applicatifs
Finance, analyse de marché
Gestion de la relation clients, commerce électronique
e-Santé, recherche clinique, épidémiologie, pharmacologie,
Bioinformatique, chimie computationelle
Environnement, télédétection, gestion agri-environnementale
Télécommunication et réseaux
Détection d’intrusion
Génie logiciel
Mémoire d’entreprise, veille technologique et stratégique
Web sémantique
15
Modérateurs


2 Responsables pour les thématiques
1 membre du Comité de Pilotage et 1 membre
du Comité de Programme :
 Fouille « générale »
 Extraction et gestion de connaissances dans des domaines émergents
 Aspects méthodologiques de l’extraction et de la gestion de
connaissances
 Expériences/Systèmes d’EGC sur des domaines applicatifs
16
Proposition de comité d’organisation
17
Affiche - Site Web
18
Organisation




Session poster en deux sessions (à affiner)
Réponse : possible dépend de l’organisation
Poster des meilleurs papiers ? (e.g. PKDD)
Réponse : oui mais ce ne doit pas être une
obligation
19
Montant des inscriptions et budget prévisionnel


Tarifs EGC 2011
Avant le 31 décembre 2010
Ateliers et
tutoriels
Conférence
Etudiant
60
170
Ateliers,
tutoriels et
Conférence
220
Autre
80
320
350
20
Montant des inscriptions et budget prévisionnel


Tarifs EGC 2011
Après le 31 décembre 2010
Ateliers et
tutoriels
Conférence
Etudiant
80
200
Ateliers,
tutoriels et
Conférence
250
Autre
100
350
380
21
Montant des inscriptions et budget prévisionnel







Stand industriels : 500 à 1000 euros
Sont inclus dans les frais d’inscription à la conférence :
Actes de la conférence et/ou des ateliers et des tutoriels
Les pauses cafés
L’adhésion à l’association EGC (20 euros)
Les déjeuners
Une contribution de 50 euros est demandée pour le
diner de gala
22
Montant des inscriptions et budget prévisionnel




La publication d’un article dans les actes de la
conférence et/ou les ateliers est conditionnée par
l’inscription d’au moins un auteur (1 auteur ne peut pas
présenter plus de 2 papiers pour 1 étudiant et plus de
trois pour les autres - reformuler)
Une copie de la carte d’étudiant sera demandée à
l’inscription des étudiants
Tarif préférentiel pour plusieurs membres d’une même
équipe ? Réponse : oui C.f. Site web EGC.
Offrir l’inscription (tutoriel) à la personne qui fait le
tutoriel
23
Budget prévisionnel



Recettes
200 inscriptions : 50 étudiants/150 autres
Avant le 31/12/2010
40 * 220 = 8800
30 * 350 = 10500
120 * 320 = 38400

Après le 31/12/2010
10 * 250 = 2500
50 * 350 = 17500

Total : 77700 euros (# 80 Keuros)
24
Budget prévisionnel









Subventions
BMO : 3000 (au moins)
CG29 : 3000 (au moins)
Région Bretagne : 3000 (au moins)
DGA ? : 4000
CNRS ?
Autres (industriels ?)
Sous total : 13 000 euros
TOTAL RECETTES : 95 Keuros
25
Dépenses

Location du Quartz : 25 Keuros








Salles/Espaces : 4 salles, 1 amphi, salons : 7294
Personnel d’accueil : 3537
Personnel technique (préparation salle, technicien) : 1634
Matériel (-50% dès le 2nd jour) (#4 video, microcravate,
wifi) : 1928
Panneaux posters : (20) 306
Pauses KF (par rapport à 200 puis 250 personnes) : 6650
Signalitique : 128
Total dépenses : 24748, 8
26
Dépenses













Frais de transport invités + hébergement
6 * 3000 : 18000
Plaquettes, programme : 1000
Repas midi : (200*25)*3 : 15000
Secrétariat : 1000
Assurance : 500
Consommables : 150
Frais de gestion : 500
Actes de la conférences - tirage CD : 12 000
Sacoches (négociation en cours)
Diner, soirée de gala : 10 000
Diner du comité de pilotage : 25 * 15 = 375
Sous total dépenses : 47525 euros
27
Budget prévisionnel

Recettes : 95 Keuros

Dépenses : 73 Keuros
28