Présentation de la Grille Paris-Sud
Download
Report
Transcript Présentation de la Grille Paris-Sud
Présentation préparée avec
C. Germain, B. Kegl et M. Jouvin
(pré)Histoire de la Grille Paris Sud
› Les besoins de la communauté HEP
› La collaboration physiciens/informaticiens
Le capital existant
› Les différentes ressources
› Activités scientifiques
Les nouvelles ambitions
Conclusions
Griile Paris Sud
2
Depuis 15 ans, HEP repose sur la production et l’exploitation de
grandes masses de données
› Volume des données simulées ~ données expérimentales
› LHC : 15 PB de données expérimentales par an
Stocker et traiter (efficacement) ces données est un défi
technologique
› Centres de calcul isolés : Impossible, besoin d’infrastructures de
calcul distribuées
› HPC et/ou GPU : essentiel des besoins inadaptés, coût élevé
Grille : émerge comme la solution alternative
› ~10 ans de R&D pour aboutir à une infrastructure européenne
(mondiale) performante : seule infrastructure pour le LHC
Griile Paris Sud
3
Mise en place d’une ressource local conséquente : GRIF
› Initiative conjointe de 6 laboratoires IN2P3/CEA en 2005
2 laboratoires P11 (LAL + IPNO) impliqués, 4 sur Saclay-Orsay-X
› Un des plus gros sites de la grille européenne
› Financé par LCG France et EGEE (core services)
GRIF depuis ses origines ouvert à de nombreuses
communautés hors HEP
› Biomed, sciences de la terre, astrophysique, chimie, systèmes
complexes…
Forte implication dans les projets européens autour de la
grille depuis le début (2000)
Griile Paris Sud
4
350 sites
200K cores
50 pays
40PBytes
Etc.
La grille phare de l’espace européen de recheche
A l’échelle du LHC
Ouverte depuis son orgine aux autres communautés
scientifiques : 3,3M jobs/mois hors HEP
Griile Paris Sud
23/01/2012
5
Collaboration entre physiciens et chercheurs en informatique de
l’université dès 2002
› 2002-2005 : PPF Augernome-Xtremweb pour l’exploration de la
technologie “desktop grid” en // avec la grille de production
› Thèse d’informatique d’un ingénieur LAL qui devriendra un membre
des projets européens “desktop grid” des 5 dernières années
(EDGeS/EDGI)
› Thèse d’informatique avec intégration des résultats opérationnels
dans le principal middleware d’EGI.
A partir de 2005, évolution vers la problématique du traitement
des données massives
› 2006-2009 : PPF DEMAIN (Des données massives aux interprétations)
Informatique, biologie, traitement du signal, imagerie médicale
› Mise en place du Grid Observatory : collection de données sur la
grille pour alimenter la recherche en informatique, portail public
d’accès aux données www.grid-observatory.org
Griile Paris Sud
6
A partir de 2010, projets “Grille Paris Sud” associant ressources
et expertise en traitement de données acquise dans DEMAIN
› 2 MRM : 2010-2011 et 2012-2014 (en cours)
› Ressources basées sur GRIF et XtremWeb
› Expertise scientifique : LRI (équipe TAO) + LAL (groupe AppStat)
20062009
2002-2005• PPF
20102011
• MRM
Grille
Paris Sud
DEMAIN
• PPF
AugernomeXtremWeb
Griile Paris Sud
20122014
• MRM
Grille Paris
Sud
7
GRIF : une ressource de calcul et de stockage très
importante
› 8000 cœurs, 2,5 PB de disque dont 30% localisés dans P11
› 1 réseau interne privé 10 Gb/s + 1 connectivité externe 10 Gb/s
› 6 ans d’expérience de travail en commun quotidien pour la
gestion scientifique et technique du site
Expérience de mutualisation gagnant-gagnant
Cloud IaaS (à la Amazon) à partir de la participation au
projet européen StratusLab
› 250 cœurs, 50 TB de disque
› Intégration progressive d’une partie des ressources de GRIF dans
le cloud
Grille XtremWeb : prête à une extension plus large sur PSud
Griile Paris Sud
8
Equipe technique gérant ses ressources : ~15 FTEs
› ~5 sur l’université Paris 11 (principalement LAL)
› 1 grande compétence de gestion d’une infrastructure de
production dans le cadre d’une infrastructure distribuée
› Expérience du support utilisateur avec des communautés de toute
taille
Plusieurs experts des technologies de calcul distribués impliqués
dans les projets européens autour des différentes composantes
› Grille (EGEE/EGI), Cloud (StratusLab), Desktop grid (EDGeS/EDGI)
Expertises spécifiques aux projets, qui peuvent être mutualisées
› Visualisation (ex : mur d’image LRI + LAL)
› Gestion de données…
Griile Paris Sud
9
Cristallisation de plusieurs projets scientifiques autour du
traitement et de l’interprétation des données massives
› GRIF est un centre de calcul essentiel pour l’Institut des Systèmes
Complexes
› Analyse génétique de variations combinées (haplotypes) avec
l’INSERM ayant débouché sur un article dans Nature Genetics
Grid Observatory : enrichissement des problématiques autour du
Green Computing
› Instrumentation de la salle machine du LAL pour collecter des
données énergétiques
› Corrélation avec les informations sur l’utilisation
› GO portal : www.grid-observatory.org
Siminole (2010-2014) : projet financé par l’ANR COSINUS
› Rendre les simulations plus efficaces : optimisation, inference et
discriminative learning
› Dirigé par l’équipe AppStat du LAL
Griile Paris Sud
10
Poursuite des projets R&D sur les architectures matérielles et
les infrastructures de calcul distribuées
› PetaQCD : besoins spécifiques à LQCD (calculs massivement
parallèles à fort taux d’échanges, 9 partenaires Physique +
Informatique)
Postdoc P2IO 2011
› GridCL : impact de l’intégration de ressources many-core/GPU
dans les infrastructures de calcul distribuées sur des applications
phares de physique
R&D P2IO 2011
› Gestion et accès performant à de grands volumes de données
dans les infrastructures distribuées, en particulier les clouds
Griile Paris Sud
11
Faire profiter l’université plus largement de ces moyens
importants
› De plus en plus de communautés confrontées à l’interprétation
de données massives : les faire bénéficier de l’expérience
acquise
› Les expériences réussies naissent de la rencontre d’un besoin et
d’une expertise
L’Université Paris Sud possède les deux !
› Une relation directe et un “tutorat” sont décisifs
L’exploitation efficace des ressources globalisées n’implique pas un
changement de modèle de calcul, mais demande un
accompagnement
› MRM : “ambassadeur” de la Grille Paris Sud
Faire connaitre les moyens disponibles
Assister les utilisateurs dans leurs premiers pas
Griile Paris Sud
12
Développer le pôle d’expertise en statistique
computationelle et apprentissage
› Un groupe transverse LRI/INRIA + LAL aux compétences
reconnues
4 thèses co-dirigées, 15 articles co-signés depuis 2006
› Un atout pour les autres communautés de l’université
› La chance d’une colocalisation avec de grosses ressources et
des groupes de physique avec des besoins stimulants
Griile Paris Sud
13
Ambassadeur du MRM (1/2 FTE) : faire connaitre la ressource
et promouvoir son utilisation dans l’Université Paris Sud
› Contacter les départements pour identifier des utilisateurs
potentiels pouvant tirer bénéfice de la plateforme
› Organiser des tutoriels sur les différentes composantes de la
plateforme (grille, cloud)
› Assister les utilisateurs à la fois dans leur utilisation et le
developpement/portage de leurs applications
Cet ambassadeur aura une expertise technique en développement
d’application
Animer une coordination des réflexions autour de la
technologie cloud sur l’université
› Journée cloud durant l’année 2012-2013
Griile Paris Sud
14
Production de données
sur leur propre fonctionnement
•
•
•
•
•
Simulation
Expérimentation
Données
Massives
Motivation
Problèmes difficiles, bruités
Passage à l’échelle des méthodes
Systèmes
informatiques
globalisés
Statistique
computationnelle,
apprentissage,
optimisation
Griile Paris Sud
e-science
Partage
Capacité de traitement
Déploiement des traitements
Optimisation des systèmes
15
Le pôle “Grille Paris Sud” est aussi un atout majeur pour Paris
Sud dans la dynamique Université de Paris Saclay
› Aucun ensemble “ressource + expertise” comparable chez les
autres partenaires
› Via GRIF, déjà des liens avec CEA (Irfu) et Ecole Polytechnique
Réflexion depuis plusieurs années dans le cadre de P2IO sur le
regroupement possible de l’hébergement des ressources
autour d’une salle machine mutualisée
› En fait 1 salle sur 2 lieux pour mettre en oeuvre des
problématiques de haute disponibilité
Réflexion en cours sur la possibilité d’une des salles dans la
vallée dans le cadre du maintien de P2IO
› Réutilisation/transformation d’1 batiment technique existant
› Ouverture à d’autres partenaires : discussion en cours avec la DI
Griile Paris Sud
16
10 ans de collaboration riche et fructueuse entre physique et
informatique
› Construction d’une grande infrastructure de calcul ouverte sur
l’Université Paris Sud, avec des moyens pour chercher et accompagner
de nouveaux utilisateurs
› Développement d’activités de recherche autour de cette
infrastructure, particulièrement l’interprétation de données massives
Ce pôle ressources + expertise est un atout de Paris Sud dans la
dynamique de l’Université Paris Saclay
› Pourrait aussi être un axe du réinvestissement de la vallée
› P2IO prêt à s’inscrire dans une démarche plus large prenant en compte
d’autres besoins de l’Université
Réflexion souhaitable sur les modalités d’un soutien de PSud au
pôle transversal de statistique computationnelle et apprentissage
Griile Paris Sud
17