2ème semestre 2014 - Plateforme bioinformatique MIGALE

Download Report

Transcript 2ème semestre 2014 - Plateforme bioinformatique MIGALE

La gazette de la plateforme
http://migale.jouy.inra.fr
Membres de la plateforme
Jean-François GIBRAT
Responsable scientifique
[email protected]
01.34.65-28.97
Franck SAMSON
Responsable technique
[email protected]
01.34.65-28.88
Eric MONTAUDON
Administrateur Système Linux
[email protected]
01.34.65-28.92
Véronique MARTIN
Ingénieur Outils et Banques de données
[email protected]
01.34.65-29.74
Annie GENDRAULT
Ingénieur Bases de données
[email protected]
01.34.65-28.98
Sandra DEROZIER
Ingénieur Conception et Développement
[email protected]
01.34.65-29.04
Coordonnées
Plateforme Migale
Unité MIG
INRA - CRJ
Domaine de Vilvert
78352 Jouy-en-Josas
--http://migale.jouy.inra.fr
[email protected]
Fax : 01.34.65.29.01
Actualités
Une formation sur le traitement des
données RNASeq est proposée à
Jouy-en-Josas et à Toulouse via la
formation permanente nationale du
25 au 28 novembre 2014.
Début juillet, l’unité MIG a été
victime d’un cambriolage, les
portables destinés au cycle de
formation ont été volés. La demande
d’un budget spécifique auprès des
départements MIA et MICA, a été
faite pour racheter ce matériel.
Marie-Laure Franchinard a été
recrutée en tant que CDD pour 18
mois sur la plateforme Migale sur le
projet
BioDataCloud
en
collaboration
avec
l’entreprise
Biogemma.
Missions de la plateforme
Déploiement d’une infrastructure de calcul scientifique.
Mise à disposition des collections génériques de données issues des travaux de génomique.
Déploiement sur la plateforme de logiciels d’analyse de ces données.
Formation des utilisateurs aux méthodologies de la bioinformatique et aux logiciels d’analyse.
Conception et développement d’applications pour automatiser certains traitements de données.
Cycle « Bioinformatique par la pratique »
 Bilan concernant l’année 2014 :
• 152 participants cumulés (64 % personnel INRA),
• 21 jours cumulés,
• 13 modules différents :
• linux,
• initiation à Perl, Perl avancé,
• initiation à Python, Python avancé,
• initiation à R,
• Galaxy,
• Traitement de données issues de séquençage nouvelle génération,
• Traitement primaire de données issues de séquençage nouvelle génération sous Galaxy,
• annotation de génomes microbiens,
• traitement bioinformatique des données RNASeq,
• traitement statistique des données RNASeq,
• fouille de texte.
Point sur le Datacenter de la région parisienne
Quelques infos sur le Datacenter ! En effet on entend parler ici et là de Datacenter en région
parisienne après celui créé à Toulouse. Nous vous proposons un petit retour sur les origines du
projet et les dernières informations connues à ce jour concernant ce fameux Datacenter.
En 2010 déjà, on promettait une nouvelle salle pour MIGALE.
Après étude, nous avons lancé le projet d'installer un container sur le centre. En collaboration
avec l'unité MIA et la DSI de Jouy nous avons fait alors une demande de financement à la CNOC à
hauteur de 80K€. Le projet a été bien perçu et nous avons obtenu l'accord de financement.
Malheureusement entre temps l'entreprise a cessé sa production de container "simple" et les
nouveaux containers produits affichaient un prix de 160K€.
Nous avons ensuite demandé une estimation de réhabilitation d'une salle en MIA en vue d'en faire
une nouvelle salle machine : coût estimé à près de 300K€, la demande de financement a été
refusée.
Il y a maintenant un peu plus d'un an un projet de réhabilitation d'un bâtiment en zone nord
pour le transformer en Datacenter régional (Jouy, Versailles) pour 20M€ a été initié avec une
demande de financement au CPER (Contrat de Projets Etat Région). Le CPER, recevant au même
moment différentes demandes de financement de Datacenter sur le plateau de Saclay, a demandé
à tous les porteurs de projet de se concerter afin de n'en créer et donc de n'en financer qu'un seul
et unique.
Une nouvelle demande concertée a été formulée, celle d'un Datacenter pour l'INRA à échelle
nationale, hébergé à l'IDRIS (CNRS/Orsay).
Voilà ! Après 5 années à éteindre certaines de nos machines tous les étés car notre climatisation
ne peut faire mieux, nous en sommes quasiment au point de départ : des projets naissent, mais
rien n'est encore acté ni signé. Un accord avec l'IDRIS devait être signé en juillet dernier. L'INRA a
parallèlement pris contact avec le CCRT (CEA), un des points forts y serait un aménagement plus
rapide. Nous ne savons pas non plus qui prendrait en charge les investissements et les coûts de
déménagement.
Une décision concernant le choix de notre destination pourrait être prise lors du prochain CDSI.
... Wait and See...
Numéro 6
2ème semestre 2014
La gazette de la plateforme
http://migale.jouy.inra.fr
Membres de la plateforme
Jean-François GIBRAT
Responsable scientifique
[email protected]
01.34.65-28.97
Franck SAMSON
Responsable technique
[email protected]
01.34.65-28.88
Eric MONTAUDON
Administrateur Système Linux
[email protected]
01.34.65-28.92
Véronique MARTIN
Ingénieur Outils et Banques de données
[email protected]
01.34.65-29.74
Annie GENDRAULT
Ingénieur Bases de données
[email protected]
01.34.65-28.98
Sandra DEROZIER
Ingénieur Conception et Développement
[email protected]
01.34.65-29.04
Coordonnées
Plateforme Migale
Unité MIG
INRA - CRJ
Domaine de Vilvert
78352 Jouy-en-Josas
--http://migale.jouy.inra.fr
[email protected]
Fax : 01.34.65.29.01
Actualités
Début août, la version de
PostgreSQL sur le serveur de
production des bases de données
relationnelles (BDD) a été mise à
jour de la version 9.1.1 à 9.3.5.
Le portail Galaxy de la
plateforme a été mis à jour. La
version actuelle est donc celle du
11 août 2014.
Les serveurs Drupal ont eux aussi
été mis à jour. Le serveur Drupal
6 est en version 6.33. Le serveur
Drupal 7 est quant à lui en
version 7.31.
L’outil BioMaj a été mis à jour cet
été et est passé de la version 1.0RC1 à la version 1.2.3.
Point sur l’Institut Français de Bioinformatique
L’IFB-core a mis en place un Cloud pilote hébergé à l’IDRIS. Les utilisateurs désireux d’essayer ce
pilote peuvent demander un compte (cf. cloud.france-bioinformatique.fr). Un tutoriel Cloud
pour la Biologie a été organisé par IFB-core et IFB-GenOuest le 19 juin 2014 dans les locaux de
l’IFB-core à Gif-sur-Yvette. Il y avait 23 participants. Les intervenants étaient au nombre de 7 : 3
personnes IFB-GenOuest (O. Collin, O. Sallou, C. Monjeaud), 1 PRABI-IBCP (C. Gauthey), 2 IFBcore (J.F. Gibrat, C. Blanchet) et 1 extérieur (C. Loomis). Les présentations portaient sur les
principes généraux du Cloud et l’exemple de StratusLab ; le Cloud pour la biologie et les
exemples des clouds IFB, IDB-IBCP et GenOuest ; des exemples d’applications de cloud en NGS
(Galaxy), protéomique et analyse de séquences intensive avec Hadoop MapReduce, et pour
terminer une discussion sur l’état actuel et les perspectives. Le tutoriel s’est bien passé et un
questionnaire rempli par les participants a montré qu’ils étaient satisfaits à la fois du programme,
des intervenants et de l’organisation. La formation sera renouvelée avant la fin 2014 dans les
locaux de IFB-GenOuest (https://cloud.france-bioinformatique.fr/tuto-IFB-2014.06).
L'IFB-core a confié le développement de la première version de son site Web à une petite société,
Atomes Crochus. Cette version sera opérationnelle début octobre. Un CDD a été recruté pour 18
mois pour s'occuper du site et du programme de formation national de l'IFB (basé sur du Elearning). Le site web mettra les comptes rendus du comité de pilotage de l'IFB en ligne,
permettant à tous ceux intéressés de suivre la mise en place de l'infrastructure.
L’IFB compte une vingtaine de plates-formes, dont Migale fait partie, organisées en 6 pôles
régionaux (organisation "horizontale"). Ils désirent aussi organiser les plates-formes par
thématiques : plates-formes du domaine biomédical, plates-formes intéressées par la génomique
microbienne, la biologie végétale, etc. (organisation "verticale"). De plus l'IFB soutient les groupes
de travail sur une thématique donnée. Il existe actuellement un groupe de travail sur Galaxy très
actif, et un groupe de travail sur le développement d'un environnement virtuel pour la recherche
(VRE) est en train de se mettre en place.
L'IFB a prévu 6 M€ pour les CDD IFB sur 5 ans, soit 1.2 M€ par an. Cela correspond à 24
CDD/an. Le copil a décidé de consacrer 60% des fonds sur les 5 thématiques identifiées dans le
projet soumis à l’ANR, à savoir :
• deux thématiques transversales : bioinformatique structurale et bioinformatique évolutive.
• deux thématiques spécifiques d’un domaine biologique : bioinformatique microbienne et
bioinformatique végétale.
40 % des fonds seront alloués à des thématiques non fléchées dans le projet initial.
Cela correspond donc à 16 CDD sur les 5 thématiques listées ci-dessus et 8 CDD non fléchés. Il a
été convenu également que, pour ne pas perdre trop de temps, le copil attribuait 16 CDD sur les
5 thématiques. Dans le futur, c’est un comité de sélection de projets indépendant de l’IFB qui se
prononcera sur l’intérêt des propositions soumises par les PF. À l’automne, il est prévu de lancer
un appel à propositions « ouvert ». Cet AAP pourra inclure des domaines thématiques proposés
par l’IFB mais il y aura également une partie « blanche ».
Bilan de la migration de CentOS, du stockage et des machines virtuelles
Nous avons mis à niveau plusieurs machines en migrant le système d’exploitation de CentOS 5 vers
CentOS 6.5. Celui-ci apporte une plus grande performance grâce en partie à son système de fichiers
"ext4". Le serveur principal de la plateforme et les nœuds (56) du cluster ont constitué le plus gros
travail. La migration des machines a occasionné une interruption de deux jours, puis quelques
opérations d'optimisation les jours suivants.
L’évolution du stockage de la plateforme se poursuit avec l’achat de disques. Il y a donc une
augmentation de la volumétrie (55 To à ce jour).
Les machines virtuelles de la plateforme étaient jusqu’à maintenant sur un serveur XEN. Elles sont
actuellement en train d’être migrées sur un serveur KVM. Ce dernier permet une utilisation plus
performante sur CentOS 6.
Numéro 6
2ème semestre 2014