Télécharger

Download Report

Transcript Télécharger

NOUVELLES POSSIBILITÉS DE R&D
INDUITES PAR LA PUBLICATION DE
COLLECTIONS DE DONNÉES
PUBLIQUES MASSIVES
Ismail KASSOU
Directeur du CEDOC ST2I
Open Gov & open Data,
Mardi 6 mai 2014
05/06/2014
Colloque national Open Gov & Open Data
Présentation
Recherche & Développement
Open Data
2
05/06/2014
Colloque national Open Gov & Open Data
3
Système National
de Recherche et
d’Innovation-SNRI
05/06/2014
Colloque national Open Gov & Open Data
Système national de la recherche

Potentiel de recherche universitaire:
 6 Instituts de recherche,
 982 structures de recherche accréditées,
 Plus de 50 Centres d’Etudes Doctorales (CEDOC).

Potentiel de recherche ne relevant pas des universités:
 17 établissements de formation de cadres (Ingénieurs et Master),
 12 Instituts et Centres spécialisés de recherche.

Recherche scientifique (centres spécialisés + structures dans entreprises )
Ressources humaines :
 Personnel de la recherche : 30.000.

Moyens financiers : +150 millions de dhs annuels.

 Production scientifique universitaire : + 2600

Thèses doctorales soutenues : + 900.
publications indexées.
4
05/06/2014
Colloque national Open Gov & Open Data
5
CEDOC Sciences et Technologies de l’Information
et de l’Ingénieur
• Centre de l’Université Mohammed V Souissi créé en 2008.
• 2 filières accréditées :
• Génie Informatique,
• Génie Sciences de l’Ingénieur (Electrique, Mécanique, Environnement, …).
• 2 établissements : ENSIAS et ENSET.
• 20 partenaires nationaux et internationaux.
• 27 structures de recherche.
• +80 encadrants.
• 361 doctorants.
• +200 publications annuelles dont 120 indexées.
• 20 soutenances de thèse en 2014 (30 prévues en 2015).
05/06/2014
Colloque national Open Gov & Open Data
Cadre de la recherche
• Autonomie scientifique des organismes,
• Liberté de pensée des chercheurs,
• Ethique de la recherche,
• Financement de la recherche,
• Démonstration des résultats,
• Evaluation :
• Review,
• H-index,
• Facteur d’impact,
• Altmetrics.
6
05/06/2014
Colloque national Open Gov & Open Data
7
Les produits de la recherche
• La recherche vise à produire des connaissances scientifiques.
• Ces connaissances peuvent prendre des formes diverses :
• publications,
• rapports,
• brevets,
• communications orales,
• etc...
• Ces connaissances peuvent être incorporées dans de
nouvelles machines, de nouveaux instruments ou dispositifs.
• Tous ces produits sont diffusé au sein de la communauté
scientifiques et permettent au chercheur d'être reconnu par ses
pairs.
05/06/2014
Colloque national Open Gov & Open Data
Biais de la recherche
• Erreur
• La recherche scientifique peut se nourrir des erreurs et des
errements des chercheurs,
• Les grandes découvertes apparaissent souvent de manière
inattendue,
• Cette particularité de la recherche scientifique porte un nom : c'est
la sérendipité.
• Fraude scientifique
• Invention pure et simple de résultats scientifiques, avec parfois
fabrication de faux matériels,
• Rectification ou sélection de résultats expérimentaux, afin de faire
paraître meilleure la force de prédiction d’une théorie,
• Plagiat d’autres scientifiques.
8
05/06/2014
Colloque national Open Gov & Open Data
Données utilisées dans la recherche
• Données scientifiques :
• Données d’observation,
• Données expérimentales,
• Données de simulation.
• Données publiques.
• Articles scientifiques.
• Thèses.
• Etc.
9
05/06/2014
Colloque national Open Gov & Open Data
Cycle de vie des données de recherche
Création
donnée
Réutilisation
donnée
Traitement
donnée
Accès à la
donnée
Analyse
donnée
Stokage
donnée
Source : http://data-archive.ac.uk/create-manage/life-cycle
10
05/06/2014
Colloque national Open Gov & Open Data
Bases de données scientifiques
• Trois modèles présents actuellement sur le web :
• Accès payant pour les usagers,
• Accès gratuit pour les usagers mais payant au moment du dépôt
de la publication,
• Accès gratuit pour les usagers et dépôt gratuit.
11
05/06/2014
Colloque national Open Gov & Open Data
IMIST : Institut Marocain de l’Information
Scientifique et Technique
• Missions :
• Diffusion de l’information scientifique et technique,
• Veille technologique.
• Réseau Marwan.
• Bibliothèque.
• Bases de données scientifique :
• Aluka,
• Jstor,
• Science direct,
• Scopus,
• MVSL,
• Web of knowledge,
• Cairn,
• Springer.
12
05/06/2014
Colloque national Open Gov & Open Data
13
Base de données TOUBKAL
• Bases de données des thèses marocaines.
• Diffusion du contenu scientifique produit par les
laboratoires marocains.
• Vérification des sujets de thèse par les directeurs de
thèse et les doctorants.
• Mise à disposition des thèses dans le domaine.
• 8225 documents disponibles en ligne (source http://www.imist.ma).
05/06/2014
Colloque national Open Gov & Open Data
14
Bases de données scientifiques en libre accés
• DOAJ : http://doaj.org
• Base de données de publication en libre accès,
• 9 707 journaux recensés de 133 pays,
• 1 614 911 documents.
• Citeseer http://citeseerx.ist.psu.edu/:
• Base de données de documents scientifiques,
• 750 000 Documents,
• 1,5 Millions de requêtes journalières.
• HAL http://hal.archives-ouvertes.fr
• Archive ouverte pluridisciplinaire HAL, destinée au dépôt et à
d'articles scientifiques de niveau recherche,
• 281 557 documents.
05/06/2014
Colloque national Open Gov & Open Data
15
SCOPUS
• Base de données de 53 millions d’enregistrement issus de près
de 21 915 journaux.
• 33 887 publications marocaines.
• 3593 publications marocaines en 2013 :
•
•
•
•
•
•
•
•
•
•
•
médecine 1134,
informatique 523,
ingénierie 508,
mathématiques 508,
physique et astronomie 486,
sciences des matériaux 425,
chimie 371,
agriculture et biologie 273,
biochimie et génétique et biologie moléculaire 252,
sciences de l’environnement 214,
…
Source : http://www.scopus.com
05/06/2014
Colloque national Open Gov & Open Data
16
Articles scientifiques open data sur le web
• Google scholar
•
•
•
•
•
•
115 100
Citeseer
3 455
SCOPUS
1 571 dont 1 043 en informatique
DBLP
1 107
Web of knowledge 317
DOAJ
96
Science direct
58
Source : sites web des bases de données
05/06/2014
17
Colloque national Open Gov & Open Data
Publications sur la thématique « open data »
sur SCOPUS
Variation du nombre d'articles par année
500
462
450
396
400
350
300
250
224
200
145
150
100
68
50
7
15
16
13
18
19
26
28
43
0
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013
Source : http://www.scopus.com
Nombre articles
05/06/2014
Colloque national Open Gov & Open Data
18
Exemples de publications en 2014
• Benchmarking open government: An open data perspective
• EXOD: A tool for building and exploring a large graph of open
•
•
•
•
•
•
•
datasets
Learning tool for medicine students based on biomedical named
entity recognition and linked open data
Seasonal comparisons of meteorological and agricultural drought
indices in Morocco using open short time-series data
Alignment and dataset identification of linked data in Semantic Web
Open data and open code for big science of science studies
On the design of a self-medication web application built on linked
open data
Closing the data gap: Creating an open data environment
In store augmented reality: Retailing strategies for smart communities
05/06/2014
Colloque national Open Gov & Open Data
19
Thématiques de recherche à fort potentiel
économique
• Internet mobile
• Gestion des connaissances
• Internet des objets
• Technologie cloud
• Robotique avancée
• Véhicule autonome et semi autonome
• Recherche sur les génomes
• Stockage de l’énergie
• Impression 3D
• Matériaux avancés
• Exploration et exploitation de pétrole et de gaz
• Energie renouvelable
Source : 2013 Mc Kinsey Global Institute Analysis
05/06/2014
Colloque national Open Gov & Open Data
20
Exemples d’usage de données ouvertes
OPEN STREET MAP : Cartographie libre du monde entier
WIKIPEDIA : Encyclopédie construite de manière
collaborative
GitHub : Hébergement de code source logiciel
ScraperWiki : Plateforme contributive autour de la
problématique de l'extraction et du traitement de données.
CKAN : Logiciel libre qui organise le stockage et le
catalogage de données
Source : De l’OpenData aux citoyens : potentiel et limites des plateformes collaboratives (Velt, Gigand 2012)
05/06/2014
Colloque national Open Gov & Open Data
Open Data vs Big Data
• L’open data consiste en l’ouverture des données
• La « big data » désigne le débordement des données et
la volumétrie des données ainsi que leur exploitation.
• Cette distinction de définition compte, évidemment, mais
pose surtout des problèmes similaires au niveau des
perspectives et de l’éthique.
21
05/06/2014
Colloque national Open Gov & Open Data
Google : Big data et Open Data
• Géant sur Internet
• Données très importantes sur les usagers
• Moteur de recherche
• Gmail
• You Tube
• Agenda
• Contacts
• Etc..
22
05/06/2014
Colloque national Open Gov & Open Data
Exemple de données collectées
<Placemark>
<name>Latitude User</name>
<description>Location history for Latitude User from 04/13/2014 to 04/27/2014</description>
<styleUrl>#multiTrack</styleUrl>
<gx:Track>
<altitudeMode>clampToGround</altitudeMode>
<when>2014-04-12T17:00:27.459-07:00</when>
<gx:coord>-6.8368479 34.0148655 0</gx:coord>
<when>2014-04-12T17:01:27.370-07:00</when>
<gx:coord>-6.8368441 34.0148424 0</gx:coord>
<when>2014-04-12T17:02:27.394-07:00</when>
<gx:coord>-6.8368441 34.0148424 0</gx:coord>
<when>2014-04-12T17:02:50.284-07:00</when>
<gx:coord>-6.8834112 33.9549033 0</gx:coord>
<when>2014-04-12T17:03:27.422-07:00</when>
<gx:coord>-6.8368555 34.0149119 0</gx:coord>
<when>2014-04-12T17:04:27.445-07:00</when>
<gx:coord>-6.8371743 34.0140319 0</gx:coord>
<when>2014-04-12T17:05:27.558-07:00</when>
<gx:coord>-6.8379364 34.0162099 0</gx:coord>
<when>2014-04-12T17:06:28.215-07:00</when>
<gx:coord>-6.8372806 34.0137386 0</gx:coord>
<when>2014-04-12T17:07:29.285-07:00</when>
<gx:coord>-6.8373622 34.0131516 0</gx:coord>
<when>2014-04-12T17:08:29.248-07:00</when>
<gx:coord>-6.8374758 34.0165992 0</gx:coord>
<when>2014-04-12T17:09:29.268-07:00</when>
<gx:coord>-6.8359342 34.0156906 0</gx:coord>
<when>2014-04-12T17:10:29.304-07:00</when>
<gx:coord>-6.8359342 34.0156906 0</gx:coord>
<when>2014-04-12T17:11:29.317-07:00</when>
<gx:coord>-6.8368555 34.0149119 0</gx:coord>
<when>2014-04-12T17:12:29.337-07:00</when>
<gx:coord>-6.837106 34.0141801 0</gx:coord>
<when>2014-04-12T17:13:29.370-07:00</when>
<gx:coord>-6.8368555 34.0149119 0</gx:coord>
23
05/06/2014
Colloque national Open Gov & Open Data
Visualisation de données
24
05/06/2014
Colloque national Open Gov & Open Data
Visualisation de données
25
05/06/2014
Colloque national Open Gov & Open Data
Visualisation de données
26
05/06/2014
Colloque national Open Gov & Open Data
Exemple de données
27
05/06/2014
Colloque national Open Gov & Open Data
Opportunités de recherche
• Cloud computing et Big data
• Systèmes mobiles
• Fouille de données :
• Datamining
• Textmining
• Webmining
• Web sémantique
• Représentation et modélisation des données
• Gestion des connaissances
• Interopérabilité des données
• ….
28
05/06/2014
Colloque national Open Gov & Open Data
29
Exemple de projets à valoriser
• Développer par ville des sites de données géographiques
•
•
•
•
enrichies de données concernant la ville, les citoyens et
les visiteurs.
Développer des sites sur l’usage des deniers publics
Mettre en place des sites sur les projets réalisés par
l’administration publique
Développer des sites pédagogiques reposant sur l’usage
de données ouvertes.
…
05/06/2014
Colloque national Open Gov & Open Data
30
Recommandations
1.
2.
Mettre en place des archives ouvertes nationales pour les publications
marocaines
Mettre en place des « incentives » pour promouvoir l’open data dans
le domaine de la recherche :
• Obligation de mettre en ligne les résultats et les données issus des travaux de
recherche financés par l’Etat
• Financement des projets de mise en place de plateforme de partage de données
• Priorité de financement pour les projets qui partagent leurs données
3.
4.
5.
6.
7.
8.
Appuyer la création de revues indexées nationales
Développer un outil national antiplagiat en conformité avec la
réglementation et les instances de protection intellectuelle
Promouvoir le développement de contenu pédagogiques
Instaurer une instance nationale pour le pilotage du développement de
l’open data.
Proposer un standard national pour la diffusion des données publiques
Coordiner les initiatives gouvernementales pour le développement de
l’open data :
• Portail national opendata.gov.ma
• Initiative open gouvernement
05/06/2014
Colloque national Open Gov & Open Data
31