1. Introduction
Download
Report
Transcript 1. Introduction
Ordonnancement d’applications intensives embarquées sur
GPUs
ADDA CHAHRAZED
[email protected]
Encadreur: Mr A.E.BENYAMINA
Co-Encadreur: Mr L.Loukil et Mr P.BOULET
1
Plan
1. Introduction
2. Travaux connexes
3. Conclusion
2
INTRODUCTION
3
1. Introduction
Problématique:
GILR
PI
PR
Algorithme
d’ordonnancement ?
Algorithme
d’ordonnancement ?
CPU
GPU
GPGPU (Architecture Hétérogène)
4
1. Introduction
Mes Présentations: : 5 exposés
Voir le lien: AASGaspard
5
Travaux connexes
6
[1] Qiang Liu and Wayne Luk2. Heterogeneous Systems for Energy Efficient Scientific
Computing. 2012
système hétérogène tels que (GPU+ FAPGA+CPU)
Satisfaction de deux critères (Max tps de performance,
Min consommation d’énergie)
)
Ordonnancement basée(liste de priorité de taches)
7
[1] Qiang Liu and Wayne Luk2. Heterogeneous Systems for Energy Efficient Scientific
Computing. 2012
Ordonnancement fonction basée sur le temps d’exécution
et consommation d’énergie sous forme un mode de
programmation linéaire
8
[2] Stanley Tzeng , Brandon Lloyd , John D. Owens. A GPU Task-Parallel Model with
Dependency Resolution. 2012
Calcul intensif sur GPUs
Satisfaction de critère (minimiser le temps d’exécution)
Ordonnancement basée(priorité de dépendance)
Ordonnancement fonction basée sur DCounter.
9
[3] Richard Membarth, Jan-Hugo Lupp, Frank Hannig, Jürgen Teich, Mario Körner, and
Wieland Eckert. Dynamic Task-Scheduling and Resource Management for GPU
Accelerators in Medical Imaging. 2012
Calcul intensif sur GPUs
Satisfaction de critère (minimiser le temps d’exécution)
Ordonnancement basée(priorité de dépendance) et LDF
(Latest Deadline First ))
10
[4] Sidi Ahmed Mahmoudi, Sébastien Fréemal, Michel Bagein, Pierre Manneback.
Calcul intensif sur GPU: exemples en traitement d’images, en bioinformatique et en
télécommunication. 2013
système hétérogène tels que (GPUs+CPUs)
Satisfaction de deux critères (minimiser le temps de
réponse
)
)
Traitement d’un seul image
(détection de coins et contour)
Ordonnancement basée sur (CUDA
et OpenGl)
Traitement de plusieurs images
(détection de coins et contour)
Ordonnancement basée sur (StarUP)
11
[5] N. Melab & T-V. Luong . Optimisation Parallèle Coopérative sur GPU . Equipe-Projet
DOLPHIN. 2010
Calcul intensif sur GPUs
Satisfaction de critère (Max tps de performance, Min
consommation d’énergie)
)
Ordonnancement basée(Algorithmes évolutionnaires)
)
12
[6] Thomas R. W. Scogland, Barry Rountree,Wu-chun Feng,Bronis R. de Supinski†.
Heterogeneous Task Scheduling for Accelerated OpenMP. 2012
Calcul intensif sur GPUs
Satisfaction de critère (Max tps de performance)
Ordonnancement basée(Algorithmes génétique)
13
2. Travaux connexes
Articles
plateforme
s
[Qiang et
al 2012]
Critère
d’optimisatio
n
Langage de Remarque
programm
ation
CPUs-GPUs- Programmation
FPGAs
linéaire
Maximiser
efficacité
énergétique
du système ,
Max tps
performance
C++
[Tzeng et
al 2012 ]
GPUs
Statique(résolution
de dépendance)
minimiser le
temps
d’exécution
-
[Membart
h et al
2012]
GPUs
Dynamique (en
fonction des
priorités et LDF
(Latest Deadline
First ))
minimiser le
temps de
réponse
CUDA,
opencl
1.Ordonnandement
par CUDA
2.Odonancement
effectué par
minimiser le
temps de
réponse
1.CUDA+O
penGL
2.StarUP
[Mahmoud CPUs-GPUs
i et al
2013]
Algorithme
d’ordonnancement
Traitement
1.Pour une
seul image
14
2. Pour
2. Travaux connexes
Articles
plateforme
s
[Qiang et
al 2011]
[Thomas
et al 2012]
Algorithme
d’ordonnancement
Critère
d’optimisatio
n
Langage de Remarque
programm
ation
CPUs-GPUs- Statique
Algorithmes
évolutionnaires
Max tps
Performance,
Min consom
D’énergie
OpenCL
CPUs-GPUs- Statique
Algorithmes
génétiques
Max tps
Performance
OpenMP
15
Conclusion
16
3. Conclusion
Proposition:
Partie1:
Commence
par un graphe à un
seul niveau
GILR
PI
PR
Algorithme
d’ordonnancement
Algorithme
d’ordonnancement
Statique
Statique
évolutionnaires
(PSO et dijkstra )
GP
GPU
Travail de
Mr Aroui
(Branch & Bound)
GPGPU (Architecture Hétérogène)
17
Référence bibliographique
[1] Qiang Liu and Wayne Luk2. Heterogeneous Systems for Energy Efficient
Scientific Computing. School of Electronic Information Engineering, Tianjin University,
300072 Tianjin, China 2 Department of Computing, Imperial College London, SW7 2AZ
London, UK. 2012
[2] Stanley Tzeng , Brandon Lloyd , John D. Owens. A GPU Task-Parallel Model with
Dependency Resolution. 2012
[3] Richard Membarth, Jan-Hugo Lupp, Frank Hannig, Jürgen Teich, Mario Körner, and
Wieland Eckert. Dynamic Task-Scheduling and Resource Management for GPU
Accelerators in Medical Imaging. Hardware/Software Co-Design, Department of Computer
Science, University of Erlangen-Nuremberg, Germany. Siemens Healthcare Sector, H IM AX,
Forchheim, Germany. 2012
18
Référence bibliographique
[4] Sidi Ahmed Mahmoudi, Sébastien Fréemal, Michel Bagein, Pierre Manneback.
Calcul intensif sur GPU: exemples en traitement d’images, en bioinformatique et en
télécommunication. Université de Mons, Faculté Polytechnique. Service
d’informatique 20, Place du Parc 7000 Mons, Belgique.2013
[5] N. Melab & T-V. Luong . Optimisation Parallèle Coopérative sur GPU . Equipe-Projet
DOLPHIN. 2010
[6] Thomas R. W. Scogland, Barry Rountree,Wu-chun Feng,Bronis R. de Supinski†.
Heterogeneous Task Scheduling for Accelerated OpenMP. Center for Applied
Scientific Computing, Lawrence Livermore National Laboratory, Livermore, CA 94551
USA. 2012
19