Issue |
ESAIM: ProcS
Volume 63, 2018
CEMRACS 2016 - Numerical challenges in parallel scientific computing
|
|
---|---|---|
Page(s) | 228 - 247 | |
DOI | https://doi.org/10.1051/proc/201863228 | |
Published online | 19 October 2018 |
A Task-Driven Implementation of a Simple Numerical Solver for Hyperbolic Conservation Laws
1
Laboratoire EM2C, CNRS, CentraleSupélec, Université Paris Saclay,, Grande Voie des Vignes,Châtenay-Malabry, 92295, France
2
IFP Énergies nouvelles, 1-4 avenue de Bois-Préau,Rueil-Malmaison Cedex, 92852, France
3
LMAP UMR 5142, UPPA, CNRS
4
Cagire Team, INRIA Bordeaux Sud-Ouest, Pau - France
5
Fédération de Mathématiques de l’École Centrale Paris, CNRS FR 3487, Grande Voie des Vignes,Châtenay-Malabry, 92295
This article describes the implementation of an all-in-one numerical procedure within the runtime StarPU. In order to limit the complexity of the method, for the sake of clarity of the presentation of the non-classical task-driven programming environment, we have limited the numerics to first order in space and time. Results show that the task distribution is efficient if the tasks are numerous and individually large enough so that the task heap can be saturated by tasks which computational time covers the task management overhead. Next, we also see that even though they are mostly faster on graphic cards, not all the tasks are suitable for GPUs, which brings forward the importance of the task scheduler. Finally, we look at a more realistic system of conservation laws with an expensive source term, what allows us to conclude and open on future works involving higher local arithmetic intensity, by increasing the order of the numerical method or by enriching the model (increased number of parameters and therefore equations).
Résumé
Dans cet article, il est question de l’implémentation d’une méthode numérique clé-en-main au sein du runtime Star PU. Afin de limiter la complexité de la méthode et ce dans le soucis de clarifier la présentation de notre méthode dans le cadre de la programmation par tâche, nous avons limité l’ordre de la méthode numérique à un en temps et en espace. Les résultats montrent que la distribution de tâches est efficace si les tâches sont suffisamment nombreuses et de taille suffisante pour couvrir le temps supplémentaire de gestion des tâches. Ensuite, nous observons que méme si certaines tâches sont nettement plus rapides sur carte graphique, elles ne sont pas toutes éligibles à un portage sur GPU, ce qui met en avant l’importance d’un répartiteur de tâche intelligent. Enfin, nous regardons un système de lois de conservation plus tournée vers l’application, incluant notamment un terme source coûteux en terme de temps de calcul. Ceci nous permet de conclure et d’ouvrir sur un travail futur, dans lequel l’intensité arithmétique locale sera augmentée par le biais d’une méthode numérique ou d’un modèle d’ordres plus élevés.
© EDP Sciences, SMAI 2018
This is an open access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by/4.0/), which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.
Current usage metrics show cumulative count of Article Views (full-text article views including HTML views, PDF and ePub downloads, according to the available data) and Abstracts Views on Vision4Press platform.
Data correspond to usage on the plateform after 2015. The current usage metrics is available 48-96 hours after online publication and is updated daily on week days.
Initial download of the metrics may take a while.