Tolérance aux pannes dans des environnements de calcul parallèle et distribué : optimisation des stratégies de sauvegarde/reprise et ordonnancement

Le passage de l'échelle des nouvelles plates-formes de calcul parallèle et distribué soulève de nombreux défis scientifiques. À terme, il est envisageable de voir apparaître des applications composées d'un milliard de processus exécutés sur des systèmes à un million de coeurs. Cette augmen...

Full description

Bibliographic Details
Main Author: Bouguerra, Mohamed Slim
Other Authors: Grenoble
Language:fr
Published: 2012
Subjects:
HPC
Online Access:http://www.theses.fr/2012GRENM023/document