Quand des erreurs se produisent dans les supercalculateurs
Écoutez l'interview d'Anne Benoit
Anne Benoit
Un supercalculateur ou superordinateur n’est rien de moins qu’un ordinateur doté d’une très grande puissance de calcul. C’est un assemblage de plusieurs dizaines de milliers de processeurs qui permettent de faire du calcul haute performance (ou HPC pour High performance calcul). Utile dans de nombreux domaines, que ce soit en climatologie pour réaliser des prévisions par exemple ou en astrophysique pour simuler des phénomènes physiques complexes (formation d’une galaxie, etc.), mais aussi en santé/médecine, en ingénierie ou encore en intelligence artificielle, ces machines peuvent offrir une capacité de calcul équivalente à celle de 40.000 ordinateurs personnels (ici 16 pétaflops pour le supercalculateur Jean Zay, soit 16 millions de milliards d’opérations par seconde).
Or comme nous l’explique Anne Benoit, chaque jour, une à deux pannes peuvent se produire sur certains supercalculateurs. Comment cela se fait-il ? Comment faire face à ces erreurs ? Quels sont les enjeux autour de ces travaux ? Les applications ? Les défis scientifiques à venir ? Une série de questions sur lesquelles la scientifique nous apporte son éclairage.
- Lire l’article « Quelle tolérance aux pannes pour les applications à haute performance » sur le site de l’INS2I, novembre 2018.
Newsletter
Le responsable de ce traitement est Inria. En saisissant votre adresse mail, vous consentez à recevoir chaque mois une sélection d'articles et à ce que vos données soient collectées et stockées comme décrit dans notre politique de confidentialité
Niveau de lecture
Aidez-nous à évaluer le niveau de lecture de ce document.
Votre choix a été pris en compte. Merci d'avoir estimé le niveau de ce document !
Anne Benoit
Maitresse de conférences à l'ENS Lyon, membre du laboratoire de l'Informatique du Parallélisme (LIP).
Joanna Jongwane
Rédactrice en chef d'Interstices, Direction de la communication d'Inria