ECTS
3
Volume horaire
59h
Établissement
INSTITUT NATIONAL DES SCIENCES APPLIQUEES TOULOUSE
Description
* méthode d'arnoldi pour construire les espaces de Krylov, solveur gmres,
* solveur de lanzcos, lien avec le gradient conjugué
* déflation et extraction d'informations spectrales (deflated CG, vecteurs de Ritz), séquence de systèmes linéaires, techniques pour le calcul des valeurs/vecteurs propres
* méthodes de décomposition de domaine (de Schwarz, de P.-L. Lions), étude théorique 1D et 2D, application au calcul parallèle
* méthodes multigrille géométrique, propriété de lis-sage, schéma V et FMG
* équivalence entre matrice creuse et graphe. Concept de remplissage et dépendances entre inconnus d'un problème creux (arbre d'élimination). Permutations de matrices permettant de réduire le remplissage. Complexité opératoire. Exploitation du parallélisme dans la factorisation de matrices creuses,
* architecture des supercalculateurs modernes (processeurs multi-coeurs, multiprocesseurs ou noeuds SMP et NUMA, accélérateurs GPU, réseaux d'interconnexion). Classification de Flynn. Hiérarchie des mémoires caches. Principes de localité spatiale et temporelle. Programmation parallèle en OpenMP: régions parallèles, directives de synchronisation, boucles parallèles, situations de compétition et tâches. Programmation parallèle en MPI: communications point à point et collectives, opérations de réduction et éventuellement optimisations. Analyse des performances: loi d'Amdahl, scalabilité forte et faible, modèle roof-line et calcul du chemin critique.

