Introduction
Do IT Now a déployé un cluster HPC dans le cloud, en utilisant des instances HPC optimisées par AMD sur AWS, a installé des applications Altair sur l’infrastructure et a réalisé des benchmarks avec des modèles de référence pour chaque application. Do IT Now a également comparé les résultats en termes de performance et de coûts pour chaque combinaison d’application et d’instance.
Au cours de cette analyse, Do IT Now a également exploré les modèles et paramètres d’optimisation possibles pour régler les applications, les instances et l’architecture HPC globale dans le nuage.
Objectif
Les instances cloud sélectionnées sont basées sur AMD EPYC™ de deux générations différentes, toutes au sein de la même famille d’instances AWS HPC :
- Amazon EC2 Hpc6a instances, dotées de deux processeurs 48 cœurs AMD EPYC™ de 3e génération de la série 7003 avec une fréquence turbo allant jusqu’à 3,6 GHz tous cœurs confondus et une mise en réseau à 100 Gb/s.
- Amazon EC2 Hpc7a Les instances Hpc7a sont dotées de deux processeurs AMD EPYC™ 9004 de 4e génération à 96 cœurs avec une fréquence turbo pouvant atteindre 3,7 GHz tous cœurs confondus, de la mémoire vive DDR5 et d’un réseau à 300 Gb/s. Les instances Hpc7a proposent également des processeurs AMD EPYC™ de 4e génération à 24, 48 ou 96 cœurs.
Dans le cas de Hpc7a, AWS propose des instances de plus petite taille qui permettent aux clients de choisir plus facilement un plus petit nombre de cœurs de CPU à activer tout en gardant toutes les autres ressources constantes en fonction des exigences de leur charge de travail. En fait, les plus petites tailles (96, 48 et 24 cœurs) augmentent la mémoire par cœur et la bande passante de la mémoire par cœur. Cela peut avoir un impact sérieux sur les performances du solveur et devient tangible dans le cas de logiciels commerciaux dont la licence est accordée par cœur. En outre, la meilleure configuration de topologie des cœurs est automatiquement sélectionnée par AWS, ce qui maximise les performances et élimine le besoin de configurations compliquées de brochage des cœurs au moment de l’exécution.
Nous avons effectué les tests sur Hpc6a et sur toutes les tailles de Hpc7a.
A propos du logiciel
Les logiciels utilisés pour les benchmarks font partie de la ligne de produits Altair CAE :
- Altair® Radioss®Altair® Radioss® est une solution d’analyse de pointe permettant d’évaluer et d’optimiser les performances des produits pour les problèmes hautement non linéaires soumis à des charges dynamiques. Utilisé dans le monde entier dans tous les secteurs de l’industrie, il améliore la résistance aux chocs, la sécurité et la fabricabilité de conceptions complexes.
- Altair® AcuSolve®Altair® AcuSolve® est un solveur polyvalent de dynamique des fluides numérique (CFD) capable de résoudre les applications industrielles et scientifiques les plus exigeantes. La technologie robuste et évolutive du solveur permet aux utilisateurs de bénéficier d’une précision inégalée.
A propos des modèles

Le modèle utilisé pour ce logiciel est le modèle "Taurus 10 millions d'éléments finis" disponible publiquement, récupéré dans le dépôt public OpenRadioss™. Il est bien adapté à l'évaluation comparative des performances HPC dans les grappes HPC dotées de nombreux processeurs. Ce benchmark a un maillage raffiné avec 10 millions d'éléments finis.
Le modèle comporte trois paramètres différents, en fonction de la durée de la simulation :
- Simulation complète, 120 millisecondes.
- Simulation plus courte, 10 millisecondes : mieux adaptée aux tests rapides de performance et d'évolutivité sur de nombreux nœuds/UAP.
- Simulation très courte, 2 millisecondes : utile pour tester les fonctions du cluster HPC.
Pour nos benchmarks, nous utilisons le cas test de simulation "plus court", avec 10 millisecondes de temps de simulation.

Le modèle utilisé pour AcuSolve nous a été envoyé directement par Altair, qui l'a considéré comme un bon exemple de simulation démontrant une grande évolutivité dans un environnement HPC.
Le modèle "Impinging Nozzle" est un modèle assez important (7.8 millions de nœuds et 7,7 millions d'éléments) qui simule un écoulement d'eau régulier à travers une buse à l'aide d'un solveur Navier-Stokes et d'un modèle de turbulence Spalart-Allmaras.
La simulation pour ce benchmark a été limitée à 200 pas de temps.
Conclusions
En termes de performances pures, les instances Hpc7a ont toujours l’avantage sur les instances Hpc6a, toujours excellentes. Le nombre plus élevé de cœurs par instance et la largeur de bande plus que doublée pour l’interconnexion à grande vitesse sont des outils puissants que les solveurs multithread et multiprocessus peuvent utiliser pour obtenir de meilleures performances.
En termes de prix, il est important de noter que l’échelonnement des tâches par prix est inférieur à celui des performances, ce qui signifie que l’ajout d’un hôte au calcul pour obtenir de meilleures performances n’augmentera pas réellement le prix de la tâche du prix horaire de cette instance, mais d’une fraction de ce prix. Cette fraction suivra la courbe d’évolutivité.
Cela est possible grâce aux propriétés d’évolutivité des solveurs Altair, à l’architecture avancée des processeurs AMD et aux optimisations AWS des instances HPC-series et des interfaces réseau EFA.
La comparaison des prix favorise l’ancienne génération d’instances AWS HPC pour Altair® Radioss®, alors que l’inverse est vrai pour Altair® AcuSolve®. Dans les deux cas, les prix ne sont pas très éloignés l’un de l’autre, même si les performances du Hpc7a sont nettement meilleures.
En outre, les différentes tailles d’instances Hpc7a permettent d’obtenir des performances encore plus rapides et peuvent offrir des options plus rentables.
© 2024. Tous droits réservés.
Altair® Radioss® et Altair® AcuSolve® sont des marques déposées d’Altair Engineering Inc.