High-Performance Computing con Full-Stack Innovation

High-Performance computing

High-Performance Computing (HPC) è diventato lo strumento essenziale della scoperta scientifica in numerosi diversi campi di applicazione.

Oggi presentiamo la traduzione in italiano di un post apparso recentemente sul TechBlog Nvidia, a nome di Ashraf Eassa e Chris Porter.

Che si tratti di scoprire nuovi farmaci salvavita, combattere i cambiamenti climatici o creare simulazioni accurate del nostro mondo, queste soluzioni richiedono una quantità enorme e in rapida crescita di potenza di elaborazione. Sono sempre più fuori dalla portata degli approcci informatici tradizionali.

Ecco perché l’industria ha abbracciato l’elaborazione accelerata da GPU NVIDIA. Combinato con l’IA, sta portando milioni di volte miglioramenti nelle prestazioni per il progresso scientifico. Oggi, 2.700 applicazioni possono beneficiare dell’accelerazione GPU NVIDIA e quel numero continua ad aumentare, supportato da una comunità in crescita di tre milioni di sviluppatori.

Miglioramenti delle prestazioni delle applicazioni HPC

Fornire una moltiplicatore di accelerazione sull’intera gamma di applicazioni HPC richiede un’innovazione incessante a ogni livello dello stack. Si inizia con chip e sistemi e si arriva ai framework dell’applicazione stessa.

La piattaforma NVIDIA continua ogni anno a fornire miglioramenti significativi delle prestazioni, con progressi incessanti nell’architettura e nello stack software. Rispetto al P100 rilasciato solo sei anni fa, la GPU H100 Tensor Core dovrebbe fornire prestazioni stimate 26 volte superiori, oltre 3 volte più veloci della legge di Moore.

High-Performance Computing chart

Il fulcro della piattaforma NVIDIA è uno stack software ricco di funzionalità e ad alte prestazioni. Per facilitare l’accelerazione GPU per la più ampia gamma di applicazioni HPC, la piattaforma include NVIDIA HPC SDK. L’SDK offre una flessibilità senza pari per gli sviluppatori, consentendo la creazione e il porting di applicazioni con accelerazione GPU utilizzando linguaggi standard, direttive e CUDA.

CUDA High-Performance computing

La potenza dell’SDK NVIDIA HPC risiede in una vasta suite di librerie matematiche con accelerazione GPU altamente ottimizzate, che consentono di sfruttare il pieno potenziale di prestazioni delle GPU NVIDIA. Per le migliori prestazioni multi-GPU e multi-nodo, NVIDIA HPC SDK fornisce anche potenti librerie di comunicazione:

  • NVSHMEM crea uno spazio di indirizzi globale per i dati che copre la memoria di più GPU.
  • NVIDIA Collective Communications Library (NCCL) ottimizza la comunicazione tra GPU.

Complessivamente, questa piattaforma offre le massime prestazioni e flessibilità per supportare l’universo ampio e in crescita delle applicazioni HPC con accelerazione GPU.

Prestazioni HPC ed efficienza energetica

Per mostrare come l’innovazione full-stack di NVIDIA si traduce nelle prestazioni più elevate per l’HPC accelerato, abbiamo confrontato le prestazioni di un server HPE con quattro GPU NVIDIA con quelle di un server configurato in modo simile basato su un numero uguale di moduli acceleratori di un altro fornitore.

Abbiamo testato un set di cinque applicazioni HPC ampiamente utilizzate attraverso un’ampia varietà di set di dati. Sebbene la piattaforma NVIDIA acceleri 2.700 applicazioni in ogni settore, le applicazioni che abbiamo potuto utilizzare in questo confronto sono state limitate dalla selezione di versioni software e applicative disponibili per gli acceleratori dell’altro fornitore.

Per tutti i carichi di lavoro ad eccezione di NAMD, che è un software per la simulazione della dinamica molecolare, i nostri risultati vengono calcolati utilizzando la geomean dei risultati su più set di dati per ridurre al minimo l’influenza dei valori anomali ed essere rappresentativi delle esperienze dei clienti.

Abbiamo anche testato queste applicazioni in scenari multi-GPU e single-GPU.

Nello scenario multi-GPU, con tutti gli acceleratori dei sistemi testati utilizzati per eseguire una singola simulazione, il server basato su GPU Tensor Core A100 ha fornito prestazioni fino a 2,1 volte superiori rispetto all’offerta alternativa.

NVIDIA A100 four-GPU performance comparison

Alimentato dai continui progressi nelle prestazioni di calcolo, il campo della dinamica molecolare si sta muovendo verso la simulazione di sistemi di atomi sempre più grandi per periodi di tempo simulati più lunghi. Questi progressi consentono ai ricercatori di valutare una serie crescente di meccanismi biochimici, come il trasporto di elettroni fotosintetici e la trasduzione del segnale visivo. Questi e altri processi sono stati a lungo oggetto di dibattito scientifico perché erano al di fuori della portata della simulazione, che è lo strumento principale per la validazione. Ciò era dovuto al tempo proibitivo necessario per completare le simulazioni.

Tuttavia, riconosciamo che non tutti gli utenti di queste applicazioni le eseguono con più GPU per simulazione. Per un throughput ottimale, il metodo di esecuzione migliore è spesso assegnare una GPU per simulazione.

Quando si eseguono queste stesse applicazioni su un singolo modulo acceleratore, una GPU completa su NVIDIA A100 ed entrambi i die sul prodotto alternativo, il sistema basato su NVIDIA A100 ha fornito prestazioni fino a 1,9 volte più veloci.

High-Performance graphs

I costi energetici rappresentano una parte significativa del costo totale di proprietà (TCO) dei data center e dei centri di supercalcolo, sottolineando l’importanza di piattaforme di elaborazione efficienti dal punto di vista energetico. I nostri test hanno mostrato che la piattaforma NVIDIA ha fornito un throughput per watt fino a 2,8 volte superiore rispetto all’offerta alternativa.

A100 power efficiency

Le eccellenti prestazioni e l’efficienza energetica della GPU NVIDIA A100 sono il risultato di molti anni di incessante co-ottimizzazione software-hardware per massimizzare le prestazioni e l’efficienza delle applicazioni. Per ulteriori informazioni sull’architettura NVIDIA Ampere, vedere il white paper sulla GPU NVIDIA A100 Tensor Core.

A100 si presenta anche come un singolo processore per il sistema operativo, richiedendo che venga lanciato un solo rank MPI per sfruttare appieno le sue prestazioni. Inoltre, A100 offre prestazioni eccellenti su larga scala grazie alle connessioni NVLink da 600 GB/s tra tutte le GPU in un nodo.

Convergenza AI e HPC

Proprio come l’elaborazione accelerata sta apportando incrementi di velocità alle applicazioni di modellazione e simulazione, la combinazione di intelligenza artificiale e HPC fornirà il prossimo aumento delle prestazioni per sbloccare la prossima ondata di scoperte scientifiche.

Nei tre anni trascorsi tra i nostri primi invii di formazione MLPerf e i risultati più recenti, la piattaforma NVIDIA ha fornito prestazioni di formazione di deep learning 20 volte superiori su questa suite di benchmark peer-reviewed standard del settore. I guadagni derivano da una combinazione di chip, software e miglioramenti su larga scala.

HPC and AI

Scienziati e ricercatori stanno già utilizzando la potenza dell’IA per fornire notevoli miglioramenti nelle prestazioni, potenziando la scoperta scientifica:

I centri di supercalcolo in tutto il mondo continuano ad adottare supercomputer con intelligenza artificiale accelerata.

  • Il supercomputer Polaris presso l’Argonne Leadership Computing Facility (ALCF), Perlmutter presso NERSC e Leonardo presso CINECA sono tutti alimentati da GPU A100 Tensor Core.
  • Il prossimo Alps supercomputer basato sul nostro  Grace Hopper Superchip sarà online nel 2023.
  • Il prossimo sistema Venado al Los Alamos National Laboratory, la cui consegna è prevista per il 2023, includerà sia il Grace Hopper Superchip che i nodi Grace CPU Superchip.

Per ulteriori informazioni sui dati sulle prestazioni più recenti, vedere la pagina “Prestazioni dell’applicazione HPC“.

 

Join our groups on Telegram…

… and don’t forget our social channels!

Definire ciò che si è non risulta mai semplice o intuitivo, in specie quando nella vita si cerca costantemente di migliorarsi, di crescere tanto professionalmente quanto emotivamente. Lavoro per contribuire al mutamento dei settori cardine della computer science e per offrire sintesi ragionate e consulenza ad aziende e pubblicazioni ICT, ma anche perche’ ciò che riesco a portare a termine mi dà soddisfazione, piacere. Così come mi piace suonare (sax, tastiere, chitarra), cantare, scrivere (ho pubblicato 350 articoli scientfici e 3 libri sinora, ma non ho concluso ciò che ho da dire), leggere, Adoro la matematica, la logica, la filosofia, la scienza e la tecnologia, ed inseguo quel concetto di homo novus rinascimentale, cercando di completare quelle sezioni della mia vita che ancora appaiono poco ricche.

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.