La scheda grafica per l'intelligenza artificiale e l'HPC generative
La scheda grafica Tensor-Core Nvidia H200 offre carichi di lavoro generici di intelligenza artificiale e HPC (High Performance Computing) con prestazioni e capacità di storage rivoluzionarie. Essendo la prima scheda grafica con HBM3e, la memoria più grande e più veloce dell'H200 accelera l'intelligenza artificiale generativa e i modelli LLM (Large Language Models), accelerando allo stesso tempo i calcoli scientifici per i carichi di lavoro HPC.
Maggiore potenza con memoria più grande e più veloce
La Nvidia H200 si basa sull'architettura Nvidia Hopper™ ed è la prima scheda grafica con 141 Gigabyte (GB) di memoria HBM3e con una potenza di 4,8 terabyte al secondo (TB/s) - quasi il doppio della capacità della scheda grafica Tensor Core Nvidia H100 con larghezza di banda di memoria 1,4 volte superiore. La memoria più grande e veloce dell'H200 accelera l'intelligenza artificiale e gli LLM generativi, migliorando al contempo il computing scientifico per carichi di lavoro HPC con una migliore efficienza energetica e un costo totale di proprietà ridotto.
Ottenere informazioni con un'inferenza LLM ad alte prestazioni
Nel panorama dell'intelligenza artificiale in continua evoluzione, le aziende si affidano a LLM per soddisfare una vasta gamma di esigenze di inferenza. Un acceleratore di inferenza ai deve fornire il throughput più elevato con il costo totale di proprietà più basso possibile, se fornito su larga scala per una vasta base di utenti.
L'H200 raddoppia la velocità di deduzione durante l'elaborazione di LLM come Llama2 rispetto ai processori grafici H100.
High Performance Computing con Superturbo
La larghezza di banda della memoria è fondamentale per le applicazioni HPC poiché consente un trasferimento dei dati più veloce e riduce i colli di bottiglia nell'elaborazione complessa. Per le applicazioni HPC ad uso intensivo di memoria, come simulazioni, ricerca e intelligenza artificiale, la maggiore larghezza di banda della memoria di H200 assicura che i dati possano essere recuperati ed elaborati in modo efficiente, con WAS che offre risultati fino a 110 volte più veloci rispetto alle CPU.
Riduzione del consumo energetico e del costo totale di proprietà
Con l'introduzione del modello H200, l'efficienza energetica e il costo totale di proprietà raggiungono nuovi livelli. Questa tecnologia all'avanguardia offre prestazioni ineguagliabili all'interno dello stesso profilo di prestazioni della H100. Le opere di intelligenza artificiale e i sistemi di supercomputing, non solo più veloci ma anche più ecologici, offrono un vantaggio economico che porta avanti il mondo dell'intelligenza artificiale e della scienza.
Accelerazione dell'intelligenza artificiale per i server aziendali mainstream
Nvidia H200 NVL è Ideal per le aziende che utilizzano sistemi rack raffreddati ad aria con prestazioni inferiori che richiedono configurazioni flessibili, accelerando i carichi di lavoro di intelligenza artificiale e HPC indipendentemente dalle dimensioni. Con un massimo di quattro GPU connesse tramite Nvidia NVLink™ e un'espansione di memoria 1,5 volte superiore, l'inferenza con i modelli LLM (Big Language Models) può essere accelerata fino a 1,7 volte e le applicazioni HPC raggiungono prestazioni fino a 1,3 volte superiori rispetto al NVL H100.
Testo tradotto automaticamente