Groq è il nome di una start-up situata a Mountain View (CA), cresciuta molto velocemente dopo aver inventato la Tensor Streaming Processor (TSP) architecture ed una nuova classe di calcolo. Groq ha da pochi giorni annunciato che la sua nuova architettura Tensor Streaming Processor (TSP) è in grado di raggiungere una performance di 1 PetaOp/s su una single chip implementation. L’architettura Groq è la prima al mondo a raggiungere un simile livello di performance, equivalente ad un milione di miliardi di operazioni al secondo, o 1e15 ops/s. Tale architettura è anche in grado di raggiungere i 250 trilioni di operazioni in virgola mobile al secondo (FLOPS).
Jonathan Ross, co-fondatore e CEO di Groq, ha dichiarato:
Siamo orgogliosi per la produzione e per i nostri clienti. Le aziende GPU al top hanno spiegato ai propri clienti di aver programmato l’offerta di performance pari a un PetaOp/s nei prossimi anni. Groq lo annuncia oggi, e nel farlo definisce un nuovo standard di performance. La nostra architettura è di diverse volte più veloce di qualsiasi altra per ciò che riguarda l’inferenza, sia in termini di bassa latenza che di inferenze al secondo. Le interazioni dei nostri clienti lo confermano. Abbiamo provveduto ad inviare campioni di prodotto appena creato ai nostri clienti, perché li testassero con i loro programmi, non appena pronti, in meno di sei settimane.
Ispirata da una mentalità di tipo software-first, l’architettura TSP di Groq consente di utilizzare un nuovo paradigma per il raggiungimento di flessibilità di calcolo e parallelismo massiccio senza l’overhead di sincronizzazione tradizionale nelle architettura GPU e CPU classiche. L’architettura Groq può gestire tanto i learning models tradizionali quanto i più moderni, e sta funzionando già ora sui siti clienti in sistemi x86 e non-x86.
La nuova architettura di calcolo di Groq, più semplice, è progettata specificamente per le richieste computazionali inerenti la computer vision, il machine learning ed altre specializzazioni dell’AI. La pianificazione dell’esecuzione avviene in software, liberando superfici di prezioso silicio altrimenti dedicate all’esecuzione dinamica delle istruzioni. Uno stretto controllo offerto dall’architettura consente il l’elaborazione deterministica, specialmente utile in applicazioni in cui sono richieste particolare sicurezza ed accuratezza. A confronto con le architetture tradizionali complesse basate su CPU, GPU e FPGA, il chip di Groq favorisce la qualificazione e la distribuzione, consentendo al Cliente di implementare con rapidità sistemi scalabili con notevole guadagno di performance per watt.
Dennis Abts, Chief Architect in Groq, ha aggiunto:
La soluzione di Groq è ideale per il deep learning inference processing in un vasto range di applicazioni. Tuttavia, anche oltre i vantaggi evidenti di questa grande opportunità, La soluzione di Groq è progettata per una classe vastissima di carichi di lavoro. L’accoppiata prestazioni/semplicità la rende una piattaforma ideale per qualsiasi carico di lavoro, sia ad elevate prestazioni che legato ai dati o al calcolo.
Per maggiori informazioni sull’architettura Groq, scaricare il white paper Tensor Streaming Architecture Delivers Unmatched Performance for Compute-Intensive Workloads.