E-Mail: [email protected]
- TSMC ha triplicato la capacità produttiva a 3nm nel 2023, ma la domanda continua a superare l'offerta.
- La produzione di TSMC fino al 2026 è già prenotata da NVIDIA, Apple, Qualcomm e AMD, creando una competizione feroce per i chip disponibili.
- Intel ha dimostrato la solidità del suo acceleratore Gaudi 2 nei test MLPerf Training 4.0, con un tempo di addestramento di 66,9 minuti per GPT-3.
L’industria dell’intelligenza artificiale (IA) sta vivendo una crescita senza precedenti, alimentata dalla domanda di applicazioni e servizi sofisticati. Tuttavia, questa corsa all’oro tecnologico si scontra con un ostacolo significativo: la scarsità dei chip a 3 nanometri (nm) prodotti da TSMC, il gigante taiwanese dei semiconduttori. La carenza di questi chip sta mettendo a dura prova l’intera filiera tecnologica, spingendo i principali attori, come NVIDIA, Apple, Qualcomm e AMD, a considerare aumenti di prezzo per i prodotti hardware basati sull’IA.
Il processo produttivo a 3nm di TSMC è diventato il “Santo Graal” dell’industria tecnologica. Offre prestazioni ed efficienza energetica senza precedenti, essenziali per alimentare le crescenti richieste dell’IA, dai supercomputer ai dispositivi mobili. Tuttavia, la domanda ha superato l’offerta, e l’intera produzione di TSMC fino al 2026 è già prenotata dai quattro colossi tech. Nonostante TSMC abbia triplicato la capacità produttiva a 3nm l’anno scorso, la domanda continua a crescere.
Nel settore dell’IA, si assorbe una quantità enorme di questi chip per alimentare acceleratori di ultima generazione, data center e piattaforme di cloud computing. Anche il mercato degli smartphone, con l’adozione del nodo N3P di TSMC, sta mettendo pressione sulla produzione. La scarsità di chip a 3nm sta creando un effetto domino lungo la catena di approvvigionamento, costringendo i produttori di hardware a competere per accaparrarsi le quantità limitate di chip disponibili. Questa situazione sta spingendo i prezzi al rialzo, con il rischio che i costi aggiuntivi vengano trasferiti ai consumatori finali.
TSMC è consapevole della situazione e sta cercando di affrontare la carenza di chip a 3nm convertendo le linee di produzione da 5nm a 3nm. L’obiettivo è raggiungere una produzione mensile di 180.000 wafer, ma l’arrivo di nuovi prodotti, come i processori Intel Lunar Lake che utilizzano chip TSMC, potrebbe mettere ulteriormente sotto pressione la capacità produttiva dell’azienda. Nonostante TSMC non abbia annunciato aumenti di prezzo, la scarsità di chip a 3nm potrebbe costringere i produttori di hardware ad aumentare i costi dei prodotti, il che potrebbe tradursi in prezzi elevati per i consumatori finali.
Intel e l’alternativa Gaudi 2
Intel ha recentemente pubblicato nuovi benchmark per Gaudi 2, un acceleratore per l’elaborazione dell’IA generativa. I risultati, basati sul nuovo test MLPerf Training 4.0, valutano le performance dell’intero sistema, dai consumi all’esecuzione degli applicativi. Il nuovo MLPerf Training 4.0 amplia la suite di test con 205 risultati prestazionali e parametri individuati con la partecipazione di 17 società specializzate nello sviluppo dell’intelligenza artificiale, tra cui Intel, Dell, Fujitsu, Google, Lenovo e NVIDIA.
Gaudi 2 svolge un ruolo fondamentale nello sviluppo e nella diffusione dell’IA. Intel ha dimostrato che l’acceleratore è conveniente e altamente scalabile, adattandosi alle esigenze e consentendo l’accesso all’IA a un numero maggiore di aziende. Per provare la sua efficacia, Intel ha sfruttato un sistema di grandi dimensioni con 1.024 acceleratori Gaudi 2. Addestrata su Tiber Developer Cloud, il test TTT (time-to-train) di GPT-3 ha segnato un tempo di 66,9 minuti, dimostrando una solida scalabilità con modelli linguistici di grandi dimensioni (ultra-large LLM).
La versione 4.0 della suite MLCommons prevede un nuovo parametro: l’ottimizzazione del modello Llama 2 70B con LoRa (low-rank adapters). Questa operazione, comune tra consumatori e professionisti, è stata svolta da Intel su un sistema da 8 acceleratori Gaudi 2 con un tempo di addestramento di 78,1 minuti. In confronto, un singolo DGX H100 di NVIDIA con 8 GPU H100 ha completato il test in più di 28 minuti. La NVIDIA H200, con la stessa GPU e 141 GB di memoria HBM3E, ha migliorato le performance del 14%, scendendo a 24,7 minuti. Con 1024 acceleratori H100, il tempo scende a 1,5 minuti.
L’industria ha necessità di colmare il gap nell’attuale offerta di IA generativa per le aziende con opzioni di calcolo ad alta efficienza e prestazioni. Gli ultimi risultati in MLPerf MLCommons dimostrano il valore di Intel Gaudi, portando sul mercato soluzioni scalabili e convenienti con reti standard e software aperto, rendendo l’IA generativa accessibile a un numero maggiore di clienti.
La corsa ai chip AI: chi dominerà il mercato?
L’avanzata dell’intelligenza artificiale sta portando profondi cambiamenti nel settore tecnologico e nella società globale. La corsa all’intelligenza artificiale e l’importanza dei chip sono paragonabili a rivoluzioni come quella agricola e industriale, con drastiche conseguenze economiche. La progressione dei cambiamenti è imprevedibile, ma chiara: la corsa all’intelligenza artificiale non è possibile senza progressi e una fornitura stabile di hardware e software di silicio.
Nvidia spicca per la celerità con cui ha scalato la vetta del successo finanziario negli ultimi anni. Il colosso californiano ha beneficiato dell’impennata della domanda di applicazioni di intelligenza artificiale iniziata alla fine del 2022. I giganti del cloud computing si sono messi in fila per ottenere le unità di elaborazione grafica (GPU) dei data center dell’azienda di Santa Clara per addestrare e alimentare modelli linguistici di grandi dimensioni (LLM). Nvidia è il fornitore ideale di chip per l’intelligenza artificiale, con partner come Meta, Amazon e Microsoft disposti ad aspettare fino a un anno tra l’ordine e la consegna per procurarsi i chip di Nvidia, pagandoli cifre considerevoli.
Il successo di Nvidia nel mercato è attribuito al processore A100, lanciato nel 2020, che ha servito applicazioni di calcolo ad alte prestazioni. OpenAI ha impiegato migliaia di chip A100 per addestrare il top di gamma ChatGPT. Alla fine del 2021, il rivale AMD ha iniziato a offrire un acceleratore per data center concorrente a quello sviluppato da Nvidia. Tuttavia, l’A100 ha superato il recente chip AMD nelle attività di formazione dei Large Language Models (LLM). Nel 2022, Nvidia ha alzato il tiro con il processore H100, più potente del predecessore di un biennio prima. AMD ha dovuto attendere fino alla fine del 2023 per presentare il MI300.
Nonostante il successo, la mancanza di un’alternativa potente all’H100, il suo prezzo elevato e la scarsa disponibilità sul mercato hanno spinto i principali clienti di Nvidia ad avviare iniziative interne di sviluppo di chip per l’intelligenza artificiale per ridurre la dipendenza dal colosso produttore di chip. Meta, Microsoft, Amazon e Alphabet (Google) hanno tutti intrapreso strade di sviluppo interno di chip per l’intelligenza artificiale.
La sfida delle startup e il futuro dei chip AI
Le GPU hanno limiti, in particolare nella velocità dei dati trasferiti su e fuori. I modelli di intelligenza artificiale moderni funzionano su un gran numero di GPU e chip di memoria interconnessi. Spostare rapidamente i dati è fondamentale per le prestazioni. Durante l’addestramento di modelli di intelligenza artificiale grandi, alcuni core della GPU possono rimanere inattivi metà del tempo aspettando i dati. Andrew Feldman, capo di Cerebras, una startup a Sunnyvale, California, paragona questa situazione al traffico bloccato in un negozio di alimentari il giorno prima del Ringraziamento.
La risposta di Cerebras è mettere 900.000 core, più memoria, su un singolo chip enorme, per ridurre la complessità di collegare più chip e trasferire dati. Il suo chip CS-3 è il più grande al mondo per un fattore di 50. Groq, un’altra startup, sta adottando un approccio diverso. I suoi chip di intelligenza artificiale, chiamati unità di elaborazione del linguaggio (LPU), sono ottimizzati per eseguire grandi modelli di linguaggio (LLM) velocemente. MatX, con sede in California, ha eliminato elementi superflui dalle GPU per migliorare le prestazioni.
Nonostante gli sforzi delle startup, Nvidia continua a dominare il mercato. Il mese scorso, Nvidia ha annunciato il lancio delle GPU “Blackwell AI” di nuova generazione, che dovrebbero essere più potenti delle attuali e consentire ai clienti di addestrare LLM più grandi con costi e consumi energetici inferiori. La domanda di chip per l’intelligenza artificiale di Nvidia potrebbe rimanere alta, grazie anche al suo vantaggio nel software di programmazione delle GPU, come CUDA, che è lo standard de facto nell’industria.
Bullet Executive Summary
La crisi dei chip a 3 nanometri sta mettendo in luce l’importanza strategica di TSMC nell’ecosistema tecnologico globale. La capacità di soddisfare la domanda crescente di chip avanzati è fondamentale per il progresso dell’IA e altre tecnologie emergenti. Intel, con il suo acceleratore Gaudi 2, si propone come un’alternativa accessibile a NVIDIA, dimostrando solidità e scalabilità nei test di settore. Tuttavia, la corsa ai chip AI vede Nvidia ancora dominante, grazie alla sua capacità di innovazione e al controllo sulla catena di fornitura.
Nozione base di tecnologia: Il processo produttivo a 3 nanometri rappresenta un avanzamento significativo nella miniaturizzazione dei semiconduttori, permettendo prestazioni superiori e una maggiore efficienza energetica.
Nozione avanzata di tecnologia: L’ottimizzazione del software per migliorare le prestazioni su nuove architetture di chip è una sfida complessa che richiede competenze avanzate in ingegneria del software e una profonda comprensione delle dinamiche hardware-software.
In conclusione, la crisi dei chip a 3 nanometri e la corsa ai chip AI stanno ridisegnando il panorama tecnologico globale. Le aziende devono affrontare sfide significative per mantenere il passo con la domanda e l’innovazione, mentre i consumatori potrebbero dover affrontare prezzi più elevati per i dispositivi tecnologici. Questa situazione stimola una riflessione personale sull’importanza della tecnologia nella nostra vita quotidiana e su come le dinamiche di mercato influenzano l’accessibilità e l’innovazione.
- Sito ufficiale di TSMC, pagine dedicate alla tecnologia 3nm
- Sito ufficiale di Taiwan Semiconductor Manufacturing Company (TSMC), produttore di chip a 3nm, per approfondire sulla produzione e sulla gestione della carenza di chip
- Sito ufficiale Intel, dichiarazioni sulla tecnologia Gaudi e intelligenza artificiale
- Sito ufficiale di TSMC, dove è possibile trovare informazioni sulla tecnologia 3nm e sui prodotti correlati