Written by

×

Cosa significa DeepSeek per la domanda di energia dell’intelligenza artificiale

Ci è voluta circa una settimana al mercato per rendersi conto che la società cinese di intelligenza artificiale DeepSeek aveva rilasciato un modello di intelligenza artificiale open source che rivaleggiava con quelli di importanti aziende statunitensi come OpenAI e Anthropic e che, cosa più importante, era riuscita a farlo in modo molto più economico ed efficiente rispetto ai suoi concorrenti nazionali. La notizia ha fatto crollare non solo i titoli tecnologici come Nvidia, ma anche i titoli energetici, portando a supposizioni secondo cui gli investitori pensavano che un’intelligenza artificiale più efficiente dal punto di vista energetico avrebbe ridotto la domanda di energia nel settore in generale.

Riduzione o aumento della domanda energetica?

Ma sarà davvero così? Mentre alcuni nel mondo del clima hanno dato per scontato la stessa cosa e hanno celebrato le apparentemente buone notizie, molti capitalisti di rischio, sostenitori dell’IA e analisti sono rapidamente giunti alla conclusione sostanzialmente opposta: che un’IA più economica porterà solo a una maggiore domanda di IA. La conseguente proliferazione incontrollata della tecnologia in una vasta gamma di settori potrebbe quindi annullare i guadagni di efficienza energetica, portando in ultima analisi a un sostanziale aumento netto della domanda di energia dei data center in generale.

Con la distruzione dei costi arriva la proliferazione“, ha detto Susan Su, un’investitrice climatica presso la società di venture capital Toba Capital. “In più, il fatto che sia open source, penso, è davvero, davvero un grosso problema. Mette il potere di espandersi, di distribuire e di proliferare in miliardi di mani“.

Paradosso di Jevons?

Se ultimamente avete sentito un sacco di chiacchiere sul paradosso di Jevons, ecco a cosa si riduce fondamentalmente questa linea di pensiero. Dopo che il CEO di Microsoft Satya Nadella ha risposto alla mania di DeepSeek pubblicando la pagina di Wikipedia per questa teoria economica del XIX secolo su X, molti hanno ricevuto un rapido corso accelerato sulle sue origini. L’idea è che, poiché le efficienze tecniche dell’era vittoriana hanno reso più economica la combustione del carbone, la domanda di carbone, e quindi il suo consumo, in realtà è aumentata.

Sebbene questa sia una possibilità concreta nello spazio dell’IA, non è affatto una garanzia. “Penso che sia una questione aperta“, mi ha detto l’esperto di energia Nat Bullard, in merito al fatto che i modelli di tipo DeepSeek stimoleranno una riduzione o un aumento della domanda di energia. “In un certo senso, tendo a orientarmi in entrambe le direzioni contemporaneamente“. Ex responsabile dei contenuti presso BloombergNEF e attuale co-fondatore della startup di IA Halcyon, una piattaforma di ricerca e informazione per i professionisti dell’energia, Bullard è personalmente entusiasta delle maggiori efficienze e opzioni che i nuovi modelli di IA possono apportare alla sua attività.

Inferenza e impatto energetico

Ma avverte che solo perché DeepSeek è stato economico da addestrare (l’azienda sostiene che è costato circa 5,5 milioni di dollari, mentre i modelli nazionali costano centinaia di milioni o addirittura miliardi) non significa che sia economico o efficiente dal punto di vista energetico da gestire. “Addestrare in modo più efficiente non significa necessariamente che puoi gestirlo in modo molto più efficiente“, ha detto Bullard. Quando un modello linguistico di grandi dimensioni risponde a una domanda o fornisce qualsiasi tipo di output, si dice che sta facendo una “inferenza“. E come spiega Bullard, “Ciò potrebbe significare che, mentre ci spostiamo verso un’era di sempre più inferenza e non solo di addestramento, gli impatti [energetici] potrebbero essere piuttosto attenuati“.

DeepSeek-R1, il nome del modello che ha causato il panico degli investitori, è anche un nuovo tipo di LLM (Large language model, un tipo di programma di intelligenza artificiale in grado di riconoscere e generare testo, tra le altre attività, ndr) che in generale consuma più energia. Fino a pochi giorni fa, quando OpenAI ha rilasciato gratuitamente o3-mini, la maggior parte degli utenti occasionali interagiva probabilmente con i cosiddetti modelli di intelligenza artificiale “pre-addestrati”. Alimentati da tonnellate di testo da Internet, questi LLM sputano risposte basate principalmente su previsioni e riconoscimento di pattern. DeepSeek ha rilasciato un modello come questo, chiamato V3, a settembre. Ma l’anno scorso, modelli di “ragionamento” più avanzati , che possono “pensare”, in un certo senso, hanno iniziato a esplodere. Questi modelli, che includono o3-mini, l’ultima versione di Claude di Anthropic e l’ormai famigerato DeepSeek-R1, hanno la capacità di provare diverse strategie per arrivare alla risposta corretta, riconoscere i propri errori e migliorare i propri output, consentendo significativi progressi in aree come la matematica e la codifica.

La catena di pensiero

Ma tutto quel ragionamento artificiale consuma molta energia. Come ha scritto su LinkedIn Sasha Luccioni, responsabile AI e clima presso Hugging Face, che realizza una piattaforma open source per progetti AI, “Per chiarire le cose su DeepSeek e sostenibilità: (sembra che) la formazione sia molto più breve/economica/efficiente dei tradizionali LLM, ma l’inferenza è più lunga/costosa/meno efficiente a causa dell’aspetto della catena di pensiero“. La catena di pensiero si riferisce al processo di ragionamento intrapreso da questi nuovi modelli. Luccioni ha scritto che sta attualmente lavorando per valutare l’efficienza energetica dei modelli DeepSeek V3 e R1.

Un altro fattore che potrebbe influenzare la domanda di energia è la rapidità con cui le aziende nazionali rispondono alla svolta di DeepSeek con i loro nuovi e migliorati modelli. Amy Francetic, co-fondatrice di Buoyant Ventures, non pensa che dovremo aspettare a lungo. “Un effetto di DeepSeek è che motiverà fortemente tutti i grandi LLM negli Stati Uniti ad andare più veloci“, ha detto. E poiché molti dei grandi attori sono fondamentalmente limitati dalla disponibilità di energia, incrocia le dita affinché ciò significhi che lavoreranno in modo più intelligente, non più duro. “Spero che li porti a trovare queste efficienze simili piuttosto che versare più benzina in un veicolo meno efficiente nei consumi“.

Transizione e AI, tre scenari

Nel suo recente post su Substack, Su ha descritto tre possibili futuri per quanto riguarda il ruolo dell’IA nella transizione verso l’energia pulita. L’ideale è che la domanda di IA cresca abbastanza lentamente da far crescere con essa il nucleare e le energie rinnovabili. Il meno promettente è che una crescita immediata ed esponenziale della domanda di IA porti a un’espansione simile dei combustibili fossili, bloccando nuove infrastrutture sporche per decenni. “Penso che ciò sia già accaduto“, mi ha detto Su. E poi c’è lo scenario tecno-ottimista, collegato a personaggi come Sam Altman, a cui Su non dà molto peso, ovvero che l’IA “guida la rivoluzione energetica” aiutando a creare nuove tecnologie energetiche ed efficienze che più che compensano l’aumento della domanda di energia.

Quale scenario prevalga potrebbe anche dipendere dal fatto che una maggiore efficienza, combinata con l’adozione dell’IA da parte di compagnie più piccole e con tasche più piccole, porti a un cambiamento nella scala dei data center. Ci saranno molte più persone che useranno l’IA. Quindi forse questo significa che non abbiamo bisogno di questi enormi data center da gigawatt. Forse abbiamo bisogno di molti più data center più piccoli, da megawatt“, mi ha detto Laura Katzman, una direttrice di Buoyant Ventures. Katzman ha condotto una ricerca per la società sulla decarbonizzazione dei data center.

Piccoli data center e microreti rinnovabili

I data center più piccoli con un’impronta energetica di conseguenza inferiore potrebbero abbinarsi bene alle microreti alimentate da fonti rinnovabili, che sono meno pratiche ed economicamente fattibili per gli hyperscaler. Ciò potrebbe rappresentare una grande vittoria per l’energia solare ed eolica più l’accumulo di batterie, ha spiegato Katzman, ma un’inutile perdita di tempo per aziende come Microsoft, che si è notoriamente impegnata a riaprire la centrale nucleare di Three Mile Island in Pennsylvania per alimentare i suoi data center. “A causa di DeepSeek, il prezzo previsto del calcolo probabilmente non giustifica il fatto di tornare ora su alcune di queste centrali nucleari o su queste altre fonti energetiche ad alto costo“, ha detto Katzman.

Quali applicazioni nasceranno da questi modelli?

Infine, resta da vedere quali applicazioni nascenti apriranno i modelli più economici. “Se qualcuno, diciamo, nelle Filippine o in Vietnam avesse interesse ad applicare questo alla propria sfida di decarbonizzazione, cosa inventerebbe?“, ha riflettuto Bullard. “Non so ancora cosa farebbero le persone con una maggiore capacità e costi inferiori e un diverso insieme di problemi da risolvere. E questo è davvero entusiasmante per me“.

Ma anche se i pessimisti dell’IA hanno ragione, e questi nuovi modelli non rendono l’IA ubiquitariamente utile per applicazioni che vanno dalla scoperta di nuovi farmaci alla semplificazione della presentazione delle domande di regolamentazione, Su ha detto che in un certo senso non ha molta importanza. “Se ci fosse la possibilità che qualcuno avesse questo tipo di potere, e potessi averlo anche tu, ti siederesti sul divano? O faresti una corsa agli armamenti? Penso che ciò stimolerà la domanda di energia, indipendentemente dall’utilità finale“.

Come ha detto Su, “Non credo che ci sia effettivamente un punto di saturazione per questo“.

Fonte: Heatmap

Immagine: Getty Images

Via col Vento

di energie rinnovabili, politiche climatiche e notizie