Tecnologia

AI, e se i costi superassero quelli delle persone?

Quattro mesi di token bastano per bruciare un intero budget annuale. I costi dell'AI hanno superato quelli umani, e nessuno guarda ancora la fattura.

Gianluca Riccio

3 Luglio 2026

A dramatic, cinematic editorial illustration depicting a massive glowing server rack tower looming over a tiny human figure at a desk, rendered in deep blues and electric purples with sharp neon highlights. The server infrastructure is enormous and imposing, casting a cool artificial light that dwarfs the small, illuminated human worker below. Floating dollar signs and abstract token streams cascade from the servers like falling rain. In the background, a faint cityscape of Silicon Valley at night. The atmosphere is tense and contemplative, evoking the uncanny moment when machine costs eclipse human costs. Photorealistic digital art style with cinematic lighting and a slightly dystopian, corporate-futuristic aesthetic.

Entra nel Canale Whatsapp di Futuro Prossimo >

“Per il mio team, il costo del calcolo è ormai molto oltre quello dei dipendenti che lo usano.” Bryan Catanzaro non è un attivista né un umanista pentito: è vicepresidente del deep learning applicato in Nvidia, l’azienda che vende le GPU su cui gira tutto il resto. Lo ha detto già lo scorso aprile, con la calma di chi sta descrivendo una cosa già successa da un pezzo.

Tre settimane dopo, il suo capo Jensen Huang spiegava agli azionisti che un ingegnere da mezzo milione di dollari dovrebbe consumare almeno 250mila dollari di token l’anno, e che Nvidia sta lavorando per portare il budget token della sua squadra ingegneristica a due miliardi: praticamente ne ha parlato quasi come se fosse un benefit aziendale, tipo i buoni pasto.

La domanda che nessuno ha fatto a Huang due mesi fa, comunque, è la stessa che oggi si stanno facendo i dirigenti di mezza Silicon Valley: se il calcolo costa più delle persone, di preciso, cosa stiamo sostituendo con cosa?

Costi dell’AI: il caso Uber

Il caso di scuola è Uber. Il CTO Praveen Neppalli Naga ha annunciato ad aprile che l’azienda aveva finito il budget AI del 2026 in quattro mesi. A marzo l’84% degli ingegneri Uber usava Claude Code, e circa il 70% del codice sviluppato passava da un modello. Il consumo di token era enorme, ma il presidente e COO Andrew Macdonald ha ammesso pubblicamente che non correlava in modo lineare con feature effettivamente rilasciate agli utenti. In pratica: si spendeva molto, si produceva molto, si realizzava un po’ meno di quanto ci si aspettasse.

Uber ha reagito imponendo un tetto di 1.500 dollari al mese per dipendente per singolo tool e una dashboard di monitoraggio in tempo reale. Microsoft, che ha investito circa 13 miliardi in OpenAI, ha detto agli ingegneri di una sua divisione di smettere di usare un assistente di coding perché la bolletta era diventata insostenibile. E poi c’è l’azienda (che per evitare di ricevere fischi e pernacchi resta anonima) che Axios cita di sfuggita: 500 milioni di dollari di fattura Anthropic in un mese solo, perché il management si era dimenticato di impostare un tetto.

E non è nemmeno il caso peggiore documentato, è solo quello di cui si ha un numero preciso. Insomma: grande è la confusione sotto il cielo.

Il tokenmaxxing e la leaderboard che è diventata un imbarazzo

Amazon aveva costruito una classifica interna, KiroRank, per tenere d’occhio quanto ciascun team consumasse token di intelligenza artificiale. L’ha tolta di mezzo in silenzio quando si è capito che gli ingegneri stavano bruciando token in task inutili solo per salire in classifica. Meta ha fatto la sua versione, Claudeonomics. Il nome del giochino, nella cultura aziendale che si è formata attorno, si chiama tokenmaxxing: massimizzare il consumo come se fosse una metrica di produttività. Un ingegnere di OpenAI, riporta il New York Times, ha processato 210 miliardi di token in una settimana: trentatré volte il testo di Wikipedia.

È semplicemente una follia, e ce ne ricorderemo: quando ricompensi le persone per quanto spendono invece che per cosa producono, la spesa diventa il prodotto. Chi ha lavorato in un’azienda con un budget per le trasferte capisce al volo di cosa sto parlando. Nel frattempo, il grosso dei task enterprise (circa il 95%) continua a girare sui modelli di frontiera, i più cari, anche quando basterebbe un modello da un decimo del prezzo. È come mandare uno a comprare il pane a 300 metri di distanza con una Ferrari.

La contabilità dei licenziamenti non torna

Nel 2026, oltre 115.000 lavoratori tech sono stati licenziati in più di 150 aziende. Meta ne ha tagliati 8.000, SentinelOne l’8% dell’organico, Wix un quinto, Block la metà, Atlassian 1.600. La motivazione ufficiale è sempre la stessa: efficienza operativa, e riallocazione verso l’AI. Uno studio del MIT stima però che l’automazione via AI sia economicamente sostenibile per circa il 23% dei ruoli. Nel restante 77%, un essere umano costa ancora meno di un token che fa lo stesso lavoro. Il capo economista di Goldman Sachs dice apertamente di non vedere l’investimento in AI come particolarmente positivo per la crescita. Su questa strana matematica avevamo già scritto a proposito dei 30.000 posti di Amazon, e non è invecchiata bene.

David Cahn di Sequoia Capital ha messo il numero sulla ferita: alle attuali cifre di spesa in infrastruttura, all’industria AI servono circa 600 miliardi di dollari di ricavi annui per rientrare. A metà 2026, il divario tra ricavi reali e ricavi necessari si sta allargando, non chiudendo. A febbraio, quando raccontammo il primo panico di Wall Street sugli agenti AI, sembrava un allarme prematuro; a giugno era diventato un modo di stare al mondo.

Chi paga il conto (e quando finiscono i sussidi)

I prezzi che le aziende pagano oggi non sono prezzi reali. OpenAI, Anthropic, Google e Meta stanno vendendo i loro servizi AI sotto il costo di produzione, bruciando capitali di rischio per prendersi il mercato. OpenAI, per ogni dollaro che incassa in inferenza, ne spende quasi due.

Sam Altman ha ammesso pubblicamente di perdere soldi sugli abbonamenti da 200 dollari al mese. In aprile Anthropic ha spostato i clienti enterprise da tariffa flat a fatturazione a consumo; GitHub Copilot l’ha imitata qualche settimana dopo. Quando i prezzi si allineeranno ai costi veri dell’infrastruttura, gli analisti prevedono bollette enterprise più alte del 30-50%. Il gigante che Huang chiamava “fabbrica di AI” nel 2024 sta cominciando a presentare il conto.

Il paragone che gira nei board è quello con la fine degli anni Novanta. La bolla di Internet è scoppiata, poi è rimasto in piedi chi è riuscito a pagare le bollette. L’AI sta per fare lo stesso passaggio, e la divisione tra chi sopravviverà e chi no si vede già: da una parte le aziende AI-native, ricostruite attorno al modello, che non pagano prezzi da frontiera per lavoro che un modello specializzato fa meglio; dall’altra chi ha attaccato l’AI a un prodotto esistente come si attacca una spilletta a un colletto.

Quando i venture capital smetteranno di sovvenzionare la festa, sarà come nel gioco dei quattro cantoni: qualcuno riuscirà a sedersi, gli altri finiranno con il culo per terra. E comunque, resta la domanda di fondo: se il calcolo costa già più della persona che sostituisce, quando comincia il conto della cena a girare nell’altro senso?
Nessuno alla cassa ha ancora una risposta pronta. Il conto, comunque, arriva.

Gianluca Riccio, direttore creativo di Melancia adv, copywriter e giornalista. Fa parte di Italian Institute for the Future, World Future Society e H+. Dal 2006 dirige Futuroprossimo.it , la risorsa italiana di Futurologia. È partner di Forwardto - Studi e competenze per scenari futuri. Seguilo su LinkedIn

Per segnalare ricerche, scoperte e invenzioni, contatta la redazione!Segui Futuro Prossimo su Whatsapp: news e update esclusivi (gratis).