Che strappo! Andrej Karpathy ha appena annunciato che entrerà in Anthropic. Se non sapete chi è, per intenderci: cofondatore di OpenAI, ex direttore dell’AI di Tesla, da due anni impegnato con Eureka Labs (la sua startup sull’educazione), Karpathy lavorerà nel team pre-training sotto Nick Joseph, e guiderà un gruppo di nuova formazione con un compito molto specifico: usare Claude per accelerare la ricerca sul pre-training… di Claude.
Lo dice lui stesso con un post su X di tre righe, asciutto come solo lui sa essere:
“I think the next few years at the frontier of LLMs will be especially formative.”
Chi è Andrej Karpathy, per chi non mastica AI dalla mattina
Per chi segue queste cose, Andrej Karpathy è uno dei nomi che girano da sempre. Per chi non le segue, basta un riassunto rapido: faceva parte del piccolo gruppo che nel 2015 ha fondato OpenAI. Poi ha guidato per cinque anni la squadra che lavorava all’Autopilot e al Full Self-Driving (la guida autonoma delle Tesla, insomma). Nel 2023 è tornato in OpenAI, ma è rimasto solo un anno. Da lì se n’è andato per fondare Eureka Labs, una sua startup che voleva trasformare completamente la didattica con l’aiuto dell’intelligenza artificiale.
Mi è parso un ripiegamento piuttosto radicale, e mi ha lasciato qualche dubbio: mi aspettavo cose egregie ma da Eureka Labs, in due anni, si sono visti pochissimi aggiornamenti pubblici. Karpathy nel frattempo è diventato una sorta di divulgatore informale: tiene un corso online gratuito intitolato Neural Networks: Zero to Hero dove insegna a costruire reti neurali da zero, e ha un canale YouTube dove ogni tanto pubblica lezioni di un’ora sui modelli linguistici. Lezioni che molti ingegneri AI di oggi hanno guardato per imparare. È anche l’uomo che, sempre su X, l’anno scorso ha coniato il termine vibecoding, ormai entrato nel gergo dei programmatori.
Cosa farà davvero in Anthropic
Come detto, Karpathy è entrato nel team pre-training di Anthropic, quello che si occupa della fase più costosa e delicata della costruzione di un modello: il lungo addestramento iniziale che dà a Claude le conoscenze di base e le capacità di ragionamento. La parte dove si bruciano i miliardi in elettricità e GPU, per intenderci.
C’è però un dettaglio in più. Un portavoce di Anthropic ha dichiarato che Karpathy avvierà anche un team nuovo, e qui la cosa diventa interessante: dovrà usare Claude per accelerare la ricerca sul pre-training di Claude stesso. Detto altrimenti, un modello che aiuta a costruire la versione successiva di sé. Non è esattamente una novità di concetto (tutti i laboratori grossi stanno provando qualcosa di simile), ma è significativo che Anthropic ci metta a capo uno come lui. Vuol dire che ci credono parecchio.

Perché non è tornato a OpenAI?
Karpathy è uno dei pochi che potrebbe tornare in OpenAI con la chiave di casa. Ci è già stato due volte. E allora perché ha scelto di andare altrove, e non in una qualsiasi? È andato dal rivale numero uno, quello che secondo le ultime valutazioni di mercato è prossimo a superare proprio OpenAI come valutazione privata.
Perché, vedete, Anthropic in queste settimane sta mettendo insieme una rosa di nomi notevole. Pochi giorni fa è entrato Ross Nordeen, ex Tesla e fondatore di xAI, lo stesso giorno in cui Anthropic ha firmato un accordo con SpaceX per affittare capacità di calcolo sul Colossus 1 (il datacenter di xAI a Memphis: sì, proprio quello di Musk). Ancora, insieme a Karpathy è arrivato anche Chris Rohlf, veterano della cybersecurity con vent’anni di esperienza fra Yahoo e Meta, che si occuperà del red team che stressa i modelli più avanzati. Tre assunzioni pesanti e un contratto di compute in due settimane.
E Eureka Labs?
Resta in panchina. “Continuo ad avere profondamente a cuore l’educazione, e tornerò sull’argomento quando sarà il momento”, ha scritto Karpathy. Ecco, “quando sarà il momento” è una di quelle formule che possono significare sei mesi o dieci anni. Il sospetto è che gli sia mancato il rumore del cantiere: lavorare a un prodotto educativo, da soli, mentre il resto del settore corre su modelli da decine di miliardi di parametri, può diventare una specie di esilio. Tornare al pre-training di un laboratorio di frontiera è un’altra storia.
Quando lo vedremo davvero
Orizzonte stimato: 12-24 mesi prima che il lavoro di Karpathy si veda concretamente in una versione di Claude. Personalmente non vedo l’ora.
I cicli di pre-training durano mesi e i benefici di un nuovo approccio metodologico emergono solo dopo almeno una generazione completa di modello. Se il team che userà Claude per migliorare Claude funziona davvero, i primi a beneficiarne saranno i clienti enterprise di Anthropic (programmatori, aziende che pagano per le API), non gli utenti dell’app gratuita. E il “miglioramento” si misurerà in benchmark di ragionamento e coding, non in cose che il lettore medio noterà tra una conversazione e l’altra. Anche perché, nel frattempo, OpenAI, Google e tutti gli altri stanno facendo la stessa cosa.
Per ora restano un post di tre righe su X, un team in costruzione, e una startup educativa che parlava di rivoluzionare l’apprendimento e che adesso aspetta in silenzio. Karpathy ha già visto da vicino come si costruisce un laboratorio di frontiera. E ha scelto dove farlo di nuovo.
Ancora una volta, senza spiegare troppo. Per lui, ancora una volta, parleranno i fatti.