Un weekend qualunque di maggio 2025, a Berkeley. Trenta matematici che si riuniscono in segreto per una sfida particolare: riuscire a mettere in difficoltà l’ultima intelligenza artificiale di OpenAI. Sembra il plot di un film, invece è successo davvero.
I ricercatori avevano preparato problemi di teoria dei numeri, analisi reale, geometria algebrica. Roba che normalmente richiede settimane di studio. Il bot ci ha messo dieci minuti. Non solo: ha anche mostrato il suo processo di ragionamento, passo dopo passo, come farebbe uno studente particolarmente brillante.
“È come lavorare con un forte collaboratore”, ha ammesso uno dei partecipanti. Il futuro della matematica è già iniziato, e non tutti se ne sono accorti.
L’incontro che ha spaventato i matematici
L’evento era organizzato da Epoch AI nell’ambito di un progetto chiamato FrontierMath per testare le capacità matematiche avanzate dell’intelligenza artificiale. I partecipanti dovevano firmare accordi di riservatezza e comunicare esclusivamente tramite l’app Signal.

Perché tanta segretezza? Semplice: qualsiasi altra forma di comunicazione poteva essere scansionata da modelli di linguaggio e compromettere l’integrità del test.
La sfida era chiara: creare problemi matematici che i ricercatori riuscissero a risolvere ma che mandassero in tilt il modello o4-mini di OpenAI. Per ogni quesito irrisolubile dall’AI, il creatore del problema avrebbe ricevuto un premio di 7.500 dollari. Spoiler: pochi sono riusciti a portarseli a casa.
Ken Ono, matematico della University of Virginia e leader del meeting, ha raccontato un episodio che lo ha lasciato senza fiato. Ha proposto al bot un problema di teoria dei numeri che considerava “una buona questione da dottorato”. In dieci minuti, o4-mini non solo ha trovato la soluzione, ma ha anche dimostrato una certa spavalderia: “Nessuna citazione necessaria perché il numero misterioso è stato calcolato da me!”.
Quando i matematici diventano obsoleti?
I risultati hanno lasciato tutti di stucco. Mentre i modelli linguistici tradizionali riescono a risolvere meno del 2% dei problemi complessi di matematica, o4-mini ha raggiunto circa il 20% di successo. Ma la vera sorpresa è stata nella metodologia: il bot non si limitava a calcolare, ma mostrava un processo di ragionamento strutturato, proprio come farebbe un essere umano.
La macchina dedicava i primi due minuti a studiare la letteratura esistente sul tema, poi scriveva sullo schermo che voleva provare a risolvere una versione semplificata del problema per imparare. Solo dopo alcuni minuti affrontava la questione principale. Una strategia che ricorda molto quella di un ricercatore esperto.
Yang Hui He, matematico del London Institute for Mathematical Sciences e pioniere nell’uso dell’AI in matematica, non ha usato mezzi termini: “È quello che farebbe uno studente di dottorato molto, molto bravo. Anzi, di più”. La velocità è l’altro aspetto che ha colpito: problemi che richiederebbero settimane o mesi a un esperto umano vengono risolti in pochi minuti.
Ma c’è un lato oscuro in tutto questo. He ha coniato un termine inquietante: “dimostrazione per intimidazione”. Come sottolineavo in questo articolo, quando una macchina afferma qualcosa con sufficiente autorità, le persone tendono a crederle, anche se non capiscono completamente il ragionamento.

Il futuro della matematica in un mondo di IA
Verso la fine del meeting, i ricercatori hanno iniziato a immaginare scenari futuri. Si è parlato del “livello cinque”: problemi che neanche i migliori matematici riescono a risolvere. Se l’intelligenza artificiale raggiungerà quel punto, il ruolo degli esperti umani cambierà radicalmente.
È un grave errore dire che l’intelligenza artificiale generale non arriverà mai, che è solo un computer. In alcuni modi, questi modelli linguistici stanno già superando la maggior parte dei nostri migliori studenti di dottorato al mondo.
Ono prevede che i matematici potrebbero trasformarsi in “formulatori di domande”, lavorando insieme ai bot per scoprire nuove verità matematiche, un po’ come fa un professore con i suoi studenti di dottorato. La creatività umana rimarrà fondamentale, anche se forse non sarà più sufficiente.
Come finirà?
L’incontro di Berkeley non è stato solo una competizione intellettuale: è stato uno sguardo nel futuro. Un futuro dove le macchine non si limitano a calcolare, ma ragionano, imparano e scoprono. E lo fanno più velocemente di noi. Il progetto FrontierMath, come riportato in questa analisi dettagliata, continuerà a monitorare questi progressi.
Alla fine i matematici possono consolarsi dei dieci problemi che sono riusciti a mettere in difficoltà l’AI. Per ora. Ma la sensazione generale è che sia solo questione di tempo prima che anche quelli cadano.
In fondo, se una macchina riesce a essere spavaldamente sicura di sé quanto un dottorando, forse il salto verso il genio matematico non è poi così lontano.