“Non ho idea di cosa succederà”, dice ridendo Dean Leitersdorf poco prima di trasformarsi in un bizzarro imperatore romano dorato. Il fondatore di Decart ha appena digitato un prompt e la sua immagine su Zoom cambia in tempo reale, oscillando in modi surreali mentre l’AI predice ogni nuovo fotogramma.
È l’anteprima di una tecnologia che potrebbe scuotere per sempre l’industria dello streaming (e dell’informazione): video generativo senza limiti di durata o qualità.
Mirage LSD, la prima AI che trasforma video infiniti
La startup israeliana Decart ha presentato Mirage, il primo sistema di intelligenza artificiale capace di trasformare flussi video dal vivo senza interruzioni. A differenza di altri modelli come Sora di OpenAI o Veo di Google, che producono clip di pochi secondi dopo minuti di elaborazione, Mirage opera con una latenza di soli 40 millisecondi. Il sistema, basato su MirageLSD (Live Stream Diffusion), genera video a 20 fotogrammi al secondo mantenendo una risoluzione di 768×432 pixel.
Il segreto sta nell’architettura autoregressiva: ogni fotogramma viene generato basandosi sul precedente e su un prompt testuale, creando un flusso continuo che può durare indefinitamente senza perdere coerenza. Come spiega Leitersdorf, fondatore e CEO della startup: “È la differenza tra guardare la magia su uno schermo e creare magia da soli”.

Come funziona Decart AI in tempo reale
La tecnologia risolve due problemi che hanno sempre limitato i generatori video AI: l’accumulo di errori e la latenza elevata. I modelli precedenti degradavano rapidamente la qualità dopo 20-30 secondi di generazione, mentre Mirage mantiene la stabilità attraverso due innovazioni chiave.
La prima è la “diffusion forcing”, che addestra il modello a pulire ogni singolo fotogramma indipendentemente. La seconda è la “history augmentation”, che insegna al sistema a riconoscere e correggere gli errori dei propri output precedenti.
Dal punto di vista tecnico, Decart ha ottimizzato il codice per le GPU Nvidia Hopper utilizzando “mega kernel” personalizzati e tecniche di distillazione che riducono i calcoli necessari per ogni fotogramma. Il risultato? Un miglioramento di 16 volte nella reattività rispetto ai modelli precedenti, rendendo possibile la generazione video interattiva a 24 fps.
La piattaforma permette di trasformare qualsiasi contenuto: dalle partite di Fortnite che diventano mondi sottomarini, alle videochiamatte che si trasformano in stili anime o cyberpunk. Secondo i test condotti, il sistema può gestire anche clip di YouTube preesistenti, applicando trasformazioni in tempo reale senza perdere la struttura originale del movimento.
Decart e il problema della verità digitale
Ma c’è un aspetto più inquietante da considerare. Sistemi come Mirage rappresentano una pietra tombale sull’informazione come la conosciamo. La realtà che vediamo non avrà più alcuna credibilità se non siamo fisicamente presenti ad osservarla. Quando un’AI può trasformare qualsiasi video in tempo reale, distinguere tra contenuto autentico e modificato diventa impossibile per l’occhio umano. Come vi raccontavo in questo articolo sui video generati dal pensiero, siamo entrati in un’era dove la manipolazione digitale supera la nostra capacità di riconoscerla.
Il contenuto non è più fisso ma adattivo. Mirage permette agli spettatori di influenzare l’aspetto del contenuto video mentre viene riprodotto, allineandosi con la nostra visione più ampia di rendere il video un mezzo più interattivo e personalizzabile.
Le implicazioni per il giornalismo, la giustizia e la società sono enormi. Se qualsiasi video può essere alterato istantaneamente, su cosa baseremo la nostra fiducia nelle prove visive? Gli esperti sottolineano che servono urgentemente sistemi di autenticazione e watermark invisibili per distinguere i contenuti originali da quelli generati artificialmente. Ma basteranno?
Il futuro dello streaming secondo Decart
Decart, fondata nel 2023 da Dean Leitersdorf e Moshe Shalev (entrambi veterani della Unit 8200 israeliana), ha già raccolto 53 milioni di dollari da investitori come Sequoia Capital e Benchmark. La valutazione attuale supera i 500 milioni di dollari, con l’obiettivo dichiarato di diventare un “kilocorno” da mille miliardi di dollari.
Nei prossimi mesi arriveranno versioni Full HD e 4K, insieme a controlli più precisi per oggetti specifici e consistenza facciale. Ma la vera domanda rimane: siamo pronti per un mondo dove ogni video può essere trasformato istantaneamente? Dove la linea tra realtà e finzione scompare completamente?
Forse dovremmo iniziare a chiederci non cosa possiamo fare con questa tecnologia, ma cosa farà questa tecnologia a noi.