Futuro Prossimo
No Result
View All Result
28 Settembre 2023
  • Home
  • Tech
  • Salute
  • Ambiente
  • Energia
  • Trasporti
  • Spazio
  • AI
  • Concepts
  • H+
Capire, anticipare, migliorare il futuro.
CES2023 / Coronavirus / Russia-Ucraina
Futuro Prossimo
  • Home
  • Tech
  • Salute
  • Ambiente
  • Energia
  • Trasporti
  • Spazio
  • AI
  • Concepts
  • H+

Capire, anticipare, migliorare il futuro.

No Result
View All Result
Robotica, Tecnologia

DeepMind presenta RT-2: robot che vedono, apprendono e agiscono

Il modello di AI sviluppato da DeepMind, che combina visione e linguaggio per controllare le macchine, aprirà nuovi orizzonti nella robotica.

30 Luglio 2023
Gianluca RiccioGianluca Riccio
⚪ 4 minuti
SharePin1TweetSendShareShareShare

READ IN:

In un ambiente luminoso, pieno di monitor e apparecchiature tecnologiche, un robot si erge come protagonista. La sua struttura metallica riflette la luce, ma è nei suoi "occhi" che si nasconde la vera magia. Questi occhi, alimentati dal modello RT-2 di DeepMind, sono capaci di vedere, interpretare e agire.

Mentre il robot si muove con grazia, gli scienziati intorno a lui scrutano ogni sua mossa. Non è solo un pezzo di metallo e circuiti, ma l'incarnazione di un'intelligenza che unisce il vasto mondo del web con la realtà tangibile.

Deepmind
Uno dei 13 robot impiegati per l'addestramento del modello.

L'evoluzione di RT-2

La robotica ha fatto passi da gigante negli ultimi anni, ma DeepMind ha appena portato il gioco a un livello completamente nuovo. Illustrato in un paper appena diffuso arriva RT-2. Cos'è? È un modello visione-linguaggio-azione (VLA) che non solo apprende dai dati del web, ma anche dai dati robotici, traducendo questa conoscenza in istruzioni generalizzate per il controllo robotico.

In un'era in cui la tecnologia avanza a passi da gigante, RT-2 rappresenta un balzo significativo, promettendo di rivoluzionare non solo il campo della robotica, ma anche il modo in cui viviamo e lavoriamo ogni giorno. Ma che significa in pratica?

L'articolo prosegue dopo i link correlati

Senza un freno delle Istituzioni l'AI porterà a un neo-feudalesimo privato?

Arriva TeddyGPT, il primo orsacchiotto AI che parla e impara con i bambini

DeepMind RT-2, da visione ad azione

I modelli di visione-linguaggio ad alta capacità (VLM) sono addestrati su grandi dataset, e questo li rende straordinariamente bravi anche nel riconoscere schemi visivi o linguistici (operando, ad esempio, in diverse lingue). Ma immaginate di poter far fare ai robot ciò che fanno questi modelli. Anzi, smettete di immaginarlo: DeepMind lo sta rendendo possibile con RT-2.

Robotic Transformer 1 (RT-1) era già una meraviglia di per sé, ma RT-2 va oltre, mostrando capacità di generalizzazione migliorate e una comprensione semantica e visiva che va oltre i dati robotici a cui è stato esposto.

DeepMind
Un modello di linguaggio visivo (VLM) pre-addestrato con dati web impara anche dai dati di robotica RT-1. Risultato? RT-2, un modello di azione di linguaggio visivo (VLA) in grado di controllare un robot - Animazione: DeepMind

Ragionamento a catena

Uno degli aspetti più affascinanti di RT-2 è la sua capacità di ragionamento a catena. Può decidere quale oggetto potrebbe essere usato come martello improvvisato o quale tipo di bevanda è la migliore per una persona stanca. Questa capacità di ragionamento profondo potrebbe rivoluzionare il modo in cui interagiamo con i robot.

E mal che vada, potreste comunque chiedere a un robot di prepararvi un buon caffè per ritrovare un po' di lucidità.

Ma come fa DeepMind RT-2 a controllare un robot?

La risposta sta nel modo in cui è stato addestrato. Di fatto, usa una rappresentazione non dissimile ai token del linguaggio che vengono sfruttati da modelli come ChatGPT.

RT-2 ha dimostrato capacità emergenti sorprendenti, come la comprensione dei simboli, il ragionamento e il riconoscimento umano. Abilità che al momento mostrano un miglioramento di oltre 3 volte rispetto ai modelli precedenti.

Con RT-2, DeepMind non solo ha mostrato che i modelli di visione-linguaggio possono essere trasformati in potenti modelli visione-linguaggio-azione, ma ha anche aperto la porta a un futuro in cui i robot possono ragionare, risolvere problemi e interpretare informazioni per svolgere una vasta gamma di compiti nel mondo reale.

DeepMind
Un esempio delle attività apprese da DeepMind RT-2. Attività che non erano presenti tra i dati con cui è stato addestrato.

E ora?

In un mondo in cui l'intelligenza artificiale e la robotica saranno sempre più centrali, RT-2 ci mostra che la prossima evoluzione non sarà puramente tecnica, ma "percettiva". Le macchine comprenderanno e risponderanno alle nostre esigenze in modi che non avremmo mai immaginato.

Se questo è solo l'inizio, chissà cosa ci riserva il futuro.

Tags: Deepmindintelligenza artificialerobot

Ultime notizie

  • Optivolt rivoluziona il solare: pannelli efficienti anche all'ombra
  • Callboats, Helsinki lancia i taxi autonomi ed elettrici sull'acqua
  • La Cina punta al sottosuolo: una base lunare nei tubi di lava
  • Su Marte in 26 giorni con la nuova vela solare in aerografite
  • Amazon investe in Anthropic: la guerra delle AI infuria
  • Sorridete: il farmaco che fa ricrescere i denti arriva ai test clinici
  • Senza un freno delle Istituzioni l'AI porterà a un neo-feudalesimo privato?
  • Quando ci estingueremo? Arriva una (bella) previsione del supercomputer
  • DNA e longevità: come i 'geni saltellanti' potrebbero allungarci la vita
  • Arriva TeddyGPT, il primo orsacchiotto AI che parla e impara con i bambini


Chat GPT Megafacile!

Guida concreta per chi si avvicina a questo strumento di intelligenza artificiale, pensata anche per il mondo della scuola: tantissimi esempi di applicazioni, indicazioni d'uso e istruzioni già pronte per addestrare ed interrogare Chat GPT.

Per inviare articoli, divulgare gli esiti di una ricerca o di scoperte scientifiche scrivi in redazione

Entra nel canale Telegram di Futuroprossimo, clicca qui. O seguici su Instagram, Facebook, Twitter, Mastodon e Linkedin.

FacebookTwitterInstagramTelegramLinkedinMastodonPinterestTikTok

Il domani quotidiano.


Futuroprossimo.it fornisce notizie sul futuro di tecnologia, scienza e innovazione: se c'è una cosa che sta per arrivare, qui è già arrivata. FuturoProssimo fa parte del network ForwardTo, studi e competenze per scenari futuri.

  • Ambiente
  • Architettura
  • Intelligenza artificiale
  • Gadgets
  • Concepts
  • Design
  • Medicina
  • Spazio
  • Robotica
  • Lavoro
  • Trasporti
  • Energia
  • Édition Française
  • Deutsche Ausgabe
  • 日本語版
  • English Edition
  • Edição Portuguesa
  • Русское издание
  • Edición en español

Iscriviti alla newsletter

  • La Redazione
  • Pubblicità su FP
  • Privacy Policy

© 2023 Futuroprossimo - Licenza Creative Commons
Quest'opera è distribuita con Licenza Creative Commons Attribuzione 4.0 Internazionale.

No Result
View All Result
Capire, anticipare, migliorare il futuro.
  • Home
  • Tech
  • Salute
  • Ambiente
  • Energia
  • Trasporti
  • Spazio
  • AI
  • Concepts
  • H+