Company name: Dynamic Solutions s.r.l.
Address: VIA USODIMARE 3 - 37138 - VERONA (VR) - Italy

E-Mail: [email protected]

Come Google Gemini 1.5 sta rivoluzionando i robot domestici

Scopri come l'integrazione di Gemini AI nei robot di Google permette loro di eseguire comandi complessi con un tasso di successo del 90%.
  • Il 90% delle istruzioni utente sono state eseguite con successo dai robot alimentati da Gemini 1.5 Pro in un'area operativa di oltre 800 metri quadrati.
  • I robot possono eseguire comandi complessi come trovare oggetti smarriti e verificare la disponibilità di prodotti (es. Coca-Cola) in meno di 30 secondi.
  • DeepMind ha utilizzato Gemini 1.5 Pro per migliorare l'interazione dei robot con l'ambiente, basandosi su input vocali e visivi.

L’azienda ha recentemente rivelato che Gemini AI sta contribuendo a rendere i suoi robot più autonomi ed efficienti nell’interagire con il mondo circostante in modo intelligente. L’integrazione di Gemini nei sistemi robotici potrebbe portare a progressi significativi, con applicazioni in diversi settori, dall’assistenza domestica alla logistica. Il team di robotica di DeepMind ha spiegato in un nuovo documento di ricerca l’utilizzo del modello linguistico Gemini 1.5 Pro, che ha la capacità di elaborare grandi quantità di informazioni, permettendo agli utenti di interagire facilmente con i robot RT-2 attraverso istruzioni in linguaggio naturale.

Il processo prevede la realizzazione di video tour di una determinata area, come una casa o un ufficio, “osservato” dal robot grazie a Gemini 1.5 Pro. In questo modo, il robot impara a conoscere l’ambiente circostante e può eseguire comandi basati su ciò che ha visto, utilizzando input vocali o immagini. Ad esempio, se viene mostrato un telefono e chiesto “dove caricarlo?”, il robot può guidare l’utente verso una presa elettrica. DeepMind afferma che un robot alimentato da Gemini ha ottenuto un tasso di successo del 90% su oltre 50 istruzioni utente in un’area operativa di oltre 800 metri quadrati.

In una clip condivisa dall’azienda su Instagram, i ricercatori hanno riscontrato “prove preliminari” che Gemini 1.5 Pro consente ai robot di pianificare ed eseguire istruzioni oltre la semplice navigazione. Ad esempio, se un utente con molte lattine di Coca-Cola sulla scrivania chiede al robot se la bevanda preferita è disponibile, Gemini “sa” che il robot dovrebbe andare al frigorifero, controllare se ci sono altre lattine e tornare per comunicare il risultato. Le dimostrazioni video fornite da Google sono impressionanti, con il robot che impiega tra 10 e 30 secondi per elaborare le istruzioni. Potrebbero passare alcuni anni prima di condividere le nostre case con robot di mappatura ambientale avanzati, ma almeno questi potrebbero trovare le nostre chiavi o il portafoglio smarriti.

Come usare Gemini 1.5 per svolgere queste 5 attività

Con Gemini 1.5 Pro, i robot di Google possono muoversi e completare attività in modo sorprendentemente efficiente. I risultati dei primi test sono stati sorprendenti. Pubblicato l’11 luglio 2024, il modello Gemini AI è destinato a cambiare il modo in cui utilizziamo smartphone e tablet per la produttività e lo svago. Questo è testimoniato dall’ultimo video su Instagram da Google DeepMind. Il colosso di Mountain View sta utilizzando Gemini per addestrare i robot e renderli più efficienti nel completamento delle attività.

Oltre alla clip, il team di robotica di Google ha condiviso un documento di ricerca che spiega l’utilizzo della lunga finestra di contesto di Gemini 1.5 Pro per migliorare l’interazione con i robot R2-T utilizzando istruzioni in linguaggio naturale. Il processo inizia con un tour visivo di un’area designata, come un appartamento o un ufficio, che il robot deve imparare a conoscere. Dopo aver studiato l’ambiente, il robot può eseguire comandi basati su ciò che ha osservato, utilizzando output verbali o visivi, come indicare all’utente la presa di corrente per ricaricare lo smartphone.

Risultati dei test e applicazioni future

Secondo quanto dichiarato da DeepMind, un robot alimentato da Gemini 1.5 Pro ha avuto un tasso di successo del 90% in oltre 50 istruzioni in un’area ampia (oltre 800 metri quadrati). I robot potranno svolgere anche altro, non limitandosi alla semplice navigazione. Nell’esempio del documento di ricerca, un utente con molte lattine di Coca-Cola sulla scrivania chiede al droide se la bevanda preferita è disponibile. Il team ha scoperto che Gemini sa, dopo la richiesta, che il droide dovrebbe dirigersi verso il frigorifero, controllare se ci sono altre lattine di Coca-Cola e tornare dall’utente per riferire il risultato. Il droide richiede dai 10 ai 30 secondi per elaborare l’istruzione, nulla di sorprendente nelle dimostrazioni di Google.

Google non ha fornito dettagli specifici sulle modalità di utilizzo di Gemini nei suoi robot, ma è probabile che l’intelligenza artificiale venga impiegata per migliorare la percezione sensoriale, la pianificazione del movimento, la presa di decisioni e l’interazione con l’ambiente. Non è la prima volta che un approccio simile viene preso in considerazione; basti pensare alla recente ricerca del MIT, dove i ricercatori hanno ideato un metodo di navigazione che converte le rappresentazioni visive in linguaggio. Anche Microsoft sta lavorando a una nuova API per utilizzare ChatGPT per il controllo di robot, droni e tecnologie simili, mostrando che i limiti delle tecnologie di intelligenza artificiale sono ancora lontani.

Bullet Executive Summary

In conclusione, l’integrazione di Gemini AI nei robot di Google rappresenta un passo avanti significativo nel campo della robotica e dell’intelligenza artificiale. Con la capacità di elaborare istruzioni complesse e interagire con l’ambiente circostante, questi robot potrebbero rivoluzionare vari settori, dall’assistenza domestica alla logistica. La tecnologia alla base di Gemini 1.5 Pro permette ai robot di eseguire comandi con un tasso di successo del 90%, dimostrando un potenziale enorme per il futuro.

Una nozione base di tecnologia correlata al tema principale dell’articolo è il concetto di machine learning, che permette ai robot di apprendere dall’esperienza e migliorare le loro prestazioni nel tempo. Un esempio avanzato di tecnologia applicabile è il deep reinforcement learning, che consente ai robot di prendere decisioni complesse basate su una serie di azioni e risultati, migliorando ulteriormente la loro capacità di interazione con l’ambiente.

Queste innovazioni non solo migliorano l’efficienza dei robot, ma aprono anche nuove possibilità per il loro utilizzo in contesti quotidiani. Invitiamo i lettori a riflettere su come queste tecnologie potrebbero influenzare la loro vita e il loro lavoro, stimolando una riflessione personale su un futuro sempre più interconnesso e automatizzato.


Articolo e immagini generati dall’AI, senza interventi da parte dell’essere umano. Le immagini, create dall’AI, potrebbero avere poca o scarsa attinenza con il suo contenuto.(scopri di più)
0 0 votes
Article Rating
Subscribe
Notificami
guest
0 Commenti
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
0
Ci interessa la tua opinione, lascia un commento!x