Google DeepMind Revoluciona la Robótica: Llega Gemini, el Futuro de los Robots Autónomos

Por: Rocío Rios

COMPARTE:

Facebook
X
WhatsApp

20 de marzo de 2025

La Evolución de la Robótica: De la IA a la Acción Física

En un giro emocionante para el mundo de la robótica, Google DeepMind ha anunciado el lanzamiento de su nueva versión del modelo Gemini, una IA capaz de fusionar el lenguaje, la visión y la acción física en robots más inteligentes y adaptables. Esta innovadora tecnología no solo permite a los robots realizar tareas como doblar papel, entregar objetos o colocar lentes en estuches, sino que también ofrece un paso importante hacia la creación de máquinas que pueden entender y actuar en escenarios complejos con una sorprendente precisión.

La promesa de la inteligencia artificial en los relatos de ciencia ficción siempre ha sido la creación de robots altamente inteligentes. Sin embargo, hasta ahora, la IA solo había existido en forma de chatbots y modelos de lenguaje. Con el anuncio de Gemini y su integración con robots físicos, este concepto ha dado un paso gigantesco hacia la realidad. Los videos publicados por Google muestran robots manipulando objetos en respuesta a órdenes habladas. En uno de los ejemplos más destacados, el modelo Gemini controla a un robot humanoide llamado Apollo, que no solo mueve objetos, sino que también interactúa en conversaciones simples con humanos.

Este modelo, conocido como Gemini Robotics, es capaz de vincular la información visual con las acciones físicas que los robots deben realizar, proporcionando un nivel de adaptabilidad y precisión nunca antes visto en el mundo de la robótica. El investigador Kanishka Rao, que lideró el proyecto, destacó que “una vez que la máquina comprende el concepto general, se vuelve mucho más general y útil”, lo que implica que los robots pueden aprender y ejecutar tareas de forma más eficiente en un rango más amplio de situaciones.

Gemini Robotics: Cognición Encarnada para una Robótica Más Inteligente

Además del modelo básico de Gemini, Google DeepMind también presentó una versión especializada llamada Gemini Robotics-ER, centrada en la cognición encarnada, es decir, la capacidad de los robots para comprender su entorno visual y espacial de manera más intuitiva. Esta versión tiene como objetivo ser utilizada por otros investigadores para entrenar modelos específicos de control para robots en diversos campos de trabajo.

La capacidad de los robots para interactuar con su entorno de manera efectiva ha sido una de las limitaciones más grandes en la robótica. Sin embargo, la combinación de los modelos de lenguaje (LLM) con las capacidades físicas de los robots abre nuevas posibilidades. Los avances de DeepMind demuestran que, aunque el entrenamiento de robots a gran escala aún es una tarea complicada, los LLM pueden ser una base poderosa para construir robots capaces de realizar una amplia gama de tareas físicas con gran destreza.

El Futuro de la Robótica y las Colaboraciones en la Industria

El impulso de Google en la robótica viene acompañado por otras iniciativas en la industria. Algunas de las renuncias de empleados clave de Google DeepMind para fundar Physical Intelligence, una startup dedicada a la robótica avanzada, han generado una nueva ola de investigaciones que apuntan a mejorar la autonomía y eficiencia de las máquinas. Además, el trabajo realizado por el laboratorio de investigación de Toyota está alineado con los esfuerzos de Google, consolidando un panorama prometedor para la robótica en los próximos años.

En septiembre de 2024, Google DeepMind también presentó un robot capaz de realizar tareas como atarse los cordones de los zapatos y doblar ropa al recibir una simple orden. Esta capacidad de realizar tareas cotidianas de forma autónoma demuestra que la robótica está avanzando a pasos agigantados y se está preparando para transformar sectores como la atención al hogar, la manufactura y la logística.

Una Nueva Era para los Robots Inteligentes

Lo que antes solo era un sueño en las historias de ciencia ficción, ahora se está convirtiendo en una realidad palpable. Con el modelo Gemini y sus nuevas capacidades, los robots inteligentes están más cerca que nunca de ser una parte integral de la vida diaria. Aunque aún queda mucho camino por recorrer, el avance de Google DeepMind en la robótica y la inteligencia artificial augura una nueva era de máquinas autónomas capaces de realizar tareas complejas con facilidad.

Esta combinación de IA y robótica tiene el potencial de cambiar industrias enteras, y podría ser el primer paso hacia la creación de un futuro donde los robots no solo ayuden a los humanos, sino que puedan realizar tareas por sí mismos de manera eficiente y precisa.