Revolução Inteligente: Sistema de IA de Modelo Duplo do Google DeepMind Capacita Robôs com Raciocínio e Capacidade de Busca

September 28, 2025
GOOGLE
4 min

Resumo

A Google DeepMind lançou recentemente os novos modelos Gemini Robotics 1.5 e Gemini Robotics-ER 1.5, marcando a primeira vez que a tecnologia de IA se aventura verdadeiramente no mundo dos robôs físicos. Estes dois modelos adotam um design de arquitetura dupla, permitindo que os robôs não só executem instruções, mas também raciocinem, planeiem e usem ferramentas de forma proativa, alcançando capacidades de interação mais avançadas com o mundo físico.

Arquitetura Dupla Inovadora

O Gemini Robotics-ER 1.5 e o Gemini Robotics 1.5 empregam um design inovador de arquitetura dupla, onde ambos trabalham em conjunto para formar um poderoso sistema de IA para robôs. O Gemini Robotics-ER 1.5 atua como o "cérebro de alto nível", responsável pelo planeamento e pelas decisões no espaço físico, enquanto o Gemini Robotics 1.5 traduz a visão e a compreensão da linguagem em ações concretas. Esta arquitetura permite que os robôs executem tarefas complexas de várias etapas, como classificar o lixo de acordo com as regras de reciclagem locais encontradas online, ou fazer as malas com base na previsão do tempo.

Uma Mudança Significativa da Reação para o Raciocínio

Carolina Parada, chefe da divisão de robótica da Google DeepMind, salienta que o novo sistema permite que as máquinas "pensem vários passos à frente", em vez de se concentrarem apenas num único passo. Ao contrário da geração anterior, que só conseguia executar instruções simples, o novo sistema faz com que o comportamento dos robôs se aproxime mais da forma de pensar humana – primeiro planear, depois agir.

Capacidade de Aprendizagem entre Robôs

Outra mudança revolucionária trazida por esta atualização é a funcionalidade de "aprendizagem entre robôs". A DeepMind demonstrou que as habilidades aprendidas pelo robô de dois braços ALOHA2 podem ser aplicadas sem configuração adicional a robôs Franka ou ao robô humanoide Apollo da Apptronik. Isso significa que o mesmo conjunto de modelos pode controlar diferentes tipos de robôs e transferir experiências, acelerando significativamente o ritmo de desenvolvimento da tecnologia robótica.

Pesquisa Inteligente na Web e Uso de Ferramentas

O Gemini Robotics-ER 1.5 é capaz de avaliar desafios complexos, invocar nativamente ferramentas (como a Pesquisa Google) para encontrar informações e criar planos detalhados passo a passo para superar problemas. Isso permite que os robôs procurem informações e as apliquem a tarefas práticas como os humanos, expandindo enormemente o leque de capacidades dos robôs.

Melhoria da Segurança e Transparência

A DeepMind colocou a segurança no centro do processo de desenvolvimento. Ambos os modelos estão equipados com salvaguardas e recursos de explicabilidade, tornando o comportamento do robô mais previsível e compreensível. A Google também lançou uma versão atualizada do benchmark ASIMOV, usado para avaliar e melhorar a segurança semântica, no qual o Gemini Robotics-ER 1.5 demonstrou um desempenho de ponta na avaliação de segurança.

Disponibilidade para Desenvolvedores

Esta atualização já está disponível para desenvolvedores: o Gemini Robotics-ER 1.5 pode ser testado através da API Gemini no Google AI Studio, enquanto o Gemini Robotics 1.5 está atualmente disponível apenas para parceiros selecionados. Isso promoverá uma inovação e desenvolvimento de aplicações robóticas mais amplos.

Um Marco Importante Rumo à Inteligência Artificial Geral

A Google DeepMind descreve este lançamento como um passo significativo para resolver a inteligência artificial geral (AGI) no mundo físico. Ao introduzir capacidades de proatividade, a Google está a ir além de modelos que apenas respondem a comandos, criando sistemas que podem realmente raciocinar, planear, usar ferramentas de forma proativa e generalizar.

Impacto na Indústria e Perspetivas Futuras

Esta tecnologia inovadora promete remodelar várias indústrias. Na área da saúde, robôs assistentes podem fornecer ajuda de acordo com as diferentes necessidades dos pacientes; em ambientes domésticos, podem tornar-se assistentes pessoais mais inteligentes. Embora a tecnologia robótica ainda esteja nos seus estágios iniciais, este lançamento indica que o futuro não é apenas sobre IA mais inteligente, mas sobre IA capaz de viver e agir connosco.

À medida que a Google DeepMind continua a avançar na fusão da robótica com a inteligência artificial, podemos esperar o surgimento de mais aplicações inovadoras, diminuindo ainda mais a lacuna entre a inteligência virtual e o mundo físico.