지능 혁명: 구글 DeepMind 이중 모델 AI 시스템이 로봇에게 추론 및 검색 능력 부여
요약
구글 딥마인드는 최근 새로운 Gemini Robotics 1.5 및 Gemini Robotics-ER 1.5 모델을 출시하며, AI 기술이 처음으로 실제 로봇 세계로 진정으로 나아가는 중요한 이정표를 세웠습니다. 이 두 모델은 이중 아키텍처 설계를 채택하여 로봇이 단순히 명령을 실행하는 것을 넘어 추론, 계획, 그리고 능동적으로 도구를 사용하는 능력을 갖추게 함으로써, 더욱 고도화된 물리적 세계 상호작용 능력을 실현합니다.
획기적인 이중 모델 아키텍처
Gemini Robotics-ER 1.5와 Gemini Robotics 1.5는 혁신적인 이중 아키텍처 설계를 채택했으며, 이 둘은 강력한 로봇 AI 시스템을 형성하기 위해 협력합니다. Gemini Robotics-ER 1.5는 "고급 두뇌" 역할을 하여 계획 및 물리적 공간 결정을 담당하고, Gemini Robotics 1.5는 시각 및 언어 이해를 구체적인 행동으로 전환합니다. 이러한 아키텍처는 로봇이 온라인에서 검색한 지역 재활용 규칙에 따라 쓰레기를 분류하거나, 일기 예보에 따라 짐을 싸는 것과 같은 복잡한 다단계 작업을 수행할 수 있도록 합니다.
반응에서 추론으로의 중대한 전환
구글 딥마인드 로봇 부문 책임자 캐롤라이나 파라다(Carolina Parada)는 새로운 시스템이 로봇이 단일 단계에만 집중하는 것이 아니라 "여러 단계를 미리 생각"할 수 있게 한다고 언급했습니다. 단순히 간단한 명령만 실행할 수 있었던 이전 세대 제품과 달리, 새로운 시스템은 로봇의 행동을 인간의 사고방식, 즉 먼저 계획하고 그 다음에 행동하는 방식에 더 가깝게 만듭니다.
크로스 로봇 학습 능력
이번 업데이트가 가져온 또 다른 혁신적인 변화는 "크로스 로봇 학습" 기능입니다. 딥마인드는 양팔 ALOHA2 로봇이 학습한 기술이 추가 설정 없이 Franka 로봇이나 Apptronik의 Apollo 휴머노이드 로봇에 적용될 수 있음을 시연했습니다. 이는 동일한 모델 세트가 다양한 유형의 로봇을 제어하고 경험을 전달할 수 있음을 의미하며, 로봇 기술의 발전 속도를 크게 가속화합니다.
지능형 웹 검색 및 도구 사용
Gemini Robotics-ER 1.5는 복잡한 과제를 평가하고, 구글 검색과 같은 도구를 기본적으로 호출하여 정보를 찾으며, 문제를 해결하기 위한 상세한 단계별 계획을 수립할 수 있습니다. 이는 로봇이 인간처럼 정보를 찾아 실제 작업에 적용할 수 있게 하여 로봇의 능력 범위를 크게 확장합니다.
안전 및 투명성 향상
딥마인드는 개발 과정에서 안전을 핵심 가치로 두었습니다. 두 모델 모두 로봇 행동을 더욱 예측 가능하고 설명 가능하게 만드는 보호 장치와 설명 가능성 기능을 갖추고 있습니다. 구글은 또한 의미론적 안전성을 평가하고 개선하기 위한 ASIMOV 벤치마크의 업그레이드 버전을 발표했으며, Gemini Robotics-ER 1.5는 안전성 평가에서 최첨단 성능을 보여주었습니다.
개발자 가용성
이번 업데이트는 개발자에게 공개되었습니다: Gemini Robotics-ER 1.5는 Google AI Studio의 Gemini API를 통해 테스트할 수 있으며, Gemini Robotics 1.5는 현재 특정 파트너에게만 공개됩니다. 이는 더 광범위한 로봇 기술 혁신 및 애플리케이션 개발을 촉진할 것입니다.
범용 인공지능을 향한 중요한 이정표
구글 딥마인드는 이번 출시를 물리적 세계에서 범용 인공지능(AGI)을 해결하기 위한 중요한 단계로 설명합니다. 능동적인 능력을 도입함으로써 구글은 단순히 명령에 반응하는 모델을 넘어, 진정으로 추론하고, 계획하며, 능동적으로 도구를 사용하고, 일반화할 수 있는 시스템을 만들고 있습니다.
산업 영향 및 미래 전망
이 획기적인 기술은 여러 산업을 재편할 것으로 기대됩니다. 의료 분야에서는 보조 로봇이 다양한 환자 요구에 따라 도움을 제공할 수 있으며, 가정 환경에서는 더욱 스마트한 개인 비서가 될 수 있습니다. 로봇 기술은 아직 초기 단계에 있지만, 이번 출시는 미래가 단순히 더 똑똑한 AI에 관한 것이 아니라, 우리와 함께 살고 행동할 수 있는 AI에 관한 것임을 보여줍니다. 구글 딥마인드가 로봇 기술과 인공지능의 융합을 계속 추진함에 따라, 우리는 가상 지능과 물리적 세계 간의 격차를 더욱 줄이는 더 많은 혁신적인 애플리케이션의 등장을 기대할 수 있습니다.