网站首页 > 市场观察 > 行业动态
谷歌放大招:Gemini Robotics-ER 1.5上线!
发布时间:2025-10-12

26268422-SRmMwM.jpg?auth_key=1760284799-

近日,谷歌放出了其最先进的机器人具身推理模型——Gemini Robotics-ER 1.5。这是首个被广泛开放给所有开发者的Gemini机器人系列模型,它将作为机器人的高级推理大脑。


Gemini Robotics-ER 1.5(简称 Gemini Robotics-Embodied Reasoning)是一种视觉-语言模型 (VLM),可将 Gemini 的智能体功能引入机器人技术领域。Gemini Robotics-ER 1.5 是一款思考型模型,能够推理物理世界、原生调用工具,并规划逻辑步骤来完成任务。


01


|Gemini Robotics-ER 1.5 有哪些新本事?

这是谷歌专门为机器人打造的AI模型升级版,更聪明、更灵活、更安全,能让机器人“听懂话、看懂事、做对事”。


1. 空间感更强,指哪打哪

像人一样“看懂”周围环境,能快速判断:哪些东西能拿起来?哪些太重或放不稳?能精准生成2D坐标点,比如你说:“把能拿的东西都指出来”,它能准确一个个指出来。而且反应很快,用的是轻量级的 Gemini Flash 模型,延迟低,不卡顿。


2. 能规划复杂任务,像人一样“动手+动脑”

可以完成需要“多步操作”的长任务,比如:“照着这张照片,把我的书桌重新整理一遍”不仅能看,还能想怎么搬、先放哪、后放哪,一步步规划清楚。还能“联网+调功能”,需要查资料?直接调用谷歌搜索。要分类垃圾?能调用本地垃圾分类规则等第三方程序。


3. 灵活控制“思考时间”

开发者可以自己调节要快,还是要更准?复杂任务(比如组装机器人),让AI“多想一会儿”,结果更靠谱。简单任务(比如指个物体),要求“立刻响应”,不耽误事。就像人做事:重要的事多思考,小事秒反应。


4. 更安全,不做“做不到的事”

新增了“安全过滤器”,能识别不现实的指令。比如:“举起一辆汽车”——机器人举不动,AI会直接说“不行”。“穿过一堵墙”——违反物理规律,AI也会拒绝。避免机器人瞎执行、出事故,让开发者用得更安心。


02


|机器人的“超级大脑”

Gemini Robotics-ER 1.5 不只听命令,还能真正理解复杂的指令,比如你说:“把桌子收拾干净”,它不会傻愣着,而是会自动拆解任务,先判断桌上有什么——书、杯子、纸屑……哪些要收,哪些要扔。


制定行动计划,先拿杯子,再放书,最后清理垃圾。调用合适的工具,控制机械臂的硬件。启动专门的“抓东西”AI模型。使用“看图说话+动作控制”的VLA模型来精准操作。整个过程一气呵成,像人一样“边看边想边做”。


机器人要在真实世界干活,必须“看得准、指得对”。Gemini Robotics-ER 1.5 特别擅长这一点:它能精确判断物体的位置,生成准确的2D坐标(就像地图上的定位点)。比如你让机器人“指一下那个水杯”,它能精准指向杯子把手或中心位置,误差极小。目前,在所有视觉语言模型中,它的指向精度是最高的。


简单说:有了这个“大脑”,机器人不再只是执行死命令的机器,而是能理解、规划、精准操作的智能助手,离“听话好用”的目标又近了一大步。


26268422-eXZUed.jpg?auth_key=1760284799-


03


|机器人行业的未来方向:用AI走向“具身智能”

头部公司的一举一动,都指向一个大趋势:未来的机器人,必须自己有“大脑”——自研AI模型,是通往通用智能的必经之路。真正能走远的,只会是极少数具备以下能力的企业。全链条技术能力(从硬件到软件全都能做)。能整合芯片、算法、数据等资源。有长期投入的耐心和战略。


“大脑+小脑”,才是下一代机器人。现在的机器人行业,已经不再只靠“写死程序”来控制动作了。大家正转向用大模型来突破传统控制的瓶颈,比如:用大语言模型理解人类指令;借自动驾驶模型感知环境;靠多模态模型融合视觉、语音、动作。


行业重点也变了:从“单个动作”转向打造“大脑(决策)+小脑(协调)”的智能系统。


谁能胜出?未来,只有极少数技术全面、布局深远的公司,才能把各种技术“收拢”成一套标准,真正定义什么是“具身智能”——也就是:能理解世界、自主学习、灵活行动的通用机器人。


一句话,没有AI大脑的机器人,未来只能算“机器”;有大脑的,才叫“智能体”。


这场竞赛,才刚刚开始。


04


竞泰观察|三条主线,抓住“机器人智能”红利

1. 关注机器人本体厂商的“AI升级”机会

已有硬件+接入Gemini ER = 智能跃升。利好:服务机器人(家庭、医疗、清洁);工业协作机器人(如优必选、埃斯顿、节卡);自动驾驶公司(同样需要物理推理能力)。


2. 布局“AI+机器人”中间件与平台公司

ER 1.5是“大脑”,还需要“神经系统”来连接硬件。关注:ROS(机器人操作系统)生态企业;机器人中间件、仿真平台、AI集成服务商。


3. 长期押注“具身智能”应用场景

家庭助理机器人:“帮我找钥匙、热饭、关窗”;医疗护理机器人:“协助老人起坐、递药”;仓储物流机器人:“自主分拣、应对异常包裹”。哪些场景最需要“高级推理”就最可能率先爆发。


统一服务热线:
18117862238
邮箱地址:yumiao@jt-capital.com.cn
公司地址:成都市高新区泰合·国际金融中心18层

Copyright © 2021 jt-capital.com.cn All Rights Reserved 

版权所有: 竞泰资本 粤ICP备2022003949号-1  

快速链接

Copyright © 2021 jt-capital.com.cn All Rights Reserved 

版权所有: 竞泰资本 粤ICP备2022003949号-1