谷歌机器人首次成功“扣篮”，展现Gemini AI技术惊人适应能力

时间：2025-06-29 09:55

小编：星品数码网

近日，谷歌在人工智能领域取得了一个引人注目的里程碑。在最新的一期播客中，一款搭载Gemini人工智能技术的机器人毫无预警地完成了令人惊艳的“扣篮”动作，显示出其在没有先前特定训练的情况下，强大的学习和适应能力。这一壮举的发生恰逢洛杉矶举办的RSS2025（机器人软件与系统大会）上，谷歌首次进行的现场互动展示，不禁让众多观众为之兴奋。

在大会上，搭载了Gemini Robotics On-Device模型的机器人成为了全场的焦点。AI领域的观察者Ted Xiao发表了对此次展示的看法：“这如同是未来的一次神奇预览。通过简单与机器人进行对话，它能够即时做出适当的反应，并尝试执行众多合理的操作，无论是应对新物体、下达命令还是展示新技能。”

Gemini Robotics On-Device模型于今年6月24日正式发布，这项技术的推出不仅将AI的潜力引入到机器人领域，且极大地提高了机器人的独立性。与早期需要持续互联网连接的模型不同，该模型能够脱离网络，进行高效的本地运算，这对于无缝高效执行任务至关重要。谷歌的X部门特别指出，这是公司首次推出的“视觉-语言-动作”(VLA)模型，旨在促进机器人快速适应新的任务和环境。

在发布之前，另一家名为Figure的公司也推出了历史上具有重大意义的AI更新——Helix模型，这是一款专注明确常规人形机器人的VLA模型。谷歌的Gemini Robotics On-Device模型在这一点上具有无与伦比的优势，它不再依赖于网络数据连接，这一点为处理对延迟高度敏感的应用提供了必要保障，确保机器人在网络不稳定或缺失的环境中也能维护高度的操作稳定性。

回顾早前的开发历程，谷歌在今年3月推出了第一代VLA模型Gemini Robotics，这一突破性进展引入了强大的多模态推理与现实世界理解能力。此次新发布的Gemini Robotics On-Device模型作为双臂机器人的基础模型，显著降低了计算资源的需求，并专注于解决灵巧操作、新任务快速适应以及基于本地运行的低延迟推理三大核心问题。

官方展示的视频中，机械手展示了丰富的能力，它们不仅可以轻松捡起一支笔，更能默契地配合，协同完成拔掉笔盖的细致操作。在随后的任务测试中，机器人根据自然语言指令，成功完成了“放置蓝色砖块”、“拉开中间抽屉”及“归位‘梨’模型”等多项任务，展示出强大的视觉、语义及行为泛化能力。

Gemini Robotics On-Device模型在基础评测中的得分亦相当突出。在泛化能力方面，虽然相较于谷歌的旗舰Gemini Robotics模型略逊一筹，但仍明显超越了之前最好的离线模型。它在处理分布式任务和复杂多步骤指令方面，表现优于市场上其他设备端替代方案。

考虑到日常生活中物品形状、大小、颜色和纹理的多样性，机器人必须具备按需生成智能和新行为的能力，尤其针对那些未曾见过的物品。机器人技术的一个重大挑战在于灵活应对未知情况，而Gemini Robotics On-Device模型则通过仅需50到100次的演示便能迅速适应新任务，展现了其强大的新任务学习与适应能力。

谷歌还将这一创新技术调整并应用到不同的机器人上，如双臂Franka FR3机器人和Apptronik的人形机器人Apollo。在Franka上，Gemini模型不仅能执行通用指令，还能处理之前未见过的物体与场景，包括如折叠衣物等精细任务，以及在工业环境中需要高适应性的皮带组装操作。Apollo人形机器人同样能依赖自然语言指令，以高效的通用方式操控各种物体。

这一系列的技术创新引发了广泛的网友讨论。有人认为，谷歌推出的离线AI机器人将可能改变游戏规则，然而也有人质疑，这与特斯拉机器人的设计到底有何区别，或者与Meta在ylecun的工作相比又有哪些不同。在机器人和具身智能领域，众多大型模型正在展现出技术的多样性与丰富性，共同围绕同一个核心命题进行探讨：如何使得人工智能在复杂的三维物理世界中建立真正的因果认知。

随着Berry-tion和AI技术的不断进步，谷歌的Gemini AI为未来的机器人应用场景，特别是在家庭、工业以及日常生活中，提供了更多可能性与想象空间。这不仅是技术上的一次革命，更是我们生活方式可能迎来的巨大转变。可预见的是，随着各项研究的深入与深化，我们将不断见证科技带来的无穷潜力与期待。

谷歌机器人首次成功“扣篮”，展现Gemini AI技术惊人适应能力

精品推荐

相关文章