谷歌推出Gemini Robotics On-Device 模型强化离线灵巧操作能力

时间：2025-06-27 05:15

小编：星品数码网

近日，谷歌公司推出了其最新的视觉-语言-动作（VLA）集成模型——Gemini Robotics On-Device，标志着机器人工具进步的重要一步。这款模型专为实现灵巧操作和高效任务泛化能力而设计，使机器人在各种应用场景中能够灵活应对多样化的任务需求，尤其是在数据网络不稳定或完全失联的情况下，依然能够稳定运行。

强大的离线智能能力

Gemini Robotics On-Device模型的最大亮点是它不依赖实时数据网络。在当今这个越来越依赖连接的世界中，机器人的运行经常受到网络条件限制的影响。谷歌认识到这一点，因此设计出了Gemini Robotics On-Device，使其可以在“断网”或网络速度变慢的情况下依然表现出色。这种能力极大地扩展了机器人在各种复杂和不稳定环境中的应用潜能，如灾后救援、户外作业甚至家庭服务。

模型在具备出色的视觉、语义理解以及行为适应能力的同时，能够理解自然语言指令，从而完成诸如拉开拉链、折叠衣物等需要高灵巧度的任务。这些功能使得搭载Gemini Robotics On-Device的机器人在多种日常生活场景下都有了广泛的应用前景，例如家庭清洁、衣物整理甚至简单的烹饪过程。

灵活的任务适应性

除了离线运行的优势外，Gemini Robotics On-Device还具备卓越的微调能力，可以通过少量的样本迅速适配新任务。谷歌的研究表明，仅需50到100个示范样本，模型就能展现出良好的任务泛化能力。这种微调能力为开发者和工程师提供了极大的便利，使他们能够根据具体情况快速调整模型以提高效果。多年来，安卓系统的开放架构使得无数开发者能在其上进行扩展和定制，而Gemini Robotics On-Device继承了这一本质，提供了令人期待的灵活性与创造性机会。

多样化的应用场景和测试

在实际测试中，Gemini Robotics On-Device经过多种操作场景的严格验证，成功在七种不同难度级别的灵巧操作任务中表现出色。这些任务包括：拉上便当盒的拉链、从一堆物品中抽取卡片以及倒沙拉酱等操作。这些任务不仅测试了机器人对复杂指令的理解能力，还验证了其在高灵巧度操作中的表现。

谷歌还将这一模型成功适配于多个机械实体上，包括Franka FR3双臂机器人和Apollo人形机器人。在双臂Franka机器人上，Gemini Robotics On-Device能够处理各种早前未见的物体和场景，同时执行诸如折叠衣物等需要高精度和灵巧性的复杂任务。Apollo人形机器人也经过适应性调整，能够理解和执行与其形态和功能特点相匹配的操作。

面向未来的机器人技术

Gemini Robotics On-Device的推出不仅为当前机器人市场注入了新鲜血液，也为未来的发展指明了方向。随着人工智能与机器人技术的不断融合，未来我们将看到更加智能、灵活并且适应性强的机器人设备。那些在高度依赖网络环境中的机器人终将面临瓶颈，而那些能够独立、智能操作的设备才具备在复杂环境中生存和发展的能力。

凭借出色的视觉识别、语义理解及高效的微调能力，Gemini Robotics On-Device极可能成为新一代智能机器人的标准配置。这些智能设备不仅将在工业生产、家居服务等领域大力推广，也将深刻改变我们的生活方式，提高人类工作与生活的效率。

在不久的未来，我们期待看到更多搭载Gemini Robotics On-Device的机器人出现在我们的生活中，帮助我们处理更为复杂的任务，提升生活质量，推动社会的进步。随着技术的不断演化，未来的机器人将会更加智能、高效，彻底改变我们对机器人的传统认知。