今天是2025年3月13日,以下是最新的AI行业新闻。

📌 **1. 谷歌 DeepMind 推出新型 AI 模型,使机器人无需专门训练即可执行物理任务**
🔗 [原文链接](https://www.theverge.com/news/628021/google-deepmind-gemini-robotics-ai-models)

谷歌 DeepMind 近日发布了两款旨在显著提升机器人执行现实世界任务能力的新型 AI 模型。其中,名为 **Gemini Robotics** 的模型尤为引人注目,它是一种先进的 **视觉-语言-行动 (vision-language-action, VLA)** 模型。

这款模型的关键突破在于其强大的 **泛化能力**。即使机器人先前没有针对特定任务或环境进行过专门训练 (training),Gemini Robotics 也能让它理解新的指令和情境,并自主规划和执行相应的物理操作。这意味着机器人不再仅仅局限于预设的程序化任务,而是能够更灵活地适应多变的环境和处理未知的挑战。

报告指出,Gemini Robotics 不仅能理解自然语言指令(例如,“请把那个苹果递给我”),还能结合视觉信息(识别桌上的苹果)并转化为具体的行动序列(规划路径、伸出机械臂、抓取苹果、递送)。这种 VLA 范式被认为是实现更通用、更有能力的机器人的关键技术路径。

此外,DeepMind 同时推出了另一项技术,旨在帮助机器人建立 **“道德罗盘” (moral compass)**,虽然具体细节未在摘要中详述,但这表明谷歌在推动机器人能力的同时,也在关注其安全和伦理规范。

这些新模型的发布,标志着 AI 技术在赋能物理实体(机器人)方面取得了重要进展,推动了机器人从高度结构化环境走向更复杂、动态的现实世界应用的步伐。这对于制造业、物流、家庭服务乃至更广泛的领域都可能产生深远影响,进一步模糊了数字智能与物理世界之间的界限。这展示了 AI 不仅能在虚拟世界处理信息,更能延伸到物理世界,通过 **Reinforcement Learning** 等技术不断学习和优化,完成更复杂的任务。

作者 kelvin

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注