2025-04-08T00:02:42.224-04:00

今天是2025年3月12日，以下是最新的AI行业新闻。

📌 **1. 谷歌 DeepMind 发布新型 AI 模型，赋能机器人无训练执行物理任务**
🔗 [原文链接](https://www.theverge.com/news/628021/google-deepmind-gemini-robotics-ai-models)

谷歌（Google）旗下的人工智能研究实验室 DeepMind 近日推出了两款创新性 AI 模型，旨在显著扩展机器人在现实世界中执行任务的能力范围，即使在未经过针对性训练的情况下也能应对新挑战。

其中一款核心模型名为 **Gemini Robotics**。这是一款先进的 **视觉-语言-行动 (vision-language-action) 模型**。它的关键优势在于能够理解全新的情境和指令，即便这些情境并未包含在其原始训练数据中。这意味着机器人可以基于对环境的实时视觉理解和自然语言指令，生成合适的行动策略，展现出更强的泛化能力和适应性。

根据报道，Gemini Robotics 不仅提升了机器人的“理解力”，还显著增强了其**物理操作的灵巧性 (dexterity)**。例如，搭载该模型的机器人能够执行更精密的任务，如准确无误地折叠一张纸。这表明该模型能更好地协调视觉感知与精细运动控制，是实现通用物理交互能力的重要一步。

这两款模型的发布，标志着 AI 技术在 **Embodied AI（具身智能）** 领域取得了重要进展。通过让 AI 更深入地理解物理世界并与之交互，谷歌 DeepMind 正在为开发出更智能、更通用、能在复杂现实环境中自主工作的机器人铺平道路。这对于制造业、物流、家庭服务乃至更广泛的自动化应用都具有深远的影响。这些模型的进步，预示着机器人将不再仅仅是执行预设程序的机器，而是能够真正理解环境、适应变化并解决实际问题的智能体。

作者kelvin

作者 kelvin

相关文章

2025-04-13T06:23:44.946-04:00

2025-04-13T06:23:44.423-04:00

2025-04-11T08:02:10.282-04:00

发表回复取消回复

You missed