今天是2025年3月12日,以下是最新的AI行业新闻。
📌 **1. 谷歌 DeepMind 发布新型 AI 模型,赋能机器人无训练执行物理任务**
🔗 [原文链接](https://www.theverge.com/news/628021/google-deepmind-gemini-robotics-ai-models)
谷歌(Google)旗下的人工智能研究实验室 DeepMind 近日推出了两款创新性 AI 模型,旨在显著扩展机器人在现实世界中执行任务的能力范围,即使在未经过针对性训练的情况下也能应对新挑战。
其中一款核心模型名为 **Gemini Robotics**。这是一款先进的 **视觉-语言-行动 (vision-language-action) 模型**。它的关键优势在于能够理解全新的情境和指令,即便这些情境并未包含在其原始训练数据中。这意味着机器人可以基于对环境的实时视觉理解和自然语言指令,生成合适的行动策略,展现出更强的泛化能力和适应性。
根据报道,Gemini Robotics 不仅提升了机器人的“理解力”,还显著增强了其**物理操作的灵巧性 (dexterity)**。例如,搭载该模型的机器人能够执行更精密的任务,如准确无误地折叠一张纸。这表明该模型能更好地协调视觉感知与精细运动控制,是实现通用物理交互能力的重要一步。
这两款模型的发布,标志着 AI 技术在 **Embodied AI(具身智能)** 领域取得了重要进展。通过让 AI 更深入地理解物理世界并与之交互,谷歌 DeepMind 正在为开发出更智能、更通用、能在复杂现实环境中自主工作的机器人铺平道路。这对于制造业、物流、家庭服务乃至更广泛的自动化应用都具有深远的影响。这些模型的进步,预示着机器人将不再仅仅是执行预设程序的机器,而是能够真正理解环境、适应变化并解决实际问题的智能体。