2025年4月5日 📌 **1. 谷歌发布 Gemini Robotics AI 模型,赋能机器人进入物理世界** 🔗 [原文链接](https://www.wired.com/story/googles-gemini-robotics-ai-model-that-reaches-into-the-physical-world/) / [补充链接](https://www.theverge.com/news/628021/google-deepmind-gemini-robotics-ai-models) 谷歌 DeepMind 近日推出了两款旨在帮助机器人执行更广泛真实世界任务的新型 AI 模型。其中,**Gemini Robotics** 是一款先进的 **vision-language-action (VLA) model**,它赋予机器人更强的智能和环境理解能力,即使在面对未经专门训练的新情境时,也能进行理解和决策。 该模型不仅提升了机器人的认知能力,还显著增强了其物理操作的灵活性和精确度,使其能够完成如折纸、整理物品等更精细的任务。Gemini Robotics 的目标是让机器人能够更好地理解模糊指令(例如“清理这里的混乱”),并将其分解为可执行的步骤。此外,谷歌还强调了其为机器人设计的“道德指南”工具,旨在确保机器人在执行任务时遵循安全和伦理原则。谷歌表示,目前正与 Agility Robotics、Boston Dynamics 等多家知名机器人公司合作,将 Gemini Robotics 技术整合到它们的人形机器人和腿式机器人中,推动 AI 在物理世界中的实际应用。 📌 **2. 微软推出具备“深度推理”能力的 Copilot AI Agents** 🔗 [原文链接](https://www.theverge.com/microsoft/636089/microsoft-365-copilot-reasoning-ai-agents) / [安全领域链接](https://www.theverge.com/news/634598/microsoft-security-copilot-ai-agents) 微软宣布为其 Microsoft 365 Copilot 增加了具备“深度推理”(deep reasoning)能力的新型 **AI agents**,旨在处理更复杂、多步骤的任务。首批推出的两个 agent 分别是 **Researcher** 和 **Analyst**。 **Researcher** agent 能够根据用户提示,自主进行深入的网络研究,整合来自多个可信来源的信息,并生成包含完整引用的详细报告。它能理解研究目标,规划搜索策略,并评估信息质量,最终交付结构化的研究成果。 **Analyst** agent 则专注于数据分析。它可以接收复杂的数据集(如 Excel 表格),理解用户的分析请求(即使表述模糊),执行多步数据清洗、计算和可视化操作,并最终生成包含图表和关键洞察的分析报告。 此外,微软还发布了针对网络安全领域的 **Security Copilot agents**。这些 agent 被设计用来自动化处理安全团队面临的大量警报和事件,例如自主分析钓鱼邮件、处理数据丢失警报、逆向工程恶意软件等,从而减轻安全人员的负担,提高响应效率。这些具备推理和自主行动能力的 AI agents 代表了 AI 从简单的问答和文本生成向更复杂的任务执行和问题解决能力演进的重要方向。 📌 **3. 亚马逊 AGI Lab 展示首个成果:高级 AI Agents 刷新网络任务性能记录** 🔗 [原文链接](https://www.wired.com/story/amazon-ai-agents-nova-web-browsing/) 亚马逊低调成立的 **AGI (Artificial General Intelligence)** 实验室公布了其首项研究成果:一系列在执行复杂网络任务方面表现出色的高级 **AI agents**。该实验室由前 OpenAI 高管领导,专注于提升下一代软件 agent 的决策制定能力,并借鉴了物理机器人的研究思路。 其最新发布的 **Nova agent** 在一项名为 **Mind2Web** 的基准测试中取得了破纪录的成绩。Mind2Web 旨在评估 AI agent 在真实网站上根据自然语言指令完成复杂多步骤任务的能力,例如“预订从旧金山到洛杉矶的最便宜航班”或“将这双鞋添加到我的购物车”。Nova agent 在这项测试中的表现超越了包括 OpenAI 的 GPT-4o 在内的所有现有模型。 亚马逊的研究人员指出,他们采用了类似于训练物理机器人的方法来训练这些 web agent,使其能够更好地理解网络环境的结构和动态变化,并进行有效的规划和行动。这项成果表明亚马逊在通用人工智能和自主智能体领域取得了显著进展,其开发的 AI agents 有望在未来处理更广泛、更复杂的在线任务,提升自动化水平。 📌 **4. Databricks 推出新技巧,让 AI 模型能够自我改进** 🔗 [原文链接](https://www.wired.com/story/databricks-has-a-trick-that-lets-ai-models-improve-themselves/) 帮助大型企业构建定制化 AI 模型的公司 Databricks 开发出一种 **machine learning**(机器学习)新技巧,可以在不需要大量高质量、精标数据的情况下提升 AI 模型的性能。这项技术结合了近期 **Reinforcement Learning from AI Feedback (RLAIF)** 和 **Constitutional AI** 等多项创新。 传统上,提升大型语言模型(LLM)的性能通常需要通过 **Reinforcement Learning from Human Feedback (RLHF)**,即依赖人类标注员提供大量反馈数据来微调模型。然而,这个过程成本高昂且耗时。Databricks 的新方法利用 AI 模型自身或其他 AI 模型来生成反馈信号,指导模型的学习和优化过程。 通过 RLAIF,一个 AI 模型可以评估另一个 AI 模型生成的输出质量,并提供反馈。结合 Constitutional AI 的原则(即预先设定一套指导模型行为的规则或“宪法”),系统可以引导模型在自我改进的过程中遵循特定的伦理和安全准则。这种方法使得企业即使在数据不完美或标注资源有限的情况下,也能持续提升其定制 AI 模型的“智商”和表现,降低了高质量 AI 模型开发的门槛。

作者kelvin

4 月 6, 2025

2025年4月5日

📌 **1. 谷歌发布 Gemini Robotics AI 模型,赋能机器人进入物理世界**
🔗 [原文链接](https://www.wired.com/story/googles-gemini-robotics-ai-model-that-reaches-into-the-physical-world/) / [补充链接](https://www.theverge.com/news/628021/google-deepmind-gemini-robotics-ai-models)

谷歌 DeepMind 近日推出了两款旨在帮助机器人执行更广泛真实世界任务的新型 AI 模型。其中,**Gemini Robotics** 是一款先进的 **vision-language-action (VLA) model**,它赋予机器人更强的智能和环境理解能力,即使在面对未经专门训练的新情境时,也能进行理解和决策。

该模型不仅提升了机器人的认知能力,还显著增强了其物理操作的灵活性和精确度,使其能够完成如折纸、整理物品等更精细的任务。Gemini Robotics 的目标是让机器人能够更好地理解模糊指令(例如“清理这里的混乱”),并将其分解为可执行的步骤。此外,谷歌还强调了其为机器人设计的“道德指南”工具,旨在确保机器人在执行任务时遵循安全和伦理原则。谷歌表示,目前正与 Agility Robotics、Boston Dynamics 等多家知名机器人公司合作,将 Gemini Robotics 技术整合到它们的人形机器人和腿式机器人中,推动 AI 在物理世界中的实际应用。

📌 **2. 微软推出具备“深度推理”能力的 Copilot AI Agents**
🔗 [原文链接](https://www.theverge.com/microsoft/636089/microsoft-365-copilot-reasoning-ai-agents) / [安全领域链接](https://www.theverge.com/news/634598/microsoft-security-copilot-ai-agents)

微软宣布为其 Microsoft 365 Copilot 增加了具备“深度推理”(deep reasoning)能力的新型 **AI agents**,旨在处理更复杂、多步骤的任务。首批推出的两个 agent 分别是 **Researcher** 和 **Analyst**。

**Researcher** agent 能够根据用户提示,自主进行深入的网络研究,整合来自多个可信来源的信息,并生成包含完整引用的详细报告。它能理解研究目标,规划搜索策略,并评估信息质量,最终交付结构化的研究成果。

**Analyst** agent 则专注于数据分析。它可以接收复杂的数据集(如 Excel 表格),理解用户的分析请求(即使表述模糊),执行多步数据清洗、计算和可视化操作,并最终生成包含图表和关键洞察的分析报告。

此外,微软还发布了针对网络安全领域的 **Security Copilot agents**。这些 agent 被设计用来自动化处理安全团队面临的大量警报和事件,例如自主分析钓鱼邮件、处理数据丢失警报、逆向工程恶意软件等,从而减轻安全人员的负担,提高响应效率。这些具备推理和自主行动能力的 AI agents 代表了 AI 从简单的问答和文本生成向更复杂的任务执行和问题解决能力演进的重要方向。

📌 **3. 亚马逊 AGI Lab 展示首个成果:高级 AI Agents 刷新网络任务性能记录**
🔗 [原文链接](https://www.wired.com/story/amazon-ai-agents-nova-web-browsing/)

亚马逊低调成立的 **AGI (Artificial General Intelligence)** 实验室公布了其首项研究成果:一系列在执行复杂网络任务方面表现出色的高级 **AI agents**。该实验室由前 OpenAI 高管领导,专注于提升下一代软件 agent 的决策制定能力,并借鉴了物理机器人的研究思路。

其最新发布的 **Nova agent** 在一项名为 **Mind2Web** 的基准测试中取得了破纪录的成绩。Mind2Web 旨在评估 AI agent 在真实网站上根据自然语言指令完成复杂多步骤任务的能力,例如“预订从旧金山到洛杉矶的最便宜航班”或“将这双鞋添加到我的购物车”。Nova agent 在这项测试中的表现超越了包括 OpenAI 的 GPT-4o 在内的所有现有模型。

亚马逊的研究人员指出,他们采用了类似于训练物理机器人的方法来训练这些 web agent,使其能够更好地理解网络环境的结构和动态变化,并进行有效的规划和行动。这项成果表明亚马逊在通用人工智能和自主智能体领域取得了显著进展,其开发的 AI agents 有望在未来处理更广泛、更复杂的在线任务,提升自动化水平。

📌 **4. Databricks 推出新技巧,让 AI 模型能够自我改进**
🔗 [原文链接](https://www.wired.com/story/databricks-has-a-trick-that-lets-ai-models-improve-themselves/)

帮助大型企业构建定制化 AI 模型的公司 Databricks 开发出一种 **machine learning**(机器学习)新技巧,可以在不需要大量高质量、精标数据的情况下提升 AI 模型的性能。这项技术结合了近期 **Reinforcement Learning from AI Feedback (RLAIF)** 和 **Constitutional AI** 等多项创新。

传统上,提升大型语言模型(LLM)的性能通常需要通过 **Reinforcement Learning from Human Feedback (RLHF)**,即依赖人类标注员提供大量反馈数据来微调模型。然而,这个过程成本高昂且耗时。Databricks 的新方法利用 AI 模型自身或其他 AI 模型来生成反馈信号,指导模型的学习和优化过程。

通过 RLAIF,一个 AI 模型可以评估另一个 AI 模型生成的输出质量,并提供反馈。结合 Constitutional AI 的原则(即预先设定一套指导模型行为的规则或“宪法”),系统可以引导模型在自我改进的过程中遵循特定的伦理和安全准则。这种方法使得企业即使在数据不完美或标注资源有限的情况下,也能持续提升其定制 AI 模型的“智商”和表现,降低了高质量 AI 模型开发的门槛。

作者 kelvin

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注