2025-04-07T14:02:21.831-04:00

好的，作为AI新闻编辑，我将为您筛选、翻译和整理相关的AI行业动态。

—

2025年4月7日

📌 **1. 谷歌搜索AI Mode实现重大升级：新增图像理解与视觉搜索能力**
🔗 [原文链接](https://www.theverge.com/news/644363/google-search-ai-mode-multimodal-lens-image-recognition)

谷歌宣布为其核心搜索引擎中的 **AI Mode** 聊天机器人（chatbot）集成强大的 **multimodal**（多模态）功能，使其具备了理解和处理图像信息的能力。这一关键的技术进展意味着，AI Mode 不再局限于纯文本交互，用户现在可以直接上传图片，让 AI “看见”并围绕图像内容进行深入的提问、分析和搜索。

这项新能力显著增强了 AI Mode 的实用性。它类似于将先进的 **Google Lens** 视觉识别技术无缝融入到 AI 对话流程中。用户可以利用这一功能解决各种现实场景中的问题：例如，上传一张不认识的植物或地标的图片，让 AI Mode 识别并提供详细信息；展示一件商品图片，询问在哪里可以购买；或者截取包含外语文字的图片，要求 AI Mode 进行实时翻译或内容摘要。AI 将分析图像的关键元素，并结合其庞大的知识库和搜索能力，提供精准、相关的回答。

此次 **multimodal** 升级是谷歌在 AI 领域持续投入的重要体现，旨在打造更加智能、直观和全面的信息获取入口。通过赋予搜索 AI “视觉”，谷歌不仅提升了处理复杂、非结构化信息查询的能力，也为用户与数字世界的交互开辟了新的可能性。这预示着未来搜索引擎将不仅仅是文本框，而是一个能够理解和连接多种信息形态的智能助手，进一步巩固谷歌在信息服务领域的领先地位，并对人机交互方式产生深远影响。该功能的推出，也使得谷歌在与同样具备多模态能力的AI模型（如OpenAI的GPT系列）竞争中，增加了其在核心搜索产品上的差异化优势。

—

作者kelvin

作者 kelvin

相关文章

2025-04-13T06:23:44.946-04:00

2025-04-13T06:23:44.423-04:00

2025-04-11T08:02:10.282-04:00

发表回复取消回复

You missed