2025年4月7日

📌 1. **谷歌AI模式新增图像理解与搜索功能**
🔗 [原文链接](https://www.theverge.com/news/644363/google-search-ai-mode-multimodal-lens-image-recognition)

谷歌(Google)正在为其以搜索为核心的 AI Mode 聊天机器人(chatbot)添加多模态(multimodal)能力。这意味着该 AI 工具现在不仅能处理文本,还能“看见”并理解图像内容,并回答用户基于图像提出的问题。

这项重大更新利用了先进的图像识别(image recognition)技术,允许 AI Mode 分析用户上传的图片,或者通过设备摄像头实时捕捉的视觉信息。用户可以简单地向 AI 展示一张图片,然后提问,例如“这是什么品种的花?”或“帮我找到类似的这种款式的鞋子”。AI Mode 将会结合其庞大的知识库和对图像的理解,提供相关的搜索结果、信息摘要或直接的答案。

此功能类似于 Google Lens 的能力,但将其深度整合到了对话式的 AI 搜索体验中。这标志着谷歌搜索朝着更加直观、更加符合人类自然交互方式的方向迈出了重要一步。用户不再局限于使用文字描述他们想要搜索的事物,可以直接通过视觉输入与 AI 进行更深层次、更高效的互动。此次更新显著扩展了 AI Mode 的应用场景,从简单的问答到更复杂的视觉信息检索和分析,为用户提供了更强大的工具来探索和理解世界。这项多模态能力的加入,预计将进一步提升谷歌在 AI 搜索领域的竞争力,并可能引领搜索引擎交互模式的新趋势。它也反映了当前 AI 发展的一个重要方向,即融合多种信息模式以提供更全面、更智能的服务。

作者 kelvin

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注