2025-04-07T18:02:13.957-04:00

2025年4月7日

📌 **1. 谷歌搜索 AI 模式融合 Gemini 多模态能力，变身视觉搜索专家**
🔗 [原文链接](https://www.androidcentral.com/apps-software/google-assistant/googles-ai-mode-gets-geminis-multimodal-powers)

谷歌近日宣布，其搜索引擎中的 AI 模式（AI Mode）将深度整合强大的 Gemini 模型的 **multimodal**（多模态）能力。这一重要升级旨在显著扩展谷歌搜索的功能边界，使其能够更智能、更全面地理解和响应包含视觉信息的复杂用户查询，从而将 AI 模式打造成一个高效的“视觉搜索专家”。

**核心亮点：**

* **Gemini 多模态能力注入：** 谷歌搜索的 AI 模式现已获得 Gemini 模型处理和理解多种信息格式（包括文本、图像等）的能力。Gemini 作为谷歌最先进的 AI 模型之一，其 **multimodal** 特性是其核心优势，能够跨越不同类型数据进行推理和交互。
* **提升视觉搜索体验：** 此次整合使用户可以直接在 AI 模式下利用图像进行搜索。例如，用户可以上传一张图片，或者直接使用设备的摄像头拍摄，然后围绕该图像提出问题。AI 模式能够理解图像内容，并结合用户的文本问题，提供综合性的回答。这对于识别地标、动植物、商品，或者理解图表、解决基于视觉信息的问题等场景，都将带来革命性的体验提升。
* **一站式回答复杂问题：** 传统的搜索可能需要用户进行多次、分离的文本和图像搜索来拼凑信息。而融合了 Gemini 多模态能力的 AI 模式，目标是实现“一次性回答综合性问题”（answering comprehensive questions in one go）。它能够直接处理图文结合的复杂查询，理解图像细节与文本指令之间的关联，生成更连贯、更丰富的单一答复，大大提高信息获取效率。
* **技术应用与未来方向：** 这项更新不仅是谷歌搜索功能的一次飞跃，也体现了谷歌将前沿 AI 技术（如 **Large Language Models**, **Multimodal AI**）快速应用于核心产品的战略。通过不断增强 AI 模式的能力，谷歌致力于提供更加直观、智能和个性化的搜索服务，满足用户日益增长的复杂信息需求。未来，我们可以期待 AI 在理解世界、与用户交互方面扮演越来越重要的角色。

此次升级标志着谷歌搜索在智能化道路上又迈出了坚实的一步，将 **multimodal** AI 的力量带给了亿万用户，预示着未来搜索将更加依赖于 AI 对多种信息格式的综合理解能力。

作者kelvin

作者 kelvin

相关文章

2025-04-13T06:23:44.946-04:00

2025-04-13T06:23:44.423-04:00

2025-04-11T08:02:10.282-04:00

发表回复取消回复

You missed