2025年4月5日
📌 1. **OpenAI 将由 GPT-4o 驱动的 Sora 集成至 ChatGPT**
🔗 [原文链接](https://www.theverge.com/openai/635118/chatgpt-sora-ai-image-generation-chatgpt)
OpenAI 近日宣布了一项重要更新:将其先进的文生图模型 Sora 的图像生成能力直接集成到了其广受欢迎的聊天机器人 ChatGPT 中。这项新功能被命名为“ChatGPT 中的图像”(Images in ChatGPT),标志着 OpenAI 在多模态(multimodal)AI 应用方面迈出了重要一步。
此前,Sora 主要通过一个独立的网站或特定接口供部分早期测试者和创意专业人士使用。用户需要离开 ChatGPT 环境才能利用 Sora 的强大图像生成能力。而现在,通过这次整合,用户可以直接在 ChatGPT 的对话界面内,使用简单的文本提示(prompts)来调用 Sora 模型生成高质量、富有创意和细节的图像。
本次集成由 OpenAI 最新的旗舰模型 GPT-4o 提供底层支持。GPT-4o 不仅在文本理解和生成方面表现出色,更在多模态任务处理上进行了优化,能够更好地理解用户的视觉创作意图,并驱动 Sora 生成符合要求的图像。这意味着用户可以在与 ChatGPT 的自然语言交互中无缝地请求和讨论图像内容。
OpenAI 特别强调,新集成的 Sora 在图像中的文本渲染(text rendering)能力上有了显著提升。这是以往许多 AI 图像生成工具面临的挑战之一,即难以准确地在图片中生成清晰、正确的文字。改进后的 Sora 能够更可靠地处理包含文字元素的图像生成请求,例如生成带有特定标语的海报、包含文字注释的图表或带有品牌名称的产品渲染图等。
这项整合极大地简化了用户的创作流程。无论是设计师寻找灵感、营销人员制作宣传材料、教育工作者创建教学图示,还是普通用户想要将想法可视化,现在都可以在同一个 ChatGPT 界面内完成从文本构思到视觉呈现的闭环。用户可以要求 ChatGPT 根据一段故事描述生成插画,或者基于讨论的技术细节创作原理图,甚至迭代修改已生成的图像。
此次更新是 OpenAI 持续推进其 AI 技术普及化和易用性战略的关键举措。通过将顶尖的 Sora 模型集成到拥有庞大用户基础的 ChatGPT 平台,OpenAI 不仅为用户提供了更丰富、更强大的交互体验,也有望进一步激发 AI 在创意设计、内容生产等多个领域的应用潜力,巩固其在生成式 AI 领域的领先地位。