自2023年3月推出以来,Microsoft
的 Bing Image Creator
一直是免费 AI
图像生成领域的活跃参与者。近期,Microsoft
再次升级其服务,宣布将 OpenAI
最新的 GPT-4o
模型集成到 Bing Image Creator
中,并同样提供免费访问。这一举措使用户在原有的 DALL-E 3
模型之外,拥有了另一个更强大的创作选项。
从 DALL-E 3 到 GPT-4o:不仅是质量提升
根据官方声明,GPT-4o
模型在图像生成质量上实现了“重大飞跃”,尤其在照片真实感、细节渲染以及对复杂提示词的理解上表现更佳。这得益于 GPT-4o
的原生多模态架构,它不像 DALL-E 3
那样将语言理解和图像生成作为独立步骤处理,而是在同一个认知过程中完成。这种集成处理方式,使其能够更准确地在图像中渲染文字或处理包含精细元素的复杂场景。
尽管 GPT-4o
带来了质量上的显著提升,但这种提升也伴随着时间成本。由于模型需要处理更复杂的细节,使用 GPT-4o
生成图像通常比 DALL-E 3
耗时更长。考虑到这一点,Microsoft
选择保留 DALL-E 3
模型作为一个“快速且选项更多”的替代方案,用户可以在创作界面一键切换。这种双模型并行的策略,显然是为了平衡高级用户对极致质量的追求和普通用户对生成效率的需求。
免费背后的市场布局
在 AI
工具普遍采用订阅付费制的当下,Bing Image Creator
坚持提供免费服务,包括每天15次快速生成额度(超出后可用积分兑换或使用标准速度无限次生成),显得尤为突出。相比之下,要在 ChatGPT
中使用 DALL-E 3
或 GPT-4o
的高级功能,用户通常需要每月支付20美元订阅 ChatGPT Plus
。
Microsoft
的慷慨并非没有目的。通过将 GPT-4o
这样的前沿技术免费提供给大众,Microsoft
旨在将其 Bing
搜索引擎、Edge
浏览器和 Copilot
助手,从单纯的信息检索工具,转变为一个覆盖搜索、问答和内容创作的综合性AI平台。此举可以有效吸引并留住用户,增强其在与 Google
竞争中的生态优势。用户可以通过 bing.com/create
网站、Bing
移动应用,甚至直接在 Edge
浏览器的地址栏中调用这项功能。
实际应用中的表现
Microsoft
也展示了新模型的实际创作能力。例如,以下两个由用户提供的提示词,展示了 GPT-4o
在不同风格和主题下的表现。
- 提示词: “一条巨大的锦鲤在云层中穿梭,周围漂浮着灯笼,背景是一弯新月——梦幻般的柔和色调,写实风格”
- 提示词: “一幅精美、方形、细节丰富、优雅、现代的科学信息图,标题为‘月相’,包含每个阶段的插图和星空背景”
此次 Bing Image Creator
的更新,不仅为免费用户带来了更前沿的 AI
工具,也揭示了 Microsoft
希望通过整合旗下产品、降低前沿技术使用门槛的方式,在 AI
时代的应用层竞争中占据更有利的位置。