在人工智能领域竞争日趋白热化的当下,OpenAI 强势出击,一口气发布两款 “推理” 模型及一款开源 AI 代理,试图稳固其在行业中的领先地位。
此次 OpenAI 推出的新模型包括全尺寸版本的 o3 模型(OpenAI 自诩为最先进的 AI 系统)以及更小却更高效的 o4 - mini 模型。同时,名为 Codex CLI 的开源代码编写代理也闪亮登场,这可是 OpenAI 自2019年以来首次推出的重要开源工具。
OpenAI 总裁 Greg Brockman 宣称:“这些模型是首批获顶尖科学家认可,能提出真正优秀且实用创新想法的模型。” 这些新模型一经推出,便立即供付费的 ChatGPT Plus 和 Pro 服务用户,以及使用其面向企业的 Teams 和 API 产品的组织使用。
然而,OpenAI 此番动作实则是在重重压力之下的奋力一搏。今年早些时候,中国的 DeepSeek 横空出世,打破了人们对美国人工智能实验室多年技术优势的固有认知。
DeepSeek 的 R1 不仅是 “思路链” 推理,而且它还是开放模型,人们可免费下载并轻松定制,这使得众多企业更倾向于部署此类开源模型。与之形成鲜明对比的是,OpenAI 的多数模型只能通过专有 API 付费访问。
与此同时,OpenAI 还要应对来自其他专有模型提供商的激烈竞争。今年 2 月,人工智能公司 Anthropic 率先推出能将快速直觉式回答与 “思路链” 逐步推理能力相结合的模型,这种决定何时推理、何时快速回答的能力,OpenAI 至今尚未企及。
上个月,谷歌推出的 Gemini 2.5 Pro 模型更是在多个基准测试中战胜了 OpenAI 的 o3 - mini 模型。
面对如此严峻的形势,周三 OpenAI 全力开启反击。公司宣称其 o3 和 o4 - mini 模型在各类基准测试中名列前茅,只不过这些结果尚未得到独立验证。此外,这两款模型具备自主使用网页浏览和编码环境等其他软件工具的能力,无需用户特别提示。
在 o3 功能演示直播中,研究人员展示了 o3 分析物理研究海报照片、自主搜索网络获取最新研究并比较结果的过程,还展示了它自主运行 Python 代码解决数学和编码难题的能力。
而且,o3 和 o4 - mini 能够直接推理视觉信息,包括草图、图表或照片,即便这些信息模糊或质量欠佳,它们也知道在推理过程中如何处理照片。
新推出的 Codex CLI 编码代理也亮点十足。它旨在用户设备上运行,借助与 o3 和 o4 - mini 模型的云端连接进行推理,同时可使用本地部署的其他软件工具。
Codex CLI 不仅能给出代码行建议,还能自主选择不同工具辅助完成任务。并且,OpenAI 表示 Codex CLI 很快就能利用 GPT - 4.1 模型的功能。
为吸引开发者尝试 Codex CLI,OpenAI 设立了 100 万美元基金,为有潜力的项目发放2.5万美元的 API 积分。另外,OpenAI 透露 o3 的训练计算能力约是创建 o1 模型(之前最佳推理模型)所需计算能力的10倍。