OpenAI发布o3-pro，推理模型性能大幅提升并降价80%

时间：2025-06-13 11:55

小编：星品数码网

在今年的推理模型领域，OpenAI突然推出o3-pro，引发了广泛关注和热议。毫无前兆的发布犹如一场震撼，为AI行业带来了一股新的风潮。该模型的价格竟下降了80%，为其上市预热添砖加瓦。

与其前辈o3相比，o3-pro是一款更为强大的产品。OpenAI的首席执行官Sam Altman对新模型的表现赞不绝口，他表示，在对比o3与o3-pro的性能胜率时，自己也感到十分意外。o3-pro不仅是一个普通的助手，它象征着人工智能的进化，具备长思考和工具调用的能力。经过多项基准测试的严苛检验，o3-pro在数学、科学和编程方面的表现完全超越了o1-pro，甚至成功打败了Gemini 2.5 Pro（0605）和Claude 4 Opus等同行业模型。

在价格方面，o3-pro的定价十分具有竞争力，仅需20美元/百万token的输入和80美元/百万token的输出，较o1-pro低了13%。这一措施不仅有效降低了用户的使用成本，还扩大了AI技术的受众基础。更值得注意的是，o3的价格也骤然下跌，新的定价为输入2美元/百万token，输出8美元/百万token，成为AI圈内一场价格革命的引导者。

值得一提的是，o3-pro明确针对深度思考的需求而优化，能够实现各种自动工具调用，包括网页搜索、文件分析和Python代码执行，它的记忆功能也提供了个性化的回答体验。这使得o3-pro在科学、教育、编程、商业和写作辅助等领域的专家评估中获得了更高的认可，评审们对其清晰度、全面性、指令遵循度以及准确性所表现出的优异成绩赞叹不已。

在多个重要测试中，例如AIME 2024、GPQA和Codeforces，o3-pro交出了十分亮眼的成绩，彻底碾压了o1-pro与o3。特别是在“4/4可靠性”这一严格标准中，o3-pro在数学、编程及博士级科学问答中的表现依旧遥遥领先。这意味着，o3-pro与o3的效能相当，但在可靠的结果输出上，o3新定价刷新了ARC-AGI-1的最高标准（SOTA）。

尽管o3-pro表现出色，OpenAI也提醒用户，使用该模型时需考虑其响应速度与思考时间可能较之前的模型更长，一些复杂问题的响应时间甚至可能需要数分钟。某位用户在测试中，只输入“Hi, I’m Sam Altman”这一句，便发现o3-pro竟然思考了近四分钟，有时甚至会达到十三分钟，这在用户体验上可能会造成一定的不便。

同时，o3-pro具备一些当前尚未实现的功能，如临时对话、图像生成及Canvas功能的支持。即使这样，它的智能水平依然让人惊叹。一些早期获得测试资格的用户，例如Raindrop ai的Ben Hylak，也对o3-pro进行了深入测评。他发现o3-pro在处理复杂问题时，远超之前版本。通过结合历史数据和上下文，o3-pro能够制定出详细且精准的计划，改变了团队的决策方式。

从某种程度上讲，o3-pro就像是一个高智商的少年需要更好的指导与环境。它能有效辨别自身的环境限制，同时了解自身可以接触的工具，这种能力确实是它升级的核心。尽管在缺乏上下文信息时，它可能会显得多思，但在分析和解决问题的能力上，o3-pro显然已经突破了以往的限制。

如果将o3-pro与市场其他竞争对手，如Gemini 2.5 Pro与Claude Opus相对比，我们会发现，o3-pro的应变能力和实用性在许多场景中显示出独特的优势。用户甚至能够通过o3-pro成功解决了几个其他模型无法应对的复杂问题，例如生成从“space”到“earth”的单词阶梯。

不过，o3的降价幅度已经拉低了其token的市场价格，而OpenAI在这一点上也显示出了建立更加开放透明市场的决心。随着竞争对手的不断加入，o3的token价格显然已经跌至行业底部，与Gemini 2.5 Pro和Claude 4 Opus相比，o3的性价比优势愈加明显。从行业发展的角度看，这是一次积极的改革，用户能够以更低的成本获取更高水平的AI服务。

目前看来，OpenAI的整个产品线似乎朝着让AI技术更加亲民和普及的方向发展，o3与o3-pro的成功发布预示着新的智能时代的到来。随着技术的不断进步与演化，未来的AI世界将值得我们期待。在的日子里，o3-pro将成为驱动AI行业前行的重要力量，而OpenAI也将在技术的道路上继续探索与创新。

OpenAI发布o3-pro，推理模型性能大幅提升并降价80%

精品推荐

相关文章