免费安卓手游下载、分享游戏攻略、电脑硬件资讯、数码科技最新资讯
当前位置: 首页 > 硬件资讯 > OpenAI发布o3-pro,推理模型性能大幅提升并降价80%

OpenAI发布o3-pro,推理模型性能大幅提升并降价80%

时间:2025-06-13 11:55

小编:小世评选

在今年的推理模型领域,OpenAI突然推出o3-pro,引发了广泛关注和热议。毫无前兆的发布犹如一场震撼,为AI行业带来了一股新的风潮。该模型的价格竟下降了80%,为其上市预热添砖加瓦。

与其前辈o3相比,o3-pro是一款更为强大的产品。OpenAI的首席执行官Sam Altman对新模型的表现赞不绝口,他表示,在对比o3与o3-pro的性能胜率时,自己也感到十分意外。o3-pro不仅是一个普通的助手,它象征着人工智能的进化,具备长思考和工具调用的能力。经过多项基准测试的严苛检验,o3-pro在数学、科学和编程方面的表现完全超越了o1-pro,甚至成功打败了Gemini 2.5 Pro(0605)和Claude 4 Opus等同行业模型。

在价格方面,o3-pro的定价十分具有竞争力,仅需20美元/百万token的输入和80美元/百万token的输出,较o1-pro低了13%。这一措施不仅有效降低了用户的使用成本,还扩大了AI技术的受众基础。更值得注意的是,o3的价格也骤然下跌,新的定价为输入2美元/百万token,输出8美元/百万token,成为AI圈内一场价格革命的引导者。

值得一提的是,o3-pro明确针对深度思考的需求而优化,能够实现各种自动工具调用,包括网页搜索、文件分析和Python代码执行,它的记忆功能也提供了个性化的回答体验。这使得o3-pro在科学、教育、编程、商业和写作辅助等领域的专家评估中获得了更高的认可,评审们对其清晰度、全面性、指令遵循度以及准确性所表现出的优异成绩赞叹不已。

在多个重要测试中,例如AIME 2024、GPQA和Codeforces,o3-pro交出了十分亮眼的成绩,彻底碾压了o1-pro与o3。特别是在“4/4可靠性”这一严格标准中,o3-pro在数学、编程及博士级科学问答中的表现依旧遥遥领先。这意味着,o3-pro与o3的效能相当,但在可靠的结果输出上,o3新定价刷新了ARC-AGI-1的最高标准(SOTA)。

尽管o3-pro表现出色,OpenAI也提醒用户,使用该模型时需考虑其响应速度与思考时间可能较之前的模型更长,一些复杂问题的响应时间甚至可能需要数分钟。某位用户在测试中,只输入“Hi, I’m Sam Altman”这一句,便发现o3-pro竟然思考了近四分钟,有时甚至会达到十三分钟,这在用户体验上可能会造成一定的不便。

同时,o3-pro具备一些当前尚未实现的功能,如临时对话、图像生成及Canvas功能的支持。即使这样,它的智能水平依然让人惊叹。一些早期获得测试资格的用户,例如Raindrop ai的Ben Hylak,也对o3-pro进行了深入测评。他发现o3-pro在处理复杂问题时,远超之前版本。通过结合历史数据和上下文,o3-pro能够制定出详细且精准的计划,改变了团队的决策方式。

从某种程度上讲,o3-pro就像是一个高智商的少年需要更好的指导与环境。它能有效辨别自身的环境限制,同时了解自身可以接触的工具,这种能力确实是它升级的核心。尽管在缺乏上下文信息时,它可能会显得多思,但在分析和解决问题的能力上,o3-pro显然已经突破了以往的限制。

如果将o3-pro与市场其他竞争对手,如Gemini 2.5 Pro与Claude Opus相对比,我们会发现,o3-pro的应变能力和实用性在许多场景中显示出独特的优势。用户甚至能够通过o3-pro成功解决了几个其他模型无法应对的复杂问题,例如生成从“space”到“earth”的单词阶梯。

不过,o3的降价幅度已经拉低了其token的市场价格,而OpenAI在这一点上也显示出了建立更加开放透明市场的决心。随着竞争对手的不断加入,o3的token价格显然已经跌至行业底部,与Gemini 2.5 Pro和Claude 4 Opus相比,o3的性价比优势愈加明显。从行业发展的角度看,这是一次积极的改革,用户能够以更低的成本获取更高水平的AI服务。

目前看来,OpenAI的整个产品线似乎朝着让AI技术更加亲民和普及的方向发展,o3与o3-pro的成功发布预示着新的智能时代的到来。随着技术的不断进步与演化,未来的AI世界将值得我们期待。在的日子里,o3-pro将成为驱动AI行业前行的重要力量,而OpenAI也将在技术的道路上继续探索与创新。

精品推荐

相关文章

猜你喜欢

更多

热门文章

更多