OpenAI与Anthropic发布新型大语言模型,推理任务能力显著提升
时间:2025-08-07 03:55
小编:小世评选
近期,OpenAI与Anthropic PBC双双发布了新型大语言模型,这两家人工智能领域的先锋旨在提升推理任务的能力,并重新定义模型在编程和数据分析方面的表现。OpenAI推出了gpt-oss-120b和gpt-oss-20b开源模型,而Anthropic则推出了Claude Opus 4.1,标志着它们在大语言模型竞争中的重要进展。
OpenAI的新动态
OpenAI的gpt-oss-120b和gpt-oss-20b两个新模型,分别拥有1170亿和210亿个参数,采用开源许可证。这意味着用户可以自由使用、修改和分发模型,进一步推动人工智能的民主化。OpenAI声称,这两个模型在多项推理任务中显著超越了同类开源模型,尤其在代码运行和与数据库交互的能力上表现出色。
运行gpt-oss-20b模型的硬件要求较低,仅需一张16GB的显卡,这使得该模型非常适合在消费级设备上使用。OpenAI的研究团队在最新的博客文章中表示,这个模型非常适合边缘设备应用、本地推理以及不依赖昂贵基础设施的快速开发。这种设计理念会吸引更多开发者和企业,尤其是那些希望在成本上具备优势的小型公司。
gpt-oss-120b虽需要80GB显存,但其输出质量经过多次优化,能够与OpenAI的专有模型o4-mini媲美。该模型采用了专家混合架构,能够根据任务动态选择最适合的神经网络,从而提高了整体效率。同时,OpenAI还对模型的注意力机制进行了改进,引入了分组多查询注意力和旋转位置嵌入技术,进一步提升了处理长输入的能力。这些优化不仅提高了模型的反应速度,还扩展了可处理的上下文窗口,支持高达128,000个Token。
OpenAI团队通过多步骤的训练过程来开发这些模型,使用带有科学技术主题的英语文本进行初步训练,随后进行了监督微调和强化学习的双轮训练,形成了高品质、高效率的模型。
Anthropic的升级版本
与OpenAI的开源策略形成对比的是,Anthropic推出的Claude Opus 4.1代表了其在专有大语言模型方面的持续创新。Claude Opus 4是在5月发布的Claude 4 Opus的升级版本,此前该模型已被广泛认为是当前最优秀的编程模型。
Claude Opus 4.1在SWE-bench Verified基准测试中得分从72.5%提高至74.5%,显示出公司在编程能力上的持续进步。Claude Opus 4.1还提升了对数据分析和研究任务的处理能力。这一新模型可通过Claude AI助手的付费版本、应用程序编程接口(API)、Amazon Bedrock以及Google Cloud的Vertex AI服务获得,适应性极强,可以覆盖多种使用场景。
企业影响与未来展望
两家公司的最新推出,为企业在选择和部署大语言模型时提供了更多选择。随着开源模型的发布,企业在内部部署、运维和优化模型的灵活性增强,能够更好地满足其特定业务需求。这种趋势标志着专有API的护城河正在缩小,许多小型和中型企业将有机会借助这些工具快速进行创新和迭代。
业内专家指出,这使得企业的竞争重心转向了工具的差异化、强化学习反馈以及特定业务上下文的数据利用。企业如果能够充分利用这些新模型的能力,开发出具备数字孪生特性的智能体,将在市场竞争中获得显著优势。那些仅仅依赖于不断便宜的API的企业,未来可能面临更大的生存压力。
OpenAI与Anthropic的新一代大语言模型不仅在推理能力、编程技巧等方面都有所提升,同时也对整个AI市场环境带来了深远的影响。随着技术进步与市场需求的变化,未来我们将看到更加多样化与高效的人工智能解决方案来应对复杂的业务挑战。