OpenAI发布新开源生成式AI模型gpt-oss-120b与gpt-oss-20b

时间：2025-08-07 09:05

小编：星品数码网

来源：至顶网

2023年10月，OpenAI正式发布了其最新的生成式AI模型gpt-oss-120b和gpt-oss-20b。这次发布标志着自2019年推出GPT-2以来，OpenAI首次开放了其生成模型的权重。虽然这两个新模型尚未达到GPT-5的水平，但从功能性和应用灵活性来看，它们更具吸引力。用户可以自由下载这两个模型，并在自己的硬件上进行本地运行，充分利用其强大的生成能力，支持多种模拟推理、工具使用和深度定制的场景。

模型特点

gpt-oss-120b和gpt-oss-20b都是基于Transformer架构的生成式模型，分别具备1170亿和210亿的参数量。两款模型皆采用了专家混合（MoE）技术，其中gpt-oss-120b在每个Token的参数使用上高达51亿，而gpt-oss-20b则将其降至36亿。凭借这种创新技术，即使是在相对较弱的硬件配置下，用户也能实现高效运算。

其中gpt-oss-20b适合配置16GB内存的台式机或笔记本电脑运行，足以满足大多数用户的需求；而gpt-oss-120b虽然要求80GB内存，但其性能表现更为卓越，非常适合那些具备一定硬件支持的研究人员和开发者。两款模型都支持高达128,000个Token的上下文窗口，大大增强了在复杂任务中的表现能力。

可配置思维链(COT)

这两个新模型还引入了可配置思维链（CoT）功能，支持低、中、高三个设置等级。较低级别的设置可以更快响应，但在输出质量上可能略逊一筹，而最高级别提供优质的生成能力。用户只需通过简短的系统提示代码即可轻松调整CoT级别，使得不同的应用场景都能得到更适合的解决方案。

性能评估

在实际性能测试中，gpt-oss-120b在大多数核心基准测试中表现处于o3和o4-mini专有模型之间，显示出强大的生成能力。尤其在数学和编程任务上的表现尤为靠近。这些新模型在“人类考试”测试中取得了19%的成绩，尽管这远低于Google最新的Gemini Deep Think所达到的34.8%。但是，gpt-oss系列模型依然展现出了开放源代码AI在特定任务中的潜力。

开源模型的意图

值得注意的是，OpenAI并不打算让用户用这两个新发布的开源模型替代其专有的GPT版本。相反，OpenAI希望通过这些模型满足用户在本地处理AI时的需求。由于本地模型能够提供更低的延迟、更多的定制选项，以及更高的数据安全性，因而在某些敏感信息处理场景下，用户更倾向于使用本地部署解决方案。gpt-oss系列模型也设计为能够与OpenAI的专有产品集成，使得即使在本地使用部分数据，用户也能获得端到端的OpenAI体验。

开发者友好政策

OpenAI通过Apache 2.0许可证对这两个模型的开放，意在鼓励开发者进行多样化的应用与调优。开发者不仅可以根据需求调整模型，还可以评估模型在特定任务中的表现。与其他AI技术公司一样，OpenAI在模型中内置了控制机制，以限制潜在的恶意行为。公司在开发过程中采取了很多安全措施，以确保模型不会被用于不当目的。

OpenAI还通过调优gpt-oss模型来预防模型出现恶意行为的最坏情况，测试者发现即使在故意挑起模型行为不当的情况下，模型造成恶性影响的概率依然相对较低。这说明OpenAI在对齐和引导模型行为方面采取了有效的措施，从而防止了模型被严重滥用的潜在问题。

下载与获取方式

有意向的开发者可在HuggingFace上下载gpt-oss-120b和gpt-oss-20b。OpenAI还提供了GitHub存储库以便查阅相关代码，用户可以在OpenAI的基础设施上测试标准版本。对于寻求更多技术实现细节的用户，OpenAI已提供详细的模型卡片及研究博客文章，以帮助用户更好地理解模型的架构与应用。

OpenAI针对本地AI需求的gpt-oss-120b与gpt-oss-20b模型的推出，不仅拓宽了生成式AI的应用场景，同时也为开发者提供了额外的创新空间，推进了开放源代码AI生态的进步。随着未来AI技术的不断发展，我们期待这些模型能够为各种领域的科研和应用注入新的活力。

OpenAI发布新开源生成式AI模型gpt-oss-120b与gpt-oss-20b

精品推荐

相关文章