免费安卓手游下载、分享游戏攻略、电脑硬件资讯、数码科技最新资讯
当前位置: 首页 > 硬件资讯 > OpenAI发布新开源生成式AI模型gpt-oss-120b与gpt-oss-20b

OpenAI发布新开源生成式AI模型gpt-oss-120b与gpt-oss-20b

时间:2025-08-07 09:05

小编:小世评选

来源:至顶网

2023年10月,OpenAI正式发布了其最新的生成式AI模型gpt-oss-120b和gpt-oss-20b。这次发布标志着自2019年推出GPT-2以来,OpenAI首次开放了其生成模型的权重。虽然这两个新模型尚未达到GPT-5的水平,但从功能性和应用灵活性来看,它们更具吸引力。用户可以自由下载这两个模型,并在自己的硬件上进行本地运行,充分利用其强大的生成能力,支持多种模拟推理、工具使用和深度定制的场景。

模型特点

gpt-oss-120b和gpt-oss-20b都是基于Transformer架构的生成式模型,分别具备1170亿和210亿的参数量。两款模型皆采用了专家混合(MoE)技术,其中gpt-oss-120b在每个Token的参数使用上高达51亿,而gpt-oss-20b则将其降至36亿。凭借这种创新技术,即使是在相对较弱的硬件配置下,用户也能实现高效运算。

其中gpt-oss-20b适合配置16GB内存的台式机或笔记本电脑运行,足以满足大多数用户的需求;而gpt-oss-120b虽然要求80GB内存,但其性能表现更为卓越,非常适合那些具备一定硬件支持的研究人员和开发者。两款模型都支持高达128,000个Token的上下文窗口,大大增强了在复杂任务中的表现能力。

可配置思维链(COT)

这两个新模型还引入了可配置思维链(CoT)功能,支持低、中、高三个设置等级。较低级别的设置可以更快响应,但在输出质量上可能略逊一筹,而最高级别提供优质的生成能力。用户只需通过简短的系统提示代码即可轻松调整CoT级别,使得不同的应用场景都能得到更适合的解决方案。

性能评估

在实际性能测试中,gpt-oss-120b在大多数核心基准测试中表现处于o3和o4-mini专有模型之间,显示出强大的生成能力。尤其在数学和编程任务上的表现尤为靠近。这些新模型在“人类考试”测试中取得了19%的成绩,尽管这远低于Google最新的Gemini Deep Think所达到的34.8%。但是,gpt-oss系列模型依然展现出了开放源代码AI在特定任务中的潜力。

开源模型的意图

值得注意的是,OpenAI并不打算让用户用这两个新发布的开源模型替代其专有的GPT版本。相反,OpenAI希望通过这些模型满足用户在本地处理AI时的需求。由于本地模型能够提供更低的延迟、更多的定制选项,以及更高的数据安全性,因而在某些敏感信息处理场景下,用户更倾向于使用本地部署解决方案。gpt-oss系列模型也设计为能够与OpenAI的专有产品集成,使得即使在本地使用部分数据,用户也能获得端到端的OpenAI体验。

开发者友好政策

OpenAI通过Apache 2.0许可证对这两个模型的开放,意在鼓励开发者进行多样化的应用与调优。开发者不仅可以根据需求调整模型,还可以评估模型在特定任务中的表现。与其他AI技术公司一样,OpenAI在模型中内置了控制机制,以限制潜在的恶意行为。公司在开发过程中采取了很多安全措施,以确保模型不会被用于不当目的。

OpenAI还通过调优gpt-oss模型来预防模型出现恶意行为的最坏情况,测试者发现即使在故意挑起模型行为不当的情况下,模型造成恶性影响的概率依然相对较低。这说明OpenAI在对齐和引导模型行为方面采取了有效的措施,从而防止了模型被严重滥用的潜在问题。

下载与获取方式

有意向的开发者可在HuggingFace上下载gpt-oss-120b和gpt-oss-20b。OpenAI还提供了GitHub存储库以便查阅相关代码,用户可以在OpenAI的基础设施上测试标准版本。对于寻求更多技术实现细节的用户,OpenAI已提供详细的模型卡片及研究博客文章,以帮助用户更好地理解模型的架构与应用。

OpenAI针对本地AI需求的gpt-oss-120b与gpt-oss-20b模型的推出,不仅拓宽了生成式AI的应用场景,同时也为开发者提供了额外的创新空间,推进了开放源代码AI生态的进步。随着未来AI技术的不断发展,我们期待这些模型能够为各种领域的科研和应用注入新的活力。

精品推荐

相关文章

猜你喜欢

更多

热门文章

更多