百度正式开源文心大模型4.5系列提升多模态理解能力

时间：2025-07-01 02:40

小编：星品数码网

2023年6月30日，百度正式发布了文心大模型4.5系列，并实现了全系列模型的开源。这一系列包括47B及3B激活参数的混合专家（MoE）模型，以及0.3B稠密型模型等共计10款不同模型，此次开源不仅提供了预训练权重，还共享了推理代码，标志着百度在AI领域的又一重要里程碑。

随着AI技术日益渗透各个行业，对模型的多模态理解能力的需求也愈加迫切。文心大模型4.5系列在这个背景下应运而生。其独特的多模态异构模型结构，旨在支持从大语言模型向多模态模型的持续预训练过程。相比于以往的模型，文心4.5系列在保持文本任务高性能的同时，显著增强了多模态理解的能力。

据了解，该系列模型的卓越性能得益于几个关键技术点。其中，多模态混合专家模型预训练技术有效提高了模型在多个任务场景下的表现，尤其是在处理复杂的视觉与文本数据时。同时，高效的训练推理框架和针对模态的后训练技术使得模型在资源利用效率上得到了极大的提升，模型的FLOPs利用率达到了47%。

文心大模型4.5在多个文本和多模态基准测试中展示了其出色的性能，尤其是在指令遵循、世界知识记忆、视觉理解和多模态推理等任务上表现卓越。这些测试结果表明，文心大模型4.5系列远超目前市场上很多主流模型，例如DeepSeek-V3和Qwen3等。在文本模型方面，其基础能力强，准确性高，指令遵循能力与推理能力表现尤为突出。

值得一提的是，在多模态处理上，文心大模型4.5系列同样不负众望。其在视觉感知和视觉常识的理解上表现优异，不仅能够实现思考与非思考的统一，还在视觉常识、多模态推理等多个主流评测中超越了闭源的OpenAI O1。文心4.5-21B-A3B Base文本模型的性能与Qwen3相当，而其多模态模型文心4.5-VL-28B-A3B更是成为了同量级中最强的开源模型，甚至在某些方面与更大参数的Qwen2.5-VL-32B相媲美。

此次文心大模型4.5系列的开源采用了Apache 2.0协议，旨在支持广泛的学术和产业应用。百度还借助飞桨提供的开源产业级开发套件，使得模型在后训练和部署过程中的门槛大幅降低，为开发者提供了更为便捷的使用体验。

百度作为国内AI研发的先驱之一，其在算力、框架和模型应用的四层布局中形成了显著的技术优势。在这次文心4.5开源发布的同时，百度还同步升级了ERNIEKit开发套件和FastDeploy高效部署套件，为开发者提供了全流程的工具支持。

在框架层面，飞桨作为中国首个自主研发的产业级深度学习，凭借多年技术积累，为文心大模型的训练与推理提供了强有力的支持。飞桨的开发生态不断丰富，让开发者在实践中获得良好的体验。飞桨深度学习框架兼容多种芯片，进一步推动了AI技术的普及和应用。

文心大模型4.5系列的开源意味着百度实现了框架与模型的双层开源，为整个行业树立了新的标杆。此举不仅能够加速AI技术应用的落地，也有望激发更多科研人员和企业的合作与创新，推动多模态理解能力的进一步发展。

百度的这一全新举措不仅是企业技术研发能力的体现，更为行业的持续进步提供了新的动力。未来，文心大模型4.5系列将如何在实际应用中发挥作用，值得我们共同关注与期待。随着技术的不断迭代，AI的应用场景将更加广泛，推动社会各领域的创新与变革。

百度正式开源文心大模型4.5系列提升多模态理解能力

精品推荐

相关文章

百度正式开源文心大模型4.5系列 提升多模态理解能力

精品推荐

相关文章

百度正式开源文心大模型4.5系列提升多模态理解能力