英特尔携手百度发布文心4.5系列开源大模型，实现OpenVINO?适配与部署

时间：2025-07-02 11:55

小编：小世评选

近日，百度在其技术生态中再次发力，正式推出了文心大模型4.5系列的开源模型。此次发布不仅展示了百度在人工智能领域的雄厚技术积累，也标志着英特尔与百度之间深厚的合作关系进一步加深。英特尔凭借其先进的OpenVINO?工具套件，实现了对文心系列大模型的高效适配和成功部署，特别是在其酷睿Ultra上，彰显了双方在推动AI技术应用方面的共同努力。

为满足日益增长的自动化与智能化需求，英特尔开发的OpenVINO?工具套件可被视为一项重磅技术，其设计旨在优化和加速深度学习模型的推理性能。OpenVINO?不仅支持跨部署，还能够充分利用英特尔硬件的强大性能，从而为各种AI应用场景提供支持，如AI PC、边缘计算以及更广泛的人工智能领域。这一的引入，使得开发者能够更加高效和灵活地进行AI模型的训练与推理。

自2021年以来，百度飞桨与英特尔OpenVINO?的合作愈加紧密。双方携手进行了深度适配，使得开发者在构建AI应用时能享受到更为强大和便捷的工具链。例如，飞桨框架下的诸多模型，如PaddleOCR、PaddleSeg以及PaddleDetection等，均已被广泛应用于金融、医疗和智能制造等各个行业。开发者不仅能通过OpenVINO?进行模型的推理和部署，还可以利用OpenVINO?的模型优化器将这些模型转化为IR格式，从而更便捷地进行后续部署。

在此次文心4.5系列大模型发布中，英特尔已经成功适配了0.3B参数量的稠密模型并在英特尔酷睿Ultra上完成部署。通过精确的适配与优化，英特尔展示了优秀的推理性能，为文心大模型的实际应用提供了坚实保障。未来，英特尔与百度将持续深化合作，适配更多文心系列模型，不断拓宽人工智能技术的应用边界，为行业提供更具创新性的解决方案。

为了帮助开发者高效部署模型，本文将详细介绍基于Python环境完成模型部署的具体步骤。在正式进行模型部署前，需将原始的PyTorch模型转换为OpenVINO?的IR静态图格式，这一过程不仅能提高模型的轻量化程度，同时有助于实现最佳的性能表现。通过Optimum工具提供的命令行工具optimum-cli，开发者能够一键完成模型格式的转换及权重量化，从而方便快捷地实现模型部署。

以下是使用optimum-cli进行模型格式转换的基本命令及参数说明：

`--model`：指向模型在HuggingFace上的ID，可提前下载并替换本地路径以供使用。对于国内开发者，推荐使用ModelScope魔搭社区作为模型下载的渠道。

`--weight-format`：设定量化精度，可选择多种格式（例如fp32、fp16、int8、int4等），开发者可根据需求选择对应的格式进行量化。

`--group-size`：设定权重共享量化参数的通道数目。

`--ratio`：设置int4/int8权重的比例，默认值为1.0，若为0.6，则表示60%的权重采用int4格式，40%的权重采用int8格式。

`--sym`：设定是否使用对称量化来减少模型的复杂性与计算量。

针对ERNIE-4.5系列的文本生成类模型，开发者可以使用Optimum-Intel来实现任务的部署与加速。Optimum-Intel通过调用OpenVINO?的runtime后端，可以在Intel的CPU和GPU上实现更高效的性能优化。同时，由于其具备良好的与Transformers库相容性，开发者可以简便地将已有的模型迁移至Optimum-Intel进行更优的运行效果。

通过此次英特尔和百度的合作，文心4.5系列开源大模型的发布不仅为业界带来了创新的AI解决方案，同时也推动了深度学习技术的普及与应用。未来，英特尔与百度将继续发扬合作精神，致力于推动人工智能领域的多元化发展，助力各行业实现智能化转型。

英特尔携手百度发布文心4.5系列开源大模型，实现OpenVINO?适配与部署

精品推荐

相关文章