腾讯发布新一代混元开源大语言模型，英特尔实现第零日全面适配

时间：2025-08-06 04:25

小编：小世评选

2023年10月，中国科技巨头腾讯正式发布了新一代混元开源大语言模型。这一创新的推出不仅是在人工智能技术中的一大里程碑，还标志着腾讯在推动AI技术普及方面的重要步骤。同时，英特尔凭借其在人工智能领域的全方位技术布局，顺利完成了针对这一新模型的第零日（Day 0）部署与性能优化。此举充分展示了“硬件 + 模型 + 生态”协同模式的巨大潜力。

腾讯的混元大语言模型系列包含四款小尺寸模型，参数分别为0.5B、1.8B、4B和7B，消费者可以通过普通的消费级显卡在多种设备上轻松运行。这些模型特别适合低功耗场景，如笔记本电脑、移动设备、智能座舱和智能家居等。腾讯在此次发布中明确指出，所有开源的模型均为融合推理模型，具备推理速度快、性价比高的特点。用户可以根据具体使用场景，灵活选择不同模型的思考模式。所谓的快思考模式则注重快速输出，适用于简单任务，而慢思考模式则处理更复杂的问题，适合需要深入推理的场合。

在英特尔的酷睿Ultra上，这些新模型已实现全面适配。在CPU、GPU以及NPU等多种AI运算引擎的支持下，混元模型展现出了卓越的推理性能。例如，使用酷睿Ultra 2代iGPU时，7B参数量模型在INT4精度下，其吞吐量可达到20.93 token/s；而0.5B的小尺寸模型在FP16精度下，其吞吐量更是高达68.92 token/s。这表明，英特尔对新模型的支持和适配已形成常态化的解决方案，能够迅速满足从个人终端到边缘设备的多样化需求，进一步推动了技术的创新和应用的落地。

英特尔利用其OpenVINO软件的强大功能，赋能ISV生态伙伴，使其能够在模型发布当天即实现应用层的适配。这一策略不仅大幅度加速了新模型的市场应用进程，也强有力地支持了开发者构建新应用的各个环节。作为开源深度学习工具套件，OpenVINO以“性能优化 + 跨部署”为核心优势，广泛应用于AI PC和边缘AI等场景，通过最大化推理性能，确保用户能够在不同硬件上无缝使用深度学习模型。

截至目前，OpenVINO已支持超过900个人工智能模型，这些模型涵盖了生成式AI领域的主流结构与算子库。这种丰富的模型支持体系，保障了在新模型发布的Day 0，英特尔就能够完成对硬件的适配部署。腾讯的混元模型快速落地的背后，正是OpenVINO的技术实力直观体现，充分释放了混元模型在酷睿Ultra上的性能潜力，为用户带来即时可用的AI体验。

生态合作是英特尔AI战略的主要支撑。长期合作伙伴驱动人生正专注于互联网客户端软件的研发与运营，致力于提供用户中心化、技术根本化和开放原则的优质服务。其AIGC助手软件借助OpenVINO推理框架，实现了本地部署与离线使用，使用户可以随时通过文本输入和语音转译与大模型进行智能对话。这一应用在混元模型发布当日即完成了适配，并成为首批支持新模型的应用之一，彰显了技术应用的高效性。

目前，驱动人生AIGC助手、英特尔AIPC应用专区及多个OEM应用商店的AI PC专区均已上架，新版本将搭载混元模型，为用户提供更智能的交互方式与服务体验。这种“模型发布硬件适配应用落地”的全链条响应，正体现了英特尔在生态协同上的能力与成果。AI的发展需要模型的创新与软硬件生态的协同，只有这样才能实现技术的突破和应用的普及。

展望未来，英特尔将继续深化与合作伙伴的合作，促进AI创新更快地融入不同的行业与大众生活。这不仅能够进一步推动整个AI产业的快速发展，更能够为全球用户提供更为便捷和智能化的生活体验。

通过部署基于Python的模型环境，开发者将能够使用OpenVINO进行模型的优化与推理。需要将PyTorch模型转换为OpenVINO IR格式，并进行权重量化，以实现更轻量化的部署与最佳性能表现。通过optimum-cli工具的使用，开发者能轻松完成这一过程。而openvino-genai则提供了基于Python与C++的全新大语言和生成式AI任务的部署方法，为用户提供友好的开发环境。

如欲深入了解更多关于OpenVINO和腾讯混元模型的具体运用与部署示例，开发者可访问相关文档与社区，获得不断更新的技术支持和示例代码，帮助他们在这个飞速发展的人工智能时代中，快速掌握核心技术，推动个人与行业的发展。

腾讯发布新一代混元开源大语言模型，英特尔实现第零日全面适配

精品推荐

相关文章