腾讯发布新一代混元开源大语言模型,英特尔实现第零日全面适配
时间:2025-08-06 04:25
小编:小世评选
2023年10月,中国科技巨头腾讯正式发布了新一代混元开源大语言模型。这一创新的推出不仅是在人工智能技术中的一大里程碑,还标志着腾讯在推动AI技术普及方面的重要步骤。同时,英特尔凭借其在人工智能领域的全方位技术布局,顺利完成了针对这一新模型的第零日(Day 0)部署与性能优化。此举充分展示了“硬件 + 模型 + 生态”协同模式的巨大潜力。
腾讯的混元大语言模型系列包含四款小尺寸模型,参数分别为0.5B、1.8B、4B和7B,消费者可以通过普通的消费级显卡在多种设备上轻松运行。这些模型特别适合低功耗场景,如笔记本电脑、移动设备、智能座舱和智能家居等。腾讯在此次发布中明确指出,所有开源的模型均为融合推理模型,具备推理速度快、性价比高的特点。用户可以根据具体使用场景,灵活选择不同模型的思考模式。所谓的快思考模式则注重快速输出,适用于简单任务,而慢思考模式则处理更复杂的问题,适合需要深入推理的场合。
在英特尔的酷睿Ultra上,这些新模型已实现全面适配。在CPU、GPU以及NPU等多种AI运算引擎的支持下,混元模型展现出了卓越的推理性能。例如,使用酷睿Ultra 2代iGPU时,7B参数量模型在INT4精度下,其吞吐量可达到20.93 token/s;而0.5B的小尺寸模型在FP16精度下,其吞吐量更是高达68.92 token/s。这表明,英特尔对新模型的支持和适配已形成常态化的解决方案,能够迅速满足从个人终端到边缘设备的多样化需求,进一步推动了技术的创新和应用的落地。
英特尔利用其OpenVINO软件的强大功能,赋能ISV生态伙伴,使其能够在模型发布当天即实现应用层的适配。这一策略不仅大幅度加速了新模型的市场应用进程,也强有力地支持了开发者构建新应用的各个环节。作为开源深度学习工具套件,OpenVINO以“性能优化 + 跨部署”为核心优势,广泛应用于AI PC和边缘AI等场景,通过最大化推理性能,确保用户能够在不同硬件上无缝使用深度学习模型。
截至目前,OpenVINO已支持超过900个人工智能模型,这些模型涵盖了生成式AI领域的主流结构与算子库。这种丰富的模型支持体系,保障了在新模型发布的Day 0,英特尔就能够完成对硬件的适配部署。腾讯的混元模型快速落地的背后,正是OpenVINO的技术实力直观体现,充分释放了混元模型在酷睿Ultra上的性能潜力,为用户带来即时可用的AI体验。
生态合作是英特尔AI战略的主要支撑。长期合作伙伴驱动人生正专注于互联网客户端软件的研发与运营,致力于提供用户中心化、技术根本化和开放原则的优质服务。其AIGC助手软件借助OpenVINO推理框架,实现了本地部署与离线使用,使用户可以随时通过文本输入和语音转译与大模型进行智能对话。这一应用在混元模型发布当日即完成了适配,并成为首批支持新模型的应用之一,彰显了技术应用的高效性。
目前,驱动人生AIGC助手、英特尔AIPC应用专区及多个OEM应用商店的AI PC专区均已上架,新版本将搭载混元模型,为用户提供更智能的交互方式与服务体验。这种“模型发布 硬件适配 应用落地”的全链条响应,正体现了英特尔在生态协同上的能力与成果。AI的发展需要模型的创新与软硬件生态的协同,只有这样才能实现技术的突破和应用的普及。
展望未来,英特尔将继续深化与合作伙伴的合作,促进AI创新更快地融入不同的行业与大众生活。这不仅能够进一步推动整个AI产业的快速发展,更能够为全球用户提供更为便捷和智能化的生活体验。
通过部署基于Python的模型环境,开发者将能够使用OpenVINO进行模型的优化与推理。需要将PyTorch模型转换为OpenVINO IR格式,并进行权重量化,以实现更轻量化的部署与最佳性能表现。通过optimum-cli工具的使用,开发者能轻松完成这一过程。而openvino-genai则提供了基于Python与C++的全新大语言和生成式AI任务的部署方法,为用户提供友好的开发环境。
如欲深入了解更多关于OpenVINO和腾讯混元模型的具体运用与部署示例,开发者可访问相关文档与社区,获得不断更新的技术支持和示例代码,帮助他们在这个飞速发展的人工智能时代中,快速掌握核心技术,推动个人与行业的发展。