腾讯自研大模型“混元”即将升级，推出新语音通话功能与“世界模型

时间：2025-06-03 21:35

小编：小世评选

随着人工智能技术的不断进步，腾讯在其自研大模型“混元”方面的最新动态引发了广泛关注。根据5月26日的报道，腾讯即将对“混元”进行一次重要升级，推出全新的语音通话功能Hunyuan-Voice，同时还将发布全球首个全模态模型“混元-O”，这些创新将进一步巩固腾讯在AI领域的竞争力。

新语音通话功能“Hunyuan-Voice”

Hunyuan-Voice，被称为腾讯首个端到端的语音通话模型，计划最早在今年6月上线腾讯的元宝App。这一新功能的推出，标志着腾讯在AI语音通信领域的又一重要举措，也预示着其在这一市场中与字节跳动旗下的豆包AI视频通话功能展开激烈竞争。通过这一新功能，用户不仅可以享受到更加自然流畅的通话体验，还能通过腾讯强大的AI技术更好地融入虚拟社交场景。

“世界模型”的构建

腾讯的目标不仅限于个别应用的开发，而是希望通过“大模型”的升级，构建一个可更好理解和与物理世界交互的“世界模型”。根据腾讯技术工程事业群的科研人员的介绍，全球首个全模态模型“混元-O”将以语言为核心，综合视觉、语音和3D等多模态能力，为更加智能的AGI（通用人工智能）的发展奠定基础。这一模型的发布预计将在年内完成，预计将极大提升机器对于复杂场景的理解能力，从而实现自主探测与决策。

多模态的未来布局

当前的科技趋势显示，单一模态的信息处理已远远无法满足未来智能应用的需求。腾讯通过“混元”大模型，展开了一条多模态与全模态的探索路线，力求实现信息的深度理解与智能响应。科学家们认为，“混元”将突破传统的线性逻辑，推动AI与人类交流互动的界限，使得机器能以更人性化的方式理解复杂的现实场景。

腾讯云与TCADP的全面升级

腾讯在“2025腾讯云 AI产业应用峰会”上宣布了更多相关成果。腾讯云的知识引擎已全面升级为腾讯云智能体开发（TCADP），并正式对外发布。新的TCADP接入了DeepSeek-R1/V3模型和联网搜索功能，整合了腾讯云在行业领先的RAG（检索增强生成）技术及智能体能力，以满意用户需求为导向，支持企业快速激活私域知识，构建专属智能代理。

开放与共享

腾讯强调，未来将持续开源多模态基础模型，进行企业级混合推理模型的开发。这一举措不仅将推动产业界的技术交流和资源共享，也为开发者提供了更多创新的可能性。腾讯希望通过开放的方式，吸引更多的开发者加入到他们的生态中，从而共同推动AI技术的发展和应用。

腾讯的“混元”大模型升级，标志着公司在AI领域不断迈向新的高度。新推出的语音通话功能与“世界模型”的开发，显示了腾讯在推动人机交互和通用人工智能方面的坚定信念。随着相关技术的不断演进和应用模式的多样化，未来的社交、工作和生活都将被重新定义。而腾讯，也将继续在这一变革中扮演重要角色，推动着行业的创新与进步。

腾讯自研大模型“混元”即将升级，推出新语音通话功能与“世界模型

精品推荐

相关文章