腾讯自研大模型“混元”即将升级,推出新语音通话功能与“世界模型
时间:2025-06-03 21:35
小编:小世评选
随着人工智能技术的不断进步,腾讯在其自研大模型“混元”方面的最新动态引发了广泛关注。根据5月26日的报道,腾讯即将对“混元”进行一次重要升级,推出全新的语音通话功能Hunyuan-Voice,同时还将发布全球首个全模态模型“混元-O”,这些创新将进一步巩固腾讯在AI领域的竞争力。
新语音通话功能“Hunyuan-Voice”
Hunyuan-Voice,被称为腾讯首个端到端的语音通话模型,计划最早在今年6月上线腾讯的元宝App。这一新功能的推出,标志着腾讯在AI语音通信领域的又一重要举措,也预示着其在这一市场中与字节跳动旗下的豆包AI视频通话功能展开激烈竞争。通过这一新功能,用户不仅可以享受到更加自然流畅的通话体验,还能通过腾讯强大的AI技术更好地融入虚拟社交场景。
“世界模型”的构建
腾讯的目标不仅限于个别应用的开发,而是希望通过“大模型”的升级,构建一个可更好理解和与物理世界交互的“世界模型”。根据腾讯技术工程事业群的科研人员的介绍,全球首个全模态模型“混元-O”将以语言为核心,综合视觉、语音和3D等多模态能力,为更加智能的AGI(通用人工智能)的发展奠定基础。这一模型的发布预计将在年内完成,预计将极大提升机器对于复杂场景的理解能力,从而实现自主探测与决策。
多模态的未来布局
当前的科技趋势显示,单一模态的信息处理已远远无法满足未来智能应用的需求。腾讯通过“混元”大模型,展开了一条多模态与全模态的探索路线,力求实现信息的深度理解与智能响应。科学家们认为,“混元”将突破传统的线性逻辑,推动AI与人类交流互动的界限,使得机器能以更人性化的方式理解复杂的现实场景。
腾讯云与TCADP的全面升级
腾讯在“2025腾讯云 AI产业应用峰会”上宣布了更多相关成果。腾讯云的知识引擎已全面升级为腾讯云智能体开发(TCADP),并正式对外发布。新的TCADP接入了DeepSeek-R1/V3模型和联网搜索功能,整合了腾讯云在行业领先的RAG(检索增强生成)技术及智能体能力,以满意用户需求为导向,支持企业快速激活私域知识,构建专属智能代理。
开放与共享
腾讯强调,未来将持续开源多模态基础模型,进行企业级混合推理模型的开发。这一举措不仅将推动产业界的技术交流和资源共享,也为开发者提供了更多创新的可能性。腾讯希望通过开放的方式,吸引更多的开发者加入到他们的生态中,从而共同推动AI技术的发展和应用。
腾讯的“混元”大模型升级,标志着公司在AI领域不断迈向新的高度。新推出的语音通话功能与“世界模型”的开发,显示了腾讯在推动人机交互和通用人工智能方面的坚定信念。随着相关技术的不断演进和应用模式的多样化,未来的社交、工作和生活都将被重新定义。而腾讯,也将继续在这一变革中扮演重要角色,推动着行业的创新与进步。