腾讯发布开源多模态视频生成工具Hunyuan Custom，提升视频创作一致性

时间：2025-05-12 10:35

小编：星品数码网

腾讯近期推出了一款名为Hunyuan Custom的开源多模态视频生成工具，这一创新工具的发布引起了广泛关注。基于腾讯自家的混元视频生成大模型（Hunyuan Video），Hunyuan Custom旨在提升视频创作的韧性和一致性，以满足内容创作者在多样性与准确性上的需求。

一、新工具的核心功能

Hunyuan Custom的最大亮点在于其对多模态输入的支持能力。该工具不仅能够处理文本与图片，还能够融合音频和视频信息，实现高质量视频生成。这就意味着，用户可以利用图文配合、音频合成等多种形式，创作出更具表现力的内容，不再局限于单一的生成模式。

具体Hunyuan Custom支持多种生成任务，例如单主体视频生成与多主体视频生成。在单主体视频生成中，用户只需上传一张目标人物的图片，并提供一句文本描述，例如“他正在喝咖啡”，系统则能够在完全不同的场景中生成视频，展现出目标人物的多种动态与表达。而在多主体视频生成中，用户可以同时提供多张图片，例如整张展示了一名游泳者与一些运动器材的照片，结合相应的描述，生成两者互动的场景视频，这使得内容创作者能够更为灵活全面地表达他们的想法。

二、应用场景和市场需求

随着数字内容创作市场的不断扩大，用户对视频生成工具的需求也越来越高。在教育、广告、娱乐等多种场景中，高质量且具一致性的视频内容都是成功的关键。腾讯Hunyuan Custom的推出正是针对这一市场痛点，提供了一个高效、智能的解决方案。

例如，在数字人领域，通过Hunyuan Custom，用户可以轻松创建个性化的虚拟形象，并赋予其多样的动作与表情，大大增强了观看体验。而在虚拟客服和在线教育场景中，工具能够借助音频驱动模式，让用户的虚拟角色与观众进行实时互动。这不仅提升了内容的沉浸感，也为用户提供了更多想象的空间。

三、对比市场现有产品

在目前的技术环境下，虽然市场上已有多个视频生成模型，但大多数的产品在一致性与创意展现方面仍显得力不从心。许多文生视频或图生视频工具在处理过程中，无法在保持角色一致的同时改变环境设置或角色动作。例如，有些工具在生成的短视频中受到文本提示词的强烈影响，导致每次生成的内容和场景都无法形成连贯的叙事。而Hunyuan Custom通过引入身份增强机制，能够有效地处理这种不一致性问题，实现了“图像提供身份，文本定义一切”的理念。

四、未来展望

腾讯对于Hunyuan Custom的未来发展充满期待。随着技术的不断演进，Hunyuan Custom将不断推陈出新，使其在多个领域中产生更大影响力。腾讯还计划在的几周内陆续开源更多功能，以吸引更多开发者参与到社区中来，进一步完善工具的应用能力。

用户可以通过Hunyuan Custom的官方网站（https://hunyuan.tencent/）体验到单主体生成的功能，而其他新功能也将陆续上线。通过GitHub（https://github/Tencent/HunyuanCustom）找到开源代码，开发者能够在此基础上进行更多的优化与改进，进一步挖掘工具的潜力。

Hunyuan Custom的发布为视频创作工具行业带来了新的气象。它让创作者能够更自由地进行创意表达，且保证了生成内容的高一致性，提升了作品的质量和价值。而随着用户使用需求的多样化，这一工具的前景也显得更加广阔。创造属于我们的精彩视频，仅在指尖间轻松一触。