HunyuanCustom：腾讯混元开源的多模态定制化视频生成工具

AI模型
25年5月11日
编辑

HunyuanCustom是什么？

HunyuanCustom是腾讯混元推出的一款多模态定制化视频生成工具，它基于混元视频生成大模型（HunyuanVideo）打造，融合了文本、图像、音频、视频等多模态输入，能够生成高质量的定制化视频。该工具在主体一致性效果上超越了现有的开源方案，具备高度控制力和生成质量。

HunyuanCustom

HunyuanCustom的主要功能

单主体视频生成：用户只需上传一张包含目标人物或物体的图片，并提供一句文本描述，HunyuanCustom就能识别出图片中的身份信息，并在完全不同的动作、服饰与场景中生成连贯自然的视频内容。
多主体视频生成：用户可以提供多张图片（如人物和物体的照片），并输入文字描述，让这些主体按要求出现在视频里。
单主体视频配音：在音频驱动（单主体）模式下，用户可以上传人物图像并配上音频语音，模型便可生成人物在任意场景中说话、唱歌或进行其他音视频同步表演的效果。这一功能广泛适用于数字人直播、虚拟客服、教育演示等场景。
视频局部编辑：在视频驱动模式下，支持将图片中的人物或物体自然地替换或插入到任意视频片段中，进行创意植入或场景扩展，轻松实现视频重构与内容增强。

HunyuanCustom的适合人群

视频创作者：可以利用HunyuanCustom快速生成创意视频，提升创作效率，实现更多样的视频内容。
短视频博主：能够快速制作出吸引人的短视频，增加内容的趣味性和多样性，提升粉丝关注度。
电商从业者：可以快速生成商品展示视频，通过改变背景、模特服装等，提升商品吸引力，促进销售。
广告创意人：能够快速制作广告视频，根据不同的广告需求，快速调整视频内容，提高广告效果。
教育工作者：可以制作生动的教学视频，通过虚拟人物讲解知识点，提高教学效果和学生的学习兴趣。
影视制作人员：可以快速制作短剧、小故事等视频内容，降低制作成本，提高制作效率。

HunyuanCustom的项目信息

体验入口：https://hunyuan.tencent.com/modelSquare/home/play?modelId=192
项目官网：https://hunyuancustom.github.io/
GitHub代码：https://github.com/Tencent/HunyuanCustom
技术报告：https://arxiv.org/pdf/2505.04512

©版权声明：如无特殊说明，本站所有内容均为AIHub.cn原创发布和所有。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则，我站将依法保留追究相关法律责任的权利。

AI大模型开源模型腾讯混元视频生成模型

TOP1

豆包 - 字节跳动旗下免费AI智能助手
23年8月17日
TOP2

SpeedAI - 专业的AIGC检测、降重降AI平台
4月30日
TOP3

千问 - 阿里旗下 AI 智能助手
4月15日
LibTV - LiblibAI 推出的 AI 视频创作平台，剧本分镜成片一站式完成
3月18日
星流 - LiblibAI 推出的一站式 AI 设计 Agent
24年12月6日
讯飞智文 - 科大讯飞推出的 AI PPT 与文档生成工具
23年11月16日

TOP1

蛙蛙漫剧 - 一站式AI漫剧视频创作工具
2小时前
TOP2

GPT-Live：OpenAI 新一代实时语音交互模型
7月12日
TOP3

暴喵 AI 管家 - 面向 Windows 和 macOS 用户的 AI 编程工具助手
7月11日
Skild Art - 一站式 AI 视觉创作平台，为商业营销而生
7月11日
deep-skill-finder：真实任务验证的 Skill 匹配引擎
7月11日
墨镜熊 - 主打加密与密态计算的 AI 隐私对话助手
7月10日