-
HunyuanCustom:腾讯混元开源的多模态定制化视频生成工具
HunyuanCustom是腾讯混元推出的一款多模态定制化视频生成工具,它基于混元视频生成大模型(HunyuanVideo)打造,融合了文本、图像、音频、视频等多模态输入,能够生成高质量的定制化视频。该工具在主体一致性效果上超越了现有的开源方案,具备高度控制力和生成质量。- 1.1k
- 0
-
SkyReels-V2:昆仑万维开源的无限时长电影生成模型
SkyReels-V2 是由昆仑万维开源的一款视频生成大模型,首创“扩散强迫(Diffusion-forcing)”训练框架,具备生成高保真、连贯、长时长(30s 以上)的影视级视频的能力。模型融合了多模态大语言模型(MLLM)、强化学习、视频理解与扩散优化等多项技术,适用于故事生成、图像到视频(I2V)、运镜控制和多元素一致性生成等丰富场景。- 2.4k
- 0
-
Amazon Nova:亚马逊推出的新一代多模态AI大模型,覆盖文本、图像、视频
Amazon Nova 是亚马逊 AWS 推出的一款先进的生成式AI基础大模型,包括4款语言模型、1款图像模型和1款视频模型,Nova 的模型支持处理文本、图像和视频的输入与输出,提供前沿智能与行业领先的性价比。能够为不同行业提供高效、低成本的解决方案,支持语言理解、图像/视频生成以及多模态能力等任务。- 4.2k
- 0