当前位置:首页>AI工具>AI大模型>VideoPoet:Google发布的用于视频生成的大语言模型

VideoPoet:Google发布的用于视频生成的大语言模型

VideoPoet是什么?

VideoPoet是Google发布的基于大语言模型(LLM)来实现视频生成的模型,之前主流视频生成模型如Stable Video Diffusion和Video Diffusion都是采用扩散架构,但VideoPoet是基于大语言模型(LLM)来实现视频生成的,即采用LLM的自回归架构。VideoPoet的一个特色是它将许多视频生成能力无缝集成到一个LLM中。

下图展示了VideoPoet的能力,它可以实现文本生成视频,图像生成视频,视频风格化,视频的inpainting和outpainting以及视频转语音

VideoPoet

下图是VideoPoet生成的一些视频示例:

了解更多详情,请前往谷歌官方介绍

©版权声明:如无特殊说明,本站所有内容均为AIHub.cn原创发布和所有。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则,我站将依法保留追究相关法律责任的权利。
0 条回复
    暂无讨论,说说你的看法吧
error: