生数科技发布Vidu，中国首个长时长、高一致性、高动态性视频大模型

AIHub 最新消息，4 月 27 日，在中关村论坛未来人工智能先锋论坛上，生数科技联合清华大学正式发布中国首个长时长、高一致性、高动态性视频大模型——「Vidu」。

「Vidu」发布短片‍‍‍‍‍‍‍‍‍‍‍‍

该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT，支持一键生成长达16秒、分辨率高达1080P的高清视频内容。Vidu不仅能够模拟真实物理世界，还拥有丰富想象力，具备多镜头生成、时空一致性高等特点。Vidu是自Sora发布之后，全球率先取得重大突破的视频大模型，性能全面对标国际顶尖水平，并在加速迭代提升中。

Vidu的快速突破源自于团队在贝叶斯机器学习和多模态大模型的长期积累和多项原创性成果。其核心技术U-ViT架构由团队于2022年9月提出，早于Sora采用的DiT架构，是全球首个Diffusion与Transformer融合的架构。2023年3月，团队开源了全球首个基于U-ViT融合架构的多模态扩散模型UniDiffuser，率先完成了U-ViT架构的大规模可扩展性验证。

基于对U-ViT架构的深入理解以及长期积累的工程与数据经验，团队在短短两个月里进一步突破了长视频表示与处理的多项关键技术，研发了Vidu视频大模型，显著提升视频的连贯性和动态性。

Vidu的问世，不仅是U-ViT融合架构在大规模视觉任务中的又一次成功验证，也代表了生数科技在多模态原生大模型领域的持续创新能力和领先性。作为通用视觉模型，Vidu能够支持生成更加多样化、更长时长的视频内容，同时面向未来，灵活架构将能够兼容更广泛的模态，进一步拓展多模态通用能力的边界。

合作伙伴计划

随着大模型AI技术的飞速发展，我们深刻认识到，这一领域的突破是一个多维度、跨领域的综合性过程，它需要技术与产业应用的深度融合。为此在发布之际，我们特别推出“Vidu大模型合作伙伴计划”，诚邀产业链上下游企业、研究机构加入，共同构建合作生态，为开启通用视觉技术的全新纪元而共同努力！Vidu (We Do) Together！

→点击申请合作伙伴计划：https://shengshu.feishu.cn/share/base/form/shrcnybSDE4Id1JnA5EQ0scv1Ph

生数科技发布Vidu，中国首个长时长、高一致性、高动态性视频大模型

合作伙伴计划

豆包 - 字节跳动旗下免费AI智能助手

SpeedAI - 专业的AIGC检测、降重降AI平台

千问 - 阿里旗下 AI 智能助手

LibTV - LiblibAI 推出的 AI 视频创作平台，剧本分镜成片一站式完成

星流 - LiblibAI 推出的一站式 AI 设计 Agent

讯飞智文 - 科大讯飞推出的 AI PPT 与文档生成工具

讯飞译制 - AI视频字幕制作与多语种译制平台

LongCat-2.0：美团发布并开源的万亿参数AI模型

图颜AI - 工作室 / 跨境电商必备AI设计助手

千问输入法 - 阿里千问推出的 AI 语音输入法，说完即成稿

袋马 daimax - 高德推出的AI 应用生成平台，一句话生成微信小程序和 iOS 应用

WPS Office：金山办公推出的一站式办公服务平台

合作伙伴计划

百家云发布AIGC新品「市场易」，市场营销驶入大模型时代

AI网络安全公司CalypsoAI获得2300万美元融资

法国总统宣布加大对人工智能领域的投入，打造5到10个人工智能产业群

王小川旗下百川智能发布Baichuan-13B大模型 130亿参数开源可商用

豆包 - 字节跳动旗下免费AI智能助手

SpeedAI - 专业的AIGC检测、降重降AI平台

千问 - 阿里旗下 AI 智能助手

LibTV - LiblibAI 推出的 AI 视频创作平台，剧本分镜成片一站式完成

星流 - LiblibAI 推出的一站式 AI 设计 Agent

讯飞智文 - 科大讯飞推出的 AI PPT 与文档生成工具

讯飞译制 - AI视频字幕制作与多语种译制平台

LongCat-2.0：美团发布并开源的万亿参数AI模型

图颜AI - 工作室 / 跨境电商必备AI设计助手

千问输入法 - 阿里千问推出的 AI 语音输入法，说完即成稿

袋马 daimax - 高德推出的AI 应用生成平台，一句话生成微信小程序和 iOS 应用

WPS Office：金山办公推出的一站式办公服务平台