-
Sana - 英伟达等推出的开源图像生成模型,支持生成4096×4096图像
Sana是由英伟达、麻省理工学院和清华大学等联合推出的文本到图像合成框架,能够快速生成高达4096×4096分辨率的高质量图像。Sana的核心设计包括深度压缩自编码器、线性DiT、解码器仅文本编码器和高效的训练与采样策略。这些设计使得Sana在保持图像质量的同时,显著提高了生成速度,甚至可以在笔记本电脑的GPU上部署。- 1.3k
- 0
-
Step-1X-Medium:阶跃星辰推出的新一代图像生成模型,支持图生图和一键风格迁移
Step-1X-Medium 是由阶跃星辰推出的新一代图像生成模型,显著提升生成速度、理解能力、细节质感以及创作功能,目标成为创作者的得力助手。升级后的模型能够更精准地理解用户指令,生成更契合需求的图像作品,并新增了“图生图”的垫图、风格迁移等更丰富的创作玩法,进一步降低创作门槛。- 2.7k
- 0
-
Amazon Nova:亚马逊推出的新一代多模态AI大模型,覆盖文本、图像、视频
Amazon Nova 是亚马逊 AWS 推出的一款先进的生成式AI基础大模型,包括4款语言模型、1款图像模型和1款视频模型,Nova 的模型支持处理文本、图像和视频的输入与输出,提供前沿智能与行业领先的性价比。能够为不同行业提供高效、低成本的解决方案,支持语言理解、图像/视频生成以及多模态能力等任务。- 1.5k
- 0