-
HappyHorse - 阿里巴巴推出的 AI 视频生成模型
HappyHorse 是阿里巴巴 ATH 创新事业部研发的 AI 视频生成模型,支持文本转视频、图像转视频,以及带原生音频和不带音频的多种生成模式。- 2.9k
- 0
-
Muse Spark - Meta AI 推出的原生多模态推理模型
Muse Spark 是 Meta AI 推出的原生多模态推理模型,支持工具调用、视觉链式思考和多智能体协作,已用于 Meta AI app 与网页端,并将逐步接入更多 Meta 产品生态。- 814
- 0
-
Qwen3.6-Plus - 阿里新一代多模态推理与智能体编程模型
Qwen3.6-Plus 是阿里巴巴推出的新一代多模态大模型,支持文本、图像、视频输入,具备逻辑推理、代码生成、工具调用、图像与视频理解等能力,适合智能体、企业应用与自动化工作流场景。官方通过阿里云百炼 API 提供接入。- 2.4k
- 0
-
Emu3:智源推出的原生多模态世界模型,可实现图像、文本、视频的统一理解和生成
Emu3是智源研究院发布的原生多模态世界模型,该模型只基于下一个 token 预测,无需扩散模型或组合方法,即可完成文本、图像、视频三种模态数据的理解和生成- 6.2k
- 0
-
Grok-1.5V:xAI发布的多模态AI大模型
Grok-1.5V不仅具备强大的文本处理能力,还可以处理各种视觉信息,如文档、图表、截图和照片。这使得Grok-1.5V能够在多学科推理、理解科学图表、阅读文本和实现真实世界的空间理解等领域与现有的前沿多模态模型竞争。- 6.7k
- 0






