-
Kimi 发布并开源 K2.6:Agent、长程编码与多模态能力全面升级
月之暗面正式发布并开源 Kimi K2.6,新模型支持文本、图片、视频输入,强化长程代码执行、Agent 集群协作与多步工具调用能力,并已上线 Kimi、API 和 Kimi Code。- 1.3k
- 0
-
GLM-5V-Turbo - 智谱推出的多模态 Coding 基座模型
GLM-5V-Turbo 是智谱 AI 推出的首个多模态 Coding 基座模型,面向视觉编程任务,支持图像、视频、文本、文件多模态输入,200K 上下文窗口。深度适配 Agent 工作流,可与 Claude Code、OpenClaw 等 Agent 协同,完成前端复刻、代码调试、GUI 自主探索等视觉编程场景,在 AndroidWorld、WebVoyager、PinchBench 等基准测试…- 557
- 0
-
Xiaomi MiMo-V2-Omni:小米全模态 Agent 基座模型,图像视频音频文本统一理解
Xiaomi MiMo-V2-Omni 是小米 MiMo 团队发布的全模态 Agent 基座模型,将图像、视频、音频编码器融合进统一骨干网络,原生支持结构化工具调用、函数执行与 UI 定位。音频理解超越 Gemini 3 Pro,图像理解超越 Claude Opus 4.6,多模态 Agent 评测超越 Gemini 3 Pro 和 GPT-5.2,支持超过 10 小时连续音频理解,现已开放 AP…- 857
- 0




