-
谷歌发布 Nano Banana Pro:新一代图像生成与编辑模型亮相
2025 年 11 月 20 日,Google DeepMind 正式推出其新一代图像生成与编辑模型——Nano Banana Pro(也被标识为 Gemini 3 Pro Image),旨在将用户的创意直接转化为“工作室级别”的视觉资产。 这一版本承接此前爆红的 Nano Banana 系列(Gemini 2.5 Flash Image),但向前迈出了关键一步:融合更强的 “世界知识理解”、清晰…... -
蚂蚁集团正式发布全模态 AI 助手「灵光」,一句话可生成小应用
2025 年 11 月 18 日,蚂蚁集团正式发布全模态 AI 助手 「灵光」,面向个人用户与开发者提供“自然语言生成小应用”的能力。灵光主打“一句话生成工具”,最快 30 秒即可创建一个可交互的小应用,支持编辑、分享与二次交互。 灵光具备文字、图像、语音、视频、3D 模型、动画等多模态理解与生成能力,并提供三大核心模式: 灵光对话:支持自然语言交互,多模态结果可直接呈现图表、模型、音视频内容。 …... -
美团发布AI编程 IDE 工具 - CatPaw,支持龙猫等多种模型混合调用
2025年11月10日,美团正式发布自研 AI 编程 IDE 工具——CatPaw。这款工具以“Agent + 人协作”为核心理念,将 AI 从辅助生成器升级为真正懂代码、会执行、能优化的智能开发伙伴。 CatPaw 集成了美团自研大模型 LongCat,并支持多模型混合调用。它为开发者提供四大核心能力: 🧩 Tab(代码补全预测):智能识别上下文逻辑,实时补全下一行代码。 🤖 Agent(快速问…... -
DeepSeek 发布 DeepSeek-V3.1-Terminus:优化语言一致性,强化 Agent 能力
2025 年 9 月 22 日,DeepSeek 正式发布其开源大语言模型的最新更新版 — DeepSeek-V3.1-Terminus。该版本在前代 V3.1 的基础上,结合用户反馈进行了深度优化,重点提升了语言一致性与智能体能力。 据官方介绍,DeepSeek-V3.1-Terminus 同时提供思考模型与非思考模型,上下文窗口均为 128k,支持在线体验。输出长度方面,非思考模型默认 4K、…... -
美团推出 AI 生活助手“小美”,开启本地生活智能化新体验
2025年9月12日,美团正式发布首款独立 AI 助手 App——小美,目前已在 iOS App Store 上线并进入公测阶段。 小美定位为 AI Agent 本地生活助手,主打“帮你想、代你办”。用户可通过自然语言一句话完成点外卖、安排工作餐或奶茶团单,系统会自动选择餐厅并完成下单;对于有“选择困难”的场景,小美能结合预算、口味和距离给出推荐,并可代为订座或排队,实时同步等位进度。 此外,小美…... -
通义千问推出新一代语音识别模型 Qwen3-ASR-Flash
2015年9月8日,阿里旗下通义千问团队正式发布最新语音识别模型 Qwen3-ASR-Flash。该模型基于 Qwen3 底座训练,结合千万小时级别的多模态与 ASR 数据,主打高精度与高鲁棒性,支持 11 种语言及多种方言,并在中英文及多语种基准测试中取得领先成绩。 Qwen3-ASR-Flash 最大亮点在于 支持上下文定制与歌声识别。用户可输入关键词、段落或整篇文档作为背景提示,模型将智能匹…... -
美团发布自研大模型 LongCat-Flash-Chat,上线在线助手 LongCat AI
近日,美团正式发布自研大模型 LongCat-Flash-Chat,并同步推出基于该模型的在线对话平台 LongCat AI,标志着美团在人工智能基础模型和应用层面的双重布局。 LongCat-Flash-Chat 是基于美团自研基础模型 LongCat-Flash 打造的对话增强模型,规模高达 5600 亿参数,采用 Mixture-of-Experts 架构 与动态专家激活机制,平均每个 to…... -
DeepSeek-V3.1 发布,迈向智能 Agent 时代的关键一步
2025 年 8 月 21 日,深度求索公司正式发布新一代语言模型 DeepSeek-V3.1,标志着其在智能 Agent 领域迈出了重要一步。新版本在混合推理架构、思考效率和 Agent 能力等方面均有显著提升。 核心亮点 混合推理架构:DeepSeek-V3.1 支持思考模式与非思考模式的自由切换,用户可根据需求选择深度推理或快速回答。 更高的思考效率:相比前代模型,V3.1 在减少输出 to…... -
OpenAI发布GPT-OSS:开源权重大模型,原生支持128K上下文
2025年8月5日,OpenAI 宣布推出全新开放权重大语言模型系列 GPT-OSS,这是自 GPT-2 以来该机构首次发布支持本地部署的模型权重。新系列包括两个版本:轻量的 GPT-OSS-20B 和高性能的 GPT-OSS-120B,均采用 Mixture-of-Experts(MoE)架构,在保持生成能力的同时显著降低计算资源消耗。 相比传统闭源模型,GPT-OSS 系列具备更强的开放性与可…... -
Manus 推出 Wide Research 功能,多智能体并发处理大规模任务
2025年8月1日,AI智能体平台 Manus 上线了名为「Wide Research」的新功能,允许用户通过多个 AI 智能体并发处理大规模任务,如批量生成设计稿、评选MBA项目或分析股票表现。这项功能已率先向 Pro 用户开放,后续将逐步开放给 Plus 和 Basic 用户。 Wide Research 的核心亮点 1、系统级并行处理与智能体协作 Wide Research 的关键在于其系统…... -
阿里通义开源视频生成模型 Wan2.2
2025 年 7 月 28 日,阿里巴巴通义实验室正式开源了 Wan2.2,这是一款专为电影级视觉控制和高质量视频创作设计的开源视频生成模型。Wan2.2 通过混合专家(MoE)架构,实现了对电影镜头语言的深度理解和还原,支持多维度的视觉呈现,如光影、色彩和构图。此外,它在数据训练规模和专业美学训练上实现了双重升级,显著提升了复杂场景的表现力和美学表现能力。 核心功能 文生视频:具备电影级视觉控制…... -
GLM-4.5 发布,面向推理、代码与智能体的开源 SOTA 模型
2025 年 7 月 28 日,智谱 AI 团队正式发布了新一代旗舰模型 GLM-4.5,这是一款专为智能体应用打造的基础模型,标志着开源模型在推理、代码生成和智能体能力上达到了新的高度。 GLM-4.5 采用了混合专家(MoE)架构,总参数量达 3550 亿,激活参数 320 亿。其姊妹模型 GLM-4.5-Air 则更为精简,总参数量 1060 亿,激活参数 120 亿。两者均在 15 万亿 …... -
通义千问发布Qwen3-Coder,推动代理编程领域发展
近日,阿里通义千问团队发布了其最新的编程模型——Qwen3-Coder,旨在为开发者提供更强大的代码生成和代理编程能力。Qwen3-Coder-480B-A35B-Instruct 是目前最强大的版本,采用了 4800 亿参数和 35B 激活参数的 MoE(混合专家)模型,能够支持原生 256K token 的上下文,并通过 YaRN 技术扩展至 1M token。该模型在代理编程、浏览器使用和工…... -
字节跳动发布 Trae 2.0 ,全新 SOLO 模式来袭
近日,字节跳动推出了 Trae 2.0,带来了革命性的 SOLO 模式,致力于改变传统软件开发的工作流程。SOLO 模式不仅是一个“写代码的机器人”,它被重新定义为一位“上下文工程师”,能够理解整个开发过程中的产品需求、技术方案、代码编写、调试和部署等环节,无需工具切换或重复沟通。 产品亮点 一体化 SOLO 模式:Trae SOLO 能够独立完成从需求生成到产品部署的全过程。它集成了编辑器、浏览…... -
OpenAI 正式发布AI智能体 ChatGPT Agent
2025 年 7 月 18 日,OpenAI 正式发布 ChatGPT Agent,这一创新工具将 AI 的对话能力与网络交互能力深度融合,为用户带来前所未有的自动化任务处理体验。ChatGPT Agent能够理解自然语言指令,主动选择并使用合适的网络工具完成复杂任务,如财务研究、在线表格填写、幻灯片制作等,显著提升工作效率。 核心功能亮点 任务自动化:ChatGPT Agent可处理多种复杂任务…...






























