-
美团推出 AI 生活助手“小美”,开启本地生活智能化新体验
2025年9月12日,美团正式发布首款独立 AI 助手 App——小美,目前已在 iOS App Store 上线并进入公测阶段。 小美定位为 AI Agent 本地生活助手,主打“帮你想、代你办”。用户可通过自然语言一句话完成点外卖、安排工作餐或奶茶团单,系统会自动选择餐厅并完成下单;对于有“选择困难”的场景,小美能结合预算、口味和距离给出推荐,并可代为订座或排队,实时同步等位进度。 此外,小美…... -
通义千问推出新一代语音识别模型 Qwen3-ASR-Flash
2015年9月8日,阿里旗下通义千问团队正式发布最新语音识别模型 Qwen3-ASR-Flash。该模型基于 Qwen3 底座训练,结合千万小时级别的多模态与 ASR 数据,主打高精度与高鲁棒性,支持 11 种语言及多种方言,并在中英文及多语种基准测试中取得领先成绩。 Qwen3-ASR-Flash 最大亮点在于 支持上下文定制与歌声识别。用户可输入关键词、段落或整篇文档作为背景提示,模型将智能匹…... -
美团发布自研大模型 LongCat-Flash-Chat,上线在线助手 LongCat AI
近日,美团正式发布自研大模型 LongCat-Flash-Chat,并同步推出基于该模型的在线对话平台 LongCat AI,标志着美团在人工智能基础模型和应用层面的双重布局。 LongCat-Flash-Chat 是基于美团自研基础模型 LongCat-Flash 打造的对话增强模型,规模高达 5600 亿参数,采用 Mixture-of-Experts 架构 与动态专家激活机制,平均每个 to…... -
DeepSeek-V3.1 发布,迈向智能 Agent 时代的关键一步
2025 年 8 月 21 日,深度求索公司正式发布新一代语言模型 DeepSeek-V3.1,标志着其在智能 Agent 领域迈出了重要一步。新版本在混合推理架构、思考效率和 Agent 能力等方面均有显著提升。 核心亮点 混合推理架构:DeepSeek-V3.1 支持思考模式与非思考模式的自由切换,用户可根据需求选择深度推理或快速回答。 更高的思考效率:相比前代模型,V3.1 在减少输出 to…... -
OpenAI发布GPT-OSS:开源权重大模型,原生支持128K上下文
2025年8月5日,OpenAI 宣布推出全新开放权重大语言模型系列 GPT-OSS,这是自 GPT-2 以来该机构首次发布支持本地部署的模型权重。新系列包括两个版本:轻量的 GPT-OSS-20B 和高性能的 GPT-OSS-120B,均采用 Mixture-of-Experts(MoE)架构,在保持生成能力的同时显著降低计算资源消耗。 相比传统闭源模型,GPT-OSS 系列具备更强的开放性与可…... -
Manus 推出 Wide Research 功能,多智能体并发处理大规模任务
2025年8月1日,AI智能体平台 Manus 上线了名为「Wide Research」的新功能,允许用户通过多个 AI 智能体并发处理大规模任务,如批量生成设计稿、评选MBA项目或分析股票表现。这项功能已率先向 Pro 用户开放,后续将逐步开放给 Plus 和 Basic 用户。 Wide Research 的核心亮点 1、系统级并行处理与智能体协作 Wide Research 的关键在于其系统…... -
阿里通义开源视频生成模型 Wan2.2
2025 年 7 月 28 日,阿里巴巴通义实验室正式开源了 Wan2.2,这是一款专为电影级视觉控制和高质量视频创作设计的开源视频生成模型。Wan2.2 通过混合专家(MoE)架构,实现了对电影镜头语言的深度理解和还原,支持多维度的视觉呈现,如光影、色彩和构图。此外,它在数据训练规模和专业美学训练上实现了双重升级,显著提升了复杂场景的表现力和美学表现能力。 核心功能 文生视频:具备电影级视觉控制…... -
GLM-4.5 发布,面向推理、代码与智能体的开源 SOTA 模型
2025 年 7 月 28 日,智谱 AI 团队正式发布了新一代旗舰模型 GLM-4.5,这是一款专为智能体应用打造的基础模型,标志着开源模型在推理、代码生成和智能体能力上达到了新的高度。 GLM-4.5 采用了混合专家(MoE)架构,总参数量达 3550 亿,激活参数 320 亿。其姊妹模型 GLM-4.5-Air 则更为精简,总参数量 1060 亿,激活参数 120 亿。两者均在 15 万亿 …... -
通义千问发布Qwen3-Coder,推动代理编程领域发展
近日,阿里通义千问团队发布了其最新的编程模型——Qwen3-Coder,旨在为开发者提供更强大的代码生成和代理编程能力。Qwen3-Coder-480B-A35B-Instruct 是目前最强大的版本,采用了 4800 亿参数和 35B 激活参数的 MoE(混合专家)模型,能够支持原生 256K token 的上下文,并通过 YaRN 技术扩展至 1M token。该模型在代理编程、浏览器使用和工…... -
字节跳动发布 Trae 2.0 ,全新 SOLO 模式来袭
近日,字节跳动推出了 Trae 2.0,带来了革命性的 SOLO 模式,致力于改变传统软件开发的工作流程。SOLO 模式不仅是一个“写代码的机器人”,它被重新定义为一位“上下文工程师”,能够理解整个开发过程中的产品需求、技术方案、代码编写、调试和部署等环节,无需工具切换或重复沟通。 产品亮点 一体化 SOLO 模式:Trae SOLO 能够独立完成从需求生成到产品部署的全过程。它集成了编辑器、浏览…... -
OpenAI 正式发布AI智能体 ChatGPT Agent
2025 年 7 月 18 日,OpenAI 正式发布 ChatGPT Agent,这一创新工具将 AI 的对话能力与网络交互能力深度融合,为用户带来前所未有的自动化任务处理体验。ChatGPT Agent能够理解自然语言指令,主动选择并使用合适的网络工具完成复杂任务,如财务研究、在线表格填写、幻灯片制作等,显著提升工作效率。 核心功能亮点 任务自动化:ChatGPT Agent可处理多种复杂任务…... -
美图推出RoboNeo,专注影像生产力的 AI 智能体
近日,美图公司正式推出 RoboNeo,一款专注于影像生产力的 AI 智能体产品。RoboNeo 旨在通过自然语言交互,帮助用户轻松完成修图、设计和视频制作等任务,让每位用户都能成为“发号施令的甲方”,仅通过语音指令即可完成复杂的视觉创作需求。 RoboNeo 的核心功能包括智能修图、AI 设计生成、视频智能处理和多模态创作。用户可以通过简单的指令,如“帮我换一个新发型”或“把背景换成海边”,快速…... -
字节跳动推出小荷 AI 医生,开启健康管理便捷新时代
近日,字节跳动正式推出其首款独立 AI 医疗助手应用 ——“小荷 AI 医生”,致力于为用户打造贴心专属的健康管家,标志着公司在医疗科技领域迈出重要一步。 小荷 AI 医生功能丰富且实用。在健康咨询方面,用户无需排队挂号,随时随地就能获取专业健康指导。无论是疾病自查、用药参考,还是日常健康建议,它都能快速响应。并且,该应用会主动收集如症状持续时间、过敏史等关键信息,让给出的解答更全面、精准和个性…... -
B站推出“代号H”AI创作工具,发力视频播客
2025年7月7日,B站宣布推出内部代号为“代号H”的AI创作工具,并同步启动视频播客创作者扶持计划,标志着平台在AI内容创作领域的又一重要布局。 “代号H”是一款专为视频播客创作者设计的AI工具,支持文案与音频两种输入格式,可自动生成与内容匹配的视频画面。该工具目前主要适配播客及泛知识杂谈类内容,具备高效生成能力——千字内容可在6分钟内完成视频制作,未来有望进一步压缩至3分钟。据内部人士透露,工…... -
阿里推出ThinkSound音频生成模型,可像“专业音效师”一样思考
2025年7月4日,阿里通义实验室正式发布了旗下首个音频生成模型——ThinkSound。这一突破性技术首次将思维链(CoT)概念应用于音频生成领域,让AI可以像“专业音效师”一样理解画面事件与声音的关系,突破了传统音频生成的局限。 ThinkSound的核心亮点在于其精确的空间音频生成能力,不仅能够为视频画面配音,更能根据画面内容做出深入的推理,生成高保真、时序精确的音效。这一技术的发布,将大大…...