-
美团推出智能经营助手“袋鼠参谋”,助力中小商家精细化运营
AIHub最新消息,近日美团推出AI智能运营辅助产品 “袋鼠参谋”,定位为基于大语言模型的本地商业智能助手,专为中小商家提供营销诊断、经营优化、行业数据解读等多项实用功能。 袋鼠参谋融合美团多年积累的本地生活服务数据与AI能力,具备强大的自然语言理解与多模态交互能力,支持商家通过文字、语音、图片、文件等方式提出问题,系统可实时生成个性化的运营建议与决策支持。无论是选址开店、菜品优化,还是营销转化、…... -
阿里通义千问宣布推出多模态模型 Qwen VLo,实现从感知到生成的跨越
2025年6月26日,阿里巴巴达摩院通义千问团队正式发布其最新多模态模型 —— Qwen VLo,标志着通义在图文理解与生成能力上的重大突破,实现了从“看懂”世界到“描绘”世界的跨越式提升。 Qwen VLo 是一款统一的视觉-语言模型,具备图文双向交互能力,不仅能理解图像内容,还可根据自然语言指令进行高质量图像生成与编辑。模型支持风格迁移、背景更换、物体添加等复杂视觉操作,同时具备视觉感知任务能…... -
蚂蚁集团发布 AI 健康应用 AQ:可看病症、看医生、看报告
2025年6月26日,蚂蚁集团正式发布旗下全新 AI 健康应用 —— AQ,致力于打造“人人可用的智能健康管家”。该应用融合前沿大模型技术,具备强大的医疗问诊、报告解读和健康管理能力,帮助用户实现从“看病症”到“找医生”、“看报告”的一站式体验。 AQ 搭载蚂蚁自研医疗大模型,支持文本、语音、图像等多模态输入,覆盖包括皮肤病识别、体检报告解析、药品识别等功能。用户可以通过打字、说话或拍照,快速获取…... -
小米AI眼镜明晚发布,支持第一人称视角拍摄,可同步拍摄、记录
2025年6月25日,小米公司宣布将于明晚正式发布其全新的小米AI眼镜,并透露该设备将支持第一人称视角拍摄,能够同步进行拍摄与记录。这一功能特别适用于健身、骑行、攀岩、做饭等日常活动,可以让用户无需手持设备便能捕捉周围的场景。小米强调,这款眼镜面向的是“下一代的个人智能设备”,致力于提供更智能、更便捷的日常体验。 产品定位与功能亮点 小米AI眼镜在发布前夕就吸引了不少关注。根据雷军的描述,这款眼镜…... -
蚂蚁集团AI理财助理“蚂小财”全面升级,增强金融服务能力
2025年6月23日,蚂蚁集团宣布旗下AI理财助理“蚂小财”进行了重大升级,全面提升了其在金融领域的服务能力和用户体验。这次升级在蚂蚁自研的大模型基础上,新增了推理大模型的接入,并对其进行了金融领域的增强,使得“蚂小财”在理财专业性、逻辑推理和沟通表达上远超通用大模型。升级后的“蚂小财”集成了超过200家专业机构的服务,并加入了“盯盘”和“诊基”等新功能,进一步拓展了其理财服务的深度和广度。 新功…... -
MiniMax 推出全球首个开源大规模混合架构推理模型 M1,性能媲美 Gemini 2.5 Pro
2025年6月17日,中国人工智能公司 MiniMax(稀宇科技)今日正式发布开源推理大模型 MiniMax-M1,号称为“全球首个开源大规模混合架构推理模型”,具备高性价比与强大性能,向生产力复杂场景全面进军。 M1 模型拥有高达 4560亿参数(456B),支持 最长100万 Token 的上下文输入,并实现了 业内最长的 8 万 Token 推理输出,效率远超国内外多个同类模型。其基于创新的…... -
字节跳动AI编程平台Trae月活破百万,助力交付60亿行代码
2025年6月12日,字节跳动官方宣布,截至2025年5月,旗下AI原生集成开发环境(IDE)Trae 月活跃用户已突破100万,累计帮助开发者交付超过60亿行代码,成为AI编程领域的现象级产品。 Trae通过自然语言生成项目框架、实时代码优化和多模态代码生成等功能,大幅提升开发效率,深受全球程序员青睐。其Builder模式支持用户仅需输入一句描述,即可生成完整项目代码。而Chat模式则能即时辅助…... -
小红书开源大语言模型 dots.llm1,主打中文能力与高效推理
近日,小红书正式开源其首个自研大语言模型 dots.llm1。该模型基于 MoE(专家混合)架构,参数总量为 1420 亿,实际推理中激活 140 亿参数,旨在平衡模型性能与推理效率。 dots.llm1 的预训练数据由 11.2 万亿个非合成 token 构成,覆盖中英文语料,未使用合成数据。模型使用了三阶段数据处理流程,优化数据质量并提升知识分布均衡性。架构上采用多头注意力机制、RMSNorm…... -
爱诗科技推出PixVerse国内版“拍我AI”
2025年6月6日,爱诗科技AIsphere正式宣布其旗下产品PixVerse国内版——“拍我AI”正式上线。自2024年1月PixVerse上线以来,用户对于国内版的推出一直充满期待,此次“拍我AI”的上线,标志着该产品正式面向国内用户开放。 “拍我AI”网页端和移动端同步上线,产品支持最新发布的V4.5版本,用户可通过网页端以及App端进行体验。此外,拍我AI同步上线API产品——拍我AI开放…... -
阿里云通义灵码重磅更新,推出全新通义灵码AI IDE
2025年5月30日,阿里云通义灵码宣布重磅更新,推出全新的通义灵码AI IDE。这是阿里云旗下的首个AI原生开发环境工具,深度适配了最新的千问3大模型,并集成国内最大的魔搭MCP市场,可调用超过3000个MCP服务,一键安装部署。此次更新标志着阿里云在AI编程领域迈出了重要一步,为开发者提供了强大的智能编程工具。 通义灵码AI IDE的核心功能 1、多种会话模式 通义灵码AI IDE支持三种会话…... -
DeepSeek 发布DeepSeek-R1-0528 ,编程与推理能力大幅跃升
2025年5月28日,人工智能公司DeepSeek低调发布了其R1推理模型的最新版本——DeepSeek-R1-0528。尽管官方称此次为“小版本试升级”,但实测结果显示,该版本在编程、逻辑推理和长文本处理等方面取得了显著提升。在LiveCodeBench基准测试中,DeepSeek-R1-0528的代码生成能力紧随OpenAI的o3和o4 mini模型,超越了xAI的Grok 3 mini和阿里…... -
扣子空间推出极致拟人 AI 播客,开启内容创作新纪元
2025年5月27日,AI Agent 平台扣子空间正式上线“极致拟人化”AI 播客功能,以惊人程度的自然语言处理与情绪合成能力,引发内容创作领域的广泛关注。 该功能支持用户一键将文字内容(如公众号文章、PDF、网页链接等)转换为一段带有自然语气、真实打断与情感互动的双人播客音频,突破了传统文本转语音(TTS)技术“机械感”与“朗读腔”的瓶颈。播客音频不仅可即时播放,还自动生成字幕与可视化网页,极…... -
腾讯发布“混元游戏”,打造首个工业级AIGC游戏内容生成引擎
2025年5月20日,腾讯正式发布“混元游戏”视觉生成平台,标志着首个面向游戏工业级内容生产的AIGC引擎正式上线。该平台基于腾讯自研“混元大模型”,融合AI美术管线、实时画布、2D图像生成、角色多视图等能力,致力于大幅提升游戏资产生产效率。 “混元游戏”通过一站式AI美术工具链,支持从文本到草图、从角色设定到三视图与360°视频的全流程自动化生成,为游戏设计师提供前所未有的创作效率。根据官方介绍…... -
OpenAI 发布AI编程工具Codex,支持自然语言执行开发任务
2025年5月16日,OpenAI 推出了名为 Codex 的云端软件工程智能体,旨在通过自然语言指令自动执行多项编程相关任务。该工具由 codex-1 模型驱动,目前已集成进 ChatGPT 的 Pro、Team 和 Enterprise 版本,Plus 用户也将在后续获得访问权限。 Codex 的主要功能包括: 代码生成与修复:可根据自然语言描述生成代码,支持基础功能实现、错误修复与测试编写。…... -
Manus正式上线图像生成功能
2025年5月16日,Manus 在X平台宣布正式上线图像生成功能,实现从品牌创意到图像设计再到网站搭建的一站式任务处理流程。该功能不仅支持输入文本生成视觉图像,还能智能理解用户意图并生成完整方案,例如瓶身设计、场景图像、商品展示图等。...