-
Step1X-3D:阶跃星辰开源的3D大模型,支持生成高保真可控的3D内容
Step1X-3D 是由阶跃星辰正式发布并开源的一款3D大模型。该模型是继图像、视频、语音、音乐等模态后,阶跃星辰在多模态AI方向的最新成果,专注于生成高保真、可控的3D内容。- 995
- 0
-
Seed1.5-VL:字节跳动推出的视觉-语言多模态基础模型
Seed1.5-VL 是字节跳动推出的视觉-语言多模态基础模型,结合图像编码器与200亿激活参数的大语言模型,具备出色的图像、视频理解与推理能力。在60项基准测试中获得38项SOTA,广泛应用于视频问答、图表理解、GUI智能体等任务,表现稳定、推理强大。- 612
- 0
-
Matrix-Game:昆仑万维开源的交互式世界基础模型
Matrix-Game是由昆仑万维开源的交互式世界基础模型,能够生成完整可交互的游戏世界,能够对人类输入的操作指令进行正确响应,保留了游戏世界的空间结构与物理特性,画面也更加精致,超越了以往所有类似开源世界模型。- 848
- 0
-
Seed-Coder:字节跳动最新推出的开源代码模型
Seed-Coder 是字节跳动开源的 8B(80亿参数)级代码大模型,它包括 Base、Instruct 和 Reasoning 三个版本,具备强大的代码生成、理解和推理能力。其最大亮点是采用“模型自助式”数据管道,利用大模型自动筛选和构建高质量训练数据,减少人工规则依赖。- 1k
- 0
-
HunyuanCustom:腾讯混元开源的多模态定制化视频生成工具
HunyuanCustom是腾讯混元推出的一款多模态定制化视频生成工具,它基于混元视频生成大模型(HunyuanVideo)打造,融合了文本、图像、音频、视频等多模态输入,能够生成高质量的定制化视频。该工具在主体一致性效果上超越了现有的开源方案,具备高度控制力和生成质量。- 1.2k
- 0
-
DeepSeek-Prover-V2:DeepSeek最新开源的数学定理证明模型,参数量高达6710亿
DeepSeek-Prover-V2 是由 DeepSeek 最新开源的超大规模数学定理证明模型,参数量高达 6710 亿(671B),相比前代 Prover-V1.5(约 7B)提升近百倍,成为目前开源中最大规模的数学推理模型之一。该模型专为形式化数学证明设计,能够生成兼容 Lean 4 等主流证明助手的高质量证明步骤,支持复杂逻辑验证、定理发现与教学应用。- 3.4k
- 0
-
Kimi-Audio:Kimi开源的通用音频基础模型,支持语音识别、音频理解等多种任务
Kimi-Audio是kimi开源的全新通用音频基础模型,支持语音识别、音频理解、音频转文本、语音对话等多种任务,在十多个音频基准测试中实现了最先进的 (SOTA) 性能。- 1.5k
- 0
-
Gemini 2.5 Flash:Google 推出的首个完全混合推理模型
Gemini 2.5 Flash 是 Google 推出的首个完全混合推理模型,允许开发人员灵活控制模型的思考功能,可开启或关闭。它还支持设置思考预算,帮助开发者在质量、成本和延迟之间找到最佳平衡。即使关闭思考功能,模型仍能保持 2.0 Flash 的高速度,并进一步提升性能,兼具高效推理和成本效益。目前处于预览阶段,支持通过 API 在 Google AI Studio 和 Vertex AI …- 2.1k
- 0
-
豆包1.5·深度思考模型:火山引擎推出的AI推理模型
在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出,在AIME 2024、Codeforces、GPQA等多项权威基准上达到或接近业界第一梯队水平。支持128k上下文窗口,16k输出。- 2.1k
- 0
-
减单 - 安徽医科大学等推出的体重管理大模型智能助手
“减单”是由安徽医科大学联合中国科学技术大学附属第一医院和健康科技企业共同发布的体重管理大模型智能助手。它基于国内外多个AI大模型技术,结合超过40万名肥胖相关慢性疾病患者的管理数据训练而成,旨在借助AI技术提高减重的个性化干预质量和诊疗效率。- 1.8k
- 0
-
Skywork R1V:昆仑万维开源的多模态视觉思维链推理模型
Skywork R1V 是昆仑万维开源的多模态视觉思维链推理模型,专注于通过多步逻辑推理解决复杂的视觉任务。它结合了强大的文本推理能力和视觉理解能力,能够处理视觉逻辑推理、数学问题、科学现象分析等任务。- 1.2k
- 0
-
Gemma 3:Google 推出的轻量级高性能开源模型,支持单个GPU运行
Gemma 3 是 Google 推出的轻量级、高性能开源模型,支持多种尺寸(1B、4B、12B 和 27B),专为单 GPU 或 TPU 设计。它支持 140 多种语言,具备高级文本和视觉推理能力,配备 128k-token 上下文窗口和函数调用功能,支持复杂任务处理。Gemma 3 提供量化版本,优化性能,降低计算需求,并配备安全特性。它无缝集成多种开发工具,支持灵活部署,助力开发者快速构建高…- 5.4k
- 0
-
QwQ-32B:阿里云开源的最新AI推理模型,更小尺寸,消费级显卡即可部署
QwQ-32B 是阿里云开源的320亿参数推理模型,具备强大的数学、代码和通用推理能力,性能比肩全球顶尖开源模型。它支持消费级显卡部署,降低硬件门槛,同时集成智能体能力,可灵活调整推理过程。采用Apache 2.0协议开源,用户可免费下载、商用和定制化开发,推动AI技术的广泛应用。- 8.7k
- 0
-
SpeciesNet - 谷歌开源的AI模型,助力野生动物识别和保护
SpeciesNet是谷歌开源的一款AI模型,专为识别野生动物而设计。它通过分析相机陷阱拍摄的照片,能够将图像分类为超过2000个标签,涵盖动物物种、分类群和非动物对象。模型基于6500万张图像训练,具备高准确性和广泛适用性,采用Apache 2.0开源许可,助力生物多样性研究和保护。- 1.3k
- 0
-
企业微信接入DeepSeek,开启智能化办公新纪元
2025年2月21日,企业微信宣布正式接入DeepSeek R1,并同步支持腾讯混元大模型。此次更新带来了多项基于AI的功能升级,包括“智能机器人”和“智能表格-客户跟进总结”,旨在大幅提升企业内部协作和客户服务的效率。- 1.7k
- 0
-
-
Phantom - 字节跳动推出的主体一致性视频生成框架
Phantom 是字节跳动推出的主体一致视频生成技术,通过跨模态对齐实现高质量视频创作。它支持单张或多张参考图像生成,可保留主体身份特征,生成生动的视频内容,适用于虚拟试穿、广告制作、动画等场景。- 2.7k
- 0
-
Grok 3:马斯克旗下XAI发布的新一代AI大模型
Grok 3是由埃隆·马斯克旗下公司xAI开发的的新一代大语言模型系列,包括Grok-3及其精简版Grok-3 mini。Grok 3计算能力是前代的十倍,具备思维链推理和逻辑一致性。数学、科学推理和编程能力领先,AIME'24得52分,科学知识75分,编程57分,AIME 2025得93分,LMSYS聊机竞技场得1400分。新增Big Brain和DeepSearch模式,优化复杂任务…- 67.7k
- 0
-
昆仑万维发布Matrix-Zero世界模型,开启空间智能新时代
2025年2月14日,昆仑万维正式推出Matrix-Zero世界模型,成为中国首家同时推出3D场景生成与可交互视频生成模型的企业。这一创新产品标志着空间智能技术的新突破,并将为内容创作行业带来颠覆性变革。 Matrix-Zero世界模型由两大核心子模型构成: 3D场景生成大模型:该模型可以将用户提供的图片转化为高度真实且可自由探索的3D场景,支持动态物理效果,满足游戏开发、影视制作等行业对快速建模…- 977
- 0
-
Matrix-Zero:昆仑万维发布的AI世界模型,支持单张图生成3D世界
Matrix-Zero 是昆仑万维发布的世界模型,包含两款子模型:3D 场景生成大模型和可交互视频生成大模型。3D 场景生成大模型能将图片转化为可自由探索的 3D 场景,具备全局一致性、支持不同风格输入、动态场景生成等亮点。可交互视频生成大模型则提供以用户输入为核心的视频生成方案,支持实时互动,具备精准控制的 action model。该模型将推动影视制作、游戏开发等领域的创新,提升内容生产效率。- 7.4k
- 0
-
OpenAI将发布 GPT-4.5 和 GPT-5,GPT-5免费无限使用
OpenAI 宣布将发布 GPT-4.5 和 GPT-5,为全球用户带来前所未有的人工智能体验。根据奥特曼的最新透露,GPT-4.5预计将在几周内发布,并成为 GPT 系列最后一个非“推理链”模型。更激动人心的是,GPT-5 将整合 o系列 和 GPT系列,形成一个全能系统,不仅能支持语音、绘图、搜索等多项功能,还能在不同任务中自动选择最适合的模型。- 6k
- 0
-
星火深度推理模型X1
星火深度推理模型X1是科大讯飞推出的首个具备深度思考和推理能力的大型AI模型。它基于全国产算力训练,拥有较高的数学能力和推理能力,能够在较少算力的情况下提供业界领先的效果,并成功实现了在实际场景中的应用。- 2.7k
- 0
-
启元重症大模型:腾讯与迈瑞联合推出的全球首个面向ICU的智能医疗大模型
启元重症大模型是由腾讯联合迈瑞医疗开发的全球首个针对ICU场景的智能医疗大模型,旨在通过实时监测患者生命体征、快速生成病情总结、提供诊疗建议以及自动生成病历等功能,全面辅助重症医疗工作。该模型结合医学知识图谱,覆盖98%的医学知识,具备强大的理解与生成能力,为医护人员提供精准的诊疗支持,提升工作效率,减轻工作负担,同时为患者争取更多的治疗机会。- 2.6k
- 0
-
Baichuan4-Finance:百川智能发布的金融大模型,金融场景能力领先GPT-4o近20%
Baichuan4-Finance是百川智能推出的专注于金融领域的大模型。该模型通过融合超过100B+的高密度、高质量中英文金融数据,致力于优化核心金融业务场景,提供智能化升级的全面解决方案。其设计严格遵循合规与安全标准,旨在赋能全场景金融创新。- 3.8k
- 0