-
天擎-美亚柏科旗下公共安全大模型
天擎是美亚柏科发布的国内首个公共安全大模型。它在2023年的美亚柏科“智会”生态合作大会上正式发布。这个大模型拥有丰富的公共安全行业知识,具备强大的警务意图识别、警务情报分析、案情推理等业务理解和推理能力。 -
Qwen3:阿里巴巴最新开源的混合推理大模型
Qwen3 是阿里巴巴推出的新一代大语言模型,支持119种语言,具备强大的推理、编码和智能体能力。它引入了“思考模式”和“快速响应模式”双模式切换,能根据任务灵活调节推理深度。Qwen3发布了多种规模的开源模型,旗舰版Qwen3-235B-A22B在多个领域性能达到业界顶尖,广泛应用于自然语言理解、复杂推理、代码生成等场景。 -
ThinkSound - 阿里通义开源的AI音频生成模型
ThinkSound 是阿里通义实验室开源的首个音频生成模型,能够像专业音效师一样理解画面内容并进行结构化推理,从而生成高保真、与视觉高度同步的空间音频,适用于影视、短视频、游戏等多种创作场景。 -
-
Mistral 7B - Mistral AI 发布的开源大语言模型
Mistral 7B 是法国AI初创公司 Mistral AI 发布的一款先进的 73亿参数语言模型,性能超越了 Llama 2 13B 和 Llama 1 34B。 -
昆仑大模型:中国石油等联合发布的能源行业大模型
昆仑大模型是由中国石油、中国移动、华为和科大讯飞联合打造的能源行业大模型。昆仑大模型具备330亿参数,并已通过国家生成式人工智能服务备案,是中国能源化工行业首个通过备案的大模型。其主要目标是推动能源行业的智能化发展,通过创新的四层架构支持油气新能源、炼化新材料等领域的大规模数据建模。 -
GPT-4o:OpenAI最新发布的多模态AI大模型,可实时推理音频、视觉和文本
GPT-4o是OpenAI推出的最新一代大型语言模型,它集合了文本、图片、视频、语音的全能模型,能够实时响应用户需求,并通过语音进行实时回答。GPT-4o具有强大的逻辑推理能力,其速度是前代模型GPT-4 Turbo的两倍,而成本降低了50%。 -
阿里达摩院遥感 AI 大模型
阿里达摩院发布业内首个遥感 AI 大模型(AIE-SEG),号称“率先在遥感领域实现了图像分割的任务统一”、“一个模型实现‘万物零样本’的快速提取”,并可识别农田、水域、建筑物等近百种遥感地物分类,还能根据用户的交互式反馈自动调优识别结果。 -
HAI-腾讯云AI应用开发平台
腾讯云HAI是一款面向AI、科学计算的GPU应用服务产品,提供即插即用的澎湃算力与常见环境。助力中小企业及开发者快速部署LLM、AI作画、数据科学等高性能应用,原生集成配套的开发工具与组件,大幅提高应用层的开发生产效率。可帮你在10分钟内开发专属AI应用。 -
OpenAI o3:OpenAI推出的最新推理模型,支持工具调用和图像理解
OpenAI o3 是 OpenAI 发布的最新推理模型,代表了其在智能推理领域的最高水平。它能够自主使用 ChatGPT 内的所有工具,包括网络搜索、文件分析、代码执行和图像生成。 -
-
Seaweed-APT:AI视频生成模型,单步生成2秒钟的1280x720 24fps视频
Seaweed-APT是字节跳动发布的一款生成模型,首次展示了在仅一次神经网络评估下生成 1280x720分辨率、24帧每秒的高质量视频,生成时长可达2秒。该模型广泛应用于影视特效、游戏开发、虚拟现实、广告创意等领域,能够快速生成复杂场景和互动内容,大幅提升创作效率,降低制作成本,推动动态内容生成技术的发展。 -
Mistral Large 2:Mistral AI发布的新一代 AI 大模型
Mistral Large 2 是法国AI公司 Mistral AI 发布的新一代 AI 大语言模型, Mistral Large 2 有 1230 亿个参数和 128k 的上下文窗口,支持法语、德语、西班牙语、意大利语、中文等多语言能力,覆盖 80 多种编程语言。该模型展示了改进的推理和准确性,在 MMLU 基准测试中达到了 84%,并与 GPT-4o、Claude 3 Opus 和 Llama… -
QVQ-72B-Preview:阿里通义推出的开源多模态推理模型
QVQ-72B-Preview 是由阿里通义团队开发的一款多模态视觉推理模型,基于 Qwen2-VL-72B 微调,拥有 73.4B 参数,专注于复杂的视觉理解和跨学科推理任务。QVQ不但能感知更准确的视觉内容,并据此作出更细致的分析推理,还会质疑自身假设,仔细审视其推理过程的每一步,经过深思熟虑后给出最后结论。 -
k0-math:月之暗面推出的新一代数学推理模型
k0-math是月之暗面公司推出的首款推理能力强化模型,采用了全新的强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,大幅提升了解决数学难题的能力,可以帮助用户完成更具挑战性的数学任务 。 -
-
Qwen2.5-VL-32B-Instruct:阿里开源的最新多模态模型,主打视觉语言理解和推理
Qwen2.5-VL-32B-Instruct 是阿里开源的多模态大模型(32B参数),支持 视觉+语言+数学推理,在 图像理解(如地理特征识别、多轮视觉问答)和 复杂数学推理(几何、数列等)方面表现突出。通过强化学习优化,其输出更符合人类偏好,回答更详细、结构化。 -
协和·太初 - 北京协和医院和中科院联合推出的罕见病领域 AI 大模型
“协和・太初”是由北京协和医院和中国科学院自动化研究所共同研发的国内首个罕见病领域 AI 大模型。该模型基于我国罕见病知识库的多年积累和中国人群基因检测数据,是国际首个符合中国人群特点的罕见病大模型。 -
启元重症大模型:腾讯与迈瑞联合推出的全球首个面向ICU的智能医疗大模型
启元重症大模型是由腾讯联合迈瑞医疗开发的全球首个针对ICU场景的智能医疗大模型,旨在通过实时监测患者生命体征、快速生成病情总结、提供诊疗建议以及自动生成病历等功能,全面辅助重症医疗工作。该模型结合医学知识图谱,覆盖98%的医学知识,具备强大的理解与生成能力,为医护人员提供精准的诊疗支持,提升工作效率,减轻工作负担,同时为患者争取更多的治疗机会。 -
PandaGPT-多模态AI大模型
首个实现了跨六种模态(图像/视频、文本、音频、深度、thermal和IMU)执行指令遵循数据的基础模型。在没有明确多模态监督的情况下,PandaGPT展现出了强大的多模态能力。 -
MathGLM-智谱AI发布的数学大模型
近日,智谱AI发布MathGLM数学模型,旨在增强大模型在数学推理方面的性能。它能够精确计算算术运算,包括基础算术运算和复杂混合运算,并提升模型的中文数学解决能力。 -
ALLaM - 专为阿拉伯语设计的AI大语言模型
ALLaM是由沙特数据与人工智能局(SDAIA)开发的阿拉伯语大型语言模型,专为理解和生成标准阿拉伯语及沙特方言设计。它经过5.2万亿tokens的双语预训练,具备强大的语言能力,并支持自定义系统提示,广泛应用于自然语言处理和文本生成等领域,旨在推动阿拉伯语技术发展并提升其在全球AI领域的地位。 -
Step-Audio:阶跃星辰推出的开源语音交互模型
Step-Audio 是阶跃星辰与吉利联合开发的业内首款开源产品级语音交互模型。它能够根据不同的场景需求,生成具有情绪、方言、语种、歌声及个性化风格的语音,支持自然、高质量的对话。 -
知彼阿尔法-企查查商业查询大语言模型
企查查“知彼阿尔法”商查大模型是全球首款商查垂直领域大模型,该模型基于企查查覆盖的全球企业信用数据进行训练,相较于当前AIGC(生成式人工智能)领域其它模型,企查查“知彼阿尔法”大模型最大的亮点在于用垂直领域的海量数据进行训练,保证信息的精准度。 -
腾讯混元T1:腾讯推出的最新深度思考推理模型
腾讯混元 T1 是腾讯推出的最新深度思考推理模型,具备强大的分析和推理能力,能够清晰、有依据地回答复杂问题。T1 还支持联网搜索,结合实时信息提供更准确的答案。 -
-
Kimi-Audio:Kimi开源的通用音频基础模型,支持语音识别、音频理解等多种任务
Kimi-Audio是kimi开源的全新通用音频基础模型,支持语音识别、音频理解、音频转文本、语音对话等多种任务,在十多个音频基准测试中实现了最先进的 (SOTA) 性能。 -
Codestral 25.01:Mistral AI最新推出的AI编程模型,编程速度提高2倍
Codestral 25.01是由Mistral AI推出的一款先进的AI编程模型,旨在显著提升软件开发的效率和质量。作为今年早些时候发布的Codestral的升级版本,Codestral 25.01在架构和分词器上进行了优化,生成和补全代码的速度提升了约2倍。它支持超过80种编程语言,特别适用于低延迟、高频率的使用场景,如代码填充(FIM)、代码修正和测试生成。 -
Luma Photon:Luma推出的AI图像生成模型
Luma Photon 是由Luma推出的一款强大的AI图像生成模型,专为需要高质量视觉创作的专业人士设计。它提供高效、快速且低成本的图像生成体验,能够帮助创作者在设计、电影、建筑等多个领域中实现卓越的视觉效果。无论是创意设计、艺术创作还是广告制作,Luma Photon 都能为用户提供无限的创作可能性。 -
-
LHM - 阿里通义开源的单张照片生成可驱动3D数字人模型
LHM 是阿里通义开源的单张照片生成可驱动 3D 数字人模型,具备高质量建模与动作还原能力。用户仅需上传一张照片,即可生成具备骨骼结构的 3D 人物,并可绑定跳舞、打篮球等复杂动作,实现流畅自然的动态表现。该模型适用于虚拟人制作、游戏角色生成、XR 场景构建等应用,具备开源可用、可部署、可交互的特点。 -
Mind GPT:理想汽车发布的多模态大模型
AIHub 12 月 11 日消息,在理想汽车智能软件发布会上,理想带来了 Mind GPT,这是理想全自研的多模态认知大模型,目前还处于内测版本。 Mind GPT是什么? 据悉,Mind GPT 是行业唯一不需要任何指令词就可以使用的大模型,也是行业唯一真正围绕车载场景打造的大模型。Mind GPT是全自研的多模态认知大模型,它可以与汽车进行一个完美的融合,让每位家庭成员都能在车里体验到最好的… -
FLUX.1:Stable Diffusion原班人马推出的开源AI图像生成模型
FLUX.1是由Stable Diffusion原班人马推出的开源图像生成模型,在文字生成、复杂指令遵循和人手生成上具备优势。FLUX.1包含专业版、开发者版、快速版三种模型,其中前两款模型击败SD3-Ultra等主流模型,较小规模的FLUX.1[schnell]也超越了Midjourney v6.0、DALL·E 3等更大的模型。 -
GO-1:智元推出的首个通用具身基座模型
GO-1是什么? GO-1是智元机器人发布的通用具身基座大模型,采用ViLLA架构,结合视觉、语言、隐式动作和执行能力。它通过学习人类视频和少量样本泛化新任务,支持多机器人形态并持续进化。GO-1代表了具身智能向通用化、智能化发展的新阶段,预示着机器人将具备更广泛的应用潜力。 GO-1的主要特点 ViLLA架构:GO-1采用Vision-Language-Latent-Action (ViLLA)… -
携程问道:首个旅游行业垂直AI大模型
7 月 17 日,携程发布旅游行业首个垂直大模型“携程问道”。 据介绍,在大模型的基础上,“携程问道”筛选高质量非结构性旅游数据 200 亿,结合携程现有精确的实时数据进行了自研垂直模型的训练。 用户提出想法,问道可从地域、主题特色等维度,推荐旅行目的地、酒店、景点、行程规划和实时优惠的选项; 在用户需求相对明确时,提供智能查询结果,用户可用文字和语音以自然语言长句的形式进行复杂条件的机票和酒店产… -
丰语大模型:顺丰推出的物流行业AI大模型,摘要准确率超95%
丰语大模型是什么? 丰语大模型是顺丰科技推出的专门针对物流行业的垂直领域大语言模型,旨在提升物流和供应链管理中的智能化处理能力。它通过对物流相关数据进行优化训练,具备高效处理物流场景中常见任务的能力,如客服支持、快递问题定位、清关条款判定等。该模型能够提高工作效率,减少人工操作时间,并在处理复杂国际物流要求时提供准确的建议和判断。 丰语大模型的功能特性 高摘要准确率:丰语模型的摘要生成准确率超过9… -
Xiaomi MiMo:小米推出的首个开源推理模型
MiMo 是小米推出的首个开源大语言模型,参数规模为 7B,聚焦于数学推理与代码生成任务。该模型通过高推理密度的预训练数据(总计 25 万亿 tokens)与强化学习后训练(包括奖励机制优化、样本再采样策略等),实现了在 AIME、LiveCodeBench 等多个权威基准上的领先表现。 -
Grok-1:马斯克xAI发布的开源AI大模型,可商用
Grok-1是Elon Musk旗下AI公司xAI发布的开源AI大模型,具有3140 亿个参数,由 8 专家组成(2 活跃状态)86B 活跃参数,使用Rotary Embeddings。 -
Seed-Coder:字节跳动最新推出的开源代码模型
Seed-Coder 是字节跳动开源的 8B(80亿参数)级代码大模型,它包括 Base、Instruct 和 Reasoning 三个版本,具备强大的代码生成、理解和推理能力。其最大亮点是采用“模型自助式”数据管道,利用大模型自动筛选和构建高质量训练数据,减少人工规则依赖。 -