-
讯飞星火开源大模型
讯飞星火开源大模型是科大讯飞对外开源的大模型。讯飞星火开源-13B(iFlytekSpark-13B)拥有130亿参数,在经过累计超过3万亿以上tokens海量高质量数据集上进行预训练,然后在精调的多元化对齐数据上进行微调得到。iFlytekSpark-13B在多个标准评估中展现出了卓越的性能,其表现优于同参数量级的开源模型,与一些闭源模型相比不相上下。 -
CogAgent-可免费商用的带 Agent 能力的视觉模型
CogAgent是由清华大学智谱AI研究团队开发的一个基于CogVLM改进的新型视觉语言模型。这个模型专门设计用于理解和导航图形用户界面。它采用了低分辨率和高分辨率图像编码器的双编码器系统,能够处理和理解复杂的GUI元素和文本内容。 -
-
Stable Video 3D-单张图片生成高质量3D内容和视频
Stable Video 3D是一个由Stability AI 推出的3D技术模型,能够从单张图片生成高质量的多视角3D内容和视频。Stable Video 3D包含两个变体,SV3D_u和SV3D_p,分别用于生成轨道视频和沿指定相机路径的3D视频。 -
华知大模型-同方知网携手华为推出的中华知识大模型
华知大模型是同方知网携手华为共同打造内容权威可信、全栈自主可控的专注于知识服务与科研行业的中华知识大模型,旨在覆盖政企文教等多个行业场景,并提供30多项通用能力体系。 -
-
-
序列猴子-出门问问多模态大模型
“序列猴子”是一款由出门问问发布的,具备多模态生成能力的大语言模型,以语言为核心的能力体系涵盖“知识、对话、数学、逻辑、推理、规划”六个维度,能够同时支持文字生成、图片生成、3D内容生成、语音生成和语音识别等不同任务。 -
Grok-1.5V:xAI发布的多模态AI大模型
Grok-1.5V不仅具备强大的文本处理能力,还可以处理各种视觉信息,如文档、图表、截图和照片。这使得Grok-1.5V能够在多学科推理、理解科学图表、阅读文本和实现真实世界的空间理解等领域与现有的前沿多模态模型竞争。 -
Stable Code Instruct 3B:Stability AI推出的代码语言模型
Stable Code Instruct 3B是Stability AI推出的先进代码语言模型,基于 Stable Code 3B 的指令调优 Code LM,旨在通过解读自然语言指令来生成代码、解决问题及执行多种编程语言的查询,从而简化软件开发流程,提高编程效率和直观性。 -
-
Emu2:智源研究院开源发布的新一代生成式多模态基础模型
2023年12月21日,智源研究院发布了新一代多模态基础模型 Emu2。Emu2通过大规模自回归生成式多模态预训练,显著推动了多模态上下文学习能力的突破。 Emu2在少样本多模态理解任务上表现出色,超越了主流多模态预训练大模型 Flamingo-80B 和 IDEFICS-80B。在 VQAv2、OKVQA、MSVD、MM-Vet、TouchStone 等多个少样本理解、视觉问答、主体驱动图像生成… -
猎户星空大模型
猎户星空大模型是一个专为企业应用设计的AI模型,具有140亿参数的多语种大模型,该模型在一个包含2.5万亿token的多样化数据集上进行了训练,涵盖了中文、英语、日语、韩语等多种语言。在多语言环境下的一系列任务中展现出卓越的性能。在主流的公开基准评测中,Orion-14B系列模型表现优异,多项指标显著超越同等参数基本的其他模型。 -
Open-Sora: Colossal-AI开源的类Sora架构视频生成模型
Open-Sora是一个开源Sora复现方案,旨在帮助用户构建类似于OpenAI Sora的视频生成模型。它提供了一个完整的开发流程,包括数据处理、模型训练和部署,支持动态分辨率和多种模型结构。 -
Phi-3:微软公布的开源小型语言模型,支持移动设备
Phi-3 是微软 AI 研究院开发的一系列小型语言模型,它们是开源的并且可以商用。这些模型的特点是体积小、所需资源少,使得它们能够在资源受限的环境中运行,例如在移动设备或者边缘计算设备上。 -
-
AudioPaLM:谷歌语音理解和生成AI大模型
AudioPaLM 是一个大型语言模型,专为理解和生成语音而设计。AudioPaLM 将基于文本的和基于语音的语言模型,即 PaLM-2 和 AudioLM,融合到一个统一的多模态架构中,可以处理和生成文本和语音。 -
-
Yi大模型-零一万物发布的开源大模型
Yi系列模型是由来自“零一万物”的开发者研发的大型语言模型。第一个公开版本包含两个双语版(英语/中文)基础模型,参数规模分别为6B和34B。两者都使用4K序列长度进行训练,并在推理时可以扩展到32K。 -
达观数据-曹植大语言模型
“曹植”是一款大语言模型,它是基于自然语言处理(NLP)、光学字符识别(OCR)、知识图谱等技术的实践产物。作为垂直、专用、自主可控的国产版ChatGPT模型,它不仅实现专业领域的AIGC智能化应用,还可以内置在客户各类业务系统中提供专用服务。 -
-
EMO-阿里巴巴发布的AI肖像视频生成框架
EMO是一个由阿里巴巴发布的音频驱动的肖像视频生成框架。它能够通过单一参考图像和音频输入,生成具有丰富表情和多样头部姿势的虚拟角色视频。EMO利用先进的注意力机制和去噪网络,支持多语言和多种肖像风格的动态表现,为内容创作和虚拟角色动画制作提供了新工具。 -
商汤商量拟人大模型
商汤商量拟人大模型支持个性化角色创建与定制、知识库构建、长对话记忆、多人群聊等功能,可实现行业领先的角色对话、人设、及剧情推动能力,广泛应用于情感陪伴、影视/动漫/网文IP角色、明星/网红/艺人AI分身、语言角色扮演游戏等拟人对话场景。 -
-
360智脑
360智脑是一个由 360 公司开发的 AI 平台,旨在探索全新的人机协作模式,激活用户的创造力和想象力。它提供了一系列的 AI 工具和服务,包括 API 开放平台、360鸿图、360AI搜索、360AI浏览器、360智脑桌面版和企业数字员工等。 -
阿里达摩院遥感 AI 大模型
阿里达摩院发布业内首个遥感 AI 大模型(AIE-SEG),号称“率先在遥感领域实现了图像分割的任务统一”、“一个模型实现‘万物零样本’的快速提取”,并可识别农田、水域、建筑物等近百种遥感地物分类,还能根据用户的交互式反馈自动调优识别结果。 -
abab 6.5-MiniMax稀宇科技发布的万亿参数MoE大 模型
abab 6.5是国内 AI 初创企业 MiniMax 稀宇科技今日正式推出的 MoE 混合专家模型架构的系列大模型,核心能力开始接近 GPT-4、 Claude-3、 Gemini-1.5。 -
灵医大模型-百度发布的产业级医疗大模型
9 月 19 日消息,百度今日发布国内首个“产业级”医疗大模型 —— 灵医大模型,并面向大健康上下游产业开放灵医大模型测评、试用,推动医疗行业的数字化和智能化进程。 -
-
PandaGPT-多模态AI大模型
首个实现了跨六种模态(图像/视频、文本、音频、深度、thermal和IMU)执行指令遵循数据的基础模型。在没有明确多模态监督的情况下,PandaGPT展现出了强大的多模态能力。 -
天工SkyMusic-昆仑万维推出的AI音乐生成大模型
「天工SkyMusic」是昆仑万维推出的AI音乐生成大模型,基于昆仑万维「天工3.0」超级大模型打造,是目前国内唯一公开可用的AI音乐生成大模型。具备高质量音乐制作、逼真人声合成、精准歌词控制、多元风格适应及复杂歌唱技巧学习等五大特点。该模型基于先进的Transformer技术,能够根据用户输入生成具有丰富情感表达的音乐作品,旨在推动音乐创作的创新和个性化发展。 -
LivePhoto:图片生成动态视频模型
阿里巴巴、香港大学、蚂蚁集团的研究人员提出了一种全新图片生成动态视频模型——LivePhoto。用户通过LivePhoto,可将一张静态图片快速生成高精准的动态视频。 与传统方法不同的是,LivePhoto在开源文生图模型Stable Diffusion基础之上,增加了运动强度和文本加权两大创新模块,可精准掌控动态视频生成过程中的运动强度、文本描述。研究人员将LivePhoto与主流模型Gen-2… -
金蝶云·苍穹GPT
金蝶云·苍穹GPT是由国内ERP龙头金蝶在2023全球创见者大会上发布的企业级大模型平台。它被定位为最懂管理的企业级大模型平台,也被称作金蝶云的智能新引擎。金蝶云·苍穹GPT拥有多模型能力、多任务编排、知识智能引擎、个性化扩展、安全可信任等特点。 -
-
-
-
PowerLawGLM-法律垂直AI大模型
"PowerLawGLM"是由幂律智能联合智谱AI发布的千亿参数级法律垂直大模型。这个模型专注于法律细分领域,针对中文法律场景的应用效果具有独特优势,具备丰富的法律知识和法律语言理解能力。 -
Llama 3-Meta最新推出的新一代开源大模型
Llama 3是一款由Meta推出的大型开源人工智能语言模型,Llama-3共有80亿、700亿两个参数版本,与Llama-2相比,Llama-3使用了15T tokens的训练数据,在推理、数学、代码生成、指令跟踪等能力获得大幅度提升。 -
Mind GPT:理想汽车发布的多模态大模型
AIHub 12 月 11 日消息,在理想汽车智能软件发布会上,理想带来了 Mind GPT,这是理想全自研的多模态认知大模型,目前还处于内测版本。 Mind GPT是什么? 据悉,Mind GPT 是行业唯一不需要任何指令词就可以使用的大模型,也是行业唯一真正围绕车载场景打造的大模型。Mind GPT是全自研的多模态认知大模型,它可以与汽车进行一个完美的融合,让每位家庭成员都能在车里体验到最好的… -
Mistral Large-Mistral AI 推出的旗舰AI大模型
Mistral Large 是 Mistral AI 推出的旗舰模型,具有顶级的推理能力,能够处理复杂的多语言推理任务,包括文本理解、转换和代码生成。