-
BenTsao本草-中文医学大模型
一个经过中文医学指令微调的 LLaMA-7B 模型,其数据集基于医学知识图谱和 GPT3.5 API 构建的中文医学指令数据集。通过指令微调,HuaTuo 的问答效果在医疗领域得到了提升。 -
Skywork O1:昆仑万维推出的「天工大模型4.0」o1版
Skywork O1是昆仑万维即将推出的具有复杂思考推理能力的系列模型,定位为国内首款具备中文复杂推理能力的o1模型。不同于现有的复现OpenAI o1模型的工作,Skywork O1不仅在模型输出上内生了思考、计划、反思等能力,同时,该开源模型在标准评测集上,对比基座模型推理能力大幅上升,真正让模型拥有了思考和反思带来的推理能力的本质上的提升。 -
Step-Video-TI2V:阶跃星辰开源的AI图生视频模型
Step-Video-TI2V是阶跃星辰开源的AI图生视频模型,基于30B参数训练,支持生成102帧、5秒、540P分辨率的视频。它具备运动幅度和镜头运动可控性,适合动画和短视频制作,尤其在动漫效果上表现突出。 -
Stable Diffusion-全球最强开源AI绘画模型
Stable Diffusion 完全免费开源,所有代码均在 GitHub 上公开,任何人都可以拷贝使用,只需要输入一句提示词(prompt),就能够在几秒钟内创造出令人惊叹的绘画作品。 -
Step-1V:阶跃星辰推出的千亿参数多模态大模型
Step-1V是阶跃星辰研发的一款千亿参数的多模态大模型。这个模型在多个领域表现出色,特别是在图像理解、多轮指令跟随、数学能力、逻辑推理和文本创作等方面。 -
EMO-阿里巴巴发布的AI肖像视频生成框架
EMO是一个由阿里巴巴发布的音频驱动的肖像视频生成框架。它能够通过单一参考图像和音频输入,生成具有丰富表情和多样头部姿势的虚拟角色视频。EMO利用先进的注意力机制和去噪网络,支持多语言和多种肖像风格的动态表现,为内容创作和虚拟角色动画制作提供了新工具。 -
讯飞星火语音大模型
讯飞星火认知大模型是科大讯飞推出的AI大语言模型,专注于提供高精度的语音识别和超拟人化的语音合成服务。它支持多种语言和方言,具备自动语种判断和智能标点功能,能够实现流畅的语音转文字和自然口语的语音输出。该模型适用于语音搜索、聊天输入、游戏娱乐、人机交互、智能客服等多个场景,为企业和开发者提供了强大的语音交互解决方案。 -
Luma Photon:Luma推出的AI图像生成模型
Luma Photon 是由Luma推出的一款强大的AI图像生成模型,专为需要高质量视觉创作的专业人士设计。它提供高效、快速且低成本的图像生成体验,能够帮助创作者在设计、电影、建筑等多个领域中实现卓越的视觉效果。无论是创意设计、艺术创作还是广告制作,Luma Photon 都能为用户提供无限的创作可能性。 -
-
Qwen2.5-VL-32B-Instruct:阿里开源的最新多模态模型,主打视觉语言理解和推理
Qwen2.5-VL-32B-Instruct 是阿里开源的多模态大模型(32B参数),支持 视觉+语言+数学推理,在 图像理解(如地理特征识别、多轮视觉问答)和 复杂数学推理(几何、数列等)方面表现突出。通过强化学习优化,其输出更符合人类偏好,回答更详细、结构化。 -
DeepSeek-R1-Lite预览版模型:深度求索推出的新一代AI推理模型
DeepSeek-R1-Lite 预览版模型是由 DeepSeek 推出的新一代推理模型,采用强化学习训练,具备长思维链推理能力,适用于数学、编程和复杂逻辑推理。模型在数学竞赛和编程任务中表现卓越,超越 GPT-4o 等知名模型。用户可通过网页版在“深度思考”模式中体验全面、严谨的推理过程,未来正式版将开源并提供 API 支持,进一步释放模型潜力。 -
金蝶云·苍穹GPT
金蝶云·苍穹GPT是由国内ERP龙头金蝶在2023全球创见者大会上发布的企业级大模型平台。它被定位为最懂管理的企业级大模型平台,也被称作金蝶云的智能新引擎。金蝶云·苍穹GPT拥有多模型能力、多任务编排、知识智能引擎、个性化扩展、安全可信任等特点。 -
MatterGen:微软推出的无机材料设计AI模型,辅助生成新材料
MatterGen 是微软推出的基于生成性AI的材料设计模型,利用扩散模型生成具有特定化学、机械、电子或磁性属性的新材料。它能够高效生成稳定、独特的材料,超越传统筛选方法,快速探索未知材料空间。 -
GLM-Realtime:智谱最新推出的端到端AI模型,支持2分钟记忆和清唱功能
GLM-Realtime是由智谱推出的低延迟端到端多模态模型,具备视频理解、语音交互、内容记忆、清唱功能和 Function Call 功能。它适用于多种实时交互场景,通过 Function Call 功能可以拓展到更广泛的商业应用。开发者可以免费调用该模型,体验其强大的实时交互能力。 -
讯飞星火认知大模型
讯飞星火是科大讯飞发布的认知大模型,以中文为核心的新一代认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。 -
abab-music-01:MiniMax推出的端到端AI音乐生成大模型
abab-music-01是由上海稀宇科技MiniMax推出的AI音乐生成大模型,支持多功能端到端音乐生成,可用于合成多种音乐形式,包括纯音乐、清唱作品,且满足伴奏、人声同时生成,大大简化音乐录制与创作过程。 -
HAI-腾讯云AI应用开发平台
腾讯云HAI是一款面向AI、科学计算的GPU应用服务产品,提供即插即用的澎湃算力与常见环境。助力中小企业及开发者快速部署LLM、AI作画、数据科学等高性能应用,原生集成配套的开发工具与组件,大幅提高应用层的开发生产效率。可帮你在10分钟内开发专属AI应用。 -
-
AgentVerse-一个用于搭建多智能体交互平台的框架
AgentVerse 提供了一个多功能的框架,简化了为大型语言模型(LLMs)创建自定义多智能体环境的过程。旨在快速、低成本的开发和定制,我们的框架赋能研究人员专注于他们的研究,而不被实现细节所困扰。 -
-
-
天擎-美亚柏科旗下公共安全大模型
天擎是美亚柏科发布的国内首个公共安全大模型。它在2023年的美亚柏科“智会”生态合作大会上正式发布。这个大模型拥有丰富的公共安全行业知识,具备强大的警务意图识别、警务情报分析、案情推理等业务理解和推理能力。 -
Seaweed-APT:AI视频生成模型,单步生成2秒钟的1280x720 24fps视频
Seaweed-APT是字节跳动发布的一款生成模型,首次展示了在仅一次神经网络评估下生成 1280x720分辨率、24帧每秒的高质量视频,生成时长可达2秒。该模型广泛应用于影视特效、游戏开发、虚拟现实、广告创意等领域,能够快速生成复杂场景和互动内容,大幅提升创作效率,降低制作成本,推动动态内容生成技术的发展。 -
Gemini 2.0 Pro:谷歌最新推出的高性能 AI 模型
Gemini 2.0 Pro 是 Google DeepMind 最新推出的高性能 AI 模型,专为编程和复杂任务优化。它具备最强的代码生成能力,能够处理复杂指令,并支持最高 200 万 Token 的上下文窗口。此外,模型可调用 Google 搜索和代码执行以增强推理能力。目前,该模型可供 Google AI Studio、Vertex AI 的开发者使用,同时 Gemini Advanced … -
LawGPT:基于中文法律知识的大模型
LawGPT 是一系列基于中文法律知识的开源大语言模型。该系列模型在通用中文基座模型(如 Chinese-LLaMA、ChatGLM 等)的基础上扩充法律领域专有词表、大规模中文法律语料预训练,增强了大模型在法律领域的基础语义理解能力。 -
BioMedGPT-清华开源的生物医药基础模型
BioMedGPT-1.6B是一个参数为16亿的生物医药领域轻量级科研版基础模型,具有跨模态与知识融合的特点,可以处理药物性质预测、自然语言类、跨模态等多种任务。 -
Qwen2-Audio:阿里推出的开源音频语言大模型
Qwen2-Audio是由阿里通义团队推出的大型音频语言模型系列,它能够接受音频信号输入,进行音频分析或直接文本响应,支持语音聊天和音频分析两种交互模式,并且提供了预训练模型Qwen2-Audio-7B和聊天模型Qwen2-Audio-7B-Instruct的版本。 -
OpenAI o4-mini:OpenAI最新推出的经济高效的推理模型
o4-mini 是OpenAI 发布的一款高效推理模型,专为快速、低成本的任务设计。它在数学、编程和视觉任务上表现出色,尤其适合高吞吐量场景。o4-mini 能自主使用 ChatGPT 的工具,如搜索、文件分析和代码执行,以快速生成答案。它还支持多模态输入,能处理图像和文本,对话自然且相关。其性价比高,是处理复杂问题的理想选择。 -
Baichuan4-Finance:百川智能发布的金融大模型,金融场景能力领先GPT-4o近20%
Baichuan4-Finance是百川智能推出的专注于金融领域的大模型。该模型通过融合超过100B+的高密度、高质量中英文金融数据,致力于优化核心金融业务场景,提供智能化升级的全面解决方案。其设计严格遵循合规与安全标准,旨在赋能全场景金融创新。 -
Claude 3.7 Sonnet:Anthropic 最新推出的混合推理AI模型
Claude 3.7 Sonnet 是 Anthropic 公司推出的一款先进的人工智能模型,具备强大的推理和编码能力。它结合了即时响应与深度思考模式,用户可通过 API 控制思考时间,以平衡速度和回答质量。此外,它在数学、物理、指令遵循和软件开发等任务上表现出色,尤其在编码和前端开发方面有显著提升。 -
GPT-4o:OpenAI最新发布的多模态AI大模型,可实时推理音频、视觉和文本
GPT-4o是OpenAI推出的最新一代大型语言模型,它集合了文本、图片、视频、语音的全能模型,能够实时响应用户需求,并通过语音进行实时回答。GPT-4o具有强大的逻辑推理能力,其速度是前代模型GPT-4 Turbo的两倍,而成本降低了50%。 -
abab-video-1:MiniMax发布的AI高清视频生成模型
abab-video-1模型支持生成最高1280*720分辨率、25帧/秒的高清AI视频,视频内容具有电影感镜头移动,最多支持6秒视频的生成。 -
Claude 3-Anthropic公司最新推出的AI大模型
Claude 3是Anthropic公司推出的一系列先进的人工智能模型,它们在多种认知任务上设定了新的行业标准。这个模型家族包括三个不同级别的模型:Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus。每个模型都提供了不同的智能水平、速度和成本效益,以适应不同的应用需求。 -
Muse:微软推出的AI游戏生成模型,能生成连贯的游戏画面和动作
Muse 是微软发布的首个专为游戏创意设计的生成式AI模型,基于大规模玩家数据训练,能够生成连贯、多样化的游戏视觉效果和控制器操作。它支持多模态生成,可快速生成游戏原型,助力开发者探索新玩法。 -
Qwen2.5-VL:阿里通义千问推出的开源AI视觉语言模型
Qwen2.5-VL是由阿里通义千问推出的一款视觉语言理解模型,结合了图像、视频和文本处理能力。它能够精准识别图像中的物体、提取视频关键事件,并执行动态推理任务。通过物体定位、结构化数据输出和多模态理解,Qwen2.5-VL广泛适用于安全监控、电子商务、文档解析等领域。 -
GPT-4-OpenAI旗下AI大模型
GPT-4是OpenAI的大型语言模型的最新版本。它在各种各样的互联网文本上进行了训练,但也从其他各种来源学习。因此,它能够以对话的方式生成富有创造性、连贯性和与上下文相关的句子。 -
协和·太初 - 北京协和医院和中科院联合推出的罕见病领域 AI 大模型
“协和・太初”是由北京协和医院和中国科学院自动化研究所共同研发的国内首个罕见病领域 AI 大模型。该模型基于我国罕见病知识库的多年积累和中国人群基因检测数据,是国际首个符合中国人群特点的罕见病大模型。 -
混元3D 2.0:腾讯混元发布的3D开源模型2.0版本
混元3D 2.0是腾讯混元推出的3D开源大模型2.0版本,旨在通过先进的AI技术,快速生成高质量的3D模型。对比1.0版本,2.0版本也依然同时支持文、图生3D的能力,并在生成效果上得到显著提升,在几何结构上更加精细,纹理色彩更加丰富,支持更精细、更逼真的3D内容创作。 -
GLM-4-Flash:智谱AI推出的首个免费API服务,支持128K上下文
GLM-4-Flash是智谱AI推出的首个全面免费的API服务,旨在让AI技术惠及更广泛的用户群体。作为一款性能卓越的大语言模型,GLM-4-Flash在语义理解、数学计算、推理、代码生成和知识应用等多个领域表现出色,支持高达1500并发,能够满足大规模应用的需求。 -
NExT-GPT:开源全能多模态AI大模型
新加坡国立大学的华人团队最近开源了全能多模态模型NExT-GPT。该模型支持任意模态的输入和输出,可以实现文本、图像、语音和视频之间的自由转换,是第一个实现从任一模态到任一模态转换的通用多模态系统。