-
Llama 3.2:Meta最新推出的开源模型,包括视觉大语言模型和设备端纯文本模型
Llama 3.1是Meta最新推出的开源大语言模型,包括90B和11B两种参数规格的视觉大语言模型,还有能在设备端本地运行的1B和3B轻量级纯文本模型,包括预训练和指令调整版。1B和3B模型支持128K tokens上下文,适配高通和联发科硬件,并针对Arm处理器做了优化。- 1.3k
- 0
-
Qwen2-Math:阿里巴巴最新开源的数学推理大模型
Qwen2-Math是阿里巴巴最新开源的数学推理大模型,是基于 Qwen2 LLM 构建的专门用于数学解题的一系列语言模型。Qwen2-Math 提供了基础和指令微调两种版本,分别有1.5B(15亿)、7B(79亿)和72B(720亿)三种参数规模,以适应不同的应用需求。- 2.6k
- 0
-
Mistral Large 2:Mistral AI发布的新一代 AI 大模型
Mistral Large 2 是法国AI公司 Mistral AI 发布的新一代 AI 大语言模型, Mistral Large 2 有 1230 亿个参数和 128k 的上下文窗口,支持法语、德语、西班牙语、意大利语、中文等多语言能力,覆盖 80 多种编程语言。该模型展示了改进的推理和准确性,在 MMLU 基准测试中达到了 84%,并与 GPT-4o、Claude 3 Opus 和 Llama…- 1.4k
- 0
-
Llama 3.1:Meta最新推出的开源大语言模型
Llama 3.1是Meta最新推出的开源大语言模型,有三种规格:80亿、700亿和4050亿参数,支持八种语言,具备128K扩展上下文长度。它提供卓越的通用知识、数学计算、多语言翻译和工具使用能力,开放下载并允许开发者定制和微调。- 11k
- 0
-
Mistral NeMo:Mistral AI和英伟达联合发布的AI小模型
Mistral NeMo是由法国AI公司Mistral AI与NVIDIA合作开发的一个120亿(12B)参数的大型语言模型。它提供高达128k tokens的上下文窗口,并且在推理、世界知识和编码准确性方面达到了该规模模型的先进水平。- 1.2k
- 0
-
DCLM-7B:苹果最新推出的开源AI语言模型
DCLM-7B是苹果与合作伙伴一起推出的开源小型语言模型,全部开源,包括权重、训练代码和数据集。DCLM-7B性能优异,接近大型模型,采用decoder-only架构,上下文长度2048。DCLM在多个基准任务上性能出色,支持商业使用。- 14.9k
- 0
-
SmolLM-HuggingFace发布的高性能小型语言模型
SmolLM是由 Huggingface 最新发布的一组高性能的小型语言模型,参数分别为 1.35 亿、3.6 亿和 17 亿,训练数据来自高质量数据集 SmolLM-Corpus,其中包括 Cosmopedia v2、Python-Edu 和 FineWeb-Edu。SmolLM 模型在多种基准测试中表现不错, 适合跑在手机这种终端设备上。- 1.6k
- 0
-
Phi-3:微软推出的开源小型语言模型,支持移动设备
Phi-3 是微软 AI 研究院开发的一系列小型语言模型,它们是开源的并且可以商用。这些模型的特点是体积小、所需资源少,使得它们能够在资源受限的环境中运行,例如在移动设备或者边缘计算设备上。- 4k
- 0
-
eSheep:多样化绘图风格的AI绘图平台
eSheep是一个提供云端AI绘图体验的平台,目前处于内测阶段。这个平台为你提供了多种风格和类别的绘图模型,包括动漫风格、游戏角色、插图、服装、电子游戏、风景、漫画、女孩、可爱、中国风、建筑、汉服、机器人、汽车、平面设计、室内设计、鲜艳的色彩、中国龙和工业设计等。你可以上传模型,并探索各种绘图风格和创意。- 8.6k
- 0
-
AIGC Cafe-AI绘画模型分享社区
AIGC Cafe 是一个专门为 AI 爱好者和开发者提供的平台,它提供了一系列的 AI 模型供用户使用和学习。这些模型覆盖了各种领域,包括图片灵感、国风、动漫、艺术风、3D 写实、自然风景、建筑、服饰配件、男生、动物、平面设计等等。- 5.7k
- 0