Qwen2.5是什么?
Qwen是阿里巴巴集团Qwen团队研发的大语言模型和大型多模态模型系列。目前,大语言模型已升级至Qwen2.5版本。无论是语言模型还是多模态模型,均在大规模多语言和多模态数据上进行预训练,并通过高质量数据进行后期微调以贴近人类偏好。Qwen具备自然语言理解、文本生成、视觉理解、音频理解、工具使用、角色扮演、作为AI Agent进行互动等多种能力。
Qwen2.5的主要特点
- 参数规模多样:易于使用的仅解码器稠密语言模型,提供 0.5B 、1.5B 、3B 、7B 、14B 、32B 和 72B 共7种参数规模的模型,并且有基模型和指令微调模型两种变体(其中“ B ”表示“十亿”, 72B 即为 720 亿)
- 大规模数据预训练:利用我们最新的数据集进行预训练,包含多达 18T tokens (其中“ T ”表示“万亿”, 18T 即为 18 万亿)
- 长文本处理能力:在遵循指令、生成长文本(超过 8K tokens )、理解结构化数据(例如,表格)以及生成结构化输出特别是 JSON 方面有了显著改进
- 指令遵循与改进:更加适应多样化的系统提示,增强了角色扮演的实现和聊天机器人的背景设置。
- 上下文理解:支持最多达 128K tokens 的上下文长度,并能生成多达 8K tokens 的文本。
- 多语言支持:支持超过 29 种语言,包括中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文、韩文、越南文、泰文、阿拉伯文等。
如何使用Qwen2.5?
Qwen2.5既提供了开源模型,也开放了API服务,帮助你快速开发或集成生成式AI功能。
1、开源版本:
- 开源地址:https://huggingface.co/collections/Qwen/qwen25-66e81a666513e518adb90d9e
- Github:https://github.com/QwenLM/Qwen2.5?tab=readme-ov-file
- 在线demo:https://huggingface.co/spaces/Qwen/Qwen2.5
2、API服务
如果不想进行繁琐的部署,阿里还开放了旗舰模型Qwen-Plus 和 Qwen-Turbo的API。
API地址:https://help.aliyun.com/zh/model-studio/developer-reference/what-is-qwen-llm
©版权声明:如无特殊说明,本站所有内容均为AIHub.cn原创发布和所有。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则,我站将依法保留追究相关法律责任的权利。