中科院自动化研究所-紫东太初大模型

紫东太初大模型

“紫东太初”跨模态通用人工智能平台是由中国科学院自动化研究所研发的以多模态大模型为核心、基于全栈国产化基础软硬件平台，可支撑全场景AI应用。

依托面向超大规模的高效分布式训练框架，自动化所构建了具有业界领先性能的中文预训练模型、语音预训练模型、视觉预训练模型，并开拓性地通过跨模态语义关联实现了视觉-文本-语音三模态统一表示，构建了三模态预训练大模型，赋予跨模态通用人工智能平台多种核心能力。

可实现文本、图片、语音、视频、3D点云、传感信号等不同模态的统一表征和学习，助推通用人工智能时代加速到来。

“紫东太初”兼具跨模态理解和生成能力，具有了在无监督情况下多任务联合学习、并快速迁移到不同领域数据的强大能力。对更广泛、更多样的下游任务提供模型基础支撑，达成AI在如视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。

在线体验：https://xihe.mindspore.cn/modelzoo/taichu

紫东太初特色

全球首个多模态图文音预训练模型
多层次多任务自监督学习
弱关联多模态数据语义统一表达
兼顾任务感知和推理增强的中文预训练模型
多粒度学习与注意力指导的视觉预训练模型
基于自监督预训练的多任务语音建模技术

中文预训练模型

文本预训练模型使用条件语言模型作为自监督目标进行训练，和GPT一样，模型根据上文来预测当前词汇，最终训练得到的模型可以生成流畅的中文表达。

本次开源的中文文本预训练模型由40层Transformer组成，隐层维度2560，包含32个注意力头，共32亿参数。训练语料丰富多样，包括新闻、百科、散文等，文本生成能力强大。

中文预训练模型基础上还可以进行微调操作，充分利用少量有监督数据增强模型在下游任务上的表现，如文本分类，对话生成、古诗创作等；除此之外，中文预训练模型还能够实现简单的少样本学习，如下图所示，输入已知的部分样例，模型能够捕捉类似的规律进行文本生成。

中科院自动化研究所-紫东太初大模型

紫东太初大模型

紫东太初特色

中文预训练模型

豆包 - 字节跳动旗下免费AI智能助手

讯飞绘镜：讯飞推出的一站式AI短视频创作工具

AIPPT：AI一键生成高质量PPT

Trae - 字节跳动推出的AI代码助手

白日梦AI-免费的AI视频创作平台，支持生成6分钟视频

笔灵AI论文写作 - 专业AI论文写作平台

AIPaperPass：AI一键生成高质量论文

蝉镜-AI数字人视频创作平台

通义灵码 - 阿里推出的AI智能编码助手

闪剪-AI数字人视频生成平台

讯飞智文-免费PPT生成工具

墨狐AI：你的网文短篇小说写作助手

讯飞文书 - 科大讯飞发布的AI公文写作工具

茅茅虫论文写作 - 一站式AI论文写作平台

紫东太初大模型

紫东太初特色

中文预训练模型

武汉大学-CheeseChat

达观数据-曹植大语言模型

Stable Diffusion-全球最强开源AI绘画模型

Segment Anything：首个图像分割基础模型

豆包 - 字节跳动旗下免费AI智能助手

讯飞绘镜：讯飞推出的一站式AI短视频创作工具

AIPPT：AI一键生成高质量PPT

Trae - 字节跳动推出的AI代码助手

白日梦AI-免费的AI视频创作平台，支持生成6分钟视频

笔灵AI论文写作 - 专业AI论文写作平台

AIPaperPass：AI一键生成高质量论文

蝉镜-AI数字人视频创作平台

通义灵码 - 阿里推出的AI智能编码助手

闪剪-AI数字人视频生成平台

讯飞智文-免费PPT生成工具

墨狐AI：你的网文短篇小说写作助手

讯飞文书 - 科大讯飞发布的AI公文写作工具

茅茅虫论文写作 - 一站式AI论文写作平台