当前位置:首页>AI资讯>百川智能发布 Baichuan2-192K 大模型 可处理约35万个汉字

百川智能发布 Baichuan2-192K 大模型 可处理约35万个汉字

百川智能发布了 Baichuan2-192K 大模型,具有全球最长的上下文窗口长度,能够处理约35万个汉字。

与目前最优秀的大模型 Claude2相比,Baichuan2-192K 的上下文窗口长度超过了4.4倍,超过了 GPT-4的14倍。

Baichuan2-192K 在长窗口文本生成、理解、问答、摘要等方面表现出色,并在10项长文本评测中取得了7项 SOTA 成绩。

Baichuan2-192K

据悉,Baichuan2-192K 通过算法和工程的优化,实现了窗口长度和模型性能的平衡,采用动态采样的位置编码优化和4D 并行的分布式方案。

目前,Baichuan2-192K 已经开始内测,已与法律、媒体、金融等行业的核心合作伙伴合作,将于不久后全面开放。Baichuan2-192K 能够应用于长篇文档关键信息提取与分析、长文档摘要、审核、编写、复杂编程辅助等场景,并为多模态输入和迁移学习提供支持。

百川大模型官网:https://www.baichuan-ai.com/home

悬河ai 吐司AI绘画

©版权声明:如无特殊说明,本站所有内容均为AIHub原创发布和所有。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则,我站将依法保留追究相关法律责任的权利。
0 条回复
    暂无讨论,说说你的看法吧
error: