开源开放大模型观察之baichuan-7B

原创走向未来走向未来

baichuan，应该是“百川”的拼音，目前开放的是7B 的模型baichuan-7B。

baichuan-7B 是由百川智能开发的一个开源非商用的大规模预训练语言模型，如果商用需要联系获得单独的许可。

baichuan-7B基于 Transformer 结构，在大约1.2万亿 tokens 上训练的70亿参数模型，支持中英双语，上下文窗口长度为4096。

在多个数据集的评估中【比如，在高考数据集中】，在7B（6B）规模的模型中，baichuan-7B成绩排在第一。

本号持续跟踪开源开放大模型，欢迎关注本公众号获得一手数据和知识。此外，本号内容基本都围绕着大模型、AGI、AIGC、生成式AI、文生文、文生图、图像理解、强化学习、知识图谱、深度学习等等人工智能有关领域。欢迎关注本公众号。

基础信息

代码许可：Apache License 2.0，允许商用，相比GPL更宽松。
模型许可：baichuan-7B模型许可协议【https://huggingface.co/baichuan-inc/baichuan-7B/resolve/main/baichuan-7B%20%E6%A8%A1%E5%9E%8B%E8%AE%B8%E5%8F%AF%E5%8D%8F%E8%AE%AE.pdf】非商业用途可直接使用，商用的话需联系邮箱“opensource@baichuan-inc.com”以获得授权。
模型许可协议目前只提供中文版本。

代码仓库：Github 【https://github.com/baichuan-inc/baichuan-7B】

模型仓库：HuggingFace 【https://huggingface.co/baichuan-inc/baichuan-7B】

模型仓库：modelscope【https://modelscope.cn/models/baichuan-inc/baichuan-7B/】

1.2T Tokens，没有其他明确的数据分布情况说明。

原始数据包括开源的中英文数据和自行抓取的中文互联网数据，以及部分高质量知识性数据。

以下是收集的非官方信息：

有网友实验了模型，提到可能用了百度知道的数据

持续跟踪基础大模型一览表

本文依然是《迈向以人为本通用人工智能》的一份子，其他内容诸如：

整理材料不易，请随手点赞、关注、转发、在看、打赏！

继续滑动看下一个