阿里云开源70亿参数通义千问大模型

微信图片_20230607123952.jpg

图源：Pixabay

芥末堆文近期，Meta发布免费且可商用的大模型系列——Llama 2。8月3日，阿里云开源通义千问70亿参数模型，包括通用模型Qwen-7B和对话模型Qwen-7B-Chat，两款模型均已上线AI模型社区魔搭 ModelScope ，且两款模型都是开源、免费、可商用的。

据悉，魔搭ModelScope为阿里巴巴达摩院模型开源社区，阿里云成为国内首个加入大模型开源行列的大型科技企业。

今年4月，阿里云推出自研大模型通义千问，据科技媒体介绍，Qwen-7B是基于Transformer的大语言模型，在超大规模预训练数据上训练得到。预训练数据包括大量网络文本、专业书籍、代码等。它是支持中、英等多种语言的基座模型，在超过2万亿 token 数据集上训练，上下文窗口长度达到8k；Qwen-7B-Chat是基 Qwen-7B基座模型的中英文对话模型，已实现与人类认知对齐。

根据魔搭ModelScope社区消息，上个月，智谱AI及清华KEG实验室发布允许ChatGLM-6B和ChatGLM2-6B完全免费商用，希望为开源社区发展作出贡献，为此，在中国中文信息学会社会媒体处理专委会的支持下，智谱AI及清华KEG实验室联合安硕信息、阿里云、魔搭社区、北京交通大学，推出了“ChatGLM金融大模型挑战赛”。比赛要求参赛选手以ChatGLM2-6B模型为中心制作一个问答系统，回答用户的金融相关的问题，不允许使用其他的大语言模型。

据悉，近日腾讯自研的 “腾讯混元大模型”也已经进入应用内测阶段，腾讯内部多个业务已经接入混元大模型进行测试。

1、本文是芥末堆网原创文章，转载可点击芥末堆内容合作了解详情，未经授权拒绝一切形式转载，违者必究；
2、如果你也从事教育，并希望被芥末堆报道，请您填写信息告诉我们。

来源：芥末堆

芥末堆商务合作：王老师 18710003484

阿里云开源70亿参数通义千问大模型

阿里云开源70亿参数通义千问大模型

图源：Pixabay

编辑推荐