图源:Pixabay
芥末堆文 近期,Meta发布免费且可商用的大模型系列——Llama 2。8月3日,阿里云开源通义千问70亿参数模型,包括通用模型Qwen-7B和对话模型Qwen-7B-Chat,两款模型均已上线AI模型社区魔搭 ModelScope ,且两款模型都是开源、免费、可商用的。
据悉,魔搭ModelScope为阿里巴巴达摩院模型开源社区,阿里云成为国内首个加入大模型开源行列的大型科技企业。
今年4月,阿里云推出自研大模型通义千问,据科技媒体介绍,Qwen-7B是基于Transformer的大语言模型,在超大规模预训练数据上训练得到。预训练数据包括大量网络文本、专业书籍、代码等。它是支持中、英等多种语言的基座模型,在超过2万亿 token 数据集上训练,上下文窗口长度达到8k;Qwen-7B-Chat是基 Qwen-7B基座模型的中英文对话模型,已实现与人类认知对齐。
根据魔搭ModelScope社区消息,上个月,智谱AI及清华KEG实验室发布允许ChatGLM-6B和ChatGLM2-6B完全免费商用,希望为开源社区发展作出贡献,为此,在中国中文信息学会社会媒体处理专委会的支持下,智谱AI及清华KEG实验室联合安硕信息、阿里云、魔搭社区、北京交通大学,推出了“ChatGLM金融大模型挑战赛”。比赛要求参赛选手以ChatGLM2-6B模型为中心制作一个问答系统,回答用户的金融相关的问题,不允许使用其他的大语言模型。
据悉,近日腾讯自研的 “腾讯混元大模型”也已经进入应用内测阶段,腾讯内部多个业务已经接入混元大模型进行测试。
2、芥末堆不接受通过公关费、车马费等任何形式发布失实文章,只呈现有价值的内容给读者;
3、如果你也从事教育,并希望被芥末堆报道,请您 填写信息告诉我们。