图源:作业帮
芥末堆文 根据作业帮微信公众号消息,9月2日,作业帮正式发布自研“银河大模型”,同时公布了银河大模型在C-Eval、CMMLU两大权威大语言模型评测基准的成绩。
今年6月,有消息称作业帮正在内测基于中国市场的教育大模型,包含多学科解题、中英文作文批改、多语言对话方向等多个教育应用场景,涉及工具类App、智能硬件、图书等业务。该项目由CTO罗亮牵头进行底层研发支持及AIGC大方向建设,研发经费优先调拨。同时,除了组织架构调整,作业帮产研团队中近百人也已并入GPT相关项目,估计有两百人以上的团队规模。
据悉,银河大模型是一款专为教育领域打造的覆盖多学科、多学段、多场景的教育大模型,具备智能解题、知识问答、中英文写作及AI伴学等方面的能力。
作业帮数据显示,作业帮银河大模型以平均分73.7分位居C-Eval榜首;同时在CMMLU榜单Five-shot和Zero-shot测评中分别以平均分74.03分及73.85分位列第一,成为首个同时在上述两大权威榜单平均分排名第一的教育大模型。
据介绍,C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集,包含13948道多项选择题,涵盖52个不同学科和四个难度级别。CMMLU榜单则由MBZUAI、上海交通大学、微软亚洲研究院共同推出。
图源:作业帮
作业帮表示,作业帮银河大模型即将在作业帮APP等学习工具、智能硬件、智能图书、教育数字化等业务场景中实现应用,同时将持续优化银河大模型性能与多模态能力,加速推进在更多教育场景的落地实践。
2、芥末堆不接受通过公关费、车马费等任何形式发布失实文章,只呈现有价值的内容给读者;
3、如果你也从事教育,并希望被芥末堆报道,请您 填写信息告诉我们。