图源:Pixabay
芥末堆文 毫不夸张地说,2023年可以被看做是国内“大模型元年”,科创公司、教育企业全都摩拳擦掌跃跃欲试,只要身处互联网就一定会在任一平台刷到过“大模型”、“AIGC”、“LLM”等关键词,所有人都乐于见证并参与到“大模型改变世界”的新浪潮中去。
科技界人士将大模型创业的生态分为四层——芯片层、框架层、模型层、应用层。整体来看,多数教育公司基于开源的大模型,快速做出了一些有意思的新产品,但主要还是集中在“应用层”。而近段时间,对“大模型”创业的质疑声也不少:先是ChatGPT的访问量出现负增长,窗口期短,开始出现唱衰大模型的声音;再有业内人士断言大模型难以落地产业,改变世界言之尚早。
据量子位统计,包含通用与垂直、开源与闭源不同类型在内,国产大模型数量已超百家。那么,目前各大公司的教育大模型产品进度如何?
1.网易有道:聚焦办公及学习场景中的效率提升
网易有道被认为具备底层技术基因,同时由于在智能学习领域的深耕,也积累了很多教育领域的业务数据和理解。在国内的教育科技公司中,网易有道较早宣布要推出大模型产品。
今年2月,先是有爆料称网易有道AI技术团队已投入到ChatGPT同源技术(AIGC)在教育场景的落地研发中,并在AI口语老师、中文作文批改等细分学习场景中尝试应用,将尽快推出相关的demo版产品。3月,网易有道还推出系列AI应用课程,其中包括“ChatGPT从入门到精通”等。
到了7月,网易正式推出了教育领域垂直大模型“子曰”,并发布了基于“子曰”大模型研发的六大创新应用——“LLM翻译”、“虚拟人口语教练”、“AI作文指导”、“语法精讲”、“AI Box”以及“文档问答”。
8月9日,网易有道发布了“子曰”教育大模型首次落地的硬件产品——有道词典笔X6 Pro,有道词典笔S6和有道听力宝Pro三款新品,分别定价1399元、499元和1099元。
网易有道介绍,功能上,子曰大模型它能够作为基座模型支持诸多下游任务,向所有下游场景提供语义理解、知识表达等基础能力。基于此,有道研发团队在“子曰”大模型的基础上,为不同学习场景设计了定制化的模型。例如其推出的虚拟人口语教练Hi Echo,主要功能在于理解场景和上下文并给出反馈,发音可关注到重音、弱读、升降调等细节,采用启发式对话并给出针对性建议。
网易大模型产品的落地方向在教育行业很具代表性——集中在办公及学习场景中,聚焦于to c的效率提升方向。在开源模型变多后,小团队就可以做出类似应用,这些产品可能会受到冲击。而另一方面,虽然模型技术在翻译和语法讲解等领域较为成熟,但目前仍旧与真人精讲有一定差距,网易称“产品在英语场景下已经能够做到98%的答题准确率”,不过在学习考试领域,2%的容错率仍可能让用户产生疑虑。
除了教育,网易还主要落地在游戏、工业、音乐场景。上个月,在浙江省召开的全省平台经济高质量发展大会上,丁磊表示,当前网易的首要任务是用最快的速度探索AI大模型的创新应用,最近三年,网易研发总投入近400亿。
2.好未来:自研数学领域千亿级大模型
不同于其他大模型产品多集中于“文本范畴”,5 月 5 日,学而思对外表示,公司正在研发数学大模型,命名为「MathGPT」,面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为导向,将于 2023 年内推出基于该大模型的产品级应用。
由于大语言模型来自对海量语言文本的训练,因此更擅长语言处理,在数理逻辑方面表现一般。Google收购的Photomath、微软数学、Mathway、专注数学计算的WolframAlpha等产品,主要利用非LLM的传统AI技术加上数据库的方式解决数学问题,学而思则选择自研基于专业领域的“数学大模型”MathGPT。8月24日,好未来自研的数学领域千亿级大模型MathGPT正式上线并开启公测,具体效果还需要时间的检验。
这当然具有很强的意义,根据世界教育不平等数据库,在印度,来自最贫困20%的家庭的15岁学生,在数学方面只有最富裕20%的家庭的15岁学生的一半水平,所以ChatGPT在数学领域的应用会让教育普及的门槛更低。学而思以数学起家”,积累了大量数学相关数据,但训练MathGPT需要的不只是数据——GPT没有数据飞轮,所以在一定意义上来说并非用的人越多越好;并且数学领域容错率更低,如何将准确率提升至100%?如何匹配不同人群的数学学习场景?可能还有很长一段路要走。
此外,好未来还入股人工智能公司深言科技,深言科技核心成员来自智源悟道大模型研发团队,致力于用最前沿的人工智能和自然语言处理技术,尤其是大规模预训练模型技术。
3.科大讯飞:从AI学习机硬件切入
谈到大模型,科大讯飞可能是不得不提的公司。
梳理时间线,今年2月,科大讯飞称已于“2022年12月进一步启动生成式预训练大模型任务攻关,科大讯飞AI学习机、讯飞听见等产品将率先落地”。4月该公司发布AIGC内容创作平台“讯飞智作”,用于音视频创作场景。
5月6日,科大讯飞正式发布了讯飞星火认知大模型及应用成果,科大讯飞AI学习机T20系列率先在语数英主学科上进行了大模型应用落地,首批上线了中英文作文类人批改(学习机端)和生成(家长端)、数学个性化精准学类人互动辅学、英语类人口语陪练功能。6月9日,讯飞星火V1.5突破开放式问答,并在数学能力和多轮对话能力上迭代升级,面向教育、医疗、工业、办公等领域的应用全面升级。
在AI学习机领域,科大讯飞又于7月6日发布了搭载讯飞星火大模型的首款立式大屏 LUMIE 10 系列,进一步扩充了学习机全系列品类,当前已搭载星火大模型的学习机系列包括 T20、LUMIE 10、T10、 X3。
8月15日,讯飞星火V2.0升级:发布代码和多模态能力,同时发布搭载讯飞星火V2.0的多项应用和产品;与华为联合发布企业私有专属大模型解决方案——星火一体机,合作共建全国产化算力底座。
科大讯飞选择从AI学习机硬件切入,是因为教育硬件贡献了重要的营收占比。财报显示,今年5月、6月,大模型加持后学习机GMV分别同比增长136%和217%。与此同时,2023年上半年,科大讯飞的研发费用为15.17亿元,同比增长5.42%。然而,8月1日,苹果应用商店下架讯飞星火APP,这多少对科大讯飞的大模型之路产生了一些影响。
摩根商研所观点认为:“现阶段较为成熟的生成式AI产品,大都是从模仿ChatGPT起步,功能区块可谓是大同小异。”而超越ChatGPT的关键一方面是在技术层面实现更快速精准的运算效率;再有就是寻求特色化突破,释放更多AI工具想象力。
4.百度:ToB和ToC领域两手布局
在今年5月26日的中关村论坛上,百度创始人、董事长兼CEO李彦宏,发表了题为《大模型改变世界》的演讲。李彦宏称:“ 未来,所有的应用都将基于大模型来开发,每一个行业都应该有属于自己的大模型,大模型会深度融合到实体经济当中去。”
此前,百度推出大语言模型生成式AI产品“文心一言”及百度智能云发布企业级大语言模型服务平台“文心千帆”。百度在今年5月发布的小度青禾学习手机也搭载了小度灵机大模型,并提供AI互动讲题、写作指导、口语练习等功能。6月,百度推出基于大模型的代码编写助手“Comate”,据百度内部人士透露,辅助代码撰写是第一阶段的主要产品功能,第二阶段,“Comate”将实现在特定领域、场景的自然语言代码生成,第三阶段将实现全领域的自然语言开发。
李彦宏曾透露:“自三月文心一言发布以来,百度收到来自企业用户超10万份针对文心一言的测试请求,包括金融,软件,教育,在线旅游等等。”他还预测,随着文心一言不断整合至各个app,尤其是搜索app之中,预计用户参与度和流量将进一步提升,由此支持在线营销业务营收的增长。
百度是国内最早推出类ChatGPT产品并开放内测的公司,且ToB和ToC领域均有布局。在资金、算力、人才乃至视野上,大厂的优势都很明显。李彦宏旗下三亚百川致新私募股权投资基金合伙企业(有限合伙)还投资了前华为“天才少年”稚晖君的机器人项目。外界普遍认为,百度投资智元机器人的真正目的是布局 AGI机器人市场。
5.作业帮:正在内测基于中国市场的教育大模型
6月,媒体披露作业帮正在内测基于中国市场的教育大模型,包含多学科解题、中英文作文批改、多语言对话方向等多个教育应用场景,涉及工具类App、智能硬件、图书等业务。
知情人士透露,作业帮在今年年初启动了自研教育大模型项目,目前该项目由CTO罗亮牵头进行底层研发支持及AIGC大方向建设,研发经费优先调拨。同时,除了组织架构调整,作业帮产研团队中近百人也已并入GPT相关项目,估计有两百人以上的团队规模。
6.阿里云:未来所有产品都将接入大模型
8月3日,阿里云开源通义千问70亿参数模型,包括通用模型Qwen-7B和对话模型Qwen-7B-Chat,两款模型均已上线AI模型社区魔搭 ModelScope ,且两款模型都是开源、免费、可商用的。
6月末,阿里云与复旦大学、中国电信共同打造的中国高校最大的云上科研智算平台CFFF(Computing for the Future at Fudan)上线,CFFF定位是为发现和解决复杂科学问题而建设的科研“超级计算机”,由面向多学科融合创新的AI for Science(人工智能用于科研)智能计算集群“切问”一号和面向高精尖研究的专用高性能计算集群“近思”一号两部分组成。接下来,平台还将持续扩大其算力规模,并向复旦校外的科研机构、高校、医院、高科技企业等开放。
在IaaS、PaaS之外,阿里云还推出了MaaS(模型即服务),阿里云还官宣:未来阿里所有的产品都将接入大模型进行全面升级,并向全行业开放通义千问的能力。据悉,阿里云的单位算力成本较之十年前下降了80%,存储成本降低90%,但也仍面临着高昂的训练成本压力。
“教育是大模型最容易落地的领域”,大模型赛道中不光有教育巨头与科技、互联网企业,不少有实力的科研院所也纷纷下场。一组数据显示:3月中旬,刚发布几天的GPT4回答准确率超过70%,同期已发布的国产大模型平均准确率20%。5 月,国产大模型的平均准确率已经追到50%以上。彼时,一位业内人士告诉我们,教育行业在对大模型的探索上,国内外最大的差异是时间,本质上这种差距花更多时间、投入算力和资金就能追上。截至目前,包含通用与垂直、开源与闭源不同类型在内,国产大模型数量已超百家。
7月,《生成式人工智能服务管理暂行办法》正式颁布,明确推动生成式人工智能基础设施和公共训练数据资源平台建设,促进算力资源协同共享,提升算力资源利用效能。在基础设施层面,国内一直在前进,教育行业真正需要思考的,也许是如何让大模型真正落地产业以及如何回击教育大模型产品同质化、缺乏突破性产品的质疑声。
参考资料:
1.《ChatGPT的应用场景畅想:教育篇》https://36kr.com/p/2262739375272073
2.《科大讯飞的机遇,藏在垂类大模型?》https://36kr.com/p/2378266100873217
3.《国产大模型已无公司可投》https://36kr.com/p/2385973327640581
4.《阿里云大模型之战:逍遥子不能输》https://36kr.com/p/2217597900895617
5.《大模型的“高考冲刺”,教育行业已率先交卷?》https://36kr.com/p/2291324087834626
6.《大模型不能再继续“裸奔”了》https://36kr.com/p/2394442594753673
2、芥末堆不接受通过公关费、车马费等任何形式发布失实文章,只呈现有价值的内容给读者;
3、如果你也从事教育,并希望被芥末堆报道,请您 填写信息告诉我们。