【芥末堆注】猿题库今天宣布获得了6000万美元D轮融资,即将推出基于数据挖掘和个性化学习的直播辅导平台“猿辅导”,题库领域会怎么发展,翻出这篇旧文来回溯一下猿题库的过去。
猿题库是我们之前写过的一个产品,这次再写它则是因为前阵子我随王壮拜访了他们的市场运营总监帅科。帅科原是网易科技的主编,虽是媒体出身,也算得上地道的互联网人。而猿题库的背后正是一个互联网属性重、技术也相对牛叉的团队——创始人李勇曾是网易总主编和门户事业部总裁。另据帅科透露,他们的技术团队很大一部分脱胎自网易有道。
就是这么一个互联网团队,先期做了一个在不少人眼里以教辅和教学资料吸引学生和老师、但却“有笔没粉”的粉笔网。可是,他们的主打公务员考试的智能题库服务猿题库出来之后,却一下子火了。
记得我之前收集沪江副总裁徐华的时候,他就调侃互联网大佬出来做教育,喜欢“高举高打”,言下之意是他并不看好——这句话在粉笔身上算是一定程度地应验了,现在的粉笔就只靠一两人运营着,重心已经转到猿题库。所以,相信有不少人(也包括我在内)会以为粉笔是互联网人投石问路、付学费攒经验的道具,而猿题库则是他们的转型之作。
但帅科显然不认同这种猜想。他告诉我,实际他们在去年刚搭建粉笔的平台时,就已经想过要做题库了,并分享了一些猿题库出来之前的轨迹(我想他指的是带一定交互和数据分析能力的智能题库,而不是传统意义上的题“库”):
去年六七月份开始规划题库的事情,在此期间做了调研,诸如用户有哪些需求,题库的功能要怎么做等等,10月初确定要做题库,10月底定了先做公务员考试的方向。
“确定要做公务员考试,一是因为全国各级别公务员考试的人数在1000万人左右,人数够大,属于刚需,二是因为跟其他细分领域相比,公务员考试还有切入机会,第三则是公务员考试的题目够多、真题也够多(近10年),但这类题目没有正式答案,已有的答案和解析也相当碎片化。”
所以,猿题库的价值正是在于将网上碎片化的考试资料聚合、并做结构化的呈现。而它真正的杀手锏,则在于发挥团队在互联网端的优势,基于题库的“算法”和由学生做题产生的大量“数据”,提高学生做题和应试的“效率”。
从宏观的角度来说,猿题库的每道题都会包含三个属性,即考点(如数学运算中的工程问题)、考频(针对不同的考试类别,考频不同)、难度(根据用户的练习数据赋予题目1-9档难度系数)。用户在做完50道左右的题目后,系统就会根据其做题的正确率、参考这50道题的上述三大属性,计算出用户的一个个人数据。
然后,通过比对用户参加的目标考试的实际要求和相关信息,包括该考试常考的考点、不同考点出现的频率等等,系统会匹配用户跟目标考试相比的实际水平,包括他对不同考点的掌握情况,对同一考点下不同难度题目的掌握情况等,生成一个个人能力评估和个性化的做题方案,确定用户还需要做哪些题。
而在提高用户的做题效率方面,猿题库还引入了时下热门的“大数据”概念。什么意思呢?系统会参照某名用户的做题数据和用户行为,确定该名用户的“DNA”,然后搜索匹配所有与该名用户有类似DNA的其他用户,参照其他用户的做题记录和做题数据,告诉该名用户他需要做哪些题、不需要做哪些题,以此提高效率。
这样说似乎很抽象,帅科给我举了个实际的例子。比如说,某名用户A做了一道难度系数为3的工程类数学题,在以往情况下,系统只能判断A无需再做难度系数为1、2的题目,至于难度为4-9的题目会不会做,正确率的高低,系统是无法判断的;同样情况下,假如用户做错了一道难度系数为3的题目,系统同样无法判断他是否能做难度系数1-9的题目。
但猿题库依赖大数据可以解决这个问题,通过聚合与用户A有类似DNA的所有其他用户BCDEF...的练习数据(B用户可能做了4、5、6;C用户做了2、3、4等等),就能覆盖该DNA下用户做1-9各个难度系数的题目频次,模拟出一个无限趋近用户A真实行为的虚拟人——针对这个虚拟人的做题方案,就可为用户A的评估和智能出题提供支持。
帅科自己就总结说,这套智能题库的特点是“产品逻辑清晰、前台简单,但后台实际相当复杂。”而这样的一套算法,他自己觉得,即便竞争对手模仿了,他也不担心。因为:“先发优势。”
据他透露,目前猿题库的平台上总共有2万道题,用户平均每天做题80万次。简单换算下,上面的每道题每天就被练了40次,这个数据量是非常大的。而“这大量的数据可以帮助我们去修正算法、使其越来越精准,拉大优势,这和做搜索引擎是一样的道理。”
另外,虽然做教育的时间并不久,帅科还是跟我谈到了他对行业的两点看法,一是传统的教育机构目前主要还是将互联网作为课程一个的推广渠道,提供的课程和服务附加价值有限;二是中国的在线教育团队简单copy美国是行不通的,当前的用户刚需、付费意向依然指向了应试教育。这个大环境同样将团队的重心指向了题库。
这两点对于想依赖教育挣快钱的团队来说已经成为共识,我接触的很多教育同行也嚷嚷着要“做题库”、甚至于百度、腾讯、阿里这些巨头也在觊觎在线教育的蛋糕。但猿题库在一定程度上确实尝到了甜头、也抢到了先机——这套智能题库在上线的第一个月就实现了日订单200单的交易(每月25人民币),用户的反应已经“超出预期”。另外,他们很快就会将智能题库从公务员考试辐射到其他职业考试范畴,比如四月底、五月初要上线的司法考试。
当然,对于一个互联网出身的团队来说,初涉教育犯错误走弯路几乎是不可避免的。关于这点,帅科并未展开说,只是简单总结道,“市场没你想得那么简单,要多跟用户去聊、了解用户的需求。”尽管他跟李勇是做科技媒体出身,算是见多识广,但“关于产品细节的东西,没人会在这种环境下告诉你,告诉你的也不一定对。”
现在的猿题库也逐渐意识到要引入传统教育这方面的人士来补自己的短板——就公务员考试这块,他们就有1个全职和5个兼职教师。
最后简单说下我的看法。我前阵子参加某线下活动时某分析师好友分享了一个观点,至今记忆犹新,意思是:“在线教育不能解决教育的所有问题、所有环节,但它却可以将当中的几个环节做好,甚至是利用互联网端的优势,将其做得非常好。”
这句话也让我引申出两点:
从严格意义上来讲,猿题库甚至跟“真正的教育”并无太大关联。但从我的角度来看,这恰是互联网人涉足教育时扬长避短的一个途径:你未必是要真的去跟教育的方方面面打交道,完全可以只跟当中的某个环节打交道,比如充斥着大量数据的“题库”、或者其他资料库(比如我们昨天介绍的魔方英语),甚至于专注做技术提供商,不是么?
猿题库利用算法和数据挖掘给学生提供个性化、自适应的学习方案,说到底解决的是学生的学习效率问题,而这个除了可以用在做题上,自然也可以延伸到严肃的教育范畴,不是么?
【推荐阅读】
本文转载自36kr,作者陈小蒙。
2、芥末堆不接受通过公关费、车马费等任何形式发布失实文章,只呈现有价值的内容给读者;
3、如果你也从事教育,并希望被芥末堆报道,请您 填写信息告诉我们。