芥末堆芥末堆

【GET2016】申请方龚绮:数据驱动的教育变革

作者:怡彭 发布时间:

【GET2016】申请方龚绮:数据驱动的教育变革

作者:怡彭 发布时间:

摘要:从场景化到数据化,教育的进化在持续进行。

申请方_meitu_14.jpg

芥末堆 怡彭 2016 年 11 月 11 日 报道

在“互联网化”之后,数据化正在成为教育变革的下一个主题。教育的数据化有多难?需要考虑多少维度?从测评到用户画像,再到规划用户的成长路径,应该经历怎样的过程?

申请方联合创始人龚绮在今日的“GET2016教育科技大会”上做了以“数据驱动的教育变革”为主题的演讲。

以下为演讲实录:

今天想实打实说一些战术层的事情。我们是一家创业公司,申请方作为专家系统,以数据驱动的方式来做面对高等教育学生的发展平台。

看我们的名字叫申请方,很容易让人联想到好像是做留学的公司,很多人问过我这个问题。我在美国读博士期间读的是数据模型专业,最开始是以留学切入,但是我们不只是想做留学,而是通过留学学业场景来研究高等教育的本质,待会我会讲到这个事情。

屏幕快照 2016-11-11 下午7.16.37_meitu_1.jpg

一个很普通的问题,大家都在谈大数据,数据到底是什么?有人说数据是用户一门课分数,课程本身的品质,还包括用户和用户之间的关系等等。可成为数据的东西太多了。我们能不能从数学的层面上抽离出来它到底是什么东西?经过我们的思考,我们认为数据的本质是刻画的实体(Entity,人、图书、网站都是实体)以及它的属性(Attribute),以及各类实体之前的关系(Relationship)以及关系的属性(Attribute)。

2121.png

举一个例子,这个图中我们暂且把Entity分为人和内容两个部分。人那部分有各种各样的用户,有各种各样的属性和相互关系。对于内容那边,例如MIT和它开设的一个的项目,它们之间存在关系且有自己的属性。另外人和内容之间又有关系。人这边有人的图谱,我们称之为 Social Network,内容这边有知识图谱,内容投影在人身上是认知图谱。除了图谱之外,还可以通过数据类型来归类数据,如图所示。但无论是从数据类型方面归类还是图谱方面归类,只是分类方式不一,他们本身是有对应关系的。我们把这两者统一起来,来刻画人的画像。

屏幕快照 2016-11-11 下午7.18.51.png

有了上面的用户画像的数据刻画,我们得出一个非常重要的结论,人受教育的过程等价于人的画像被不断更新的过程,这是我们的认识。每个人的画像有个性化的起点,还有个性化的终点,因为有不同的追求。我想去做计算机,我想做工程师,这是不同的目标。画像与画像之间的变化过程是受教育的过程,在这个过程中要有作用,它被教育作用了,作用之后一定要被测量,你怎么能知道给他这个教育是好还是坏?所以有测量之后要有反馈去迭代。我们通过画像的更新定义了教育之后,怎么定义好的教育?基于起点和终点的个性化差异,帮助用户完成更有效率的画像,这就是好的教育。

在座很多做垂直领域细分,你可以考虑我做的这个事情在上述框架中有没有价值。比如说有人做考试,考试是做什么事情?就是通过考试测试教育成果。有的同学做慕课或远程教育,这个是作用在“环境”上,让教育过程变得高效。所以这是好的教育,因为这个符合框架。

前面这些都是很理论的说法,实际上操作时数据战术到底怎么实施呢?这是一个问题。我们分为理想层和现实层,对于理想层,我们要通过学术层、理论层、工程层、技能层、专业层真正部署自己怎么去产品实施。基于理论层我们要做需求分析,要做数据模型,要做数据的收集,要做数据库的建立,数据库进来之后要做数据的清理和整合,要做数据的分析,最后做数据的传递、评估,再反回去做需求的分析。在数据安全整个涵盖所有的路径,这是基本的理论层。理论层往上学术层,是对做的这些事情的学术支撑。往下是技能层,指我们做的这些事情需要具备哪些技能。再往下是专业层,专业层是指我们找的这些人在哪个专业去找。由于时间的关系,这些内容我就不展开说了。

实际上你很难找到一个完备的团队做这样的事情,我们通过自身的经验,发现这样的团队需要具有以下的基本素质。第一要做 Modeling 的人,第二个一定要懂 Programming,第三要懂 Data Processing人,第四要懂 Perceptions。Modeling 是建模,建模之后需要工程化需要 Programming,工程化以后进行一系列的数据处理,例如数据抓取、网上爬数据,建数据库以及数据分析都是 Data Processing。另外还需要具备Perception 能力的人,也就是需要有洞察力的人。能够把教育需求分析出来,协助模型化,并且把数据结果友好的表达给用户。我们是一个创业公司,也算是一支奇葩的团队,作为创业公司我们成立了高等教育研究部和数据部,为什么做这件事情呢?高等教育研究部把的高等教育的规律把它变成数学上可以理解以及建模的元素,数据部需要做很多真正数据上面的事情。

屏幕快照 2016-11-11 下午9.14.36.png

接下来这张图,我们申请方是做高等教育的学业发展平台,我们从高等教育入口和出口换成几个场景,第一个场景是升学场景,升学进来以后有课程的基础训练,基础训练之后有以背景提升为核心的高级训练分为科研、职业、公共服务、创业指导,我们称之为RISE。之后通过继续深造返回到学业入口,或就职到学术界、业界、社会公共服务、创业为代表的学业的出口。因为我们尝试做高等教育整个学业规划底层框架的研究,所以我们需要把高等教育相关的场景全部囊括下来。基于我们团队的背景,我们团队70% 都是海归,20% 以上都是博士生,经历了完整的高等教育科研训练,且覆盖了多个学科领域,因此我们以升学场景作为切入点,来做整个的学业规划的底层数据研究。

做了这个基础研究之后怎么去覆盖各个学业场景呢?例如升学当中也包括高考的报考,我们的做法基于本身的个人画像普适性研究,那是一把尺子,有了这把尺子之后,就可以把其他的学业场景要参考的数据维度映射到这把尺子上面。肯定有人说了,映射的话你的维度很可能是不全的,那么多的数据你也不可能完全知道,那该如何扩展呢?这就涉及到底层结构的问题,这把尺子按照数学的方法,所有的维度都是正交的。任何一个新维度进来,一定会被已有的维度被线性表达。我们跨场景跟别人合作。你有你的评价方式,我有我的评价方式,为什么我的评价方式比你好呢?第一,我比你更完备,你所有的维度能够被我的正交表达,这个很重要,否则做不了融合的事情。第二,我们的维度方便扩展。我们按照这个方式,一个个场景去突破,画像的维度将变得越来越完备。对人的个人画像的刻画,这是我们的核心,随着场景的拓展会变得非常完备好用。

3.png

下面说一下我们2C的产品。我们做的这个事情首先以数据为核心。机器端包括PGC数据库,含学业数据库、职业数据库。第二个是管理工具,然后是社区UGC数据库和测评体系。我们有非常多且内容丰富的数据库。有人爬我们的数据,没有关系,因为它只能抄表层的内容,不能抄这些数据底层的标签,它们之间关联等,这些数据背后的维度才更好的为学业规划所服务。

重点说一下测评体系,测评体系包含个性化评测,用那把尺子量一下学业状态,量了之后我们给用户智能化推荐合适的学业目标。很多的测评产品有了这个推荐之后就到头了,但我们推完之后会给你规划一条路径,告诉你在什么时间做什么事情,怎么去推进。比如说留学场景,你做完测试后就可以做智能化推荐。你适合选什么样的专业,以及适合去申请哪些学校。再告诉你之后该怎么申请,什么时间做什么事情以及怎么做。你需要学很多的知识,这些事情就在规划中通过教育资源的方式提供给你。怎么做这个事情?因为我们现在有留学的经验,所以我们可以通过专家系统的方式进行推荐。马上问题就出来了,你怎么保证这个事情是 OK 的?你推荐的准确与否?我们的核心是个人画像,我们希望跟用户能给我们实时的反馈。你做了某一个我们推荐的资源后,到底离你的学校近了多少,这个东西可以基于个人画像功能进行实时反馈。你一旦达到那个目标之后,可以反馈我们的推荐模型是不是 OK,模型进行自我进化。我们想把这个做法推广到其他的场景,包括其他升学场景、学业过程场景以及职业场景。

对于人机混合部分,人机混合智能引擎形成用户多平台、多周期会话,这是很重要的发展趋势。另外,我们还希望提供标准化需求智能解决方案:机器在前端、人工后端支持。因为我们是做学生学业发展规划的公司,我们希望通过标准化需求,以及标准化学业状态,告诉用户可能做什么样的事情。当这个机器不能满足需求时,人就可以进去,机器在前端人在后端。另外,对于个性化需求智能解决方案,我们可以做 To B 的合作。刚才有人说培训界的咨询师非常缺乏,缺乏的本质是缺乏经验,哪有那么多时间培养咨询师呢?那是否能做到人在前面,后面有机器支持呢?因为我们是做学业规划的,这个有可能实现。还是以留学咨询为例,一个留学咨询师很难完整了解一个学生当前状态适合读什么专业或什么档次的学校?你可以说这个学生很适合去哈佛,但是需要理由去支持,这个支持并不是把结论告诉他,而是有一套成熟的推荐体系以及规划资源,告诉学生你为什么这样选择,以及该怎么做?这就是人在前,机器在后。

4.png

我们的 PGC 数据库有学校、专业、课程、校园机会等等的数据库,我觉得做数据方面的东西一定有很多的文章可做。我们花了差不多两年的时间整理这些数据,而且很好的更新这些数据。校园机会包括讲座、论坛、讲学机会、竞赛等,只要对学业有帮助的都可以拿出来。

5.png

工具是帮你更好的管理资源以及进行资源搜索。还有UGC的数据是社区,还有测评产品。我们其实已经发布了专业测评、留学测评、高考报考测评。第四个图是测评规划页,就是说测了之后告诉你该怎么去做。

另外,做学业规划,研究用户画像,需要一把尺子,这个尺子不是谁都可以定义和推广的,需要和大B合作,让大 B 帮助背书,我们做了这样的尝试。我们推出了To B 的品牌SquareStrategics(方略)。取自《荀子》中的一句话,由于时间关系我就不一一解读了。大概的意思是,一定要提前准备好策略,才能打胜仗。

我们 To B 有三个目标群体,第一个是高等教育、科研机构的学术组织,第二个是企业机构,第三个是公共事业,政府、教育研究机构及公益组织。我们对他们是技术与数据驱动的互联网方案提供商,以及践行教育研究的全球智库。我们作为创业公司对于学术层级、政府层级有自己的独特优势。我们在高等教育研究上,会自上而下打一些点,我们会发一些报告,会发其他国家高等教育怎么样,他们的教育评价体系是怎么回事,他们的高等教育机制是怎么回事等等。我们还会有全球战略的研究报告。基于高等教育入口-过程-出口全过程研究报告,有评价机制研究报告,有高考报考报告,有大学生的 RISE 体系发展报告,大学生就业机会研究报告等,这些会为我们的理论体系做背书。

谢谢大家!

戳这里查看所有嘉宾精彩演讲,立即永久保存,感谢【印象笔记企业版】友情支持


1、本文是 芥末堆网原创文章,转载可点击 芥末堆内容合作 了解详情,未经授权拒绝一切形式转载,违者必究;
2、芥末堆不接受通过公关费、车马费等任何形式发布失实文章,只呈现有价值的内容给读者;
3、如果你也从事教育,并希望被芥末堆报道,请您 填写信息告诉我们。
来源: 芥末堆
芥末堆商务合作:王老师 18710003484
  • 【GET2016】申请方龚绮:数据驱动的教育变革分享二维码