芥末堆芥末堆

【GET2018】VIPKID林陈斌:AI构建在线教学新生态

作者:西瓜 发布时间:

【GET2018】VIPKID林陈斌:AI构建在线教学新生态

作者:西瓜 发布时间:

摘要:在线课堂监测及评测

屏幕快照 2018-11-19 上午2.25.34.jpg

芥末堆 西瓜 11月18日 报道

11月14日,在以“碰撞·演变”为主题的GET2018教育科技大会分论坛上,VIPKID教学产品负责人林陈斌给观众们带来了题为《AI构建在线教学新生态》的分享。

在这一主题下,林陈斌主要分享了两块内容,智能师生匹配和在线课堂监测及评测。

以下为林陈斌演讲实录:

今天给大家演讲的主题叫做AI构建在线教学新生态。前面有两位专家已经讲过了语文和数学,我们是从另外一个视角讲一下英语行业,主要是从科技怎么为教育赋能为老师助力的角度,为大家分享一下我们在之前做的过程当中的一些经验。

大家都知道2017年被定义成AI元年,有很多标志性的事件出现。我们一直在思考AI在教育行业里面应该扮演什么样的角色。我们认为AI在整个教育系统里面可以成为我们学生的好伙伴,就是他知道学生应该在什么时候开始学,然后他可以扮演一个激励他的角色也可以扮演一个跟他一起来学习成长的角色。第二个是外教的好助力,可以帮助我们的老师更好的感知到学生现在的学习情况,把学生的很多数据呈现给老师,让老师通过这些数据可以更好的了解学生,达到更好的教学效果。

另外我们也可以把好的老师把挑出来,每一节课不同老师的教法是不一样的。VIPKID的老师是自研的,我们的老师来自于北美个人家庭,他们是一个个的个体。除了基本的教学培训以外,所有的老师在这里面是自由发挥的,每个老师个人能力和性格都不一样,对于同一节课,同一个学生教法也是不一样的。所以这个过程当中怎么把好的老师好的表现沉淀出来,让其它更多的老师去学习和模仿,这是给我们老师赋能的。

另外一块就是我们家长的好帮手,家长付钱让学生到机构来买的是好的学习效果,我们怎么能让家长放心,你的孩子在这儿学得开心学得快乐,这些效果怎么分析和怎么以好的形式呈现给家长,这是我们考虑AI在里面应用的地方。

VIPKID所有的业务全部发生在线上,我们目前已经有50多万名学生在线上学,也有6万多名老师在线上课。每天在线授课量超过15万节,所有的数据在线发生的时候给我们沉淀了很多优质的数据,利用这些数据和我们的技术,我们现在可以做些什么事情?

第一个是在整个全的教学环节里面,全面提升教学技术。我们怎么给老师更好的数据。老师进课堂之前,他就可以知道学生上一节课所有的知识点掌握情况和上一节作业的掌握情况,我这堂课是应该快讲还是应该拿出点儿时间把上一节课进行回顾和复习。学习和评测这一块我们也都是用数据去做,我们所有的题目都是自适应地推荐给学生,然后学生所有的一些评测的结果数据也可以作为它后续一些推荐学习材料基础的条件。

然后整个学习过程是智能化的,这个待会儿我再详细讲,主要在师生的匹配,把我们的模型算法应用到里面。

最后就是VIPKID想强调的是让孩子插上语言的翅膀。所以我们的内容不是应试教育,虽然我们可以让学生的能力提升,用九十分的能力考出一百分的成绩,但我们的主旨不是做应试教育,核心是要锻炼学生的领导力,全球视野,协调能力等等全方面的素质。所以我们也举办了很多有温度的一些活动和方式,也做出一些产品能让孩子得到全面的锻炼和培养。接下来我就展开重点的把这三块跟大家分享一下。

屏幕快照 2018-11-20 下午2.10.15.jpg

智能师生匹配

这是目前我们利用数据和技术已经实现的几个大模块,第一个就是智能师生匹配。因为我们本质上要解决的问题是供需匹配问题。

说到供需匹配,大家印象当中应该比较能够浮现出来的是美团,背后可能有几百万家商户,几千万家用户。滴滴每天订单超过几千万单,实时要匹配司机和乘客。我们要匹配的是6万名老师和五十多万名学生,每天都要匹配。我们认为这个匹配的难度其实要比电商和出行的难度更高一些。

我们的匹配维度要更多一些,因为每一个学生都是独立的个体,每一个老师的教法也是一个特殊的个体。这里面他们之间会发生什么样的化学反应?我们不得而知。

我们有一个非常有意思的数据,就是我们的学员,来到我们这个平台之后他大概率在他整个学习周期里面会选择8-10名老师,大部分是发生在他的前一个月以内,前一个月里面他会换3-5名老师选到一名他合适的老师。选到了之后一般他会固定两到三名老师,以这些老师为主,后面再慢慢的换一些其他老师尝试风格。

在线课堂监测及评测

第二块是我们在线课堂评测。这个事情其实本质上做的是,传统教学里面教务的工作和优质老师的工作,他对于这堂课教学效果评测做一个数据化的表达。最后通过所有的这些数据和老师的匹配,我们来掌握学生的情况来做个性化内容的推荐。我们的智能师生匹配是怎么做的?我们老师这里面大概有22个维度,现在目前已经实现了。

屏幕快照 2018-11-20 下午2.08.21.jpg

比如说,我们的维度有老师的共性特征,然后老师讲话的语速,老师的节奏,老师的音色、性别、年龄、形象等等。学员这边的话有他的潜在兴趣以及他是否关注老师,就是他对老师的一个关注情况,过往的课堂表现,知识点的掌握情况等等。两边的这些数据我们做匹配和分析之后可以找到他们的一个共同点。

说的可能比较抽象一点,我举几个例子大家会感受更深刻一点,这是一个真实的案例。真实的案例是我们有一个小学员,这个小学员我们叫他猪小弟,他跟我们平台非常有缘分,所以我们对他的学习情况一直很关注。他刚来到我们平台的时候我们就爸评价数最好的老师筛出来,给他推荐了三位。每一位老师都是颜值高、表现力强、教学水平高、学生口碑好的老师。但这三位老师教完以后,猪小弟的学习效果并不好,然后我们详细看了他前面课堂的表现,发现整个过程就是老师讲的眉飞色舞,但是猪小弟同学整个人是眼光呆滞。

这是什么原因呢?我们就在背后去分析这个事情,当然后面有一个也是比较机缘巧合我们给猪小弟换了第四位老师跟前面老师的风格是不一样的。这位老师是一个美国的退休老师,年龄大概五十多岁微胖,相对就是比较严肃的老年退休老师。这个老师的风格比较内敛,比较深沉。会循序渐进地讲,他也不太多的跟他开一些玩笑。但是当猪小弟在屏幕之外的时候,老师会威严但是不是特别的凶地告诉他说你现在应该认真听讲,这个老师是这个风格。但是他们两个最后产生的化学反应非常好,很明显地看到每一节课猪小弟的反映就越来越好。到最后就开始他活泼的这一面就呈现了。

我们后面跟猪小弟的爸妈在聊这个事情,我们发现就是这个小朋友他自己本身在现实生活当中也是一个性格比较内向的。所以这种小朋友当他看到老师夸张的一些手型动作的时候,他本人是没有特别适应的这样一个课堂气氛。反而是比较温和的教法能够让他更好地接受,更好地适应课堂的环境,然后慢慢的通过慢热的训练自己找到了感觉。

这是我们之前发生的一个非常真实的例子。基于这个例子我们就开始把师生匹配开始建模,学生这一块我们首先在性格上面分成了很多大类,他有外向型的,内向型的,有偏视觉型的,听觉型的。这里面我们会匹配不同的颜值和手势或者说是语音和音色上面非常有特点的一些老师。然后所有的这些维度里面有的维度特征性会非常强,有的会表现没有那么强。

大家觉得说老师的这些因素里面,哪一个因素会对一堂课程的教学效果产生严重的影响?我们发现最有效的首先是老师的语速,老师的语速对于学生在不同年龄阶段应该适合的语速有一个非常明确的范围值。这个我不知道在其他的学科里面会不会有这么明显的特征。但是我们通过数据的表达上面分析出来,在英语的这个学科这个特征非常明显,因为本身就是全外语环境的教学。所以语速不适应的话,即使那些词句学生在掌握的范畴之内,但是听力水平跟不上。我们全量的语速在120字每分钟,所以这里面我们通过这个,对于老师也是一种反向部署。

我们现在在老师的训练当中加上了一个功能,以前是没有这一条的。现在老师在我们的培训课的时候,会有一个语速的训练课,我们会实时的反映出你现在目前的语速是多少,老师在教一个课件针对不同的学员,虚拟语速一定要达到限定的范围之内,才会得到绿色的反馈。我们要给老师找这种感觉。

屏幕快照 2018-11-20 下午2.08.54.jpg

然后这个是我们的实时的在线课堂的一个语音评测的一个系统。这个系统做的事情就是我们把每一节课的实时数据可以拿出来进行详细的分析。我们的这些数据整体来说是非常可靠和实时去进行储存的,然后通过这些数据分析我们最终可以得到每一节课的教学质量结论。

这些数据包含但不限于,就是我们通过语音识别的技术,语音分析的技术,图像识别技术和图像分析技术可以得到了一些数据。这里面包含了学员的表情,然后师生的手势,教室的环境,老师的发音,语音的一些识别评测包括课堂连线行为轨迹的数据。

然后我们会发现这些数据里面对一节课,最后能够有好的效果它影响最大的是什么?学员的笑脸次数。我们发现学员的笑脸次数一堂课如果低于十个笑点,学员可能打一个差评,家长也有可能打一个差评。我们跟学员跟家长的反馈做拟合的话会发现这样的关系。排名第二是师生的交互,因为师生的语音是两套音轨,老师的音轨起来降低到学生的音轨起来到收拢,中间的时差0.05秒算是一次成功的交互,每堂课要有14次交互才会被打成好课。

所以通过这些数据我们现在可以做什么事情?第一个是对于上课纪律的监控,师生有没有迟到有没有早退,然后老师有没有在教学过程当中发生一些什么样其他的一些不雅的行为。这就是我想借这个事情跟大家分享一个经验。

我们知道现在目前就很多做AI技术的公司,我们其实在做这里面也应用到了一些友商的底层技术。但是我们发现我们最终在一些细节场景上面监控的准确率来说跟我们的友商对比起来,这个差距会非常小。就是我们基本上接近了专门做AI底层技术的这样一家公司。这个核心原因主要是因为我们有大量的数据和一个非常好的场景。

比如说做AI技术的公司他其实并不知道,对于一个老师的教学纪律监控我们应该要监控那些指标?而通过学员的反馈和家长的评价我们知道排名第一的是老师的迟到早退,排名第二是老师的打哈欠。那我们就可以针对性的对打哈欠这个事情作为精细的图像识别的分析。而这个分析在传统的AI领域公司首先他不知道这个问题,你最大的问题是你不知道这是个问题。

我们知道这个问题就可以针对性地训练它,打哈欠为什么在我们这儿会变成一个非常严重的问题?因为中美是有时差的。我们学员上课的时间大部分是美国老师上课的时间,很多老师是在睡眼惺忪的状态。而打哈欠的时候我们发现非常难识别,笑脸好识别,但是打哈欠和他张大嘴巴示范发音和他正要大声的说话,这个识别的难度其实是非常大的。但这个对我们非常有价值所以我们投入很大的精力把这块的数据研究上去。

所以这是我们首先第一个应用,它对于学员和老师的这个纪律上都会有评测。第二就是对于差课的监控。低于我们的平均值把它定义成差课,我们会有服务人员及时的回访,跟家长沟通到底是学生表现有问题还是说老师这一节课有问题?然后相应的我们会做一些调整。其他我就先不展开讲了。

屏幕快照 2018-11-20 下午2.09.19.jpg

这是我们目前的基础数据,每天处理三亿张图片,各项指标跟主流厂商的接近率是5%,我们最终每天关注的数据达到了十万家。这是我们目前在整个平台里面除了我们的一对一业务我们还有中文的业务,我们还有小班课的业务也都在应用课程质量分析的体系。然后最后是一个课程个性化内容的推荐,这个就不展开讲,因为我相信其实我们不管是用科技的方法还是用人文的方法,我们都在做类似的事情。通过学员的精细化的解读给他推荐更准确的个性化的学习内容。


1、本文是 芥末堆网原创文章,转载可点击 芥末堆内容合作 了解详情,未经授权拒绝一切形式转载,违者必究;
2、芥末堆不接受通过公关费、车马费等任何形式发布失实文章,只呈现有价值的内容给读者;
3、如果你也从事教育,并希望被芥末堆报道,请您 填写信息告诉我们。
来源: 芥末堆
芥末堆商务合作:王老师 18710003484
  • 【GET2018】VIPKID林陈斌:AI构建在线教学新生态分享二维码