芥末堆芥末堆

【GET2017】首师大方海光:能够进行知识共享共建的都是好的教育大数据

作者:吉吉 发布时间:

【GET2017】首师大方海光:能够进行知识共享共建的都是好的教育大数据

作者:吉吉 发布时间:

摘要:教育大数据应用研究进展

屏幕快照 2017-11-15 下午4.11.38.jpg

芥末堆 吉吉 11月15日

在以“共建·让更好的教育来得更快”为主题的GET2017教育科技大会“学术发展论坛”上,首都师范大学教育技术系教授、人民教育出版社数字教育研究院首席研究员方海光带来了主题为“教育大数据应用研究进展”的分享。

方海光认为教育大数据对于课堂来讲,它真正产生价值的是形成了一个闭环,学生和教师都形成了一个闭环,这种闭环能够使学生的学习效果越来越接近于他预期的目标;对于学校来讲,大数据真正的价值,是实现跨业务的共享。

以下为方海光的演讲实录(芥末堆略有删减):

各位嘉宾、各位好朋友,各位老师、各位同学大家下午好,我用20分钟的时间把我们最新的一些研究的成果,尤其是关于教育大数据方面的内容跟大家汇报一下,主要讲解一些基础的东西,包括我们最新的一些研究,有些内容也确实是我们第一次呈现给大家。

屏幕快照 2017-11-15 下午3.22.43.jpg

首先是背景的内容。这是关于大数据的生态图,在这张图上我们可以解析,解析出来以后就是我们教育大数据,教育大数据有两种理解,一种是大数据技术在教育当中的应用,二是教育行业内的大数据。第一种思路是完全以大数据作为技术切入进来,第二种是以业务为主导。

所以我们一般倾向于理解成第二种,教育行业当中的大数据这样的,因为这个行业很特别,我们知道技术影响最差的就是教育,因为教育里面的很多业务是很奇怪、很特别的,所以这里面的数据也不同。

所以右边我们看到,我们可以把它分成四个层次,第一层次、第二层次主要是针对于企业的,包括互联网企业、云平台企业,第三和第四是针对研究机构和学校的。所以各个不同角色在上面有不同的分布。

大数据能解决所有问题?

屏幕快照 2017-11-15 下午3.32.13.jpg

第二个图我们想说清楚,在大数据方面最重要的一点就是数据的来源,而这张图当中我们说明白数据的来源是两个。一种是我们通过自己的方式去采集,另外是通过其他系统进行交换。这是两个最主流的来源。而且教育大数据当中,一种是传统我们看得见的结构化数据,比如说我们测试的数据,典型是属于这一类,另外是非结构化的数据。在教育里面非结构化的数据占更多的比重,远远超过50%。所以这也是教育行业当中整个大数据最奇怪的地方。

屏幕快照 2017-11-15 下午3.33.56.jpg

第三个图我们想说的是目前我们看得见的整个社会有一个潜在的发展规律,大家看得见,比如说亚马逊、共享单车,还有我们看到的外卖美食,统统原本都是很小的数据,当这种小数据聚集在一起,尤其是通过互联网加大以后,就变成一个很大的产业,而这种产业我们认为是小数据聚集在一起成为一个大企业,这也是一个大数据的体现,虽然数据量很小,但是一个大的产业,影响巨大,这也可以称为一个大数据。

所以这样的话,我借用张院士的一句话,目前大数据很热,似乎大数据能解决所有的问题,但是真要大数据解决所有的问题,那这个就不叫大数据了。

因为当前有一种争议,认为大数据能够解决所有问题,尤其在教育领域,好像以前解决不了的问题,今天我们用大数据都可以解决。其实不然,大数据只是其中一个方面。未来我们描述大数据能够解决很多的传统的B端,这是能够看得见的,尤其是传统以经验为基础的处理方式,未来在大数据方面,我们有新的处理的方法。这是基本的定位。

什么是教育大数据?

我们简单跟大家说一下,从我们的视角来看,到底什么是教育大数据,这是最关键的。目前来讲我们不纠结数据的量的大小,也不去考虑它的存储空间多大,我们考虑只要能够支持共建、共享,能够产生新的价值的这种数据,其实就是好的数据、就是大数据。

目前我们会特别关注全学习过程的数据,以往我们所有的研究很难跟踪一个人的全学习过程,甚至部分刻画都刻画不了,现在我们把教育大数据聚焦到全学习过程,所以我们想这更多是一个新的方法,所以这个是大数据真的有价值的地方。

目前来讲,国内包括美国现在是这么一个情况,整个的大数据的应用是在国家的这个层面上,尤其教育大数据是在国家战略这个层面。所以,我们有国家的实验室,包括国家整个的行动计划,应用方面有三大类:

  1. 教育大数据中心。我们看见各地、各省、各区域都在建教育大数据中心,这是典型的一个应用。

  2. 区域当中的共建共享。这个甚至包括联盟、跨地区、分校之间的数据的共建共享。

  3. 围绕我们的学习过程。我们会把它更多的聚焦到课堂。

这三大类的应用都是教育大数据典型的应用的场景,我们在我们出的这本书当中(国内第一本关于教育大数据),专门详细分析了这三大类的应用:第一大类相当于聚焦到课堂,第二大类相当于聚焦到大系统的建设,第三大类其实指的是共建共享。所以,共建共享的思想其实才是最归根到底的一个思路。

这个是学习的过程,分为老师和学生课前、课中、课后;

屏幕快照 2017-11-15 下午3.50.24.jpg

这个是整个过程的数据,多样化的,非结构化的,比如说一些行为、作品类的都可以;

屏幕快照 2017-11-15 下午3.52.04.jpg

这个是典型的在反转课堂当中,课前和课上中间的反馈环节,就是一个大数据体现的环节,包括学生提到了一些问题(非结构化),学生观看视频的一些时间,回答问题的一些准确率等等,都是大数据的体现。

屏幕快照 2017-11-15 下午3.51.21.jpg

这个是传统我们看得见的事件诊断和分析,这个是会有特定的应用。

屏幕快照 2017-11-15 下午3.52.36.jpg

这个是我们的一个小研究,关于数字化课堂教师和学生行为交互的一个数据采集和分析的系统,我们称之为改进型弗兰德斯,这样的一个系统,相当于课堂上对于老师的一种观察。

屏幕快照 2017-11-15 下午3.53.23.jpg

教育大数据的学校应用水平如何?

目前来讲,我们会聚焦到在学校这个层面,到底这种大数据应用在什么样的水平,这是一个关键,目前我们会分成三大类的水平:

  1. 这个学校仅仅是一个数据中心,它只会采集数据。

  2. 采集完了之后会考虑一些应用,比如说精准的教学,在这个层面他会考虑数据标准的问题。

  3. 围绕这这个数据他有一些增值或者一些价值的一些体现,这样会产生一些价值的共享,三个不同的层面。

对于课堂来讲,一般我们也分成三个过程:采集数据、应用、挖掘和分析。所以,这个是聚焦在课堂上的大数据。

如果我们要聚焦到教材上,尤其我们说第三代的智能的教材,从传统最早期的电子课本、电子书包,第三代的智能化的教材。智能化的教材真正的应用效果就在在于它的一些速度、适切性和安全,说白了它就是一个大数据,它的基础也是教育大数据。

然后教育大数据如果对于课堂来讲,它真正产生价值的是形成了一个闭环,学生和教师都形成了一个闭环,这种闭环能够使学生他的学习效果越来越接近于他预期的目标。

对于学校来讲,大数据真正的价值,是实现跨业务的共享。比如说我们拿学生的食堂数据来分析他未来是不是有给补助的要求,这个是跨业务的共享。

所以这是在学校一端真正能提现很大价值的一个地方。

教育大数据可以参考的标准是什么?

目前,我们很多的地方都去建大数据系统,到底怎么考虑它的标准?我们给大家一个建议,因为这个现在各市其实建的很多,我把全市所有的学生全聚集在一起,聚集到统一的一个平台上,这有一个大数据,其实这只是大数据的一方面。

大数据的核心思想并不是建这个中心,更多的是建一个生态,让所有的数据能够流转起来、融通起来。

所以这种数据的存储应该是分布式存储,并且建立相应的应用,目前来讲我们可以参考的标准是XAPI的标准,可以参考的体系架构是L2S一类的体系架构。这一类的应用可以将学校非正式的学习正式化,比如说学生在操场上的学习,纳入到整个记录当中这样去做。

屏幕快照 2017-11-15 下午3.58.58.jpg

教育大数据对学习的过程需要数据的融通,其实传统我们国家的CELTS标准,包括传统的国际上的Sgall标准都解决不了这个问题,而Sgall标准的升级版XAPI它的整体架构特别值得我们参考,去生成我们自己的应约标准和国家标准。

这个系统是这样,整体上有一个专门记录的独立系统,在不同的场景有不同的平台,原有的平台保持原有的应用,一起对焦到LRS当中,相关的LRS相互可以进行通讯,并且支持整个数据的分析,整体是这么一个架构。

教育大数据构造的课堂是什么样子?

下面看一下我们说大数据构造的课堂,这是我们基于大数据构造的一个新型数字化的课堂,这种课堂依然还是以学生为中心,但是这是一个数字化体系。有别于传统的课堂,在这个体系下,我们可以把各个环节的数据分解,这是目前国内分解最细的一个模型,每个分解点上我们可以根据你能采集到的数据进行采集数据,我们针对这个课堂可以进行数据挖掘和预测,这也是这个系统的一个架构。

屏幕快照 2017-11-15 下午4.01.25.jpg

目前来看,真正落地的学校当中很多的平板教学,对于平板教学采集到的数据是两大类:

  • 一类是过程类数据。比如说看视频自主学习。

  • 一类是评测类数据。比如说作业和测试。

再看一下教育大数据的处理过程,一般根据我们大数据的一些要求,教育大数据处理过程是这样的,采集、处理、分析、呈现、挖掘、预测,有些解读为学习分析的过程,有些解读为教育数据挖掘的过程,两者可以融合为一体。

对于学生我们更多是一个个性化的学习,对于教师精准教学,校长精准管理和精准的学型分析、教研员精准教研,包括一些新方法。

所以对于不同的关系的人有不同的特定应用,目前来讲,我们说教育大数据的分析方法和手段,一系列的,因为有很多的研究只是其中的一块,这是传统的进行数据分析常规的方法,在这个基础之上我们可以进行挖掘和BI的分析,可以进行大数据的技术,进行一些可视化。所以后面相当于延伸出来的。

屏幕快照 2017-11-15 下午4.07.26.jpg

当然还有一系列的详尽的方法,比如说决策数、聚列分析、聚类、关联、神经网络,这些就不说了。

谢谢各位!


1、本文是 芥末堆网原创文章,转载可点击 芥末堆内容合作 了解详情,未经授权拒绝一切形式转载,违者必究;
2、芥末堆不接受通过公关费、车马费等任何形式发布失实文章,只呈现有价值的内容给读者;
3、如果你也从事教育,并希望被芥末堆报道,请您 填写信息告诉我们。
来源: 芥末堆
芥末堆商务合作:王老师 18710003484
  • 【GET2017】首师大方海光:能够进行知识共享共建的都是好的教育大数据分享二维码