科大讯飞教育事业群副总裁王卓
芥末堆 红印儿 11月17日
11月16日,在“GET2017教育科技大会”第三日的人工智能论坛上,科大讯飞教育事业群副总裁王卓发表了以“人工智能助力教与学”为主题的演讲。他介绍了科大讯飞人工智能技术的发展情况,并分享了科大讯飞将人工智能技术应用到教和学之中的经验。
“如果不能回应中国社会的重大问题,科大讯飞的价值会大打折扣。”王卓说。科大讯飞在教育行业中发现了很多亟待解决的问题,比如,如何让学生个性化地学习、如何减少老师的重复性工作。通过利用人工智能技术收集和分析教学数据,科大讯飞逐渐建立起一个网络化、数字化的教学平台,为后续实现个性化学习打下数据基础。
以下是王卓的演讲实录(芥末堆有删减):
今天我想在这里做两件事。一是向大家全面地介绍科大讯飞AI技术发展到什么样的程度、在教育行业是怎样应用的。二是介绍科大讯飞在教育行业中将技术、用户流量、内容整合、渠道建设都做到什么样的程度,看看这些资源怎么与在座的创业团队对接、形成生态,共同推动中国教育产业的发展。
技术发展的价值在于它能解决怎样的社会问题
首先,介绍一下人工智能现在的发展情况。人工智能已经上升到了国家战略的层面。在2016年,人工智能被美国和欧盟列入整体发展战略。我们国家今年出台了相关文件,公布了新一代人工智能发展规划。未来,人工智能对国家的经济发展将起到至关重要的作用。在人工智能的发展方面,中美两国处于同一个赛道上。我们在人工智能尤其是感知智能的发展赛道上处于全球最领先的水平。
今年2月,我国人工智能发展的进展受到美国的关注,《纽约时报》专门对此进行了报道。在发展人工智能的过程中,科大讯飞认识到这不是一家企业的事,也不是几个团队的事情,而是需要举全国之力来做。凡是有志于从事这个领域的团队、公司、研究机构,应该联合起来,一起推动中国人工智能产业的发展。2016年,我们联合相关合作单位发表了《人工智能深圳宣言》,就是要在国内团结一切可以团结的力量,共同推动中国人工智能产业的发展。
在这个背景下,我们再来谈教育。科大讯飞为什么要进入教育行业?科大讯飞发展到目前的状态,如果想在未来追求更大的发展,我们的价值取决于我们能解决什么样的重大社会问题。如果不能回应中国社会的重大问题,科大讯飞的价值会大打折扣。
放眼中国各个行业,教育行业存在的问题最多。教育行业未来的变革中存在巨大的商业价值,这是科大讯飞把人工智能技术应用在教育行业的根本出发点。由于教育行业的特性,这件事也不是一家企业能做的。我们怀着去年发表《深圳宣言》时的那种心态,希望团结国内有志于从事教育行业的企业和创业团队,一起实践人工智能在教育行业的应用。
我们把人工智能分为三个层次,即计算智能、感知智能和认知智能。计算智能是说机器就像AlphaGo机器人一样,计算能力和存储能力超强。科大讯飞的自身定位是在感知智能和认知智能方面。感知智能就是让计算机能听会说、能看会认,像人一样跟你交流。认知智能是说让计算机能理解、会思考。科大讯飞从1999年创业之始就在感知智能的赛道上,到今年,我们的位置已经从感知智能在向认知智能靠近。
在感知智能上,我们已经做到了全球领先的水平。从2006年参加全球的PK大赛到今天,科大讯飞代表中国在感知智能方面一直获得全球第一。不管是语音合成、语音识别,还是高噪音环境下的语音识别,在所有的PK评测中科大讯飞都代表中国拿到了第一名。我们的感知智能技术在全球绝对是领先的。现在,感知智能技术也用在了语文、英语、音乐等一些学科中,用来给学生构建标准化的学习环境。
关于认知智能,全球基本上都是围绕考试机器人在做。美国华盛顿大学的图灵中心已经把考试机器人作为人工智能的一个重要抓手,通过美国高中生物考试来检验人工智能的效果。日本国立情报研究所也把机器人是否能考上东京大学作为人工智能的抓手。
中国科技部建成了类人答题机器人,联合了国内9家最领先的研究单位,想在2020年让机器人能在全学科考试上达到前20%考生的水平。现在认知智能的重点都投向了考试机器人的研究。为什么?因为考试机器人回答的题目是你以前在社会上见不到的,解析题目并分析整个知识体系对技术的要求非常高。我们国家也把类人答题考试机器人作为中国人工智能的总抓手。
这对科大讯飞来说是一个机遇。科大讯飞牵头承担了首个人工智能重大项目“类人答题机器人”。我们跟其他另外8家单位一起致力于这方面的攻关。在高考机器人的攻关方面,我们以语音和语言为入口推动认知革命的整体变革。
在国家考试中心出题的评测下,150分的数学试卷,机器人基本能达到110分的水平。在医疗方面,360分就能通过全国医师资格考试,而机器人考了457分。医师资格考试的考题不是基于题库而是重新定制的,因此它的考试难度也相当高。
技术开始驱动教育的变革
科大讯飞如何把现有的技术成果应用在教育行业的变革中?我们总说技术是为教育服务的。教育是核心,技术位于从属的地位。但到目前这个阶段,技术发展的成果已远远超越了教学理论和方法论的水平。教育技术的发展已经对教育的方法论产生了具有变革性的影响。我们慢慢在形成一个共识,那就是技术在驱动教育,技术的重要性得到大大提升。
目前,中国的教育已经进入教育大数据时代。 这个“大”字怎么理解?我们理解它有两层含义,一是指数量大,二是指价值大。拥有最大量的数据并不一定就获得最大的价值。在大数据的背景下,教育未来的发展方向一定是在个性化学习上。科大讯飞也在从教育大数据、个性化学习的角度来推动人工智能和教育的融合。
人工智能技术应该给教育带来怎样的价值?第一,人工智能技术要对数据采集的手段进行变革。 大量的教和学的过程化数据都是以视频、音频、图片的方式存在的,但这只是数字化。想要形成数据化,就需要人工智能技术。人工智能技术要能把音频都转成文字,把以前写在纸上的作文识别出来,把以前在纸上写的学科试题答卷智能解析出来。用人工智能技术对课堂教学场景进行分析,是人工智能技术在数据采集和分析方面的重要价值。
第二,为教师减负增效。很多老师都在做重复性的工作,比如批改作业、重复备课。人工智能可以大幅提高老师的效率,让计算机来承担那些简单重复的工作。
第三,帮助学生实现个性化的学习,提高学习效率。一个初三的学生可能会花3个小时来练习一套题,第二天他做这套题可以得100分。通过后台数据的分析,我们可以在半小时里教给学生他想学的、欠缺的、需要提升的东西,剩下两个半小时的时间,学生可以做别的事情。
第四,为管理决策提供大数据,为科学治理提供支撑。国家对教育的年度投资已经达到了GDP的4%。想要知道投下去的资源是否产生了相应的效果,可以用人工智能技术分析教育大数据,给国家相关部门提供科学的决策依据。
用伴随式的数据收集与分析为个性化学习做铺垫
想要全面地推进人工智能,要做到三点:
1、深入一线,覆盖教、学、考、管
一定要深入到一线,不能就技术论技术。
人工智能技术听着很高大上,但也有短板,并没有达到完全成熟的地步。技术人员、产品人员必须要到一线去深入了解教、考、评、管各个环节,才能让技术与教育的应用场景结合起来。
2、互联联通,常态应用中收集真实教育大数据
常态化收集不是说收集一次、两次的数据。它是对课堂教学、课堂学习、家庭作业等环节进行日常性的数据采集,每天都会采集学生真实的生活数据、体质数据。常态化采集对供应商的服务能力、资金能力都提出非常大的要求。
3、应用大数据,实现个性化教、针对性学与科学决策
如果不围绕以上三点深入研究的话,人工智能就是一个高大上的东西,无法落地。科大讯飞对教学过程性数据的采集有一个完整的链条。从课堂互动、作业到考试,我们都会收集对应的数据。不同数据的采集方法有所不同。比如我们用智慧课堂设备采集课堂教学互动和授课数据,用手机采集日常学生作业和练习的数据,用校级云阅卷系统采集校内考试数据,用区域数据中心采集中考、会考等区域统考数据。
学校是数据采集的主战场。我们把科大讯飞的系统安装到学校里,目前主要针对中学。有1万多所学校部署了我们的系统,并形成了常态化的使用。采集数据的服务成本和资金成本是巨大的。每个学校都要配备相关的硬件、软件和到校服务团队。基本上每200个学校就要配12名地面服务人员。前期的硬件和软件投入都需要有资本实力,用免费部署系统的方式来培育市场、引领市场。
另外,建设自身品牌也很重要。当学校得知它的数据要汇聚到我们的平台上,一开始是会抵制的。我们通过一年、两年、三年用心用情的服务,树立起自己在教育信息化方面的品牌,获得了学校的认可,才能做出这样的汇集数据的平台。
目前,科大讯飞已经建立起一个网络化、数字化的教学平台,采用伴随式的教学数据收集方式,为个性化学习打下坚实的数据基础。
通过搭建平台、数据分析和资源建设让人工智能技术融入教育
在推广应用中有几个亮点。一是口语学习。口语学习面向中考、高考等各类考试。以前的口语考试要么缺乏客观评价学生口语水平的方法,要么所需投入的人力物力很大。一旦评审老师的疲劳了或者评分标准不统一,就不能保证公平。人工智能技术已经进入中高考的智能评阅中。我们的口语评测技术在广东、江苏、上海、北京、天津等十多个省市的中高考里已经得到全面的应用。
二是全学科的阅卷。批改主观题和作文会占用老师大量的时间。我们可以用人工智能技术把老师从重复的工作中释放出来。一些省市中高考的作文批改已经在使用我们的技术。
收集好数据后,最难的是对教和学的数据进行精准的分析评价。为了进行评价,要建立庞大的知识库,覆盖全学科、全学段。市面上能采集到的题库数据很多都是冗余的,都不能作为种子试题。当每个学科都选出四、五万道种子试题之后,就要开始搭建学科知识体系。体系怎么分层、板块怎么划分,全国都众说纷纭,很难找到一致的标准。科学的分层是靠采集到的数据来驱动的,是非常难的事,所需投入也很大。科大讯飞初步建立起一套分析评价体系,针对主管部门、校长、老师、家长和学生,都能提供他们相应感兴趣的评价服务。
我们帮助老师实现了精准的讲评。在上课前,老师就可以通过后台数据知道学生在作业中都有哪些问题。在课堂上,老师就可以采用更有针对性的教学策略,精准地去讲解相应的知识点。我们还初步实现了针对学生的个性化题库推荐。我们为某一个学科构建了898个知识点,还梳理了2489个题型,建立了5万多道种子用户题和60多万道拓展题目。在这样的知识体系下,当学生的学习数据被回收上来之后,就可以给学生更加精准地推送题目,提高学习效率。
我们的后台数据也支持老师的教研。以前的教研是经验性的,现在是大数据指导下的精准教研。很多学校已经建立了精准教研中心。根据学生的数据和分析,我们会告诉老师教学中存在什么问题,他们的教研应该如何更有针对性。
除了平台、数据分析和评价之外,人工智能发展还有一个很核心的问题,那就是资源的汇集。不光是计算机学习海量知识需要海量的数据,学生的学习、老师的教学也需要海量数据资源的支持。
我们的资源建设分为三个层次:
第一,国家资源平台。十二五期间,国家积累了大量的数据,包括名师资源、一师一优课的资源。我们把这些资源汇集起来,筛选出高质量的内容,为老师的课堂教学和学生个性化学习提供服务。
第二,各大出版社的资源。我们提供的数据服务覆盖学生学习的整个过程。如果要开发同步学习的产品,必须要拿到各个出版社的授权,去整合各个出版社的优质资源。科大讯飞每年会在这方面投入几千万的资金。
第三,教师日常教学的资源。我们用智慧课堂采集课堂上的全程数据。在后台,我们有一个3000多人的加工团队。
在未来,人工智能技术与教育的融合会向哪几个方面发展?现阶段,我们主要采集学生知识性学习的数据。今后,我们也会关注学生的成长数据、心理健康数据、体质数据、创造数据、核心素养数据等等。我们还会关注智能硬件、VR、AR技术的发展。最终,我们希望搭建一个覆盖全教育场景的教育数据中心,实现个性化学习、针对性教学以及科学管理。
2、芥末堆不接受通过公关费、车马费等任何形式发布失实文章,只呈现有价值的内容给读者;
3、如果你也从事教育,并希望被芥末堆报道,请您 填写信息告诉我们。