越来越多的老师愿意在课堂使用自适应学习系统,学校的分析系统也可以通过预测提高学生毕业率。与此同时,算法的使用带来了许多伦理、实践和哲学问题。高等教育引入人工智能到什么程度合适呢?谁来决定算法应该是什么样的?
为了探讨这些问题,教育技术资讯网站Edsurge收集了斯坦福大学教育学院教育学助理教授坎迪斯·特尔(Candace Thille)和Civitas learning的联合创始人兼首席学习官马克·米利伦(Mark Milliron),两位分别就AI进入高等教育的痛点发表了自己的看法,并提出了一些解决方案。
Q: Civitas开发了用于高等教育的AI系统。马克,现在使用情况如何,学生又是怎样得到帮助的?
马克·米利伦: 现在的高等教育还处于使用人工智能的初级阶段。可能正从“问责分析”转变为“行动分析”。目前,高等教育中95%的数据工作着重于问责分析,即向认证机构、立法机构和受托人提供数据。我们的首席数据科学家来自医疗保健领域,他打比方说,高教机构似乎痴迷于“尸检分析”。利用已不在学校的人的数据,通过讲故事的方式帮助现有的学生。
我认为我们获取的数据更接近现实,实现“行动分析”,更好地帮助学生。我们开始使用预测分析,显示学生的行动轨迹,利用这些数据,帮助学生选择更好的发展路径。特别的,预测分析正努力将学生的未来个人化,并协助学生作出重大决定,同时在正确的时间为学生提供精确的支持和鼓励。
马克·米利伦
这么做一开始是有些痛苦的。我们要先将学生归类,然后做各种假设,基于某一类某一种假设,以确定学生做出1、2、3、4……种选择。从一开始给学生分类就充满了风险,同时其他方面也存在问题。幸好我们已经看到越来越多的数据,并且越来越精确。学生所做的,就是利用这些数据,为自己的学业锦上添花,或实现“自救”。
每一个数据都是一个脚印,把它们拼起来,就是学生的心路历程。这是学生的数据,他们的数据应该被用来帮助他们自己。然而现在学生的数据大多提供给了教育机构,仅仅用来告诉他们一些现象,一些事实。
Q:坎迪斯,你是使用人工智能和自适应学习工具的早期先锋,在卡内基梅隆大学学习,又在斯坦福大学工作。最近有人担心,公司提供的AI工具可能成为黑箱,受老师、教育工作者或高等院校的控制。你怎么看?
坎迪斯·特尔:我相信利用这些从学生日常活动中提取出来的数据可以支持学生学习,让学生受益,我对此非常赞赏。我们的工作方式与Civitas的略有不同,我们为学生学习特定学科时创造个性化和适应性的学习体验。因此,我们的工作方式是,跟踪学生在线学习时产生的互动信息,把这些信息丢进预测模型里,预测学生的学习轨迹。
我们所做的,是让AI系统支持教学决策。我们把预测信息反馈给系统或老师,帮助他们洞察学生学习问题出自哪里,以便做出正确的教育决策。
坎迪斯·特尔
怎样收集数据,预测模型中应包含哪些因素,如何权衡这些因素,使用何种建模方法或算法,预测中要表现哪些信息,以及如何将结果展现给不同的利益群体?等等。这都是非常活跃的研究领域,也是新兴的学习科学的一部分。
所以我认为在学术方面,所有这些,特别是模型和算法,不能黑箱操作,它们必须透明,必须能接受同行评议。同时,它们必须是具有挑战性的,这样我们就清楚地知道,正在做出教育决策的,是那些知道如何做出这种决定的人。如果只是说“相信我们,我们的算法是可行的”,那么我认为他们的是炼金术,不是科学。
Q:马克,作为一个公司领导者,你如何回应上一个问题?
马克·米利伦:我们绝对认为,想做这种工作的公司,都应该确保自己的数据科学预测是公平公正公开的。例如,如果你想查看学生的成长轨迹,那么工具应该展示最佳预测以及相应的得分和权重,你就可以看到,哪些变量影响了预测结果。
这么做的一个原因是,帮助教育者与数据互动,以对学生做出正确的决定。
数据应该交给那些管理顾问、优秀的学生,以及看得懂数据还会反思的人,然后发表到同行评议期刊上,让其他人都能看到学到。但现实是,目前建模还是一种商业化的东西,不是尖端科学,你能让教育者知道的就是使用了哪些因素,哪些因素是最具预测力的,以及它们是如何载入模型的。算法往往是不能公开的,它太重要,事关模型的正确性和效率。
让教育工作者思考这些东西目前还做不到。最好建立一些实践论坛,供人们分享使用经验。
Q:会有人担心学生和教授误用数据吗?
坎迪斯·特尔:很多人会认为,“电脑是无偏见的”,或者“它是客观的”,或者“它说的是真的”。他们没有意识到计算机算法是由人类编写的。建模时,模型中包含哪些因素?如何权衡这些因素?预测时依据什么标准得出分数?这些都是人为决定的。
如果我们的数据没有广泛的代表性,无法在不同环境里代表大部分学生,无法适用于特定环境,那么算法就会产生有偏差的结果。
马克说使用系统的人应该真正了解系统告诉他们的内容,应该会使用这些系统,这一点我非常赞同。但是我正在考虑制度问题。很多教育机构都承担着很大的责任压力,而现在问责制的一个核心问题就是毕业率。
假设我是一名学生。我想成为一名医生,所以报考一个医学预科班。第一年就要学习化学、生物和相关的所有课程,我有点惶恐,因为我没有上过高中,我真的属于这里吗?我很高兴自己能进来,但有点怀疑自己是否能适应这种学习。
第一年的必修课是生物序列和化学结构,我很讨厌这些,而选修课我选了自己很感兴趣的拉丁文化研究。我的生物和化学课程只得了C和D,但选修课学得很好。导师约我见面,他看了我的预测分析,分析表示我在本专业4到6年里毕业的概率只有2%,但选修课学得很好,如果转专业的话,肯定能获得更好的成绩,保证4年毕业。系统和导师都建议我转专业。
这时候我肯定想,那都是你们认为的。我的理想是成为一名医生,我来这里是学医的,不是换专业的。
这就是数据偏见导致的事件。
我关心的是已经处于这样形势下的学生的想法:“学校这么照顾我,老师最关心我的前途,他们也给我看过数据(证据)了,看来我成不了医生了,学医真的太难了,我想他们是对的,我应该换专业。”
这不仅仅是某个学习者的损失,也是大家的损失。一个本可以成为了不起的医生的学生却被数据引导着转行了,对于整个社会而言,也是一种损失。
马克·米利伦:我非常同意这个观点。问题是,我们能不能以一种完全不同或更有效的方式使用相同的数据。我们要使用设计思维,对那个学生说:“如果你真的还想走医学这条路,以你现在的水平,可以先通过这门课程,使用这些资源,这样你在4~6年毕业的可能性就增加了一倍。”
好在我们还处于非常初级的阶段,如果能在这方面建立一个行为规范和道德规范,就能确保事情往好的方向发展。
坎迪斯·特尔:我们还可以用另一种方式使用这些数据,不仅改变学生,还可以分析机构的教学模式。如果学生没有化学基础,那么问题不仅仅是“如何让这个学生与众不同”了,我们需要看看老师教化学的方式是否合适,以保证学生更多地通过。这可能是使用数据的另一种方式。
(本文转自智能观,作者Jeffrey R. Young )