提到教育测评,你会想到什么?是密密麻麻的答题卡?是挑灯夜战的苦苦准备?还是卷纸上的一个个红勾叉?其实,随着科技的进步,测评早就远远超出了简单的“考试”概念。它不仅开始与大数据结合,更开始逐渐从大一统、一刀切的标准化向更尊重个体的个性化转型。而且,测评也越来越成为对教育进行修正的重要参考,甚至在科技的帮助下,测评可以为教育者提供实时的教学效果反馈,提供跨越不同国家的横向比较,为个人提供更有时间纵深的综合动态测评。
从七十年代开始,由一小群来自华盛顿和俄勒冈州的教育研究者组成的NWEA(Northwest Evaluation Association)专注于推动对考核与测验环节的改革。在他们的努力下,美国的测试系统已经进入了崭新的信息化、全球化的时代。中美对话与NWEA进行了深入的访谈,以寻求新时代下更创新有效的科学测评之路。
1977年,NWEA刚刚成立的时候,公众所熟知的教育测评系统还属于“一刀切”的统一纸质考试。当年,NWEA所希冀的是建立一个鼓励因材施教的测评系统。在他们设计的考试中,老师会依据学生的学术水平为他们选择不同难度的试题,每道题的难度都是在和其他题目的对比下设定的——这是美国第一个个人化的测试平台。据此,NWEA建立了一个可以比较衡量学生成果的“成绩等级”。这项测试的强大之处在于,它既可以评估学生相对于同龄人的水平,也可以体现学生自身对于知识的熟练程度。这使得我们对于测评的理解,远远超过了“考试”的概念。
NWEA设计的“适应性”个性化试题(图片来源于网络)
今天,NWEA把考试搬到了网络平台上。从二年级到十二年级的学生都会在打开浏览器窗口时被分配到一个和他们年级相符的题目,如果他们答题的过程进行得顺利,系统就会给他们提供更复杂的试题,如果错题率较高,考试难度就会相对降低。NWEA的董事会主席、布朗大学教育政策学教授Kenneth Wong博士在接受中美对话收集时告诉我们,这份测试的目标是让每个学生达到50%左右的准确度,从而来监测学生在自己学习阶段所能自主取得的水平。
MAP:关注到每个学生的个性化考试
MAP考试界面(图片来源于网络)
这份测试的官方名称叫做MAP(Measures of Academic Progress)。它不仅高效,也非常简明易懂、利于分析。NWEA研究中心的负责人John Cronin博士对中美对话说,MAP后台的系统中对每个分数段都有详尽的解释,说明在这个水平的学生都理解和消化了哪些知识点,下一步的学习应该如何进行,以及哪些方面还需要提高。MAP的另一个革命性特点是,它可以给教师提供实时性的反馈。借助互联网的媒介,教师们在考试后就可以及时收到对学生水平的评估。一年中,这项测试会进行三到四次,所以在每个季度,老师们都有根据测验结果改进自己教学方法的机会。来自密西西比州的学区副主管Jody Woodrum博士说,MAP告诉教师们应该特别关注哪些落后的孩子,又应该给哪些尖子生创造更多进步的空间。
现在,NWEA已经从创建时的14个学区扩张成了一个全国性的组织,并在全球都有合作伙伴,MAP覆盖的学生人数也达到了700多万人。NWEA的独特性也恰恰在这点体现:它创造了一个国家级的基准组,并提供了将全国任意两个学生相比较的可能。
使用MAP进行学生进步追踪及基准比较(图片来源于网络)
MAP所使用的基准组由一个经过加权的公式计算而出。这个组中的学生的种族及社会和经济条件的比例都代表了全国人口的分布——这些数据对建立比较教育的研究来说非常重要。Kenneth Wong博士也告诉中美对话,NWEA 正在创建一个大型教育数据库——这个数据库将不仅仅包括分数,也会体现学生和学校的社会性组成。
在研究人员的努力工作下,NWEA现在可以把单个学生的表现和基准组相对的百分比呈现出来。比方说,一个考到200分的学生所取得的百分比可能是45%,说明他在基准组中领先了45%的学生,他可以据此来了解自己在同龄人当中的水平。除了常规比较之外,NWEA还可以通过几个调整来评估学生水平的增长。在增长评估中,NWEA将不再考虑学生的种族背景和经济水平,而用来比较的两个因素则是起始分数和教学量。比如再回到那个以45%的成绩获得200分的学生身上,在28个星期的教学后,他和全国的基准组形成了怎样的比较?如果基准组在这个教学时间内进步了8分,而我们的学生进步了10分,那么我们可以说他走在了基准组的前面。
NWEA的学生报告样本(图片来源于网络)
制定全国性基准组并真正比较学生需要大量的实时数据。NWEA不仅做到了这点,还将会为学生提供一份跟踪他们至少三到四年的持续进步纵向报告。个体学生比较的方式是根据每所学校用来预估学生成长轨迹的8-9项数据而产生的。但是,NWEA还没有开始制作预计未来轨迹的建模。在这方面,Cronin博士认为,为低成绩的学生预测低增长轨迹可能是无益的。他补充说,NWEA的理念并不是简单地预测未来的增长——他们希望制定一个可以改变低增长轨迹的课程,而不是固化这种模式。
OECD: 与全球同龄人的同场竞技
学生们用NWEA设计的系统测试(图片来源于网络)
在国家一级上,NWEA最近开始与PISA合作,为美国国内的学校提供OECD测试,从而对国际上的学校和学区之间进行比较。OECD的测试方式是从每所学校抽取85名15岁的学生,并提供数学,阅读和科学的比较考试。在此之前,PISA提供了国家间宏观教育系统的比较,而NWEA可以把这种对比推进到学校一级。Kenneth Wong博士在收集中告诉中美对话,每个学校将接受相同的测试,考试将与PISA考试中项目水平的难度相符。接下来,NWEA可以据此为学校生成报告和个体化支持。 “例如,美国Fairfax的一所学校可以参加OECD考试,并可以根据之后生成的报告来判断学校具体到八年级数学的教学水平是否和在中国上海或芬兰的学校持平。”在教育数据变得更加全球化的今天,这一测试有助于推动透明化的国际数据共享,并为学校提供了相互学习的机会。
在发表于《教育周刊》的一篇文章中,弗吉尼亚州Fairfax县的前学区主管John Dale和读者分享了他在学校推行OECD测评的经验。Dale先生认为,在排名之外,向来自全球各地教育界的同行学习更为重要,而OECD就为他的学区提供了一个这样的学习机会。作为全美第11大的教育系统,Fairfax县的学校发现,OECD测评提供的对比可以更好地让他们认知自己在全球化标准中所处的位置。很多校长表示,他们想了解他们的学生和世界范围内领先的同龄人们相比之下的水平,从而为学校制定国际化的基准。
NWEA出具的学校报告样本(图片来源于网络)
在参加OECD考试之后,所有学校都会收到一份非常详尽的报告,其中将会包括对测试结果的详细解释和每份试卷结尾的学生调查。每份报告将会把单所学校的表现与全球高中的表现进行比较,并强调与该学校相关的分析结果。 例如,在Fairfax县,这份报告显示,该地区学校的表现优于芬兰和韩国,并在科学方面和高排名的国家极为接近,但通过将更多的跨学科学习纳入课堂,学校的表现还可以进一步提高。
忧虑:用于教师或适得其反
尽管有这些优势,这两个测试还是不可避免地招致了一些批评和质疑。除了学生评估之外,MAP评估已被印第安纳州的一些学校用作教师评估工具。Cronin博士向我们指出,NWEA不希望看到这种趋势,因为它可能会损害学生和老师之间的信任——通过使用MAP评估作为问责措施,教师可能会越来越担心评估结果本身,而不是将其视为提高其教学技能的一种方式。这一发展不仅破坏了评估的原始意图,而且对学生和教师的成长都有害无益。
无论如何,MAP和OECD测试等评估的出现在当今教育行业的发展中依然有着至关重要的作用。在学习过程的数字化进程中,个性化学习平台的发展需要与其兼容的评估系统来跟踪。MAP评估的灵活性可以帮助教师和政策制定者们来高效地收集和查明学生的成绩,加强了他们对学生学习过程的了解,并给予了他们可能的干预和支持方式。与此同时,OECD测试则为学校提供了具有突破性的、将学生的表现与世界各地的其他学校进行比较的机会。
因此,当人们询问:个性化教育怎么测评?全球化是否带来了教育评估方面的进步?我们说,因为NWEA的努力,美国教育行业向着透明化、现代化及国际化的未来跨出了一大步,问题的答案,或许在这里。
本文转自微信公众号“中美对话”,作者翁馨,编辑蒲艾、丁梦琪,芥末堆经授权转载。
2、芥末堆不接受通过公关费、车马费等任何形式发布失实文章,只呈现有价值的内容给读者;
3、如果你也从事教育,并希望被芥末堆报道,请您 填写信息告诉我们。