图片来源:unsplash
本文根据Aha社会创新学院顾远在前不久举办的第五届“中国教育三十人” 论坛上的发言整理而成,内容略有增补。
杨东平老师邀请我来参加这个论坛时,他跟我说的是让我点评前面的几位讲者发言的内容,来了以后我才发现已经给我定好了题目,变成演讲了,所以我没有PPT,和大家即兴地分享一些关于 “创新教育的评价” 我的一些思考。
前面杨老师分享时提到了芬兰的例子,芬兰的教育世界第一,而芬兰的学生并不像我们的学生学得这么辛苦。坐在我旁边的一位伙伴听到这儿就问了我一个问题:“你说为什么芬兰的教育世界第一,而芬兰的综合国力却并不是世界第一呢?” 我觉得这是一个特别典型的问题,它很好地体现出了围绕教育和教育评价人们常见的两种 “集体无意识” 。
首先,这个问题的背后暗含了一个假设,就是教育的目的是为了提升综合国力。
我们不排除从政府的层面或者对某些教育机构而言,这个假设可能确实成立。同时,我们也应该意识到,不同的教育主体和利益相关方对于教育的目的经常是不尽相同的。有人认为教育的目标就是“吃得苦中苦,方为人上人”;有人认为教育是为社会主义培养接班人,为民族复兴积蓄力量;有人认为教育应该是培养一个个活泼泼的人......对芬兰而言,很可能人家更在意教育是否能提升国民的幸福指数,然后顺便也提升了在PISA考试中的成绩。而后者,仅仅只是实现真正目标过程中的副产品。
于是,这就让我们意识到了另一个 “集体无意识” 。芬兰教育 “世界第一” 这个不假思索的说法是怎么来的?
原来,它指的是芬兰在PISA考试中的成绩世界排名第一。我们一方面不断地引用芬兰的教育实践来展示教育创新的多种可能性,来为我们打破应试教育的努力寻找启发,另一方面却仍然把它在一个标准化考试中的排名当作它的教育成就的证明。我们是否意识到了这其中的矛盾之处?
对教育的评价是很难的,哪怕是看起来非常简单的内容。
比如计算机课上学了打字,想测评一下学习效果,听上去足够简单了吧。但是测评的是速度还是准确率就不一样,更不要说还涉及到输入文本的难度,在不同干扰环境下的表现等。评价应试教育好歹还可以用考试的分数来衡量,评价非应试的创新教育就更复杂了。
此时,我想分享自己的一个核心观点:
关于教育的评价我们应该抛弃在下意识里的工业时代的思维,这种思维让我们总是想要找寻到一种“标准的、精确的、固定不变的”评价体系;
我们应该意识到教育评价是科学和艺术的平衡、精确和模糊的平衡、主观和客观的平衡,并且评价过程本身伴随着真实的学习历程,是动态的,而非静态的。
任何的教育评价都不是孤立存在的,而是服务于特定的教育目标,目标不一样,评价的内容、方式、主体等都会不一样。
比如现在学校都会重视让学生掌握一定的电脑应用能力,但不意味着教学目标就是一样的。“帮助学生熟练地使用数字产品” 和 “帮助学生借助数字产品来进行创造” 显然是两种不同的目标。
总体而言,教育创新的趋势在教育目标上表现为越来越以学习者的个人成长为中心,帮助学习者发现和发挥自身的潜力,获得终身幸福,并成为一个积极的公民。
进而,任何的教育目标总会落实到具体的教学内容上。
我发现做创新教育的人在设计各自的教学内容时一般是四个来源,当然这些来源往往相互交叉。
一个来源是国家的课纲,规定好了各个阶段学习者应该掌握的内容。
一个来源是所谓的“威胁论“,典型的如 AI 威胁论,我们要学习什么取决于什么事 AI 不能做只有人才能做的,否则我们以后的工作就要被 AI 抢走了;还有国家竞争威胁论,国民要学习什么取决于在国际竞争中要获得怎样的优势。
一个来源是学术上的实证研究,比如前面一位讲者分享的“创新素养”框架,就是依托于一些学者对这个问题的实证研究得出的结论。有必要提醒一句的是,对某一个问题的学术研究往往存在多个竞争性的理论,不可太过迷信某一个理论,而科学进步就是在不同理论间的竞争中发展的。
第四个来源是做创新教育的那个人自己。很多小微创新学校里,创始人都有自己特定的教育理念,可能出自某种信仰,可能出自某个理论体系或者流派,也可能是很个人化的研究和实践经验。
总体而言,教育创新的趋势在教学内容上表现为越来越从传授 “事实性知识” 转变为 “培养学习者的核心素养”。
不同的教学目标会侧重不同的核心素养。现在有很多的机构提出了各种各样的核心素养框架,彼此之间有相同的地方——比如常见的4C核心素养;但也有很多不同的地方,即便是同一个素养之下包含的内容也未必完全一样。所以我们不要去指望有一套标准的、适用于一切目标的素养框架会出现,同时,在应用某一个素养框架时也要能明白其来龙去脉才能有效实践。
测评方式可能是教育评价体系中人们最容易感受到也最受抨击的地方。
应试教育的测评方式一般就是标准化的考试,而且只能独立完成,不能和其他人商量,不能借助外面的工具,不能用网络查询,还只能用笔写。而我们又期待这些学习者在从学校毕业以后能够表现出良好地与他人协作的能力,能够熟练应用数字产品,能够有很好的网络素养、信息素养 …… 这岂不是很矛盾吗?
总体而言,教育创新的趋势在测评方式表现为越来越多元,越来越与不同的学习方式相互匹配。
比如现在很流行的项目式学习(PBL),常见的测评方式就是项目的最终成果展示和过程中的学生自我评价等。
上午有一位嘉宾在分享时提到美国做教育评价都是 “结果导向” 的。他还做了个类比,说就好比一只鸟捉虫子喂小鸟,你管它是怎么喂的,最重要的衡量标准就是最后那个小鸟能飞了就对了。我觉得这种说法难以置信,这个类比糟糕透顶。
首先,教育的目标——如我们前面所说,是多元的,不可能像小鸟会飞了那样就是为了一种结果。
其次,老鸟喂小鸟这是个由基因决定的生物性行为,小鸟长大了喂它的下一代还是一样动作;而教育可不是这种机械重复性的行为,教育是要帮助人发现内在动力和潜质去自我成长的,所以不可能不关注过程,只关注结果。
事实上,今天越来越多的教育测评除了测最终的学习成果,也会测评和记录学习的过程,并据此来帮助学习者调整自己的学习行为和下一步的学习目标。
这个过程很类似 GPS 在导航时起到的作用,帮助你到达设定的目的地,在过程中随着真实发生的情况及时地给予你反馈并调整路线。
而从更为深远的角度来说,在我们所面临的VUCA时代,连目的地的设定,也就是学习的目标,也是一边探索一边发现、不断进化逐渐形成的,没有一个现成的、所有人都一致的、清晰明确可以事先就能界定的目标。
另外,测评方式也内在的包括测评的主体。
传统的应试教育,就是老师出题考学生。在创新教育领域,我们会看到除了有老师参与的评价,也会有学生的自评、学生之间的相互评价、社区或者其他专业人士的评价等。
说到这儿,我想起来就在前不久(10月8日),台湾正式实施《学校形态实验教育评鉴规范》。其中第二条内容提到了政府对实验教育进行评鉴对原则是“协调沟通“,而不是我们在大陆常见到的”指导和规范“。同时,第三条第二款进一步指出评鉴之前要和被评鉴的机构协商评鉴的内容和形式,而不是要求后者去被动接受前者所规定的。这就更在实施细节上体现出政府主管部门对民间的创新教育的尊重和信任。同时,这也表明政府和民间创新机构都意识到,教育,特别是创新教育,是不能用一套标准化的体系去评价的,从内容到形式只能逐步在实践中摸索。
最后,就要说到教育评价到结果用来做什么,也就是教育评价的目的是什么。
传统应试教育是用一套评价标准来评价所有学生,本质上是把学生当作 “产品” 来筛选,所以评价的结果就是“成功”和“失败”,其实就是“合格” 和 “不合格” 。
总体上,教育创新的趋势在教育评价的结果应用上体现为越来越把学生当作 “用户” ,评价的目的不是为了奖惩,而是为了帮助学习者更好地学习,不断地改进自己的学习成果,提升自己的成长体验。
我们都听说过 “适应性学习(adaptive learning)” ,现在还出现了 “适应性考试(adaptive testing)” ,根据上一道题的结果推送下一题,以便更有效地评估学习效果,也便于学生和老师根据每一步的测评来决定下一步的教学。
教育评价体系的问题目前已经成为制约教育领域创新发展的最主要的原因之一。很多关心教育创新或者正在实践教育创新的人会积极地从网络上或者书本上搜集各种素养框架、评估表、评价工具等,一些教育机构也会展示一套看起来非常细致严谨的评估框架来证明自己的教育实践的有效性,却往往忽略了:
一、创新教育并不存在唯一“正确的”评价体系,而只有“合适的”评价体系;
二、“合适的” 评价体系由教学目标、教学内容、评价方式,以及对评价方式的应用这四点组成,并且这四点有着高度的内在一致性,相互匹配并相互支持。
各方对教育评价体系的探究正越来越深入,很多很精细的框架已经出现并正在实践中被应用。比如 Summit 的学习测评系统,基于斯坦福评估学习与平等中心(SCALE)的跨学科技能评估准则。这套测评系统精细到学生七大认知领域的36个具体的认知技能,每个认知技能还被细分为8个不同等级。借助这套测评系统,人们希望能够更加精确、具体地展现出每个学生的认知能力发展程度,并帮助他们提出更加清晰的学习目标,来达到综合知道和规划学习的目的。
再次提醒一句,这些都只是测评系统 “之一” ,而非 “唯一” ;并且它要真正发挥作用,一定是建立在上面我们说过的四点内容相互匹配相互支持的评价体系之中的。
在测评体系不断走向精细化的同时,我们也不要忽略或者排斥相对主观的、定性的、模糊的测评方式。
德鲁克在回顾自己成长历程的时候提到过自己在小学阶段遇到了人生的第一位导师艾尔莎小姐。这位年轻的女士发现了小德鲁克在写作方面很有天分,于是鼓励小德鲁克每周都写一篇自己想写的文章,然后给予及时的点评反馈,帮助他不断提高写作水平。最终德鲁克的写作天分得到了极大的发挥,他不仅是个思想家,还是个文体大家。另外,德鲁克自己成年以后经常使用 “反馈分析法” 来助力个人成长。他每年都会给自己制定个人成长计划,定期用实际的成果与当初的计划做比较,借此分析出自己的长处、自己的学习方式的特点,并制定下一阶段新的成长目标。
教育的 “出口” 对教育和教育评价的影响是显而易见的。
人们常说教育的目标就是3C:College(大学)、Career(工作)、Citizen(公民)。长期以来,体现标准化考试的成绩的一纸文凭成了教育的 “出口” 判断教育成果的工具。本质而言,文凭是为了解决信息不对称的情况下快速筛选人才的问题。那么如果在信息相对充分透明的情况下,是不是可以尝试更多其他的对教育成果的认可方式。比如小微创新学校在彼此熟识的情况下,可否相互认可彼此的学分和各自多样的评价方式;比如企业和学校之间建立委托培养关系,用毕业生在实际工作中的表现作为教育成果的体现;再比如国外有一些以同辈学习(peer-to-peer learning)为主要学习方式的学校会向本地的高校提出要求,在录取自己的学生时增加 “同辈证言(quote)” 作为学习成果评价的比重。
最后我想指出的是,关于创新教育的评价我们可以从其他一些地方获得启发。
比如企业是如何 “选用育留”人才的,如何编制 “素质词典” 、如何制定 “人才发展规划” 的;比如幼教、特殊教育领域是如何做教育成果评价的,因为这些教育领域相对离应试教育比较远。时间关系,我就不展开细说了。
今天这场即兴发言基本上把我对创新教育的评价的主要观点都说了,内容有点多。
如果大家只能记住三个词,或者三句话,我希望是下面这三个:
1. 目标:不存在放之四海皆准的评价标准,任何教育评价框架的起点都是教学目标。
2. 平衡:教育评价是科学和艺术的平衡、主观和客观的平衡、精确和模糊的平衡。
3. 动态:教育评价的方式回应着教学目标和教学内容,目的是为了帮助学习者的成长,所以做教育创新的人应该有能力及时地动态调整自己的教育评价方式。
本文转自微信公众号“Aha社会创新学院”,作者顾远。文章为作者独立观点,不代表芥末堆立场。
2、芥末堆不接受通过公关费、车马费等任何形式发布失实文章,只呈现有价值的内容给读者;
3、如果你也从事教育,并希望被芥末堆报道,请您 填写信息告诉我们。