图片来源:pixabay
小序:
在最忙的时候写文章,当然是迫切的想聊一聊。
但现在时间有限,所以把几个话题合并一下,简单聊一聊。却不是特意凑在一起,它们还是有一个逻辑的。应试——高考机器人——教师的可替代性:反射了当今教育的三个方面。
不想做任何争议,就为发表我内心的看法。如果有想深入争论的同学,倒是可以和“自适应”话题系列一样,开一个局:只可惜我这几个月是最忙的时候。
时值高考,一下子沸腾了。不仅是忐忑的考生们、焦急的家长们、以及等同陪考的班主任和老师们,教育圈里也有话题开燃。
我列一下:
罗崇敏:两个伪命题戕害中国教育
早叔看高考:高考是最公平的制度?人云亦云罢了
数学高考:两 AI 考生交卷,最高考到 134 分
AI高考数学考了134分,人类的噩梦开始:学霸淘汰,老师下岗,社会分层?
怎么样,题目火爆吧?四篇文章,足以掀开了当下教育许多重要的问题。李子来一一细表。
如何看待“应试教育”和“素质教育”
罗老师的文章很犀利,提出了二分对立应试教育和素质教育,其实是戕害了中国教育。因为,所有的教育都是应试教育,也都是素质教育,它们是教育的不同维度——一个是就测评而言,一个是就目标而言。
相信很多行内人还是赞同这种看法的。但我觉得值得进一步的商榷。
我首先立论,中国“应试教育”现状不容我们把这个概念大而化之。教育测评固然是现代教育的一大根基——我许多时候也提及,对教育测评,即使是大规模标准化测评,都应持有正面的看法。因为这是社会学领域科学化后的进步,也是公共教育的进步。即使在某个时期来谈中国的应试教育,也有其进步性。但在于今天,我们对“应试教育”如此作论:
应试在我国起源于一千多年前的科举制度,到目前为止,除了文化大革命中废除应试,凭“一手老茧”、“一身泥巴”和“一颗红心”,由工农兵推荐上大学外,我还没有发现那一个国家上大学不要应试。只是应试的内容和方式方法不同而已。比如中国的应试只是在纸上,而发达国家的应试在笔试、面试、社会实践等各方面。应试是教育命题中应有之意,不存在应试教育之说。应试作为评价办学质量和学生素质的手段之一,只要教育存在应试这个手段就存在。关键是应试内容的真理性,应试方法的科学性,应试结果的运用合理性,保障应试评价的客观公正性。
确实是不妥的。中国的“应试教育”,有其鲜明特点。概括起来就是三点:
中高考是划定考试范围的、以知识掌握数量与深度为考察目标的纸笔考试。(虽然演进过程中出题方向有变化,但和“知识应用和迁移”为目标的考试还是有根本不同的)
中国的学校的教学和学生的学习是以中高考为核心的,是面向中高考的。进而,整个教学与学习管理的内核,就是应试。
中国的高校在录取学生时,长期的主流手段就是一考定终身。高考考分是唯一录取标准。
把“应试”任意大而化之,脱离了这三个根本点,都是有故意混淆之嫌。固然一些高校开始了自主招生尝试,开始了面试,但把更多的教育测评手段都说成是应试,这个逻辑无法让人信服。否则,在这个意义上而言,上帝review众人,决定你是向上走还是向下走的时候,也是“应试”终结性评价了?还有一个例子是,如果你邀请一位欧美国家的教育学者,你告诉他们——他们的中小学教育和中国的应试教育,在应试层面没有任何区别,你认为他们会非常认同?
不要开玩笑了。
应试教育中当然也有素质。某某中学的学生,包括我少年的记忆,天不亮就出操,一把水抹脸上,回来刘海都是冰——这当然锻炼了孩子们的意志,孩子们的坚毅。但你不得不承认,这和“士不得不弘毅,任重而道远”是两码事,我们自己也都是从那个过程出来的,现在毕业生们漫天飞舞的珍贵碎纸片,也在诉说着其中的故事。
有其不得已的理由,但不应该成为理想的典范。
当然,素质教育也是一个讲不清楚的概念——这里罗老师说的对,有什么教育不是以提高学生素质为目标的吗?只不过,我们期望孩子具有什么素质?!这样的素质如何可以落实?!
这是当下最大的问题。
那么我的观点是什么呢?我的观点是中国应试教育必须改革。至于如何改这是一个大话题,我不准备在这里聊。但老老实实的探讨我们期望孩子具有什么素质,我们如何看待孩子,这是必须的。而且,仅凭一家之言应该是不行的;教育应该允许乃至赞许百家争鸣。
有些朋友会重提应试教育带来的公平性——有人戏言,这次高考是考生们最后一次公平考大学的机会。关于这个话题,请见前面杨早老师的文章——早叔看高考。我以为不要轻易相信应试教育是公平的,它发展下去只是对某些人公平的。上帝造人没有参考中高考的题目类型。
如何看待中高考的衍生教育产品
商业的逻辑,完全不同于教育的逻辑。商业就应该挣钱,否则对不起股东。但教育,其本质就应该是有教无类,就应该是犁牛之子,山川不舍。
但问题摆在了我们这一群做教育的市场力量同学的面前,我们是商业教育产品。
做中高考的衍生教育产品,我个人其实没有任何问题。应试教育,即使缩小到大规模标准化考试仅作为录取参考因素的一员,我也认为很值得一批人的投入。从这个点上而言,我对于那些在提高应试效率和成绩的战友们,表示鼓掌。
抛开这个潜在争议点之后,我们回到这个话题上:就是新鲜出炉的高考机器人。高考机器人在新闻出来之后,教育的圈子里,还是小小高潮了一把。一般集中在两个点上,其一是如何做出来的,其二是有什么用。再概括一下,那也是如何看到高考机器人。
高考机器人是少有的技术和传播天生相合的爆点。当然,受限于中国的考试制度,如果高考机器人可以在考试院申请到一间教室,可以和学生们同步参加高考——那边学生刚发下来试卷,这边没多久高考机器人交卷了——这个活动会更加的火爆。
谈谈高考机器人的实现
可是,它到底如何做到的呢?我没有做,当然没有办法准确回答。想必两家也没有发论文的想法,不能如alphago一般,棋谱和原理都摆出来。但两家都排除了基于题库的检索和匹配这种方法,其中林老师那里还断了网。所以我们可以暂且抛掉这个实现思路。而认为它是基于自然语言理解和推理答题的。
如果是这样,它到底有多牛X呢?
在智能技术层面,它有两个大坑。一个是自然语言理解和处理相关,主要包括题目文本的处理和符号化过程,以及推理完成之后的解答生成。另一个就是推理解题。
虽然我们不知道它们实现的细节,但从一些例子中可以管中窥豹。
首先指出,我们记者同学不要使用一些惊叹误导——比如,诸如机器人可以在很短时间内交卷,还能考一百来分,再比如,这个机器人没有使用任何专家知识库。机器人的能力,和时间没有线性关系——这是和人不同的,或许这也揭示了,人的智能系统与人工智能系统,还是有根本区别的。所以十分钟交卷,和两个小时交卷,没有那么大的差别。同样,只要做自然语言处理,就离不开专家知识。现在做词性标注和句法分析,不可能离开基础词库和语料库,有很多语言学家的知识贡献;做分类也需要训练样本。(当然,随着智能技术发展,它可以尽早脱离呀呀学语的阶段)
然后我们看一看题目的文本处理。高考数学试卷,是一种专有领域的文本。不同的题型,其处理难度也是不同的。我们最常见的,就是数学对象的识别,包括专有名词、公式符合、习惯表达等,比如大部分的选择题,都可以通过这样的数学对象的识别,转化成一个“条件、问题、选项”的符号化表述。有了这样的符号化表述,就可以使用训练好的推理解题引擎,来进行解题过程。
我们来看一个例子:
这是北京文科高考第一题,这一题的条件是“全集R,集合A”,问题是“求A的绝对补集”,四个选项都是集合。
类似于这样的、大量的基础性题目,其文本处理和符号化过程,就是一个基本的专有领域的自然语言处理任务。难度是一般的。
而另外一个例子,是同一套试卷的最后一个选择题:
这是一道具有应用背景的题目,在考试改革到现在,很有一批题目都是这样的。它的背景是“围棋状态空间复杂度、可观测宇宙、普通物质、原子总数”,这个背景是一个壳,它对于解题本身没有信息量,但对于教学和认知有影响。对于机器人而言,只要识别出条件“M,N”,问题“M/N”,以及四个选项,就可以进行解答。
但老师讲题的时候,一定会说,这是一个紧密贴合现实的题目。而且,要注意到学生的背景认知问题对于解题的影响,直白说,虽然学生数学原理知道,但被背景材料吓住了,没看懂。这就是高考机器人和教学的不同。
当然,高考机器人可以进一步,把背景理解的很好,以后扩展应用。
我们往外拽一点。这道题是一个披着应用背景的假应用题。它的背景和问题本身没有任何关系,对提出问题、分析问题和数学建模没有任何影响,你完全可以修改为王大麻子脸上的麻子数。如果我们用“知识应用和迁移”来评价这道题目,这种背景设置就是滥题,而且M/N非常的无厘头。
所以,你可以进一步看到,即使是所谓高考,在转型过程中它对于我们高大上的教育目标的实施,也是痛脚不断。(不要和我说中国应试教育的先进性了)
再看一个例子,文本稍微复杂一些:
据说这就是一个机器人没有做出来的题目。而现场专家说机器人看不懂题。
好吧,回归正常了。这段文本没有复杂的数学公式,只是稍微有点绕。就人看来,文本阅读要远比公式好懂——所以可能不觉得这对机器人是个障碍。亲爱的同学,相信我,专有领域规范的文本处理,对于机器人而言不是特别困难的任务,但这样相对自由的文本,题目内涵蕴藏于文本含义内,绝对是对机器人的一个挑战。
这个题目涉及到非数学形式化表达的几个概念,“学习小组,学生,教师,人员构成:男学生人数,女学生人数,教师人数”,关系概念“多于,两倍多于”,特定量“人数的最大值”,“人数的最小值”。这些概念任何一个没有符号化表示,机器人就解决不了这个题目。而恰恰这样的非标准化的、也不是往年大量重复出现的,也就是机器人没有事先准备的,表现出了它“诚实”的能力。
另外一个例子是说机器人解决不了“鸡兔同笼”问题,原因是它不知道鸡有几条腿, 兔有几条腿。这肯定是核心原因之一,那就是机器人绝对不具备常识知识库——但肯定也有另外一个原因,就是非常考的自由文本问题,机器人的文本理解能力还是很差的,它不能把问题有效的形式化或者符号化。
我们举个简单例子就知道了:问,刘德华比张学友高几厘米?数学问题简单吧?关系“高几厘米”也可能可以识别,但刘德华和张学友的身高是多少,却是人类娱乐世界的花边知识。机器人在这个层面非常薄弱。(最强的还得看国际搜索巨头的积累)
我们再看一看推理过程。大家都是教育专家,也都是高考过来的,解题自然没有问题。当然也能尝试思考机器人是如何推理的。我们说把检索匹配的技术路径去掉,那么推理还是可以往下设想的。
能够符号化的题目,条件、问题(选项)都能识别对的话,解答可能需要制定若干解题策略,也就是后面有不同的模型来解决不同的题目。有一些题目是可以暴力解题的,有一些题目需要一步一步由条件寻找问题的路径,等等,这样的策略和模型也可以通过详尽的样题解答过程来训练,来优化。
如果我来做这样的项目,是可以有所考虑的。但至于是什么模型,乃至有多少“推理规则”,我们都不在往下猜测。
谈谈高考机器人的价值
高考机器人的投入,对于技术是有极大价值的。作为一个学术或技术问题,用于标准化考试的应试题目的理解和自动求解,这对教育技术在这个领域的发展,有非常好的促进作用。
你想想看,如果不是这个爆点,有多少老板会愿意在技术上做深度投入呢?且老板不是李彦宏、马云和马化腾的情况下。
但行业内,对此另一大热点议题就是高考机器人有什么用。
甚至有人提出了“学霸淘汰、教师下岗、社会分层”的惊天之闻。坦白说,这回到我们对于应试教育的争议上,应试教育真的没有那么大的影响力,对于人的一生而言。我曾经提过一个笑话般的“长周期社会效度”,来考察高考——也就是,每个工作十年的人不做任何准备,去参加一下高考,以你现在的这个成绩你觉得和现代学生比,你能上一个什么大学?你现在能上的大学,和当年考上的大学相比,具体差距是什么?这个我称之为高考的“长周期社会效度”,你的生存路线替你选择了,你当年高考表现的能力有多少是有用的。另外一方面,其实我们前面分析高考数学样题的时候,已经展示过,知识的应试(掌握)考察,与知识的应用和迁移考察,是完全不同的测评,而且,不同教育目标对孩子的塑造追求也有很大不同,我们不要对应试教育抱有这么大的预期。
如果应试教育这个基石依然如此的话,所以请不要把高考机器人提到这样一个高度。
有许多人侃侃而谈的是,如果机器人可以自动解题,那么机器人当然可以把它的解题思路教授给孩子们。机器人自动教学——智能教师,这不是非常神奇的吗?(如果有同学有印象,我们以前讨论自适应的时候,曾经提到过智能教学系统的话题;以后有机会我可以就这个话题详细探讨)
甚至于,高考机器人发展下去,不是可以让教师下岗吗?
我这里展示一下我的思考逻辑。
对于封闭领域的应试集合而言,主流题目的解题路径是可以自动化的;但对于开放测评集合而言,这很长一段时间内都是机器人不可逾越的。所以高考机器人可以做的,是劳动密集型的那一块工作。
比如,盗一张可汗的图:
类似这样的解题路径,你说对于训练学生解题有没有帮助?当然在某个环节某个场景是有用的。但是,你不要忘了:
教师不是机器人,机械的引导解题步骤
解题步骤中可以形式化展现的,对孩子的学习而言不一定是最重要的问题
大部分可以步骤化的东西,孩子不是学不会,而是他有自己的理由或现状导致他没有足够的投入
……
这样的理由,我可以给你列一个巨长的单子。它们共同指向一个问题,高考机器人教孩子学解题,其价值是什么?
目前最合理的一个答案是——不是代替老师,而是代替照本宣科的庸师。
那么老师应该起到什么作用?我恰好懂些技术,又懂些教师和教育。根据我最近带课的经验,以及我印象中所有不可磨灭的老师的印象而言,好老师都不是机械展示解题步骤的人。如果这样定位,即使放到应试教育中也是难以性感的。
对于教师的本真作用,我这篇文章来不及细谈。但可以提供两个点,一短一长。短的来自于杨早老师,他说他最欣赏的教育,就是大鱼带着小鱼游,游着游着小鱼变大鱼。而长的,来自于我自己上课的三篇感触日记——作为一个教师,我在课堂过程中的感触及真实想法。
坦白说,我也真的期望智能教师系统可以实践这样的教育理想——可是我更痛苦的是,别说机器人,连人都没有做好。不知道机器人如果懂你们的想法,它会不会哀叹:何苦来哉!
教师的价值与替代性
从尊重技术的角度,我们说高考机器人是非常有益的一个技术探索。我恨不能现在也投入做智能教师系统。
从尊重人的角度来讲,如果我们没有把人当做机器的思想作祟的话,我们都不敢说机器人是可以代替教师的。
所以,我的观点是,教师永远具有独特的价值,在教育领域,而且是核心的价值。教师永远不可替代(除非人类灭绝,我们也就不用争议了)。
如果我准备做智能教师系统,一定是和优秀教师共生的系统。是相互促进的系统。
期待高考机器人,在应试之外,以及在人机共生层面,可以多做一点思考。
附录:我作为教师的上课感触记录
实验课感触记录
第一篇
星期一
第二节课结束之后,对这两节课做了一个简单的反思,有如下点记录总结
启蒙课的总体目标:因为大部分孩子是第一次接触少儿编程,所以目标设定为兴趣,并基于兴趣的基础上对编程的意识、习惯以及思维框架做初步的训练。不定位成系统的知识与深度的编程能力构建——这个放到启蒙二期中。
学生具体情况有差异,表现在
a) 对于低龄的,主要是跟随和玩,也就是更宽泛意义上的兴趣。所以需要在作业中增加一批“短小但有趣的代码样例”给他们做支撑。
b) 对于较大年龄的,在兴趣的基础上强调编程的意识、习惯和思维框架,所以需要紧盯他们的输出,并让他们多做展示,强化学习的效果。
c) 对于有编程经验的,则给予特殊的任务,挖掘他的贡献能力。
家长会在课上陪同,鼓励家长帮忙做点维护纪律的帮助,但孩子在完成课堂任务时,最好不要给予孩子压力——也不要表达出让孩子“好好学习、表现好一点”的期待,既要让他有自己的空间,同时也让他用自己的节奏去进入,有时慢一点也没有关系。
总的来讲,第一节课和第二节课,课堂进展和孩子表现,是超过我个人预期的——比我预判的要好。孩子参与度很高,而且他们提出的问题有的时候看起来很小白,但深入一想都很准确。
不过我们现在所采用的,是活动式的、更多纳入西方教育很多课堂方法的授课方式,不会追求紧张的知识宣贯。同样活动中会给孩子充分的留白,让他们动手、思考和表现。所以一个实际情况上,这两次课前准备的内容,每次大概都是进行三分之二。这也是正常的,在准备上也会考虑更多。
同时,这个课程有一点翻转课堂的实践,课前会有小视频预习,且课后作业都会紧贴思维框架的教育目标,并需要孩子们展示——测评也是多样的。但如课堂上所说,我们不会正式公开分数,而是引导孩子们发现改进自己的机会。
期望这是家长、孩子和老师的共识:自我改进远比分数结果重要。
第二篇
星期二
第四节课结束之后,随着对于scratch的熟悉,孩子们自己的动手能力和创作欲望在增强,但同时带来一些新的问题,需要仔细考虑:
课堂活动中,孩子们更加关注自己的作品实现、完善,而不再关注别人介绍作品的“形式化”的部分,导致两个问题,第一个是演讲时下面的孩子更愿意弄自己的东西,只是当发现上面演讲的同学作品中有有趣的点才会抬头关注一下,其次就是演讲的流程变得有点散漫,部分孩子也对遵照流程不感兴趣,而是一上来就演示。
在学习过程中,对于知识应用和精准的思考与解决问题并不会特别关注——而主要的注意力是做出“惊人”的效果。也就是说,怎么让自己的东西更有趣,但不会考虑后边实现的原理是什么。好的一方面,这是好奇心发展的正常阶段——要把scratch这个东西翻来覆去的摆弄,比着要弄出一个异常的效果。但其为什么会如此、程序的逻辑,并不在视野之内。
对于过程的散漫,有几个解决方式:
做纪律管理
把作品演讲的评分标准和过程显式化
建设某种团队协作模式
重构课堂活动
在这个阶段,孩子有两个点表现的非常突出,也是我们最需要的——其一是孩子展示自己作品的需求,其二是探索的好奇心(也就是自己要随便弄、弄出有意思甚至惊人效果的追求)。展示和好奇心是最值得肯定的、最值得激发的,它要远大于对知识精准的追求、对纪律的追求。(只有到“解决真实问题”的阶段,对孩子们才应该提高知识精准掌握的要求)
孩子们注意力不关注的东西,其积极的意义就在于它表明了孩子不需要。所以我们即不需要用纪律管理的方式来约束、强制,也不需要通过测评和竞争激励的方式来引导——让孩子们接收他们这个阶段不太需要的东西。
所以方法1和2都可以舍弃。我们把目标聚焦在展示和好奇心激发上,并在这个目标下来考虑课堂活动建设的问题。
团队协作会有一点挑战,因为他们正处于“半生不熟”的状态,刚脱离陌生、可以自己弄但又不懂得原理的节点(同时对于一二年级孩子要求熟通原理有点不合理),更难于融洽的协作。同时还有担心,那就是怕大龄孩子对低龄孩子“误伤”,因为更好的带动别人是一个要求更高的能力,评价式的语言一旦出来(你好笨,好无聊等等)会对低领孩子产生负面影响。
所以团队协作模式最好在更成熟的阶段来进行实施。
看起来,重构课堂活动可能是一个选择。但如何重构,是一个需要继续考虑的问题。
第三篇
星期四
近期网站开发和上课备课交织在一起,略忙。
第六次课上了一个复习课,原因是注意到部分、尤其是低年级的孩子对程序原理有些关注度不够(对他们而言课程也越来越困难了)。但在一个以动手实践为主要形式的活动课堂中,在教学过程中尽量避免大面积宣贯知识的诉求下,孩子们可能会显得对于“知识细节”不够扎实。
习惯传统教育模式的人都会有这个担心。实际上虽然我知道这个启蒙课要追求什么,但还是想对这个点关注一下,所以安排了复习课。根据每节课前写简单教案的习惯(也就是教学目标、翻转课堂以及活动任务和作业安排),复习课的简单设想如下:
**********************************
本节复习课。
每个人平均分配给20分钟,用于解答问题,并实现学生一个自由任务;边实现边讲解。
其他同学在自由时间段任意实现一个作品,最后所有同学展示作品。
在20分钟时间内,重点在于:
给所有同学讲明白程序运行的基本逻辑
展示从想法到需求到实现到调试的过程
根据“走迷宫的猫如何更聪明”的问题,来激发孩子学会如何思考并优化一个方案
******************************************
但实际上,低年级孩子在“知识细节”的扎实度上,其实没啥进展。他们忙着提自己天马行空的需求,但焦点不在如何实现以及代码本身上。对于局部的爆点,他们会关注一下怎么做的——所以,如果不填鸭,局部爆点的实践可能是引导他们关注知识的一个手段了。
高年级学生要好很多。最近一次课讲克隆,从影分身到生物克隆原理到程序设计中的克隆,在跟一个孩子讲克隆代码的原理的时候(任务是苹果园接苹果的游戏),他调试代码调试不出来——原因是把想要的行为代码,写在父代角色,而克隆体子代角色没有这个部分的代码——在scratch中并不是面向对象的继承关系,子代只有父代的属性。他很困惑,我们就在子代中加了一条日志,证明代码没有接收到相应的交互行为。他突然感受到——日志可以这么用。
虽然日志在启蒙课开始就有介绍,但在后面的较复杂的代码调试中用到,用于解决问题,有点被击中的感觉——这种感受就是我想追求的“学习”。使用这样一个过程带来的“知识细节”扎实,要远比“宣贯+机械训练”好很多。
团队中荣耀很重要。因为我们每一个人,不管是大人、孩子,不管是成功的人还是不成功的人,我们都在意自己的价值,并在这个点上看重团队和社群的反馈。
我们在意的是发自内心的反馈。
启蒙课到了这个阶段,高年级的孩子已经可以按照自己的想法,或许参考一些资料帮助,实现一些真正有趣的东西。
一个孩子实现了类似flappy bird的游戏,还增加了躲避炮弹与发炮弹的环节。我真心觉得这很赞,在课堂上特意说,“这是我们班上同学们自己做的一个工业界级别产品”,什么是工业界级别产品?就是成熟到可以让其他人玩的产品。
果然,孩子们非常重视这个评价。作者也非常的神气,在展示时其他学生挣着玩一下,作者特意允许每个人玩两遍。
当孩子不止一次追着问下次课什么时候开始的时候,我还是发自内心的开心的。
每一个孩子都值得你关注,每一个孩子都令人那么欢喜。高年级的两个孩子都极为聪明,各有特色,低年级的孩子也表现出超可爱的一面。越小越能暴露人性的可贵,对自己的好奇心的诚实与忠实。而越大的孩子,则越丰富,将能克服困难探索更加深度的世界。
不要为表象所迷惑。就如对于低年级孩子,不要批评他们对“知识细节”不够专注。他们只是对自己天性的某个方面更关注而已。
爸爸妈妈、教育者如果想配合他们,就在他们前面抹蜜,在他们脚下垫石头。
本文转载自爱知行,作者李子。
来源:爱知行