芥末堆芥末堆

“纳什均衡”与作业僵局

作者:隐蔽的历史 发布时间:

“纳什均衡”与作业僵局

作者:隐蔽的历史 发布时间:

摘要:人类社会的绝大部分集体活动,都可以在博弈论中找到答案。

00.jpg

笔者曾以“剧场效应”一词分析了当下中国教育惨烈的军备竞赛(《从坐着看戏到站着看戏-兼谈教育现状》)。“剧场效应”是个通俗比喻,不仅适用于教育领域,也广泛适用于各行各业的过度竞争现象(比如:手机的摄像头越来越多、屏幕越来越大、各单位加班时间越来越长……等)。“剧场效应”这种现象还可以从博弈论角度进行学理分析。

一、什么是“纳什均衡”?---从博弈论说起。

看过电影《美丽心灵》的该知道数学家纳什。纳什最重要的贡献就是提出了“纳什均衡”,并由此获得1994年诺贝尔经济学奖。

640.jpg

 “纳什均衡”是博弈论中的一个重要推论,了解“纳什均衡”,必须先从博弈开始说起。

人类社会中的所有集体活动都可以用“博弈”来解释。社会中的人、企业、国家,几乎随时随地都在“博弈”(购物时讨价还价、企业间合同谈判、中美之间的“贸易战”……)。

举个栗子:

令狐冲和张无忌在一起吃饭,令狐冲分到一份面条,张无忌分到一份米饭。面条、米饭的热量、售价相同,两人各吃各的。假设米饭与面条的福利都等于1。则令狐冲和张无忌各自占有的福利为1,两人总福利等于2。

起初两人各吃各的饭,两人之间无博弈。经过一段时间后,令狐冲对面条产生了厌倦,于是在某一天,令狐冲想品尝张无忌的米饭,这就产生了两人之间进行博弈的可能。

第一轮博弈:令狐冲身高马大,孔武有力,采取暴力胁迫手段夺取了张无忌 的米饭。令狐冲一人吃了两份饭,张无忌无饭可吃。此时,令狐冲的福利为1+1=2,张无忌的福利为1-1=0。令狐冲+张无忌的总福利不变仍为2。这轮博弈没有增加总福利量,只是福利发生了转移,这种博弈局面称为“零和博弈”。例如,封建社会中统治者凭借暴力对农民的残酷剥削,社会中的各种诈骗犯罪行为,就类似于零和博弈。又如,超级中学独占了全省的清北升学人数,代价却是普通中学升入名校人数锐减,也类似于零和博弈。在生活中,这类结果也称为“单赢”。成因在于博弈双方资源(实力)的不对等和强势一方的打破规则、恃强凌弱。

第二轮博弈:张无忌被令狐冲打劫后,痛感自己的羸弱,苦练九阳神功。某一天当令狐冲故技重施时,遭到了张无忌的强力反弹,两人激烈拼抢,在争夺中面条和米饭都被破坏而无法食用。结果,当天两人不但都挨了饿,而且还都受了伤,还要去医院看病,治疗过程将减少各自的福利0.5。所以,这一轮博弈的结果是双方的福利均为-0.5,达成的福利总量为-1。这种导致福利总量减少的博弈称为“负和博弈”。例如,国家之间惨烈的战争(如第一次世界大战。),破坏了社会生产力,减少了全世界的福利总量;历史上有的农民起义推翻了旧王朝,严重破坏了生产力,在一段时间内也减少了文明社会的福利总量。在生活中,这类博弈结果也称为“双输”“多输”。成因在于博弈各方力量接近,且均采取对抗策略。

第三轮博弈:痛定思痛,令狐冲,张无忌握手言和,采取合作策略,各自把一半食物与对方交换,双方都品尝到对方的饮食(两人营养都更丰富了),由于两人的健康指数和心理状况都因此轮博弈得到了改善,故福利都比原来增加了0.2,这轮博弈达成的双方福利总和为2.4。对比初始状态,福利总量增加了0.4,所以这轮博弈为“正和博弈”。例如,二战后成立联合国,减少了各国冲突,增加了世界福利总量;欧洲成立了欧共体增进各国合作减少彼此对抗,经济全球化深入推动各国合作,都推动了世界福利总量飞速提升。在生活中,这类博弈结果称为“共赢”“双赢”“多赢”。成因在于博弈参与者改变了博弈策略,从对抗走向了合作,从个体理性走向了集体理性。今天的文明社会,即使是实力不对等的博弈,占上风的一方也往往不会采取直接掠夺的博弈策略,就是看到了合作策略能带来长远的稳定收益。这是人类社会经过反复博弈后的理性选择,也是人类文明告别丛林法则,趋于整体进步的表现。

总结图:

WX20181217-102846.png

人类社会的绝大部分集体活动,都可以在博弈论中找到答案。小到公司企业的兴衰,大到国家民族的治乱,都能看出群体博弈的力量。

总结:博弈的分类和后果:

1、争取正和博弈。

把参加博弈各方的所有收益相加,得数为正数的为“正和博弈”,此时,博弈的结果整体促进了社会总福利。达成正和博弈是社会进步的根本所在,应尽力创造条件增加或维持正和博弈。如十字路口红绿灯制度就是典型的合作型正和博弈。交通参与者在路口越合作,每个人的长期通过效率越高,社会的整体交通福利越好。反之,无红绿灯设计,或红绿灯故障的路口,每个人都抢行,极易形成人人难以通过的负和博弈。

2、控制零和博弈。

把参加博弈各方的所有收益相加,得数为零的为“零和博弈”。此时,可能博弈的某一方是利益获得者,另一方是利益损失者,也可能大家都有得有失,但得失相互抵消后,社会的总福利只是发生了转移,但总量维持不变。零和博弈改变了福利的分配状态。有时候可以选择,有时候必须选择,有时候尽量避免。如学校考试排名,公司奖金分配,财政资金分配等。零和博弈有利于调动部分人群的积极性,但存在边际收益递减的问题,所以需要及时调整零和博弈格局。

3、避免负和博弈。

把参加博弈各方的所有收益相加,得数为负数的为“负和博弈”,此时,博弈的结果整体减少了社会的福利。负和博弈减少了社会总福利量,且增加了各方的对抗,会激化矛盾。故制度设计和政策安排应引导各方淡化短期利益,重视长期收益,促进各方合作,减少各方对抗。如商家间避免恶性降价竞争、开发商减少暴力拆迁、城管避免钓鱼执法等。

0.jpg

二、“纳什均衡”:一种负和博弈的僵局。

承接前文,“负和博弈”是最差的一种博弈结果。

引入:“纳什均衡”则是指无法终结,且持续恶化的“负和博弈”。(“纳什均衡”有数学定义,本文侧重其在经济学、社会学领域中的含义。)

含义:所谓纳什均衡,指的是博弈参与人的这样一种策略组合,在该博弈演进中,任何参与者单独改变博弈策略都不会得到好处。换句话说,除非所有人同时改变博弈策略,否则没有任何人会改变策略,则该博弈组合就是一个纳什均衡。

延伸:在没有强大外力介入情况下,“负和博弈”中的参与者均不会改变博弈策略,无人愿意与其他博弈者合作,“负和”局面不断恶化,博弈的结果越来越差,导致社会总福利持续减少的恶果。通俗来说,就是“恶性循环”无法中止。

例:纳什均衡的推演:愈演愈烈的作业。

作业布置多少合适?这可不光是写作业的学生和布置作业的老师博弈的结果,而是多方力量博弈的结果。作业这轮博弈的参与者有学生、家长、老师、班主任、学校管理层、其他竞争学校、政府管理部门。

根据前文所述:

第一轮博弈:正和博弈阶段。老师布置的作业不多,学生能顺利完成,也乐意完成。双方的博弈策略为合作博弈,师生都是正收益,此时为“正和博弈”。

第二轮博弈:零和博弈阶段。来自家长、考核机制和管理层的压力,推动了某一科个别教师增加作业量。当此学科作业量激增后,那些作业量较少的学科学习时间将被严重蚕食,这些学科成绩会显著下降,但学生的各科总成绩不变。教师之间有得有失,收益在教师之间发生了转移,教师们的收益之和不变。

第三轮博弈:负和博弈阶段。为捍卫自己学科的学习时间,这些学科老师也被迫增加作业量。此时,所有学科的作业量都持续增加。学生的身心健康受损,写作业的积极性下降,教师的批改作业量和劳动强度也大为增加,但大家的考核排名并未有本质变化。此时,博弈就进入了“负和博弈”阶段。

第四轮博弈:纳什均衡阶段。但,悲哀的是,此时没有老师敢减少自己的作业量,因为你一旦减少作业量,学生就会把这部分时间用于写其他作业,你的学科利益就会短期受损。这就形成了大家相互加码,无人选择退出的“纳什均衡”局面。此时,纳什均衡下大家的福利总和持续减少(所有参与者都更累了,但排名收益并未有大的变化),形成了没有赢家、都是输家的僵持局面,但坚持当下策略却是僵局中每个参与者的最佳选择,因为改变当下的策略,自身利益会减少的更快。

第五轮:纳什均衡的强化。当某学校、某老师试图减少作业量,以打破越来越累的“纳什均衡”僵局,就会招致家长的强烈反弹:为何不补课?隔壁学校可是在补课呢!为何不重视成绩?基于此,单个学校、学科无法独立改变增加作业的博弈策略,除非所有的学校全部同时结束对抗,走向合作,以集体理性取代个体疯狂。

这就解释了作业为何愈来愈多且难以控制难以减少的内在机制。作业布置的“纳什均衡”,其原因就在于社会用短期的评价机制考量学生学习和教师业绩,必然推动各个博弈参与者为谋求短期收益,采取非理性的对抗性博弈策略。最终形成“负和博弈僵局”,即“纳什均衡”局面。

同理,愈演愈烈的恶性补课、恶性延长的学习时间、越来越少的假期、变本加厉的生源大战,都可以在“纳什均衡”中找到答案。

00.jpg


三、如何避免形成负和博弈尤其是纳什均衡?

其一、增加优质资源供给,缓解福利焦虑。因为资源越是短缺,人们越趋向于非理性的短期利益,趋向对抗,拒绝合作。比如增加优质学位数量会一定程度缓解了人们争抢学位的拼抢现象。

其二,增加替代选项。技术进步带来替代资源的爆炸式增长,是缓解博弈困境的重要机遇。比如办好职业院校,引导部分学生分流,也会降低竞争烈度。

其三、增加监督机制。防止博弈各方中某一方违规抢跑,否则博弈很容易从正和、零和演化为负和局面。如限制作业布置的上限,严惩节假日补课等。

其四、调整福利分配。在资源供给短期内难于增加,替代技术进步缓慢情况下,改变利益分配方案也是一个思路。如把学位按人口比例分解到各下级学校,学校以对教师实行综合评价制度替代单一成绩评价等。

四、继续来看纳什故事:

烈日炎炎的下午,纳什教授给学生上课,窗外楼下有几个工人正施工,机器的响声成了刺耳的噪音,于是纳什走到窗前狠狠地把窗户关上。马上有同学提出意见:“教授,请别关窗子,实在太热了!”而纳什教授一脸严肃地回答说:“课堂的安静比你舒不舒服重要得多!”然后转过身一边嘴里叨叨着“给你们来上课,在我看来不但耽误了你们的时间,也耽误了我的宝贵时间……”,一边在黑板上写着数学公式。

正当教授一边自语一边在黑板上写公式之际,一位叫阿丽莎的漂亮女同学(这位女同学后来成了纳什的妻子)走到窗边打开了窗子,电影中纳什用责备的眼神看着阿丽莎:“小姐……”而阿丽莎对窗外的工人说道:“打扰一下,嗨!我们有点小小的问题,关上窗户,这里会很热;开着,却又太吵。我想能不能请你们先修别的地方,大约45分钟就好了。”正在干活的工人愉快地说:“没问题!”又回头对自己的伙伴们说:“伙计们,让我们先休息一下吧!”阿丽莎回过头来快活地看着纳什教授,纳什教授也微笑地看着阿丽莎,既像是讲课,又像是在评论:“你们会发现在多变性的微积分中,往往一个难题会有多种解答。”

阿丽莎对“开窗难题”的解答,使我们得出启示:那些看似零和博弈或者是负和博弈的问题,也会因为参与者的巧妙博弈策略而转为正和博弈。正如上文中纳什教授所说:“多变性的微积分中,往往一个难题会有多种解答。”

关键点就是,用合作策略取代对抗策略。关键点就是,以集体理性取代个人理性。

本文转自微信公众号“隐蔽的历史”,作者郭山。文章为作者独立观点,不代表芥末堆立场。

1、本文是 芥末堆网转载文章,原文:隐蔽的历史
2、芥末堆不接受通过公关费、车马费等任何形式发布失实文章,只呈现有价值的内容给读者;
3、如果你也从事教育,并希望被芥末堆报道,请您 填写信息告诉我们。
来源:隐蔽的历史
芥末堆商务合作:王老师 18710003484
  • “纳什均衡”与作业僵局分享二维码