图片来源:视觉中国
教师专业发展是提高学校教育质量和学生学业成绩的关键因素。随着各国对教师专业发展的重视和投入的增加,政策制定者越来越重视教师专业发展的有效性研究。本研究聚焦具有中国特色的区县基础教育教学研究体系,基于北京市海淀区2016—2019年高中阶段学生及其任课教师、所在学校相匹配的数据,采用增值模型、多层线性模型和结构方程模型,分析教师参与区级和校本教研活动对教师的教学实践、自我效能和学生学业成绩的影响。
分析结果显示:
(1)教师参与区级教研活动的程度对学生成绩有显著的正向影响,其中聚焦于学科课程内容的教研活动对学生成绩的增值作用尤其显著;
(2)参与区级教研活动程度较高的教师具有更高的自我效能感,在其课堂教学过程中更倾向于组织探究性和以学生为中心的教学活动,以及采用更加多元的评价策略;
(3)教师参与校本教研活动的程度对学生成绩同样具有显著的正向影响,教师之间的非正式交流的积极作用不容忽视;
(4)对校本教研的中介作用的分析显示,区级教研通过提升教师校本教研的参与程度,间接影响教师教学实践。
教师专业发展;区域教研;学业成绩;增值评估
文章目录
一、研究背景
二、文献综述
三、数据和分析方法
四、区域教研活动与教师的教学实践和自我效能
五、区域教研活动与学生成绩
六、总结和讨论
一、研究背景
教师是提高学校教育质量和学生学业成绩的关键因素,为此,各国政府都致力于提高教师素质和教学水平,从而提高学校的教育质量和学生的学业成绩。世界银行2018年的全球发展报告指出,许多国家和地区存在一种学习危机:学生尽管在上学,但却没有进行有效的学习(World Bank,2018)。造成学习危机的主要原因包括:儿童早期教育和学前教育准备不足,学校教育资源投入不足、使用效率低,教师缺乏有效教学的知识、技能和动力等。尤其是在基础教育阶段,教师的人员支出占学校经费的四分之三左右,这是影响学生在校学习效果的关键因素。
提高教师队伍质量,不仅需要吸引和留住有才能的人从事教学,还需要为在职教师提供专业发展的机会。教师专业发展活动是被广泛认可的提高教师知识技能、教学实践和学生学习成绩的关键途径,也是课程和教学改革得以落地和实现的基础(National Commission on Teaching and America’s Future,1996;Day and Sachs,2005;European Commission,2005;Darling-Hammond et al.,2009)。随着各国对教师专业发展的重视,政策制定者越来越重视教师专业发展的有效性,以促使有限的公共资源能够得到更好的分配和使用。教师专业发展的最终目的是改善和提高学生的学习,因此教师专业发展对有效提高教师教学水平和学生学习成绩至关重要。
自从1966年《科尔曼报告》分析了学生学业成绩的差异来源之后,教育实证研究一直致力于打开教育生产的黑箱,分析学校、家庭和社会环境对学生学业成就的影响(Glewwe et al.,2011)。教师作为其中最重要的一个因素,受到了高度的关注。早期的研究在分析教师对学生学业成就的影响时,主要聚焦于教师的个人和专业背景,例如教师的教龄、学历、资格、工资和职称等。随着人们对学校和教师效能的关注,以及对教师专业发展的重视,越来越多的研究逐渐聚焦到了教师专业发展对教师和学生的影响上(Desimone,2009;Hill et al.,2013)。
另一方面,随着TIMSS和PISA等国际测试项目的开展,学生成绩名列前茅的中国、日本、韩国、新加坡等东亚国家受到了高度的关注。在研究了这些国家的教育体系和教学组织方式之后,学者们认为这些国家的学生之所以能够取得较好的成绩与教师专业发展的组织和制度安排密切相关。例如师徒带教、集体备课、相互听课、磨课以及教学研究小组等,使教师不仅在入职阶段可以得到融入专业共同体的机会,在入职之后也能够有组织地参与到持续的专业发展活动中(Darling-Hammond et al.,2017;World Bank,2018)。
在中国,省(自治区、直辖市)、市、县(区)教研室和学校教研组的四级教研体系自建立之初就与基础教育的建设和发展紧密相连,长期以来在保障教学秩序、支持课堂教学、组织教学研究、推进课程改革等方面起到了不可替代的作用,是极具中国特色的基础教育教学研究制度。在关键时期,教研组织承担了培训教师、提高教师专业水平的重要任务,保证了我国中小学教学的基本质量。随着我国基础教育改革和中小学课改的不断发展,教研体系越来越成为推进课程教学改革、提高教学质量和教师专业发展的核心力量(丛立新,2011;梁威等,2011)。在这一过程中,教师专业发展也经历了从单一化、学历补偿式培训模式向以教师为主动学习者的教师专业发展模式的转变。
学者和实践者越来越倡导以学校为本,通过教学实践和教师反思性学习实现专业发展(卢乃桂,2006;宋萑,王恒,2019)。而另一方面,相对于国外的教师专业发展活动的实证研究,目前国内相关领域的研究,尤其是教师专业发展有效性的研究相对较少。现有研究对教师专业发展活动的各方面因素有所涉及(张文静等,2010;赵健等,2013;托马斯等,2015),但尚未有研究将区域教研活动作为一个整体,将包括区级和校级在内的各类教师专业发展活动与学生的学业成绩联系起来,探讨其对学生学业成绩影响。本文基于教师专业发展的实证研究框架,以北京市海淀区为例,采用增值模型、多层线性模型和结构方程模型,分析区级和校本教研活动对教师的教学实践、自我效能和学生学业成绩的影响。
二、文献综述
本节首先回顾了国外尤其是美国从20世纪80年代开始的教师专业发展的实证研究如何定义、衡量和评估高质量、有效的教师专业发展活动。目前国外教师专业发展活动的实证研究主要包括三类:一是通过更加“客观”的标准,例如学生成绩,来衡量教师专业发展活动的效果;二是收集和分析教师专业发展活动的某类“特征”及其效果;三是采取“随机实验”的方法评估专业发展的效果。其次,我们对国内教师专业发展活动的实证研究进行了梳理。
目前国内对于教师专业发展活动的实证研究大致可分为三类:一是描述和分析教师专业发展活动现状,包括教师专业发展活动的供给、教师的需求以及专业发展活动的地区和城乡差异;二是探讨影响教师参与专业发展活动的个人层面和组织机构层面的因素,提出教师的自我意识、教师专业共同体、学校的组织因素以及教师专业培训和教研体系特征等对教师专业发展的影响;三是检验教师专业发展是否有效影响了教师自身的知识、态度、实践以及学生的学习结果。最后,在回顾国外和国内教师专业发展活动的实证研究的基础之上,形成本文的基本分析框架。
(一)国外教师专业发展的实证研究
自《科尔曼报告》发布之后,学校投入作为教育投入的重要组成部分,首先受到了关注,形成了一系列学校效能(school effectiveness)的研究成果。早期的研究较为关注学校的类型、办学条件(例如,经费、班级规模、生师比等)的影响,而对教师的研究则主要聚焦于教师的学历、经验、工资等方面(Glewwe et al.,2011;Hanushek,1997,2003)。随着对学校和教师效能的关注,以及对教师专业发展的重视,越来越多研究逐渐聚焦到教师专业发展的投入对教师和学生的影响上。
早在20世纪20年代,就有学者对教师的教学活动和教师培训的要素进行研究(Charters & Waples,1929),但在如何描述教师的工作以及教师所需的知识和技能方面,并未达成共识,也未采用同一套概念进行对话。从20世纪70年代开始,评估教师专业发展活动有效性的实验研究开始出现(Carpenter et al.,1989)。
随着对教师专业发展的重视,相关研究呈现出爆炸式的增长,但仍然只有部分研究关注教师专业发展活动对学生学习过程或结果的影响,其中采用较为严格的因果推断或者实验方法的研究则更少(Kennedy,2016)。直到1990年,对教师专业发展活动有效性的评估还主要依靠教师自我汇报的满意度、态度和观念等方面的变化,较少关注专业发展活动的结果以及产生结果的机制和关键因素(Desimone,2009;Hill et al.,2013)。
一方面,观察、访谈等质性研究方法和教师的满意度调查仍旧是评价专业发展活动效果的重要工具,基于民族志和深度案例研究的方法能够全面深入地研究教师在专业发展活动中的经历和经验。
另一方面,随着政府对教师专业发展的重视和公共财政投入的增加,以及政策制定者对可复制、可推广的教师专业发展活动的需求,推动了通过教师专业发展活动提高教师教学水平和学生学习效果的趋势性、相关性和有效性的研究。
发展到现在,有关国外教师专业发展活动的实证研究主要包括三类:第一类是通过更加“客观”的标准,例如学生成绩来衡量教师专业发展活动的效果。随着标准化考试被全球各国的教育系统采纳,越来越多的国家开始采用学生的考试成绩为教育政策的制定、学校的问责、教师的考核和日常行政管理工作提供数据支持(Lingard et al.,2013)。20世纪60年代就有国家和地区使用增值评估的方法来评价学校教育对学生学业的影响。随着西方国家教育问责制的普遍实施,教育增值模型从学术领域进入了政策实践领域,已经成为教育问责的重要工具。例如,2002年美国通过《不让一个孩子掉队》法案,要求各州测试学生阅读和数学成绩并对学校进行问责。于是,美国许多州开发了自己的教育增值模型,州政府采用模型评估结果对公办学校乃至教师实施问责。再例如经济合作与发展组织(OECD)主导的教育系统国际指标项目(Indicators of Education Systems)也将增值评估的方法纳入国际教育指标系统中。
第二类是收集和分析教师专业发展活动的“特征”及其效果。面对各类正式和非正式的教师专业发展活动,部分研究者主张聚焦于高质量的、有效的专业发展活动特征,进而收集相关的数据,对专业发展活动与教师教学和学生学习之间的趋势性、相关性和有效性进行描述和分析(Kennedy,1998;Garet et al.,2001;Penuel,2007;Yoon et al.,2007;Desimone,2009;Darling-Hammond et al.,2017)。
图片来源:图虫创意
尽管目前对高质量的、有效的专业发展活动的特征暂无明确统一的定义,但支持者认为根据以往的理论、质性和实证研究,已经能够总结出得到广泛认可的特征。其中,Kennedy(1998)根据专业发展活动的内容特征进行分类,分析了不同类型的专业发展活动对学生学习的影响①。此后,Yoon et al.(2007)回顾了1300多项教师专业发展活动对学生成绩影响的研究,采用了Kennedy对专业发展活动的分类,对其中9项符合有效教育策略资料库(What Works Clearinghouse)标准的实验研究的有效性进行了分析。
此外,也有一部分研究对某个大型的教师专业发展活动的有效性进行评估(Garet et al.,2001;Penuel,2007)。例如,Garet et al.(2001)基于对高质量专业发展活动的共识,设计了一套问卷对全国1027名参加联邦艾森豪威尔专业发展项目(Eisenhower Professional Development Program)的教师进行调查,分析该专业发展活动的结构和核心特征的有效性②。在前期综述研究的基础上,Darling-Hammond et al. (2017)回顾了过去三十年聚焦于教师专业发展对学生学业成绩影响的实证研究,尤其是那些发现教师专业发展对学生学业有积极影响的研究,从中提炼出了七个被广泛认可的特征,包括聚焦课程内容、融入主动学习、支持协作、示范和模范、专家指导和支持、反馈和反思以及具有持续性③。
然而,此类研究存在一定的局限性。首先,由于专业发展活动的实施是有选择性的(例如,项目会选择更加积极和配合的学校和教师,或选择更加有需要的学校和教师),同时教师也会根据自身的基础和需求选择更加合适的项目,因此专业发展活动的实施效果因学校和教师本身的特质而有差异,最终的结果不完全是由专业发展活动所带来的。
其次,大部分研究是基于教师自我汇报的结果,而非基于课堂观察、测试、活动日志等更加客观得出的结果,会对效果的估计造成偏差。因此,更加准确的估计就需要对同一项专业发展活动在不同学校、不同培训者和接受培训的群体之间进行比较。然而大多数有效的专业发展活动的研究项目规模不大,因此缺乏大规模推广的结果对比,也就可能导致对项目的评估结果截然不同。
第三类研究是为了解决第二类研究的局限性,采取“随机实验”的方法评估教师专业发展的效果。随机实验原本是医学研究监测药物效果的手段,其基本方法是将研究对象随机分组,对不同组实施不同的干预,以对照效果的不同。社会学领域的随机实验核心在于利用实验的操作技巧(如随机化被试、控制相关变量),来评估变量之间的因果效应,从而对现实世界所发生的事件之间的联系给出科学的检验(罗俊等,2015)。
20世纪30年代,随机实验方法被用于农业生产领域。20世纪下半叶,一些国家的政府开始推动大规模的社会实验。最早的一项教师专业发展活动的随机实验是20世纪70年代末Good et al.(1983)对美国教育学会(National Institute for Education)支持的密苏里州有效数学教学项目的评估。随后,也有其他研究者开始采用随机实验的方法评估专业发展的效果(Carpenter et al.,1989)。这些研究通过实验的方法,部分证实了之前经验研究认为的有效的教师专业发展活动特征确实起到了积极的作用。
2002年美国联邦政府通过的《不让一个孩子掉队》法案提出教育政策需要有符合科学标准的研究支持(scientifically based research),并强调优先考虑采用随机实验研究的成果。教育科学研究学会也在其教育研究基金的申请标准中加强了对教育实证研究和实验研究的导向(U.S. Department of Education,2002;IES,2012)④。受此影响,后来涌现出了一大批教师专业发展活动的研究,致力于采用随机实验的方法发现有效的、可推广的专业发展活动。
总的来说,教师专业发展有效性的实证研究方法在不断发展,研究者和实践者不满足于仅评估单个教师专业发展的效果和关键特征,还想要对项目的外部有效性以及不同项目之间的有效性进行比较。
Borko(2004)在其具有较大影响的一篇文章中将教师专业发展有效性的研究分为三个阶段。第一阶段的研究主要关注单一地点实施的某一项教师专业发展活动,其主要目的是确认该专业发展活动是否具有可行性,是否有效提高教师的教学水平和学生的学习效果。第二阶段的研究主要关注多个地点同时实施的某一项专业发展活动,其主要目的是确认该项专业发展活动在不同的情境中由不同的培训者实施的时候是否能够保持有效性。第三阶段的研究关注的专业发展活动开始扩展到对多个地点实施的多个项目进行比较,其主要目标是对不同类型的专业发展活动的实施过程、效果以及所需要的资源进行比较,其结果为相关政策的制定和公共资源的配置提供支持。
为了对单项和多项教师专业发展活动进行评估和比较,需要对项目各要素和环节有更加清晰的定义,建立一个将项目各要素、过程和结果联系起来的逻辑框架。很多学者尝试构建教师专业发展如何影响教师知识、技能、观念和态度并最终影响学生学习效果的理论框架。Kennedy(1998)将专业发展活动的影响路径分为三类:第一类路径注重改变教师特定的教学行为,从而改变学生的学习;第二类路径注重改变教师的知识,从而改变教师特定的教学行为和学生的学习;与第二类路径相似,第三类路径也注重改变教师的知识和教学行为,但对教学行为不做过多详细要求。
与Kennedy归纳的第一类专业发展活动的逻辑类似,Supovitz(2001)提出高质量的专业发展活动是通过改变教师的课堂教学行为,从而促进学生的学习。Guskey & Sparks(2002)认为有效的教师发展活动不仅改变教师的行为,也改变教师的知识。Yoon et al.(2007)的研究认为教师的专业发展分两步影响学生成绩,即教师的专业发展首先是提高教师相关的知识技能,然后是提高教师课堂教学实践,最后才能提高学生成绩。在回顾以往研究的基础之上,Desimone(2009)提出了一个教师专业发展有效性研究的概念框架,该框架概括了教师专业发展的关键特征、教师知识和理念、课堂实践与学生成绩之间的相互影响的关系(图1)⑤。
首先,教师参加专业发展活动;其次,专业发展活动增长了教师的知识和技能,改变其态度和理念;再次,教师用新知识和技能或转变了的态度和理念来改善教学内容或教学方法,或两者兼而有之;最后,教学改变促进了学生的学习。该框架可以从教师的转变(如专业发展改变教师知识、理念或实践)和教学改进(如改进教学实践影响学生成绩)两方面来检验专业发展的有效性,而这两个方面对理解专业发展如何产生影响均不可或缺。除了教师专业发展的关键特征、教师知识和理念、课堂实践与学生成绩以及这四部分要素之间的相互关系之外,框架中还包括一些个人、机构和环境因素:(1)学生的个人和学术特征;(2)教师的个人、专业背景特征,也包括教师的经验、知识、信念、态度等;(3)班级、学校、学区等环境因素;(4)各层级政府和相关政策环境。
尽管对什么是有效的教师专业发展没有统一的定义,大量关于教师专业发展如何影响教师自身和学生学习的实证研究也并没有使用完全一致的影响路径,图1的概念框架也没有囊括所有可能影响专业发展有效性的要素,例如教师专业认同、专业团体协作、校长领导力等要素在支持专业发展中的作用,但图1的框架仍旧提供了研究之间相互探讨的基础。
首先,该框架基本上包含了教师专业发展活动有效性研究的基本要素,使得研究观察和测量的指标相对一致和稳定,并为相关的实证研究提供了讨论和对话的基础。
其次,该框架为聚焦教师专业发展有效性研究的计划和时间线的制定提供了一定的指导,即从教师专业发展活动到活动对教师知识、信念、态度的影响和改变,进一步改变了教师的教学实践,从而影响了学生的学习和学业成就。最后,在共同的框架和研究基础之上总结的有效专业发展的要素、特征和影响机制能够为实践者提供更多的信息,可以帮助学校和教师设计更加有效的专业发展活动。
(二)国内教师专业发展的实证研究
目前国内对教师专业发展活动的实证研究大致可分为三类:一是描述和分析教师专业发展活动现状,包括教师对专业发展活动的需求和评价、专业发展活动的供给情况以及专业发展活动的城乡和地区差异;二是探讨影响教师参与专业发展活动个人层面和组织机构层面的因素,提出教师的自我意识、教师专业共同体、学校的组织因素以及教师专业培训和教研体系特征等,都会影响教师的专业发展活动;三是将教师专业发展活动与教师知识技能、课堂教学实践以及学生学业成绩的变化联系起来,检验教师专业发展是否有效影响了教师自身的知识、态度和实践以及学生的学习结果。
1. 教师专业发展活动的需求情况
(1)教师的类型
不同类型的教师对专业发展活动的需求程度不同,穆洪华(2018)基于2014年中国基础教育质量监测7个省市的数据,对公办小学教师培训情况进行分析后发现:从学历来看,学历越低的教师,其对专业发展活动的需求越高;从教龄来看,新教师对培训的需求更高;从学科来看,不同学科教师的需求度也不同,就主科(语文、数学、英语、科学)而言,科学教师的需求要远远高于其他三科教师;从城乡来看,我国乡村教师对教师专业发展迫切需求的比例要高于城镇,乡村教师更加需要专业发展活动(李琼等,2018)。
(2)培训内容
大量研究表明,教师最需要的培训内容是学科教学方法。越贴近教师实践的知识与技能,越被教师认为是最需要的。李琼等人(2018)的研究发现,城乡教师对学科教学法知识方面的培训需求更大。李琼等人(2013)对北京市教师的调查发现,学科教学法与学科前沿知识是教师最需要研修的内容。同样,赵明仁等人(2009)对北京市中小学教师专业发展活动的调查发现,超过半数的教师认为自己目前最需要进修的内容是学科教学方法。陈向明和王志明(2013)对全国9省中小学教师的调查发现,教师最希望从培训中所学到的内容是教学方法及策略。朱小虎和张民选(2017)对TALIS数据的分析也发现,上海教师最为需要的两个专业发展内容分别为个性化学习的教学方法和学科教学能力培训。
除了学科教学方法外,教师对学生发展相关内容培训的需求也十分强烈。陈向明和王志明(2013)的研究发现,教师对学生发展和心理健康培训的需求仅次于教学方法和策略。蔡金花和曾文婕(2018)对初中教师的调查也发现,教师对于深入了解学生发展特点的培训需求相对较强。柯政和洪志忠(2011)对中学教师的调查发现,教师参加培训意愿最高的是有关学生学习和发展的专业发展活动。
(3)培训形式
教师对培训形式也存在明确的需求指向性。教师更愿意接受通过团队研讨性的活动来提升专业发展水平,教师需求最强烈的培训形式是教学观摩研讨和同事间的交流。蔡金花和曾文婕(2018)的研究发现,观摩他人教学并在课后进行研讨、与同事分享经验以及讨论问题是初中教师认为最想参加的教研活动形式。李琼等人(2013)的研究也发现,从教师对日常教研活动形式的满意度与有效性来看,教师感到最有效的是跨校、跨区教学观摩研讨,其次是同事之间的随时交流。
需要注意的是,不同阶段教师对培训形式的需求可能存在差异。蔡金花和曾文婕(2018)发现5年以下教龄的教师对观摩他人教学、与同事分享和讨论的需求特别强烈。相比之下,5—10年教龄的教师对于专家讲座和课题研究的需求比其他教龄的教师要强烈。这与崔允漷(2011)的研究发现一致:中高职称教师对听专家报告和做课题研究这两项专业发展活动持有较高水平的认可。
2. 教师专业发展活动的供给情况
教师最需要的专业发展活动内容是学科教学方法和学生发展,最需要的专业发展活动形式是教学观摩和研讨。而在实际供给上,从培训内容来看,供给最多的也是学科知识和教学方面的相关培训。朱小虎和张民选(2017)对TALIS数据的分析发现,所教学科领域的知识和理解以及教学能力是上海教师专业发展活动中最为重要的内容。
薛海平和陈向明(2012)通过全国范围的调查发现,教师认为自己接受最多的培训内容是教育教学理论、学科教学、教学方法及策略、班主任工作和学校及课堂教学管理。培训内容的供给基本上满足了教师需求。从培训形式来看,李琼等人(2018)的研究发现,城乡教师参与率最高的教研形式是“工作坊或日常备课和公开课研讨”。
朱小虎和张民选(2017)对TALIS数据的分析发现,上海教师参与率最高的教研形式是课程工作坊、带教和相互观摩。薛海平和陈向明(2012)通过全国范围的调查发现,在被调查者接触的培训中,最常见的几种培训方法是集中讲授、听课评课与录像观摩。培训形式的供给也能够满足教师的需求。
限于调查数据所覆盖的范围,大部分针对教师培训和专业发展的差异分析仅局限在部分省市。例如李琼等人(2018)基于5个省的项目市县的乡村学校教师调查,采用TALIS中的教师专业发展工具,分析教师对专业发展的需求以及影响发展有效性的因素。
穆洪华(2018)基于2014年中国基础教育质量监测7个省市的数据分析了这些地区教师专业发展活动是否具备有效教师专业发展的特征要素。薛海平和陈向明(2012)调查全国9省市中小学教师培训现状,采用多阶段分层随机抽样对中小学教师以及教师培训者进行了问卷调查。
王艳玲和胡惠闵(2020)、谢晨和尹弘飚(2021)是少数基于全国各省的教研机构和教师调查的数据,对教研和教师专业发展活动的开展情况进行分析的研究。其中,Yin et al.(2020)基于全国范围内教研员的抽样调查,对作为教师专业发展活动的主要提供者教研员的工作特征和专业发展需求进行了分析。
谢晨和尹弘飚(2021)基于全国30个省级行政区47620位中小学教师对本区县教研工作开展的评价,构建并计算了各省的教研工作质量指数和教研发展均衡指数,发现基于教师评价的教研和专业发展活动在地区之间存在较大差异,既有以上海、浙江、辽宁等为代表的高质量、高均衡省份,也有北京、天津、山东等高质量但均衡较低的省份,此外中西部地区还存在大量低水平、低位均衡的情况。
3. 影响教师参与专业发展活动的因素
教师参与专业发展活动面临着各类主客观因素的挑战,大致可分为教师个人因素和组织机构因素两类。例如,王双龙(2017)的研究发现,教师的自我意识会显著影响教师的专业发展水平,教师的自我意识程度越高,投入自身专业发展的积极性越高。李琼等人(2018)发现,“与工作时间冲突”是阻碍城乡教师参与专业发展活动的最重要的两个因素之一,而“项目或课程过于昂贵”是乡村教师参与专业发展活动的最大障碍。
也有研究表明,个人所在的情境因素,例如学校支持氛围也会影响教师参与专业发展的意愿和程度(王双龙,2017)。谢晨和尹弘飚(2021)则从教研机构的设置、教研队伍、经费保障和工作方式等分析影响一个地区教研和专业发展活动的因素,发现教研员队伍的经验和规模以及更加专业化的领导对教研和专业发展的质量提升有显著的影响。
4. 教师专业发展活动有效性的实证研究
与国外的研究相似,针对教师专业发展活动效果的研究较多以教师本身的知识、技能、观念和自我效能为衡量效果,较少关注对学生学习效果的影响。目前,在专业发展活动有效性的研究中与本文较为相关的有三项:托马斯等人(2015)基于中国东西部三个地级市2009—2012年303345名普通高中毕业生、任课教师和校长的数据,检验了专业学习共同体和教师发展因素对学生学业成绩的增值影响。结果显示,教师专业发展因素和学生学习成绩之间具有正向相关性,尤其是“参加正式专业发展培训活动”“同事间非正式的改进教学的交流”“参加相关课题研究”和“参加主要教授科目教学策略和方法培训”。
张文静等人(2010)以房山区42所小学的1238名四年级学生和42名数学教师为研究对象,考察教师的特征变量、教学方式和教师培训三个方面对小学四年级学生数学学业成绩增长的影响。教师培训包括是否参加过新课程培训、教师间是否经常讨论教学问题、教师共同准备材料或者备课、教师间相互听课/评课、教师参与教研活动的频繁程度。结果显示,与教师培训相关的变量和学生学业成绩的增长几乎没有显著关系。赵健等人(2013)基于对我国教师专业共同体导向的专业发展实践的关注,在5个城市的59所学校、119个班级、5066名学生的成绩和问卷数据以及581名教师问卷数据的基础上,考察教师专业发展实践特征及其与学生学业成绩的关系。
基于“教师专业发展即参与学习共同体”的假设,作者主要关注备课、培训参与、听评课和教科研参与四个方面的教师专业发展实践⑥。研究通过描述性统计揭示了教师参与教科研的总体状况,但没有对教科研参与情况与学生成绩之间的关系作进一步分析。
除了以上三项研究之外,还有部分研究基于国际大型教育质量监测项目,例如国际学生评价项目(PISA)、国际数学与科学趋势比较研究(TIMSS)和教师教学国际调查(TALIS)对教师专业发展活动的有效性进行国际比较分析。例如谢敏等人(2008)采用TIMSS数据比较了日本、瑞典、美国、中国香港地区的教师资格和职业发展对学生成绩的影响;陈纯槿(2017)基于TALIS数据分析了教师参与专业发展的影响因素,发现影响教师专业发展有效性最主要的因素是教师的合作文化;李勉等人(2018)基于PISA、TIMSS和PIRLS数据,分析教师特征和专业发展与学生成绩的关系。但由于数据的限制,以上国际比较分析并没有涉及中国大陆地区。
综上,在目前国内有关教师专业发展活动有效性的研究中,尤其是检验教师专业发展活动对学生成绩的增值影响的研究中,对教师专业发展活动的各方面因素都有所涉及,但尚未有研究将区域教研作为一个整体,将包括区级和校本在内的各类教师专业发展活动与学生的学业成绩相互联系起来,探讨区域教研活动对学生学业成绩影响的实证研究。
(三)基本分析框架
本文尝试在Desimone(2009)研究总结的理论框架的基础上(图1),结合国际教师调查对教师专业发展活动的概念框架和指标,构建针对区域教研对教师和学生成绩影响的分析框架。目前全球通用的有关教师专业发展、教师效能、教师教学实践及课堂行为等相关数据的调查问卷主要包括:TIMSS、PIRLS、TEDS-M和TALIS等⑦。其中TALIS是经济合作与发展组织(OECD)研发的对教师专业发展、教学理念及实践和教师工作环境进行调研的国际项目。该项目力图通过问卷方式了解各国和地区教师的专业准备、入职培训、专业发展、教学信念与实践、教师评价、校长领导力、学校氛围与支持等方面的情况。上海是中国内地首个参加2013和2016年TALIS调查的地区。根据研究目的,本文主要采用了TALIS作为教师专业发展问卷的基本框架(表1)。
根据教师专业发展有效性研究的概念框架和TALIS调查问卷基本框架,图2构建了本文“投入—过程—产出”的概念框架。其中投入主要包括教师专业特征和教师专业发展两大主题。教师专业特征主要包括教师受教育背景、工作满意度和动机、自我效能。教师专业发展主要包括区级教研活动和校本教研活动。过程包括教师知识技能、教学实践以及相应的课堂环境和学校环境。
在产出部分,本文主要关注的是学生学业成绩。区级和校本教研活动对学生学业成绩的影响路径如下:(1)在投入端,教师参与不同类型的区级和校本教研活动;(2)在过程端,教研活动提升了教师的知识技能,而知识技能的提升影响了教师课堂教学实践,提升了教师的自我效能,这一过程在相应的课堂和学校环境中发生;(3)在产出端,过程端的教师知识技能、教学实践的提升促进了教师自我效能与工作满意度的提升,也促进了学生学习和学业成绩的提升。
此外,各主题之间存在大量潜在的关系,这些关系可能是单向的,例如我们可以预期受教育背景会影响教师的教学实践,但教师入职之后的教学实践不大可能反向影响受教育背景。而另一些因素之间的关系则可能是双向的,例如教师参与教研活动会影响教师的实践,但这些实践也会影响对教研活动的需求、设计和实施。教师的课堂教学实践在课堂和学校环境中发生,同时也影响了课堂环境和学校氛围,学校环境既塑造教师专业实践,也由教师专业实践塑造。
表2为教师问卷的基本框架。问卷包括6个部分:(1)教师背景信息包括教师的年龄、性别等个人背景和学历、专业训练等教育背景;(2)工作情况包括职位、工作经历、教学及非教学时间安排;(3)教学情况包括课堂教学实践、与同事交流合作和与教学实践相关的自我效能;(4)教师专业发展包括教师参加的区级常规教研活动、区级专题教研活动和校本教研活动;(5)评价与反馈包括教师自身、同事、学校管理者和区教研员的评价,以及评价对教学实践和学生成绩的影响自评;(6)学校氛围和支持包括学校对教师发展的支持、对教研活动的支持,教师的职业认同感、学校归属感、工作压力和倦怠感。
三、数据和分析方法
(一)数据来源
本文使用的数据主要分为三个部分:一部分是2016—2019年参加高考的42127名高中学生成绩和选课数据。表3为样本学生的分布情况,每一届在10000人以上,其中文科为2500—2700人左右,理科为7700—8100人左右⑧。除了学生成绩和选课数据之外,本文使用的第二个数据为教师问卷数据。2019年2—3月课题组向参与教研活动的数学、语文、化学三科教师发放区域教研参与情况调查问卷。此次调查共有1974名教师提交了问卷,其中语文教师占47%,数学37%,化学16%。第三,本文基于学生选课信息将教师数据与学生数据进行匹配,建立了包含学生基线成绩、出口成绩和相应学科任课教师信息的数据。
(二)分析方法
基于学生成绩和教师问卷数据,本文主要关注三个方面的问题:首先,对数学、语文和化学三科教师参与教研活动,包括区级和校本教研活动的情况进行描述统计和回归分析,在此基础上采用结构方程模型对教师参与教研的作用进行分析;第二,采用增值评估的方法分析2016—2019届高三学生的成绩,估计学校和教师对学生成绩的增值作用;第三,基于学生成绩和教师问卷匹配数据,采用增值评估的方法,分析教师专业发展活动参与情况对学生成绩的影响。
增值估计是基于教育生产函数模型衍生出来的增值评价方法,其理念是建立在一个前提假设的基础上,即学校和教师在能够在原有的基础之上增加学生的学业成绩,超出原本期望的部分即学校和教师的增值效应。目前在对学校和教师进行评价的时候,主要使用中考和高考升学率、上线率等指标。虽然中高考等高利害测验在筛选学生方面具有专业性,但仅使用中高考成绩评价学校质量和教师水平存在一些弊端。主要原因之一在于,中高考成绩是学生在初中和高中阶段学习的累积,如果不考虑学生入学时的学业水平,那么结果性评价就不能准确反映学校和教师的作用。增值估计则通过学生基线学业成绩,将学生开始成绩中学校无法作用的因素,如学生的遗传、性别、家庭背景等个人因素进行一定的控制,从而估计学校和教师对学生作出的“增值”影响。此外,增值评价可以在一定程度上分离学校、教师和学生自身因素对学业发展的影响,因此也有助于对学校和教师的影响进行更客观的评价。
具体来说,传统的教育生产函数为分析学生学业成绩产出提供了一个包含学生个人能力、家庭背景、学校和教师投入、同伴效应等各类因素在内的完整分析框架。在研究学校和教师的增值性效应时,我们在教育生产函数中加入了上一学期学生的学业成绩:
其中,A的n次方是第n学期时的学业成绩。C、F、S、T、P分别代表社区、家庭、学校、教师和同伴的影响,α代表学生个人能力。上标n的引入意味着第n学期学业成绩是从初始到当下全部教育投入要素共同作用的结果。Aº是初始学业成绩,它的引入在很大程度上缓解了缺乏家庭背景信息、过去教育经历造成的遗漏解释变量问题。
目前,教师增值估计模型被广泛用于中小学阶段教师对学生成绩的增值评估(Jacob & Lefgren,2008;Kane et al.,2008;Hanushek & Rivkin,2010)和教师培训项目和教师专业发展项目的有效性评估(Boyd,et al.,2009;Harris & Sass,2011;Goldhaber et al.,2013)。根据Meghir & Rivkin(2011)对教师增值研究的梳理,增值模型主要分为获得分数(gain-sacore)和滞后分数(lagged-score)两类。本文采用的是滞后分数,也就是将学生的出口成绩作为结果变量,学生的入口成绩则作为控制变量之一。本文的增值分析分为三个部分:第一部分基于学生成绩数据分析不同学校对学生成绩的增值影响,即学校的“打包”增值影响(模型一);第二部分基于学生和教师匹配数据分析教师的“打包”增值影响(模型二);第三部分基于学生成绩数据和教师数据,分析教师参与专业发展活动与学生成绩增值的关系(模型三)。本文的计量模型如下:
1. 学校增值估计
2. 教师增值估计
3. 教师专业发展的增值估计
基于学生学业成绩的教师增值模型估计的是教师“打包”增值效果,提供的是教师相对水平信息,因此主要用于探索是否一些教师比另外一些教师有相对更多的进步,但无法进一步识别教师的哪些特征对增值的贡献更大。为了进一步分析教师参与专业发展活动对学生学业成绩的影响,本文采用考虑了学生滞后分数(lagged-score)以及学校固定效应的增值估计模型,此外还包括教师个人和专业背景特征,具体模型如下:
在实际分析中,由于数据的限制,增值估计往往携带有大量的干扰因素,理想的情况应该是分别控制学生的个体特征和学校的资源环境特征。学生的个体特征包括性别、年龄等个人特征,也包括父母受教育程度、职业、收入等反映家庭经济背景的因素,通常根据学生问卷获得相关数据。学校的特征包括学校规模、基础设施等投入和办学条件数据,也包括环境、氛围和管理等数据,通常根据校长问卷获得相关数据。在缺乏相应的数据时,研究常用的处理方法是采用学校固定效应,以控制学校层面不随时间变动的影响因素(Aaronson et al.,2007;Boyd et al.,2009)。在有多科成绩数据时一些研究还采用学生固定效应,以控制学生层面(例如成绩、家庭背景等)的影响因素(Clotfelter et al.,2010;Goldhaber et al.,2013)。在下面估计教师对学生成绩的增值影响时,我们先尝试采用学校随机模型,然后再采用学校固定模型。
(三)教师专业发展活动的衡量
基于本文所关注的区域教研体系下的教师专业发展活动与学生学业成绩的关系假设,我们重点采集区级教研活动和校本教研活动的相关数据。其中,区级教研活动又可分为区级常规教研活动、蕴含有效教师专业发展特征的教研活动和专题教研活动三类。
首先,根据活动的组织形式,区级常规教研活动包含8个子问题:教材教法、研究课、专家讲座、课题项目研讨、中心组活动、跨学科教研、学术会议、优秀经验和成果分享。根据活动的内容,区级常规教研活动包含9个子问题:学科课程的整合与开发、学科核心知识与思想方法的理解、学科教学关键问题的确定和解决、单元整体教学、深度学习活动的设计与实施、促进学习的持续性评价、中高考命题方向和命题思路、分析和使用学生评价数据、跨学科能力的教学(如STEAM、批判思维、问题解决等)。我们对每位教师参与区级教研活动的频率做平均值处理,得到每位教师区级常规教研活动的平均参与程度。其次,本文根据Darling-Hammond et al.(2017)总结的有效教师专业发展活动特征,将区级常规教研活动进行了归类,分为聚焦课程内容、融入主动学习、示范和模范、专家指导和支持四项蕴含有效专业发展特征的教研活动⑨。
表4为教龄5年以上的教师和教龄5年以下的教师在各区级常规教研活动组织形式上的参与情况。总体来看,教师参与率较高的包括教材教法分析、研究课、专家讲座、课题项目研讨及分享。教师参与率较低的包括中心组成员活动、跨学科教研、各级学术会议以及优秀经验分享。从教龄5年以上和教龄5年以下的教师对比来看,老教师在大部分教研活动形式的参与率上要高于新教师,其中在参加各级学术会议和优秀经验分享上的差距更加明显。这可能是因为老教师从教经验长,经验更加丰富,同时也有更好的资源参与学术会议。
表5为教龄5年以上的教师和教龄5年以下的教师在各区级常规教研活动内容上的参与情况。总体来看,教师参与频率较高的教研活动内容为单元整体教学、学科教学关键问题的确定和解决、学科核心知识与思想方法的理解。教师参与频率较低的教研活动内容为跨学科能力的教学、学科课程的整合与开发。对比来看,教龄5年以上的教师在大部分教研活动的参与率上要高于教龄5年以下的教师,其中在分析和使用学生评价数据、中高考命题这两项与评价相关的培训内容上差距尤为明显。
区级专题教研活动包括“基于学科能力表现的教学改进”“考试评价研讨”和“深度学习”三项专题教研项目。表6为区级专题教研活动参与情况。“基于学科能力表现的教学改进”项目是地区教师进修学校与师范大学合作开展的项目。该项目基于学科能力构成模型,开发出指向核心内容主题的学科能力发展水平诊断工具,对学生的学科能力发展水平现状进行诊断,聚焦问题、反思教学、开展教学改进实践研究。在参与调查的教师中共1118名教师参加过“基于学科能力表现的教学改进”项目,总体参与率为57%,教龄在5年以上的教师有62.4%参加过该项目,教龄在5年以下的教师仅34.6%参加过该项目。“考试评价研讨”专题教研活动基于评价数据的分析和反馈,帮助教师改进课堂教学,帮助学校改进教学管理,同时促进教研内容和方式的改进。在参与调查的教师中共866名教师参加过“考试评价研讨”项目,总体参与率为44.2%,老教师参与率显著高于新教师。“深度学习”则是教育部基础教育课程教材发展中心的教学改进项目。在参与调查的教师中共1105名教师参加过“深度学习”项目,总体参与率为56.4%。同样,老教师的参与率显著高于新教师。
校本教研包含7个子问题:校内听评课、集体备课、参与校本课程及其他教学辅助材料的开发、就教学中遇到的问题与同事进行研讨、与同事讨论某类学生的学业发展问题、与同事分享教学经验与资源、接受专家指导(包括教研员、大学教学专家等)。首先,本文对每位教师参与校本教研的频率做平均值处理,得到每位教师参与校本教研活动的平均参与程度。其次,根据以往的文献,以上校本教研活动又可分为正式和非正式校本教研两类。本文进一步将校内听评课、集体备课、参与校本课程及其他教学辅助材料的开发以及接受专家指导归为正式的校本教研,将就教学中遇到的问题与同事进行研讨、与同事讨论某类学生的学业发展问题、与同事分享教学经验与资源归为非正式的校本教研。
表7为教师校本教研活动的频率。总体来看,教师参与频率最高的正式教研活动为集体备课,有76.5%的教师经常参加(平均值未在表中显示),教龄5年以上的教师参与频率高于新教师。其次是校内听评课,有51%的教师经常参加,新老教师没有太大差异。相对来说,教师在学校接受专家指导的机会较少,19.8%的教师从不或较少接受专家指导,新教师接受专家指导的机会更少。此外,29%左右的教师从未或较少参与校本课程及其他教学教辅材料的开发,新教师的参与频率低于老教师。从教师与同事的非正式交流来看,频率最高的是与同事讨论教学中遇到的问题,77.7%的教师经常与同事讨论,其次是与同事分享经验和资源以及讨论某类学生的学业发展问题。
本文转载自微信公众号“华东师范大学学报教育科学版”(ID:ECNU_xbjk)。文章为作者独立观点,不代表芥末堆立场,转载请联系原作者。
2、芥末堆不接受通过公关费、车马费等任何形式发布失实文章,只呈现有价值的内容给读者;
3、如果你也从事教育,并希望被芥末堆报道,请您 填写信息告诉我们。