【芥末翻】认知科学实验：通过脑力训练游戏开发儿童大脑，真的有用吗？

【芥末翻】是芥末堆全新推出的一档学术栏目，由芥末堆海外翻译社群的小伙伴们助力完成。我们致力于将全球经典或是前沿的教育理念、教育技术、学习理论、实践案例等文献翻译成中文，并希望能够通过引进这类优质教育研究成果，在全球教育科学的推动下，让更好的教育来得更快！

本文选自Scientific Report，作者 Wexler, B. E. et al.，标题 Cognitive Priming and Cognitive Training: Immediate and Far Transfer to Academic Skills in Children. ，来源 Sci. Rep. 6, 32859; doi: 10.1038/srep32859 (2016).译者颖杰，编辑阿槑。

编者推荐：玩脑力训练游戏真的能提高智力，改善学习效果吗？美国耶鲁大学去年九月份的一项研究称，特定的计算机脑力训练游戏确实有助于提高学生的数学和阅读考试成绩，甚至超过一对一辅导的效果。其理论依据在于，大脑的神经系统具有可塑性，经过严格设计的脑力训练游戏能够帮助学生集中注意力，改善自我控制能力，工作记忆和认知灵活性。

整个实验概括如下：

在以583名二年级儿童作为样本的实验研究中，研究者对学校所使用的计算机脑力训练游戏的效果进行评估，学校希望利用这种神经可塑性的潜力改善学习。由于认知操作由动态重构神经系统支持，而神经系统是广泛分布于整个大脑处理组件集成，环境输入有力地塑造了这些系统的神经元间的连接。

实验结果显示：

在数学或阅读课上的游戏开始之前，做一个 5 分钟的脑力训练游戏，能够提升学生们在课程游戏中的表现。
而持续4个月每周进行三次20分钟的脑力训练，与对照组（同一时间进行测试，但未进行脑力训练的学生）相比，学生整体的数学和阅读考试成绩有所提升。
以上结果证实了具有即时效果的认知启动对学习的影响，以及具有长期远迁移效果的脑力训练对学业成就的影响。

实验设计：BT游戏能否激活学生的认知系统？

针对动物和人类的研究指出，大脑的结构和功能基本上由环境产生的神经元活动形成。只引用三个例子来说明：

当听觉输入被外科手术替换为视觉输入，雪貂的听觉皮层会表现其视觉皮层的结构和功能；
对老鼠的感官系统进行刺激和训练，可以逆转年龄相关的神经元校正、髓鞘和细胞结构的变化;
儿童长时间练习小提琴的行为，则与左手相对的右侧感觉运动皮质的扩展有关，使得他能做出快速且复杂的手指运动。

医学科学家已经发明了基于这种神经可塑性潜力的新治疗手段。最引人注目的是可以让盲人“复明”的感觉替代装置。盲人佩戴一个眼镜式的相机，将类似电视画面的图像发送到放置在舌头上的小而密集的网格，交由大脑来处理，就好像是由眼睛传入的。其他研究人员则通过用计算机呈现的神经认知练习，增强神经系统功能不足的精神分裂症或抑郁症患者的活性依赖性。

这些基础科学和临床研究鼓励研究人员和业界为儿童创造基于计算机的脑力训练游戏（brain-training games，简称BT），由于大脑具有高度可塑性，我们可以提高注意力，思维能力和学习成绩等。然而，针对此项研究，最近有评论称，对这些项目的评估显示，其作用很小，甚至没有超过打BT游戏能力的提升。但是，神经可塑性的基础和临床证据表明，局限性可能在于这款BT游戏，而非这件事本身，需要做进一步研究，确定BT游戏可以帮助儿童，特别是在学校应用过程中。

屏幕快照 2017-06-25 下午3.39.48.jpg

表1.认知启动效应（标准错误）对阅读表现的影响

我们设计了四种计算机BT游戏以增加学生的管控功能。管控功能是心理学理论中的一套认知操作系统，在自我管理和信息管理方面十分重要，包括注意力集中，反应抑制，工作记忆和认知灵活性。当我们预测 5-7 岁孩子的在学校能否成功时，管控功能就发挥作用。

本研究中使用的第一个游戏在其初始阶段训练简单的持续关注，但会系统地添加由判别注意，反应抑制，认知灵活性，工作记忆和同时多重关注构成的管控功能训练。其他游戏也需要持续的注意力，但聚焦在使用类别，模式识别或空间工作记忆等方面。他们使用新的算法，通过不同的任务配置使得每时每刻的难度和进度都达到个性化。

此外，总体上来讲，BT游戏也包括体育锻炼，有一般的有氧运动和认知要素锻炼，认知锻炼用来激活神经认知系统。有研究数据显示，数千名儿童在集中注意力、反应抑制和工作记忆的研究测试中有显著提升，而这些游戏在内容、形式和用户体验上都大相径庭，这表明，其隐含价值超越了训练游戏本身，触及底层认知操作。

本研究旨在评估BT游戏对数学和阅读表现的即时影响（认知启动）和长期影响（学术成就）。

在即将开始数学或阅读课游戏之前进行脑力游戏训练，真的能提升学生在认知启动上的表现吗？
在这几个月中，相较于那些没有进行脑力训练游戏的学生，BT能提升学生在数学和阅读标准化考试中的表现吗？

已经可以确定的是，前置刺激可以改变之后的信息处理。“启动”一词表示，可以增强语义上相关单词的识别、归类或生成。刺激出现之前的警报提示增强了对刺激的反应，而任务相关的视觉刺激延迟了对视域中相同位置紧接而来刺激的反应。通过处理数学方程的认知操作可以促进后续的语言任务。在fMRI（功能性磁振造影）之前，读取包含单独的代词“I”（“我”）而不是代词“we”（我们）的文章，能够增强与观看自己照片相关联的右前额叶区域的激活，这一增强又与更快的反应频率相关。神经系统是分布在整个大脑，相对活跃且互连的运算资源，而认知操作由动态的重新配置的神经系统所支持。任务集是用于执行任务的神经系统配置。如上述研究中的操作启动构成了部分后续的任务集。

构建有效的任务集是幼儿教育教学中的一项挑战。在行为层面上，很明显这需要让孩子们参与、坚持、理解和记忆。在神经认知层面，学习课程材料所需的管控功能和相关的脑力资源在学校期间保持活跃的发展。

针对第一个问题，我们试图确定，用于激活与管控功能相关的神经系统的BT游戏是否可以启动这些系统，从而帮助大脑构建更有利于学习数学或阅读的神经认知任务集。如果可行，则可以系统地确定不同学习课程内容所需要的认知启动类型，以及什么样的初始化学习对于每个孩子来说是最好的。

第二个问题则是，在为期几个月的训练中，更频繁地使用BT游戏来增强神经认知功能。其核心目标是促进与管控功能相关的神经活动的开发。其关键问题是，这些结果能否真正让学生从日常的数学和阅读课程中学到更多，并在学校的数学或阅读成绩测试中表现得更好。如果是这样，这将证明BT在远迁移和学业成绩提升上的作用，而这在目前是一个有争议的问题。

实验结果：即时效果和长期远迁移效果

>>问题1：认知启动对阅读和数学表现的影响。

阅读CC游戏（curricular content game ）。

通过启动模式识别（p <0.001），普通管控功能（p <0.001）和空间工作记忆（p = 0.01）等脑力训练游戏，学生阅读CC游戏的准确率有所提高。当速度和准确率一起考虑时，所有四种BT游戏的积极效果是更大且显着（类别p = 0.05，所有其他p <0.0001）。模式识别游戏具有最大的效果，而类别游戏效果最小，两者之间差异显著（p = 0.08）（表1）。

数学CC游戏（curricular content game ）。

通过BT游戏模式识别（p <0.001）启动，数学CC游戏的准确率明显增强，并且通用管控功能和空间工作记忆，BT游戏的效果显著（p=0.07）。BT游戏在模式识别和空间工作记忆上的效果差异也十分大（p = 0.095）。当速度和准确性一起考虑时，所有四个BT游戏的积极效果再次更大且显著：一般管控功能p = 0.000001，类别p <0.000001，模式识别p = 0.001，以及空间工作记忆p = 0.008。类别BT游戏比空间工作存储器（p = 0.016）或模式识别（p = 0.034）BT游戏（表2）有更大的性能增强。

根据Keith关于学校学习影响的规则，0.05和0.10之间的影响被认为是小而有意义的，0.10到0.25之间是中等，而0.25以上的影响很大23。在评估的16种触发影响中，11种具有统计学上地显著性，并且依据指南，11种的8种具有中等影响（表1和2）。

屏幕快照 2017-06-25 下午5.46.58.jpg

表2.认知启动效应（标准误差）对数学表现的影响

屏幕快照 2017-06-25 下午5.47.06.jpg

图1.学校数学测试成绩。左侧栏是控制类中没有进行大脑训练的儿童的冬季和春季分数。右侧栏是在两个测试日期之间进行大脑训练的儿童的冬季和春季分数。学校设置了熟练度的临界分数及以下。

>>问题2：远迁移之于学校数学和阅读成就测试。

实验结果：项目参与者比没有做BT游戏但进行相同数学和阅读测试的控制组学生显示出更大的提升。

在数学（74.10 +/- 16.7 vs. 74.23 +/- 15.6）或阅读（22.65 +/- 5.5 vs. 22.54 +/- 5.8）中，BT和对照组之间基线分数（平均值+/- sd）没有差异。如由时间交互组所显示的，在测试后组中的差异更大，数学（91.67 +/- 10.8 vs. 86.25 +/- 12.4）和阅读（29.92 +/- 6.2 vs. 29.18 +/- 4.8 ）。效应大小（Cohen's d）对于数学为0.49，对于阅读为0.18。当不排除具有完美或接近完美基线得分的受试者（参见“方法”）时，对数学的影响在p <0.001时仍显著，但是对阅读的影响不显著。

在数学考试中，学校系统会根据学生表现进行分类，分为熟练、有风险或有缺陷，如图1所示（分别为绿色，黄色和红色）。在年初，达到熟练程度孩子很少，但到年底时，脑力训练班比控制组多了12.8％的儿童达到熟练程度。相比于区域平均水平或同样学校的对照班级，那些在数学和阅读课程中使用了BT训练的班级学生显示出更高的熟练度，但我们并未获得单个学生的数据进行统计分析。

探讨：不同的脑力游戏激活不同的神经处理系统

在计算机化的数学或阅读课程内容学习游戏开始之前，做一个五分钟的脑激活视频游戏，能够提高课程游戏的表现。

考虑到这一点，老师们尝试建立适宜学习的心智/大脑状态（任务集），比如教室环境（例如，避免分心，良好的光线），以及教学技巧，如“如果你的眼睛不在看我的眼睛，即你没有注意我”。我们的实验表明，旨在激活特定的神经认知处理系统的短视频游戏可以作为大脑热身操，提高在视频游戏后的认知表现。与教师目前可用的程序相比，视频游戏认知启动可以更直接地建立内部状态以促进学习，并且对紧随其后的课程内容产生作用。此外，技术能轻而易举地使得认知启动进行调整，以适应不同儿童认知特性可能存在的差异。这些应用也同样可以用于学校以外的学习和表现情境。

我们的数据显示了四种BT游戏之间不同的认知启动效应，以及对不同的课程内容产生的作用。类别BT（Categories BT ）游戏对数学CC游戏的认知启动影响最大，超过空间工作记忆以及模式识别类（ Pattern Recognition ）的BT游戏。

相比之下，类别BT游戏对阅读CC游戏的启动效果是最弱的，模式识别类BT游戏对其影响最大，这与我们的假设一致：即不同的BT游戏激活不同的神经处理系统，同时，最合适于学习数学和阅读的任务集也并不相同。

我们的第二个发现是，在12-16周之间，玩过BT游戏的孩子在学校数学和阅读测试中表现比对照组班级有更大的提高，其对数学测试结果（0.49）的影响力大于一对一辅导（0.40）。这一效果通过一个教师和超过20个孩子而不是一个教师对一个孩子来实现，并且在对每一主题需重复辅导的同时改善阅读表现。数学（0.49）和阅读（0.18）的结果明显大于在课后周末和夏季课程的扩展教学。本研究中的发现与许多以前没有远迁移的儿童研究相反，这可能是由于BT游戏本身的特性。本研究中的BT激活和训练了多项神经认知功能，将其作为通道来激活支持管控功能的神经系统。这与以往最常研究的项目形成对比，那些方案仅关注单维度的认知功能。此外，该项目能够以个性化的训练方式来调节其难度配置。最后，当前的BT包括了体育锻炼以及计算机化锻炼，这同样是此前的项目所缺乏的。计算机的呈现和体育锻炼被设计为协同工作，虽然这可能是本研究中积极结果的一个原因，但这也意味着当前研究中不可能确定每个观察结果的相对贡献。此外，我们注意到，本研究不包括主动控制条件，因此留下实验条件中一些其他非特定方面的可能性，例如放松孩子或诱导积极的情绪也可能有助于产生积极结果。然而，我们的 BT干预措施效果明显大于其他学校的干预效果，和“常规教育”相比，这与BT有特定影响的结论也是一致的。

BT的效果在数学测试表现上比在阅读的更大，但这可能更多地与心理计量特质的表现相关，而非BT本身的属性。数学测试是一个客观的纸笔测试，这使其比更主观化评分和个性化的阅读测试更为可靠。而且，来自阅读测试的数据表明，教师评分有限的内在打分可靠性潜在地增加了方差。

本研究也有局限性。

首先，四种类型的BT游戏在许多方面是类似的，且被设计用来激活与EF相关联的重叠神经系统。重要的是，尽管有这些相似性，它们具有明显不同的启动效应，表明了即使在有限范围内的变化中，使用特定启动活动性质的BT游戏影响了启动活动。但是由于这些相似性，我们不能定义有效的认知启动对数学或阅读的局限性和基本特征。

第二个局限是，在评估对学校数学和阅读成绩测试的远迁移效应时缺乏主动控制。有可能出现这样一种现象，学生堆参与学校新计划的热情带来了更大的动机和努力来进行成就测试，即“霍桑效应”。但是，基于以下几个原因，这不太可能影响我们的实验结果。计算机练习是高度复杂的，很快会失去新奇感或相关的热情，这只是学校周的一部分。更重要的是，对于做BT +阅读CC游戏的团队，尽管在数学上没有明显的帮助，但他们在数学测试结果上显示出非常大的收益。在年底和其他学校一起进行的数学测试，没有将之配合他们之前做过的BT+阅读CC游戏。类似的考虑适用于做了BT +数学CC游戏的团队的阅读结果。最重要的是对21项学校干预研究的元分析，所有这些研究都采用了常规教育作为非主动控制和广泛的数学和/或阅读成绩测试，正如在我们的研究中作为结果测量的方式。这个平均效应大小为0.0724。如果你假设这些干预措施根本没有真正的效果并将所有的影响归因于霍桑效应，我们观察到的影响是数学测试结果的七倍，阅读的两倍半。

第三，由于BT项目需要持续的课程时间投入，教育部门首先确定了愿意实施该项目的学校，然后选择在学生人数、工作人员稳定性、前一年考试成绩和总体资源等方面相匹配的比较学校。这具有不可随机分配的缺点，但同时有确保试验和比较学校尽可能相似的优点。由于所有学校每天大多数的活动旨在提高学生表现，所以没有理由认为试验学校和比较学校在成功动机上有所不同。

最后，用学校的成就测试来证明BT的远迁移在心理测验上有局限性。天花板效应意味着我们无法评估BT对高成就学生的潜在好处以及从分析中去除那些学生，因为在BT和对照组之间，都引入了不对称的还原平均人为潜在地增加平均提升结果的情况下，他们只有很少甚至没有空间来展示BT的影响。这种效应可以减少BT和对照组之间的差异。

总之，这项研究提供了强有力的证据表明远迁移大脑训练对儿童的影响，这是学术界一个重要但存在争议的问题。此外，这项研究首次表明，在开始在线课程内容游戏之前，一个简短的大脑热身或认知启动游戏可以增强学生的表现。这为未来的研究开辟了道路，以确定适用于不同课程内容的大脑激活认知启动类型，不同儿童之间的个性化差异，同一个儿童在不同时间段发生的变化，以及从长远来看，即时认知启动如何促进课程内容的学习。该研究在真实的学校环境中完成，表明BT和认知启动可能被广泛应用于基于神经科学和技术赋能的教学中。

屏幕快照 2017-06-25 下午5.48.39.jpg

图2.一般管控功能大脑训练的两个用户界面。左侧面板的版本是孩子跟着移动光线，并在当它变成一个符合目标标准的宝石时点击它。在所示的游戏级别有两个移动光线，在这一屏幕截图时，是一个刚刚变成的蓝色宝石。屏幕顶部的线索显示了目标是蓝色的宝石。右侧面板是相同认知需求和计算机代码的第二用户界面。在这一屏幕截图时，移动透镜（黄色圆圈）刚刚在板条箱中露出了目标猴子，孩子点击了它，猴子从箱子中释放出来并逃走了。游戏的计算机代码是使用文本编辑器Sublime（https://www.sublimetext.com/）和在Photoshop（http://www.photoshop.com/）中创建的艺术作品所形成的。

研究方法：实验中所使用的四个BT游戏

实验的参与者。该项目是为4所位于Fairfax的弗吉尼亚公立学校（FCPS），来自13个班级的372名二年级学生所设立的。每所学校的班级被随机分配接受BT加数学CC内容游戏（170名学生）或BT加阅读CC游戏（202名学生）。三所学校中额外的10个二年级班级作为没有接受BT或CC游戏的控制对照组（72名学生和139名学生分别作为数学成绩和阅读成绩的控制对照组）。试验和控制对照学校的人数类似，所有学校中由于家庭低收入，有5-10％的儿童符合免费或减少午餐的基准。所有研究程序均经由耶鲁大学医学院人类调查委员会批准，所有研究程序均符合相关指南。

四个计算机脑力训练（BT）游戏。

游戏1旨在集中注意力，反应抑制，认知灵活性。这个游戏的两个版本具有相同的底层计算机代码和认知挑战的顺序，但具有不同的用户游戏体验（图2）。

在该游戏的第一个版本中，学生开始使用鼠标来跟踪一个移动的光线，当它变成一个红色的宝石时点击它。正确反应，光线移动得更快；错误反应，光线移动得变慢。随着游戏的进行，增加了更多方面的管控功能。不应该点击的蓝色宝石出现，增加了区别注意和反应抑制。接下来，目标随机在红色和蓝色之间切换，增加反应抑制需求和认知灵活性。工作记忆的引入，是通过显示半宝石，并指示孩子只点击与前一个相同颜色的来创造一个完整的宝石。除了主要关注管控功能，这个游戏还需要视觉空间处理和手眼协调。所有级别在屏幕上重复两个和三个移动灯光。

第二个版本具有相同的底层计算机代码和认知挑战的顺序，但是不同的用户游戏体验（图2）：魔术棱镜从一个移动的条板箱跳到另一个，透露出内部是否有猴子。如果它是“目标”的猴子，孩子点击它，猴子逃出箱子。我们发现，每个组件管控功能（如反应抑制）的神经心理构造与游戏玩法的任何操作方面（如对陪衬物无反应）没有一一对应，因为操作行为需要多功能混杂，其本身在当时的神经生理学水平上具有另一整合身份。但是我们认为，跨游戏级别操作的逐步组合，以及整套BT游戏的操作集合构成一个BT程序，其强烈地激活了一套支持管控功能的神经功能系统。

游戏2训练使用类别（类别）。海盗将东西从胸部投射到空中，孩子必须在其飞出屏幕前，点击目标类别的东西。通过正确的反应，它们移动得更快，并且渐进地增加级别到在屏幕上出现累计六个飞行物体。最初是简单的和自然界的类别，如字母、数字、动物、植物、食品和家具。更高级别的类别包括工具，机器，运动和“度假中带的东西”。在最高级别中，孩子必须在屏幕上找到同一类别的对象。

游戏3训练模式识别（模式识别）。学生连续看到一列三个目标，必须选择三个附加目标之一来完成这一模式。鸭子拿着目标，当一列成功完成后，鸭子愉快地飞走了。游戏从简单的模式规则开始，如“所有相同的形状”或“所有相同的颜色”，进一步到规则像“所有不同的颜色和形状”，模式像“蓝色圆形-黄色三角形-蓝色圆形-黄色三角形”。更高的级别包括数字模式，旋转形状和不同类型问题的混合。正确反应，允许的反应时间变得更短；错误反应，反应时间变得更长。

游戏4训练空间工作记忆（空间工作记忆）。孩子们必须记住一组在海滩上坐着的海盗举手请求吃饭的顺序，或者是一个嬉戏的猴子所到营地里的位置，并按照适当的顺序点击它们。要记住位置的数量从两个开始，成功则数量增加，错误则减少。一些游戏级别要求孩子以相反的顺序作出反应。游戏指令通过听觉-耳机和视觉-屏幕来呈现。

身体的大脑训练练习（PE）。像计算机练习一样，认知方面的身体锻炼从持续注意力和反应抑制开始，并逐渐延伸到认知灵活性，多个同时注意力和工作记忆层面。例如，最初，孩子们在地板上他们自己圆圈内分配自己的空间，照顾自己的身体，并练习像瑜伽的平衡姿势。接下来，他们控制球成对传递，小组按照规则玩游戏，需要规划、策略和自我控制，或像“西蒙说”的反应抑制游戏。后来，他们学习武术和舞蹈顺序，或者投掷两个不同的彩色袋到另外五六个孩子的圆圈中，而孩子按照不同的顺序投掷每一颜色。每天都有或多或者的有氧运动，小组和个人集中练习。虽然身体锻炼和计算机练习具有高度相似的认知需求，并被设计为激活类似的、重叠的神经功能系统，但我们没有大脑成像数据来确认重叠的程度。

课程内容（CC）游戏。本研究按照纽约州二年级学生的共同核心学习目标，创建了阅读和数学游戏。对于阅读和数学游戏，我们评估了两个方面的表现。首先是准确率，由正确的反应/总反应量，以及独立的反应速度。第二个测量，正确反应/分钟，组合的速度和准确率。例如，如果一个孩子得到100％的准确率，但反应非常慢，他的正确反应/分钟将是相当低的。第二个孩子获得50％的准确率，但是两倍的反应速度，在正确反应/分钟他将得到相同的分数。如果两个孩子反应同样快，那么得到正确反应更高百分比的人将获得更高的正确反应/分钟得分。不同的个体可以优先考虑不同的结果目标或策略，并且认知启动可以不同地影响在这两种措施中反映出来的策略和目标。在这些措施和结果维度的二维空间中，定位每个个人以及评估相对优先级如何随时间变化，这超出了本报告的范围。然而，这两个措施让我们开始考虑不同类型的启动将如何影响整体的不同结果目标和策略。

阅读游戏。尽管游戏仅仅依赖于视觉刺激和匹配，阅读游戏需要孩子们使用由元音声音相似定义的正确链接来创建单词链。链条像锚一样固定浮动的海盗船，一个小海盗游到水下从选项中选出单词，把单词放到链条上的渔网中。在31个游戏难度级别中，比赛从简单到复杂（例如，从一块黄油-帽子-坐垫，到天-说话-星期日-圣代-干草-摇摆-戏剧-灰色-称重量-嘶鸣声-迷路）（注：这些单词在英语发音中有部分发音相似）。

数学游戏。数学游戏基于填数字-由线连接的三个圆圈的集合，具有包含“整体”（例如，12）的大圆圈，以及包含其“部分”（例如5和7）的较小圆圈。在游戏中，这种视觉结构被呈现为平衡秤。另外，在中心平衡点的一侧有两个较小的球体，在另一侧有一个较大的球体。为了减法，在天平的每一侧，有两个相等大小的球体。孩子必须从一个特定的球体中添加或减去黄金以平衡秤，从一个不同价值的金片集合中选择移动到一个球体，并选择哪些金片从球体中删除。这些问题旨在增加对十进制和百进制数字（计算）和概念的理解，并对两位和三位数字的加减更为熟练。随着学生们通过120个游戏关卡，问题变得更加困难。在数学游戏的计算能力中，移动以平衡称被认为是正确的步骤。在这个游戏中，移动之前，实际实现平衡的移动不按对或错论，但过多的移动步骤会积累得到较低的分数。例如，如果问题6 +？ = 24在左侧的一个球体中是6，在左侧的第二球体中为空，那么通过添加一个10单位片和两个4单位片相较于添加一个5单位片，三个2单位片和一个1单位片直到秤平衡，前者是更快地回答。第一个策略将得到更高的精确度分数（1/3 vs. 1/11），并且潜在地具有更高的组合速度和准确率分数，因为平衡秤的数量/分钟反映了实现平衡所需的移动数量和每次移动的速度。

表现和学术成绩。BT的远迁移通过学校数学和阅读的标准化测试结果，和刚刚开始（测试前）之前和完成（测试后）之后阅读成绩的改变，以及在相同时间点的对照组进行评估。数学成绩测试由FCPS开发，并在整个地区标准使用。测试包括20个问题，涉及数学相关知识的多个领域，要求学生识别对称图形，识别和描述几何形状，使用数据来预测实验结果，构建图形，识别图形模式，估计和测量长度，以及使用金钱、时钟和日历，以及计算、位值算术和分数等。阅读成绩是通过发展性阅读评估（DRA）来评估，第二版的阅读流畅性和理解程度，由每个孩子的老师基于孩子如何朗读和理解标准化测试段落来评估。教学手册帮助老师来管理和评分测试27。测试-重测的可靠性基于同一教师对同一学生（n = 112，1-6年级），14天间隔（不指定不同教师的数目）的评级，非常高的0.97（流利）和0.99（理解）。为了评估评估者的可靠性，26位打分者评估了录音记录，并审查了来自30个DRA部门的学生写作。Gwel的Kappa First整理了约定评分系数，0.57为流利，0.65为理解，其中41-0.60为中等，高于0.60为相当好27。

大脑训练计划。从2015年2月到6月，孩子们每周三次或每周四次做BT和CC电脑游戏，平均每个孩子31次，范围6-65，两个异常值被删除，81％的孩子做至少20个部分。在研究中这些部分最初包括5个5分钟的BT游戏和一个10分钟的CC游戏，但CC游戏缩短到5分钟约占20％，以适应学校日程限制。为了评估潜在的认知启动效果，我们将当没有BT游戏时的CC效果与在四个BT游戏之后的CC效果进行比较。为了最小化在玩CC游戏之前课程时间结束时的天数，CC游戏被随机地安排为一天中的第一、第二或第三个游戏。由于我们有四种类型的BT游戏，我们有五个选择条件（CC第一，BT1 / CC，BT2 / CC，BT3 / CC和BT4 / CC）。在10个训练环节的每个连续块中，随机选择CC游戏最先出现的两个环节。为了提高参与度，在孩子们玩BT游戏之前，他们会看到一个“游戏选择”屏幕，允许他们选择两个BT游戏之一来进行下一个游戏。他们的选择限制了在每个10环节随机块中的未来选项，使得4种BT游戏中的每一种在这块中的两次CC之前。孩子们每周进行一次或两次PE训练游戏，每天大约30分钟。教师门户网站的在线材料提供了便利计算机练习和详细的日常问题的PE计划。老师们接受了4小时的计算机和PE训练游戏管理培训，所有的培训都由学校教师带领。

统计分析。即时认知启动对数学和阅读表现的影响。来自每个关键击球或来自每个游戏的鼠标点击的未处理的数据被发送到国家评估、标准和学生测试研究中心（CRESST /UCLA）的统计分析团队来分析。因此，尽管整个研究团队参与讨论总体目标，战略分析和发现解释，数据分析在很大程度上独立于设计这项BT研究的研究人员，以及支持在学校使用该计划的商业公司（C8Sciences）。由于一些原因，BT游戏对CC游戏表现的影响评估在统计上是复杂的。数据集的结构是多层次的，且游戏玩法部分嵌套在学生中。许多潜在的协变量可能影响CC游戏的表现。此外，在任何特定的环节中，只进行CC游戏级别的子集。因此，期望环节表现也由于参与级别的属性而复杂化，一个环节到另一个环节变化。为了解释这些复杂性，我们采用灵活的多级反应理论（IRT）28-31方法，连同学生之间变化实时建模的协变量，也解决CC游戏的不同特点包括CC游戏水平难度。

对数据集进行反常值和异常值的筛选。消除不完整或过长的环节，如果在某一环节中的特定游戏级别上花费的时间少于一分钟或少于10个游戏移动，则不考虑该数据。这些过滤器创建了一个用于分析的数据集，其由读取CC游戏的5876个（经过滤器之前的6,534）和数学CC游戏的3884个（从过滤器之前的4,541）组成。卡方和RMSEA项拟合统计表明所有结果测量优秀适合。报告的p值是2尾。

远迁移对于学校数学和阅读表现测试。程序参与者和控制对照组之间的差异，是通过在R中运行的重复测量方差分析（ANOVA）评估而得。由于老师的误差，BT组中的73名学生在春季被给到得错误的数学测试或没有数学测试。这导致了BT组孩子的分析样本中，数学测试结果有299名，阅读测试结果有399名。在阅读测试中观察到的最高分数为38分。在参与者和对照组儿童的整个样品中，从测试前到测试后的平均提升超过6分。为了在评估参与者和对照组可能的不同提升时限制上限影响，将53名在之前测试有34分及以上评分的孩子从BT组中排除，从对照组中排除7个，分别留下319名和132名。在之前测试有90分及以上（BT组中有68名和对照组中有24名）分数的孩子从数学成绩分析中排除，其中最高可能得分为100分，整体样本的平均提升超过16分，留下来的组内分别是231名和48名学生。在重复分析中，没有学生被排除。由于来自多个以前学校实施的数据显示了班级数学和阅读测试的平均增长（补充数据1），所以研究中使用了单尾测试。在每组分析中使用的前/后差值分数的分布满足正常假设，并且各组在Fligner检验差异分数的方差没有差异。

>>声明

本翻译仅作了解之用，并非用于学术研究或商业决策。芥末堆海外翻译社群的小伙伴们力求将关键理念与思想更广泛地传播至中文区域，故部分表达可能与原文有所差异。如需使用，请查证原文。