首页
杂志网
当前位置:首页>>学前教育>基于潜变量的分析方法对儿童平衡秤任务的评估>正文

基于潜变量的分析方法对儿童平衡秤任务的评估

来源:杂志发表网时间:2015-12-20 所属栏目:学前教育

  

  一、引言

  平衡秤任务研究在心理学中最早始于皮亚杰,他在 1958 年所使用的任务形式如图 1 所示,在离支点不同距离处放上数量不同的标准单位重物,在去掉两端支撑物后,要求儿童判断平衡秤两端是保持平衡还是一端下降。皮亚杰让各年龄儿童操作实物平衡秤,通过实际观察、记录和分析儿童操作过程中的言语行为,得出儿童在完成平衡秤任务上具有不同的认知发展阶段。不同年龄儿童在平衡秤任务上表现的差异实质上反映了其比例推理能力发展的阶段性特征。

  目前,平衡秤任务已经取得许多新进展,新的研究方法也逐渐取代了传统方法,然而国内关于平衡秤任务的研究开展的并不多,主要研究方法也局限于上世纪八九十年代提出的技术,这样的情况下,很难保证研究结果的可靠性。本文将介绍平衡秤任务的解题规则的研究进展,以及传统方法存在的缺陷,以及潜在类别分析方法在平衡秤任务领域的应用,最后总结新统计方法对儿童高级认知策略研究的价值,为相关领域研究提供参考。

  (一) 平衡秤任务的解题规则Siegler 认为,不同年龄儿童在平衡秤任务上的表现存在差异的根本原因在于其所使用的问题解决规则不同。

  本文作者认为 Siegler 所指的规则与策略等同,均指被试在解决问题过程中所采取的一系列心理操作。Siegler 认为解决平衡秤任务时可使用四种规则:(1) 使用规则Ⅰ儿童认为平衡秤上重物重量更大的一端下降,两端重量相等时则保持平衡; (2) 使用规则Ⅱ的儿童在平衡秤两端重物重量不同时认为重量更大的一端下降,重量相同时则认为重物离支点更远的一端下降;(3) 使用规则Ⅲ的儿童在平衡秤两端重物的重量或距离至少其一相同时均能正确判断,但若二者显示平衡秤的变化趋势不一致,他们则只能凭猜测回答;(4)使用规则Ⅳ的儿童掌握了力矩规则,他们同时考虑了物体重量和离支点的距离,通过计算平衡秤两端重物的重量与其到支点的距离之积,判断平衡秤的下降方向。

  这些规则能用来表示儿童潜在的知识结构,四种基本规则的复杂性依次增加,掌握复杂规则的儿童其比例推理能力也更强。但 Siegler 的分类并未穷尽所有解题策略,有很多被划分成使用规则Ⅲ的儿童可能使用的是其它规则,如加法规则、规则ⅢA、质性比例规则和运货车规则。

  1. 加法规则(Additive Rule):上述四种规则中,只有规则Ⅳ同时考虑了重量和距离信息。但有研究显示,存在其它能够综合考虑重量与距离两方面信息的规则,称之为加法规则。加法规则至少有两种类别,一种是简单相加,是指比较两侧重物的重量与到支点的距离之和; 另一种是加权相加,比较两侧重物的加权重量(如重量的2倍)与到支点距离之和。

  有研究显示,大约有13.8 % 的被试(6岁、9岁,12岁的儿童及成人) 使用了加法规则。

  2. 规则ⅢA(Perceptual Muddle Through Rule) :Klahr 和 Siegler 认为,对于一类题目(平衡秤一端重物距支点距离更远、另一端重物重量更大) ,有的儿童是凭借感觉,因为他们在一些任务上选择重物重量更大的一端下降,在另一些任务上选择重物距支点距离更远的一端下降,此情况下称为规则ⅢA。

  3. 质性比例规则 (Qualitative ProportionalityRule):此类儿童同时考虑了重量及距离信息,认为将更轻的重物放在与支点更远的距离与将重量更大的重物放在与支点距离更近处等价。因此,使用此规则的儿童对冲突问题会做出保持平衡的判断。Normandeau 等人研究发现,有3.9 % 的被试是使用质性比例规则。

  4. 运货车规则(Buggy Rule) : Van Maanen,Been和 Sijtsma 使用线性逻辑斯蒂潜在特质模型分析7 -8 年级的儿童的作答,发现当平衡秤一端重物重量更大、距支点更近时,有些儿童认为将重物向远离支点方向移动一格,则重物重量应减少一个单位,直到两端重物与支点距离相同,称之为运货车规则。Jansen 和 Van der Maas 使用潜在类别分析技术(后文介绍) 再次验证了运货车规则的存在。

  (二) 平衡秤任务的测量为了研究儿童在解决平衡秤任务时的规则使用情况,Siegler 通过改变重量与距离维度设计了平衡、距离、重量、冲突重量、冲突距离、冲突平衡等 6 类平衡秤题目。

  题目均以图形方式呈现给被试,每题均有三个图形选项表示平衡秤状态(图 1) ,被试只能在三个选项中选择一个。其中,平衡题目是指平衡秤两端重物的重量及其与支点的距离均相同; 距离题目是指在平衡秤两端重物重量相等,但与支点距离不等; 重量题目是指在平衡秤两端重物重量不同,但与支点距离相同。依据重量与距离判断上述三种题目的平衡秤状态不会发生冲突,可称为简单类型。

  冲突重量题目是指平衡秤一端的重物重量更大,但其与支点距离更近; 冲突距离题目是指平衡秤一端的重量更小,但由于其与支点距离更远,所以此端会下降; 冲突平衡题目是指在平衡秤一端与支点距离更远处放上重量更小的重物,平衡秤会保持平衡。上述三种题目的共同特征是,平衡秤一端重物的重量更大,而另一端重物与支点距离更远,单纯根据重量或距离判断平衡秤的结果状态存在冲突,可称为冲突类型。

  还有一种 Siegler 没有使用的题目类型,那就是在平衡秤一端与支点距离更远处放上重量更大的重物。但这种类型的题目无法判定儿童的规则使用情况,没有区分度,所以大多平衡秤任务研究中使用的都是前面介绍的 6 类题目或子集。

  二、规则评估技术

  研究儿童完成平衡秤任务时,一个非常有挑战性的问题是确定个体所采用的具体解题策略。为此,Siegler 提出了规则评估技术(Rule Assessment Methodology,RAM) 。其依据是,理论上可以预测使用四种基本规则解决平衡秤任务的正确性。例如,使用规则Ⅰ时只考虑重物的重量信息,所以使用此规则的儿童便无法正确完成涉及距离信息的平衡秤任务。基于上述思路,可以分别预测使用四种规则解决不同平衡秤任务的正确率,如表 1 所示。

  

  表1中的预测有其理论依据,被试的实际作答可能由于猜测和失误的原因,不会与表 1 的数据完全吻合。针对实测数据中被试作答与理论预测的偏差,Siegler 使用了如下标准判断儿童在其所使用的30 题平衡秤任务测验上的规则使用情况:(1) 使用规则Ⅰ: 至少26 个题以上只依据重量信息回答,并且判断至少3个距离类型题目为平衡;(2)使用规则Ⅱ:有26个题以上的作答符合下面的情况,在两端重物重量不同的情况下只考虑重量,在两边重量相等的情况时才考虑距离,4个距离题目至少做对 3题;(3)使用规则Ⅲ: 12 个非冲突类型题目至少做对10 题,4个距离题目至少做对3题,其他18个冲突题目的回答中至少有5次不会完全依赖重量或距离度线索;(4)使用规则Ⅳ: 至少答对 26 题。

  规则评估技术从 Piaget 的临床实验方法出发,将 Piaget 的观点与平衡秤任务完成的信息加工过程相结合,以标准化的程序评定儿童的规则使用,可以避免临床观察过程中的主观性。Siegler 的规则评估技术使用的是纸笔测验来完成,与 Piaget 的个别测试相比,不仅更有效率,而且由于采用非言语方式有助于减少儿童口语报告对其作答反应的影响,以及其言语表达能力对于结果评定的影响。使用上述方法,约有 90 % 的儿童可被划归到四种规则中的一种,年龄最小的儿童使用规则Ⅰ,年龄最大的儿童使用规则。基于上述优势,规则评估技术在早期平衡秤任务研究中得到了广泛应用。

  然而,在规则评估技术的使用过程中,研究者们发现 Siegler 的规则评估技术也体现出诸多不足,可能导致误判被试的规则使用情况。这种技术的不足主要体现在如下几个方面:

  1.题目选项格式限制了被试反应。Siegler 的研究中使用的平衡秤任务包括三个选择项,被试只能在三个选择项中选择一个,这种题目形式有可能限制了被试的可能作答。有研究者通过设定特殊形式的平衡秤任务解决了此问题,基本思路是在平衡秤一端的重物有预设好的重量及其与支点的距离,儿童需要在平衡秤另一端放上研究者准备好的一些重物,以使平衡秤向指定方向倾斜或保持平衡,这样被试的作答反应便不会受到选择项的限制。Mc-Fadden 等人以上述方法构建新平衡秤任务测试了 5- 7 岁的儿童,发现原来有 70 % 的被规则评估技术归为使用规则Ⅰ的7岁儿童实际上考虑了距离方面的因素。

  2.被试可能采用其它规则。如前所述,解决平衡秤任务除 Siegler 提出的四种基本规则之外,被试也可能采用加法规则等其它策略。有研究者使用规则评估技术及纸笔形式的平衡秤任务测验,发现 15% - 30 % 不能进行分类,而且此类儿童的作答方式是一致的,说明此类儿童使用的规则不在 Siegler 的四种规则之列。所以被试可能使用四种基本规则之外的策略完成平衡秤任务,此时若使用 Siegler 的规则评估技术来评定被试的规则使用情况,就会使得对被试进行分类产生错误,将使用四种规则之外的被试误判为使用的是四本基本规则中的规则。

  3.试题的设定会影响规则的评估。若规则评估技术是稳定有效的,则无论使用何种类型的平衡秤任务,对被试规则使用情况的判定应该是一致的,但研究显示并非如此。Ferretti 和 Butterfield 设计了不同力矩之差(Torque Difference,TD) ,即平衡秤一端力矩与另一端力矩的差值,如图 1 中的力矩差为0(1 × 4 - 4 × 1) 。他们使用规则评估技术对被试的解题规则进行归类,发现: 随着力矩增大,归类为“不使用规则”或是规则Ⅰ的儿童数量减少,而使用规则Ⅳ者数量增加; 当力矩差值最大时,小学五六年级儿童中有 61 %被归类为使用规则Ⅳ,这个水平几乎与大学生使用规则Ⅳ的比例相当。

  可以看到,对儿童使用的解题规则判定与平衡秤任务设置的力矩差值有关,若测验中力矩差值较大的平衡秤任务较大,那么儿童也更可能被归类为使用更复杂的规则。所以,运用规则评估技术研究平衡秤任务的合理性与可信性受到了研究者的质疑。

  三、潜在类别分析

  针对规则评估方法的不足,一些研究者开始试图使用潜类别分析分析儿童在平衡秤任务上的规则使用情况。

  在心理学中,因素分析被广泛用于处理潜变量为连续类型、观察指标也为连续类型的数据。有时研究者感兴趣的潜变量为非连续的,并且对应的观察指标也是属于称名变量或顺序变量,此时则需要使用潜在类别分析(Latent Class Analysis) 方法。表2 总结了现代统计学中处理各种类型潜变量与对应外显变量的四类方法。

  儿童在解答平衡秤任务测验时,尽管其实际认知能力发展阶段不可直接观察,可视为潜在变量,但通过观察儿童完成平衡秤任务时的作答反应模式、出声言语等外显指标可间接地推知儿童的认知发展阶段。依 Siegler 的观点,儿童认知发展阶段反映在了其所使用的解决平衡秤任务的规则上,进而体现在具体题目上不同的作答反应(如 Siegler 采用的每道题目的三个备选项,“左倾”、“右倾”、“平衡”) 。

  因此,儿童完成平衡秤任务测验时,潜在变量与外显变量均可视为类别变量,可以认为平衡秤任务的作答数据满足潜类别分析的前提假设。

  潜类别分析方法提供了被试作答的非条件概率及条件概率。其中,非条件概率用来描述一个潜类别存在的概率,这里影响潜在类别数量的是完成平衡秤任务的各种策略; 条件概率用来描述某个潜类别中对于某个试题的选择特定选项的反应概率,通过这些条件概率可以看出各个潜在类别在某个试题中的反应特征,从而可以推断此被试群体中是否存在新的解题规则。与规则评估技术不同,潜在类别分析通过 AIC 和 BIC 等信息指标来评价数据中究竟存在多少个类别,若增加潜在类别的数量,而 AIC与 BIC 减小值却很小,则认为已有的潜在类别已经足够。潜在类别分析方法根据贝叶斯方法对被试分类。可以看出,潜在类别分析方法具有明确的统计基础,克服了传统规则评估技术的在这方面的不足,受到了研究者的广泛欢迎。

  Shulzt 和 Takane 对潜在类别分析方法与规则评估技术进行了比较,指出了潜在类别分析方法不足,这种方法不仅需要大量被试,而且与因素分析方法相似,潜在类别分析方法很难找出真实数量的潜在类别,容易产生被试数量少且难以解释的潜类。他们的观点与 Boom 等人相似,认为不应将不具有理论意义的潜在类别解释为策略。

  但 van derMaas 等人认为他们指出的缺点正是现代潜变量统计方法的优势所在,只有如此,探索性潜在类别分析才可探查到理论分析所忽略的解题策略,如加法规则。他们进一步指出,规则评估技术的拥护者忽略了重要的一点,在验证性潜在类别分析方法(Con-firmative Latent Class Analysis) 中,可以指定题目上作答的条件概率为理论上的预测值,此时只需要无条件概率,验证性潜在类别分析具有规则评估技术的全部优点,而且更加灵活、扩展性更强。

  四、总结

  尽管目前已有大量关于平衡秤任务的相关研究,但并未取得一致结论,Siegler 的研究显示,5 -20 岁的儿童中,有 96 % 的儿童使用四种基本规则;Aoki 的研究显示使用四种基本规则的被试只有 38 %,其研究被试群体来自 4 年级、6 年级学生和大学生;Chletsos 发现 70 % - 85 % 的被试能够进行分类(8 -15 岁儿童及大学生) 。

  辛自强等人使用规则评估技术对 10 - 12 岁中国儿童的研究发现 71. 6 % 的儿童使用四种基本规则,其中51. 9 %的儿童使用规则Ⅰ。根据此结果,规则Ⅰ仍是 10 -12 岁中国儿童使用的主要规则。但 Siegler 的研究显示,国外儿童使用规则Ⅰ的主要是 4、5 岁儿童。意识到国内外研究结论差异较大,赵玉等人使用潜在类别分析技术对中国儿童的研究给出了不同的看法,但国内关于平衡秤任务的研究较少,需要更多的研究验证是否存在客观差异。

  由于测量理论的进步和计算机技术的发展,复杂统计学方法得以应用在人类高级认知功能的研究。在潜在类别分析方法引入平衡任务研究中,虽然解决了规则评估技术存在的一些问题,但这两种方法有相同的假设,即儿童在作答测验的过程中,对各类题目自始至终只使用一种规则。这种关于儿童作答过程的假设过于严格,事实上,对于不同类型题目使用不同的应对策略是人类智慧行为的自然体现。Rijkes 和 Kelderman 基于 Rasch 模型提出了一种策略转换模型(Strategy Shift Model) 可以释放这一限制,但此模型较为复杂,需要估计更多的参数,导致模型识别较为困难,因此并未取得广泛应用。

  与国外相比,国内关于儿童高级认知策略方面的研究不仅在数量上较少,在方法上也亟待引入潜在类别分析等现代统计方法。新分类技术的掌握需要更多的统计学知识,对心理与教育研究者提出了更高的要求。

点此咨询学术顾问 快人一步得到答案

SCI期刊问答

回到顶部