为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

儿童中期攻击行为测评的多质多法分析

2011-05-05 14页 pdf 953KB 42阅读

用户头像

is_752723

暂无简介

举报
儿童中期攻击行为测评的多质多法分析 心理学报 2011, Vol. 43, No.3, 294−307 Acta Psychologica Sinica DOI: 10.3724/SP.J.1041.2011.00294 收稿日期: 2010-04-15 * 国家自然科学基金项目(30570612、30970905)、教育部人文社科重点研究基地重大招标项目(08JJDXLX270)、全国教育科学“十一 五”规划教育部重点课题(DBA070073)、全国教育科学“十一五”规划教育部青年...
儿童中期攻击行为测评的多质多法分析
心理学报 2011, Vol. 43, No.3, 294−307 Acta Psychologica Sinica DOI: 10.3724/SP.J.1041.2011.00294 收稿日期: 2010-04-15 * 国家自然科学基金项目(30570612、30970905)、教育部人文社科重点研究基地重大招标项目(08JJDXLX270)、全国教育科学“十一 五”规划教育部重点课题(DBA070073)、全国教育科学“十一五”规划教育部青年专项课题(EBA080304)、山东省泰山学者设岗学科、 “十一五”强化建设重点学科(发展与教育心理学)建设经费资助项目。 通讯作者: 张文新, E-mail: wxzhang01@hotmail.com 294 儿童中期攻击行为测评的多质多法分析* 王姝琼 张文新 陈 亮 李海垒 李 春 周利娜 (山东师范大学心理学院, 济南 250014) 摘 要 以 2695 名三、四的儿童(平均年龄 10.06 ± 0.54 岁)作为被试, 使用同伴评定、同伴提名 和教师评定对这些儿童的三种攻击行为(身体、言语、关系)进行了测评, 采用相关分析与结构方程模型对儿 童攻击行为的多质多法数据进行统计处理。多质多法模型的分析结果显示, 三种方法对儿童攻击行为的测评 具有一定的会聚效度, 但区分效度较低; 同伴测评儿童攻击行为的有效性优于教师测评, 其中同伴评定的 有效性好于同伴提名。 关键词 儿童中期; 身体攻击; 言语攻击; 关系攻击; 多质多法分析 分类号 B844 1 问题提出 近来研究者指出, 以往攻击行为的研究存在测 评结果之间一致性较低、研究结论相互矛盾的问题, 特别是以往研究大多使用单一测评方法或同类测 评者评定儿童的攻击行为, 使得研究结论的外部效 度 和 无 偏 性 受 到 了 影 响 (Karver, 2006; Ladd & Kochenderfer-Ladd, 2002; Peets & Kikas, 2006)。例 如 , McNeilly-Choque, Hart, Robinson, Nelson 和 Olsen (1996)研究发现, 研究者在操场上观察儿童 攻击行为获得的数据与教师评定的儿童攻击行为 数据间相关性较低(关系攻击: r = 0.01; 身体攻击: r = 0.30)。Archer (2004)对 78 项研究进行的元分析 表明, 观察法、同伴评定和教师报告的女性关系攻 击水平高于男性, 该结果与采用同伴提名和自我报 告获得的研究结果不一致。由于研究者采用不同测 评方法或不同报告人提供的攻击行为数据之间存 在不一致性, 那么基于单一测评方法或同类测评者 提供数据所获得的研究结果就难免会存在偏差, 进 而影响到研究结论的外部效度。因此, 如何才能获 得攻击行为的有效数据是攻击行为研究中的一个 关键问题。 针对不同测评方法或测评者提供的攻击行为 数据间存在不一致性的问题 , Kazdin (1995)指出 , 事实上没有哪种测量能够完全摆脱来自偏见、人为 和主观性因素的影响, 要想编制出一种能够完全准 确地获得目标行为所有信息的测评方法是不现实 的。尽管根据同类测评者提供数据获得的研究结论 可能存在一些偏差, 但不同测评者是基于对特定时 间和环境中儿童攻击行为的了解进行的测评, 他们 提供的数据可以让研究者从不同的角度了解儿童 的攻击行为(Achenbach, 1995; Loeber, Burke, Lahey, Winters, & Zera, 2000)。因此, 一些研究者开始从采 用相同测评方法或测评者评价儿童的攻击行为转 向采用多种测评方法或测评者对发生在不同时间 和环境中的儿童攻击行为进行测评, 尽可能从多个 角度获取儿童攻击行为的信息。 采用多种测评方法和多类测评者获取儿童攻 击行为的信息, 是实现攻击行为测评“金”(gold standard)的一种有效途径(Kraemer et al., 2003)。在 攻击行为的研究中, 针对普通群体、大样本的被试, 研究者通常选取问卷调查法收集数据, 其他测评方 3 期 王姝琼 等: 儿童中期攻击行为测评的多质多法分析 295 法的可行性较差。问卷调查也包括不同的测评方式, 其中提名法和评定法是最常用的, 本研究选取了这 两种测评方式。儿童的主要活动场所是家庭和学校, 因此教师、父母和同伴具备观察儿童攻击行为发生 的条件, 有能力测评儿童的攻击行为, 可以作为测 评者(Ladd & Kochenderfer-Ladd, 2002)。但是, 他们 测评攻击行为的信效度不同。已有研究发现同伴和 教师报告的儿童攻击行为之间的相关性高于两者 分别与儿童自我报告之间的相关, 同伴和教师测评 攻击行为的信效度也要高于儿童自身(Xie, Cairns, & Cairns, 2002)。原因可能是在大多数社会文化中, 攻击通常被定义为消极的社会行为, 社会认可度低, 因此具备一定社会的儿童在期许效应的影响 下, 倾向于低估自己的攻击行为。学校是儿童群体 活动的主要场所, 攻击行为在同伴群体中发生的可 能性较大, 因此同伴和教师比儿童的父母有更多的 机会参与或观察到儿童攻击行为的发生。父母通常 不会参与儿童的学校活动, 了解儿童在学校的行为 表现主要通过与儿童自己和教师的交流间接实现。 此外, 父母同样会受到社会期许效应的影响, 这些 因 素 都 会 影 响 父 母 报 告 儿 童 攻 击 行 为 的 信 效 度 (Underwood, Beron, & Rosen, 2009)。同伴和教师测 评儿童攻击行为的客观性优于儿童自身和父母。选 取同伴群体作为儿童攻击行为的测评者, 有助于行 为样本容量的最大化以及减小个别测评者对评定 对象可能造成的评定偏差。选取教师作为测评者是 由于教师接触儿童群体的机会较多, 可以形成判断 儿童行为的内隐标准, 所以许多研究选取同伴和教 师作为儿童攻击行为的测评者(例如, Brendgen et al., 2008; Guerra, Huesmann, & Spindler, 2003; Murray-Close, Crick, & Galotti, 2006)。本研究同时 选取同伴和教师作为儿童攻击行为的测评者。 尽管同伴和教师测评儿童攻击行为都具有一 定的优势, 但已有研究很少考察通过两者测评儿童 攻击行为的有效性是否存在差异。有研究者指出, 儿童和青少年的行为或心理变量的测评结果会受 到测评者自身因素、观察目标行为的环境和频率等 许多因素的影响(Kraemer et al., 2003)。同伴和教师 判断儿童攻击行为的标准, 两者与儿童的关系模式 以及两者观察儿童攻击行为的时间、地点都存在差 异, 这些因素都有可能造成同伴和教师测评儿童攻 击行为存在不一致性。Archer (2004)的一项元分析 表明, 采用教师报告的研究结果显示女生比男生有 更多的关系攻击, 但采用同伴提名和儿童自我报告 的研究并没有获得一致的结果。近来, 一项有关攻 击行为性别差异的元分析显示, 同伴报告儿童身体 和言语攻击的性别差异程度要大于教师报告的差 异程度, 教师报告的女生间接攻击多于男生, 同伴 报 告 的 间 接 攻 击 则 没 有 显 著 的 性 别 差 异 (Card, Stucky, Sawalani, & Little, 2008)。这些元分析的结 果在一定程度上表明对儿童攻击行为的测评会受 到不同测评者的影响。综上所述, 本研究的主要目 的之一就是通过在一项研究中同时选取儿童攻击 行为较为理想的两类测评者, 使用验证性因素分析 比 较 同 伴 和 教 师 测 评 儿 童 攻 击 行 为 有 效 性 上 的 差异。 尽管本研究选取的提名法和评定法都属于问 卷调查, 但它们之间存在差异。提名法要求测评者 从被评定群体中选出一部分符合测评内容的对象, 而评定法要求测评者对被评定群体中的每一位成 员的目标行为或特质进行评定, 前者是对行为实施 者的确定, 后者则是对儿童行为表现程度或频率的 评定。本研究将两种测评方式与两类测评者相结合, 形成了三种测评方法, 即同伴提名、同伴评定和教 师评定。以班级为单位, 同伴提名是全班同学评定 出一部分同学, 同伴评定是全班同学评定同性别的 所有同学, 教师评定是一个教师评定全班同学。依 此, 本研究可以在一定程度上考察儿童攻击行为的 测评结果受测评者因素的影响更明显, 还是受测评 方式的影响更明显。此外, 已有研究指出尽管采用 同伴评定测评攻击行为的信效度高, 但耗时较长、 程序繁琐, 因此, 能否采用同伴提名代替同伴评定 有待考察(陈光辉, 张文新, 王姝琼, 2009)。针对这 一问题, 本研究通过比较同伴提名和同伴评定测评 攻击行为之间的有效性以及两种测评方法之间的 相关性尝试解决该问题。 攻击行为的研究结论之间存在不一致性, 不仅 因为各个研究的测评方法或测评者不同, 还因为攻 击行为本身包括不同的亚类型。按照攻击的形式, 研究者通常将其划分为身体攻击(如打人)、言语攻 击(如骂人)和关系攻击(如活动中排斥他人) (Little, Brauner, Jones, Nock, & Hawley, 2003; Crick & Grotpeter, 1995)。已有研究表明不同形式的攻击行 为之间存在差异。Vitaro, Brendgen 和 Barker (2006) 在一篇关于攻击亚类型的综述文章中指出, 许多研 究结果都表明从儿童早期开始身体攻击呈现下降 的发展趋势, 而在同一年龄段关系攻击却呈现上升 的发展趋势。另一项实证研究发现基因和环境之间 296 心 理 学 报 43 卷 的交互作用与身体攻击有联系, 但与关系攻击的联 系却不密切(Brendgen et al., 2008)。其他研究结果 表明, 个体早期的关系攻击与其日后的同伴关系有 密切联系, 而早期的身体攻击与日后的心理适应联 系更密切(Crick, Ostrov, & Werner, 2006; Ostrov, 2008)。鉴于已有研究结果表明不同类型的攻击行 为在发展趋势、与相关变量的关系模式等许多方面 存在本质差异, 而测评者提供的信息会受到所评定 的目标行为特征的影响, 如果研究者对攻击行为的 测评没有区分亚类型, 就可能混淆不同类型攻击行 为的测评结果, 从而影响研究结论的准确性。因此, 本研究将攻击行为按照身体、言语和关系三种类型 进行测评, 考察了同伴和教师的测评结果在三类攻 击行为之间是否存在差异, 并按照不同攻击水平划 分标准选取数据样本, 考察不同测评方法或测评者 评定同类攻击行为的一致性和同类测评方法或测 评者评定不同类型攻击行为的区分性是否随儿童 攻击水平的变化而发生改变。 儿童中期是身体攻击、言语攻击和关系攻击共 存的年龄阶段。已有研究表明, 婴幼儿最初采用身 体攻击实现自己的目的, 随着社会认知能力和言语 表达能力的发展, 幼儿的言语攻击开始增多, 进入 儿童期, 特别是学龄阶段以后, 儿童的社会规范性 有了明显的提高, 成人对儿童行为的限制性有所增 强, 儿童采用身体和言语攻击更可能受到惩罚, 因 而相对比较隐蔽的关系攻击开始成为儿童一种新 的攻击形式(Björkqvist, Lagerspetz, & Kaukiainen, 1992; Vitaro et al., 2006)。此外, 作为本研究测评者 的同伴在逻辑思维和社会认知能力等许多方面有 了很大的发展, 他们已经具备了判断和报告儿童攻 击行为的能力。作为本研究测评者的小学教师与儿 童的关系相对于中学教师和青少年的关系要更为 亲密, 小学教师参与儿童群体活动的机会也比较多, 因此小学教师对儿童行为的了解相对比较细致、全 面。基于以上原因, 本研究选取儿童中期的样本作 为研究攻击行为的测评对象。 对攻击行为进行多种测评方法的评定符合多 质多法(MTMM, multitrait-multimethod)设计的研究 思路。多质多法设计在心理学研究中的优势逐渐受 到研究者们的关注, 发展心理学的许多研究也开始 使用多质多法设计来收集儿童和青少年心理、行为 等方面的数据, 例如, 对青少年的受欢迎性、社会 适应和过失行为的研究(Allen, Porter, McFarland, Marsh, & McElhaney, 2005)、对儿童反社会行为的 基 因 和 环 境 因 素 的 研 究 (Baker, Jacobson, Raine, Lozano, & Bezdjian, 2007)、对儿童问题行为的测评 (Kerr, Lunkenheimer, & Olson, 2007)以及对儿童攻 击行为发展的研究(Ostrov & Crick, 2007)等。多质 多法设计的优势主要体现为以下几个方面:第一, 多质多法设计可以避免或降低单一测评方法或同 类测评者测评造成的信息偏差或缺失; 第二, 多质 多法研究获得的结论, 其推广性大于使用单一测评 方法或同类测评者获得的研究结论; 第三, 采用多 质多法设计可以考察数据所依托的不同测评方法 和不同特质的会聚效度与区分效度, 更准确、有效 地了解测量的目标行为或心理结构, 以及不同测评 手段的有效性(Geiser, Eid, Nussbeck, Courvoisier, & Cole, 2010)。 多 质 多 法 的 研 究 观 点 由 Campbell 和 Fiske (1959)提出, 他们通过对多质多法相关矩阵的分析, 判断不同测量方法的会聚效度和不同心理特质之 间的区分效度。近来一些研究者提出用验证性因素 分析检验多质多法模型(Courvoisier, Nussbeck, Eid, Geiser, & Cole, 2008; Geiser et al., 2010; Kerr et al., 2007), 可以进一步了解不同测评方法评定的行为 指标对各自归属的潜因子产生的影响效应, 从而更 准 确 、 全 面 地 获 取 多 质 多 法 数 据 提 供 的 信 息 (Konold & Pianta, 2007)。此外, 研究者还可以通过 建立高阶因子模型考察不同测评方法对测评变量 的高阶因子的解释程度(王益文, 林崇德, 张文新, 2004)。 综上所述, 本研究通过对同伴提名、同伴评定 和教师评定分别提供的儿童身体攻击、言语攻击和 关系攻击的数据进行多质多法分析, 探讨以下几个 问题:(1)考察同伴和教师测评儿童攻击行为时, 不 同测评方法测评同类攻击行为的会聚效度和同类 测评方法测评不同攻击行为的区分效度; (2)比较同 伴和教师测评儿童身体攻击、言语攻击和关系攻击 有效性上的差异。 2 研究方法 2.1 被试 本研究 2007 年选取小学三、四年级的 2695 名 儿童作为被试, 其中男生 1398 人(占 51.87 %), 女 生 1297 人(占 48.13 %)。被试的最大年龄为 11.42 岁, 最小年龄为 8.50 岁, 平均年龄为 10.06 ± 0.54 岁。所有被试均来自山东省济南市的 14 所小学(其 中 6 所省级规范化小学, 8 所普通小学)的 50 个班 3 期 王姝琼 等: 儿童中期攻击行为测评的多质多法分析 297 级, 班级内人数在 26~67 人之间, 其中 32 个班级 (占 62.75 %)的人数在 50 人以上。89%的被试为独 生子女。母亲平均年龄 37.08 ± 2.61 岁, 受教育水 平在本科及本科以上者占 32.20%, 本科以下且高 中以上者(含高中毕业生)占 54.00%, 高中以下者占 13.80 %; 父亲平均年龄 38.83 ± 3.07 岁, 受教育水 平在本科及本科以上者占 44.50%, 本科以下且高 中以上者(含高中毕业生)占 44.20%, 高中以下者占 11.30%。儿童所在家庭的月总收入在 1000 元以下 的 占 5.00%, 1000~3000 元 之 间 的 占 35.10%, 3000~6000 元之间的占 45.40%, 6000 元以上的占 14.50%。 这些学生的班主任也完成了对儿童攻击行为 的测评, 参与测评的教师共 50 名, 其中女教师 47 人, 男教师 3 人, 教师完成测评后, 研究者支付一 定的劳务费。部分教师由于个人原因未完成所有教 师评定问卷的作答 , 通过教师评定 , 我们获得了 2389 名学生的数据, 其中男生 1248 人(占 52.24%), 女生 1141 人(占 47.76%)。 2.2 研究工具 2.2.1 同伴提名问卷 本研究采用同伴报告的儿 童 社 会 行 为 量 表 (CSBS-P) 测 评 儿 童 的 攻 击 行 为 (Crick, 1997)。儿童按照问卷中每个题目描述的行 为表现, 从班级里选出自己认为最符合这些描述的 三名同学, 将其名字写在相应描述后面的横线上。 儿童在每个题目上的被提名次数(未被提名者的次 数计为零)在班级内进行标准分转换, 然后再进行 统计分析。问卷有 6 个题目测量身体攻击(例如, 谁 经常踢或打别的同学), 6 个题目测量关系攻击(例如, 谁经常在背后说别的同学的坏话)。已有研究表明 同 伴 提 名 测 评 儿 童 攻 击 行 为 具 有 较 好 的 信 效 度 (Brendgen et al., 2008; Khatri, Kupersmidt, & Patterson, 2000)。在本研究中, 问卷测量身体攻击 和关系攻击的内部一致性信度分别是 0.96, 0.95。 2.2.2 同伴评定问卷 本研究根据早期对幼儿攻 击行为进行研究的观察表 (王益文等 , 2004), 编制了儿童攻击行为的同伴评定问卷。儿童按照问 卷中每个题目描述的行为表现, 对班级内每位同性 别同学进行评定。计算每一个受评儿童在每一个题 目上被多个同伴评定得分的平均分, 将其作为该儿 童在该题目上的得分, 然后进行统计分析。班级之 间的学生人数不同, 班级内对每一个儿童进行评定 的同伴人数范围是 10 人至 28 人。问卷有 5 个题目 测量身体攻击(例如, 打、撞、踢别人), 4 个题目测 量关系攻击(例如, 活动或玩的时候排斥别人), 3 个 题目测量言语攻击(例如, 骂、嘲笑别人)。问卷采 用 4 点记分, 0 表示“从来不这样”, 3 表示“经常这 样”。在本研究中, 问卷测量身体攻击、关系攻击和 言 语 攻 击 的 内 部 一 致 性 信 度 分 别 是 0.97, 0.95, 0.97。采用验证性因素分析考察问卷的结构效度 , 将三种攻击行为作为潜因子, 题目作为指标建立模 型, 结果显示模型与数据拟合较好, χ2/df = 17.55, RMSEA = 0.078, CFI = 0.99, NNFI = 0.99。 2.2.3 教师评定问卷 本研究采用 Crick 等人编制 的儿童社会行为量表(教师版)测量儿童的身体和关 系攻击(Crick, Casas, & Mosher, 1997)。问卷有 6 个 题目测评身体攻击(例如, 踢或打别人), 5 个题目测 评关系攻击(例如, 在活动或游戏时排斥别的同学), 采用 5 点记分, 0 表示“从不”, 4 表示“总是”。由于 Crick 原问卷测评关系攻击的第 4 个题目“如果某个 同伴不按照他(她)的意思做, 就不邀请这个同伴参 加他(她)的生日聚会”, 在本研究选取的中国儿童 样本中不具有代表性, 因此被删除。该问卷在已有 研 究 中 具 有 较 好 的 信 效 度 (Crick et al., 1997; Willoughby, Kupersmidt, & Bryant, 2001)。在本研究 中, 问卷测量身体攻击和关系攻击的内部一致性信 度均为 0.93。 本研究采用张文新等人修订的 Olweus 儿童欺 负问卷(中文版)中的部分题目测评儿童的言语攻击 (Olweus, 1993; 张文新, 武建芬, & Jones, 1999)。问 卷有 3 个题目测评言语攻击(例如, 说脏话、骂人), 采用 5 点记分, 0 表示“从不”, 4 表示“总是”。在本 研究中 , 问卷测量言语攻击的内部一致性信度为 0.93。本研究对包含三类攻击行为的教师问卷进行 了验证性因素分析, 结果显示模型与数据拟合较好, χ2/df = 16.20, RMSEA = 0.080, CFI = 0.99, NNFI = 0.99。 2.3 施测程序 本研究的主试为具有施测经验的发展心理学 的研究生。施测之前, 研究者对主试进行指导语、 问卷内容以及施测注意事项的专门培训。所有学生 问卷的施测均取得了学校和学生家长的同意。学生 问卷以班级为单位集体施测, 问卷填写约需 40 分 钟, 每班由两名主试负责, 被试填写完全部问卷后 由主试当场收回问卷, 没有教师在场。教师问卷的 填写在学校的会议室中进行, 问卷填写一般需要 1 到 1.5 个小时, 教师填写问卷时会有主试指导。主 试现场发放问卷并当场收回。 298 心 理 学 报 43 卷 2.4 数据管理与分析 本研究采用 Foxbase 2.0 录入数据与管理, 采 用 SPSS 13.0 和 LISREL 8.70 对数据进行统计分析。 2.5 数据缺失值的处理 同伴评定和教师评定测评的儿童攻击行为数 据存在随机缺失, 本研究采用 SPSS 13.0 缺失值处 理操作中的 EM 估算法分别在同伴评定和教师评定 数据库中进行了缺失值处理。 3 结果分析 3.1 三种方法测评三类攻击的平均值和标准差 同伴评定和教师评定测评的儿童身体攻击、言 语攻击、关系攻击以及同伴提名测评的身体攻击和 关系攻击的平均值和标准差见表 1, 其中同伴提名 的儿童攻击行为得分是标准分。 3.2 三种方法测评三类攻击的相关分析 计算同伴评定和教师评定三类攻击(身体、言 语、关系)以及同伴提名所测得的身体和关系攻击 的积差相关系数, 表 2 呈现了各变量之间的零阶相 关矩阵。结果显示, 三种方法测评三类攻击行为的 各相关系数范围在 0.35~0.92 之间, 所有相关系数 均达到显著水平(ps < 0.001)。表中斜体数值表示相 同测评方法评定不同类型攻击之间的相关, 同伴提 名的身体和关系攻击之间的相关系数是 0.80; 同伴 评定的三类攻击行为两两之间的相关系数范围在 0.86~0.92 之间; 教师评定的三类攻击行为两两之 间的相关系数范围在 0.74~0.83 之间。该结果显示 三种测评方法各自评定的不同类型攻击之间均具 有较高的相关性。表中加粗的数值表示不同测评方 法评定相同类型攻击之间的相关, 三种测评方法评 定身体攻击的相关系数范围在 0.51~0.74 之间。同 伴评定和教师评定 测 评 言 语 攻 击 的 相 关 系 数 是 0.52。三种测评方法评定关系攻击的相关系数范围 在 0.35~0.68 之间。该结果显示三种测评方法评定 同 一 类 型 攻 击 行 为 的 相 关 性 处 于 中 等 至 较 高 水平。 表 1 三种方法测评攻击的平均值(M)和标准差(SD) 身体攻击 言语攻击 关系攻击 方法 M SD M SD M SD 同伴提名(N = 2694) 0.00 0.90 − − 0.00 0.88 同伴评定(N = 2691) 0.46 0.45 0.40 0.40 0.38 0.32 教师评定(N = 2389) 0.56 0.69 0.57 0.76 0.58 0.68 注:同伴提名的儿童攻击包括身体攻击、关系攻击; 同伴评定和教师评定的儿童攻击包括身体攻击、言语攻击、关系攻击, 下同。 表 2 三种方法测评三类攻击的相关分析结果 1 2 3 4 5 6 7 8 1. PN-PHA − 2. PN-REA 0.80*** − 3. PR-PHA 0.74*** 0.63*** − 4. PR-VEA 0.69*** 0.63*** 0.92*** − 5. PR-REA 0.63*** 0.68*** 0.86*** 0.89*** − 6. TR-PHA 0.51*** 0.41*** 0.61*** 0.57*** 0.51*** − 7. TR-VEA 0.45*** 0.35*** 0.53*** 0.52*** 0.44*** 0.83*** − 8. TR-REA 0.35*** 0.35*** 0.42*** 0.40*** 0.40*** 0.80*** 0.74*** − 注:英文字母 PN 代表同伴提名, PR 代表同伴评定, TR 代表教师评定; PHA 代表身体攻击, VEA 代表言语攻击, REA 代表关系攻击。 斜体数值表示相同方法测评不同攻击行为的相关结果; 加粗数值表示不同方法测评相同攻击行为的相关结果。*** p < 0.001。 3.3 儿童攻击行为多质多法模型的分析结果 本研究使用 LISREL 8.70 软件处理儿童攻击行 为的多质多法数据, 采用极大似然估计的方法对模 型进行检验。本研究判断模型拟合采用四个指标: χ2/df, RMSEA, CFI, NNFI, 需要说明的是当样本量 大于 1000 时, χ2 对判断模型与数据的拟合程度参考 价值不大, 在此只作参考(Geiser et al., 2010; Kerr et al., 2007; 温忠麟, 侯杰泰, 马什赫伯特, 2004)。 3.3.1 多质多法模型的验证性因素分析结果 对 3 种测评方法评定的 3 类攻击行为进行验证性因素分 析, 考察多质多法模型与数据的拟合程度、因子载 荷和因子之间的相关性。每种测评方法包括的测评 3 期 王姝琼 等: 儿童中期攻击行为测评的多质多法分析 299 题目作为模型的指标, 3 种测评方法(同伴提名、同 伴评定、教师评定)作为模型的 3 个方法潜因子, 3 类攻击行为(身体、言语、关系)作为模型的 3 个特 质潜因子, 模型中的每一个指标都归属于 1 个方法 因子和 1 个特质因子, 方法因子之间和特质因子之 间容许相关。本研究选取的是普通儿童样本, 为了 更充分的揭示不同测评方法的会聚效度和测评各 攻击因子的区分效度是否随儿童攻击水平的变化 而发生改变, 因此分别选取全体被试、攻击得分在 1 个标准差以上的被试(使用 SPSS 统计软件计算三 类测评方法分别测评各类儿童攻击行为的平均因 子分, 然后将因子分转化为标准分, 其中任何一种 测评方法的攻击因子得分在 1 个标准差以上均符合 筛选标准)和攻击得分在 0 标准差以上的被试(筛选 方法同前)共 3 个子样本数据进行验证性因素分析。 同时, 考察和比较基于上述 3 个子样本建立的模型 的所有指标在各自归属因子上的载荷和因子之间 的相关性, 及其指标误差方差。 验证性因素分析共包括 3 个模型, 模型 1(基于 全体被试)、模型 2(基于攻击得分在 1 个标准差以 上的被试)、模型 3(基于攻击得分在 0 标准差以上 的被试)。3 个模型中, 各个指标分别在方法因子和 特质因子上的载荷以及因子之间的相关系数见表 3 和表 4, 3 个模型的拟合指数见表 5。儿童攻击行为 多质多法模型结构示意图如图 1 所示。 从表 3 呈现的结果分析, 总体上, 同伴测评的 指标在三个攻击因子上的载荷高于教师测评指标 的载荷, 在三个方法因子上的载荷与教师测评指标 的载荷差别不大。从三种测评方法评定三类攻击行 为的误差项分析 , 对身体攻击和言语攻击的测评 , 总体上同伴评定指标的误差最低, 同伴提名指标的 误差高于同伴评定, 教师评定指标的误差最高, 对 关系攻击的测评, 总体上同伴提名指标和同伴评定 指标的误差都低于教师评定。比较基于不同攻击划 分标准建立的 3 个模型, 结果表明同伴和教师测评 的儿童身体攻击以及同伴评定的儿童言语攻击的指 标在攻击因子上的载荷会随攻击划分标准的提高而 增加, 但教师评定的言语攻击以及同伴和教师测评 的儿童关系攻击的指标在攻击因子上的载荷并没有 随攻击划分标准的提高表现出规律性变化。总体上, 同伴和教师测评的儿童身体和言语攻击指标在方法 因子上的载荷随攻击划分标准的提高而下降, 但同 伴和教师测评的儿童关系攻击指标在方法因子上的 载荷没有表现出规律性变化。三个模型的误差项没 有随攻击划分标准的提高出现规律性变化。 从表 4 呈现的结果分析, 3 个模型中身体攻击 因子与言语攻击因子之间的相关性较高, 言语攻击 因子与关系攻击因子以及身体攻击因子与关系攻 击因子之间的相关性较低, 这种相关趋势在根据不 同攻击划分标准建立的三个模型中基本一致。3 个 模型中同伴提名因子和同伴评定因子之间的相关 性明显高于同伴评定因子与教师评定因子之间的 相关性, 这表明相同测评者不同测评方式测评儿童 攻击行为的一致性高于相同测评方式不同测评者测 评儿童攻击行为的一致性, 即相同测评者比不同测 评者有更高的测评一致性, 但相同测评方式却比不 同测评方式有更低的测评一致性, 这反映出测评者 对儿童攻击行为测评结果的影响比测评方式明显。 3.3.2 对测评儿童攻击行为的会聚效度和区分效 度的分析 本研究通过分析多质多法模型的指标 在因子上的载荷及比较各种嵌套模型, 考察不同测 评方法测评同类攻击行为的会聚效度和相同测评 方法测评不同攻击行为的区分效度。该分析单元中, 各种嵌套模型的指标相同 , 只是潜因子的设定不 同。以 3.3.1 中的模型 1 作为基准模型, 比较模型 1 与嵌套模型在拟合指数上的差异。 为了考察不同测评方法测评相同攻击行为的 会聚效度。建立模型 4, 即设定 3 个相关的方法因 子, 无特质因子。比较模型 1 和模型 4 在拟合指数 上的变化(见表 5 和表 6), ∆χ2 (41) = 8906.62 (p < 0.001), ∆CFI 和 ∆NNFI 均为 0.02, 结果表明存在特 质因子的模型 1 与数据的拟合情况更好, 反映出特 质因子对模型拟合有贡献, 即由不同方法测量的指 标也同时会聚于共同的特质因子。此外, 多质多法 模型的指标在特质因子上的载荷越高表明测评的 会聚效度越好, 本研究 3.3.1 部分的验证性因素分 析结果显示, 随着攻击划分标准的提高, 测评身体 攻击和言语攻击的指标在特质因子上的载荷也在 上升, 即不同测评方法评定身体攻击和言语攻击的 会聚效度在提高, 但测评关系攻击指标在特质因子 上的载荷没有表现出规律性变化, 因此不同方法测 评关系攻击的会聚效度变化不大(见表 3)。 为了考察相同测评方法测评不同攻击行为的 区分效度。建立模型 5, 设定 3 个完全相关的特质 因子和三个自由相关的方法因子。比较模型 1 和模 型 5 在拟合指数上的变化(见表 5 和表 6), ∆χ2 (3) = 3061.61 (p < 0.001), ∆CFI 和 ∆NNFI 均为 0.01, 结果 表明存在三个自由相关特质因子的模型 1 与数据的 300 心 理 学 报 43 卷 表 3 多质多法模型的指标在特质因子和方法因子上的载荷与指标的误差方差(完全标准化解) 特质因子 方法因子 身体攻击 言语攻击 关系攻击 同伴提名 同伴评定 教师评定 误差 指标 M1 M2 M3 M1 M2 M3 M1 M2 M3 M1 M2 M3 M1 M2 M3 M1 M2 M3 M1 M2 M3 PN-PHA 0.40 0.53 0.46 0.78 0.68 0.74 0.23 0.25 0.24 0.24 0.32 0.28 0.88 0.85 0.87 0.17 0.18 0.18 0.33 0.46 0.38 0.82 0.75 0.79 0.22 0.23 0.23 0.16 0.22 0.18 0.85 0.85 0.84 0.25 0.24 0.26 0.20 0.30 0.24 0.86 0.83 0.85 0.21 0.23 0.23 0.15 0.20 0.17 0.89 0.89 0.88 0.19 0.17 0.19 PR-PHA 0.59 0.70 0.67 0.77 0.66 0.70 0.06 0.08 0.07 0.54 0.64 0.60 0.81 0.74 0.76 0.05 0.05 0.06 0.52 0.63 0.53 0.82 0.74 0.76 0.07 0.06 0.07 0.26 0.33 0.31 0.88 0.85 0.85 0.16 0.17 0.18 0.22 0.29 0.27 0.91 0.89 0.89 0.12 0.13 0.14 TR-PHA 0.30 0.43 0.34 0.73 0.63 0.68 0.38 0.42 0.49 0.19 0.30 0.23 0.82 0.81 0.80 0.29 0.26 0.31 0.31 0.39 0.36 0.73 0.64 0.67 0.37 0.44 0.43 0.09 0.10 0.12 0.82 0.82 0.80 0.32 0.32 0.34 0.12 0.17 0.15 0.81 0.78 0.78 0.32 0.36 0.36 0.14 0.20 0.16 0.77 0.70 0.74 0.39 0.47 0.43 PR-VEA 0.42 0.51 0.47 0.86 0.80 0.83 0.08 0.11 0.10 0.29 0.38 0.31 0.91 0.87 0.90 0.09 0.10 0.10 0.37 0.49 0.42 0.87 0.81 0.84 0.10 0.11 0.12 TR-VEA 0.27 0.29 0.31 0.78 0.68 0.72 0.32 0.45 0.39 0.25 0.22 0.25 0.78 0.73 0.74 0.34 0.41 0.40 0.24 0.21 0.23 0.80 0.76 0.76 0.31 0.38 0.37 PN-REL 0.55 0.57 0.55 0.70 0.69 0.69 0.21 0.20 0.22 0.41 0.42 0.41 0.77 0.78 0.76 0.25 0.21 0.25 0.50 0.52 0.50 0.73 0.73 0.72 0.22 0.19 0.23 0.37 0.38 0.35 0.79 0.77 0.79 0.24 0.25 0.26 0.42 0.41 0.43 0.78 0.80 0.77 0.22 0.20 0.22 0.33 0.31 0.32 0.78 0.80 0.78 0.28 0.26 0.29 PR-REL 0.30 0.29 0.28 0.83 0.81 0.81 0.22 0.26 0.27 0.20 0.19 0.17 0.87 0.85 0.86 0.21 0.24 0.24 0.11 0.12 0.07 0.94 0.92 0.93 0.11 0.14 0.13 0.17 0.19 0.13 0.88 0.87 0.87 0.20 0.21 0.22 TR-REL 0.13 0.14 0.12 0.82 0.81 0.82 0.31 0.32 0.32 0.17 0.16 0.15 0.76 0.76 0.77 0.40 0.37 0.38 0.13 0.09 0.10 0.78 0.78 0.78 0.38 0.38 0.39 0.12 0.07 0.09 0.79 0.79 0.79 0.36 0.36 0.37 0.11 0.05 0.08 0.80 0.82 0.80 0.34 0.32 0.35 注:M1, M2, M3 分别表示模型 1 (n = 2384), 模型 2 (n = 567), 模型 3 (n = 1385), 下同。 3 期 王姝琼 等: 儿童中期攻击行为测评的多质多法分析 301 表 4 多质多法模型特质因子之间和方法因子之间的相关系数(完全标准化解) 特质因子 方法因子 身体攻击 言语攻击 关系攻击 同伴提名 同伴评定 教师评定 M1 身体攻击 − 同伴提名 − 言语攻击 0.72 − 同伴评定 0.72 − 关系攻击 0.21 0.25 − 教师评定 0.45 0.52 − M2 身体攻击 − 同伴提名 − 言语攻击 0.73 − 同伴评定 0.64 − 关系攻击 0.16 0.23 − 教师评定 0.13 0.07 − M3 身体攻击 − 同伴提名 − 言语攻击 0.73 − 同伴评定 0.69 − 关系攻击 0.09 0.11 − 教师评定 0.33 0.30 − 表 5 多质多法模型和全模型的拟合指数表 模型 χ2 df χ2/df RMSEA CFI NNFI M 1 (n = 2384) 5783.73 613 9.44 0.062 0.99 0.99 M 2 (n = 567) 2138.95 613 3.49 0.068 0.98 0.98 M 3 (n = 1385) 3853.31 613 6.29 0.064 0.99 0.98 M 4 (n = 2384) 14690.35 654 22.46 0.122 0.97 0.97 M 5 (n = 2384) 8845.34 616 14.36 0.073 0.98 0.98 M 6 (n = 2384) 226.52 12 18.88 0.087 0.99 0.98 图 1 儿童攻击行为多质多法模型结构示意图 注:指标和误差项的实际总数量各为 38 个, 指标标签中的数字表示该指标在模型中的实际数量。 拟合情况更好, 即不同攻击行为因子之间具有一定 的区分效度。此外, 多质多法模型的指标在方法因 子上的载荷越低, 表明测评的不同特质或行为的区 分效度越好, 根据本研究 3.3.1 部分的验证性因素 分析结果显示, 多质多法模型的指标在方法因子上 的载荷均较高, 因此三种测评方法评定攻击行为的 区分效度总体上都不是很理想。随着攻击划分标准 的提高, 多质多法模型中测评身体攻击和言语攻击 的指标在方法因子上的载荷表现为下降的趋势, 即 测评身体攻击和言语攻击的区分效度在提高, 但测 评关系攻击的指标在方法因子上的载荷没有表现 出规律性的变化。 302 心 理 学 报 43 卷 表 6 多质多法模型拟合指数的比较结果 模型比较 ∆χ2 ∆df ∆CFI ∆NNFI M1 vs. M4 8906.62 41 0.02 0.02 M1 vs. M5 3061.61 3 0.01 0.01 3.3.3 二阶模型的验证性因素分析结果 本研究 通过建立攻击行为的二阶模型, 考察一阶方法因子 对二阶攻击因子的解释率。本研究将同一方法测评 的每一种攻击行为的题目得分的平均分作为二阶 模型的指标, 同伴提名包括身体攻击、关系攻击两 个指标, 同伴评定和教师评定分别包括身体攻击、 言语攻击、关系攻击三个指标, 因此模型共包含 8 个指标, 测评同一种攻击行为的指标之间容许残差 相关(参考相关特质相关特性模型的设定方法), 以 三种测评方法(同伴提名、同伴评定、教师评定)作 为一阶因子, 8 个指标分别归属于 3 个一阶因子, 同 时抽取一个二阶攻击因子, 建立二阶模型 6, 模型 拟合指数见表 5。结果表明三个方法因子对攻击高 阶因子的标准化回归系数和解释率分别是:同伴提 名为 0.82 和 67%; 同伴评定为 0.94 和 88%; 教师评 定为 0.64 和 41%, 其中同伴评定对二阶攻击因子的 标准回归系数和解释率最高, 其次是同伴提名, 最 后是教师评定。 4 讨论 准确有效的获取儿童攻击行为的数据是形成 可靠研究结论的前提。本研究对同伴和教师测评儿 童中期的身体攻击、言语攻击和关系攻击的数据进 行了多质多法分析。研究的主要目的是通过对儿童 攻击行为多质多法模型的分析了解不同测评方法 评定同类攻击行为的会聚效度和相同测评方法评 定不同攻击行为的区分效度, 以及比较同伴和教师 测评儿童攻击行为有效性上的差异。研究结果表明, 不同测评方法对儿童攻击行为的测评具有一定的 会聚效度, 但测评不同攻击行为之间的区分效度较 低; 同伴相比于教师是测评儿童攻击行为更为有效 的测评者。 本研究采用验证性因素分析, 考察了同伴和教 师测评儿童三种攻击行为的会聚效度和区分效度。 首先, 不同方法测评同类攻击行为的相关性高表明 模型具有较好的会聚效度。本研究相关分析的结果 表明多种测评方法测评身体攻击的相关性较高, 测 评言语攻击和关系攻击的相关性相对低一些, 这说 明儿童的身体攻击比言语攻击、关系攻击更具标识 性、更易判断。从分析多质多法模型中指标在因子 上的载荷以及比较多质多法嵌套模型的结果看, 不 同测评者评定儿童的攻击行为具有一定的会聚效 度, 并且随着攻击划分标准的提高, 同伴和教师测 评儿童身体和言语攻击的会聚效度也在提高, 这表 明当研究者所考察的儿童群体的攻击水平越高, 不 同测评方法或测评者之间评定的一致性就越好, 因 此, 选取同类测评方法获得儿童攻击行为有效信息 的可能性也越大。反之, 当研究者考察的儿童群体 的攻击水平较低时, 就需要考虑使用多种测评方法 评价儿童的攻击行为, 以确保测评结果的准确性。 关系攻击具有相对隐蔽和不易判断的特点, 而且不 同测评者对关系攻击的定义可能存在较大的差异, 本研究发现即便攻击划分标准提高, 同伴和教师测 评关系攻击的会聚效度也不会有明显的变化, 说明 不同测评者对关系攻击的测评比对身体攻击、言语 攻击的测评具有更明显的不一致性, 这在以往研究 中也得到了证实(Ostrov & Bishop, 2008; Xie et al., 2002)。基于此结果, 研究者在考察攻击儿童群体或 普通儿童群体的关系攻击时, 都应尽可能采用多种 方法或多类测评者进行测评。其次, 相关分析结果 表明相同方法测评的儿童身体、言语和关系攻击之 间存在较高的相关性, 因而区分效度较低, 多质多 法模型的方法因子载荷较高也表明测评不同攻击 行为之间的区分效度总体上不高。这种攻击亚类型 之 间 的 高 相 关 性 在 以 往 研 究 中 也 得 到 了 证 实 (Brendgen, Dionne, Girard, Boivin, Vitaro, & Pérusse, 2005; Crick et al., 2006)。此外, 本研究进行的相关 分析和验证性因素分析的结果还表明, 身体攻击与 言语攻击的相关性大于两者分别与关系攻击的相 关性。一方面, 攻击亚类型之间的高相关性表明它 们之间可能存在共发性(Björkqvist et al., 1992)。年 龄幼小的儿童最初使用身体攻击来达到自己的目 的, 随着言语和认知技能的发展, 他们开始学会同 时使用身体和言语攻击, 并随后逐渐学会采用危险 性 更 小 、 更 具 隐 蔽 性 的 关 系 攻 击 (Vitaro et al., 2006)。儿童使用言语攻击的同时也会继续使用身 体攻击, 关系攻击也不会完全替代身体攻击或言语 攻击。另一方面, 同伴和教师在测评儿童攻击行为 时可能会受到晕轮效应的影响, 使得具有一种攻击 类型的儿童在其他攻击类型上的受评分数高于实 际分数, 该现象也存在于有关儿童情绪适应的多质 多法研究中(Geiser et al., 2010)。鉴于儿童攻击行为 测评的区分效度不高, 研究者可以采用多种测评方 式和多类测评者进行测评, 尽可能从多个角度来获 3 期 王姝琼 等: 儿童中期攻击行为测评的多质多法分析 303 取信息, 提高测评的准确性。 本研究多质多法模型的验证性因素分析结果 表明相同测评者不同测评方式提供的数据之间一 致性高于相同测评方式不同测评者提供数据之间 的一致性, 这反映出测评者对儿童攻击行为测评结 果的影响比测评方式明显。尽管对儿童攻击行为的 测评是按照维度划分的, 并且采用不同的测评方式, 但分析结果却明显受到测评者自身因素的影响, 而 且测评者更可能是根据儿童在一定时间和情境中 的表现来评分, 而不是将攻击行为看作儿童的稳定 特质进行测评。一些研究者指出, 不同测评者提供 的信息之间一致性不高反映出测评可能受到几种 因素的影响:儿童的真实特质(行为、能力等)、儿 童被观察到的情境或环境、不同测评者的视角或观 点、测量的误差(Kraemer et al., 2003)。这些因素会 不同程度地渗透到测评者提供的信息之中。例如, Achenbach 等人(1987)所进行的元分析表明不同测 评者提供数据之间的不一致性与测评者的身份(儿 童的父母、教师等)和观察到儿童行为的次数有关, 当不同测评者之间与儿童的关系相似且观察儿童 行为的环境与频率相仿时, 测评者之间的一致性就 比较高。然而, 需要指出的是不同测评者提供信息 之间的一致性高并不表明研究设计的合理性就好, 如果不同测评者所处背景、持有的视角
/
本文档为【儿童中期攻击行为测评的多质多法分析】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索