儿童中期攻击行为测评的多质多法分析下载_在线阅读_14

is_752723

暂无简介

儿童中期攻击行为测评的多质多法分析心理学报 2011, Vol. 43, No.3, 294−307 Acta Psychologica Sinica DOI: 10.3724/SP.J.1041.2011.00294 收稿日期: 2010-04-15 * 国家自然科学基金项目(30570612、30970905)、教育部人文社科重点研究基地重大招标项目(08JJDXLX270)、全国教育科学“十一五”规划教育部重点课题(DBA070073)、全国教育科学“十一五”规划教育部青年...

心理学报 2011, Vol. 43, No.3, 294−307 Acta Psychologica Sinica DOI: 10.3724/SP.J.1041.2011.00294 收稿日期: 2010-04-15 * 国家自然科学基金项目(30570612、30970905)、教育部人文社科重点研究基地重大招标项目(08JJDXLX270)、全国教育科学“十一五”规划教育部重点课题(DBA070073)、全国教育科学“十一五”规划教育部青年专项课题(EBA080304)、山东省泰山学者设岗学科、 “十一五”强化建设重点学科(发展与教育心理学)建设经费资助项目。通讯作者: 张文新, E-mail: wxzhang01@hotmail.com 294 儿童中期攻击行为测评的多质多法分析* 王姝琼张文新陈亮李海垒李春周利娜 (山东师范大学心理学院, 济南 250014) 摘要以 2695 名

小学

小学生如何制作手抄报课件柳垭小学关于三违自查自纠报告小学英语获奖优质说课课件小学足球课教案全集小学语文新课程标准测试题

三、四

年级

六年级体育公开课教案九年级家长会课件PPT下载六年级家长会PPT课件一年级上册汉语拼音练习题六年级上册道德与法治课件

的儿童(平均年龄 10.06 ± 0.54 岁)作为被试, 使用同伴评定、同伴提名和教师评定对这些儿童的三种攻击行为(身体、言语、关系)进行了测评, 采用相关分析与结构方程模型对儿童攻击行为的多质多法数据进行统计处理。多质多法模型的分析结果显示, 三种方法对儿童攻击行为的测评具有一定的会聚效度, 但区分效度较低; 同伴测评儿童攻击行为的有效性优于教师测评, 其中同伴评定的有效性好于同伴提名。关键词儿童中期; 身体攻击; 言语攻击; 关系攻击; 多质多法分析分类号 B844 1 问题提出近来研究者指出, 以往攻击行为的研究存在测评结果之间一致性较低、研究结论相互矛盾的问题, 特别是以往研究大多使用单一测评方法或同类测评者评定儿童的攻击行为, 使得研究结论的外部效度和无偏性受到了影响 (Karver, 2006; Ladd & Kochenderfer-Ladd, 2002; Peets & Kikas, 2006)。例如 , McNeilly-Choque, Hart, Robinson, Nelson 和 Olsen (1996)研究发现, 研究者在操场上观察儿童攻击行为获得的数据与教师评定的儿童攻击行为数据间相关性较低(关系攻击: r = 0.01; 身体攻击: r = 0.30)。Archer (2004)对 78 项研究进行的元分析表明, 观察法、同伴评定和教师报告的女性关系攻击水平高于男性, 该结果与采用同伴提名和自我报告获得的研究结果不一致。由于研究者采用不同测评方法或不同报告人提供的攻击行为数据之间存在不一致性, 那么基于单一测评方法或同类测评者提供数据所获得的研究结果就难免会存在偏差, 进而影响到研究结论的外部效度。因此, 如何才能获得攻击行为的有效数据是攻击行为研究中的一个关键问题。针对不同测评方法或测评者提供的攻击行为数据间存在不一致性的问题 , Kazdin (1995)指出 , 事实上没有哪种测量能够完全摆脱来自偏见、人为和主观性因素的影响, 要想编制出一种能够完全准确地获得目标行为所有信息的测评方法是不现实的。尽管根据同类测评者提供数据获得的研究结论可能存在一些偏差, 但不同测评者是基于对特定时间和环境中儿童攻击行为的了解进行的测评, 他们提供的数据可以让研究者从不同的角度了解儿童的攻击行为(Achenbach, 1995; Loeber, Burke, Lahey, Winters, & Zera, 2000)。因此, 一些研究者开始从采用相同测评方法或测评者评价儿童的攻击行为转向采用多种测评方法或测评者对发生在不同时间和环境中的儿童攻击行为进行测评, 尽可能从多个角度获取儿童攻击行为的信息。采用多种测评方法和多类测评者获取儿童攻击行为的信息, 是实现攻击行为测评“金

标准

excel标准偏差 excel标准偏差函数 exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载

”(gold standard)的一种有效途径(Kraemer et al., 2003)。在攻击行为的研究中, 针对普通群体、大样本的被试, 研究者通常选取问卷调查法收集数据, 其他测评方 3 期王姝琼等: 儿童中期攻击行为测评的多质多法分析 295 法的可行性较差。问卷调查也包括不同的测评方式, 其中提名法和评定法是最常用的, 本研究选取了这两种测评方式。儿童的主要活动场所是家庭和学校, 因此教师、父母和同伴具备观察儿童攻击行为发生的条件, 有能力测评儿童的攻击行为, 可以作为测评者(Ladd & Kochenderfer-Ladd, 2002)。但是, 他们测评攻击行为的信效度不同。已有研究发现同伴和教师报告的儿童攻击行为之间的相关性高于两者分别与儿童自我报告之间的相关, 同伴和教师测评攻击行为的信效度也要高于儿童自身(Xie, Cairns, & Cairns, 2002)。原因可能是在大多数社会文化中, 攻击通常被定义为消极的社会行为, 社会认可度低, 因此具备一定社会

规范

编程规范下载 gsp规范下载钢格栅规范下载警徽规范下载建设厅规范下载

的儿童在期许效应的影响下, 倾向于低估自己的攻击行为。学校是儿童群体活动的主要场所, 攻击行为在同伴群体中发生的可能性较大, 因此同伴和教师比儿童的父母有更多的机会参与或观察到儿童攻击行为的发生。父母通常不会参与儿童的学校活动, 了解儿童在学校的行为表现主要通过与儿童自己和教师的交流间接实现。此外, 父母同样会受到社会期许效应的影响, 这些因素都会影响父母报告儿童攻击行为的信效度 (Underwood, Beron, & Rosen, 2009)。同伴和教师测评儿童攻击行为的客观性优于儿童自身和父母。选取同伴群体作为儿童攻击行为的测评者, 有助于行为样本容量的最大化以及减小个别测评者对评定对象可能造成的评定偏差。选取教师作为测评者是由于教师接触儿童群体的机会较多, 可以形成判断儿童行为的内隐标准, 所以许多研究选取同伴和教师作为儿童攻击行为的测评者(例如, Brendgen et al., 2008; Guerra, Huesmann, & Spindler, 2003; Murray-Close, Crick, & Galotti, 2006)。本研究同时选取同伴和教师作为儿童攻击行为的测评者。尽管同伴和教师测评儿童攻击行为都具有一定的优势, 但已有研究很少考察通过两者测评儿童攻击行为的有效性是否存在差异。有研究者指出, 儿童和青少年的行为或心理变量的测评结果会受到测评者自身因素、观察目标行为的环境和频率等许多因素的影响(Kraemer et al., 2003)。同伴和教师判断儿童攻击行为的标准, 两者与儿童的关系模式以及两者观察儿童攻击行为的时间、地点都存在差异, 这些因素都有可能造成同伴和教师测评儿童攻击行为存在不一致性。Archer (2004)的一项元分析表明, 采用教师报告的研究结果显示女生比男生有更多的关系攻击, 但采用同伴提名和儿童自我报告的研究并没有获得一致的结果。近来, 一项有关攻击行为性别差异的元分析显示, 同伴报告儿童身体和言语攻击的性别差异程度要大于教师报告的差异程度, 教师报告的女生间接攻击多于男生, 同伴报告的间接攻击则没有显著的性别差异 (Card, Stucky, Sawalani, & Little, 2008)。这些元分析的结果在一定程度上表明对儿童攻击行为的测评会受到不同测评者的影响。综上所述, 本研究的主要目的之一就是通过在一项研究中同时选取儿童攻击行为较为理想的两类测评者, 使用验证性因素分析比较同伴和教师测评儿童攻击行为有效性上的差异。尽管本研究选取的提名法和评定法都属于问卷调查, 但它们之间存在差异。提名法要求测评者从被评定群体中选出一部分符合测评内容的对象, 而评定法要求测评者对被评定群体中的每一位成员的目标行为或特质进行评定, 前者是对行为实施者的确定, 后者则是对儿童行为表现程度或频率的评定。本研究将两种测评方式与两类测评者相结合, 形成了三种测评方法, 即同伴提名、同伴评定和教师评定。以班级为单位, 同伴提名是全班同学评定出一部分同学, 同伴评定是全班同学评定同性别的所有同学, 教师评定是一个教师评定全班同学。依此, 本研究可以在一定程度上考察儿童攻击行为的测评结果受测评者因素的影响更明显, 还是受测评方式的影响更明显。此外, 已有研究指出尽管采用同伴评定测评攻击行为的信效度高, 但耗时较长、程序繁琐, 因此, 能否采用同伴提名代替同伴评定有待考察(陈光辉, 张文新, 王姝琼, 2009)。针对这一问题, 本研究通过比较同伴提名和同伴评定测评攻击行为之间的有效性以及两种测评方法之间的相关性尝试解决该问题。攻击行为的研究结论之间存在不一致性, 不仅因为各个研究的测评方法或测评者不同, 还因为攻击行为本身包括不同的亚类型。按照攻击的形式, 研究者通常将其划分为身体攻击(如打人)、言语攻击(如骂人)和关系攻击(如活动中排斥他人) (Little, Brauner, Jones, Nock, & Hawley, 2003; Crick & Grotpeter, 1995)。已有研究表明不同形式的攻击行为之间存在差异。Vitaro, Brendgen 和 Barker (2006) 在一篇关于攻击亚类型的综述文章中指出, 许多研究结果都表明从儿童早期开始身体攻击呈现下降的发展趋势, 而在同一年龄段关系攻击却呈现上升的发展趋势。另一项实证研究发现基因和环境之间 296 心理学报 43 卷的交互作用与身体攻击有联系, 但与关系攻击的联系却不密切(Brendgen et al., 2008)。其他研究结果表明, 个体早期的关系攻击与其日后的同伴关系有密切联系, 而早期的身体攻击与日后的心理适应联系更密切(Crick, Ostrov, & Werner, 2006; Ostrov, 2008)。鉴于已有研究结果表明不同类型的攻击行为在发展趋势、与相关变量的关系模式等许多方面存在本质差异, 而测评者提供的信息会受到所评定的目标行为特征的影响, 如果研究者对攻击行为的测评没有区分亚类型, 就可能混淆不同类型攻击行为的测评结果, 从而影响研究结论的准确性。因此, 本研究将攻击行为按照身体、言语和关系三种类型进行测评, 考察了同伴和教师的测评结果在三类攻击行为之间是否存在差异, 并按照不同攻击水平划分标准选取数据样本, 考察不同测评方法或测评者评定同类攻击行为的一致性和同类测评方法或测评者评定不同类型攻击行为的区分性是否随儿童攻击水平的变化而发生改变。儿童中期是身体攻击、言语攻击和关系攻击共存的年龄阶段。已有研究表明, 婴幼儿最初采用身体攻击实现自己的目的, 随着社会认知能力和言语表达能力的发展, 幼儿的言语攻击开始增多, 进入儿童期, 特别是学龄阶段以后, 儿童的社会规范性有了明显的提高, 成人对儿童行为的限制性有所增强, 儿童采用身体和言语攻击更可能受到惩罚, 因而相对比较隐蔽的关系攻击开始成为儿童一种新的攻击形式(Björkqvist, Lagerspetz, & Kaukiainen, 1992; Vitaro et al., 2006)。此外, 作为本研究测评者的同伴在逻辑思维和社会认知能力等许多方面有了很大的发展, 他们已经具备了判断和报告儿童攻击行为的能力。作为本研究测评者的小学教师与儿童的关系相对于中学教师和青少年的关系要更为亲密, 小学教师参与儿童群体活动的机会也比较多, 因此小学教师对儿童行为的了解相对比较细致、全面。基于以上原因, 本研究选取儿童中期的样本作为研究攻击行为的测评对象。对攻击行为进行多种测评方法的评定符合多质多法(MTMM, multitrait-multimethod)设计的研究思路。多质多法设计在心理学研究中的优势逐渐受到研究者们的关注, 发展心理学的许多研究也开始使用多质多法设计来收集儿童和青少年心理、行为等方面的数据, 例如, 对青少年的受欢迎性、社会适应和过失行为的研究(Allen, Porter, McFarland, Marsh, & McElhaney, 2005)、对儿童反社会行为的基因和环境因素的研究 (Baker, Jacobson, Raine, Lozano, & Bezdjian, 2007)、对儿童问题行为的测评 (Kerr, Lunkenheimer, & Olson, 2007)以及对儿童攻击行为发展的研究(Ostrov & Crick, 2007)等。多质多法设计的优势主要体现为以下几个方面：第一, 多质多法设计可以避免或降低单一测评方法或同类测评者测评造成的信息偏差或缺失; 第二, 多质多法研究获得的结论, 其推广性大于使用单一测评方法或同类测评者获得的研究结论; 第三, 采用多质多法设计可以考察数据所依托的不同测评方法和不同特质的会聚效度与区分效度, 更准确、有效地了解测量的目标行为或心理结构, 以及不同测评手段的有效性(Geiser, Eid, Nussbeck, Courvoisier, & Cole, 2010)。多质多法的研究观点由 Campbell 和 Fiske (1959)提出, 他们通过对多质多法相关矩阵的分析, 判断不同测量方法的会聚效度和不同心理特质之间的区分效度。近来一些研究者提出用验证性因素分析检验多质多法模型(Courvoisier, Nussbeck, Eid, Geiser, & Cole, 2008; Geiser et al., 2010; Kerr et al., 2007), 可以进一步了解不同测评方法评定的行为指标对各自归属的潜因子产生的影响效应, 从而更准确、全面地获取多质多法数据提供的信息 (Konold & Pianta, 2007)。此外, 研究者还可以通过建立高阶因子模型考察不同测评方法对测评变量的高阶因子的解释程度(王益文, 林崇德, 张文新, 2004)。综上所述, 本研究通过对同伴提名、同伴评定和教师评定分别提供的儿童身体攻击、言语攻击和关系攻击的数据进行多质多法分析, 探讨以下几个问题：(1)考察同伴和教师测评儿童攻击行为时, 不同测评方法测评同类攻击行为的会聚效度和同类测评方法测评不同攻击行为的区分效度; (2)比较同伴和教师测评儿童身体攻击、言语攻击和关系攻击有效性上的差异。 2 研究方法 2.1 被试本研究 2007 年选取小学三、四年级的 2695 名儿童作为被试, 其中男生 1398 人(占 51.87 %), 女生 1297 人(占 48.13 %)。被试的最大年龄为 11.42 岁, 最小年龄为 8.50 岁, 平均年龄为 10.06 ± 0.54 岁。所有被试均来自山东省济南市的 14 所小学(其中 6 所省级规范化小学, 8 所普通小学)的 50 个班 3 期王姝琼等: 儿童中期攻击行为测评的多质多法分析 297 级, 班级内人数在 26~67 人之间, 其中 32 个班级 (占 62.75 %)的人数在 50 人以上。89%的被试为独生子女。母亲平均年龄 37.08 ± 2.61 岁, 受教育水平在本科及本科以上者占 32.20%, 本科以下且高中以上者(含高中毕业生)占 54.00%, 高中以下者占 13.80 %; 父亲平均年龄 38.83 ± 3.07 岁, 受教育水平在本科及本科以上者占 44.50%, 本科以下且高中以上者(含高中毕业生)占 44.20%, 高中以下者占 11.30%。儿童所在家庭的月总收入在 1000 元以下的占 5.00%, 1000~3000 元之间的占 35.10%, 3000~6000 元之间的占 45.40%, 6000 元以上的占 14.50%。这些学生的班主任也完成了对儿童攻击行为的测评, 参与测评的教师共 50 名, 其中女教师 47 人, 男教师 3 人, 教师完成测评后, 研究者支付一定的劳务费。部分教师由于个人原因未完成所有教师评定问卷的作答 , 通过教师评定 , 我们获得了 2389 名学生的数据, 其中男生 1248 人(占 52.24%), 女生 1141 人(占 47.76%)。 2.2 研究工具 2.2.1 同伴提名问卷本研究采用同伴报告的儿童社会行为量表 (CSBS-P) 测评儿童的攻击行为 (Crick, 1997)。儿童按照问卷中每个题目描述的行为表现, 从班级里选出自己认为最符合这些描述的三名同学, 将其名字写在相应描述后面的横线上。儿童在每个题目上的被提名次数(未被提名者的次数计为零)在班级内进行标准分转换, 然后再进行统计分析。问卷有 6 个题目测量身体攻击(例如, 谁经常踢或打别的同学), 6 个题目测量关系攻击(例如, 谁经常在背后说别的同学的坏话)。已有研究表明同伴提名测评儿童攻击行为具有较好的信效度 (Brendgen et al., 2008; Khatri, Kupersmidt, & Patterson, 2000)。在本研究中, 问卷测量身体攻击和关系攻击的内部一致性信度分别是 0.96, 0.95。 2.2.2 同伴评定问卷本研究根据早期对幼儿攻击行为进行研究的观察

记录

混凝土养护记录下载土方回填监理旁站记录免费下载集备记录下载集备记录下载集备记录下载

表 (王益文等 , 2004), 编制了儿童攻击行为的同伴评定问卷。儿童按照问卷中每个题目描述的行为表现, 对班级内每位同性别同学进行评定。计算每一个受评儿童在每一个题目上被多个同伴评定得分的平均分, 将其作为该儿童在该题目上的得分, 然后进行统计分析。班级之间的学生人数不同, 班级内对每一个儿童进行评定的同伴人数范围是 10 人至 28 人。问卷有 5 个题目测量身体攻击(例如, 打、撞、踢别人), 4 个题目测量关系攻击(例如, 活动或玩的时候排斥别人), 3 个题目测量言语攻击(例如, 骂、嘲笑别人)。问卷采用 4 点记分, 0 表示“从来不这样”, 3 表示“经常这样”。在本研究中, 问卷测量身体攻击、关系攻击和言语攻击的内部一致性信度分别是 0.97, 0.95, 0.97。采用验证性因素分析考察问卷的结构效度 , 将三种攻击行为作为潜因子, 题目作为指标建立模型, 结果显示模型与数据拟合较好, χ2/df = 17.55, RMSEA = 0.078, CFI = 0.99, NNFI = 0.99。 2.2.3 教师评定问卷本研究采用 Crick 等人编制的儿童社会行为量表(教师版)测量儿童的身体和关系攻击(Crick, Casas, & Mosher, 1997)。问卷有 6 个题目测评身体攻击(例如, 踢或打别人), 5 个题目测评关系攻击(例如, 在活动或游戏时排斥别的同学), 采用 5 点记分, 0 表示“从不”, 4 表示“总是”。由于 Crick 原问卷测评关系攻击的第 4 个题目“如果某个同伴不按照他(她)的意思做, 就不邀请这个同伴参加他(她)的生日聚会”, 在本研究选取的中国儿童样本中不具有代表性, 因此被删除。该问卷在已有研究中具有较好的信效度 (Crick et al., 1997; Willoughby, Kupersmidt, & Bryant, 2001)。在本研究中, 问卷测量身体攻击和关系攻击的内部一致性信度均为 0.93。本研究采用张文新等人修订的 Olweus 儿童欺负问卷(中文版)中的部分题目测评儿童的言语攻击 (Olweus, 1993; 张文新, 武建芬, & Jones, 1999)。问卷有 3 个题目测评言语攻击(例如, 说脏话、骂人), 采用 5 点记分, 0 表示“从不”, 4 表示“总是”。在本研究中 , 问卷测量言语攻击的内部一致性信度为 0.93。本研究对包含三类攻击行为的教师问卷进行了验证性因素分析, 结果显示模型与数据拟合较好, χ2/df = 16.20, RMSEA = 0.080, CFI = 0.99, NNFI = 0.99。 2.3 施测程序本研究的主试为具有施测经验的发展心理学的研究生。施测之前, 研究者对主试进行指导语、问卷内容以及施测注意事项的专门培训。所有学生问卷的施测均取得了学校和学生家长的同意。学生问卷以班级为单位集体施测, 问卷填写约需 40 分钟, 每班由两名主试负责, 被试填写完全部问卷后由主试当场收回问卷, 没有教师在场。教师问卷的填写在学校的会议室中进行, 问卷填写一般需要 1 到 1.5 个小时, 教师填写问卷时会有主试指导。主试现场发放问卷并当场收回。 298 心理学报 43 卷 2.4 数据管理与分析本研究采用 Foxbase 2.0 录入数据与管理, 采用 SPSS 13.0 和 LISREL 8.70 对数据进行统计分析。 2.5 数据缺失值的处理同伴评定和教师评定测评的儿童攻击行为数据存在随机缺失, 本研究采用 SPSS 13.0 缺失值处理操作中的 EM 估算法分别在同伴评定和教师评定数据库中进行了缺失值处理。 3 结果分析 3.1 三种方法测评三类攻击的平均值和标准差同伴评定和教师评定测评的儿童身体攻击、言语攻击、关系攻击以及同伴提名测评的身体攻击和关系攻击的平均值和标准差见表 1, 其中同伴提名的儿童攻击行为得分是标准分。 3.2 三种方法测评三类攻击的相关分析计算同伴评定和教师评定三类攻击(身体、言语、关系)以及同伴提名所测得的身体和关系攻击的积差相关系数, 表 2 呈现了各变量之间的零阶相关矩阵。结果显示, 三种方法测评三类攻击行为的各相关系数范围在 0.35~0.92 之间, 所有相关系数均达到显著水平(ps < 0.001)。表中斜体数值表示相同测评方法评定不同类型攻击之间的相关, 同伴提名的身体和关系攻击之间的相关系数是 0.80; 同伴评定的三类攻击行为两两之间的相关系数范围在 0.86~0.92 之间; 教师评定的三类攻击行为两两之间的相关系数范围在 0.74~0.83 之间。该结果显示三种测评方法各自评定的不同类型攻击之间均具有较高的相关性。表中加粗的数值表示不同测评方法评定相同类型攻击之间的相关, 三种测评方法评定身体攻击的相关系数范围在 0.51~0.74 之间。同伴评定和教师评定测评言语攻击的相关系数是 0.52。三种测评方法评定关系攻击的相关系数范围在 0.35~0.68 之间。该结果显示三种测评方法评定同一类型攻击行为的相关性处于中等至较高水平。表 1 三种方法测评攻击的平均值(M)和标准差(SD) 身体攻击言语攻击关系攻击方法 M SD M SD M SD 同伴提名(N = 2694) 0.00 0.90 − − 0.00 0.88 同伴评定(N = 2691) 0.46 0.45 0.40 0.40 0.38 0.32 教师评定(N = 2389) 0.56 0.69 0.57 0.76 0.58 0.68 注：同伴提名的儿童攻击包括身体攻击、关系攻击; 同伴评定和教师评定的儿童攻击包括身体攻击、言语攻击、关系攻击, 下同。表 2 三种方法测评三类攻击的相关分析结果 1 2 3 4 5 6 7 8 1. PN-PHA − 2. PN-REA 0.80*** − 3. PR-PHA 0.74*** 0.63*** − 4. PR-VEA 0.69*** 0.63*** 0.92*** − 5. PR-REA 0.63*** 0.68*** 0.86*** 0.89*** − 6. TR-PHA 0.51*** 0.41*** 0.61*** 0.57*** 0.51*** − 7. TR-VEA 0.45*** 0.35*** 0.53*** 0.52*** 0.44*** 0.83*** − 8. TR-REA 0.35*** 0.35*** 0.42*** 0.40*** 0.40*** 0.80*** 0.74*** − 注：英文字母 PN 代表同伴提名, PR 代表同伴评定, TR 代表教师评定; PHA 代表身体攻击, VEA 代表言语攻击, REA 代表关系攻击。斜体数值表示相同方法测评不同攻击行为的相关结果; 加粗数值表示不同方法测评相同攻击行为的相关结果。*** p < 0.001。 3.3 儿童攻击行为多质多法模型的分析结果本研究使用 LISREL 8.70 软件处理儿童攻击行为的多质多法数据, 采用极大似然估计的方法对模型进行检验。本研究判断模型拟合采用四个指标： χ2/df, RMSEA, CFI, NNFI, 需要说明的是当样本量大于 1000 时, χ2 对判断模型与数据的拟合程度参考价值不大, 在此只作参考(Geiser et al., 2010; Kerr et al., 2007; 温忠麟, 侯杰泰, 马什赫伯特, 2004)。 3.3.1 多质多法模型的验证性因素分析结果对 3 种测评方法评定的 3 类攻击行为进行验证性因素分析, 考察多质多法模型与数据的拟合程度、因子载荷和因子之间的相关性。每种测评方法包括的测评 3 期王姝琼等: 儿童中期攻击行为测评的多质多法分析 299 题目作为模型的指标, 3 种测评方法(同伴提名、同伴评定、教师评定)作为模型的 3 个方法潜因子, 3 类攻击行为(身体、言语、关系)作为模型的 3 个特质潜因子, 模型中的每一个指标都归属于 1 个方法因子和 1 个特质因子, 方法因子之间和特质因子之间容许相关。本研究选取的是普通儿童样本, 为了更充分的揭示不同测评方法的会聚效度和测评各攻击因子的区分效度是否随儿童攻击水平的变化而发生改变, 因此分别选取全体被试、攻击得分在 1 个标准差以上的被试(使用 SPSS 统计软件计算三类测评方法分别测评各类儿童攻击行为的平均因子分, 然后将因子分转化为标准分, 其中任何一种测评方法的攻击因子得分在 1 个标准差以上均符合筛选标准)和攻击得分在 0 标准差以上的被试(筛选方法同前)共 3 个子样本数据进行验证性因素分析。同时, 考察和比较基于上述 3 个子样本建立的模型的所有指标在各自归属因子上的载荷和因子之间的相关性, 及其指标误差方差。验证性因素分析共包括 3 个模型, 模型 1(基于全体被试)、模型 2(基于攻击得分在 1 个标准差以上的被试)、模型 3(基于攻击得分在 0 标准差以上的被试)。3 个模型中, 各个指标分别在方法因子和特质因子上的载荷以及因子之间的相关系数见表 3 和表 4, 3 个模型的拟合指数见表 5。儿童攻击行为多质多法模型结构示意图如图 1 所示。从表 3 呈现的结果分析, 总体上, 同伴测评的指标在三个攻击因子上的载荷高于教师测评指标的载荷, 在三个方法因子上的载荷与教师测评指标的载荷差别不大。从三种测评方法评定三类攻击行为的误差项分析 , 对身体攻击和言语攻击的测评 , 总体上同伴评定指标的误差最低, 同伴提名指标的误差高于同伴评定, 教师评定指标的误差最高, 对关系攻击的测评, 总体上同伴提名指标和同伴评定指标的误差都低于教师评定。比较基于不同攻击划分标准建立的 3 个模型, 结果表明同伴和教师测评的儿童身体攻击以及同伴评定的儿童言语攻击的指标在攻击因子上的载荷会随攻击划分标准的提高而增加, 但教师评定的言语攻击以及同伴和教师测评的儿童关系攻击的指标在攻击因子上的载荷并没有随攻击划分标准的提高表现出规律性变化。总体上, 同伴和教师测评的儿童身体和言语攻击指标在方法因子上的载荷随攻击划分标准的提高而下降, 但同伴和教师测评的儿童关系攻击指标在方法因子上的载荷没有表现出规律性变化。三个模型的误差项没有随攻击划分标准的提高出现规律性变化。从表 4 呈现的结果分析, 3 个模型中身体攻击因子与言语攻击因子之间的相关性较高, 言语攻击因子与关系攻击因子以及身体攻击因子与关系攻击因子之间的相关性较低, 这种相关趋势在根据不同攻击划分标准建立的三个模型中基本一致。3 个模型中同伴提名因子和同伴评定因子之间的相关性明显高于同伴评定因子与教师评定因子之间的相关性, 这表明相同测评者不同测评方式测评儿童攻击行为的一致性高于相同测评方式不同测评者测评儿童攻击行为的一致性, 即相同测评者比不同测评者有更高的测评一致性, 但相同测评方式却比不同测评方式有更低的测评一致性, 这反映出测评者对儿童攻击行为测评结果的影响比测评方式明显。 3.3.2 对测评儿童攻击行为的会聚效度和区分效度的分析本研究通过分析多质多法模型的指标在因子上的载荷及比较各种嵌套模型, 考察不同测评方法测评同类攻击行为的会聚效度和相同测评方法测评不同攻击行为的区分效度。该分析单元中, 各种嵌套模型的指标相同 , 只是潜因子的设定不同。以 3.3.1 中的模型 1 作为基准模型, 比较模型 1 与嵌套模型在拟合指数上的差异。为了考察不同测评方法测评相同攻击行为的会聚效度。建立模型 4, 即设定 3 个相关的方法因子, 无特质因子。比较模型 1 和模型 4 在拟合指数上的变化(见表 5 和表 6), ∆χ2 (41) = 8906.62 (p < 0.001), ∆CFI 和 ∆NNFI 均为 0.02, 结果表明存在特质因子的模型 1 与数据的拟合情况更好, 反映出特质因子对模型拟合有贡献, 即由不同方法测量的指标也同时会聚于共同的特质因子。此外, 多质多法模型的指标在特质因子上的载荷越高表明测评的会聚效度越好, 本研究 3.3.1 部分的验证性因素分析结果显示, 随着攻击划分标准的提高, 测评身体攻击和言语攻击的指标在特质因子上的载荷也在上升, 即不同测评方法评定身体攻击和言语攻击的会聚效度在提高, 但测评关系攻击指标在特质因子上的载荷没有表现出规律性变化, 因此不同方法测评关系攻击的会聚效度变化不大(见表 3)。为了考察相同测评方法测评不同攻击行为的区分效度。建立模型 5, 设定 3 个完全相关的特质因子和三个自由相关的方法因子。比较模型 1 和模型 5 在拟合指数上的变化(见表 5 和表 6), ∆χ2 (3) = 3061.61 (p < 0.001), ∆CFI 和 ∆NNFI 均为 0.01, 结果表明存在三个自由相关特质因子的模型 1 与数据的 300 心理学报 43 卷表 3 多质多法模型的指标在特质因子和方法因子上的载荷与指标的误差方差(完全标准化解) 特质因子方法因子身体攻击言语攻击关系攻击同伴提名同伴评定教师评定误差指标 M1 M2 M3 M1 M2 M3 M1 M2 M3 M1 M2 M3 M1 M2 M3 M1 M2 M3 M1 M2 M3 PN-PHA 0.40 0.53 0.46 0.78 0.68 0.74 0.23 0.25 0.24 0.24 0.32 0.28 0.88 0.85 0.87 0.17 0.18 0.18 0.33 0.46 0.38 0.82 0.75 0.79 0.22 0.23 0.23 0.16 0.22 0.18 0.85 0.85 0.84 0.25 0.24 0.26 0.20 0.30 0.24 0.86 0.83 0.85 0.21 0.23 0.23 0.15 0.20 0.17 0.89 0.89 0.88 0.19 0.17 0.19 PR-PHA 0.59 0.70 0.67 0.77 0.66 0.70 0.06 0.08 0.07 0.54 0.64 0.60 0.81 0.74 0.76 0.05 0.05 0.06 0.52 0.63 0.53 0.82 0.74 0.76 0.07 0.06 0.07 0.26 0.33 0.31 0.88 0.85 0.85 0.16 0.17 0.18 0.22 0.29 0.27 0.91 0.89 0.89 0.12 0.13 0.14 TR-PHA 0.30 0.43 0.34 0.73 0.63 0.68 0.38 0.42 0.49 0.19 0.30 0.23 0.82 0.81 0.80 0.29 0.26 0.31 0.31 0.39 0.36 0.73 0.64 0.67 0.37 0.44 0.43 0.09 0.10 0.12 0.82 0.82 0.80 0.32 0.32 0.34 0.12 0.17 0.15 0.81 0.78 0.78 0.32 0.36 0.36 0.14 0.20 0.16 0.77 0.70 0.74 0.39 0.47 0.43 PR-VEA 0.42 0.51 0.47 0.86 0.80 0.83 0.08 0.11 0.10 0.29 0.38 0.31 0.91 0.87 0.90 0.09 0.10 0.10 0.37 0.49 0.42 0.87 0.81 0.84 0.10 0.11 0.12 TR-VEA 0.27 0.29 0.31 0.78 0.68 0.72 0.32 0.45 0.39 0.25 0.22 0.25 0.78 0.73 0.74 0.34 0.41 0.40 0.24 0.21 0.23 0.80 0.76 0.76 0.31 0.38 0.37 PN-REL 0.55 0.57 0.55 0.70 0.69 0.69 0.21 0.20 0.22 0.41 0.42 0.41 0.77 0.78 0.76 0.25 0.21 0.25 0.50 0.52 0.50 0.73 0.73 0.72 0.22 0.19 0.23 0.37 0.38 0.35 0.79 0.77 0.79 0.24 0.25 0.26 0.42 0.41 0.43 0.78 0.80 0.77 0.22 0.20 0.22 0.33 0.31 0.32 0.78 0.80 0.78 0.28 0.26 0.29 PR-REL 0.30 0.29 0.28 0.83 0.81 0.81 0.22 0.26 0.27 0.20 0.19 0.17 0.87 0.85 0.86 0.21 0.24 0.24 0.11 0.12 0.07 0.94 0.92 0.93 0.11 0.14 0.13 0.17 0.19 0.13 0.88 0.87 0.87 0.20 0.21 0.22 TR-REL 0.13 0.14 0.12 0.82 0.81 0.82 0.31 0.32 0.32 0.17 0.16 0.15 0.76 0.76 0.77 0.40 0.37 0.38 0.13 0.09 0.10 0.78 0.78 0.78 0.38 0.38 0.39 0.12 0.07 0.09 0.79 0.79 0.79 0.36 0.36 0.37 0.11 0.05 0.08 0.80 0.82 0.80 0.34 0.32 0.35 注：M1, M2, M3 分别表示模型 1 (n = 2384), 模型 2 (n = 567), 模型 3 (n = 1385), 下同。 3 期王姝琼等: 儿童中期攻击行为测评的多质多法分析 301 表 4 多质多法模型特质因子之间和方法因子之间的相关系数(完全标准化解) 特质因子方法因子身体攻击言语攻击关系攻击同伴提名同伴评定教师评定 M1 身体攻击 − 同伴提名 − 言语攻击 0.72 − 同伴评定 0.72 − 关系攻击 0.21 0.25 − 教师评定 0.45 0.52 − M2 身体攻击 − 同伴提名 − 言语攻击 0.73 − 同伴评定 0.64 − 关系攻击 0.16 0.23 − 教师评定 0.13 0.07 − M3 身体攻击 − 同伴提名 − 言语攻击 0.73 − 同伴评定 0.69 − 关系攻击 0.09 0.11 − 教师评定 0.33 0.30 − 表 5 多质多法模型和全模型的拟合指数表模型 χ2 df χ2/df RMSEA CFI NNFI M 1 (n = 2384) 5783.73 613 9.44 0.062 0.99 0.99 M 2 (n = 567) 2138.95 613 3.49 0.068 0.98 0.98 M 3 (n = 1385) 3853.31 613 6.29 0.064 0.99 0.98 M 4 (n = 2384) 14690.35 654 22.46 0.122 0.97 0.97 M 5 (n = 2384) 8845.34 616 14.36 0.073 0.98 0.98 M 6 (n = 2384) 226.52 12 18.88 0.087 0.99 0.98 图 1 儿童攻击行为多质多法模型结构示意图注：指标和误差项的实际总数量各为 38 个, 指标标签中的数字表示该指标在模型中的实际数量。拟合情况更好, 即不同攻击行为因子之间具有一定的区分效度。此外, 多质多法模型的指标在方法因子上的载荷越低, 表明测评的不同特质或行为的区分效度越好, 根据本研究 3.3.1 部分的验证性因素分析结果显示, 多质多法模型的指标在方法因子上的载荷均较高, 因此三种测评方法评定攻击行为的区分效度总体上都不是很理想。随着攻击划分标准的提高, 多质多法模型中测评身体攻击和言语攻击的指标在方法因子上的载荷表现为下降的趋势, 即测评身体攻击和言语攻击的区分效度在提高, 但测评关系攻击的指标在方法因子上的载荷没有表现出规律性的变化。 302 心理学报 43 卷表 6 多质多法模型拟合指数的比较结果模型比较 ∆χ2 ∆df ∆CFI ∆NNFI M1 vs. M4 8906.62 41 0.02 0.02 M1 vs. M5 3061.61 3 0.01 0.01 3.3.3 二阶模型的验证性因素分析结果本研究通过建立攻击行为的二阶模型, 考察一阶方法因子对二阶攻击因子的解释率。本研究将同一方法测评的每一种攻击行为的题目得分的平均分作为二阶模型的指标, 同伴提名包括身体攻击、关系攻击两个指标, 同伴评定和教师评定分别包括身体攻击、言语攻击、关系攻击三个指标, 因此模型共包含 8 个指标, 测评同一种攻击行为的指标之间容许残差相关(参考相关特质相关特性模型的设定方法), 以三种测评方法(同伴提名、同伴评定、教师评定)作为一阶因子, 8 个指标分别归属于 3 个一阶因子, 同时抽取一个二阶攻击因子, 建立二阶模型 6, 模型拟合指数见表 5。结果表明三个方法因子对攻击高阶因子的标准化回归系数和解释率分别是：同伴提名为 0.82 和 67%; 同伴评定为 0.94 和 88%; 教师评定为 0.64 和 41%, 其中同伴评定对二阶攻击因子的标准回归系数和解释率最高, 其次是同伴提名, 最后是教师评定。 4 讨论准确有效的获取儿童攻击行为的数据是形成可靠研究结论的前提。本研究对同伴和教师测评儿童中期的身体攻击、言语攻击和关系攻击的数据进行了多质多法分析。研究的主要目的是通过对儿童攻击行为多质多法模型的分析了解不同测评方法评定同类攻击行为的会聚效度和相同测评方法评定不同攻击行为的区分效度, 以及比较同伴和教师测评儿童攻击行为有效性上的差异。研究结果表明, 不同测评方法对儿童攻击行为的测评具有一定的会聚效度, 但测评不同攻击行为之间的区分效度较低; 同伴相比于教师是测评儿童攻击行为更为有效的测评者。本研究采用验证性因素分析, 考察了同伴和教师测评儿童三种攻击行为的会聚效度和区分效度。首先, 不同方法测评同类攻击行为的相关性高表明模型具有较好的会聚效度。本研究相关分析的结果表明多种测评方法测评身体攻击的相关性较高, 测评言语攻击和关系攻击的相关性相对低一些, 这说明儿童的身体攻击比言语攻击、关系攻击更具标识性、更易判断。从分析多质多法模型中指标在因子上的载荷以及比较多质多法嵌套模型的结果看, 不同测评者评定儿童的攻击行为具有一定的会聚效度, 并且随着攻击划分标准的提高, 同伴和教师测评儿童身体和言语攻击的会聚效度也在提高, 这表明当研究者所考察的儿童群体的攻击水平越高, 不同测评方法或测评者之间评定的一致性就越好, 因此, 选取同类测评方法获得儿童攻击行为有效信息的可能性也越大。反之, 当研究者考察的儿童群体的攻击水平较低时, 就需要考虑使用多种测评方法评价儿童的攻击行为, 以确保测评结果的准确性。关系攻击具有相对隐蔽和不易判断的特点, 而且不同测评者对关系攻击的定义可能存在较大的差异, 本研究发现即便攻击划分标准提高, 同伴和教师测评关系攻击的会聚效度也不会有明显的变化, 说明不同测评者对关系攻击的测评比对身体攻击、言语攻击的测评具有更明显的不一致性, 这在以往研究中也得到了证实(Ostrov & Bishop, 2008; Xie et al., 2002)。基于此结果, 研究者在考察攻击儿童群体或普通儿童群体的关系攻击时, 都应尽可能采用多种方法或多类测评者进行测评。其次, 相关分析结果表明相同方法测评的儿童身体、言语和关系攻击之间存在较高的相关性, 因而区分效度较低, 多质多法模型的方法因子载荷较高也表明测评不同攻击行为之间的区分效度总体上不高。这种攻击亚类型之间的高相关性在以往研究中也得到了证实 (Brendgen, Dionne, Girard, Boivin, Vitaro, & Pérusse, 2005; Crick et al., 2006)。此外, 本研究进行的相关分析和验证性因素分析的结果还表明, 身体攻击与言语攻击的相关性大于两者分别与关系攻击的相关性。一方面, 攻击亚类型之间的高相关性表明它们之间可能存在共发性(Björkqvist et al., 1992)。年龄幼小的儿童最初使用身体攻击来达到自己的目的, 随着言语和认知技能的发展, 他们开始学会同时使用身体和言语攻击, 并随后逐渐学会采用危险性更小、更具隐蔽性的关系攻击 (Vitaro et al., 2006)。儿童使用言语攻击的同时也会继续使用身体攻击, 关系攻击也不会完全替代身体攻击或言语攻击。另一方面, 同伴和教师在测评儿童攻击行为时可能会受到晕轮效应的影响, 使得具有一种攻击类型的儿童在其他攻击类型上的受评分数高于实际分数, 该现象也存在于有关儿童情绪适应的多质多法研究中(Geiser et al., 2010)。鉴于儿童攻击行为测评的区分效度不高, 研究者可以采用多种测评方式和多类测评者进行测评, 尽可能从多个角度来获 3 期王姝琼等: 儿童中期攻击行为测评的多质多法分析 303 取信息, 提高测评的准确性。本研究多质多法模型的验证性因素分析结果表明相同测评者不同测评方式提供的数据之间一致性高于相同测评方式不同测评者提供数据之间的一致性, 这反映出测评者对儿童攻击行为测评结果的影响比测评方式明显。尽管对儿童攻击行为的测评是按照维度划分的, 并且采用不同的测评方式, 但分析结果却明显受到测评者自身因素的影响, 而且测评者更可能是根据儿童在一定时间和情境中的表现来评分, 而不是将攻击行为看作儿童的稳定特质进行测评。一些研究者指出, 不同测评者提供的信息之间一致性不高反映出测评可能受到几种因素的影响：儿童的真实特质(行为、能力等)、儿童被观察到的情境或环境、不同测评者的视角或观点、测量的误差(Kraemer et al., 2003)。这些因素会不同程度地渗透到测评者提供的信息之中。例如, Achenbach 等人(1987)所进行的元分析表明不同测评者提供数据之间的不一致性与测评者的身份(儿童的父母、教师等)和观察到儿童行为的次数有关, 当不同测评者之间与儿童的关系相似且观察儿童行为的环境与频率相仿时, 测评者之间的一致性就比较高。然而, 需要指出的是不同测评者提供信息之间的一致性高并不表明研究设计的合理性就好, 如果不同测评者所处背景、持有的视角

本文档为【儿童中期攻击行为测评的多质多法分析】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。

儿童中期攻击行为测评的多质多法分析

热门搜索

历史搜索