心理学研究方法自学笔记
第一章 心理学研究方法的特点与发展
第一节 心理学研究方法与科学方法论
一、科学研究的一般特点和原则
1、科学研究的特点
科学研究与常识或日常经验的主要区别,就在于科学研究的系统性和有控制的特点。
(1)系统的理论框架与目的。
(2)控制的机制。
(3)严密的分析。
2、科学研究的目的与一般过程
科学研究的目的主要包括三个方面:
(1)描述对象的状况。
(2)解释对象的活动过程。
(3)预测对象将来的发展。
科学研究实际上是这样一个过程:
从各种事实中归纳出一定的理论,即从个别或特殊的知识中概括出一般性的原则、规律和定理;根据这种理论演绎出各种有关假设,即从一般的知识出发,对特殊或个别现象作出理论和假设,以进一步的事实验证这些假设,从而进入科学研究的高一级水平。
3、辨证唯物论是科学研究的指导
培根是“英国唯物主义和整个现代实验科学的真正始祖”,培根的主要著作《新工具》强调了归纳法的重要性,他对归纳的三种方法:求同法、差异法和共变法作了详细论述。
笛卡尔是唯物论的创始人,他的《方法论》一书特别重视演绎法和教学方法的作用。
辨证唯物论的认识论,严格地以自然科学和社会科学的成就为基础,越来越称为科学研究的指导。
二、心理学研究方法的作用
1、增加心理学研究的知识。
2、开阔心理学研究的思路。
3、提高评价研究的能力。
4、加强心理学的应用。
三、心理学研究方法的内容与分类
1、心理学研究方法的主要内容
(1)研究方法的发展与理论思路。
(2)研究的设计与评价。
(3)心理测量的理论与方法。
(4)研究数据的分析与研究结果的报告。
2、心理学研究方法的分类
目前比较一致的分类,把心理学研究的具体方法分成六大类:观察法、实验法、模型法、测量方法、统计方法和其他研究方法。
第二节 心理学研究方法的发展
一、早期心理学研究方法
19世纪末、20世纪初,心理学在发展中形成了许多学派,人们把这个时期称为“学派时期”。
二、心理学研究的主要范式
1、大样本研究范式
1925年,费歇尔在其经典著作《研究工作者的统计方法》中,把大样本范式引进心理学研究。
大样本范式以随机化程序选择大量被试,对他们进行较少量的心理学测试,从而检验与分析有关的心理学特征与发展过程。
大样本研究范式的基本思想是:一项研究所采用的被试越多,统计检验就越有效。
2、小样本研究范式
小样本研究范式是由斯金纳在其名著《有机体的行为》中提出的。
小样本研究范式的基本思想认为,对少量的被试进行大量的心理测定,能够对其心理活动展开有效的研究。
三、定性研究方法
所谓定量研究,是指从数量化的思路出发,运用心理量表或其他手段,对心理特征及心理活动作定量测定,并对所测得的数据进行严格的统计分析。
所谓定性研究,则是采用书面的、言语的和观察的方式,取得有关心理特征与行为表现的描述性资料,并对这些资料作出定性的分析。
目前最流行的定性方法有两种,个案分析法与文献综合法。
个案分析法,是指选在少量典型案例进行全面、深入的观察与分析。
文献综合法,是指从各种书面的、口头的方式获得有关研究对象的资料。
四、心理学研究方法发展的新特点
1、研究的现场化与多分支特点。
2、研究手段的综合化、数学化和计算机化。
第三节 现代科学方法与心理学研究
一、信息方法在心理学研究中的应用
香农在贝尔系统技术杂志上发表的题为“通讯的数学理论”的文章,标志着信息论的诞生。
信息论是由数理统计方法来研究信息处理与传递的科学,是研究通讯与控制系统中信息传递共同规律的通讯理论。
1949年,米勒和弗里克发表了“统计行为论和反应顺序”一文,标志着心理学研究中开始运用信息测量。
二、控制论方法在心理学研究中的应用
维纳创立了控制论,控制论方法已被广泛运用于心理学研究,特别是应用心理学的研究。
控制论分析方法,是以某种
来侦察系统状态的偏离,并采取步骤来矫正系统行为以消除差误,即通过反馈指导行为。
三、系统方法在心理学研究中的应用
奥地利生物学家贝塔朗菲建立了一般系统论。
所谓系统,是由许多相互联系和相互作用的各部分组成的整体或实体。
系统方法,则是一种把对象放在系统的形式中加以考察的方法。它从系统的观点出发,着重从整体与部分和与环境的相互联系、相互作用和相互制约的关系中综合和精确的考察对象,找到解决问题的最佳方法。
与系统方法密切有关的,是所谓列联方法,列联方法是一种较为具体的分析手段。它强调了系统之间关系的具体特征与模式,重视在变化的条件和具体的情况下研究对象的活动过程。
四、计算机在心理学研究中的应用
1、计算机的基本用途
在心理学研究中,计算机主要有三个方面的用途:
(1)研究数据的处理。
(2)心理学实验的操作与控制。
(3)心理过程的模拟和模型化。
2、计算机在心理学各领域研究中的应用
(1)计算机在知觉实验中的应用。
(2)计算机在心理语言学研究中的应用。
(3)计算机在临床心理学研究中的应用。
第2章 心理学研究的理论基础与思路
第一节 心理学研究与因果关系分析
一、因果关系分析的意义
心理学研究中,经常以因果关系分析的水平作为衡量研究质量的标准。
因果关系分析的水平,实际上涉及到研究所包含的控制程序。
在心理学研究中,“控制”可以包含三种含义:
一是指研究对于外部因素和实验情景的控制能力;
二是指研究对于自变量的控制程度;
三是指研究设计过程中的控制成分。
二、有关因果关系分析的若干理论
1、休谟的理论观点
英国哲学家休谟有关因果关系的理论观点,在心理学发展史上有着很重要的影响。
2、穆勒的因果关系推论的标准
穆勒对于因果关系的看法与休谟不完全相同,在某些方面可以说是前进了一部。
3、波普的理论
波普强调了否证所假定的因果关系的重要性。
4、科林伍德等的活动理论
科林伍德等许多科学哲学家提出所谓“活动理论”,以此解释因果关系。
5、海德的认识论观点
与活动理论密切有关的,是一种“进化认识论”的观点,其中比较有代表性的,是海德的归因理论。
三、心理学研究中的因果关系分析
心理学研究中因果关系分析的一些原则:
1、因果关系的可检验性。
2、因果关系的层次性。
3、因果关系的复杂性。
4、因果关系的动态特点。
第二节 心理学研究的理论构思
一、心理学研究的理论思路
1、心理学研究的一般理论观点
在心理学研究中,人们常常有意无意的运用某种一般的理论观点,主要是静态观点和动态观点。
静态的观点把心里学研究看成一种提供系统知识的活动,即发现新事实、增加新信息的活动;这种观点还把研究作为一种对所观察的心理现象进行解释的方式。
动态的观点又称为启发式观点,它强调理论和相互关联的概念图式,并以此开展进一步研究。
2、归纳与演绎
采取归纳思路,主要关心的是数据,数据是一个技术性术语,相当于平时所说的事实。
采取演绎思路的心理学研究则强调理论解释的重要性,而数据主要用来决定某些备择解释的正确性,研究者的主要精力在于提出理论解释。
3、心理学研究的理论假设
建立明确的假设,这是理论构思的重要组成部分。
理论假设是进行心理学研究时不可缺少的重要工具。
二、相互作用心理学的理论思路
传统心理学研究中,主要采取了三种理论思路和概念模型,即特征论模型、心理动力模型和情景论模型。特征论模型只重视人们的个性与智力特征;心理动力模型则主要强调人的“动态心理场”;情景论模型则主要通过环境的考察来寻找决定人们行为的主要因素。
相互作用心理学的基本观点有四个方面:
(1)个体的行为是他们与所处情景之间多方向的连续的交互作用的结果;
(2)个体在这一交互作用过程中是有意识的和主动的;
(3)在交互作用的人的方面,认识和动机因素是行为的基本决定因素;
(4)在交互作用的情景方面,情景对于个体所包含的心理学意义是重要的决定因素。
目前,相互作用心理学已从个性研究,发展到社会心理、发展心理、教育心理、临床心理和工业心理等心理学分支,成为心理学研究的基本理论思路。
三、测量理论
心理学研究的重要理论基础之一是心理测理论,即对心理特征和心理活动过程的数量化测定与分析的理论原则。
经典的测量理论与方法,起源于本世纪初斯皮尔曼的早期研究,至今有七八十年的历史。应该指出,经典测量理论形成体系,还是四五十年代的事情。古利克森的著作《心理测验的理论》和洛德的《心理测验分数的统计理论》一书,对经典测量理论做了全面、系统的阐述和分析,称为测量理论发展的重要里程碑。
第三节 理论模型的构建
一、理论模型的一般问题
1、什么是理论
理论可以粗略定义为一组解释某些现象的相互关联的陈述。陈述数目越少,能解释的现象越多,则理论越有功能。
在心理学研究中,理论主要有两种功能:
第一,理论起着组织数据的作用。
第二,理论发挥着预测功能。
2、心理学理论构建的类型和方式
(1)归纳理论
归纳理论以数据为基础,把数据反映的实际关系组织为理论原则。(代表人物:斯金纳)。
(2)演绎理论
演绎理论从理论解释出发,寻求数据以检验理论的预测。(代表人物:赫尔)。
(3)机能理论
机能式理论综合了归纳与演绎两种成分,既强调数据,又重视解释。(代表人物:费斯汀格)。
(4)模型
模型被用于指导数据的收集并作为进一步研究的框架,因此,模型的进一步发展,将越来越类似于机能理论或演绎理论。
3、理论的评价
在心理学理论的评价中,可以采用以下的标准:
(1)简洁性;(2)精确性;(3)可检验性。
二、理论模型的准确性
理论模型的准确性在很大程度上取决于研究本身的效度。
在心理学研究中,十分关心各种心理特征与行为在不同情景条件下的变化,并设法解释和预测心理活动的变化与发展,这些变化又称作“变异”。
研究表明,产生没能解释的变异的情况主要有以下三种:
(1)在研究中运用了无关的或关系很小的自变量,因而不能解释因变量的变异;
(2)在研究中没有考虑较多的、正在起作用的变量,所以没能作出比较正确的理论解释,在这种情况下,需要同时考虑多个变量;
(3)虽然在研究中正确的选择与变量,却由于对变量的测量不准确而产生了差误变异。差误变异是自变量无法解释的。
三、因果模型的构建
心理学研究的重要任务之一是发现、解释和预测变量之间的因果关系;理论模型构建的基本方面也是表述这种因果关系,或叫做因果模型。
1、运用外源变量
计量经济学研究提出,把变量区分为外源和内源变量,有利于因果模型的构思,这种思想已经被心理学家所接受和采用。
2、一般递归系统
如果变量系统中在时间t上被作为内源变量的任何变量都不能同时作为另一内源变量的原因和结果,那么这种系统就称为“一般递归系统”。
3、因果模型的条件
(1)
的理论陈述
(2)因果关系的理论假设
(3)明确的因果顺序和因果方向
(4)自抑式函数方程
(5)明确的理论边界
(6)模型的稳定性
4、构建因果模型的基本步骤
(1)提出理论构思和初步模型
(2)变量的操作化和处理
(3)以实际数据支持函数方程
(4)实际数据与结构模型相结合
第三章 心理学研究的设计
第一节 研究的类型
一、自然观察
自然观察是心理学研究中常见的研究类型,它通过对自然发生的活动的系统观察或调查,分析和研究有关的心理特征、心理过程以及主要的影响因素。
自然观察有两个显著的特点:
一是研究的对象是在自然发生与发展中的现象,并非人为的创设的情景;
二是对研究对象不施加任何干预或操纵某些因素,使所进行的观察尽可能不引人注意而影响正常活动。
自然观察有许多变式,其中最常用的是个案研究和抽样调查。
1、个案研究
一般来说,个案研究是对于单一案例或有限数目的事例所进行的全面、深入和详尽的考察和研究。
2、抽样调查
抽样调查的关键环节是取样的代表性和调查问卷设计的质量。
3、对个案研究和抽样调查的评价
个案研究和抽样调查的一个主要弱点,是这些研究一般是描述性的,不容易作出有关因果关系的推论;
个案研究的另一个弱点是难以重复研究,再现原有结果,并且容易受研究者现有的理论假设和其他主观因素的影响,从而出现偏向;
此外,个案研究一般取样比较小,限制了研究结果的可应用性和普遍意义。
一种个案研究的变式,称为“偏差个案分析”,它通过对两个背景相似而结果不同的案例的比较与分析,找出造成差异的原因,较好的克服了个案研究不易做因果关系推论的问题。
二、相关研究
相关研究是根据与研究对象有关的各宗因素之间的相互关系就对象特征和行为作出解释和预测的研究。
最常用的研究指标是皮尔逊积矩相关系数。相关研究的适用范围比较广。相关系数本身并不能说明因果关系,这是在进行相关研究时应特别注意的。
三、实验和准实验
实验和准实验是心理学研究的最重要的类型之一。
实验是对环境进行系统的操纵,从而观察这种操纵对于行为的效应的研究形式。实验的主要优点是能够对研究变量进行严格的控制,从而决定自变量的变化是否引起了因变量的差异,作出有关心理现象的因果解释。
准实验是现场条件下经常运用的研究设计,它与实验的主要区别在于,准实验中没有运用随机化程序进行被试选择和实验处理。最常用的准实验设计有“不等同对照组设计”和“间歇时间序列设计”。
四、发展研究
发展研究是从心理活动或事件的过程研究它们的发展变化,影响事件发展的各种因素及其相互关系。
1、发展研究的类型
(1)纵向研究
纵向研究是从时间纵深的发展过程来考察研究对象。
(2)横切面研究
横切面研究是指在较短时间间距中对不同的对象样本进行观察和测定,从而对各类对象作出总体分析的研究类型。
(3)趋势研究
趋势研究又称预测研究,它是在有关对象的先前情况和资料的基础上,建立某种预测模型,并在进一步的多次观察与测量中作出检验。
2、对发展研究的评价
发展研究的三种主要类型各有其优缺点。
纵向研究在一段时间里对研究对象进行了周密考察,因而适合于确定引起某些特征变化的因素,建立某种因果关系。
横切面研究可以同时研究较大样本,研究效率比较高,成本较低,费时也较少。
趋势研究的实际意义大,但要进行这种研究,需要相当水平的研究方法方面的知识,各阶段的要求比较高。
第二节 研究的步骤和
一般来说,心理学研究包括以下步骤:
课题与变量的选择,研究设计的确定,研究方法和程序的制定,研究的实施,研究结果的分析,研究结果的总结与报告。
一、研究课题与变量的选择
1、课题的选择
(1)课题的类型
(2)课题选择的标准
判断研究课题的优劣,有几条标准:
所研究的问题应该涉及两个或两个以上变量之间的关系;
所研究的问题应该尽可能明确具体;
具有通过实际研究解决问题的可能性。
2、概念和构思
概念是把不同来源的几种成分结合为单一观念的一种看法。
构思则是由于特定科学研究目的而有意识提出或采用的概念。
3、常见的变量
(1)自变量、中介变量和因变量
自变量是另一个变量变化的原因,因变量是自变量作用的结果,这两种变量一般可以直接或间接的观察。
中介变量是与有机体有关的不可观察的过程或状态,用以帮助解释自变量与因变量之间的关系,也常作为假设的构思,从可观察到的测定作出推论。
还有另一类变量称作“控制变量”,这是指实验期间保持恒定的某些潜在的自变量。
(2)干涉变量
当一个变量的系统变化可能改变其它两个变量之间的关系时,这个变量就称为干涉变量。
4、变量的操作定义
变量的操作定义是有关构思的可观察指标的具体陈述。
作出操作定义包括两个程序:
(1)确定与心理学构思有关的具体测量指标;
(2)在实际研究或实验中产生并观察该变量指标的变化,进行测量与检验。
二、确定研究设计
1、研究设计的目的和控制原则
研究设计的基本目的有两个方面:一是回答所研究的问题;二是控制研究中的变异量。
研究设计实际上具有一定的控制机制,这种控制的统计学原则是:
(1)使系统变异最大;
(2)控制外源的系统变异;
(3)使差异变异最小。
2、研究设计的标准
(1)研究设计回答了研究问题并准确的检验假设;
(2)研究设计通过不同程度的随机化,较严格的控制自变量;
(3)使研究具有一定的内部效度和外部效度。
3、研究的计划
(1)研究目的的理论框架;
(2)以往研究的考察;
(3)研究的设计与方法。
三、研究的方法和过程
1、研究的方法
(1)研究被试的取样方法:明确研究的总体、样本的大小、取样的手段等;
(2)实验处理的方法:自变量的操纵和控制方式、实验处理的实施、仪器的配备和程序的安排等;
(3)收集数据的方法:确定测量指标及其测定方法,设计相应的量表,规定数据的记录方式等;
(4)数据的统计分析方法:根据数据的特征,选择研究数据的分析方法和检验方式。
2、研究的过程
在研究过程中应注意按照研究设计行事,并随时记录研究中发生的情况。
四、研究结果的分析和总结
通过统计分析并确定变量之间的关系以后,就可以作出研究的结论。在作出结论的过程中,应该注意以下问题:
1、单一研究的局限性
2、作结论时决策差误
3、研究的结果与理论的发展
4、有待进一步研究的问题
第三节 研究的元分析
一、元分析的发展和特点
元分析是对已有研究结果的总体分析,也有人称为“总分析”。
1、元分析的发展
罗森塔尔,1976年对几百项有关实验者期望效应的研究的结果进行了综合分析。
2、元分析的特点
(1)元分析是一种定量分析
(2)元分析是一种全面的评价
(3)元分析寻求普遍性的结论
二、元分析的步骤
元分析是一项细致的工作,它主要包含四个基本步骤:
1、以往研究的检索
2、研究的分类和编码
3、研究结果的测定
4、分析与评价
三、元分析的应用
1、有关心理疗法效应的元分析(施莱辛格)
2、有关学校班级大小和学习成绩之间关系的元分析(格拉斯与史密斯)
第四章 研究的取样
第一节 取样的理论
一、取样在研究中的重要性
实践证明,取样程序不但能节省人力与物力,而且能显著的提高研究的效率。
事实上,取样还能使研究的结果更为准确、有效和可靠。
取样还能起到减少损耗、保护总体的作用。
取样是科学研究设计的重要部分,它直接关系到研究的效度,特别是外部效度。
二、总体和样本的特征
1、总体与样本
总体是指具有某些共同的、可观察特征的测量值的完整集合,它也可以是个体或者某种客体的总合。
样本是总体的子集,它是从总体选取的有限数目的成分或元素,用以代表总体。
2、样本的代表性
样本的基本条件是能够代表它所属的总体。
所谓代表性,并不一定意味着样本是其总体的缩影,不要求样本具备总体的所有关特征,而是在统计意义上获得的。
三、取样的置换型和随机化
1、取样的置换性
所谓取样置换,是指取样过程中已取样的样本成分是否返回总体,继续参加取样,这在随即取样中特别重要。
取样置换可以分成两类:置换取样和非置换取样。
当所抽选的样本成分在抽选后继续返回总体参加进一步抽选时,称为置换取样。当已抽选的样本成分不再返回总体参加下一步取样时,称为非置换取样。
2、样本空间
与取样置换性有关的一个概念是“样本空间”,指所有的取样可能性。
3、随机化
随机化是指研究中的客体、被试、实验室处理或分数等的每一成分被抽选的概率均等。
第二节 取样的程序和方法
一、取样的一般程序
一项研究究竟选择什么样的总体和样本,这取决于研究者所要达到的目的和使研究结果具有普遍意义的范围。
取样过程实际上包括三个方面:
(1)规定总体,对总体作出明确的定义;
(2)选取样本,运用恰当取样方法抽取样本;
(3)统计推论,从样本的统计数据估算出总体的有关参数。
样本可以是有偏向的或无偏向的,选取样本是取样程序的中心环节。
二、几种主要的取样方法
1、简单随机取样法
在随机取样中,总体中每一个体被抽选的机会是均等的。运用随机取样方法所选取的样本称为“随机样本”。
随机取样的一种方法是采用“抽彩法”。随机取样的另一种方法是“随机表取样法”。就是运用严格制作的随机数字表,随意的进入包含总体数目的随机数字区,选取所需要的样本数目。
随机取样又分为两类:(1)置换型随机取样;(2)非置换型随机取样。
2、分层随机取样法
分层随机取样法是先把总体分成若干层次或子总体,然后独立、随机的从每一层次选取样本。
分层随机取样与简单随机取样相比,具有三方面的优点:
(1)样本更具代表性;(2)参数估算更为准确;(3)取样更为灵活。
分层随机取样可以分成比例分成取样和非比例分成取样两种方法。
3、系统取样法
系统取样法是从总体中取一随机起点,从该起点开始选取每K项元素(个体或分数等),直至取满所需要的样本量。
4、聚类取样法
即先把总体分成若干群类,然后再各群类内进行取样。
5、非随机取样
有些研究为了某些研究目的或由于研究条件的限制,不能运用随机取样方法,而需要从总体选择具有某方面代表性的个体成分或根据一定的主观判断抽取样本。这种取样方法称为非随机取样,又称作目的性取样或计划取样。
非随机取样主要有两种:
(1)定额取样法:按特定的标准(职业、年龄、文化、性别)确定取样定额,这一方法与分成取样很相似,但主观成分较大。
(2)判断取样法:根据研究人员的需要或方便,以主观判断决定所需样本,这一方法代表性很难确定,适用于试测和可行性研究。
6、方便取样法
方便取样法是以志愿者或容易招聘的人员作为样本,而很少考虑样本的代表性。
除了上述六种主要的取样方法以外,还有一些其他的取样方法,例如:顺序取样法、穿透重复子样本法等等。
第三节 取样的误差和影响因素
一、取样的误差
1、样本均值的分布
在心理学研究中,我们把测量分数或个体的总体特征称为参数;把分数或个体的样本特征叫做统计值。因此,整个分数总体的平均值是一个参数,而样本的平均值是一个统计值。
2、均值的标准误差
均值的标准误差是指样本 均值分布的标准差。
二、样本的大小和影响因素
1、样本的大小
统计学的原理告诉我们,均值的标准差误差和样本大小之间的关系是,在足够大的样本条件下,可以在一定精确度范围内估算总体的均值。
2、影响样本大小的一些因素
(1)研究的准确性。
准确性是指样本均值与总体均值的一致程度。
(2)研究的经费和成本。
(3)总体的同质性。
一般来说,总体越是同质,就越有条件采用较小样本;总体越是异质,就越需要选取较大样本。
第五章 研究的效度
第一节 研究的内部效度
一、研究效度的概念
(1)所研究的两个或多个变量之间是否存在一定的关系?尤其是,研究的自变量与因变量之间是否有关系?
(2)如果所研究的变量之间存在一定关系,这种关系是否因果关系?
(3)如果变量之间可能存在因果关系,它所包含的具体的因果关系构思是什么?
(4)如果变量之间的因果关系构思明确,这种因果关系对于其他的成员、背景条件和时间的普遍意义如何?
以上四类问题相互关联,都涉及到研究的有效性,即研究的效度。1957年,社会心理学家坎贝尔,第一次明确的提出研究的效度问题。
研究的自变量与因变量之间的关系属于内部效度的问题;
在变量之间判断因果关系,这是统计结论效度的问题;
因果关系的构思性质,涉及到研究的构思效度;
变量之间关系的普遍意义,则是研究的外部效度问题。
二、内部效度的定义和条件
1、内部效度的定义
效度常常是指一项测验测到所要测量的东西或达到某种目的的程度,也有人叫作真实性。
研究的内部效度是指在研究的自变量和因变量之间存在关系的明确程度。
2、内部效度的条件
首先是由于正确的选择了研究的自变量和因变量;
内部效度的另一个重要条件是周密的实验和研究设计。
三、影响内部效度的因素
1、历史因素,包括前摄历史因素和后摄历史因素。
2、选择因素。
3、成熟因素。
4、研究被试的更换和淘汰。
5、测量和测试手段。
6、统计回归效应。数理统计学的基本原理告诉我们,在进行重复测量时,初测时获高、低极端分数者会在重测时倾向于向平均值偏移,即发生统计回归效应。
7、实验处理和程序。
8、多种研究条件和因素的交互作用。
上述8种主要因素,都是在研究中应特别注意控制的,最有效的途径是采用随机化程序。在心理学研究中具有较高内部效度的设计之一,是著名的“所罗门四组设计”。
第二节 研究的外部效度
一、外部效度的定义和条件
1、外部效度的定义
研究的外部定义,是指实验和研究的结果能够一般化和普遍化到其他的总体、变量条件、时间和背景中去的程度,即研究结果和实验效果的普遍性和可应用性。
一般认为,内部效度是外部效度的比较条件,但不是充分条件。
2、外部效度的条件
外部效度的要求是使研究能够代表真实世界的情况。
这种多重实验手段,是获得外部效度、提高研究结果可应用性的重要条件。
二、影响外部效度的因素
1、总体效度,这是指研究结果对于研究者最终感兴趣的总体的普遍意义。
2、自变量和因变量的定义和测试方式。
3、对测量的敏感化。
4、多重实验的干扰。
5、特异性效应。
6、试验者效应。
7、研究与实际情景的相似性。
8、被试选择和实验处理的交互作用。
第三节 统计结论效度和构思效度
一、统计结论效度
1、统计结论效度的定义和条件
统计结论效度是有关决定实验处理效应的数据分析程序的效度检验,它并不涉及系统性偏向的来源的问题,而是研究差误变异源和如何适当运用统计显著性检验的问题。
研究的统计结论效度驻澳取决于两个方面的条件:
一是数据的质量,数据分析程度的效度是以数据的质量作为基础的。
二是统计检验的假设,数据分析中所采用的各种统计方法,都有其明确的统计检验假设。
2、影响统计结论效度的因素
(1)统计功效低
(2)违反统计检验的假设
(3)测量信度低
(4)实验处理实施的可靠性
(5)研究背景中随机的无关因素
(6)被试的随机异质性
二、研究的构思效度
1、构思效度的定义和条件
研究的构思效度涉及到研究
和测量指标的理论构思及其操作化的问题,即理论构思及其转换的有效性。
为了使研究具有较高的构思效度:
首先,要求研究的理论构思结构严谨、层次分明,形成某种构思网络,并对研究中的自变量和因变量作出严格的定义。
其次,针对研究构思的特点,给予明确的操作定义,并确定相应的测量指标。
2、影响构思效度的因素
(1)对于研究构思的解释
(2)单一操作的偏向
(3)单一方法的偏向
(4)实验者期望和被试猜测
(5)构思水平之间的混淆
(6)不同实验处理的交互作用
三、四种研究效度之间的关系
研究的内部效度、外部效度、统计结论效度和构思效度,是相互联系和相互影响的。
统计结论效度实际上是内部效度的特例,它们都涉及研究本身的因果关系和统计检验的可靠性。
构思效度则与外部效度有一致之处,即它们的基本点都在于作出概括性和结果的普遍性。
构思效度与外部效度之间的主要差异是:前者所指的目标总体较难具体确定,而后者则往往要求一般化到实际上存在的特定总体、背景和时间等条件。
影响研究效度的因素多种多样,但大致可以分成四类:
(1)与被试有关的因素;
(2)测量与具体研究方法方面的因素;
(3)研究构思与程序设计因素;
(4)实验条件与不同因素的交互作用。
第六章 实验和准实验
第一节 现场研究的特点和条件
一、现场背景的特点
1、边界特点
(1)变量强度
(2)变量变化范围
(3)变量操纵的频次和持续时间
2、结构特点
(1)时间结构
(2)自然单元
(3)复杂性
二、现场研究的条件和局限
1、现场研究的情景效应
在现场研究条件下,情景是开放的、动态的,往往会产生某种情景效应。
2、研究的代表性
研究的代表性主要有两个方面:研究样本的代表性和实验处理或程序的代表性。
3、现场研究中的因果关系
现场研究中包含着众多的因素,又不易对变量作出有效的控制或操纵。
此外,多数现场研究花费多、代价高,而且不易有多组被试参加研究,这些都是它的一些局限。
三、现场研究和准实验
现场研究中最多采用的是准实验设计,不过准实验设计并不一定都是在现场进行的。
准实验设计的种类比较多,常见的有五种类型:
(1)交叉滞后组相关设计;
(2)回归间断点设计;
(3)不等同对照组设计;
(4)间歇时间序列设计;
(5)重复处理设计。
第二节 准实验设计
一、准实验设计的一般问题
准实验设计的概念,是心理学家坎贝尔和库克在讨论研究效度问题时首先提出来的。
准实验设计有以下三个方面的新动向:
1、研究方法论重点的转移
2、传统实验的局限日益明显
3、日益重视研究的质量
二、交叉滞后组相关设计(CLPC)
交叉滞后组相关设计,需要满足三个基本的假设:
(1)交叉滞后组相关所表示的因果关系不随时间的推移变化;
(2)同步相关与稳定性相关都尽可能一致,如果出现不一致,应有合理的解释;
(3)交叉滞后组相关中包含了主要的变量,并已作出相应的测量。
三、回归间断点设计
这种准实验设计通过实验处理与事后测量回归线的间断点的特征,确定准实验处理的主效应。
常见的回归间断点设计都包含着事前与事后测量,用以考察某些实验性措施的效果。
四、不等同对照组设计
不等同对照组设计是经常采用的准实验设计之一。所谓“不等同”,主要是指参加研究的各组之间至少有一种特征的“总体期望值”不相同。
不等同对照组的设计运用了对照组和事前、事后比较,大大加强了研究的内部效度。
五、间歇时间序列设计
间歇时间序列设计是在实施实验处理前后的一段时间里对研究对象作出多次重复观察或测定,并通过对整个时间序列的测定结果的比较,确定实验处理的效果。
最基本的间歇时间序列设计包括一个实验组和实验处理前后的多次观察。
第三节 实验室实验设计
一、实验室实验的一般问题
1、实验室实验的特点
(1)试验者创设情景并操纵事件或变量;
(2)通过控制手段确认变异源,包括实验操纵和统计控制两种方式;
(3)实验室环境中能最有效的运用实验控制策略。
实验室实验有许多优点,其中主要的优点是可以运用各种与实验策略有关的控制手段;同时,有条件较准确的确定变量之间的因果关系。
2、实验室实验的形式
实验室实验主要有两种形式:标准实验室实验和模拟实验。
3、实验室实验的程序
(1)有关实验程序的描述说明;
(2)训练被试;
(3)实验背景的设置。
二、被试间设计和被试内设计
在心理学实验设计中,有两种常用的分配被试的方式:
一种方式是把不同的被试分配到不同的实验条件或水平,称为被试间设计;
另一种方式把相同的被试分配到不同的条件或水平,称为被试内设计。
1、被试间设计
这种设计比较保守、安全。
2、被试内设计
实验效率比较高,但有可能产生实验处理的污染。
在被试的个体差异比较大的情况下,宜选用被试内设计;当实验处理可能造成污染时,应采用被试间设计。
三、因子式实验设计
1、因子式实验设计的一般问题
所谓“因子”,是指构成实验设计的基础变量,它不同于“因素分析”里所说的“因素”。因子主要有两种类型:顺序性和称名型。
在进行因子式试验设计时,应注意以下几个方面的问题。
(1)因子与水平的组合
(2)随机化
2、因子水平之间的交互作用
因子水平之间的交互作用分为顺序性和非顺序性两类。
3、被试间因子式实验设计
被试间因子式试验设计是让不同被试分别进入不同因子条件,从而比较实验的结果。
4、被试内因子式实验设计
被试内设计常常能节省被试并控制个体差异。由于被试在记忆能力方面的差异比较大,因而有关记忆的实验多用被试内设计。
四、小N实验设计
小N设计实际上就是小样本范式的实验设计,主要有三种类型:反转型设计、扩展式反转设计和多重基线设计。
五、拉丁方和希腊拉丁方设计
拉丁方设计原来主要用于农业研究,例如不同土壤配方的实验。其主要目的是为了控制顺序效应。
希腊拉丁方设计是以正交方式结合了两个拉丁方,使每一因素的各种水平交错在一起。
第七章 心理测试理论与测量方法
第一节 经典和现代测试理论
一、经典测试理论
经典测验理论及其方法,起源于斯皮尔满在本世纪初有关智力和智力测验的著名研究。
1、斯皮尔满的分数模型
斯皮尔满的分数模型提出,任何心理测验所得到的分数(X),都是由反映对象稳定的心理特征的真分数(T)和由随机因素造成的误差分数(e)这两种成分所构成。
这个分数模型依据三个基本假设:
(1)模型中真分数是稳定的,对相同对象多次重复测量的误差分数呈正态分布;
(2)真分数和误差分数是相互独立、互补相关的,两者之间没有显著相关。
(3)真分数和误差分数是以简单可加的方式结合在一起的。
2、经典心理测验理论的主要局限和问题
(1)测量结果特定于具体测验
(2)测量参数特定于具体样本
(3)忽视项目反应的模式
二、现代测验理论
1、潜特征测验理论
这类理论起源于上世纪20年代中期的瑟斯顿有关“心理年龄量表”的研究。
潜特征理论认为,测验成绩在不同程度上反映出人们的心理特征。这些特征是不能直接观察和测定的,所以称为潜特征。
这一理论的主要目的是,确定测量结果与那些不可观察的特征之间的关系。
潜特征测量理论有三个重要的概念。
(1)潜特征空间的维度
如果单一能力或特征可以说明测量结果,则称为单维,否则为多维。
(2)局部独立性
局部独立性是假定被测者对某一测验项目的正确回答的概率不受其他项目成绩的影响,可以用X2检验法检验项目反应的局部独立性。
(3)项目特征曲线
项目特征曲线是项目分数对于能力的回归线,它说明了从具有特定潜特征的总体随机选取的受测者作出特定反应的条件概率。
2、项目反应理论
项目反应理论是潜特征测验理论的新发展,也是目前应用最多的。这个理论指出了个体某种反应类型的概率与个体某些特征之间的关系,它的基本思想与潜特征理论其他许多模型是一致的。
项目反应理论主要有以下几个基本特征:
(1)测量指标与反应者的潜特征联系在一起
(2)用数学函数确定项目特征参数
(3)通过项目信息函数来推算测量的信度和标准误
三、现代测验理论在心理学研究中的应用
现代测验理论在心理学研究中正在得到日益广泛的应用,其中应用比较多的课题有测验项目的分析、成绩测量表和态度问卷的设计、测量项目库的设计,以及社会心理气氛和管理作风的研究,等等。
第二节 测量的信度和效度
一、测量信度和效度的概念
1、测量的信度
测量信度是指测量结果反映出系统变异的程度。
2、测量的效度
测量效度是指心理测量的有效性,即测量到的是不是需要测定的心理特征。
常用的有内容效度、同时效度、预测效度和构思效度。信度是良好效度的必要前提,却不是充分条件。
二、测量信度的评定
在评定测量信度时,需要区分两种测量误差:(1)测验内误差变异;(2)测验间误差变异。
评定测量信度的方法比较多,常用的有重测信度、等同信度、折半信度和内部一致信度等。
1、重测信度
重测信度是在一定时间间隔中运用同一测验作出重复测量所得到的信度系数。
2、等同信度
等同信度是以两组等效测验分别作出测量来评定信度系数。
3、折半信度
折半信度是在测试以后对测验项目按奇项、偶项或其他标准分成两半,分别记分,以两半分数之间的相关系数作为信度系数。
4、内部一致信度
内部一致信度是目前比较流行且效果较好的信度评定方法。
它不需要把测验项目分成两个部分,而是从测量构思层次化入手,使测量项目形成一定的内部结构,并以内部结构的一致性程度,对侧量信度作出评定。
内部异质性信度主要有两种:库德—理查森的公式20和克劳伯克的α系数。
三、测量效度的评定
1、内容效度
内容效度是指测验项目在多大程度上表示了所要测定的特征范畴。
2、预测效度
预测效度是指测验结果能够预测人们将来行为的程度。
3、同时效度
人们用测验分数与当时行为表现或工作实绩之间的相关作为效度指标,称为同时效度。
4、构思效度
构思效度就是要检验测验是不是真正测量了我们所提出的理论构思。
5、聚合效度与辨别效度
坎贝尔和菲斯克于1959年提出两种新的效度:聚合效度和辨别效度。
聚合效度是指运用不同测量方法测定同一特征或构思时测量结果相似的程度,即不同测量方式应在相同特征的测定中聚合在一起。
辨别效度是指在运用相同测量方法测定不同特征或构思时,辨别不同特征的程度,即不同特征的测量结果之间不应有高相关。
聚合效度和辨别效度的概念主要基于以下的考虑:
(1)测验总是一个“特征—方法”的单元,特征的测量总离不开一定的方法。
(2)只有通过相似性和差异性的联合测定方法,才能准确的描述和解释测量结果。
侧量效度的评定是一个理解、掌握、完善和实践心理测量的工作过程。
四、影响测量信度和效度的因素
1、影响测量信度的因素
(1)测量项目的数目
(2)测量的程序
(3)测量项目的质量
(4)测量人和受试者
2、影响测量效度的因素
(1)测验的组成
(2)测量的程序
(3)效标的特征
(4)样本与受试者特点
第三节 心理测验
一、心理测量和测验的一般问题
1、心理测量的水平
心理测量是以不同量表方式进行的,常用的有四种量表方式,也叫做心理测量的水平:称名量表、顺序量表、等距量表和等比量表。
(1)称名量表
又称类别类别,即以测量对象的类别方式记分。
(2)顺序量表
顺序量表既们有相等单维,又没有绝对零,只是要求评定人在若干个备择项目中按照一定标准排出等级次序。
(3)等距量表
等距量表有相等的单位,但没有绝对零,因而其测量水平比顺序量表提高了一步。
(4)等比量表
等比量表更进了一步,它既有相等单位又有绝对零,因而属于最高测量水平。
2、心理测验的种类
心理测验是主要借助量表对心理特征和行为进行观察和描述的系统心理测量。常用的心理测验分成两大类:
(1)最大成绩测验
这类测验用以测量人们的最大作业成绩,从而对他们所具备的能力作出评定。这种测验包括各种智力测验和技能测量,还包括成就测验。
(2)典型反应测验
这类测验不是测量人们能够干些什么,而是测定人们在特定情景中的典型行为或感受,主要包括个性、习惯、兴趣、焦虑、情绪等。
3、影响心理测验的因素
(1)测验的形式和练习因素
(2)焦虑和动机
(3)主观倾向和反应定式
(4)测验实施中的因素
二、心理测验的应用及其效果
1、一般智力测验和能力倾向测验
一般智力测验对于实际学习和工作成效的预测效度并不高,能力倾向测验的效度略高一些;某些婴儿智力测验几乎没有预测效度。
2、标准成就测验
标准成就测验主要用于教育领域。实际应用情况表明,阅读测验和数学测验比语言测验和社会研究测验效度高得多,因为前者更少受到内容和课程设置方面因素的影响。
成就测验主要用于三中目的:
(1)检查和控制教育质量;
(2)评价课程设置和培养计划;
(3)对学生进行个别诊断和评估。
3、兴趣测验
兴趣测验在单独使用时实际价值并不大,但是,如果把兴趣测验与能力倾向测验结合在一起,能够在职业选择、人员挑选和技术培训等方面提供比较有效的依据。
4、个性测验
传统个性测验主要采用自我报告和投射技术。
自我报告的的个性测验对于在学校、职业或生活方面的成功并没有多大的预测价值,主要用于诊断某些症状。
投射测验主要用于心理治疗,但是,这种测验的信度比较低,其效度一般都比较低,不易用于学校、企业等作为心理测量工具。
5、情感和态度的测量
这方面的测量多半用于问卷量表或访谈法,这方面测量的主要局限和问题,是受试者根据需要而虚构情况的倾向、设法作出符合社会要求的反应的定势、项目用词的语义问题等。
三、心理测验的项目分析
1、项目的准备
项目的特征:内容效度、难度和辨别力。
在项目和测验的试测过程中,应注意以下问题。
(1)试测的对象,应从正式测验所要应用的总体中取样,注意其代表性。
(2)试测力求正规化,使得实施过程与将来的正式测验时的情况尽可能相似。
(3)试测时,应使受试者有足够的答题时间,使结果更为可靠。
(4)在试测过程中,随时记录受试者的反应,包括答题的一般进度、题意不清之处等情况。
2、项目分析的基本步骤(略,p155)
第四节 心理物理方法和信号
法
心理物理方法是由费希纳创立的。费希纳在有关感觉阈限的研究中,设计并采用了三中方法:(1)最小变化法;(2)恒定刺激法;(3)平均误差法。我们把这三种方法称为经典心理物理法。
一些新的更好的方法中,最有意义的是坦纳和斯韦兹于1954年提出的信号检测理论和方法。
一、经典心理物理方法
1、最小变化法
最小变化法又称为极限法,这是让被试通过一系列尝试,对强度渐增或渐减的刺激作出反应,检验有关这一刺激的感觉阈限。
2、恒定刺激法
恒定刺激法又叫正误法,其主要特点是以被试在判断中正确与错误或者肯定与否定的频次与比例来决定感觉阈限。
3、平均差误法
平均差误法又叫调整法,它的特点是让被试调节比较刺激,使之与标准刺激相等或匹配,并以匹配的差误来计算感觉阈限。
二、心理物理方法的新发展
在心理物理方法的新发展中,有四个富有意义的里程碑。这就是福勒顿-卡特尔原则、瑟斯顿比较判断定律、赫尔森适应水平理论、斯蒂文斯幂函数定律。
三、信号检测法
信号检测论以统计决策论作为基础,由坦纳和斯韦兹首先应用于人的知觉研究。
根据信号检测理论,控制信号检测有两种基本心理过程:
(1)建立感觉印象
(2)决策判断
信号检测论最初应用于人的听觉检测和辨别,后来被用来研究工业检验、医疗诊断、警觉行为和信息检索系统等方面的课题。
第八章 访谈法、问卷法和观察法
第一节 访谈法和问卷法的特点和类型
一、访谈法的特点和类型
访谈法是研究者通过与研究对象的交谈来收集有关对方心理特征与行为的数据资料的研究方法。
1、研究访谈的性质
研究访谈是有研究者发动,目的在于采集与研究课题有关的信息。
这种访谈集中于研究的特定内容,以期系统的解释、描述和预测一定的心理特征或者活动。
访谈的结果往往不象心理治疗那样直接影响被访者,而是有比较长远和广泛的利益。
2、访谈法的类型
研究访谈按照提问和反应的结构方式分为不同的类型:
(1)“有结构”方式是一种有指导性的、正式的、事先决定了问题项目和反应可能性的访谈形式;
(2)“无结构”方式则是一种非指导性的、非正式的,自由提问和作出回答的访谈形式。
还有两种半结构的访谈:
(1)半结构访谈Ⅰ,要求被试自由的回答预定的访谈问题,也可以用讨论的方式作答;
(2)半结构访谈Ⅱ,按有结构的方式回答无结构的问题。
3、访谈法的优缺点
访谈法的优点:
(1)访谈法比较灵活、适用面广;
(2)访谈法能够比较有效的收集人的态度、知觉、意见等方面的资料;
(3)访谈法能够了解被访人的动机、个性和情感特点;
(4)访谈法容易建立主客双方融洽的关系。
访谈法的缺点:
(1)对访谈结果的处理和分析比较复杂,要求由专门的人员进行;
(2)访谈人的价值观、信念和偏向也会影响被访人的反应,必须事先进行适当的访谈技术训练;
(3)访谈工作比较花费时间和精力,因此代价比较高。
二、问卷法的特点和类型
问卷法不但是目前心理学研究中最经常应用的研究方法之一,也是经济学、社会学、管理科学和各种教育研究的重要方法。
1、问卷法的性质
问卷法是通过书面形式、以严格设计的心理测量项目或问题,向研究对象收集研究资料和数据的一种方法。
2、问卷法的类型
问卷法象访谈法一样,可以分为有结构和无结构问卷,问卷提问的方式决定了问卷的结构程度。
问卷法由于采用了量表形式,因此也可以用心理测量的分类方式,即称名型、顺序型、等距型和等比型问卷量表。
3、问卷法的优缺点
问卷法的优点:
(1)它比较客观统一,效率比较高,可以用团体方式进行;
(2)结果统计高度数量化、规范化;
(3)费用低,不用花很多力气去训练使用人员;
(4)在有的课题的研究中,由于问卷不记名,使得答卷人更加开放,真实的反映自己的观点和态度。
问卷法的缺点:
(1)它不够灵活,多数问卷要求以有结构的方式回答问题,使人感到不能充分说明自己的态度,有时还有由于不回答许多项目而使问卷失效;
(2)问卷法只适合具有一定文化程度的人,使得应用范围受到限制。
第二节 访谈法的设计
一、影响访谈效果的因素
1、成功访谈的条件
(1)资料的可及性
(2)被访人的认知
(3)被访人的动机
2、访谈人的影响
(1)提问方式
(2)探究方式
(3)激发动机
(4)访谈记录
此外,访谈人的注意、兴趣、倾向、记录能力等也都影响访谈的效果,在访谈过程中应当加以注意和控制。
二、访谈的信度、效度和客观性
访谈信度通常以稳定性来评估,即我们所说的重测信度。还可以用客观性来考察,“客观性”是指两个或多个访谈人在划分反应类别上的一致程度。
访谈的效度比较难确定,可以根据谈话标准计算预测效度或同时效度,也可以进行构思效度的分析。
提高访谈信度和效度最有效的办法,是对访谈人进行严格的训练,并且设法控制访谈人的个性特征对于访谈结果的影响。
三、访谈问题的设计
访谈问题的设计,首先要考虑到成功访谈的三个主要因素:信息资料的可及性、问题的认知因素以及被访人的动机。
1、开放式问题与闭合式问题
在访谈设计中究竟应采用开放式问题还是闭合式问题,应该考虑四个方面的因素:
(1)访谈的目的
(2)被访人的信息水平
(3)被访人意见的结构
(4)对被访人情况的了解程度
2、直接问题与间接问题
3、问题的组织与编排
在访谈设计时,应注意以下一些组织与编排问题:
(1)问题的编排使得问题由广泛、一般到具体,由较大问题到小问题,问题过渡自然。
(2)访谈初期的问题起说明背景、激发兴趣的作用;重要的问题放在中部,容易引起不愉快或疑惑的问题尽可能排在后面。
(3)对复杂课题,应多用复合性问题或多重问题。
第三节 问卷法的设计
一、影响问卷效果的因素
1、受试人的主观倾向
2、工具方面的因素
3、情景方面的因素
二、问卷设计的一般原则和步骤
1、问卷量表设计的层次
问卷量表的设计包含着四个层次,这就是问卷的理论构思与目的、问卷的具体形式或格式、问卷项目的语句和问卷的用词。
2、问卷设计的一般步骤
问卷设计主要包括下列步骤:
(1)根据研究目的与假设,收集所需资料;
(2)确定问卷形式;
(3)列出标题和各部分项目;
(4)征求意见,修订项目;
(5)试测,以30-50人为试测样本,求出信度、效度;
(6)进行项目分析,重新修订;
(7)正式测试。
3、问卷测量的准确性
问卷测量的准确性包括五个方面的特点:
(1)效度
(2)测量工具之间的相关
(3)同质性
(4)信度
(5)测量分数的分布
三、常用问卷量表的设计
常用的问卷量表有:总加量表法、累积量表法、一致定位量表法和语义区分量表法等。
1、总加量表法
总加量表发又称利克特量表,是由美国心理学家利克特于1932年创制的。
2、累积量表法
累积量表法由古特曼于20世纪40年代提出的。
3、一致定位量表法
一致定位量表法由瑟斯顿在20世纪20年代末提出的,是等距量表问卷设计中最常用的方法之一。
4、语义区分量表
语义区分量表是由奥斯古德、苏奇和坦嫩鲍姆等在1957年研究提出的,已在问卷设计中被广泛应用。
语义区分量表的数据分析,可以分析分为三个部分分数:概念间分析、量表间分析和被试间分析。
第四节 观察法的设计
一、观察的类型和特点
观察法是在一定时间内对特定行为表现或活动进行考察,而收集研究资料的一种方法。
1、观察法的类型
观察法可按事先是否确定具体观察项目而分成“有结构观察”和“无结构观察”;
还可以按观察者是否直接参加所研究的活动,分成“参与观察”和“非参与观察”。
观察还可以按照对行为的不同取样方式,分成“事件取样观察”和“时间取样观察”。
2、观察的特点
(1)首先要考虑的问题是究竟观察什么;
(2)观察需要确定“行为单元”,即观察测定中所用的行为成分的大小;
(3)观察推论的程度,即观察要求观察者作出多大程度的推论;
(4)观察系统的普遍性或者可应用性。
二、观察的测定
1、观察评级中的反应偏向
(1)晕轮效应,这是以对客体的一般印象而形成的恒定的评级倾向。
(2)宽大效应,这是在评级中出现过宽或过严的倾向,前者称为正宽大效应,后者叫做负宽大效应。
(3)趋中效应,这是在评级判断中避免作出极端性判断,而倾向于在量表中断打分的偏向。
2、混合标准评级量表
混合标准评级量表以行为的关键事件作为评级依据。
3、行为定位量表
行为定位量表对各行为等级以具体事例定位,定义明确,评级误差小,测量效度较高。
三、观察法的评价
1、观察法的优点
(1)观察数据比较客观、全面和准确;
(2)观察具有较多的“时间信息”;
(3)在观察