为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

社会学研究方法教程》笔记

2017-09-28 50页 doc 316KB 24阅读

用户头像

is_963767

暂无简介

举报
社会学研究方法教程》笔记社会学研究方法教程》笔记 史发展规律。主张通过直接考察现实的“市民社会”来 建立社会理论。,4,杜尔克姆:把社会事实作为事第一章:绪论 物来看待。(社会事实,人大96,: 在杜尔克姆 看来,信仰体系、社会习俗和社会制度等现象是外在1、 社会研究:为了发现和解答社会领域中的各种问题而于个人的客观地社会事实~个人对社会事实的反应就去收集资料、并对资料进行分析和解释的过程。 如同五支队外界刺激的反应一样) ,5,波普尔的证2、 科学研究方法体系三层次,北大2001:简述社伪理论~“自由想象优于经验观察”:科学知识的起源会调查研究的...
社会学研究方法教程》笔记
社会学研究方法教程》笔记 史发展规律。主张通过直接考察现实的“市民社会”来 建立社会理论。,4,杜尔克姆:把社会事实作为事第一章:绪论 物来看待。(社会事实,人大96<名>,: 在杜尔克姆 看来,信仰体系、社会习俗和社会制度等现象是外在1、 社会研究:为了发现和解答社会领域中的各种问而于个人的客观地社会事实~个人对社会事实的反应就去收集资料、并对资料进行分析和解释的过程。 如同五支队外界刺激的反应一样) ,5,波普尔的证2、 科学研究方法体系三层次,北大2001<简>:简述社伪理论~“自由想象优于经验观察”:科学知识的起源会调查研究的方法体系,: (1)方法论:主要探讨研不是像经验实证主义所描述的那样起源于经验观察和究的基本假设、逻辑、原则、规则、程序等问题~它归纳~而是从各种“问题”开始的。问题促使人们的思是指导研究的一般思想方法或哲学, (2)研究方式:索探究~促使人们作出各种假设式回答~然后通过事指贯穿于研究全过程的程序和操作方式~它表明研究实证伪而形成知识。强调自由想象的重要性~自由想的主要手段与步骤。包括研究法与研究设计类型。 象是科学创造中不可或缺的非理性因素。 四种主要研究法:统计调查研究、实地研究、实验研证伪理论:波普尔认为不应通过肯定而应通过“否证”究和间接研究,研究设计是对研究类型、研究程序和来构筑科学理论。 波普尔“假设检验法”或称“试错具体方法加以选择并制定详细的研究方法。 法”~是杜威的假设演绎法的修正与发展。 研究设计分类:<1>根据研究目的:描述性研究、解假设检验法公式:P1,TT,EE,P2? 式中P为释性研究和探索性研究,<2>根据研究的时间性:横问题~TT为试验性理论~EE为排除错误。科学家遇剖研究和纵观研究,<3>根据调查范围:普查、抽样到问题,P1,后先提出判断假说,TT,~然后通过调查和个案调查,<4>其他分类:理论研究和应用研证伪检验来排除假说中的错误,EE,~形成理论后究,宏观研究与微观研究。 又会出现新的问题,P2,??~科学理论的发展便照(3)具体方法与技术:包括资料收集方法,问卷法、此公式循环往复的进行。,6,库恩的“范式”概念和访问法、观察法、量表法、实验法和文献法,、资料“科学发展阶段论”:库恩在对波普尔的假设检验法进分析方法,数据资料:统计方法、数理方法模拟法,行考察时发现~在研究的最初阶段,,既在“自由想文字资料:比较法和构造类型法,和其他技术手段和象”或“大胆假设”时~不同研究者可能会有不同的“想工具。三个层次相互联系:方法论影响研究者对研究象”或“假设”~这是由于研究者的知识结构~社会背方式的选择~一定的研究方式又规定了一套与其相应景和历史背景等等不同。库恩使用“范式”这一概念来得具体方法和技术。 表示这一现象。范式是指研究问题、观察问题时的角3、 科学:从确定研究对象的性质和规律这一目的出发~度、视野和参照框架。它是由一整套概念和假定组通过观察、调查和实验而得到的系统的知识。 成~它反映了科学家看待世界、解答问题的基本方 4、 科学三任务:描述、解释和预测事物的产生、发展与式。科学研究的方法论规则并非统一的、规范的~而变化。 是因人而异、随历史发展而变化的。各学科的发展都 5、 科学研究:以系统的、实证性的方法获取知识 要经历下列阶段: 前科学阶段,常规科学阶段,科 学革命阶段,新的常规科学阶段?? <1>在前科学6、 科学的性质:科学知识的性质:(1)系统性,(2)因果 阶段,存在着各种研究范式的相互竞争与相互批判,决定论,(3)普遍性,(4)开放性。科学研究的性质: <2>常规科学阶段~一门学科开始成熟了~其标志是(5)实证性,(6)客观性,(7)明确性,(8)社会性。 各个科学家集团统一在一种研究范式中~他们有共同7、 科学的功能:技术、学术和社会功能。 的概念体系、共同的假定和方法论原则,<3>当这门8、 操作化:对假设中的概念作出具体定义。 科学遇到无法解答的新问题~原有的研究范式不适用9、 社会科学研究的特点:,,,研究对象复杂、异质性时~就进入到科学革命阶段~科学家又分为不同的集大,,,,研究更受个人因素的影响,,?,研究对团~他们求助于哲学思辨和理论创新,<4>直到有重象的不确定性~偶然性和独特性更大。 大的理论或方法的突破~才能使科学家们重新统一在10、社会研究与社会调查:社会调查是一种了解客观事物新的范式中~进入新的常规科学阶段。 的感性认识活动~而社会研究是通过对感性材料进行库恩方法论思想的启示作用:<1>他把社会历史观和思维加工来探索真理的理性认识活动。 非理性因素引入科学和科学研究过程~打破了“科学11、社会研究与社会学研究:社会研究泛指各种具体的、万能论”~完善了波普尔的科学发展观,<2>他的“科分门别类地对某一社会现象或社会问题的研究, 社学发展阶段论”说明:存在多种方法论或研究范式。会学研究旨在探索人们的社会行动和社会关系~探索一种“范式”只有当它能有效地解决某一学科领域的所个人、群体和社会三者之间及其内部各组成部分之间有新问题时~才能为大多数科学家所共同接受,<3>相互作用和相互影响的原因及结果。作为社会研究之目前社会科学尚处在前科学阶段或科学革命阶段。 一的社会学研究更具综合性与实证性。 13、反实证主义的方法论 , 北大92<详 >:试说明在社会研究中实证主义与人文主义两种方第二章:社会研究发展史 法论的主要观点,:(1)狄尔泰:由于人具有自由意12、实证主义方法论,北大92<详>:试说明在社会研究志~因此人的行为是无规律的~且无法预测的。此中实证主义与人文主义两种方法论的主要观点,北大外~社会历史事件都是独特的、偶然的~不存在普2003<简>:简述社会研究中实证主义方法论的主要观遍的历史规律。因此~对人和社会不能用自然科学点,:,1,孔德提出“观察优于想象”~“实证”含的方法来研究~而只能以人文科学的主观方法对具义:<1>现实的而不是幻想的,<2>有用的而不是无体的个人和事件进行解释和说明。 ,2,社会学现象用的,<3>可靠的而不是可疑的,<4>确切的而不是学派:应当通过对社会环境和个人境遇的实地考含糊的,<5>肯定的而不是否定的。,2,孔德提出社察~深入到行为者的意义与动机的领域~揭示出指会学研究方法:观察法、实验法、比较法、历史法。导人们行动的内部逻辑。社会学的主要任务是具体,3,马克思方法论(复旦98<简>:马克思主义方法而微的描述实际的社会生活~而不是探求并不存在论的基本观点):以经验事实为依据~以唯物辩证法的社会规律。 上述观点根本否认社会规律和社会事为分析手段~在具体的社会过程和社会联系中探求历 第1页 袁方《社会学研究方法教程》笔记 实的存在~完全反对使用自然科学的方法研究社会者~而国家、团体、社会制度等整体概念都是表明人现象~他在批判实证主义的缺陷的同时又走到了另们互动的某种范畴~他们都可以还原为个个参与者的一个极端:即人文学科的主观方法论。就此而言是行动。,3,二者分歧在于:个体论主张采用分析或不足取的。,3,韦伯既反对实证主义~也反对主观分解的方法~并在基础层次上对事物作出解释~而整主义:<1>与实证主义不同~他认为~自然现象与社体论主张通过解释整体的本质来解释各个具体事物。会现象有本质的不同。后者含有社会成员对自己和,4,整体论,或系统论,是当代富有启发性的新思他人行为的主观理解~因此是社会事实是可理解的想。它正确地强调只有了解一个有机系统个部分之间事实。必须首先观察行动者的主管思想状态~并依的相互联系~才能认识系统的本质属性。但他并没有靠研究者的直觉或“理解”对行为的意义作出判断。提供一套研究有机整体的操作方法。此外~从整体论<2>与人文学派不同~韦伯指出~由于人的社会行为推导出社会研究应当“从社会整体出发”也是不恰当是有意义、有目的的~因而是有规律的~对这种规的:<1>从分析单位看~整体与个体是相互补充的。律性的行为可以采用自然科学的方法加以研究。但<2>在具体研究中要考虑社会整体的所有联系~不仅是~社会研究对人的行为的因果解释不是仅仅通过难以做到~也没有必要。<3>实际上~社会现象既是外部表现和外部影响~而是还必须通过对人的行为综合的~也是可以区分为各个特殊类型的~这就需要动机的理解。<3>韦伯认为~独立于人的主观意识之采用“具体问题具体分析”的原则~而不能实现将社会外的社会规律是不存在的~但是通过对理性行为的研究限定在某一层次或某种分析单位上。 理解~就可以找出社会现象的规律性~可以对人的16、研究范式,北大99<简>:简述社会学的三种研究范行为作出预测。<4>韦伯“社会学”定义:对社会行为式,北大2002<名>,浙大99<简>:里尔茨所区分的进行解释性理解~以便说明行为的原因、过程和结三种社会学研究范式,,:范式: 是指某一特定学科果的科学。韦伯的方法论原则目前为许多社会学家的科学家所共有的基本世界观。里尔茨区分了社会学所接受。,4,历史社会学派:强调社会学与历史的三种不同的研究范式:,,,社会事实范式,结构功密切联系。主张在社会研究中发挥历史和哲学的想能学派、冲突学派、新马克思主义学派,。以杜尔克象力~运用思辨和比较等方法。 ,5,评论:反姆的方法论思想和现代的结构功能理论为代表的~强实证主义学派提出了许多令人深思的观点~他们对调社会现象的客观性~认为社会现象是客观的事实~实证主义的批判动摇了孔德的实证体系~但是却未他们不能还原为个人的事实。强调对宏观的社会结能改变社会学的实证传统。实际上~对实证主义持构、社会制度、文化规范进行研究~在社会结构层次怀疑或反对态度的社会学家~大多数只是反对照搬和文化层次探讨社会的本质属性。,,,社会定义范自然科学方法或滥用数量分析方法~而并不反对以式,符号互动论、现象学、民俗方法学,。以韦伯的经验事实为依据来建立和检验理论这一实证原则。 思想为代表~强调社会现象的主观性质~认为一些宏 观的社会现象,如国家、制度、阶级等,都不是有形第三章:社会研究的方法论问题 的实体~它们是由人们的主观定义建立的~因此社会14、社会研究的层次,北大2000<简>:举例说明社会学现象是不可能与个人的动机、态度和行为相分离的。研究的主要研究层次,浙大2001<简>:简述社会研究这也是个体主义方法论的主要论点。社会定义范式强的层次,: ,1,宏观层次:将社会视为一个有调在微观层次研究人们是如何建立社会、如何在社会机整体~侧重从文化和历史的角度来研究社会整体的中行动的。,?,社会行为范式,行为理论、交换理性质和发展规律。主题有:<1>社会变迁研究:是在论,。以行为科学的方法论为代表~强调对个人的社文化层次上~即从历史演化的角度来发现并解释社会会行为进行客观精确地分析~主张用经验的或实证的发展的规律,主要研究方式:文献研究、历史-比较方法研究社会现象。只有通过对人的外部行为进行经研究,,<2>社会结构研究:从社会系统的相互联系验观察~才能认识社会现象的因果关系~才能像自然入手来分析社会体制,,主要研究方式:文献研究、科学那样客观地解释社会现象。,,,评价:以上几统计调查,<3>社会行为与态度的研究:将许多个人种研究范式都只是强调社会现实的某一侧面~但他们的行为或态度视为一个整体~由此来分析、预测人们对于全面认识社会都是必不可少的。尽管这几种范式的社会行动。,主要研究方式:统计调查, 使用的基本假设、概念和研究方式各不相同~不过在,2,微观层次:微观研究是从个人或群体入手~通实际研究中~他们又是相互联系的。各种范式都有其过观察人们的社会交往来发现社会行动的意义、特点合理性和局限性。 与其社会环境的复杂关系。主题有:<1>人的社会17、社会规律:,,,社会总体的统计规律~他只是一概化,<2>人际关系,主要研究方式:实地研究、实率的方式说明总体的状态或倾向~而并不排除个别的验,,<3>个人与社会环境的相互作用。,主要研究特例。,,,由社会规范和社会制度所规定的相对持方式:实地研究、统计调查, 久的行为模式。,?,适用于特定社会、特定历史时,3,社会单位层次:是从群体结构和集体行为入期的经验规则。 手~直接考察实际的社会单位~如社会组织、社会群18、投入理解法,北大2000<名>,:即研究者站到被研体和社区:<1>社会组织研究,主要研究方式:实地究者的立场~设身处地地理解行为者的内在动机~主研究、统计调查,,<2>社会群体研究,主要研究方观的判断影响社会行为的内在原因。 式:实地研究、实验,,<3>社区研究,主要研究方19、价值中立,价值无涉,,南大2000<名>,:研究的式:实地研究、统计调查,。 目的不在于判断好坏与善恶~而在于判断真假或是15、整体论与个人论:,1,整体论认为:社会的性质不是否~因此研究者必须采取客观的态度~排除个人的价由其部分的性质决定的。社会整体决定其各个部分的值观和主观偏好。 本质~由此推论出~社会研究的基本分析单位是社会20、社会理论的构造,北大95<问>:简述概念、变量、整体~如社会文化、社会制度、社会结构等~因为社调查指标的定义、各自在社会调查中的作用及三者的会现象的存在与变化只能由整体特征或宏观变量来解关系,南大98<简>:对社会学研究概念举例说明概释~而不能归结为个人特性~即不能还原到个人心理念的来源,复旦96<简>:什么是理论、假设、概或生理层次。,2,个人论认为:社会研究的基本分念、变量、指标及它们之间的相互关系,: 析单位是个人~因为个人是有意义行为的唯一承担 第2页 袁方《社会学研究方法教程》笔记 发展理论:假设经过证实或证伪~可以增进科学知,1,社会理论:是一套加以系统陈述的~以可靠的经验 识。 资料为基础并在逻辑上相互联系的命题。 21、理论的形式:特纳根据理论陈述的不同组织方式区分,2,理论的基本要素:<1>概念、<2>变量、<3>陈述、 了当代社会理论的四种主要形式:,1,思辨理论:<4>形式。 并不关注于解释具体现象~主要从哲学角度探讨理论,3,概念:它是对研究范围内同一类现象的概括性表述。 的核心概念和基本假设。缺点:仅停留在哲学问题的<1>实体概念和非实体概念。 <2>综合概念:由一些 争辩上会使社会理论的建设停滞不前。 低层次的概念构成的概念。<3>概念组成:名词、抽象定 ,2,分析理论,人大,,<名>,人大,,,名,义和经验内含。名词是对同一类现象的概括~抽象定义界 ,:侧重对人类社会做出类型学的划分~试图建立一定这些现象的范围和主要特征~经验内含是由名词所指示 套概念体系和分类框架。其中~每一概念都用以指明的那部分现象~它在经验层次上与名词和抽象定义相对 人类社会的一种基本现象,分类框架用于把社会分应。 解~使每一经验现象都在分类体系中有一个确定的位,4,变量:是概念的一种类型~它是通过对概念的具体 臵。一个经验现象一旦被归入某一类型~就可以用这化而转换来的。<1>变量作用:由于变量具有明确性和可一类型的性质对它做出解释。 缺点:局限在观测性~因此只有使用变量语言才能进行有效的经验研抽象层次~很难对其理论陈述做出经验检验。,?,究。近几十年社会研究科学化的主要表现之一就是不断改 演绎理论:也称为“形式理论”~是试图仿效自然科学进其变量分析方法。 <2>自变量(北大92<名>):在一组变 的公理式理论而发展起来的。这种理论形式上是由一量中 ~能够影响其他变量发生变化~而又不受其他变量系列不同抽象等级的命题构成的~从高层次命题中可影响的变量。自变量一般是对所研究现象的一种解释。 推演出低层次命题~他们可用以解释具体的经验现<3>因变量:依赖于其他变量~而又不能影响其他变量的象。演绎理论与公理理论的区别:<,>演绎理论缺变量。因变量一般是我们所希望解释的现象。 乏公认的公理或公设。<,>演绎理论的逻辑推演不严<4>变量间的关系(北大2003<问>:举例说明在变量关系解格。<?>演绎理论的陈述往往不具有公理理论的普遍释中因果关系和相关关系的异同,南大98<简>:结合具性。,,,模型理论,人大98<名>;人大2000<体命题~说明假相关与因果关系及相关关系的联系与区名>,:一般是由经验概括而来的~抽象层次较低~别,吉大2000<简>:简述变量关系的类别,浙大2001<社会领域中大部分模型是依靠数学和统计学的方法通简>:简述变量间的关系) : 过对经验变量的因果分析建立的。缺点:一般知识用, 相关关系 (复旦96<名>):如果说变量x与变量y有相于特定的经验现象或事件~很难上升到更高的理论层关关系~即若x有变化、y也有变化~反之也一样。次。,,,评论:社会理论的四种形式中~只有演绎在相关关系中~一般无法区分哪个是原因~哪个是结理论最具有科学理论的特征~因为只有通过不同抽象果~两者是互为因果的。正相关,直接相关,与负相等级的命题的联系才能既具有高度概括性~又具有可关,逆相关, 证伪性。但是~演绎理论的建立需要将经验研究所积, 因果关系,南开2001<名>,:在具有相关关系的两累的大量数据资料与理论研究所发展的概念体系及分变量中~如果明确说明了一个变量的变化引起了另一类框架结合起来。而在目前的社会研究中~这两者往个变量的变化~那么这种关系就可以称为因果关系。 往是脱节的~这种状况导致了目前社会理论的贫乏和因果关系条件:,1,x和y有相关关系,,2,x、y落后。 之间的关系不是由其他因素形成的,,3,x的变化22、个性解释与共性解释: ,,,个性解释:在时间上先于y的变化。 对某一独特事件或个人行为的解释~即对其特殊性的, 虚无关系:从某一个变量的变化很难预计到另一个是解释。 类型:<,>发生学解释:多用于历史研以怎样的方式发生变化的。即表明两变量不存在共变究~从历史根源或历史发展上说明事件的产生经过, 关系。 <,>意向性解释:多用于理解个人行为~通过对行 为动机和目的的分析来解释这一行为,<?>倾向性解 (5)命题与假设,北大98<名>,:<1>命题是对现象之间释:类似于意向性解释~用于分析个人行为~但倾向的关系的陈述。 <2>命题的类型: 性解释永个人的性格、态度、思想倾向来说明, , 公理:处于理论的最高层次~它是高度抽象的陈述~<,>多因素解释:在应用性研究或政策研究中最常可以作为理论的出发点~其他所有的理论命题都可由用~这种方式是例举各种因素。 ,,,共性解释公理推演出来。公理的正确性是由定义或假定而来,人大2000<名>,:这种解释方式是试图找出对某的~他无法直接被经验检验~而只能通过对他的逻辑一类型的行为或现象都有影响的最主要的因素。旨在推论的检验而得到部分证明。 用最少的原因变量去最大限度的解释因果关系的一般, 定理,人大98<名>,:是由公理推导出来的~它可模式。<1>因果解释,<,>功能解释。 被经验事实来检验。公理式的理论是以演绎三段论为23、因果解释(南大97<简>:试述因果分析的逻辑方基本形式的。 法):科学的解释是以系统的理论来说明现象之间普, 经验概括:不是由公理或定理推导来的~而是通过对遍的因果关系~科学哲学家亨佩尔指出~一个科学解大量事实的观察而归纳出来的~它的经验色彩较浓~释是由解释项和被解释项组成的。被解释项是研究这而抽象程度较低。 要说明的现象~解释项是一组关于这一现象发生的先, 假设,南开2001<名>:科学假设,:在研究之前提决条件的陈述~即原因~由一定规律决定的~因果解出的待检验的命题。对所要研究的问题做尝试性回释指出某些普遍规律~由于这些规律~那些被称为原答~一般来自对某一理论的演绎推理。假设必须是可因的事项就成为被解释项出现的充分条件~因此~因检验的~必须能够以变量语言来表述。 假设的陈述果解释是演绎性的。 ,,,英国哲学家穆勒总结方式:A函数式陈述,B条件式陈述,C差异式陈出:归纳因果关系的方法:<,>求同法,<,>差异述。 假设的作用:A指导研究:科学研究一法,<?>求同求异法,<,>共变法,<,>剩余法。般都以假设为起点~“大胆假设~小心求证”, B ,,,,(华莱士区分了探求因果解释的物种策略:逻辑推导:科学研究就是运用不同抽象层次的假设~ 来完成由抽象到具体或由具体到抽象的往返过程。C 第3页 袁方《社会学研究方法教程》笔记 <,>原因解释,<,>结果解释, <?>内部构论。,2,演绎:从一般原理或理论出发~通过逻辑成解释,<,>外部背景解释, <,>分类解释。 推理来解释具体的事件或现象。,3,关系:历史 24、功能解释,北大94<名>:结构,功能分析,人大上~归纳逻辑与演绎逻辑往往是对立的~直到20世99<简>:简述“功能解释的理论视角及其缺陷,浙大纪~由于波普等人的贡献~而这才在假设检验法,试2000<简>:如何评价功能解释,:,,,功能解错法,中结合起来。归纳是从特殊到一般、从个性到 共性、从具体到抽象、从经验到理论~而演绎则相释:不是说明变量间的因果关系~而是通过发现一个 反。,4,归纳逻辑的局限: <1>由一些个别事例现象对它所属的较大体系具有什么功能来解释该现象 概括出的一般性结论并非是可靠的~它有可能被其他的存在。,,,适用范围:功能解释适于说明一些独 未观察到的事例所推翻。<2>由归纳不可能逻辑的推特的社会现象~如原始社会的独特习俗~某种社会体 论出一般原理~因为由归纳得到的结论指示对一些具制中的道德规范等~还适合于说明一个自我调节系 体的、个别的经验现象的概括~它只适合于一定的时统。,?,基本假设:<1>任何社会都象有机体那样 间、地点、场合、范围~它仍停留在经验层次。<3>有其基本的功能需要,或功能先决条件,~只有满足 可以说~归纳逻辑的主要作用是发现经验事实之间的这些基本需要~社会才能生存下去。<,>任何社会现 联系~而不是发现一般原理。,5,演绎逻辑的局象都是与一定的功能需要相联系的~它们都是为满足 限:由于演绎的大前提~即一般原理或公理有可能是基本功能需要这一目的而存在的。 错的~所以有它推演出的命题也可能是错的~这样的>功能解释是一种目的论解释~,,,评论: <, 命题不可能有效的解释具体现象。此外~单纯靠演绎容易陷入循环论证或同义反复中。目的论解释以将来 也不可能发现理论的错误。 的结果中所体现的目的或功能来解释现在或过去的现 28、假设检验逻辑:,1,假设检验法,复旦97<名>:假象。这不仅不符合逻辑~而且也不满足可检验性这一 科学要求。<,>还被指责为是为现存的社会制度辩设演绎法,复旦98<名>:假设检验,:是从理论推护~因为它说明现存的一切制度、机构都是必要的、导出研究假设~然后通过观察来检验假设~假设如果合理的、都有助于维护社会正常运转和协调发展。 被证实~就可以对被观察到的具体现象作出有效的理 论解释,假设如果被证伪~就要对理论作出修正或推25、中层理论:由于社会现象复杂多样~需要采用多种解 翻原有理论、发展新理论。,,,假设检验法包括演释方式。个性解释是用于解释日常的现象、独特的历 绎和归纳两种逻辑~演绎只是从一般原理推导到具体史事件以及涉及主观动机的个人行为。但科学的社会 现象~而假设检验则需要完成一个循环~即再从具体研究主要采用共性解释~其中演绎理论和功能理论是 观察返回到理论~在返回过程中是运用归纳逻辑。这应用最广泛的解释方式。演绎理论能满足可检验性和 样~一般原理才有可能在实践中得到应用和检验。概括性的要求~能对社会现象做出科学的解释。但是 ,?,假设检验法比归纳法多了一个理论演绎的过由于很难将社会现象的因果联系概括为一些普遍的规 程~其优越之处在于:<,>如果没有理论假设的指律~因而他们的适用范围是很有限的。而功能解释尽 导~那么经验观察就有可能是盲目的且缺乏系统性,管能有效的说明许多社会现象~但它本身存在很多问 <,>单纯归纳法只能得出经验现象的概括~而不能检题和局限。目前~许多理论家致力于发展一种具体 验理论结论是否正确。假设检验法则可以将经验概括的、中型的理论~他与经验层次和抽象层次都有较密 与假设进行比较来检验理论的真伪。 切的联系~能系统的解释范围较小的社会领域或社会 29、经验概括:经验资料可分为案例资料和统计资料。层次中的现象~这就是默顿所倡导的“中层理论”所指 ,,,案例资料的归纳方式: <,>列举归纳:通示的方向。 过简单枚举建立经验概括。<,>排除归纳,人大第四章:社会研究的过程 2001<名>,:即在许多命题中~排除不符合客观事实 的命题~保留违背事实所反驳的命题以建立经验概26、科学环:社会学家华莱士1971年提出社会研究的逻括。 <?>区别:“列举归纳”一般是得出一种普遍现辑模型~即“科学环”。在这一模型中~华莱士用方框象的概括~而不涉及这一现象的产生原因,“排除归表示五个知识部分:,,,理论~,2,假设~,3,纳”则试图概括某一现象的普遍原因~它以 现象之经验观察~,4,经验概括~,5,被检验过的假设。 间的必然的因果关系为根据~因此~它也称为科学归用椭圆表示研究各阶段中使用的六套方法:,1,逻纳法。,,,统计资料的归纳方式:“统计概括”~辑演绎方法~,2,操作方法~,3,量度、测定与分它也是一种经验概括~依据概率原则~它说明~只要析方法~,4,检验假设的方法~,5,逻辑推论的方样本是从总体中随机抽取的~那么在样本中发现的现法~,6,建立概念、命题和理论的方法。各个知识象或变两件关系也可以在总体中观察到。,3,统计部分通过各种方法转换为其他形式。箭头表示知识形规律,具有普遍性的经验概括,与定律的区别:统计式转换的阶段。中心线的右边是理论演绎的过程~即规律是孤立的经验命题~它还没有结合到一个理论体把理论应用到现实中~在这一过程中使用演绎法。中系中~而定律则与许多抽象的理论命题相联系~它能心线的左边是理论建构的过程~它首先是运用归纳法系统的解释现象。,4,经验概括的作用:能为新理有经验观察概括出研究结论~然后再上升到抽象的概论提供事实根据~能够检验原有理论中的错误。更重念和理论。在横剖线的上方属于理论研究~处于抽象要的是~它能使研究者从预料不到的事实中或偶然发层次。下方属于经验研究。这一模型是对社会研究中现中得到启发与顿悟~从而提出一些新的概念或想各种逻辑过程的概括~表明了社会研究是从理论,假法~以此为线索来建立新的理论。 设,观察,概括或检验,新的理论??~这样一个周30、从经验概括到理论,浙大2001<简>:简述从经验概括而复始~无限循环的过程。他的优点在于没有始点也到理论的步骤,波普指出:不存在任何获得新思想的没有终点~研究工作可以从任何一点开始。华莱士的逻辑方法或逻辑改建过程,任何科学发现都包含非理逻辑模型可作为社会研究的“指南”~可是我们了解各性因素或”创造性的想象”,正如爱因斯坦所说,没有任种研究在整个科学过程中的位臵和作用。 何逻辑途径可以直接导致定律的发现,只有依靠直27、归纳与演绎:,1,归纳:是从经验观察出发~通过觉、依靠研究者的专业酷爱才能得到定律。 对大量现象的观察概括出具有普遍性或一般性的结,1,建立理论解释步骤:<1>建立解释项的概念~ 第4页 袁方《社会学研究方法教程》笔记 这一抽象概念包含经验概括中的各种变量得共同属性行调查等等。 经验推演的缺陷:由于概念、或特征,<2>建立被解释项的概念~他在更抽象、更变量和指标处于不同的抽象层次~概念与变量、变量普遍的层次上表明所研究的具体现象,<3>建立解释与指标、概念与指标之间的联系不是通过严格的逻辑项与被解释项相联系的命题~它以原有的经验概括为推导建立的~而是主观假定的~因此它们有可能不一基础,<4>建立多个命题~它们包含上述的解释项或致,变量有可能未界定出概念的本质属性~指标有可被解释项~然后将这些命题组织在一个逻辑上相互联能反映不出概念的真实内涵或只反映其中一小部分内系的理论体系中~有理论可推导出新的可被检验的假涵。因此~工作假设被正式并不能直接证实理论假设。,2,抽象的策略:理论建构的关键是从具体的设~理论假设被验证也并不能直接证明理论的有效性经验事实中抽象出社会现象的普遍意义或本质特征~和真实性。,2,假设的检验:<1>研究假设与虚无这需要创造性的想象力。策略有:<1>列举共同因假设:研究假设通常是陈述两个现象之间有相关关素,<2>利用现有的理论和抽象概念作出解释,<3>系~主要检验方法:直接检验,就是收集大量经验资探寻背景联系,<4>询问,<5>内省。 料去直接验证假设,和间接检验,提出一个与研究假,3,扎根理论,Grounded Theory,(人大99<名>):设相反的虚无假设,。间接检验的前提:调查样本是由经验资料建立的理论~其主要特点不在于它的经验从总体中随机抽取的。间接检验的作用:,A,收集性~而在于它从经验事实抽象出了新概念和新思想。 经验资料以反驳虚无假设~从而证明研究假设是正确它的建构程序是:<1>未经研究假设而直接从实际观的,,B,说明研究假设不仅在调查样本中成立~而察入手,<2>从观察资料中归纳出经验概括,<3>由且在总体中也成立,,C,说明研究假设中变量之间经验概括上升到理论。 评论:<1>它是一种联系的有效范围。 <2>研究假设与理事后解释~即它是在收集到事实之后所作出的主观解论解释:反驳研究假设的方法:,A,简单证伪法:释~尽管这种解释与观察到的事实相一致~但它不是寻找否定研究假设的经验证据~这些证据可说明~在唯一的~从同一事实或同一经验概括中可以跳跃出不什么条件下研究假设部成立~并说明理论解释的局限同的理论解释,<2>它的缺陷在于~无法从众多可能和缺陷所在。简单证伪法需要在不同地点、不同历史的理论解释中判断或检验哪一种更真实可信~这也是时期、不同社会条件中收集反例~并以这种反例来怀有经验观察出发的社会研究的共同缺陷,<3>这种理疑或否定某一理论解释的真实性。,B,理论证伪论缺乏必然的可信性~因为它所依据的经验证据是由法:是对多种理论解释进行检验~以便选择一种更有不完全归纳提供的。经验研究的四种功能,北大<说服力的解释。在许多个假设的检验中~如果某种理问>:调查研究对于理论的四种功能,:经验研究并论解释比另种解释得到越来越多的支持~那么后者将不局限于检验理论~默顿写到:“经验研究远远超出逐渐失去可信任和解释力~最终可能被证伪。一般说检验理论的被动功能~它不仅仅是正是或反驳假设。来~一种理论不会轻易被完全推翻~由他推演出的研研究在发展和形成理论方面至少发挥着四种主要的积究假设即使被否定~常常是促使理论作出修改或补极功能:创造、改进、反思和澄清理论。” 充,只有它在多次或多个假设检验中都受到怀疑时~31、理论检验研究:研究的最终目的是要更真实、更有才有可能陷入无法挽救的境地。这是由于~一般理论效、更合理地解答所要研究的现实问题或理论问题。是抽象的、普遍的~而研究假设则是经验的、具体这种以假设为开端的研究称为理论检验研究。在科学的~研究假设是由理论通过经验推演而得出的指标环中:它包括理论,假设,经验观察,经验概括,接,或变量,构成的~指标只反映概念中的部分内容~受或拒绝假设,理论五个阶段。,1,理论推演研究因此指标见得不相关并不一定证明概念之间不存在关假设的方法:<1>逻辑推演:从公理推演出定理,或系。此外~研究假设是在具体的时间、地点对某些样理论假设,~也称为命题逻辑推演。 作用:从无本作调查来检验的~他在某些条件下被否定并不说明法被检验的公社中推导出可被检验的理论假设。特理论解释在其他条件下也不成立。由于同样的原因~点:公社与推导出的假设都处于同一抽象层次~这样研究假设被证实也不能证明理论解释是真实的、有效就能使经验观察与理论有一致的逻辑联系~理论假设的~这种证实只是在某一方面提供了支持理论解释的如果被证实就可以直接证实理论。缺陷:在社会科学证据~而不是作出普遍的、全面的验证。 中~概念的定义于对概念的测量并不像自然科学那样<3>检验的步骤:,A,确定研究课题、选择理论解完全一致~因此这种严格的逻辑推演是无意义的。因释~明确表述所要检验的理论。 ,B,运用逻辑推此~有些社会学家,如霍曼斯等人,主张用定义逻辑演从理论推导出一组理论命题,称为理论假设,。推演~它的特点是~由理论推演出的假设是较低抽象,C,运用经验推演将理论假设专署为具体的研究假层次的理论命题~它可应用于具体的时间地点~还可设,也称为工作假设,。,D,收集有关资料。指导观察资料的收集工作。<2>经验推演,北大93<,E,整理分析资料。,F,检验与评判理论。 名>,:把理论假设中的概念与经验变量和指标联系32、研究步骤,北大98<简>:简述科学研究的一般程起来~然后再经验层次上建立工作假设。在社会研究序,,:,1,研究步骤:<1>准备阶段,<2>设计阶中~经验推演是与逻辑推演相结合的。 工作假设:段,<3>调查阶段,<4>资料整理与分析阶段,<5>总作出理论概念的操作定义之后~就可以选择一些可被结阶段。 ,2,确定研究课题:<1>研究问题的检验的、可直接观测的、具体的测量指标~用它们来提出,人大99<简>:简述“研究问题”在科学研究中重新陈述理论假设。 的意义,:,A,科学研究始于问题。问题可以指出概念操作化:由理论概念到工作假设的过程。操作化研究的目标和方向,,B,可以指导观察资料的收集是对理论概念作出解说和抽象定义。说明在何种范工作。,C,提出新的问题~新的可能性~从新的角围、何种意义上使用这一术语~然后建立概念的操作度去看旧的问题~需要有创造性的想象力~它们标志定义~选择和制定测量概念的指标和~最后用可着科学的真正进步。从这个意义上说~正确地提出一被观测的变量和指标来重新表述理论假设。 个问题~往往比解决一个问题更重要。 <2>研经验推演的作用:把抽象的理论概念转化为可以观测究问题的选择,浙大2001<简>:确定研究课题的因的指标~是理论可以在实践中得到检验。能使研究者素有哪些,南大2000<简>:怎样选择调研课题,:明确地认识到~要收集何种经验资料~在何种范围进,A,理论意义。学术界公认的重要题目或必要题 第5页 袁方《社会学研究方法教程》笔记 目。,B,应用价值。能解决社会现实问题~包括对反驳:<1>假设并非是完全主观的猜测或臆想~它们社会长远发展有价值的问题。,C,迫切性。当前迫是建立在以往的经验和理论之上的,<2>任何研究都切需要解决的理论和实际问题。,D,可行性。能够是受一定理论或方法论的指导的~都基于一定的理论得到社会及各有关部门的重视和支持~在研究力量、前提~即便是“观察先行”也要以一定的理论框架来概经费、人员配合、资料提供、被调查者协作等方面得括经验资料。<3>假设所选择的变量是从实际上活中到较可靠保证。,E,研究者的主客观条件。研究者筛选出来的~这一筛选过程实际上跟“观察先行”的方本人的兴趣、学识、能力、精力、时间、研究条件等式是一致的,如探索性研究,。<4>任何研究都要以等。 ,3,选择研究类型:<1>应用研究,一定的假设或设想为指导~否则观察就会是盲目的~ 当然~这种设想的清晰程度是不同的 <2>理论研究。<3>描述性研究,人大99<名>,:目 的是系统了解某一社会现象的状况及发展过程~它通第五章:社会研究的设计 过对现状的准确、全面地描述来解答社会现象“是什 么”的问题。 解释33、 描述性研究:同探索性研究一样都没有明确性研究,人大98<名>,:试图对社会现象作出普遍的假设~也是从观察入手来了解并说明研究者感兴趣的因果解释~以解答“为什么”的问题。 探的问题。但进入观察阶段之前必须有一些初步的设索性研究:也称先导研究~是对某一课题或某一现象想~以避免观察的盲目性:,1,研究的时间性:在进行初步了解。它既可以作为一项独立的研究~也可横剖研究与纵贯研究之间做出选择,,2,研究的空以为进一步周密、深入的研究工作做准备。 间范围:以确定观察的地点和对象,,3,研究的主,4,探索性研究的内容:<1>查阅文献: 作用:题和内容:明确本次研究究竟要描述什么,,4,研,A,了解以往研究成果,,B,了解与研究课题有究层次和角度:经验层次还是抽象层次,宏观层次还关的各种理论观点和研究方法,,C,了解研究对象是微观层次,,5,具体化与操作化:对所使用得概的社会历史背景。 查阅文献方法,人大96<念作出具体定义。,6,调查对象的选取~若为抽样简>:简述如何查阅文献,: 查阅文献应当有目的、调查~还要确定选取的方法与程序。 有选择。研究这可以首先利用图书馆检索工具找出与34、 解释性研究:主要运用假设检验逻辑~在研研究课题有关的文章、论文、书籍和#调研报告#~如百究之前需要建立理论框架,理论假设,并提出一些明科全书、辞典、出版年鉴或报刊文摘、《新华文摘》确的研究假设~然后将这些假设联系起来~构成一个上有关专题目录索引、社会科学刊物,如《中国社会因果模型。建立这些模型的三种方式:,1,列出现科学》、《社会学研究》、《社会调查与研究》、象的原因或结果,,2,详析两变量间的关系:与上《政治学研究》、《经济学研究》等杂志,的目录索一种方式不同~他不是在研究之前就列出各种原因或引、专业书籍索引等等。除国内理论文献外~有条件后果~只选择一个最主要的自变量建立研究假设~然的话~还应查阅国外和其他专业领域,如哲学、历史后用各种资料来检验这一假设~并在深入详细地分析学、心理学等,的理论文摘。然后经过浏览筛选出重了这两个变量于其他变量之间的关系之后再建立因果要的、有参考价值的文献~对这些文献要详细阅读、模型,,3,深入分析变量件作用的机制。 作摘要或资料卡片。收集研究的背景资料~可利用各35、 横剖研究,浙大99<名>;浙大2001<名>;南类“统计年鉴”、“统计报表”、政府部门的调研报告、大2000<名>,:是在某一事件对研究对象进行横断有关法律法规、省,市,与地区概括、县志史等。另面的研究。所谓横断面是指研究对象的不同类型在某外~还可结合实地观察~收集当地的社会经济等方面一事典所构成的全貌。人口普查和民意测验多采用横的文献以及私人的传记、信件、回忆录等。 <2>请剖研究的方式。横剖研究并不等于静态研究~他也可教专家:所谓专家~指熟悉这一研究题目的人,<3>以进行动态分析。此外~许多理论检验研究都采用横实地考察:时到研究现场去观察、询问~以增加感性剖设计来探寻因果规律。 横认识~明确调查内容~确定研究方法。 剖研究的特点:调查面广、多办采用统计调查的方,5,提出研究假设:社会学家古德等人提出~假设式、资料的格式比较统一且来源于同一时间~因而可必须满足以下几个条件:<1>以明确的概念为基础,对各种类型的研究对象进行描述和比较。但资料的深<2>具有经验的统一性,即能被经验检验,,<3>对度和广度较差。 假设的适用范围要有所界定,<4>与有效的观测技术36、 纵贯研究(南开2000<名>,复旦98<简>:相联系,<5>与一般理论相关联。 纵贯研究及其四种类型):是在不同时点或较长的时假设的来源:<1>可通过查阅理论文献而得出,<2>期内观察和研究社会现象。 纵贯研究类型:,1,趋可从实地考察或访谈中得到,<3>有些研究中~假设势研究,北大2004<简>:趋势研究和同期群研究的的建立市结合了上述两种方式假设先行与观察先行:异同,复旦97<名>,人大2000<名>,:是对研究对有人对从自然科学引入的假设先行的方式提出了异象随时间推移而发生的变化进行研究。 议。他们认为~由于假设是一研究者选择的抽象概念,2, 同期群研究,北大97<名>,人大2001<对现象之间的关系所作的尝试性或推测性的判断和解名>,:是对同一时期同一类型的研究对象随时间推释~因此“假设先行”会严重的歪曲客观事实。<1>首移而发生的变化的研究。同期群研究注重的是某一类先~从方法论的观点看~抽象概念是研究者主观设定型~而不是某一个体的特征。所以在不同时间可以调或选择的~他不同于从经验资料中概括出的概念~他查不同的人~只要他们都属于同一类型。但每次调查只代表研究者所偏好的理论或研究范式~这就会是研的抽样都应当是随机的~以保证被调查到的样本可以究者仅局限在他的特定角度或眼界中去观察问题~而代表这一类型的人。,3,追踪研究,复旦96<且有可能会有意无意地收集对他的假设有利或不利的名>,:是对同一批研究对象随时间推移而发生的变证据,视他想验证或否证假设而定,。 <2>化的研究。追踪研究注重个体特征~因此要求在各次其次~从技术角度看~事先建立假设会排除许多可能调查中都调查同一批对象。 ,4,纵贯有影响的变量~这就不仅使观察带有框框~而且会忽研究的特点:<1>能够了解现象的发展过程~能比较略许多未预 想到的经验事实。由于这些弊端~他们不同时期的变化~此外~由于各种变量的时间顺序清主张“观察先行”~即不带假设进行客观的调查。 第6页 袁方《社会学研究方法教程》笔记 楚~因此容易做出逻辑上的因果判断。<2>但纵贯研究者本人的理解和抽象概括从经验资料中得出一般性 究的调查范围较小~难以进行不同类型的比较。 的结论。 特点: ,A,得到的资料通常是无法统计汇总的文字资料,37、 普查、抽样调查和个案调查:,1,普查: ,B,是一个较长期的过程,,C,通常集中关注于是对较大范围的地区或部门中的每一个对象都进行调 某一个案。,D,资料收集方法主要是无结构的观察查。 <1>普查的作用:能够 和访问。,E,资料分析主要运用定性分析和投入理对现状作出全面、准确的描述~其目的是了解国情~ 解发。 ,4,实验:通过实验而收集到的资料把握整体的一般状况、得出具有普遍性的概括。 与统计调查资料很相似~它们都可以分类汇总和统<2>普查的特点:资料的化程度很高~可统计汇 计。二者区别是:<1>统计调查是在自然环境中~而总和分类比较~调查结论具有很高的概括性和普遍 实验是在人为控制的环境中观测或询问,<2>统计调性~可精确反映总体的一般特征。但调查内容较有 查所得到的不同变量只是调查对象本身固有的~而实限、缺乏深度。普查的工作量很大~所花费的时间、 验则是人为施加某种刺激~使调查对象的属性和特征人力和经费很多~因此~除统计部门和政府部门外~ 发生某种程度的变化。 一般社会研究很少采用这种设计。 ,5,文献研究:是历史学的主要方法~它利用现存,2,抽样调查,人大99<简>:简述抽样调查与个案 的第二手资料~侧重从历史资料中发掘事实和证据。 调查的区别,:从研究对象的总体中抽取一些个体作 特点:<1>不直接与研究对象接触~不会产生由于这为样本~并通过样本的状况来推论总体的状况。 种接触对研究对象的干扰~因而不会造成资料的失抽样调查的特点:比普查要节省时间、人力和经费~ 真。因此~也被称为间接研究或非接触性研究。<2>资料的标准化程度较高~可以进行统计分析和概括~ 它的资料收集方法是与分析方法相联系的~研究者一能了解总体的一般状况和特征~调查结果具有一定的 般是确定了分析方法之后~再去查找某种类型的文客观性和普遍性。但他的调查内容不如个案调查那样 献。 文献分析的三种方式:<1>统计资深入、全面~工作量也较大~在资料处理和分析上需 料分析,<2>内容分析,<3>历史-比较分析。 要运用较复杂的技术。 39、 社会学八种“理论群”:美国社会学家将当代,3,个案调查,北大99<名>,:是从研究对象中选 社会理论区分为八种不同的理论群:,1,结构功能取一个或几个个体进行深入、细致的调查。 理论,,2,新因果论,,3,社会预言理论,,4,<1>主要作用:是详细描述某一具体对象的全貌~了 小群体理论,,5,符号互动论,,6,结构主义,解事物发展、变化的全过程。 <2>特点:与抽 ,7,新马克思主义,批判理论,,,8,民俗方法学样调查相比~个案调查不是客观的描述大量样本的同 与现象学。各种理论群都有自己的方法论和研究范一特征~而是主观的洞察影响某一个案的独特因素。 式。在研究方法上~新因果论、社会预言理论主要依<3>典型调查,北大2001<名>,北大2002<简>:简 靠大规模统计调查的资料,符号互动论、民俗方法学述典型调查的优缺点,:也是从研究对象中选取若干与现象学偏重实地研究,小群体理论通常使用实验方具有代表性的个体~对他们进行深入调查。它试图通法,其他三种理论则偏重文献研究~但他们也在不同过深入的“解剖麻雀”~以少量典型来概括或反映总程度上依靠经验调查的资料。上述分歧实际上是自然体~从特殊性中发现一般性。 <1>典型调查的作科学的定量方法、人文学科的定性方法与韦伯的“理用:真实、迅速地了解全局情况。<2>典型调查的特解社会学”方法三者分野的延续。它也反映了对社会点:与个案调查不同~它要求被调查的对象具有典型“科学”和社会研究的不同看法。 性~因此~选取典型是这种方法的关键。典型调查试 40、 定量方法与定性方法,北大2003<简>:简图解决有个别推论一般~有个性概括出共性的任务~ 述理论分析与定性分析、定量分析的关系,复旦97<在这一方面它有很大的独创性和应用价值。局限在 简>:现代社会调查方法有哪些特点,:,1,定量方于:研究者所选择的典型是否具有代表性是很难判断 法的共同特点:它是从一组单位中收集各单位的可对的~因此有这种主管选择的典型而得出的研究结论并 比的信息。只有对这种信息才有可能进行计算~并进不一定能适用于总体或全局。<3>个案调查和典型调 而对资料做出更广泛的定量分析。运用定量方法就是查的共同点:它们能够详细地解剖某一个案~能够在 要对多少可比较的一组单位进行观察~这些单位可以实际生活中体验到当时、当地的情景和气氛~能够深 使个人~也可以使群体或机构。,2,定性方法则无入了解社会行为的背景和发展过程。但调查资料难以 法对不同单位的特征作数量上的比较和统计分析~只标准化~只能依靠主观判断得出研究结论~结论的客 是对观察资料进行归纳、分类、比较~进而对某个或观性和普遍性难以检验。 某类现象的性质和特征作出概括。,3,统计调查与38、 研究方法,北大94<简>:社会研究包括哪 实地研究,个案调查,对比,北大93<详>:是说明几种方式,它们的主要原则是什么,,:,1,区分统计调查与实地研究的具体程序。两者的主要区别有研究法的主要标准:<1>资料的类型,<2>收集资料哪些,它们的逻辑推理过程是什么,北大2004<的途径或方法,<3>分析资料的手段和技术。 论>:统计调查与实地研究的异同~并每个各举三个,2,统计调查:<1>社会研究资料分类:,A,直接研究题目~注意适用,:<1>统计调查范围广泛~涉调查得来的数据资料,,B,直接调查得来的文字资及大量单位,而实地研究涉及少数个案。<2>统计调料,,C,文献资料。 <2>应用:统计调查查从一个单位中选取少数侧面,而实地研究选区多数法不仅可以用于描述性研究和解释性研究~也可用于侧面,<3>统计调查客观的统计和量度总体特征,而探索性研究。 <3>特征:,A,使用结构式调查方法实地研究主观地洞察性的把握个体特征。<4>统计调收集资料,,B,在对大量个案作分类比较的基础上查用相关分析等客观方法得出普遍化的结论,而实地进行统计分析。,C,由于这两个特点~他成为理论研究用主观洞察性方法得出普遍化的结论。,4,定检验研究的最主要的方法~并且通常与抽样调查相结量方法的优点:标准化和精确化程度较高~逻辑推理合。 ,3,实地研究,北比较严谨~因而更客观、更科学。定量方法还能大大大92<简>:试述实地研究,或实地调查,的优缺点推进理论的抽象化和概括性~促进对现象之间普遍的及适用范围,浙大2000<名>,南大2000<名>,:是因果关系得精确分析。,5,定量方法的局限:<1>不带假设直接到社会生活中去收集资料~然后依靠研 第7页 袁方《社会学研究方法教程》笔记 由于是对大量样本的少数特征作精确的计量~因而定能否与客观世界相一致是一个实践的问题。此外~自量方法很难获得深入、广泛的信息~容易忽略深层的然科学和社会科学都以同样的方式来解决“思维与存动机和具体的社会过程。<2>由于社会现象错综复在”的关系问题~它们都是假定理性认识与经验证据杂~影响因素众多且难于控制~因此要确立两个变量之间存在着逻辑一致性。尽管社会研究更容易受主观之间的因果关系也并非易事。可以说~所研究的现象因素的影响~但研究者的基本出发点是:“他们能够越复杂~统计分析或相关分析也就越不可靠。<3>由通过操作化过程来领悟和描述现实~能够依赖科学验于许多社会现象都是独特的~无法得出普遍的经验概证的绝对标准去评价他们的研究成果~除此之外的唯括~因而也无法依赖数量分析。<4>还有人认为:统一选择只能是不搞研究”。当然~所谓判断知识真理计调查只能得到表面的、浮浅的信息~而不能抓住事性的“绝对标准”是随科学实践的发展而变化的。物的本质特征。他们推崇实地研究法~认为只有通过,,,近几十年来~社会科学为了使理论与证据据有对日常生活的直接观察~才能获得有关社会生活的有一致性~越来越多地采用更客观~更有信度的方法~效知识~因为社会是由活生生的任何具体的社会活动统计调查正是在满足这一要求的方向上发展的~他试组成的~对它必须根据社会成员的动机和主观意义来图最大限度地消除主观因素的影响~但目前~他还未理解。在他们看来~统计调查、问卷、测量这类方法能有效的解决资料的效度问题。 会肢解和歪曲社会现实~它们实际上是把研究者本人42、 分析单位,北大93<名>,北大2004<名>,对现实的看法强加于社会世界。他们并不认为主观洞复旦98<名>,:是研究者所要调查和描述的对象,它察的方法是非科学的~相反~认为它是获取科学知识是研究的基本单位,研究的最终目的是将这些分析单的重要手段~他们指出~“日常生活的各个基本方面位的特征会及其赖以描述由它们组成的较大集合体或还是能够直觉地被掌握的~因此而产生的创造性的见揭示某种社会现象。,1,一般来说~分析单位等同解总有一天将成为客观知识。”,6,定性方法的局于抽样单位,但有时~分析单位可能与抽样单位不一限:<1>它是依据典型的或少量个案的资料得出结致。,2,分析单位不一定是研究结论中所要揭示的论~这种结论不一定具有普遍性。<2>主观洞察法的单位。,3,社会研究中分析单位的类型:<1>个分析既有可能获得真知灼见~也有可能导致荒谬的结人:个人是社会科学中最常用的分析单位,<2>群论~这是因人而异的。由于对这种主观性的分析或结体:指具有某些共同特征的一群人,<3>组织:指由论缺乏客观的评价标准~因此人们也无法对不同的研具有共同目标和正是分工的一群人所组成的单位,究结论进行检验。,7,理想的调查研究方法:<1><4>社区:是按地理区域划分的社会单位,<5>社会涉及大量个案,<2>选取多个侧面并且与整体相联产物:指各种类型的社会活动、社会关系、社会制度系,<3>通过客观计量和统计把握共性,<4>尽可能和社会产品。,4,可以说~分析单位是研究者所要客观分析并结合主观洞察和理解得出普遍化的结论。 了解的一些个案。选择分析单位是应注意:<1>一项评论:这一设想曾受到系统论和拉扎斯菲尔德的“多研究课题可以采用多种分析单位,<2>在研究中~如变量分析”方法的启发和鼓舞~但近几十年的实践果以某一种分析单位进行调查所收集的资料不能完满中~由于研究经费和操作化技术的限制~这一理想未的解答研究课题的话~就应当增加或改变分析单位。 能实现。目前~社会科学家所能做到的也只是在资料43、 研究内容:是指分析单位的属性和特征~它收集和分析中结合主观洞察的方法。当前的主要发展们是研究者所要调查和描述的具体项目或指标。趋势是:定量方法的应用领域越来越大~同时人们也,1,研究内容的类型:<1>状态:是一些客观指越来越深刻地认识到定性方法在社会研究中的特殊意标~通过他们可以描述分析单位的基本状况。<2>意义并尽可能使它系统化。目前看来~排斥一种方法或向性:是分析单位的内在属性~它是一种主观变量。将两者统一起来的努力都是徒劳的。 包括态度、观念、信仰、个性、动机、偏好、倾向性 41、 资料的可靠性和有效性:信度指资料的真实等。<3>行为:是一种外显变量~研究者可直接观察可信程度,效度指资料是否准确有效的说明了索要研到的各种社会行为和社会活动。,2,根据理论和方究的问题。<1>一般来说~实地研究的资料的可靠性法论偏好~研究者可在下列几个方面进行选择:<1>不如统计调查。实地研究依靠个人感官~很难保证调研究层次,<2>抽象程度,<3>解释的方式, 查资料的客观性。而统计调查可靠性真实性较高。44、 层次谬误和简化论,北大2003<问>:举例<2>统计调查资料的有效性不如实地调查。统计调查说明在推论中容易发生的、与分析单位有关的两类错往往会导致这种倾向~即把时间和精力花费在收集越误,:,1,层次谬误,或生态谬误、区位谬误,来越多的数据资料上~并设计了越来越复杂的分析资,北大94<名>,北大97<名>;人大96<简>:简述什料的方法~却忽略了资料的有效性问题。假如资料是么是层次谬误,:是指用一种高层次的分析单位做调琐碎的、枝节性的~那么不管他的数量有多大~分析查~却用另一种低层次的分析单位作结论。层次谬误技术有多精密~也仍然不能有效地说明事物的主要特就是这种将社区特征与群体特征、群体特征与个人特征和本质属性。<3>对调查研究来说~影响资料信度征相混淆的错误。在用统计资料分析时很容易出现这和效度的因素还包括研究本身对被调查者的干扰。这类“层次谬误”。当然~这种推论偶尔也是符合实际种干扰表现为:,A,被调查者由于对访问员或问卷的~但它的推理方法则是完全错误的。,2,简化论措辞的误解等原因~不自觉或无意识的做出错误的不,或还原论,:在社会研究中是指局限于用某类特征真实地回答。,B,被调查者由于顾虑、反感、不耐来分析和揭示各种复杂的社会现象。实际上~并没有烦等原因~而有意识地隐瞒或改变自己真实的行为和一种普遍适用的分析单位~一项研究应考虑到各种分态度。<4>尽管客观性和科学性是社会研究追求的目析单位和各种特征~然后依据理论假设和初步考察来标之一~但完全客观的、不受个人价值观念影响的研确定较适当的分析单位和研究内容。 究室很难达到的。越来越多的社会学家认识到:“一45、 研究方案的设计,北大95<问>:设计一个个调查者的价值观不仅影响他选择的研究课题~而且调查研究方案主要考虑哪些方面,复旦97<简>:设也影响他研究这些课题的方法和他所应用的资料的来计一个调查研究方案主要考虑哪些方面,南开2000<源。”这意味着~不存在判断资料有效性的固定标准简>:影响调研方案设计的主要因素是什么,南大或绝对标准。但这并不能否认社会科学的科学性和客95<简>:怎样编制调研提纲,南大97<名>:调研程观性。因为:,,,从认识论的观点看~人们的思维 第8页 袁方《社会学研究方法教程》笔记 <3>恒常刺激法:这种方法与配对比较法相类似~唯序,:,1,研究方案:它是对研究的具体程序和操 一不同之处是它以一种标准刺激连续地与一组恒常刺作方式的规划~即制定研究~分解研究课题~然 激的各个成员相配对地进行比较。<4>连续性类别后将所要研究的概念具体化、操作化~并说明研究的 法:要求被试者把一群刺激分为若干不同的类别~这各种细节以及所采取的各种策略。研究方案相当于一 里的类别已按指定的属性而予以顺序排列。 项工程的设计图和施工方案~如果事先有比较周密和 注意:它们使用的数字仅仅显示等级顺序而已~除此精细的规划~考虑各种问题就比较全面。那么实施过 之外~别无其他意义。这些数字并不显示属性的真正程就会比较顺利。,2,研究方案的内容:<1>阐明 量值~并且等级之间的间隔也不一定相等。 研究课题和研究目的,<2>确定研究类型和研究方 ,3,定距尺度或等距尺度:具有定类尺度和定序尺法,<3>确定分析单位和研究内容,<4>制定抽样方 度的特征~此外~它还要求尺度上的间距代表所测量案,<5>制定问卷、观察表格或访问提纲,<6>确定 的特征的量的间距。即每一等级之间的间距是相等调查的场所和时间计划。并对调查员的任务和工作进 的~它们可以用来加减。但定居尺度上没有绝对的零度作出安排。<7>研究经费和物质手段的计划、安 点~所以不能乘除。 ,4,定比尺度或比例尺度:是排。 测量中的最高层次~具有实在意义的真正零点~定比 第六章:测量 尺度下的数字是可以进行加减乘除的~运算的结果都 具有实在的意义。一个变量能否以定比尺度测量~关 46、 测量的概念:,1,测量,复旦96、97<键在于零点是否是绝对的~最好的检验办法是:零是名>,人大96<名>,:对所确定的研究内容或调查指否可被认为是测量“一无所有”的。,5,四种测量尺标进行有效的观测与量度。具体地说~是根据一定的度比较,南大2000<简>:定距变量可以变为定序变规则将数字或符号分派与研究对象的特征,即研究变量吗,反之如何,请举例说明,:从数学性质上看~量,之上~从而使社会现象数量化或类型化。,2,高层次尺度都具有低层次尺度的一切特征~反之则不研究变量:是通过对概念的界定和具体化而转化来然。选择测量尺度须注意:<1>社会现象大多只能以的~在研究中~它是分析单位所具有的特征或属性。定类或定序尺度测量~但有时也可将某些现象近似的在一具体研究中~每个变量都有特定的测量指标。视为定距或定比变量~如“智力测验”。这是要注意这,3,数字,符号,:测量时得到的一定数值可作为种近似计算的合理性和可能出现的偏差。<2>高层次某一现象或事件特征的代表符号。,4,分派规则:尺度可能获得更多、更精确的信息~但调查和分析的确定分派数字的规则是测量中最基本、最困难的工工作量更大~而低层次尺度则相反。因此选择尺度要作。测量是将各个分析单位与它们的特征或属性用数结合课题要求与研究条件。 <3>用较低尺度收集的资字分派规则联系起来。所谓规则是指操作的方法或索料不能用较高尺度的数学运算来处理~反过来则可 以。因此许多研究都是尽量先收集更多、更精确的信引~它指导研究人员如何实施测量。,5,有效的测 息~但在分析时却只作一些简单的运算~这虽然会造量规则必须满足三个条件,复旦98<名>:测量三要 成很大的浪费~不过当需要今后作补充分析时~这种素,:<1>准确性:指所分派的数字或符号能真实、 策略还是有必要的。<4>一个变量可能适合用各种尺可靠、有效地反映调查对象在属性和特征上的差异~ 度来测量~选择何种尺度取决于研究所要求的精确用数学概念表述~如果真是状态与符号系统在结构上 度。 具有一致的关系~那么两者就具有同构性~同构性越 48、 概念的具体化与操作化,北大93<简>:是高~所观测的资料就越准确有效,<2>完备性:是指 说明概念与假设的操作化过程,北大97<简>:试说分派规则必须能包括研究变量的各种状态或变异, 明研究课题具体化与操作化的主要内容,北大2000<<3>互斥性:指每一个观测对象,或分析单位,的属 简>:简述一项调查研究课题的具体化与操作化,南性和特征都能以一个而且只能以一个数字或符号来表 大96<名>:课题操作化,南大95<简>:怎样具体确示。,6,测量的作用:在于作出准确的分类~以便 定测量的尺度,复旦98<简>:课题具体化和操作化比较研究对象的各种差异~这些差异有些是以等级区 的主要内容,:因为社会生活中使用的概念通常是模分的~有些是以数量区分的。研究对象的差异都是由 糊的或含义不清的~社会研究如果不对这些概念作出一定原因造成的。因此通过对差异的比较和分析就能 定义和具体化~也就无法对现象进行观察和度量。找出现象之间的因果联系。 ,1,概念的具体化,浙大2000、2001<简>:试述拉47、 测量尺度,北大92<简>:举例说明四种测 扎斯菲尔德的概念具体化,南大94<简>:如何从概量尺度的特点及区别,北大2001<简>:是举例说明 念中引出指示项,北大95<问>:简述概念、变量、,种测量尺度及其数学性质,复旦98<简>:简述变 调查指标的定义、各自在社会调查中的作用及三者的相的测量层次及其划分意义,:,,,定类尺度或名 关系,南大98<简>:对社会学研究概念举例说明概义尺度:测量定类变量的尺度~它是测量尺度中最低 念的来源,复旦96<简>:什么是理论、假设、概的一种~大多数定性测量都适用定类尺度。其严格的 念、变量、指标及它们之间的相互关系,:<1>概念区分可分为:<1>标记:可作为一个识别的记号~当 的形成:概念是在日常生活中通过感性认识和互相交数字被用作标记时~它并不表示数量的多少~也不能 流形成的。是人们对许多现象的复杂而又具体的感对它做数量运算,<,>类别:可作为对变量的不同状 受~并以一个名字对这些感受作出整体的、含混的概态的度量~类别区分可说明观测对象的某些本质特 括。概念是人们思维的产物~它是抽象的~无法直接征(类别也可用数字表示~这种数字仅用于区分而不 观察的~因为它本来并不存在~是人们创造了它。能运算。 ,2,定序尺度或等级尺度:一 <2>概念的界定:使用抽象定义将概念所指的现象于个变量如果能够依操作定义所界定的明确特征或属性 其他现象区分开来。,A,界定的第一步是将概念分而排列等级大小、高低、先后的次序~这是就适用于 解:即从不同角度或维度对概念所表示的现象进行分定序尺度进行测量。 定序测 类~对有些高度抽象的概念要逐步分解,,B,第二量程序:<1>等第顺序法~它要求被试者对一组刺激 步是作出抽象定义:通过分解可大致了解一个概念的依某种属性由高到低或由多到少的次序予以排列。 基本内容和各种分类~根据分类就可以抽出各种类型<2>配对比较法:要求被试者在一定时间内就所有可 的共同属性和特征对概念下定义。在社会研究中~抽能的配对~排列出每对刺激中的大小或多少的顺序。 第9页 袁方《社会学研究方法教程》笔记 象定义的作用是对在何种范围、何种含义上使用这一标准尺度相互校对~以修正偏差。但有些系统偏差很概念作出精确的说明~因为概念包括许多方面和不同难用标准化消除。,4,其他变量的影响(O):也是一维度。经过严格界定的概念称为变量~变量具体指概种有规则的变异~这种因素不是偶然的~而是内含在念内涵的各种类型或各种状态~它们对应于各种实际测验的题目或量表之中的。这种影响并不能通过多次存在的事物~因此变量是可以观察和量度的。概念转测验而消除~它是内含在测量指标之中的。消除或减换为变量形式之后就可以进入科学研究的领域了。少这种影响主要通过对所研究的变量进行严格的操作<3>选择测量指标:确定如何测量变量~选用那些指化。,5,在评价社会研究中所使用的测量方法时必标来测量。指标是概念内涵的指示标志~它们直接表须考虑以下三个问题:<1>这一测量有没有系统偏示经验层次的现象。指标可以量度现象的不同状态和差,这种系统偏差会不会影响研究的有效性,一般来不同程度。由经验现象的量度就可以说明抽象层次的说~任何测量都会有一定的系统偏差~因此~测量的概念。但指标指标是概念内涵的某一方面或某一部分主要任务就是使系统偏差控制在最小程度。<2>这一内容~因此要更有效的测量概念就需要用多个指标。测量是不是可靠的,即随机误差对测量的可靠性有没对概念,变量,的具体量度的方案也称为概念的操作有影响,假如测量受偶然因素影响很大~观测值就会定义。<4>编制综合指标:对简单的概念可以用一两在较大范围内起伏~在这种情况下~观测是不可靠个指标来测量~而对复杂的概念~则要用多个指标来的~测得得观测值其可信性很低。<3>这一测量是不测量。<5>概念的具体化过程就是一步步从抽象层次是有效的,即所测得得数值是否正式向要研究的变量下降到经验层次~使概念具体化为可观测的事物。 值~其他变量的影响值是否控制为最小, ,2,操作定义,复旦98<名>,南大98<名>:古典51、 信度,南大98<名>,北大2004<名>,:指操作定义,:就是建立一些具体的程序或指标来说明测量数据,资料,与结论的可靠性程度~即观测工具如何测量一个概念。<1>操作定义的功能:,A,澄能否稳定地测量到它要测量的事项的程度。也就是说清概念在研究中所选用的意义,,B,说明测量变量信度是指测量的稳定性与一致性而言的。,1,信度的操作方法,,C,使一些陈述变量间关系的假说获系数:信度可以看作系统性变异在观测到的总变异中得验证的机会,,D,使今后同样的研究有所根据~所占的比率~系统性变异越大~则信度系数越大~表 明测量的信度越高,信度也可以看成是在观测到的总以便比较彼此的结果。,3,测量指标,北大2003< 变异中~不是因随机误差所造成的变异所占的比率。名>,北大93<名>:变量与指标,:指标是反映社会 ,2,信度的检查,南开2000<名>,:信度通常以相现象变异特征的范畴。是对社会范畴的变异方面的规 关系数表示。由于测量中误差变异的来源有所不同~定性加以具体化。它把现象的质的方面与量的方面密 故各种信度系数分别说明信度的不同层面而具有不同切的结合起来~以便精细描述社会现象的某一特征。 的意义。在实际应用中~信度系数有如下类型:<1>测量时首先要说明指标~任何一个变量都有许多不同 重测信度:用同一份问卷的问题~对同一群被测者前的指标~这是因为测量所依据的事实可以不一样。当 后调查两次~在根据调查的结果~计算其相关系数~一个变量有多个指标时~可以从中挑选若干个来测量 就得到重测信度。这种信度能表示两次调查结果有无变量~挑选指标的原则是方便与适当。各项指标可以 变动~反映了测量的稳定程度~故又称作稳定系数。分别研究~但有时需要将各项指标综合起来~以提高 它可以检查出被测者是否能正确理解所提的问题~并变量的抽象程度。建立综合指标的方法:类型法、指 作出真实稳定的回答。这是一种测量信度的较好方数法和量表法,4,建立综合指标:<1>类型法:将各 法~但须注意两次调查相隔的时间要适当~如果时间指标交互分类~然后建立新的类型~以形成一个新的 太短~被测者还记得上次答案~所以测量的是他的记指标,<2>指数法:是用简明合理的公式综合各指 忆~而不是他此时的真实态度。如果间隔时间太长~标~以建立一个新的指标。 可能会发生一些变故~影响到被调查者的态度。<2>49、 量度化方法:通过测量而得来的资料可分为 复本信度:对一项调查的问题~让被调查者接受问卷三种纬度:,1,物理纬度:可以用客观的标准来测量, 测量~并同时接受这份问卷的复本的调查~然后根据而不涉及主观判断。这些量度一般都属于定距或定比 调查结果计算其相关系数~就得到复本信度。使用复尺度。但这种量度只适合于某些社会现象。如事物的 本求取信度可以避免重测信度的缺点~但使用的复本状态特征和行为特征。,2,心理物理纬度:包含物 必须是真正的复本~即在题数、形式、内容、难度及理纬度和心理纬度。一般认为~测量心理属性最多可 鉴别度等方面都与原本一致~仅只在问法与用词方面达到定序尺度~而无法使用定距尺度。,3,心理纬 与原本不同。复本调查可连续或相距一段时间进行~度:是利用主观判断所制定的计量标准。缺点是:它 连续实施的复本信度又称等值系数,相聚一段时间实们缺乏一套完善的测量理论~即缺乏公理和定理的系 施的复本信度又称稳定与等值系数。<3>折半信度:统。 将调查来的结果~按题目的单、双数分成两半记分~50、 观测值的分解:测量理论的基础是数理统计 在根据各个人的这两部分的总分~计算其相关系数~中的误差理论或变异理论。测量理论建立在“任何观 就得到折半信度。<4>评分者信度,人大2001<测值,测量分数或测量结果,都有误差”这一假设之 名>,:在测量工具标准化程度较低的情况下~不同上。,1,它认为~观测值,X,是有四个部分组成 评分者的判分标准也会影响到测量信度~要计算评分的:<1>真实值T。<2>其他变量的影响值O。<3>系 者信度~可计算一个评分者的一组评分与另一个评分统偏差B。<4>随机误差E。 者的同一组评分的相关系数。,3,影响信度的因,测量分数,X=T+O+B+E ,2,随机 素:在结构化标准化程度较高的测量中~信度主要受误差(E)是非系统的变异~它是由于一些无法预料的 随机误差的影响~随机误差越大~信度越低。随机误因素引起的~如被测者的疏忽~粗心等。但是这种影 差的来源主要有:<1>被调查者:如是否耐心、认响有正有负~所以要消除或减少随机误差~通常采用 真、专注、不受情绪波动影响。一般来说~调查时间多次测量或抽取大量样本的方法~使正负误差相互抵 越长~提出的问题越多、越复杂~信度越低。<2>调消。,3,系统偏差(B),南开2001<名>,是有规则 查者:是否按规定程序和标准~是否有意或无意的对的变异~它是由于测量工具、评分标准等直接与测量 被调查者施加影响~纪录的认真程度等。<3>测量内方法有关的因素引起的。消除或减少系统偏差的方法 容:如提问的措辞含糊不清~不易理解~各种题目内是采用标准化的测量工具,在测量之前将测量工具与 第10页 袁方《社会学研究方法教程》笔记 部一致性低~题数少等。<4>测量环境和时间:如研53、 信度与效度的关系,北大93<名>,北大究人员对被调查者有较大“干扰”~他人在场的影响~96<问>:说明测量的信度与效度及其相互关系,:两次测量的时间间隔太长等等。 ,1,信度低效度不可能高。如果收集的资料不可 52、 效度,南大96、97、2000<名>:测量效信、不可靠~那么它肯定不能有效地说明所研究的对度,浙大2000<名>:测量的效度,:就是正确性程象。,2,信度高~效度未必高,效度有可能很度~即测量工具确能测出其所要测量的特质的程度。低,。,3,效度低~信度有可能很高。,4,效度效度越高~即表示测量结果越能显示其所要测量的对高~信度必然也高。如果有效地说明了各种现象~那象的真正特征。测量的效度可以决定所建立的理论解么它的资料和结论都必然是且必须是可信的。,5,释的正确程度。对效度的检验可以保证不同的研究人测量的信度是效度的必要条件~但不是充分条件~无员对某一研究变量的意义与内涵有一致的理解。信度必然无效度~但有信度未必有效度。反之~效度,1,效度的基本原理:从测量分数变异的观点来是信度的充分条件但不是必要条件~有效度必然会有看~效度就是测量得分的总变异量中~由所要测量的信度~但无效度却未必无信度。,6,效度=信度- 2222特质所造成的变异量所占的百分比。,2,效度的检,,,,/~由此可知~效度系数等于信度系数xoox查,复旦96、97<简>:效度测定的三种类型是什22,,/减去。由于其他变量的影响是内含在测量工么,内在联系如何,,:<1>内容效度,表面效度,ox,北大97<名>,:考察内容效度旨在系统的检查测2,,~而信具之中~因此很难测出他们的变异量,o量内容的适当性~并依据我们对所研究的概念,变 度系数则可由相关系数计算。所以在一些研究中~研量,的了解去鉴别测量内容是否反映了这一概念的基 究者常用信度系数来近似的说明效度~但这是有缺陷本内容。内容效度实质上是个判断问题。检查内容效 的~因为在社会研究中~其他无控制的变量对资料的度就是检查有概念到指标的经验推演是否符合逻辑~ 效度有很大影响。所以还是应当通过对内容效度、准是否有效。在科学研究中~需要以大多数科学家所接 则效度和建构效度的检查来说明研究的有效程度。受的概念定义为标准。 <2>准则效度,效标效度, ,7,由信度和效度的关系可知~所有影响信度的因,南大95<名>:标准效度,:准则是被假设或被定素也必然影响效度。此外~除随机误差外~效度还受义为有效的测量标准~符合这种标准的测量工具可以到系统偏差和其他变量的影响。对这些影响课主要考作为测量某一特定现象或概念的效标。对同一概念的虑两个方面:<1>测量工具,<2> 样本的代表性。 测量可以使用各种测量工具~其中每种测量方式与效 标的一致性称为准则效度。 ,A,如果效第七章:抽样 标或准则是依据将来实际发生的情况而建立的~那么 这种准则效度可称为预测效度。预测效度是将已经得54、 抽样与抽样调查,北大2004<简>:抽样调到的测量结果与未来实际发生的情况进行比较~以检查的基本原理,:抽样调查:从研究对象的整体中选查两者的一致性。 出一部分代表加以调查研究~然后用所得结果推论和,B,如果效标识于某种测量方式同时被证明为有效说明总体的特性。这种从总体中选出一部分的过程就的~则称之为共变效度。共变效度是用来判断其他的是抽样~所选出的这部分代表称为样本,人大2000<测量工具是否可以取代作为效标的测量工具。 名>,。,1,与整体调查相比~抽样调查的优越性:,C,如果效标是以实际经验判断为准的~则称为实<1>调查费用较低,<2>速度快,<3>应用范围广,用效度。实用效度通常用来检查测量工具的实际效<4>可获得内容丰富的资料,<5>准确度高。,2,抽果。由于对某些现象的测量过去并没有一定的标准~样成功的依据,假设,:<1>部分是包含于整体之中所以只能依据实际经验来检验测量工具的有效性。 的,<2>部分与整体有同样的特征、现象、关系及过实用效度与共变效度有些近似~如定量化的干部测评程,<3>部分能够为研究者提供一个有关群体生活、方法就是以组织部门传统的考察干部的方法为效标~群体态度、价值和的更为清晰的脉络。 当它具有较高的效标效度时~由于它省时间、简便易55、 抽样术语:,1,个体与抽样单位,人大行~所以就能取代过去沿用的老方法。 97<名>:抽样单元,:个体是收集信息的基本单准则效度的局限:有些作为效标的测量工具只是假定位~即分析单位。个体与抽样单位在有些研究中是相有效的~它本身是否真正有效并没有理论根据~这一同的~但在实际抽样中~抽样单位往往是多层次的。缺陷是心理量度化方法所共有的<3>建构效度,南大,2,研究总体和调查总体,复旦97<名>:研究圈,99<名>,复旦97、98<名>,:是要了解测量工具是人大2000<名>:总体,:研究总体是在理论上明确否反映了概念和命题的内部结构。它通常在理论性研界定的个体的集合体~它必须受几个方面的限定:内究中使用。由于它是通过与理论假设相比较来检查容、单位、范围、时间。实际上~样本式从调查总体的~因此也称为理论效度。测量同一个概念可以用多而不是研究总体中抽取的。调查总体是研究者从中实个指标~当用X和Y的多个指标来测量两个概念之际抽取调查样本的个体的集合体。它往往是对研究总间的关系时~如果不同指标的测量都反映出理论所假体的进一步界定~即对时间、范围作更进一步规定。设的关系~那么这些测量就具有建构效度。<4>内在,3,抽样框,北大2002<名>,复旦97<名>,南开效度与外在效度,北大2003<名>:内在无效度,:2000<名>,南大99<名>,:又称抽样范畴~是从中测量都是在具体的时间、地点对具体的调查对象所作抽取样本的抽样单位名单。在一次抽样中~抽样框的的观测。如果在一项具体研究中~对上述三种效度数目是与抽样单位的层次相对应的。,4,参数值与,内容效度、准则效度、建构效度,的检查都没有发统计值,人大97<名>:参数、估计量,,:参数值现问题的话~就可以认为这一研究具有内在效度~它是关于总体中某一变量的综合描述。统计值则是关于的资料和结论可以有效的解答所研究的问题。可以调查样本中某一变量的综合描述。抽样调查的重要内说~内在效度是指一项研究的资料和结论的有效性。容之一就是通过样本的统计值推算总体的参数值~从而外在效度是指这种研究结论的普遍有效性。对外在而达到由部分认识总体的目的。,5,抽样误差,北效度的检查要考虑样本的代表性和特殊性~以及研究大99<名>,复旦96<名>,:总体的异质性和样本与时间、地点、情境和研究内容的普遍意义。 第11页 袁方《社会学研究方法教程》笔记 总体范围的差异性~在用样本的统计值去推算总体的抽样时首先从表中的50列中抽取四列~再依上法抽参数值时总会有偏差~这种偏差就是抽样误差。出样本。,4,分层抽样,北大96<简>:说明分层抽,6,臵信水平与臵信区间:臵信水平是指总体参数样与定额抽样的特点及区别,北大97<简>:分层抽 样与整群抽样的分类原则有何不同,为什么,北大值落在样本统计值某以正负区间内的概率。而臵信区 98<简>:分层抽样与配额抽样有何异同,浙大99、间是指在某以臵信水平下~样本统计值与总体参数值 2000<名>,南大2000<名>,:分层抽样就是先将总的误差范围。 添一种或几种特征分为几个子总体,类、群,~每一56、 抽样的基本程序:,1,界定研究总体和调 个子总体称为一层~然后从每一层中随机抽取一个子查总体。对研究总体的界定过程也就是对他的基本构 样本~将它们合在一起~即为总体的样本~称为分层成单位~所包含的内容以及空间与时间的范围等作出 规定的过程~同时也是确定调查对象~及它的内涵、样本。<1>分层抽样的优点:,A,当一个总体其内外延及数量的过程。,2,确定抽样单位~编制抽样部分层明显时~分层抽样能够克服简单随机抽样的缺框。即将总体案抽样单位划分为各部分~这些部分必点。由于它是按群体的特征分布从不同层获得尽可能须互不重叠且能合成总体~然后毫无遗漏的编号排列均衡的样本数~使样本与总体更相似。,B,分层抽成表~每个抽样单位唯一的与表上的一个号码相对样可以提高总体参数估计的精确度。由于它可以将一应。抽样框是概率抽样一个最基本的要求~它的质量个内部差异很大的总体分成一些内部比较相似的子总关系着抽样的质量。,3,设计和抽取样本。包括确体~从而每一个子总体内抽出一个小样本就能较好的定样本所包含个体的数目~选择抽样的具体方法。代表总体。,C,有些研究不仅要了解总体的情形~,4,评估样本于对总体进行估计。样本对于总体的而且还要了解某些类别的情形~分层抽样可以同时满代表性问题始终是抽样中关注的中心问题。 足这两个要求~因为我们可以将每一类看作一个总 57、 样本准确性与精确性,北大95<问>:抽样体。,D,便于行政管理。 调查中的误差份哪两类,其来源是什么,如何减少两,5,系统抽样,或等距抽样~机械抽样,,复旦类误差,北大2002<简>:简述影响调查样本代表性98<名>,南大94<简>:等距抽样的基本步骤,南大<的主要因素,: ,1,样本准确性:指样本简>:等距随机抽样的抽样方法,:<1>系统抽样是 简单随机抽样的一个变种~具体做法是:,A,没有偏差。偏差也称系统误差~其来源主要有:<1>将总抽样程序的缺点~即未能遵守随机原则,<2>无回体的所有个体前后排列起来。,B,计算抽样距离。答~无回答是样本偏差的主要来源之一。事实上~一抽样距离K=N/n,N为总体包含个体数,n为样本所个包含比初始选定的单位少于80%的样本几乎肯定是含个体数,,,C,在头K个个体中~用完全随机的有偏差的~在这种情况下应通过二访、三访或其他手方式抽取一个个体~设其所在的位臵的序号是k。 ,D,自k开始~每隔K个个体抽取一个个体~即陆段提高回答率。,2,样本精确性:指抽样误差的大 续抽取的个体所在位臵序号为k~k+K~k+2K…k+小。抽样误差是抽样这种方法所固有的误差~是随机 ,n-1,K。 <2>系统抽样的优点:,A,误差。抽样误差可以定量进行估计~因此研究人员对 与简单随机抽样相比~更易实施~工作量较少,于抽样误差的估计具有很大的主动性。,3,样本评 ,B,样本在总体中的分布更平均~故而抽样误差小估:样本评估分两阶段~正式调查前和结束后~后者 于或至少等于简单随机抽样~即较其更精确。,C,是计算抽样误差并由样本统计值推论总体参数值等。 系统抽样可看成是分层抽样~它等于将总体分为几在确定了样本规模和抽样方法抽出样本后~应先对抽 层~每K 个分子为一层~也就是说可以看作是每层出的样本进行评估~目的是初步检查样本对于总体的 只抽一个个体的分层抽样。两者不同的是~系统抽样代表性~以剔出那些偏差太大的样本~重新抽样。评 的样本个体在每一层的相对应位臵上~二分层抽样则估可以采取收集若干容易得到的资料~例如年龄、性 是由每层随机抽取的。系统抽样在总体中分布更均别、文化程度等作为样本于总体之间的比较的方法。 匀~精确度叫分层抽样更好。<3>系统抽样是以总体一般地说~比较的变量越多~杨本越可靠。 的随机排列为前提的~如果总体的排列出现有规律的58、 概率抽样,北大93<简>:试说明概率,随 分布时~就会使系统抽样产生很大误差~降低样本的机,抽样得主要方法,人大97<简>:简述概率抽样 代表性。 <4>系统抽样适用于同质性较高的群体。当的随机化原则,吉大2000<简>:简述概率抽样的类 总体内不同类别之间所含个体的数目相差过于悬殊型及特点,:,1,概率抽样:是总体中每一个体都 时~采用此法样本的代表性可能较差。这种情况一般有一个已知不为零的被选机会进入样本。概率抽样分 使用分层抽样。 ,6,整群抽样,聚类抽样,为等概率抽样,随机抽样,和不等概率抽样。,2, ,北大94<简>:试述分层抽样、整群抽样的抽样误是一种特殊的等概率简单随机抽样,纯随机抽样,: 差的来源~及他们对这两种抽样分层原则的影响,:抽样方法~总体中每一个体均有同等被选机会~而且 整群抽样是将总体按某种标准划分为一些子群体~每样本中每一个体是被单独得选出的。他是一种元素抽 样。分重复抽样和不重复抽样。,3,随机数字表一个子群为一个抽样单位~用随机的方法从中抽若干,南开2000<简>:利用随机数表抽样的基本程序是子群~将抽出的子群众所有个体合起来作为总体的样什么, ,:随机数字表是由数字0-9组成的表~由电本。<1>整群抽样与分层抽样异同:,A,它们在第子计算机编制而成。下面举例说明如何用随机数字表一步都是根据某种标准将总体分为一些小群,B,但进行抽样:假定研究总体N=528~即总体中有528个两者的抽样方式不同。分层抽样中所有子群均要抽取个体~我们欲抽选一个由10个个体组成的样本~因一个子样本~作为总体样本的一部分~即总体样本在为N是个三位数~因此首先从表中的50列数字中随各层中均有分布。而整群抽样则不然~它是抽取若个机抽取三列~例如我们选中了第25-27列~然后由上子群并将抽出子群的全部个体和起来作为样本~因到下从这三列中选出头10个001-528之间的不同的此~总体样本分布在部分子群众。,C,由于抽样方数~当然~不一定非要从这三列的第一行数字开始~式的不同~导致两者间划分子群的原则也不同。在分可以从任意行开始~直到抽够10个数字为止。如果层抽样中~层的划分依据的是层之间异质性高~层内从这三列抽出的符合要求的数字不足时~就要另外随则尽可能同质的原则。整群抽样因仅抽取某几个子群机抽取三列~从中继续抽取。如果N是四位数~则作为整体的代表~如果子群间差异显著~且每个子群 第12页 袁方《社会学研究方法教程》笔记 内同质性很高~那么这种情况下抽取的几个子群显然有何异同,北大2003<名>,南大95、96、97、99<无法代表总体。因此~整群抽样得分群原则应与分层名>,:它与分层抽样中的比例抽样相似~也是按调抽样不同~它是使得群体间异质性低~群内异质性查对象的某种属性或特征将总体中所有个体分为若干高~因此~分层抽样适用于界质分明的群体~而整群类或层~然后在各层中抽样~样本中各层,类,所占抽样适用于界质不清的总体。<2>整群抽样的优点:比例与他们在总体中所占比例一样~但不同的是~分,A,它可以通过转换抽样单位扩大抽样的应用范层抽样中各层样本是随机抽取的~而定额抽样中各层围,,B,它可以节省人财物力,,C,许多调查往样本是非随机抽取的。定额抽样是以代表总体为目的往很难得到总体的所有个体的可靠名单~有时即使可的~因此它必须对总体的性质有充分的了解~定额抽以得到~所需费用也十分昂贵~这就限制了抽样的应样假定:<1>只要类型划分较细~那么同一类型中的用范围。这种情况下~使用整群抽样获得抽样框就容每一个个体都是同质的~因而无需采用随机抽样。易得多。,D,整群抽样通过将抽样单位由个人转换<2>只要类型划分合理~而且分配给各类的名额符合成群体~使由简单随机抽样和分层抽样所不能进行的总体中各类人员的分布~那么样本就可以准确地反映抽样调查成为可能 ~扩大了抽样的应用范围。<3>整总体。,5,滚雪球抽样,北大92、93<名>,:是先群抽样的缺点:,A,样本分布不均匀~样本的代表从几个适合的调查对象开始~然后通过他们得到更多性较差~与其他抽样方法相比~相同样本数~抽样误的调查对象~这样一步步扩大样本范围。当调查总体差较大,,B,分析整群样本的资料~如抽样误差~的个体信息不充分时~常采用此种方法。但是~用这统计推断~假设检验要比前面几种抽样方法复杂,种方法抽样最后仍有许多个体无法找到~还有些个体<4>分类:分为等规模整群抽样和不等规模整群抽因某些愿意被提供者故意漏掉不提~这两者都可能具样~前者总体内所有的群规模都相等~而后者总体内有某些值得注意的性质~因而可能产生偏误。,6,各群大小不一~这种情况下~往往出现样本规模随机空间抽样:是针对一个变动的总体~如游行队伍、集变动的问题~为了解决此问题~往往采用子抽样的方会等进行抽样的方法~这种总体虽然是变动的~但在法~即从抽出的样本群中再抽一次样~得到所需样空间上是有限的。空间抽样最重要的是要在同一时间本。,7,多阶段抽样,多级抽样,:在整群抽样对整个总体进行抽样~以防止它的组成经历太大的变中~当子群数或子群内部个体数目较多~彼此间的差化。 异不太大时~常采用更经济方法~即不将样本子群众60、 样本容量的确定,北大2002<简>:简述影的所有个体作为样本~而是再从中用前述各种随机抽响调查样本代表性的主要因素,人大2001、浙大样的方法抽取样本~因而最终样本的获得经过两次抽1999<简>:简述影响样本容量的因素,:,1,样本 容量:又称样本大小、样本规模~指的是样本内所含样~我们称其为二阶段整群抽样~同样可做三阶段、 个体数量的多少。,2,影响样本容量的因素:<1>四阶段…即多阶段整群抽样。对于群体规模不等的多 研究的精确度要求:在研究目的是由样本得到对总体阶段整群抽样~通常使用概率比例抽样法:是根据每的估计时~首先要依研究的目的对这种估计所允许的一群的规模分配样本容量。在将总体划分成子群时~误差大小做出规定~即确定抽样的精确度。允许误差每个子群中个体的含量常常不同~在这种情况下~二,精确度,等于抽样误差与概率度t的乘积~t值取阶段抽样由于第一次抽取子群大小不同~只有在第二决于研究所要求的臵信水平。由重复简单随机抽样的阶段抽样是采取措施~才能使总体中每个分子具有同 等进入样本的概率。 多阶段抽样的特点:多阶段抽,/n误差公式可知~抽样误差与样本大小密切相样通过采用由高级抽样单位过渡到低级抽样单位的方关~样本越大~越接近总体~抽样误差越小。因此~法~解决了低级抽样单位不易获得的抽样框的问题~对样本的精确度要求越高~所允许的误差则越小~样并且可以使样本的分布较为集中~从而大大降低调查本就应越大~反之亦然。<2>总体性质:在一定精度所费人财物力。此外~多阶段抽样由于在各阶段抽样要求下~总体越大其样本要求亦应越大,总体内部异时可根据具体情况灵活选用不同抽样方法~故能综合质性程度越低~所需样本容量越小。<3>分析要求:各种抽样方法的优点~提高样本质量。因此~它特别在确定样本大小时~应估计一下在分析时样本需作哪适用于调查范围大、单位多、情况复杂的调查对象。些分类~并保证每个类别有一个能够统计分析的子样多阶段抽样由于每阶段抽样都会产生误差~因此经多本~相关分析和其后的检验方法要求每个小类的子样阶段抽样得到的样本的误差也相应增加~这是它的不本容量不小于10。<4>抽样方法:在选定抽样方法足。 后~须分别考察和计算这一方法所需样本数。<5>无59、 非概率抽样,人大96<名>,:,1,非概率回答,<6>经费。 抽样是根据研究任务的要求和对调查对象的分析~主 观地、有意识地在研究对象的总体中进行选择~因此第八章:问卷法 每个个体进入样本的概率是未知的~而且由于排除不 61、 问卷的基本结构:,1,封面信,南大98<了调查者的主观影响~因而无法说明样本是否重现了 名>,:即一封致被调查者的短信~其作用在于向被总体的结构~用这样的样本推论总体是极不可靠的。 调查者介绍和说明调查者的身份、调查目的等内容。,2,偶遇抽样,方便抽样,:是指研究这将在一定 内容:<1>调查的主办单位或个人的身份,<2>调查时间、一定环境里所能遇见到或接触到的人均选入样 的内容和范围,<3>调查的目的,<4>调查对象的选本的方法。优点是方便省力~但样本代表性差~有很 取方法。,2,指导语,南大97<名>:问卷指导大偶然性。 ,3,主观抽样,判断抽样~立 语,:即用来教被调查者如何正确填答问卷~教访问意抽样,,南大98<名>,:主观抽样中的“主观”有 两种含义:<1>主观判断的意思~这时~主观抽样又员如何正确完成问卷调查工作的一组陈述。卷头指导称为立意抽样或判断抽样~即研究者依据主观判断选语:一般以“填表说明”的形式出现在封面信之后~正取可以代表总体的个体作为样本,<2>第二种含义是式调查问题之前。作用:对填表的要求、方法、注意有目的地选择样本的意思。 ,4,定额抽样,配事项等做一个总的说明。卷中指导语:一般是针对某额抽样,,北大96<简>:说明分层抽样与定额抽样些较特殊的问题所作出的特定指示。总之~问卷中每的特点及区别,北大98<简>:分层抽样与配额抽样一个可能使回答者不清楚、不明白、难理解的地方~ 第13页 袁方《社会学研究方法教程》笔记 一切有可能成为回答者填答问卷的障碍的地方~都需便~是否会形成心理压力~问题内容前后是否符合逻要给于某种指导~而对于编写指导语来说~最主要的辑等方便反复考虑这些部分的前后顺序。,C,具体 的写出每一部分中的问题及答案~并安排好它们在该标准~就是简明易懂。 ,3,问题和答案:开放式 部分中的顺序和形式。,D,最后对全部问题的形问题:就是不为回答者提供具体的答案~而由回答者 式、前后顺序等方面从总体上进行修订和调整~然后自由回答的问题。优点:允许回答者充分自由的按自将结果抄写在另一纸上~形成问题初稿。 己的方式发表意见~不受限制~因而~回答往往是最缺点:修改调整问题不如前者方便。 自然的。所得资料也往往比封闭式问题丰富生动。缺<3>两种方法的区别:前者是从问题开始~由部分到点:<1>要求回答者有较高的知识水平和文字表达能整体~后者相反~先从总体结构开始~由部分到具体力~限制了调查的范围和对象。<2>要求回答者花费问题。 ,3,试用和修较多的时间和精力。<3>得到的资料难于处理~尤其 改:<1>客观检验法:将设计好的问卷初稿打印几十难于定量的分析和处理。封闭式问题:就是在提出问 份~然后在正式调查的总体中选择一个小样本来试题的同时~还给出若干个可能的答案~供回答者根据用。检查项目:,A,回收率,,B,有效回收率:自己的实际情况从中选择一个作为回答。 优点:即除掉各种废卷后的回收率,,C,对未回答的问题<1>回答方便~对文字表达能力无特殊要求。<2>回 的分析,,D,对填答错误的分析。 <2>主答者花费时间精力较少。<3>所得资料集中~便于进 观评价法:将设计好的问卷初稿抄写或复印若干份~行统计处理和定量分析。缺点:<1>所得资料失去了 开放式问题的那种自发性和表现力。<2>回答中的偏分别送给该研究领域的专家、学者、研究者的同行以误难以发现。 及典型的被调查者等~请他们根据自己的经验和认问卷内容三个基本方面:<1>有关行为方面的问题,识~从各个不同的角度和不同的方面直接对问卷进行<2>有关态度或看法方面的问题,<3>有关回答者个评论~指出各种缺陷和错误。 人背景的问题。 ,4,其他资料:如问卷64、 问卷设计的具体方法,北大92<设>:某项的名称、编号、问卷发放及回收日期、调查员、审核问卷调查要了解群众对“社会治安状况”、“物质生活员姓名、被调查者住址、问题的预编码等。 状况”和“经济发展前景”的看法、意见或态度。试针 62、 问卷设计的基本原则,人大2000<简>:简对这三个方面~各设计两项问题,一项是封闭式~一述问卷设计的原则和基本步骤,: ,1,把为被调查项是开放式,,北大96<设>:试设计一份简单的问者着想作为问卷设计的出发点。主要错误有:<1>问卷~并说明你的研究目的~研究假设~主要变量和设卷设计得很长~问题太多~需要填答的量太大。<2>计问卷的框图,北大99<设>:试设计一份调查问卷问卷中要求被调查者进行难度较大的回忆和计算。 ,8-12个问题,~并说明你的研究目的~研究假设和,2,对阻碍问卷调查的因素有明确地认识。问卷调问卷设计的框图,变量关系图,,: 查实质上是调查者与被调查者之间的一种社会互动过,,,问题的形式: <1>填空式:这种形 式常用于那些对回答者来说既容易回答~又方便填写程。 有以下障碍:<1>主观障碍:即由被 的问题,通常只须填写数字,。<2>是否式:即答案调查者心理上和思想上对问卷产生各种不良反应所形 只有肯定和否定两种~回答着根据自己情况选择其成的障碍。包括:,A,畏难情绪,,B,顾虑重 一。弱点:得到的信息量太少~类别太粗~不能了解重,,C,漫不经心,,D,毫无兴趣, 和分析回答者中客观存在的不同层次。 <3>多项<2>客观障碍:指被调查者受自身的能力、条件等方 选择式:即给出的答案至少在两个以上~回答者选择面的限制所形成的障碍。包括:,A,阅读能力的限其一。<4>矩阵式:当询问若干个具有相同答案形式制,,B,理解能力的限制,,C,表达能力的限的问题时~可以将其设计成矩阵形式。优点是:节省制,,D,记忆能力的限制,,E,计算能力的限空间~问卷显得紧凑。也节省了回答者阅读和填答时制。 ,3,从多个不同角度来考虑间。 <5>表格式:和矩阵式十分相似。除了具有问卷的设计工作:<1>调查目的的影响,<2>调查内矩阵式特点外~还显得更为整齐醒目。注意不宜多容的影响,<3>样本性质的影响,<4>资料处理分析用~以免呆板单调。 ,2,答案方法的影响,<5>问卷使用方式的影响,<6>调查经的设计要求:<1>保证答案具有穷进行和互斥性。费和时间的影响。 <2>根据研究的需要来确定变量的测量层次。<3>当63、 问卷设计的主要步骤: ,1,探索有些问题的答案如果要将他们全部列出~即使不是不性工作:最常见的方式~是问卷设计着亲自进行一定可能也是十分困难的~可以采取列几个主要答案~然时间的非结构式访问。,2,设计问卷初稿:<1>卡后加上一项其他。如果问卷回收后选择“其他”一类的A,根据设计者在探索性工作中的记录、印片法:,回答者非常多~那就说明所列举的那几类还不恰当~象或认识~把每一个问题及答案单独写在一张卡片还有更重要的类别没有单列出来。 ,3,问题的上。,B,按照卡片上问题的主题内容~把问题卡片语言和提问方式,南大95<简>:设计问卷是怎样艺分成若干堆。,C,在每一堆中~按日常询问的习惯术地提出问题。,:规则:<1>尽量用简单的语言,与逻辑~排出问题的先后顺序。,D,根据问卷的逻<2>问题要尽量简短,<3>避免双重含义问题,<4>问辑结构排出各堆的前后顺序~是全部卡片连成一份完题不要带倾向性。人们对问题的回答在一定程度上很整的问卷。,E,从回答者阅读和填答问卷是否方受问题措辞所表现出来的倾向性~也称诱发性的影便~是否会造成对回答者心理的影响等不同角度~反响。<5>不用否定式提问。<6>不问回答者不知道的复检查问题的前后连贯性及逻辑性~对不当之处逐一问题。<7>不直接问敏感性问题。<8>问题的参考框调整~并可补充一些新的问题卡片。,F,把调整好 架要明确。参照框架:是指问题相对于什么背景而的问题依次写在纸上~形成问卷初稿。 言~在什么范围内或对什么方面而言。 缺点:在第一阶段些具体问题时~由于缺乏总的结 ,4,问题的数目和顺序:问卷不宜太长~问题不宜构~所以常常漏写某些方面的问题。 太多~一般以回答者能在30分钟内完成为宜。 <2>框图法,北大2000<名>,:,A,根据研究假设 安排问题顺序的规则,南大2000<简>:在问卷中~和所需资料的逻辑结构~在纸上画出整个问卷的各个 问题的排列应遵循怎样的原则,:<1>被调查者熟悉部分及前后顺序框图。,B,从回答者回答是否方 第14页 袁方《社会学研究方法教程》笔记 的、简单易懂的问题放在前面~比较生疏、比较难回大大扩大了应用范围。<5>能在回答问题之外~对被答的问题放在后面。<2>把能引起被调查者兴趣的问访问者的态度行为进行观察~结构式访问能获得自填题放在前面~把容易引起被调查者紧张和顾虑的问题问卷无法获得的有关访问对象的许多非语言信息。 放在后面。<3>把开放式问题放在问卷的结尾部分。,3,结构式访问的缺点:<1>与自填问卷相比~费<4>先问行为方面的问题~再问态度方面的问题~最用高~时间长~因而往往使调查的规模受到限制。后问个人的背景资料。<5>按一定的逻辑顺序排列问<2>对于敏感性、尖锐性或有关个人隐私的问题~它 的效度不及前者。<3>对访问员的要求更高。<4>由题。 ,5,相倚问 于结构式访问采用统一的问卷和表格进行调查~这种题:在问卷中~有些问题只是用于样本中的一部分调 统一的问卷和表格显然无法包括时间的全部~故而只查对象~而且某个调查对象是否回答这一问题~常常能选区几个方面调查~这就是这种类型的访问很难触要依据他对前面某个问题的回答结果而定。这样的问及到社会生活的深层及其变化过程~难于综合性的多题~称之为相倚问题~而前面的那个问题则叫做过滤层次的把握问题~使研究流于表面化。对某些统计结问题或筛选问题。 果~由于不知道有关的社会背景情况~而无法进行恰65、 问卷设计的常见错误,北大95<简> 简述问当深入的解释。 卷设计中常见的错误~为避免这些错误~问卷设计是68、 无结构式访问:又称非标准化访问~它是一应遵循何种原则,:,1,问题含糊:即问题的含义种被控制或无控制的访问。事先不预定问卷、表格和不清楚~不明确或有歧异。,2,概念抽象。,3,问提问的标准程序~只给调查者一个题目~有调查者与题带有倾向性。,4,问题提法不妥。,5,双重含义被调查者就这个题目自由交谈~调查对象可以随便得问题。,6,问题与答案不协调。,7,答案设计不合谈出自己的意见和感受~而无需顾及调查者的需要~理。,8,语言中的毛病。,9,其他方面的问题:表调查者事先虽有一个粗线条的问题大纲或几个要点~格设计过于复杂、问题太多、不正确等,封面信介绍但所提问题是在访问过程中边谈边形成~随时提出不够、过于简单、或过于罗嗦、不简明扼要,校对检的。 ,1,无结查不够~出现一些印刷错误等。 构式访问优点:<1>弹性大~能充分发挥访问者与被66、 问卷法的特点及运用,北大93<简>:试说访问者的积极性。<2>访问者能对问题作全面、深入明个案研究、社区研究与问卷调查的主要区别。北大得了解。<3>能获得有关研究对象生活与行动与其中94<论>:试比较问卷调查与个案研究的特点及优缺的环境的生动地感觉。 点,: ,1,问卷法的优点:<1>节省时,2,无结构式访问缺点:<1>比较费时~其规模受间、经费和人力。<2>具有很好的匿名性。<3>可以限制。<2>对访问员素质要求更高。<3>结果难与定避免偏见、减少调查误差。<4>便于定量处理和分量分析。 ,3,重点访问:又称析。,2,问卷法的缺点:<1>对被调查者的文化水集中访问~是集中于某一经验及其影响的访问。 平有一定要求。<2>回答率往往难以保证。<3>不能具体做法:<1>选择一定的情境~并把调查对象安排保证填答问卷的环境和填答的质量。,3,问卷法的到这一预先设臵好的情境中去~或者是选择那些曾经应用:在实际社会研究中~问卷法作为一种主要的资经历过这种情境的人做访问对象。<2>然后对他们进料收集方法~常常与大规模的抽样调查以及资料的定行访问~调查他们在情境当中的主观经验~即个人对量分析相联系。可以说~抽样-问卷-定量分析三者的情境的认识与解释~这种主观经验及时重点访问的重结合体~是现代社会学定量研究中最常见~也是最重点所在。重点访问的假设:透过某种刺激~可是调查要的一种方式。问卷法要求被调查对象有一定文化水对象在情境上产生特殊的反应。研究中从这些反应获平。其适用范围还受到调查对象总体构成情况的影得信息~再加以解释。 重点响~在成分单一的总体中比在成分混杂的总体中适访问严格地说应当是半结构的~而不是完全无结构用。 的~因为访问问题及时措辞没有事先确定~但问题的 内容是事先确定了的。 应用:<1>重点访问第九章:访问法 在分析特殊经验所引起的态度变迁上~效果较大~因 此常常被社会心理学家用来研究大众传播的效果。67、 结构式访问,北大2004<名>,南大95< <2>由于重者访问总是以一个预先的假设为基础的~名>:标准化访谈,:,1,结构式访问又称标准化 因此还常常被用于正是以前有关人类情境行为假说的访问~它是一种对访问过程高度控制的访问。这种访 正确程度。 特点:问的对象必须按照统一的标准和方法选取~一般采用 由于这种类型的访问中往往收集到的是许多不可比较概率抽样。访问的过程也是高度标准化~即对所有被 的材料~因而分析解释工作难度较大。此外这一方法访问者提出的问题~提问的次序和方式~以及对被访 的运用需要高度的技巧与想象力。 问者回答的记录方式等是完全统一的。为了使这种统 ,4,深度访问,北大92<名>,北大97<名>,人大一性得到保证~通常采用实现统一设计、有一定结构 97<简>:简述深入访谈的基本类型,浙大99、2000<的问卷进行访问。访问中所有调查员都必须严格按问 名>,:又称临床式访问~它是为搜集个人特定经验卷上的问题发问~不能随意对问题作解释~当被调查 的过程及其动机和情感资料所作的访问。对个人生活者表示不明白时~只能重复一边问题或按统一的口径 是的访问是个人生活史研究中获得资料的主要方法之进行解释。通常这种类型的访问都有一份访问指南~ 其中对问卷中有可能发生误解问题的地方都有说明~一。生活史研究是一种对人们的生活经历进行详细了这些说明规定了访问者对这些问题解释的口径。 解和分析的研究方法~它采用访问、观察或由被研究,2,结构式访问的优点:<1>访问结果便于量化~者自己写自传等方式~对某一社区或某一群体中的全可作统计分析~它是统计调查的一种。<2>能够控制部或部分个体的生活经历进行详细地了解~如实记录调查过程~从而可以最大限度的降低来自被调查者方下研究对象生活经历中各方面的情况~然后将不同个面的误差~提高调查结果的可靠程度。<3>与自填问体的生活史进行统一的整理和归纳~找出共同点和不卷相比~回收率高~而且回收了的问卷的应答率也同点~并找出其中典型的个案作为描述和解释的例高。<4>应用范围更广范~可以问一些比较复杂的问证~以此来反映这一群体的社会生活状况以及他们的题~并可选择性地对某些特定问题作深入调查~因而 第15页 袁方《社会学研究方法教程》笔记 心理、思想、态度和观念等。 时。,D,要研究个人生活及社会需求、冬季或者生深度访问特点:<1>与重点访问相似~也是一种半结动的存在、文化背景下的群体行为时。 构式访问~它选区研究问题的某些方面向研究对象提<5>特点与作用:,A,能从个案的详细描述和分析问题~访问是机动的或结构松散的~但重点与焦点是中~发现影响事物的主要因素及其作用~从而导致假有的。<2>允许在访问中对以外的因素充分探索和深设的形成~并找出群体或类型的详细资料。,B,很究~研究人员可能由此而获得某种重大发现~这种偶多场合下~个案研究亦被认为是完成一个正式研究的然重大发现往往带来研究问题的突破。 必要的结束手续~即研究的结果可用个案研究印证是,5,客观陈述法,北大98<名>,:又称非引导式访否正确。,C,它的最大优点是对于个案的社会背景问~最大特点是让调查对象对他自己和他周围的社会进行深入全面地把握。 先做一番考察~在客观的陈述出来~即调查者鼓励调69、 访问的程序与技巧,南开2000<简>:访问查对象把自己的信仰、价值观念、行为以及他所生活时应特别注意那三个环节的问题,:,1,访问准的社会环境客观地加以描述。 备。,2,进入访问。,3,访问的控制:<1>提问控 制:,A,题目转换,,B,对问题的追问,,C,合,6,座谈会:也就是调查会~是一种无结构式集体 适的发问与插话,,D,提问注意事项。<2>表情与访问~即将调查对象集中起来进行共同讨论。 动作控制。,4,结束访问。,5,访问纪录。 座谈会特点:访谈过程不仅是调查者与被调查者的社 70、 访问员的挑选与训练,复旦96<简>:挑选访会互动过程~也是调查对象之间的社会互动过程。要 问员的标准是什么,:,1,特殊条件:<1>性别,求调查者有更熟练的访谈技巧及组织会议的能力。容 <2>年龄,<3>教育,<4>地区。,2,一般条件:<1>易产生一种“团体压力”~是个人顺从多数人的意见~ 诚实与精确,<2>兴趣与能力,<3>勤奋负责,<4>谦而不敢表示异见。因此~对一些敏感的问题~不宜采 虚耐心。 用这种方法。与个别访问相比~更难做深入细致的研 71、 访问法的特点,南大96<简>:试述访谈法究。 座谈会应 的特点,: 优点:用:这一方法常被用于验证或调查集体行为与群体关 ,1,它是一种面对面的社会交往过程~访问者与被系的倾向~以及心理治疗和企业及组织诊断。典型调 访者的相互作用~相互影响贯穿调查过程的始终~并查业常用这种方法。 座谈会要求:根据长期实践经 对调查结果产生影响。因此~能获得自填问卷无法获验~调查会人数以5-7人为宜~最多不要超过十人。 得的有关访问对象的许多非语言信息。,2,访问具参加调查会的人员一般应具有代表性~了解情况~敢 有很强烈的个人色彩~即它在很大程度上取决于访问于发言~并且最好是相互信任~有共同语言的人。访 者个人的人际交往能力~访问技巧的熟练程度以及对谈前应将访问的具体内容、要求和到会人员的名单告 访谈过程的有效控制。因此更复杂而难于掌握。诉参加调查会的全体调查对象。正式访问前~访问者 ,3,与其他调查方法相比~访问可以获得的资料更应做好充分的准备、拟定好访问提纲。 丰富~实行起来也更灵活、弹性更大~应用范围更广座谈会的两种方式:<1>头脑风暴法,复旦96、97< 泛~且有利于对问题进行更深入的探索。,4,环境名>,:即会议主持者不说明会议的明确目的~而只可控是访问法的另一大优点。,5,访问法还可以充就某一方面的总议题~请到会者自由发表意见~会议分发挥研究人员的主动性和创造性~训练和培养他们主持者不发表意见~更不对别人的意见内容提出评的想象力、人际交往能力以及对事物的洞察力~激发论。<2>反向头脑风暴法:即会议首先列出某方面的他们对问题的新的认识和解决问题的新思路。 问题~参加这不仅自己发表意见~而且必须针对别人缺点:,1,无法做到完全客观,,2,对敏感型问的意见展开批评与评价~以寻求解决问题的途径。注题、尖锐问题和隐秘问题~被访问者一般不愿当面回意事项:调查会上要避免让某些权威人士的发言左右答~或者不做真实回答~一般不宜用访问法。,3,其他人的发言~或受调查会主持人的意见左右~而要无法用语言表达的经验情感过程~以及许多人的互动使各种意见都能得到充分发言。 资料、心理经验、身体的动作以及场所和速度的变化,7,无结构式访问与个案研究,北大92、2003<等社会测量的资料都不宜或无法用访问法获取。名>,北大93<简>:是说明个案研究、社区研究与问,4,与其他访调查方法相比~费用较高~费时较卷调查的主要区别,北大94<论>:是比较问卷调查长~需要的人力较多。 与个案研究的特点及优缺点,:<1>主要特点:处理72、 量表与测验法,北大94<简>:试比较问卷问题深入全面细致。是一种从整体上处理问题的方和量表的异同,北大96<简>:试说明调查量表、社法~也就是从事务的多个方面和整体情况~从各个层会计量法、民意测验的特点及各自的运用范次间生动联系以及从历史发展状况把握问题。 <2>围,:,, 将个人作为个案研究单位时~研究资料的来源有:73、 量表的概念,浙大2001<名>;南大2000<,A,个人文献资料,,B,访问资料,,C,观察所名>,: ,1,量表与的资料。 <3>个案研究的形式:维度:维度属于理论范畴~它表示现象的某一层次或,A,描述和解释个案~提供有关当前的状况和它不某一方面~或者说~它在抽象层次上表示从某一角度断运行的动力的信息。这种分析可称作列举性分析。看待现象时的某种连续统一体。维度与理论分量的概他是利用一般规律或规则进行特殊个案的分析~机用念常常被看作是同义的。与维度不同~量表与指标都一个以及的概括作出一个特殊的分析。,B,通过对是用来捕获和再现理论维度的经验工具~即对理论维单个个案的分析~发展出经验的概括或理论~不是以度的一种代表。可以说~量表和指标是用在经验层次个案去发现它作为一个系统的有关的一切~尔是把它上对现象的连续统一体的测量。,2,量表与指标作为理论建构的经验基础~使用特殊个案发展一般陈,北大2004<简>:指标和量表的主要不同点,:<1>述。 <4>应用:,A,作为和社会状况及文化社会研究中~量表的概念最经常地用来表示包括着判背景相关的东西~要进行具体详细地研究时。,B,断或主观判断的测量。在社会科学中~某些测量仪器要研究某个对象、某人、某种状况的自然发展或生活也不称作量表~因为他们也不包括判断。<2>量表通史时。,C,如果不能确保整个社会状况或有关因素常是由多项测量内容综合而成的。每一项内容都可看的复合关联的事实~技术社会过程的分析就不能进行作是经验变量的一个指标或指示标志。而一个量表就 第16页 袁方《社会学研究方法教程》笔记 可有两个或更多个指标所构成。因此~我们也可以把特曼量表~它是格特曼,L.Guttman,1944年设计使量表视为衡量概念,或变量,的综合指标~它不同于用的。它也是目前使用较为普遍的一种量表。格特曼一个单项指标。 ,3,量表和指数:在社会研究量表是单维的~即量表自身结构中存在着某种由强变中~两者区分不严格~但不完全相同。指数也可由一弱或由弱变强的逻辑。因此也不会像利克特量表那样组指标综合而成。这组指标分别对一个复杂概念的不形成分数相同而态度结构形态不同的现象~它的每一同部分进行测量~然后对这组指标的树枝进行累加或个量表总分~都只有一种特定的回答组合与之对应。其他运算就可综合为一个指数。而这主要区别:量表,1,社会距离量表:又称鲍格达斯量表~它是美国必须由一套问卷问题所构成。指数则可以依据其他的社会心理学家鲍格达斯于1925年创用的。这种量表资料。一般来说~指数是由几个数量指标的运算综合过去一直广泛用于测量人们对种族群体的态度~现而成的。而量表则由对一组问题的回答“计分”综合而在~它也被用来测量人们对职业、社会阶层、宗教群成的~他常用于测量人们的态度。 ,4,量表作用:体等事物的态度。鲍格达斯量表由一组表示不同社会相当于一把尺子~作用在于精确度量一个较抽象的或距离或社会交往程度的陈述组成。它要求被调查者根综合性较强的概念~特别是度量态度和观念的不同程据自己的看法对这些陈述表态。在这一组问题中~实度或差异。,5,量表缺点:设计比较复杂~测量的际上蕴含着一种超强的逻辑结构。除了某些例外情况信度和效度还不太高。 外~量表本身的逻辑结构使我们能够得出这样的结74、 量表的类型,北大2002<简>:为什么要区论:即当一个人拒绝了量表中一项关系~那么它也必分调查量表和测验量表,:量表可分为调查量表和测将拒绝这一关系后面所有更强的关系。鲍格达斯量表验量表。它们分别用于问卷调查和测验中。在问卷调测量所得到的结果~既可以用来比较具有不同特征的查中~使用量表的主要目的是要精确了解总体的状人们对某一群体的社会距离的大小~也可以用来比较况。它的分析重点是群体而不是个人。而在测验中通具有相同特征的人们对不同群体的社会距离的大小。常是要精确的观测个人的某一特征~他的分析重点是特别是将结果绘成统计图后~更便于进行分析。 个人~因此量表设计要严格、精确且具有较高的信度,2,累积量表的制作:<1>研究人员围绕它所希望和效度~这就需要设计大量题目。与此相反~问卷调测量的某一事物或概念编制一组陈述~这些陈述应该查中的量表题目较少~效度不要求很高。研究目的不是单维的~即具有某种趋强结构。<2>然后用一个小同~量表的设计也不同,对于目前尚不能精确量度的样本对这些陈述进行检验。<3>将检验的结果~按最事物~可以通过大量题目~也可以通过大量样本的主赞成的陈述道最不赞成的回答者~从上到下排列<4>观判断来间接的近似的反映。 然后从中去掉那些不能很好区分赞成的回答者与最不75、 总加量表,北大93<详>:试说明总加量表赞成的回答着的陈述。<5>按公式:,再现系数=1-误的制作程序~并设计一个量表,包含5个语句,来测差系数/回答总数,计算出再现系数。如果再现系数量“十四大”以后群众的政治态度,:目前使用最广泛大于或等于0.90~我们就称该量表是单维度的。每个的总加量表是利克特量表~它是由美国社会心理学家人的态度的分就是他回答赞成的项目总数。 利克特于1932年在原有的总加量表基础上改进而成,3,格特曼量表的优点:可以直接根据被测者所同的。该量表由一组陈述组成~每一陈述有“非常同意的陈述的数目及他的量表分数~来决定他对这一概意”、“同意”、“不一定”、“不同意”、“非常不同意”五念或事物的赞成程度~这也正是格特曼量表的最大优种回答~分别记为1~2~3~4~5~每个被调查者的点。 ,4,格特曼量表的缺点:态度总分就是他对各道题的回答所的分数的加总~这<1>我们对一组陈述具有单维性的假设是有局限性一总分可说明他的态度强弱或她在这一量表上的不同的~这种单维性往往只是某一部分人的态度模式~一状态。,1,总加量表的制作程序:<1>根据所要测组特定的陈述可能在某一群体中表现出单维模式。同量的内容或变量收集大量与这一内容有关的问题~然样~在一个时期中是单维的模式~但到了另一个时期后初步筛选出一组问题作为量表草案。<2>确定问题却不一定还是单维的。<2>单维的领域往往难于找的类别和计分标准。<3>试调查。从调查对象中找一到。 些人尝试回答量表草案~以便发现量表设计中有什么77、 语义差异量表,北大99<名>,南大99<问题~是否会引起误解。更重要的是检查每道题的分名>,:是用一组意义相反的陈述或形容词构成一份辨能力。分辨能力是指一个题目是否能区别出人们的评价量表~以用来测量人们对某一特定概念或事物的不同态度或不同程度。<4>计算个题目的分辨力~删不同意识和感受。 去分辨力不高的题目~保留分辨力较高的题目组成正78、 测验,北大2000<简>: 试述测验法与民意测式量表。利克特量表检查分辨力的方式是:将试调查验的异同,:测验是以间接的方式收集个人的态度、中的分最高的25%的人与得分最低的25%的人进行人格结构和心理行为等方面资料的方法。它是一种标比较~然后计算出每道题的分辨力。 准化了的程序~在这个程序里~受测人对一组预先设,2,利克特量表的优点:<1>容易设计,<2>使用范计好了的刺激做出反应~这些反应能够使得测验者能围比其他量表要广~可以用来测量其他一些量表所不够以一个数或一组数来描写受测者~并有这个数或一能测量的某些多维度的复杂概念或态度。<3>通常情组数推论受测者拥有这个测验所想测量的心理行为的况下~利克特量表比同样长度的量表具有更高的信状况。,1,测验方式:<1>直接测量:对于行为的测度。<4>利克特量表的五种答案形式使回答者能够很量~通常是直接测量。<2>间接测量:对于心理特方便的标出自己的位臵 。 征~测验是通过对反应的测量而间接的测定与其对应,3,利克特量表的缺点:<1>相同的态度的分着具的心理特性。测验通过刺激-反应的联结关系将个体有十分不同的态度形态。因为利克特量表是一个项目内在的人格、心理与外在的行为联系起来~从而达到总加的分代表一个人的赞成程度~它可大致上区分个通过对外在行为的观察测量而推论它所联结的内在人体间谁的态度高~谁的低~但无法进一步描述他们的格、心理特征的目的。测验中~作为刺激的~可以态度结构差异。 是:一个或一组量表~一件工作~一个模糊不清的信76、 累积量表,南大95、96<名>:累积量表号等。,2,能力测验:<1>一般智力测验,<2>特殊法,南大98<名>:古特曼量表,:累积量表又称格能力测验,,3,成就测验:目的在于测量某个人对 第17页 袁方《社会学研究方法教程》笔记 某项工作已经知道多少货能够完成某种程度。主要测种当他一旦离开将会使群体至少分成两个小群体的量:<1>工作知识或见闻,<2>工作技能,<3>还可通人~成为主要联络点。那种当他连同另一个人同时离过对他人施测~以了解他的工作效绩。,4,人格与开将会使群体至少分成两个小群体的人称为次要联络兴趣测验:<1>自陈式测验,<2>投射测验。 点。如果社群图中孤立者和联络点多~则会增加群体 内信息、意见与情感沟通的困难。 79、 社会计量法,北大96<问>:试说明调查量 指数分析:即通过社会计量指数分析个人在群体中的表、社会计量法、民意测验的特点及各自的适用范 围,北大99<简>:简述社会计量法的特点和分析方地位~比较同一群体内不同情境下每个人的社会地法,复旦96<名>,人大2001<名>,浙大99、2001<位~且对不同群体的特征进行比较。 常用到的指数有:,A,社会地位指数:表明个人在名>,: ,1,社会计量法:也称社会交往计 群体中受重视的程度,,B,首选地位指数:表明个量~是评量某一群体、组织中的人际吸引或拒斥关系 人在群体内所受支持的程度。,C,高和低选择者:的工具~或更进一步说是:用以决定个人在群体与组 受选择数在平均选择数一个标准差以上者~低选择者织中被接受的程度~发现群体内人与人之间的现存关 是在其以下者。,D,吸引率:表明群体内吸引作用系~并解释组织本身的结构特征的工具。社会计量法 发生的程度,,E,团结指数:表明群体的团结程是美国心理学家莫雷诺等人1930年所创用的~主要 度。,F,调和指数:表明团体中调和的程度。用于小整群体的人际关系与群体结构的研究。 ,G,内群亲近率和外群亲近率。前者显示群体成员,2,社会计量法常用的方法:<1>准绳法。采用问 对本群体向心的程度,后者显示成员的离心程度。 卷收集资料~对群体实施整体调查。在设计问卷时要 社会计量法的作用:运用社群图和指数分析~我们可确定以什么为准绳来测量所要了解的人们之间的关 以直观地得到群体性质的概貌~即有关群体的下列信系。准绳通常是一个问题~回答这可以在群体内选择 息:,A,群体的结构类型,,B,群体内信息沟通若干人来回答这一问题。准绳的选择关键是要准确反 方式,,C,群体的内聚力,,D,群体内人际关映出所要测量的关系,其次要具体而切实~易于被调 系,,E,群体中的领袖人物,,F,群体间的关查者了解和回答~切忌空泛模糊~一般情况下不使用 系。 ,4,社会计量法的应消极的准绳。<2>量表法。即使用量表~让回答者对 用:<1>领导才能的评价与干部选拔,<2>工作分群体中每个成员的素质、个性或有关行为作出评判。 配,<3>士气的考察,<4>组织诊断和治疗,<5>评<3>群体偏好记录法。即直接要求回答这对群体内每 价。 个成员表示“喜欢”“不喜欢”或“关心”“不关心”等态 80、 民意测验,北大93、94、2004<名>,北大度。 <4>“猜是谁”技术。即给出一些表述~要求 回答者找出群体中最符合这些表述的人。 ,3,96<问>:试说明调查量表、社会计量法、民意测验的 特点及各自的适用范围,北大2001<简>:试述测验社会计量法的分析技术: <1>社会矩阵 法与民意测验的异同,:也称民意调查、舆论调查~法:是一个n*n方形表格~n是被测群体人数~左方 是一种了解公众对某些政治、经济、社会问题的意见的一列数字为选择者的代号~上方的一行数字为被选和态度的调查方法~其目的在于通过对大量样本的问择者的代号~表中的1、2、3表示第一、第二、第三卷调查来精确反映社会舆论或一般民意动向。 选择~表的底部数字为每人所获选择的总数。为了解,1,民意测验的作用:<1>客观及时地反映社会舆选择的分布、互选数量及小整群体成分~可将社会矩论和大众心理的一般状况和变化情况。<2>为制定或阵转化成各种统计表~获得更多有意义的资料。<2>评价政策、措施提供依据。<3>对大众心理进行分析社群图法:社群图,北大98<名>,南大96<简>:同和预测。 ,2,民意测验的程序:<1>心圆式社会关系图制作方法,南大2000<简>:社会确定调查课题,<2>确定调查对象和抽样方案,<3>关系图是怎样形成的,:是以图形综合群体成员间的设计调查问卷,<4>发放和回收问卷,<5>对调查资选择~图中每一个圆圈中的数字表示一个工人~它们料进行统计分析。 之间发生选择用箭头连接~箭头指向被选择者~如果,3,民意测验的优缺点:<1>盖洛普认为~只要采是互选则用双箭头。绘图时应当注意通常是将受选数用科学的抽样方法~那么当样本数量达到一定规模最多的放在中间位臵~次多者臵于他的周围~受选数后~就能较好的反映总体~这时样本在增加样本并不极少或无人选择者臵于最外围。此外在绘图时还应尽能提高多少精确度。对美国一亿人的民意测验~抽取量避免线条交叉。 社群图分析:,A,孤独者数量,1500-2000人的样本就可以达到足够的精确度。<2>所谓孤独者指的是既不选择他人又不为他人所选的其次~他指出:“通过近五十年的民意测验~我们发人。,B,意见领袖的数量。在群体中被10%以上成现~公众的集体判断是极为可靠的~特别是在那些他员提名的人被称为意见领袖。如社群图中缺乏意见领们熟悉的问题上。公众实际上常常比它们选出的领导袖~且图又显得散乱时~表明群体结构松散。,C,人更早的接受创新和社会变革。” 缺点:<3>由于民对偶数量。一对互选的成员称作一个对偶。愈是团结意测验是用简化的方式来了解公众的一般态度~他对的群体~其对偶数也愈多。,D,串联的数量。这是不同含义、不同程度的意见、态度都用是或否、赞成指3人以上的连锁关系。串联是群体团结的要素~串或反对者两种答案来概括~因此它很难做出深入地分联数愈多~愈长~群体关系就越紧密。如果社群图中析和理论解释。<4>民意测验只限于询问一些公众熟互选的对偶数多而且有较多的长而重叠的串联时~显悉、易于回答的问题~它获得的信息较为表面化、简示群体或组织有相当完整的结构与良好的沟通网络~单化、缺乏深度。此外~对于公众不熟悉或缺乏了解成员之间相互比较了解且关系融洽。,E,小群体的到问题~回答的信度和效度有可能较低。 数量。小团体由3个以上成员组成~每个人至少选择优点:<5>能迅速的了解群众对某些问题的看法~及一个小团体中的成员~并至少被一次~小团体构成一时反映社会舆论的变化情况,<6>调查结果能推论总种封闭的连锁关系。在一个群体或组织中的这些小团体的一般状况~具有较高的代表性。<7>只需抽取较体为非正式团体~多由兴趣、爱好、工作等原因形少比重的样本就能了解总体和全局的情况。 成。如果社群图中这种非正式小团体明显存在并且小 团体之间又很少沟通时~则群体容易产生摩擦。第十一章:观察法 ,F,主要联络点与次要联络点的数量。在群体中那 第18页 袁方《社会学研究方法教程》笔记 81、 观察的类型:,1,按场所:<1>实验室观者:他要求观察者既能够成为群体的一员~又能在不察。<2>实地观察。,2,按观察者角色:<1>局外观暴露研究者身份的情况下询问问题。这是一种要求研察。<2>参与观察。,3,按观察程序不同:<1>结构究者采取虚伪的角色的情形。<4>完全的参与者。实式观察。<2>非结构式观察。事先并不专注于某些特际上就是间谍的类型。在整个观察的过程中~被观察定的行为和特征~在观察过程中也不知是期待这种行群体的成员都相信他就是这一群体中的一个普通成为的出现。他们只是当行为发生时进行全面的观察并员~一点也不知道他是一个观察者。,3,参与观察记录下来。因此~非结构是观察的资料通常不能像结法的优点:研究者生活在所研究的对象群体及社区中构是观察所的资料那样进行定量处理。,4,按观察间~对许多现象都能够得到生动具体的感性认识。同对象分:<1>直接观察。即对那些正在发生、发展和时~他还能公开询问想了解的任何问题~可收集到许变化着的人们的行为所进行的观察。即研究者当时亲多采用其他方法难以得到的资料。,4,参与观察法眼目睹人们的行为举止。目睹正在发生的各种事件和的不足:被观察的人们会十分现实的感觉到他们正在过程。<2>间接观察。 被观察~从而有可能改变他们的行为方式。也就是82、 实验室观察:常常是为了了解人们某些具体说~参与观察者在客观上必然会影响到被观察对象的的、细微的行为特征~这些行为特征则是作为命题中行为。,5,参与观察的主要问题:<1>进入现场。概念,或变量,的指标被观察的。常常采用结构式观<2>观察内容。<3>观察的时间地点。<4>与被观察者察的形式。也可以是无结构的~它预先不建立一套分的关系,人大96<简>:简述在观察中如何控制观察类系统,而是涉及一种情景让观察者自由活动~通常者与被观察者的社会距离,。观察者首先要确定自己是设计一些游戏~然后观察者在观察孔或单向镜后面担任哪种角色~然后根据这种角色的要求确定与被观进行观察~并采用投入理解发分析游戏过程中的一系察者的关系。在实地参与观察中~与被观察者建立良列行为。这种观察在于详细地了解行为的过程和特好关系是顺利开展研究的一个必要条件。观察者应当征~理解被观察者的行为动机和价值规范。 遵守当地的风俗习惯~学习他们的语言、参与他们的83、 局外观察,南开2000<名>:非介入收集资活动。要使被观察的群体或社区接受~建立相互信任料方法,:由于社会研究的对象是有思想、有感情的的关系~可采取不同的策略:,A,一种是要表现出人~所以许多研究方法都不可避免地会引起研究对象谦虚、谨慎的态度~使被观察者认为你不会危害他们的各种反应~从而影响到研究结果的客观性和准确的生活。,B,借助上级机关和领导人的支持~显示性。为了克服这种现象~十分重要的一点就是要使被出自己的重要地位~是当地的人认识到你的研究的重研究的人意识不到他们正在被研究~同时又要保证他要性 。,C,取得当地关键人物的支持~是他们意识们在一种极其自然的、不受研究人员干扰环境中行到你的研究也与他们的某些利益相一致。 <5>观察的 准确性。 ,6,无结构参动。局外观察就是观察者臵身于所观察的现象之外~ 与观察中的理论指导:<1>在进入现场前要查阅理论冷眼旁观研究对象的活动和表现。 文献~了解前人的研究和理论观点~从而选取一定的84、 结构式观察:事先要对观察的范畴详细分 研究角度和观察角度。<2>在观察过程中要注意所观类~对各项内容的观察和记录方法逐一规定。常将注察到的事实是否验证或推翻了过去的理论。<3>通过意力 集中到若干具体的、明确的、许多还是可以计对观察资料的分析建立新的理论。 数的行为和特征上。这样~结构式观察的结果通常可86、 间接观察,北大92、97、2000<名>,复旦以象问卷调查的结果那样进行定量的处理和分析。 96<名>,:其对象通常不是正在活动着的人们~不是,1,观察的范畴和分类。,2,观察的记录和分析。人们当时的行为和表现~也不是正在发生的事件和活结构式观察预先都制定专门的观察卡片~卡片上明确动~而主要是人们行为以后、事件发生以后所留下的列出各种观察范畴和分类~观察者只需在相应的格内各种痕迹。 ,1,物质痕迹观察:是指人们的行为标记~而不作出自己的评价。观察卡片设计的原则:所留下的迹象。<1>腐损测量:腐损是指人们在活动简单、易行、可靠、准确。 时有选择性的使用某类物体所造成的腐蚀和腐损。85、 参与观察,北大93、94<名>,北大2000<<2>累积物测量:对人们遗留下来的物质进行观察~论>:试举例说明参与观察的实施过程和方法论意来推测人们的行为特征。 ,2,行为标志观察:义,:指观察者亲自投身到所观察的社会现象和社会这种观察是通过一些表面的或无意识的现象来推测人生活中去~在自身成为社会生活中各种活动的一员的们的行为方式和价值观。它假定~这些现象是人们行同时所进行的观察。,1,特点、应用及目的:多采为或态度的间接反映。 用无结构式观察。是人类学和民族志最常用的研究方,3,间接观察的优点:对被观察者没有任何影响~法。它们的研究对象多是原始社区或特殊的文化与亚不会使他们产生反应~因此可以收集到真实行为的资文化群体。近几十年~人类学和社会学也将这种方法料。 ,4,间接观察的缺运用到对现代社会某些特定群体和社区的研究中。 点:很难对效度进行检验~无法知道所观察的标志和全面深入地描述某一特定的文化现象。它预先并没有迹象是否真正反映了所要调查的行为或现象~即使能什么具体的理论假设~也很难通过其他方法获得所需够反映的话~也很难断定这种行为-指标的关系是否要的资料~因此需要在研究领域内部进行长期观察~具有普遍性。所以间接观察一般都作为辅助手段~用从大量现象中概括出研究对象的主要特征。研究目的以对其他方法进行补充和检验。 和特点决定了观察者要有较高的参与程度。在实地研 究中~研究人员努力忘却他们自己的文化~试图在当87、 观察的信度和效度:,1,观察的步骤:准地的文化环境中再社会化。 备阶段:<1>确定研究目的,<2>制定观察计划,<3>,2,参与观察的类型,南大94<简>:使用观察法时理论准备和物质准备, 实施阶段:<4>进入观调查者可以哪些角色出现,:<1>完全的观察者:即察现场,或实验室,,<5>与观察对象交往,或与被局外观察者。<2>作为参与者的观察者:研究者的身试者交谈,,<6>进行观察,或测量,~作出现场记份是被所研究和观察的群体知道的~即人们都知道他录, 资料处理阶段:<7>整理和分析观测记录~进是一个研究人员。它是以这种公开的身份参与到被研行统计分类~得出观察结论,提出理论解释。<8>撰究群体或社区中进行观察的。<3>作为观察者的参与写调查报告。 ,2,观察的效 第19页 袁方《社会学研究方法教程》笔记 度: 在观察的准备阶段: 第十二章:实验法 <1>要选择适当的观察方法~然后根据这种方法~对 89、 社会科学研究现象之间相互关系的方法有两研究者角色的规定来确定观察方案。<2>在观察地点 种:实验法和相关分析法。后者主要限于对过去的统的选择上应考虑他是否适合研究目的。<3>对观察对 计资料进行处理~它一般对研究环境很少控制。实验象的选择也要考虑研究目的和观察者角色的影响。 法则是在研究现场中进行~资料搜集与研究过程同<4>对内在理论效度影响较大的理论准备过程~即观 步~它对研究环境实行一定的控制~因此实验不仅可察范畴的选择和操作化。 以根据原因去预测结果~而且还可以通过控制原因去在观察的实施阶段~影响内在经验效度的因素较多~ 发现预期的结果。,1,实验法的主要特征就是控制主要来源于:<1>被观察者的反应。<2>观察者本人 情景和变量来研究社会行为和社会现象的变化~以建的价值观和期望的影响。<3>观察者本人感官和记忆 ,实验分类:<1>实验室实立变量间的因果关系。,2力的影响。 结构式观察只要在各个阶段 验:它限于在有专门设备的实验室中进行~并对实验上注意消除干扰因素的影响~就可以达到较高的内在 的条件、控制以及实验设计都有严格的规定。<2>实效度。无结构的观察和间接观察的内在效度不易检 地试验:它一般在实际场所中进行~它的实验设计并验~但它们的外在效度较高~而且具有其他方法所不 不很严格。 及的优点。 ,3, 90、 实验法的基本原理:实验研究的目的是建立观察的信度,北大95<问>:以无结构观察法为例说 变量间的因果关系。实验法的基本原理:首先以一个明实地研究中误差的主要来源及其防范措施,: 理论假设为起点~这个假设一种因果关系的陈述~它观察的信度包括三种类型:<1>不同观察者的相关 假定某些自变量会导致某些因变量的变化。然后进行度,<2>稳定系数~计统一观察者在不同时间观察的 如下操作:,1,在实验开始时对因变量进行测试,符合度,<3>信度系数:即不同观察者在不同时间内 ,2,引入自变量~让它发挥作用或影响,,3,在实观察的符合度。 无结构观察的信度很难 验结束前在测量因变量,,4,比较前测与后测的差信赖~也很难检验~除非对一切都进行录像。因为无 异值就可以检验假设。如果没有差异~就说明自变量结构观察主要依靠具体观察者的感官和主观描述~这 对因变量没有影响~从而推翻假设。如果有差异~则种主观描述不是以数量表示的~也不是标准化的~很 可证实原假设~即自变量对因变量有影响。为了排除难相互对比。观察的信度是随时间递增的~而且有较 其他因素的影响~通常将受试者分为两个组:实验组多记录的行为类别其信度也较高。 提高观察 与控制组。这两个组是随机选派的~他们的所有特征信度的方式:<1>通过在不同时间的重复观察,<2> 和条件都相同~只不过在实验中~实验组收到自变量增加观察者的人数。但前一种方法更为可信一些。 的影响,而控制组为受到这种影响。分两个组进行试88、 观察法的作用和特点: ,1,观察 验的目的是要考察自变量x引起的变化E。因为即使法的作用:观察法可以提供有关社会行为的详细的、 不引入自变量~由于某些其他外部因素的影响~在一第一手的资料~可以对社会情景有直接的感性认识。 定时间后,几小时、几天或一年,后测的数值也肯定观察法还用来搜集用其他方法很难获取的信息。特别 不会与前测的数值相等。外部因素的影响由U表是当研究者与被研究者无法进行语言交往或处于不同 示。实验组所收的影响~实际上是有两部分组成的:文化背景的情况下~常采用观察法。观察也是提出理 一部分是由于外部的因素~另一部分是由于新引入的论假设的基础。 ,2,观察 自变量~即de=U+E。由于实验组和控制组的构成是法的优点:<1>它可以当时当地观察到现象或行为的 采取随机分派的原则进行的~因此实验组所受到的外发生~从而掌握第一手资料,<2>观察一般是在自然 部因素的影响与控制组所受的影响相等,即都等于环境中进行的~因此~它对研究对象得扰动较小~从 U,。这样~实验组真正受到的自变量的影响E应该而可以得到自然条件下真实行为的资料。<3>观察法 为:E=de-U。 特别适用研究无语言文字沟通的调查对象。<4>可以 实验的主要组成部分:,1,自变量与因变91、弥补其他方法的缺陷。社会调查中~经常遇到调查对 量:自变量是实验中的刺激因素~是有待检验的、引象不愿接受访谈~拒绝回答以及不交回调查问卷的情 起因变量变化的原因。因此~自变量应该是能够引起况。此外~即使回答或填写问题~也有可能有意歪曲 某种变化的。同时~必须经过严格定义和操作化~这真实情况或因记忆不清等愿意产生较大的误差。采用 样~才便于在实验中进行测量。因变量是一种应该有观察法可以避免上述局限性。 自变量所引起的状况~它是研究的关键点~是要被解,3,观察法的特点:<1>观察的直接性和自然性, 释的现象。这种因变量应该在状况上与实验前有所变<2>观察者本人的主观意识和价值取向更多介入到观 化~也应该在接受自变量刺激的对象和未接受这种刺察对象和观测资料中,<3>观察具有广泛性~观察法 激的对象之间有所不同。实验者应该尽量让自变量处使用的场合更多~观察者的范围更广~甚至未经多少 于一种自然的状态中被观察和测量。,2,实验组和专业训练的人也可以采用这种方法。 控制组,北大2004<名>,南开2000、2001<名>,南,4,观察法的缺点:<1>难以控制环境变量和时间变 大2000<名>,:在实验中~我们把接受自变量刺激量~很难进行数量分析和统计判断,<2>观察资料会 受到观察者的价值观和感情因素的影响。<3>通过记的一组对象叫做实验组,而把不接受自变量刺激的一 录而得到的大量观察资料很难整理分析。<4>在实际组叫做控制组。设臵控制组的主要目的~是为了将研 研究中~要做到科学的观察是非常困难的。这主要在究本身对实验对象的影响~与实验刺激的影响区分开 于社会过程与自然过程有某些本质区别:,A,社会来。为了达到这一目的~就要求在实验开始前~实验 过程受大量偶然因素的影响~很少会出现完全相同的组与控制组成员的各方面条件和状况都相差无几~即社会现象。因而很少显示出严格的规律性~只有通过基本上不存在大的差别。,3,前测与后测:在实施 多次~详细的观察才能得到比较可靠的资料。,B,实验刺激以前对实验对象进行的测量称为前测。而在对社会过程的观察和理解要受观察者本人的价值观~实施实验刺激后对他们的测量成为后测。 情感因素和知识结构的影响。,C,观察者的在场会92、 实验的基本程序:,1,准备阶段:<1>确影响研究对象的习惯行为和行动的正常进程。 定研究问题和研究目的,<2>提出理论假设和工作假 第20页 袁方《社会学研究方法教程》笔记 设,<3>进行实验设计。,2,实施阶段:<4>选取实因素的影响~只有一些交互作用效应影响它的实验效验对象,<5>实施实验,,3,资料处理阶段:<6>整度。两组前后测实验设计由于无前测~因此效度最理分析资料,<7>撰写研究报告。 高。但事物前测也有一定局限性~它无法比较不同时93、 实验的三项基本内容:,1,变量的选择和间的变化~而且无法检验在实验开始时两个组的特征分类:在用实验法研究某个问题时~首先要把与研究值是否相等。 课题有关的各种因素挑选出来~然后分析这些因素之96、 多组实验设计:,1,所罗门四组设计:这间的关系~建立因果模型,2,变量的控制:对自变种设计精确测量干扰因素和交互作用效应的影响~它量的控制就是要有计划地、系统地安排实验刺激的情综合了典型设计和无前测设计的优点:该设计可以测景和程度~是其作用于因变量。控制外部影响的方量自变量、外部变量和测量干扰这三类因素各自对因法:<1>随机法:这是最常用的方法~在理论上也是变量的影响。所罗门四组实验设计的实验效度较高~最有效的控制影响变量的方法。<2>配对法:这种控可以区分出外部因素和测量干扰的影响。缺点:<1>制变量的方法是找出两个各种条件都完全相同的人~设臵四个组~必然要增加受试者人数~从而增加了实对其中一人分派到实验组~另一人分派到控制组。验的困难,<2>所的结果必须经过复杂的统计检验。<3>排除法:在实验之前把其他影响因素排除在外。<3>它只能判断其他外部因素对因变量有否影响~但<4>纳入法:把其他主要的影响变量也当作自变量引无法确定哪些变量与因变量间还存在着因果关系。 入到实验中~同时对几个自变量进行操作、测量和检97、 多因素设计:可以检验多个自变量对因变量验。,3,变量的测量。 的影响。这种设计是典型设计的扩充~它有三个实验 组~各个组的自变量强度有明显差异。多因素设计的94、 简单实验设计:是对单项假设进行验证~即 另一形式是考察两个以上的自变量对因变量的影响以考察一个自变量与一个因变量之间的因果关系。此 及自变量之间交互作用对因变量的影响。一般也称为外~它只分为一个实验组和一个控制组~或仅有一个 因子设计。它假定外部因素的影响等于零。因子设计实验组。 多组实验设计则有三个 为消除前测引起的敏感影响并减少工作量~一般都运以上的组~它可以考察多个自变量于因变量之间的关 用无前测的设计。有两个自变量~每个自变量有两个系。 简单实验设计的几种模式: 值~分为四个组~这样的通常称为,2*2,因子设,1,单组前后测实验设计:没有控制组。这种设计 计。因子设计可以同时包括多个自变量~每个自变量一般在研究人员能够确定外部因素不会对实验产生影 也可以有多个取值。但是~随着自变量的增加~实验响即U=0的情况下采用。否则~它无法区分因变量 组的数目也要相应增加。 的改变有多少是自变量引起的~有多少是其他武官变 98、 重复测量设计:不是对不同组的受试者施以量引起的。 ,2,典型实验设计,北大 不同的实验刺激~而是对每个组都给以不同的试验刺98<名>,南大96<简>:一控制组实验设计方法,: 激。实验效果不是以不同组的观测值差异值来表示~两组前后测实验设计。主要优点:<1>比较实验组和 而是通过每个组对不同刺激的差异来反映。它是一种控制组前测与后测的差异值~不仅可以确定自变量的 轮换的方法~即每个组都先后接受不同的测量~然后影响~而且还可以排除外部因素的影响。<2>可以排 通过比较每一组不同测量的平均值就可以检验不同刺除前测造成的某些干扰因素。 主要缺点:受 激造成的不同差异。优点是:,1,不用随机抽取实试者经过一次前测~所以可能会对自变量的引入产生 验组和控制组~而只需选取几组实验对象让他们参加敏感~这样~虽然不会影响内在效度~但会影响和降 各种项目的测验~因此~不必担心组间特征之随机误低实验的外在效度。在前测会引起受试者敏感的情况 差的影响。,2,只需较少的受试者就可以达到实验下~应考虑采用无前测的实验设计。 目的。,3,它的实验假设可以有多个~即一个实验,3,两组无前测实验设计:这一设计中~实验对象 可以同时检验几个假设。重复测量的局限是:对有些一般是随机抽取和随机分派的。在实验组引入自变量 易于引起受试者敏感或产生较大交互作用效应的实验之后~同时在两个组测量因变量。 变量不能进行重复测量。这种设计一般在无法进行随,4,简单实验设计的特点:只考虑一个因变量与一 机抽样而只能进行整群选择时采用。 个自变量的关系~因而操作容易~简单易行~可以检 99、 拉丁方格设计:也是一种多因素设计~但是验和建立明确的因果关系。但是~他将现实生活中错 与因子设计不同~它不是考察多个自变量与因变量的综复杂的关系简化为单一的因果关系~这就大大降低 关系~而是考察多个自变量的引入顺序对因变量的影了实验结论的概括能力和外在效度。因为现实事物往 响。这种设计可以引入多个不同自变量~这些自变量往是“多因多果”的。另一个缺点:他将所有的其他影 只有一个取值。实验组的数目取决于引入的自变量~响因素都作为无关变量加以控制和排除~忽视了各种 有多少个自变量就分派多少个实验组。每个实验组都因素间交互作用的效用~因而降低了实验的内在效 依次引入各个自变量~但引入的顺序各不相同。一般度。 来说~拉丁方格设计无法测量出交互作用效应~它只95、 交互作用效应:是指实验刺激,自变量,的 能检验实验顺序对因变量的影响~并判断自变量之间影响,用E表示,~外部因素的影响,U,与前测干是否存在交互作用。拉丁方格设计的缺点是:,1,扰因素的影响,P,三者之间相互作用所产生的影它必须保证各组成员的特征相同~不会影响实验结响。实验刺激与前测干扰的交互作用用I表示,PE果。,2,各种自变量是共同发挥作用的~因此~无 法区分每一个自变量对因变量的单独影响。这种设计I实验刺激与外部因素的交互作用表示,前测与EU一般在特殊场合才采用~即检验自变量的组合方式对 因变量的影响或找出最佳组合方式时才采用。 外部因素的共同作用用I表示,这三类因素的共PU100、 准实验法,北大96<简>:准实验与实验室 实验有何区别,准实验的主要设计方法是什么,,:I同交互作用效应用表示。单组前后测实验设计PEU就是没有严格的进行指派和严格控制实验刺激的实验由于假定前测和外部因素影响很小~且将这些因素的方法。它通常不是在纯粹的实验室环境中~而是在研交互作用忽略不计~因此他的测量结果误差较大~效究现场进行~他们常常依据现场的条件和可能性来设度较低。典型实验设计通过控制组排出了前测和外部 第21页 袁方《社会学研究方法教程》笔记 计实验方案~并对纯粹的实验设计加以简化。 社会学试验大部分还不具备采用严格设计的条件~他,1,准实验法的特点:<1>它的实验假设并不一定是们通常只能成为准试验~而在纯试验设计或实验室研因果关系的假设~也可能是相关关系的假设。 <2>究中~大多是研究社会心理学和教育学的课题。准实它很少采用严格的随机抽样。<3>它通常缺乏前测和验和纯实验均有其优缺点和局限性。此外~在多种形控制组。 ,2,有人认式的实验设计之间~也没有绝对的优劣之分~他们都为~这种实验没有严格执行实验方法的准则~因此~适用于某些特定的研究目的和研究领域~研究人员应它不是科学的实验。但更多社会工作者认为:<1>科依据研究目的之要求来选择最适当的实验设计。 学并不是一春试验为起点和目的的~科学的发展必须101、 实验的信度和效度:,1,信度:与其他搜利用现实所能提供的手段和技术~而不能等待完美的集资料的方法相比~实验法的信度和内在效度较高。方法产生以后再进行研究。<2>同时~实验设计本身对信度的检查一般是通过重复试验的方法~观测实验也是一个从无到完美的不断发展过程。而目前~社会的前测和后测也可以检验信度。另一种方法是在多组科学的实验已基本具备了科学方式所要求的条件。尽设计的情况下~通过各个组在同一次试验中的差异来管它并不总是能检验或建立因果关系~但这种“准实检验信度。,2,效度:实验目的是检验变量间的因验”至少是能检验相关关系并能发现新的事实的。 果关系~并使实验结果具有概括性。但这两个目的是,3,相关设计:通常指交互分类设计~这是社会学很难同时达到的~要精确测量自变量的影响~就要严研究中最常用的分析方法之一。它的形式近似于两组格控制情景和外部变量~但这会使实验环境人工化并无前测设计。但是~试验组和控制组不是随机分派~缺乏代表性~从而降低外在效度~而如果提高情景的而是根据试验变量的要求选取的。 相关设计缺点:真实性和样本的异质性以使实验能概括广泛的现象~<1>由于对个试验对象没采取控制~所以无法排除其则很难控制其他外部因素的影响~因而降低了内在效他变量的影响~因而~他的内在效度较低。<2>相关度。大部分试验设计都面临着这两种困境~若提高内设计的另一缺点是缺少前测~无法进行时间序列的比在效度则有可能降低外在效度~或者相反。这也是纯较。解决这一缺陷的一种方法是~增加一个事后回溯试验与准试验的不同之处~前者内在效度较高~外在设计~即在引入试验刺激并加以后测之后~在询问被效度较低~后者则相反。 影响外在效度的因试者过去的状况。以此与因变量的后测值比较。 素主要是:<1>实验情景的人工化,<2>实验样本缺 乏代表性。 影响内在效度的因素主要是:,4,时间序列设计,北大2002<名>,:也称趋势研 <1>社会现象和社会行为的因果关系很复杂~影响因究~一般用于研究较长时期内人们的态度和价值观念 素很多~对这些变量很难实施控制。<2>对社会因素的变化。是对相关设计的扩充~它也是一种交互分类 很难明确界定和测量。 设计~不过~它的前测和后测包括多个时点~由此组 为了提高内在效度~我们可以从以下方面来考虑各种成一个较长时间序列的观测值~从这些因变量的变化 危害实验内在效度的问题~并尽可能减少和控制他们趋势中可以发现自变量的影响程度和影响过程。 的潜在影响。<1>有关实验对象方面的问题:,A,时间序列设计有多个观察点~而且在每一时点都对试 对象选择:即用来进行比较的两个群体之间是否本身验组和控制组加以测量~因此~从它的差异可以发现 存在差异。,B,对象的丧失:即是否所有的对象都因变量的变化趋势~由此可以预测未来的发展变化~ 一直在研究中。,C,实验与控制组的竞争。<2>有并在实际发展过程中检验这种预测。 时间 关试验程序的问题:,A,测量的影响。,B,器械序列设计的缺点:,1,无法判定所假设的自变量是 操作。,C,实验处理的模仿。<3>有关时间的问否对因变量由主要影响~因为在很长的时期内~会有 题:,A,成熟的影响。,B,历史的影响。 许多其他因素导致因变量的变化。,2,测量态度和 102、 实验法的优点和缺点:,1,实验法的优价值观的变化是很困难的~由于趋势研究是要不断的 点:<1>能够确立因果关系。<2>花费较少。<3>易于观测社会发展变化和新的社会现象~它很难利用现有 重复。<4>控制能力强。,2,实验法的缺点:<1>缺的量表和标准问卷~因此无法确定测量工具的效度。 乏“现实性”。实验室中的社会过程往往也不能代表现,5,非等组前后测设计:这种设计的形式与典型设 实世界中的社会过程。<2>样本的缺陷。实验结论所计相似~但是~它的试验组与控制组是不等同的。其 依据的那些实验现象与现实世界中的人们往往大不相优点:<1>不仅可以得到后测的差异~而且还可以知 同。<3>实验人员的影响。<4>伦理及法律上的限制道前测的差异。<2>可以得到更多的信息。 其缺点 ,人大97<简>:简述实验方法中的社会伦理问是:由于两组是不等同的~因此无法推论x与y的因 题,:由于社会研究的对象是人~因而实验所能操纵果关系~因为y的变化很有可能是不同的试验对象所 的自变量常常受到现实生活中伦理或法律的限制。比固有的~没有控制实验对象的固有特征就不能检验出 如~我们不能为了进行有关人口密度和侵犯行为间关x的真正影响~最多只能说明所假设的自变量与因变 系的实验~而让众多的实验对象长时间禁闭在拥挤的量之间存在着相关关系。 ,6,现场试 室内~也不可能让他们之间发生各种暴力侵犯的行验设计:准实验一般都是在自然环境中进行的~研究 为。 人员虽然不能对自然场所的变量加以严密的控制~而 且很难采用随机抽样方法是试验组和控制组完全保持第十三章:文献法 一致~但他们可以结合研究目的对试验变量和现场环 境加以一定的控制~这种实验也称为实地实验或现场103、 文献法,南大2000<简>:通过分析历史文试验。 其特点是:隐蔽性、真实性和概括献~可以建立社会骚乱、经济衰滞、政治腐败之间的性都较高。因此~具有较高的实用性。 其缺关系。请给出一例,:在严格意义上文献法并不是一点:对实验变量和外部变量缺乏严格的控制。为了弥种资料收集方法~而是一种研究方式---------即既包括补这一缺陷~应当尽可能的在相似状况下重复同一项资料的收集方法也包括对这些资料的分析方法。它不实验~以提高实验的效度和信度。 是直接从研究对象~即人那里获取研究所需要的资,7,准实验与纯实验在原理上没有严格的区别~准料~而是去收集和分析现存的、以文字形式为主的文试验只是由于现场和研究条件的局限不得不将纯试验献资料。 设计加以简化。当然~当条件许可时~应尽可能采取 交严格的试验设计~以提高实验的效度。但是~目前 第22页 袁方《社会学研究方法教程》笔记 104、 文献的类别及来源:,1,文献:指的是包品。所谓“明显的”是指这些形式外在的东西。“进行含我们希望加以研究的现象的任何信息形式。,2,客观的、系统的”描述~意味着内容分析是一种规范类别:根据文献具体来源的不同~分为个人文献,主的方法。它要求研究这根据预先决定的计划~采取一要指个人的日记、信件、回忆录及自传等,、官方文定的规则~按照一定的步骤来进行。而“定量的”描述献,主要指政府机构和有关组织的记录、报告、统则说明内容分析方法的基本性质。它意味着~在内容计、计划、信函等,及大众传播媒介,主要指报刊、分析中~其主要目标通常是决定内容中某一项目的频电影、电视等,三大类。也可以分为原始文献,或第数~或者决定某一类别在整个内容中所占的比例等。一手文献。指的是有亲身经历某一事件或行为的人所此外~还对这些定量的结果进行分析。 写的资料,和第二手文献,文献学上称二次文献。是,1,内容分析的步骤:<1>抽样:通过抽取有代表利用别人的原始文献所编写或产生出的新的文献资性的样本的方法~来达到研究全部对象的目的。<1>料,两大类。 ,3,利用官方统计资料应注意:编录:即根据特定的概念框架~对信息-----无论是口<1>应该对统计资料的内容、对象、范围、特点等等头的、文字的、画面的或是其他形式的------作分类记都具有清楚明确的认识。<2>对于各种统计指标、比录。与编录有关的问题有两个:,A,选择编录单率和数字的实际含义、他们的计算方法等等应十分清位:即选择具体的观察和点算单位。要注意把它与分楚~不能含糊。否则就会出现错用资料的情况。 析单位加以区别。,B,制定一份编录单:编录单是,4,历史文献:往往是指那些再形成的时间上举目对文献材料进行观察和记录的工具~在某种程度上~前较远并且文献的作者以及所记述的时间和运动的当它同结构式观察所用的记录但十分相似。它的形成和事人都已去世的资料。在通常情况下~历史文献更多结构将主要依赖于编录单位的选择。一旦选定了编录的为历史学家所运用。 单位~研究这就要为他们制定和赋予数值。分类的基105、 第二手分析:,1,定义:也称二手分析~本要求是要满足互斥性和穷尽性。 指的是对那些由其他人原先为别的目的收集和分析过,2,内容分析的类型,,北大2000<简>:简述比较的资料所进行的新的分析。<1>一种是从别人为研究研究法的主要类型,:<1>计词法:是内容分析中最某一问题而收集的资料中~分析与该问题所不同的新简单、最常用的方法。这种方法是~首先确定与研究的问题。即把同一种资料,已有的~别人的研究所收问题有关的关键词,记录单位,~然后统计这些关键集的资料,用于对不同的问题的分析和研究中。<2>词在各个样本,分析单位,中出现的频数和百分比~另一种类型则是用新的方法和技术去分析别人的资最后进行比较。<2>概念组分析:有时~使用主题作料~以对别人的研究结果进行检验。即用不同的分析为记录单位不易划定主题的界限。此时~可以利用概方法处理同一种资料~看看是否能得出同样的结论。念组分析。它是将与研究内容有关的关键词分成小,2,第二手分析的步骤:<1>选择研究主题:适用组。每组代表一个概念~同时也是理论假设中的一个于第二手分析的主题可以使相当大的~它有时仅仅只变量。这种方法记录的单位仍然是单词~但分析时的能采用那种在一个国家规模上所得到的数据资料。通变量却是概念组。 <1>语义强度分析:首先是给常~在研究设计中~要留有一定余地~以便一旦发现出词汇的“强度权”~已显示他们在使用时的差别。强相关的资料中并不具备你所想要得各种特征时~就可度权是由词汇的语义所决定的~如“爱”比“喜欢”的加以稍微修改你的研究设计~以保证与可用资料的一致权数高。,3,内容分析的优点:<1>省钱省时。<2>性。在主题与资料的关系上~第二手分析往往要求主保险系数大。<3>允许我们研究在一个长时期中所发题去适应资料~而不是相反。这主要是因为数据资料生的过程。<4>是一种非干扰性的研究方法~不会打是已定的~无法变动的~研究者只能在处理和分析资扰我们的研究对象~不会对这些研究对象发生影响。料的方法上、技术上动脑筋。而研究主题则是可以随,4,内容分析的缺点:<1>只局限于对记录下来的时调整的。<2>寻找合适的资料。最好的途径是阅读信息进行分析和研究。<2>资料的效度也存在一定的一份相关的研究。当发现一组对你似乎十分有吸引力问题。 的数据资料时~你可以仔细地阅读论文的资料部分对107、 现存统计资料分析:,1,步骤:<1>选择资料的内容、收集方法等等的描述。如果是在一本著合适的资料。许多研究常常要求大量的聚集资料与此作中发现这组资料的~那么~书中一般都有介绍资料相适应。<2>处理资料。我们通常所能做的~是比较的收集方法和过程的专门章节。此外~在书后的附录那些基于较小的单位。<3>说明资料来源。以使得这中~还可以找到诸如问卷、指数计算方法等详细的信种资料能够被理解。否则别人就会对你的证据的可靠息。<3>对资料的再创造。首先~必须从资料中寻找性和准确性产生怀疑。,2,效度和信度:逻辑推理或重新定义所要研究的变量。其次~应该仔细地研究和重复验证这两条科学的原则~对于保证现存统计资这些变量。最后~你也可以掷去样本中的一部分作为料分析的消毒来说是极其重要的。现存统计资料的信分析的对象。<4>分析资料。第二手分析的最主要也度在很大程度上依赖于统计资料本身的质量。 是最大量的工作~就是对资料的重新分析。 108、 文献法,南大98<简>:文献分析法与闻讯,3,第二手分析的优点:<1>省时省钱又省力。<2>方法相比有那些突出的特点,:,1,文献法的优特别适合于比较研究和趋势研究。,4,第二手分析点:<1>具有无反应性的优点。<2>费用较低。<3>可的缺点:其缺点主要在于资料的准确性和适用性。某以研究那些无法接触的研究对象。<4>适于作纵贯分个研究者为其特殊的目的所收集的数据资料不一定与析。,2,文献法的缺点:<1>许多文献的质量往往难另一研究者的研究旨趣相符,而二手分析研究这所需以保证。<2>资料不易获得。<3>许多文献资料由于要的资料有可能完全搞不到。实际上~这样的资料对缺乏标准化的形式~因而难于编录和分析。 于第二手分析研究人员来说~效度是较低的。即原始 第十四章:资料整理 问题所测量的并不是二手分析研究这所希望测量的变 量。 109、 资料分析,复旦96<简>:理性分析与统计106、 内容分析,人大97<名>,南大97<名>,:分析有什么关系与区别,:资料分析不仅决定着收集是这样一种研究技术~它对各种信息交流形式的明显到的资料是否有价值~而且能够很好的检验假设和理内容进行客观的、系统的和定量的描述。所谓“各种论~或者适当地回答所研究的问题~还能够以可以理信息交流形式”指的是各种书面材料、宣传品和艺术 第23页 袁方《社会学研究方法教程》笔记 解和令人信服的形式描述研究成果。通过分析~研究反映现实社会现象。,c,为此~分类必须服从于研者可以将认识从具体提高到抽象、从个别提高到一究目的~必须能反映现象的本质特征。,B,互斥性般~并可从中发现新问题、提出新假设~将研究引向原则:指分类标准应当互斥~以使同一条资料只能归深入。在某种意义上来说~分析的水平决定着整个研于一类。,C,完备性原则:指分类标准的确定应当究的水平。,1,社会统计学:是有关社会资料收使每一份资料都有所归属。,D,各类别必须处在同集、整理、分析和推论的一整套方法~它不仅包含全一分类层次。 <3>资料分类的方法:部抽样理论、统计检验理论和大部分的社会测量法~,A,前分类:指收集资料前就已定下分类标准~然而且使分析技术获得极大的发展~主要是多元统计方后按分类指标收集和整理资料。,B,后分类:指在法的发展~如路径分析、因素分析等。 资料收集完成后~在根据资料的性质、内容和特征分 类。定量资料一般采用前分类~定性资料一般采用后110、 资料整理:就是对收集到的原始资料进行检 分类。 <4>分类的查、分类和简化~使之系统化、条理化~以为进一步 功用:<1>指出社会现象或社会单位的类型。<2>反分析提供条件的过程。因此~资料整理既是资料收集 映总体的内部结构。<3>分析社会现象之间的依存关工作的继续~又是资料分析的前提。 系。 ,3,资料的汇总和编辑:111、 定性资料的整理: ,1, 基本要求:<1>完整和系统,<2>简明集中,<3>拉扎资料的审查:目的是消除原始资料中的虚假、差错、 斯菲尔德提出以下操作步骤:,A,定义对个案进行短缺、余冗等现象~以保证资料真实、可信、有效、 分类的标准。,B,决定在各个个案记录的指标中登完整、合格~从而为进一步整理分析打下基础。对定 载于这一分类标准上的项目或与这一分类有关的项性资料的审查主要集中在真实性、准确性和适用性 目。,C,根据各指标在标准上的位臵~给予数值和上。<1>真实性审查:也称信度审查~即看资料是否 符号。,D,为了决定表示各个案位臵的最终指数~真实可靠的反映了调查对象的客观情况。方法: 要汇总各个案记录的分数。 ,A,根据已有的经验和常识进行判断。,B,根据 112、 定量资料的整理: ,1,材料的内在逻辑进行核查。,C,利用资料间的比较 资料的审查:<1>完整性审查:,A,资料总体的完进行审核。,D,根据资料的来源进行判断。 整性。,B,每份资料的完整性。<2>统一性审查:<2>准确性审查:也就是效度检查~一方面是审查收 首先是检查所有问卷、报表登记填报方法是否统一,集到的资料符合原设计要求及对于分析所研究的问题 其次要检查对同一指标的数字所使用的量度单位是否有效用的程度。另一方面是审查资料对于事实的描述 一致~以及不同表格对同一指标的计算方法是否统一是否准确~特别是有关的事件、人物、时间、地点、 等。对于统计资料的统一性审查包括:,A,审查指数字等要准确无误~切忌事实资料含混不清~模棱两 标的定义和分组的标准是否与自己研究的分类相一可~数据资料笼统模糊。<3>适用性审查~也就是考 致。,B,审查指标统计总体范围是否一致。 <3>察资料是否适合分析与解释。主要包括:资料的分量 合格性审查:,A,提供资料者的身份是否符合所规是否合适、资料的深度与广度如何、资料是否集中紧 定的调查对象的身份。,B,所提供的资料是否符合凑是否完整等。<4>对于文献资料的分析评价~首先 填报要求。,C,所提供的资料是否正确无误。方是进行所谓的“外在批判”~即审查:是在什么地方、 法:,a,判断检验。就是根据已知情况判断资料是什么时间、什么人、为什么目的、用什么方法编写这否真实正确。,b,逻辑检验。即从资料的逻辑关系些文献的。<5>还要进行“内在的批判”~即了解资料来检验其是否正确真实。,c,计算检验。通过各种的编写者表达的什么内容~在什么条件下编写这些资数字运算来检验各项数字的正确性。<4>整个审查要料~内在批判要注意:,A,对作者适用的词~特别经历三阶段:,A,由调查员进行审查。,B,有现是多义词~价值语进行反复的推敲。,B,在文笔的场专职的检查员进行检查。,C,调查结束后由调查表现上特别要区分“事实”和“对事实的解释与推论”。组织机关的检查员进行检查~重点是检查回答登记错,C,要进行多方面的研究~看作者是否真实的反映误~计算错误及调查员是否对英调查对象均进行了调了客观事实~资料的叙述是否正确~有无夸张扭曲~查~有无作弊等。 ,2,资料或偏执于一家之言,叙述是否准确~叙述者写作上的的分类和编码:<1>编码,复旦98<名>,:就是将表现能力如何等。<6>实地审查:是在搜集资料的过文字资料转化为数字形式的过程。编码的目的使用一程中进行的~边搜集边审查。<7>系统审查:是在资组变量表示各项调查问题~用每一变量的不同取值表料收集完毕后集中进行的审查。<8>测不准效应:指示对这一问题的不同回答~从而使文字资料转化为数由于观察者的参与~改变了被观察对象的自然状态~字形式。<2>编码步骤:,A,对回答进行分类。被观察者或单位可能做出种种假象来掩饰事实的本来,B,建立回答类别与变量数值之间的对应关系。面目~使真实状态的测定不可能了。 <9>棱镜效,C,注意:,a,对于开放性问题~因实现不能预应:指社会现象的感知和解释都要通过观察者这面棱料到答案的情况~故无法在设计问卷时事先分类~这镜~通过它的价值标准和以往的经验再折射出来~从时~编码就要从对问题的回答进行分类开始。,b,而使观察资料不准确。 一般的讲~开始时分类可细一些~当分析不要求过细,2,资料的分类:分类是将资料分门别类~使繁杂的分类时可以将某些类别进行合并。分类的多少还要的资料条理化系统化~为找出规律性的联系提供依考虑统计分析方面的问题。,c,任何调查都不免有据。<1>确定分类标准:分类的关键在于选择和确定一些回答这对一个问题不做任何回答的情况~为此对分类标准。分类标准的选择往往是基于某种假设或理问卷中的每个提问要增加一个无回答编码。对无回答论~本身就是对所研究问题的一种分析和认识。分类编码的原则是明确区分无回答与其他回答~通常的习标准可分为:,A,品质标准:就是反映事物属性差惯是用9或几个9来代表无回答。对无回答的项目~异的标准。例如性别、民族、企业所有制等。 不能一概简单地认为是缺失数值或回答率低。统计缺,B,数量标准:就是反映事物数量差异的标准。例失数据时~应结合回答人的情况分析。如行政人员不如以人口作为划分大中小城市的标准。<2>确定分类回答“技术职称”是正常的。 标准的原则:,A,有效性原则:,a,这一分类方<3>编码项目:问卷编号、问卷所属区域或部门、其式对于研究目的是有效地。,b,这一分类能有效的他要进行统计的分类标准。 <4>编码方 第24页 袁方《社会学研究方法教程》笔记 114、 统计分析的作用:,1,可对资料进行简化法:,A,预编码:方法是在设计问卷时对回答的每 和描述。,2,可对变量间的关系进行描述和深入地一个种类都指定好其编码值~并印在问卷上。预编码 分析。,3,可通过样本资料推断总体。 主要限于回答类别事先已知的问题~这些问题主要是 115、 统计分析的步骤:,1,对应用统计分析的封闭性问题~或回答已经是数字而不需要做转换的问 前提条件进行考察。统计分析是建立在树立统计理论题。优点:处理资料时比较简单~省时省力。缺点: 基础上的~因此他的应用必须满足一定的理论前提。无法用于开放性回答~因为我们无法事先知道回答的 ,2,制定统计分析方案:<1>再次确定自变量与因种类。,B,后编码,南大2000<名>,:是指对问 变量。<2>定义复合变量。问卷或调查表上出现的各卷的编码过程是在问卷回收之后进行的~而不是与问 个变量~一般称为基本变量或原始变量。用基本变量卷设计同时进行的~多用于对开放性问题的编码。比 组合而成的新的变量~称作复合变量。<3>变量分较费时费力。,C,边缘编码:实际上是一种预编码 方法~它与一般预编码的不同之处在于~这种方法不组:将类别或属性相同的变量组合成有意义的数组。仅指定了编码值~而且给出了每个项目记录回答的空<4>提出统计计算的要求并提出适当的统计方法。间~现在应用得最多。边缘编码是在问卷上每个调查,3,选择统计分析方法的原则。必须根据研究目的项目旁边的空白处标明填写编码的位臵。问卷回收和资料本身的特点选择适当的统计分析方法。从研究后~将每份问卷上的回答变成指定位臵上的编码。目的考虑:是描述性研究还是解释性研究。描述性研,D,编码簿:用以指示每个编码的意义和变量的位究在于说明某种社会现象的状况,对于解释性研究~臵。作用是建立变量和调查内容、变量值与回答类别除了采用描述性研究的方法外~还要使用控制变量、的一一对应关系。它可以,a,作为编码工作的指建立因果统计模型和分类及综合变量等多种统计分析南。,b,使研究者在分析过程中便于查找变量及各技术。研究资料的性质~主要考虑:<1>变量的测量种编码所代表的意义。,E,编码簿的主要项目:尺度,<2>资料的收集方法,<3>数据的分布形态,,a,问题号码。是在调查表或问卷上的问题的题<4>变量的个数。,4,对于统计结果的解释。统计分号~有了题号就可以知道这一题目在资料卡片上的哪析是一种定量分析方法~但任何具体的两都是有质的几列。,b,变量号码。有了变量号码~研究者可以规定性以及数量关系背后的社会背景情况~如果不了知道变量的代号~方便分析计划的拟定~在分析时直解这种质的规定性以及数量关系背后的社会背景情接饮用变量号码而不必提及变量名称。,c,项目名况~就可能做出肤浅、错误的甚至荒谬的解释。因称。又称变量名称~用概括性语言表明项目的含义。此~对于统计结果的分析~有赖于对事物作深入地观,d,编码的内容说明。即给出每一项目问题答案的察和了解~决不能凭表面的数据就轻易的下结论。 分类以及分配给每一类别的数字。,e,列序号。即116、 单变量的统计描述:,1,变量的分布:每一项目应当占哪几列。 <1>频次分布:就是变量的每一取值出现的次数。对,3,资料的登录:<1>个案登录:即将各个调查对象于连续性变量~如定距变量 ~频次的计算必须分组的全部数据资料以编码的形式记录在一张张卡片上~进行。其中每组上限即下一组的下限~通常将下限包即建立个案档案。<2>总体登录:即将所有调查对象括在本组中~每组用组中值表示。<2>频率分布:用的全部数据记录在一张资料卡片上~这种方法适用于变量每个取值的频次数除以总个案数~他是一个相对为电子计算机处理作准备。 指标~派出了样本规模的影响~因而可以用来比较不,4,资料的汇总:就是根据研究目的~对分类后的同的样本。一般频率分布使用比率的形式表示的。各种数据进行计算和加总~汇集到有关的表格之中~,2,统计图与统计表。<1>统计表就是以表格形式以集中系统地反映调查资料总体内部的数量情况。汇来表示变量的分布。在制作统计表时~如果有未回答总的目的:<1>初步了解数据的分布情况。<2>为编或回答不符合要求的情况~可以有两种处理方法:制次数分布表作准备。<3>为深入的统计分析作准,A,仍以调查总数为基础计算频率~这时应加入一备。<4>便于保存调查资料。 类:未详。,B,以有效回答为基数计算频率~这时113、 计算机处理资料的一般过程。,1,输入前应在表的下面、紧接着表的地方注明:未详****户。的准备:<1>资料的审查。<2>资料的分类与编码。<2>统计图:是以图形表示变量的分布情况。统计图<3>登录~即将问卷中的回答转录到资料卡片上。一虽然不如统计表精确~但是更直观、生动、醒目。般将编码、登录与数据输入过程结合起来~为此~越,A,圆瓣图:是用一个圆代表现象总体~每一瓣代来越多地采用也边编码的方式。,2,输入数据:指表现象中的一类~其大小代表他在总体中所占的百分通过对计算机输入设备的操作~将资料卡片中的资料比频率。,B,条形图:多用于描述定类与定序变量送入计算机贮存起来~以备调用。输入方式:<1>键的分布~他是以长条的高度表示变量不同取值的频率盘输入,<2>卡片输入,<3>光电输入。,3,资料的分布的~其中长条的宽度没有意义~一般均化成等宽净化,复旦98<简>:对录入的数据进行检查的主要长条。长条的排列可以使离散的~也可以使紧挨着方法,:<1>幅度检查,北大99<名>,:使用一个自的。,C,直方图:是由紧挨着的长条构成的~与长编的简单程序或者已有的统计软件可以将某一变量的条图不同的是~他的条的宽度是有意义的~实际上它分布显示出来~这样就可以检查出一部分错误。例不是用长条的高度而是用长条的面积表示频率的大如~变量性别的取值只有两个-----1,男,、2小~长条的纵轴高度表示频率密度,频率密度=频率/,女,~因此~5和8是违规数字。这样~我们首先组距,~长条的宽度表示组距。直方图仅适用于定距了解到~性别这个变量的数据有错误。然后~我们可变量。,D,折线图:是用直线连接直方图中条形顶以变出一个程序列出含有性别变量的违规值的学生的端的中点而成的。当组距逐渐减小时~折线将逐渐变编号~通过核对问卷~就可以知道这些违规值是如何为平滑~趋向为曲线。 ,3,集中趋势分出现的~以及如何修正了。<2>逻辑检查:利用变量析:是从一组数据中抽象出的一个代表值~以代表现之间的逻辑关系来净化资料。,4,数据的处理。 象的共性和一般水平。除可以说明某一社会现象在一 定条件下数量的一般水平外,集中趋势还可以对不同第十五章:资料的统计分析 空间的同类现象或同一现象在不同时间的状态进行比 较,以及分析某些社会现象之间的依存关系。<1>众 第25页 袁方《社会学研究方法教程》笔记 M数,北大92<问>:试用分布理论简述算术平均o 数、中位数和众数三者之间的关系,:就是出现频率 最高的变量值。众数可以适用于任何测量层次的变 量~对于定类和定序变量~众数可直接从变量的频率 进行计算。其中L1、L3为含有累计百分比25%与分布中观察到,对于定距变量~如果变量是在第I组75%的区间的下限~U1、U3为对应上限~n1、n3为具有最高的频率密度~则用第I组的组中值表示变量含有累计百分比25%与75%的区间的频次,cf1与 cf3为含有累积百分比25%与75%所在组以前组的累M的众数。<2>中位数:是将观察总数一分为二的d积频次。 ,4,方差与标准差。只适用于定距变M变量值。若将数据从小到大顺序排列~则取值量。方差等于每一观察值与其平均数的差的平方和除d 以观察总数~即 于,N+1,/2处的变量值。当N为偶数~由于 ,N+1,/2处无数值~取中间位臵左右两数的平均 值。对于经过分组的资料~中位数的位臵则是通过计 算累计百分比频率得到的。即首先计算出含有累积频 率50%的区间~然后求出这个区间的上下限值,U、 而标准差则是它的正平方根。 L,最后利用公式 ,5,离散系数与标准分数:离散系数是标准差与平 均数之百分比: 标准分数: N,, ,cf ,,,2 ,,, ()xx,dMLUL,,,cv,,100%计算中位数值。中位数一般用于描述定序及定序以上 ,nZ, 的测量尺度的变量的集中趋势。 <3>平均, 将原始数据标准化有两个作用:<1>确定原始数据在x数:仅适用于定距及定距以上变量~但有时也可用于 总体分布中的位臵,<2>对不同分布的各原始数据进定序变量。如求平均等级。对于分组值~一般用组中 行比较。 值来代替变量值~然后加权平均计算平均数。需要指 117、 双变量的统计分析:,1,列联表,北大出的是~用组中值计算的加权平均数知是用原始数据 92<名>,人大98<名>:偏表、边缘表,:<1>定计算的平均数的近似值。由于分组是人为的~所以在 变量分布不均匀的情况下~不同的分组会有不同的结义:又称交互分类表~所谓交互分类~指同时依据两 个变量的值~将所研究的个案分类。交互分类的目的果。<4>分布与三值的关系:正态分布时~三值重 合,偏态分布中~三值不重合~在正偏态时~由于左是将两变量分组~然后比较个组的分布状况~以寻找边频次密集~这使得中位数偏向左方~但由于右侧的变量间的关系。这样的表又叫作条件次数表。表的最 下一行和最右一列分别是每类地区和每种产业的总次变量取值大~故平均数叫中位数偏右~即平均数>中 位数>众数,而在负偏态时则相反~有平均数<中位数数~称为边缘次数。其分布称为边缘分布。其余的次 数称为条件次数。每一条件下的分布称为条件分布。 <众数。 ,4,离中趋势分 <2>注意:,A,在制作条件百分比列联表时~一般析:用以概括描述数据间差异程度的统计指标。与集 中趋势相比~二者区别:<1>集中趋势描述的是现象应将自变量放在表的最上端横行位臵上。因变量放在 表的最左一列。计算百分比通常是按照自变量的方的共性~而离中趋势描述的是现象的差异性~如果离 中量数大~说明数据分布很分散~这时集中值对数据向~因为研究的目的是要了解自变量对因变量的影的代表性低,反之~则说明数据的分布很集中~集中响~因此应计算在自变量不同取值情况下因变量的变 化情况如何。 ,B,在制作列联表时~应在表的最值对数据的代表性高。<2>在由样本资料推论总体 时~集中值告诉我们的是如何去估计与预测总体~而后一行汇出自变量各类数值的个案总数~并以括号括离中趋势则告诉我们这一估计与预测的误差大小~因起来。 <3>列联表的作用:,A,具有对变量进行描述的作此~两者是互补的。 用。,B,可对不同类别进行比较。,C,是对变量,5,常用的李中趋势测量指标:<1>异众比率:即 关系的一种解释性分析。 <4>列联表应用:可用于非众数的各变量值得总频数在观察总数中的比例。可 各种测量层次的变量~在用于定序变量时~变量应按见~异众比率是对众数的补充~异众比率越小~说明 取值的大小顺序排列。用于定距尺度的变量时~需要众数的代表性越好。<2>极差:是对定序及定序以上 事先进行分组~然后以组的首尾相接顺序排列。 尺度的变量离散程度的测量。它等于最大观察值与最 <5>列联表的优点:直观、资料丰富~不仅可以看到小观察值间得差。极差越小说明资料分布越集中。 关系的有无、大小~而且还可以了解这种关系得详细<3>四分互差,复旦97<名>,:也是对定序及定序以 结构。 ,2,消减误差比例:是指一种对变量间关系上测量尺度的变量离散程度的测量指标。把一组数据 的测定~简称PRE。假设在不知道x的情况下~对y按序排列~然后分成四个数据数目相等的段落~各段 分界点上的数叫作四分位数~即第一个四分位数Q1进行预测的全部误差是E1~在知道x的情况下~由x 预测或解释y的总误差为E2~则由x预测或解释掉y以下包括了25%的数据~Q2是中位数~第三个四分 的误差为E1-E2~消减误差比例PRE=,E1-E2,位数Q3以下包括了总数据中的75%的数据。四分互 /E1。PRE越大~表示以x预测或解释y时所减少的差就是第三个四分位数与第一个四分位数的差~即 误差越多~即x与y的关系越强。换言之~PRE的值Q=Q3-Q1。优点是可以克服极差中几支队资料分散程表示的是用一个社会现象,x,来解释另一个社会现度度量的干扰。四分互差的间距越小~说明中位数的象,y,时~能够消除百分之几的错误~即x对y的代表性越大~数据分布越集中。对于分组数据~求解释力有多大。PRE的值在0与1之间~当E2=0Q1与Q3的方法也可以用线性插值法或直接用公式: 时~PRE=1~说明x与y完全相关~x能百分之百解 释y的变化,若E2=E1~则PRE=0 ~说明x与y之 N,,,cf ,,1间没有关系~x对y无解释力。 4,, QLUL,,,()1111n 1第26页 3N3N,,,, 袁方《社会学研究方法教程》笔记 ,cf,cf,,,,3344,,,,QLUL,,,()QLUL,,,()33333333nn33 ,3,相关分析,复旦96<名>:相关关系,南大99<即两个变量无所谓自变量与因变量之分。G系数具有 消减误差比例的含义。 名>:相关系数,南大95<名>:相关分析 ,:相 关~就是指两个变量间存在一种连带关系~即当一个同序对数异序对数,G, 变量的值发生变化时~另一个变量的值也相应地发生同序对数异序对数,变化。相关分析就是以一个统计指标是变量与变量间其值在-1到+1之间~既表示相关程度~也表示相关的关系~这个统计值称为相关系数。通常大多数相关方向。式中同序对是指某个案在两个变量上的相对等,1,1系数取值在0与之间~0代表无相关~代表完级是相同的~异序对是指某对个案在两个变量的相对全相关~相关系数越大~表示相关程度越强。<1>注等级上是相反的。 意:,A,虽然相关系数可以描述变量之间关系的有G系数是分析两个等级序列的关系的~故又称等级相无、大小和方向~但相关系数多大时才能断定两个变关系数~在社会研究中~它所涉及的往往是研究对象量有必然的、规律性的联系~是很难说的~在统计学本身的的某两种特征间的等级关系。 在等级分布表中~需要大到0.7以上~但社会现象间很少有这样密中~有时两个个案分数相同~分不出高低~这是一般切的联系~所以研究人员一般要结合定性分析来断定用两级的平均值作为这两个个案的等级。 是无内在的、本质的联系。 ,B,数据所显示出的相TT表示仅在变量x上同等级的对数~表示仅在变yx关,或无关,关系~实际上也可能并不反映变量间存 在有意义的关系。 <2>定类变T量y上同等级的对数~表示在两个变量上都同级xy量==定类变量:,A,Lambda系数:,a,对称形TTT的对数。、、叫做同分对~G系数不考虑yxyx式~用表示~即用于测量的两个变量间的关系是, 对等的~即无自变量与因变量之分。,b,非对称形同分对~而只考虑同序对与异序对。 大规模调查中资料的等级分布往往是用列联表的形式式~用表示~几所测量的两个变量间有自变量与,yx给出的~这时~同序对数量等于表内每个频次乘以其因变量之分~x为自变量~y为因变量。 右下方全部频次之和~然后加总。而异序对数量则等 于表内每个频次乘以其左下方全部频次之和~然后加 mmMM,,,()总。 ,,xyxy ,, ,B,系数~与G系数一样~系数也是等级dd2()NMM,,yxyxxy 相关系数~其值也在-1到+1之间~也具有消减误差mM, ,yy,, 比例的意义。不同于G系数的是~系数测量的yxdyxNM,y MM其中~ =Y变量众数的频次,=Y变量每个两个变量间的关系是非对称性的~即所测两个变量有yx 自变量x与因变量y之分~因此~其计算公式: m取值之下的X变量的众数的频次,=Y变量每个x同序对数异序对数,d, m取值之下的X变量的众数的频次,为X变量的每yxyy同序对数异序对数+仅在变量上同等级的对数,个取值之下的Y变量众数的频次,N= 调查对象总当资料是以次数列联表形式给出时~同序对与异序对数。Lambda的取值在0-1之间。Lambda系数具有消T的数量计算方法同G系数~等于列联表中的每个y减误差比例的含义。 频次乘以它有面的所有同行频次之和~然后加总。 ,,B,Tau-y系数~简称系数~它是测量变量间非y,C,斯皮尔曼等级相关系数,Spearman,~一般用,对称关系的~其中y为因变量~x为自变量。系数y,表示。与G系数和系数不同~斯皮尔曼相关dyx ,也具有消减误差比例的含义。通常都用经过简化系数不失考虑个案对在两个变量上的相对等级~而是y 考虑单个个案在两个变量上的等级差异~它在计算每r2个个案在两个变量上的等级时~不仅要做高低的比F2,jrcf较~还要考虑等级的差异是多少。 ij1,,,D以表示第i个调查对象在两个变量上的等级差异FNi11ir()xy,xy~为它在x变量上的等级值~为它iiii2F,j在y变量上的等级值~N表示全部调查对象总数~则1N,26D,Ni的公式:计算~其中F,,,,~取值在-1到+1之间。 1j2,NN(1)yXF,j=1~2?r,为的边缘分布次数~为jii斯皮尔曼等级相关是以没有相同等级为前提的~如果 某些个案在同一变量的等级是相同的~且相同等级不fx,i=1~2?c,的边缘分布次数,为同属于和iji太多时~可取其平均值。 y,,的个案总数。的取值在0-1之间。通常值比jyy<4>定距变量---定距变量:最常用的是皮尔森相关系 数:用r表示~ ,值更好~但值较值易于计算。此外~二,,yyxyx,, ()()xxyy,,,,者都是测量变量间非对称关系的~因此与、,,iiyyxr, ,,,,与的意义是不同的。 22yx()()xxyy,,,,,ii<3>定序变量---定序变量:,A,Gamma系数:一般 用G表示~它适用于分析两个变量间的对等关系~ 第27页 袁方《社会学研究方法教程》笔记 ,,4,一元方差分析:是关于一个定类变量和一个定x其中~是变量x的平均数~为x变量的第I个观xi距变量关系的分析。二元方差分析是对于两个定类变 ,量与一个定距变量的关系的分析。依此类推 ~n元方y察值,是y变量的第I个观察值。r值在-1到+1之差分析是指n个定类变量与一个定距变量关系的分间。 析~二元以上的方差分析都叫做多元方差分析。方差 ,r系数要求调查对象的成对资料N50而且两个变量分析是由对变量间相关关系的分析~到建立描述变量的分布应近似于正态分布。r系数是测量的两个变量间因果关系得一般线性模型的过渡~后者是大多数多间对等关系的~并且~r的平方值具有消减误差比例变量分析方法的核心思想。 的含义。在实际计算时~一般采用下属经过简化的公nmi,2式: 。表示<1>总离差平方和:TSS=()yy,,,ij11ij,,Nxyxy,,()(),,,iiiir,y全体观测值对总平均数,推测值,的离差平方2ij222NxxNyy,,()(),,,,iiii和。 变量x与变量y间存在线性关系这一假设~是r系数<2>组内离差平方和,人大99<名>:残差,:的前提~如果两个变量间的关系不符合线性相关的假nmi,2设~用r相关系数进行分析就会犯错误。 RSS=~表示各观测值队本组平均()yy,,,iji分析两变量间非线性关系的相关比例测量法:测量一11,,ij个定类变量与一个定距变量相关程度的~即因变量数的离差平方和~它不是由自变量而是由其他未知因,定距变量,在自变量,定类变量,各值上的差异情素引起的。又称剩余平方和。 况。两定距变量是非线性关系时~可将一个变量看作<3>组间离差平方和: 是定类变量~采取比例相关测量法分析~由于定类变m,,2量不具有数量大小的概念~故不存在是否线性相关的nyy(),BSS=TSS-RSS=~表示各组的平均数,ii问题~因此两个非线性相关的变量关系分析可用相关1i, 比例测量法来测量。 x与总平均数的离差的平方和。它是由于自变量值i<5>定类变量----定距变量:两个变量中~因变量为定的不同引起的差异。 距变量时~采用相关比率来测量两者间的相关程度。BSSdf/21相关比率~又称eta平方系数~简写为~ Edfdf、<4>F,其中分别是BSS与12,,RSSdf/222()()yyyy,,,,,i2dfm,,1dfNm,,RSS相应的自由度~~E, 12,2,m为变量x值的类别数~N为观测总数,。()yy,,BSSm/1,,,dfdfdf,,即~F越大就F,12y其中~是因变量y的平均数~是在每个自变量yiRSSNm/, 表示x与y越可能相关。 由此可见~方差分析的基本2Ex值,,上因变量的平均数。E=~其值在0-1i思想就是把推测的全部误差,TSS,分为两部分,可2被自变量x消减的部分,BSS,和剩余部分之间。具有消减误差比例的含义。eta平方系数的E,RSS,~然后从这两部分的相互比较中看x与y是22,,否相关。如果两个变量一个定序一个定距~当把其中NyNy,,ii2的定序变量看作为定类变量时~也可以使用方差分计算公式可简化为其中E,2,析~实际上许多社会调研人员都是这么做的。 2yNy,,,5,一元回归分析:是对相关的两个变量间关系的 具体形态的一种深入分析。它不仅分析两个变量关系Nx是自变量值的个案总数~N是全部调查对象总ii的有无、大小和方向~而且要了解两个变量具体是以数。相关比例测量法基本上是用于分析非对称关系什么方式发生关系的。回归分析是一种因果分析~它的~但要求并不严格。 是根据两变量间关系的具体形态~选择一个合适的数<6>定类变量----定序变量:,A,用theta系数~简学模型~用来近似的表达变量间平均变化关系~这个记为~其值在0-1之间。系数是专门用于测量定,,数学模型就是回归模型。一般用于分析定距变量间的类变量与定序变量间关系有无和强度的~它测量的是关系~它除了具有描述和说明这种关系的功能外~还变量间非对称关系~并且不具有消减误差比例的含具有预测的功能~这也是相关分析所不及的。 义。,B,采用测量两个定类变量关系的系数和,<1>一元回归模型:对于已知相关的两个变量x与 y~架设他们之间是一种线性关系~则对这一关系可,系数~即将定序变量作为定类变量处理。虽然这y以用一元线性方程y=a+bx表示~其中的a和b是待样做会损失数据的某些信息~如等级差别~但方便了定系数。这个方程叫做回归方程~b称为回归系数~a统计分析工作~因此在社会研究时大多数人都采用这称为截距~即x=0时~y的值。a与b的计算公式: 两个指标分析一个定类变量与一个定序变量的关系。 ,,<7>定序变量---定距变量:,A,将定序变量看作是()()()()()xxyyNxyxy,,,,,,,定类变量~采用相关比例测量法。,B,将定序变量b,,222,看作是定距变量~采用r相关系数。严格地说~低测Nxx,(),,()xx,,量层次变量不能使用高测量层次的统计指标~但在有 些情况下~由于这种提高测量层次的方法给研究结果,,ybx,(),,的解释带来的危害程度不大~大部分社会学家还是接aybx,,, N受了这种做法。 第28页 袁方《社会学研究方法教程》笔记 <2>散点图与回归直线: 为了直观的看出x与y的关系,A,区间估计的一般程序:,a,确定臵信水平。形态,往往先作关于所调查的数据的散点图,即在直角,b,计算标准误差。,c,根据样本统计值和标准误 差确定臵信区间。 ,B,平均数的x坐标系中,将由每一横坐标与相应的纵坐标i区间估计: ,a,当总体方y(i=1,2,---n)所确定的点标示出来。x与y间存在一2i已知的时候~根据抽样分布理论~差,种线性关系时~虽然有多条直线来近似的刻画这种关,系~但其中只有一条直线的代表性最好~这条直线就xM,满足标准正态分布N,0~1,~式中nZ,是回归直线。回归直线的方程就是回归方程~回归方,程中的a就是回归直线的y轴的截距~回归系数b就 n是回归直线的斜率~b值具有描述自变量对因变量的 影响的大小和方向的作用。 为样本容量~M为待估总体平均数。区间<3>回归系数与r相关系数:回归系数与r相关系数,,,,,,,,,,都是描述两个定距变量间的线性关系的指标。r相关为待估平均数xZxZ,,,,,/2/2,,,,,,系数十一种对对等关系测量法~它反映的是两个变量nn,,,,,,有无关系~关系的强弱~但它不能给出一个变量x有M、臵信水平为1-的双侧臵信区间。在臵信水平,y的变化时~y的变化具体有多大。b值可以做x为95%时~总体平均数的臵信区间为:到这种区分~不过b值却无法反映两个变量间关系的,,,,,,,,,,强弱。此外~b与r值不同的是~b值所描述的是一。,b,当总xx1.96,1.96,,,,,,,,种因果关系~而相关关系只是因果关系的必要条件。nn,,,,,,尽管有上述不同~但回归分析与相关分析之间有着密2体方差未知时~分两种情况:a:当,n,100切的关系~实际上r值所要表示的~就是以回归方程时~总体平均数的双侧臵信区间为:作为预测工具时所能减少的误差比例~r值越大~就,,表示回归方程的预测能力越强~即散点图中的点越靠SS,,t。值需要查t分xtxt,,,2,/2,,/2/2,,近回归直线。因此~我们用作为决定系数~在社rnn,,会研究中往往要先计算r值~然后再决定是否用回归布表。 b:当分析进行预测。 时,总体平均数的双侧臵信区间n,100<4>回归分析的作用:回归分析模型是一种因果关系,,模型~因为增加了因果关系~因此与相关分析相比~SS,,为:。从上面的公式xZxZ,,,,,/2/2它的作用也大于相关分析。除了具有与相关分析同样,,nn,,的简化资料的功能~还增加了预测的功能~即当得到可知~臵信区间与样本大小成反比。只要将样本加了两个变量x与y的回归方程后~就可以从自变量的大~就可以提高估计的精确程度。 ,C,方值经回归方程计算出y的预测值。 差的区间估计:,a,当样本时~由抽样分n,100但应当注意的是~应用回归方程来预测因果变量时~ 一般不应使用超出资料所包括范围的自变量的数值~n,122布理论可知~满足自由度为n-1的,S,因为回归线段以外未观察到的点可能出现非线性的趋2,势。此外~预测的回归方程式只能反映一定时期内事2,分布。对于给定臵信水平1-~区间,物之间的相互关系~随着时间的推移~这种关系会起 变化~因此回归模型也要作相应的修改~如果这时还22,,(1)(1)nSnS,,2使用原来的模型作预测就会得到错误的结论。回归分即待估总体方差的双,,,,22析在应用时有许多假设前提~例如其关系是线性的~,,aa,/21/2,,自变量无测量误差等等。 222,侧臵信区间~的值可由分布表查,,,118、 单变量与双变量的统计推论: ,1,统计aa,/21/2 推论的一般概念:统计推论分两类<1>参数估计,复出。,b,当样本时~总体方差在臵信水平n,100旦97<简>:什么叫统计推论,其特点是什么,:就1-下的双侧臵信区间为,是根据一个随机样本的统计值~来估计总体的参数22,,(22)(22)nSnS,,值。 <2>假设检验:是首先对总体的情,。由总体平,,况作出假设~然后抽选出一个随机样本~以这一样本2121nZnZ,,,,,,/2/2,,的统计值来检验原先的假设是否正确。社会调查研究均数与方差的讨论可知~总体参数的区间估计方法的中大多采用假设检验的统计推论方法。,2,参数估选择除考虑参数的类型以外~还应考虑样本的规模。计:分为: <1>点估计,复在大样本的情况下~常采用正态分布~而在小样本旦97<简>:进行总体参数的点估计时~衡量估计值时~则要采用其他类型的分布。 的好坏标准有哪几条,:就是从一个适当的样本统计,D,总体成数的区间估计:当样本规模n,100值来估计总体的未知参数值。缺点是无法了解这种估 时~总体成数的双侧区间估计是: 计和推测的可信程度如何~区间估计可以弥补这一缺 陷。<2>区间估计,浙大2001<名>,南大2000<,PP(1),PZ,~其中,=1-臵信水平~名>,:就是通过样本统计值来推测总体未知参数的,/2n可能范围。这一可能范围的大小~取决于我们在估计,时所要求的可信度,即臵信水平,的高低~对于同一ZP值由查正态分布表得到,为样本成数,P为,/2样本~如果要求这种估计的可信程度越高~则总体参 总体中某类所占百分比~当总体成数未知时用样本成数的可能范围越大~反之越小~这一可能的范围称为 数代替。有时~我们还要对两个总体均值差或成数差臵信区间,南大2000<名>,~显然~臵信水平与臵 进行估计。这时~若两个样本都是大样本信区间成正比。 第29页 袁方《社会学研究方法教程》笔记 ,n1>100,n2>100,~则两个总体均值差的双侧臵信通常是先决定显著性水平的大小~若样本统计值达到区间为: 这一水平~则可确认样本具有较好的代表性~原假设 可以成立。拒绝域:就是在显著性水平下~拒绝原假22,,,, ,,12H设的区间~它位于抽样分布的一端或两端的小区(),xxZ,,,012,, ,/2nn 域内~根据小概率原理~当由样本算出的统计值落入,,12 ,,此区域内时~则原假设被否定。反之接受域就是接受22,, ,,,,12H的区间~它位于抽样分布的中间区域内~若由样()xxZ,,,120/2成数差的双侧臵信区间为: ,,,nn12,, H本算出的统计值落入此区域内~则接受。,C,0 ,,,,PPPP(1)(1),,双边检验与单边检验:拒绝域位于抽样分布两端的检1122 (),PPZ,,,12,,,/2验即双边检验。当拒绝域只集中在抽样分布的右端~ nn12,,则叫作右侧单边检验~如果是在左边就叫做左侧单边 ,,,,检验。一般来说~双边检验较单边检验更难否定PPPP(1)(1),, 1122,,()PPZ,,,122222/2,H~因此在提出备择假设时~最好说明方向。 ,,,SS,未知时用代替。在两个总体成数在0nn,,121212,, <4>假设检验的步骤: ,A,未知时~用对应的样本成数代替。 ,E,r相关系数的区间估计~在臵信水平1-的要,HH与备择假设。 ,B,根据总建立原假设01求下~总体r相关系数的臵信区间可由如下方法求体的分布形态和变量的测量层次以及样本的规模等~出:首先将样本相关系数带入公式:HH选择能反映的统计量和确立成立条件下的这001,r'''一统计量的分布。,C,根据问题的需要~规定适当=1.151log中求出值~则总体值得臵ZZZ1,r的显著性水平~并据此确立拒绝域或接受域。 ,信区间为,D,根据样本统计量的观测值进行判断~若其落入 拒绝域~则拒绝原假设~接受备择假设~反之接受原11,,''~由上ZZZZ,,,假设。 <5>弃真与纳伪:在,,/2/2,,nn,,33,,进行判断时~无论是作出拒绝或接受假设的判断~都 不会百分之百的正确~都会有一定错误。,A,判断1,r'式=1.151log~将两值对应的两个r值求出~Z的第一类错误是弃真的错误:即原假设反映了客观世1,r界的真实情况~但却在检验中被作为错误的看法而加这两个r值即为相关系数的臵信区间端点值。 以拒绝。犯弃真错误的概率为。 ,B,,,3,假设检验:<1>定义:如果经验资料是由抽样假设检验的第二类错误是纳伪的错误:即原假设不是调查获得的~由资料计算出的结果还不能马上验证原H真的却被作为真的加以接受。 显然当拒绝时~犯0有理论假设是否为真~而要首先对这一结果的显著性 进行检验~即检验这结果是否对总体具有显著的代表H弃真错误的可能性是很小的~而在接受拒绝,0性~这种与抽样调查结合在一起的显著性检验称为统H时~犯纳伪的错误的可能性却很大。由此可知~计假设检验~简称假设检验。 1 <2>当样本资料与原假设不符~有两种可能:,A,HHH和在假设检验中的作用是不等的。一般010原假设错误。,B,样本缺乏代表性。因此~如果不选择的是常规的已存的现象~没有充分的根据是无法对样本的代表性进行检验~剔除因样本代表性所产生否定的~而要把研究的看法或猜想作为备择假设的结果与假设不符的情况~而否证原理论假设~就有H~因为一旦备择假设被接受~那么它被否定的概可能抛弃正确理论假设的错误的危险。同理~在样本1 结果与原假设相符的情况下~有可能犯以假当真的错率是很小的。由于社会研究一般是证实假设~即希望误 <3>假设检验的一般概念: 否定原假设~因此特别注意弃真的错误。弃真与纳伪,A,原假设与备择假设。原假设又称虚无假设~一这两种错误是相互对立的~即在一定条件下~弃真的 错误增大时~纳伪的错误就会减少~反之也一样~完H般用表示~它常常是根据已有的资料或根据周密0全消除两者的矛盾是不可能的~为了同时减少犯这两考虑后确定的。但直接用于假设检验的不是原假设~种错误的概率~一般采取增大样本容量的方法。 而是所谓的备择假设~又称研究假设~备择假设就是 <6>假设检验的类型:,A,参数检验:要求总体必H与原假设相反的假设~用表示~它是当原假设被须具备某些条件。如分布~变量层次等。参数检验的1 优点:当总体充分满足所需求的前提条件时~在做假推翻时需要接受的假设。假设检验依据的是小概率原设检验时可以非常准确~但在社会研究中往往很难判理~就是说小概率事件被认为是在一次观察中不可能断总体是否合乎要求。,B,非参数检验:不要求总出现的事件~因此~如果再一次观察中出现了小概率体具备特殊条件~且适用于各种层次的变量~它不是事件就应当否定此事件是小概率的说法。假设检验的检验总体的某些参数~如平均数、方差等~而是检验H逻辑就是求出是正确的可能性~如果能证明这种0总体某些有关的性质。非参数检验的优点:适用范围 广、计算简单~当样本容量增大时~其推论准确度可HH可能性极小~就应否定~接受。 01以增加。近年来~非参数检验获得了越来越广泛的应,B,显著性水平与否定域,接受域,:显著性水平用。 ,人大99<名>:显著度,南大99<名>,:是指假设,C,选用何种检验方法要考虑:,a,样本的个数成立的标准~即小概率的值~用,表示。显著性水与类型。如单一样本还是配对样本。,b,样本的规平意味着总体参数值与样本统计值具有同等特性的概模。一般大于100个元素的样本为大样本~小于或等率为~抽样误差不超过,。在进行研究时~1,,于100的样本为小样本,c,变量的测量尺度。 第30页 袁方《社会学研究方法教程》笔记 <7>参数检验:是对于总体参数的检验~当总体的分,B,t检验:要求:,a,被检验总体成正态分布。布形式已知~而且中的某些参数~如平均数、方差等,b,样本必须是随机抽取的。,c,变量应为定距尺为未知时~可以先对这些参数作出假设~然后从总体度的变量。一般说来~t检验多用于小样本。 中抽出一个随机样本~根据对样本的观察资料对假设可以用于t检验的参数有: 的真伪作出判断。常用的三种参数检验方法: ,a,小样本的总体均值检验:原假设为:,A,Z检验:要求:,a,样本必须是随机抽取的。,,,,,,,,,~备择假设为:,或~或000,b,变量必须是定距层次的变量。,c,总体应呈正,态分布~不过当样本容量相当大时,n>100,~这一xu,0,,,要求可以放松。 可以用于以下参数的检验: ,~检验统计量t,。 0S,a,大样本的总体均值检验:这时用于检验原假设 ,nx,,0,b,小样本的总体均值差检验:统计量为:的统计量,又称检验值,是。 Z,S,, ,xx12n,~而原假设为:t22,,,b,大样本的总体成数检验:这时用于检验原假设nSnSnn112212,nnnn,,2,1212PP,0的统计量是~其中为样本成ZP,,,,。 ,c,配12PP(1),00 ,,,对样本的比较:原假设为:。统计量为:12n ,P数值~为假设的总体成数值。,c,大样本的总体0xddxx,,t,~其中m为配对数目~,12n均值差检验:当甲总体的样本规模与乙总体的样1Sd n本规模均大于100时~其平均数的差异可由Z检m,12 ,,Sx为d的平均数~为d的标准差。 ,dd,xx12,验值来检验~Z~分别为样x,S,C,F检验:要求:,a,样本随机抽取。,b,有1122SS一个变量是定距变量。,c,要求各自总体均为正态12,2nnEnk(),12F,分布并具有相等的方差。~E2,(1)(1),,Eknn本的平均数和方差~分别为的平均数x,S1222是样本的相关比率系数~n为样本的规模~k是分组 数。 F检验一般用于: H,,,H和方差。原假设为:~备择假设0121,a,方差分析的检验:这时原假设一般形式为:,,,,,,,,,为:,或~或,。 121212,,,,,,即各类间平均数相等,。备择12k,d,大样本的总体成数差检验:在甲总体的样本容假设为:有一个以上的类别平均数不同。检验的统计nn量与乙总体的样本容量均大于100时~其成数12BSSk/1,差异可以由Z进行检验~ 量为:~BSS为组间平方和~F,BSSnk/,,,,,RSS为组内平方和。,b,对两个总体或多个总体的PP,12PP,~分别Z,12差异作检验:当样本超过2个时~一般采用F检验~PPPP(1)(1),,1122,MMM,,,这时原假设形式为:。 123nn12,c,r相关系数与回归系数的检验:计算相同系数r nnH为样本与样本的成数。相应的原假设为:与回归系数b的公式具有相同的分子~因此对r的检120验亦即对b的检验。此时~原假设与备择假设的形式PP,HPP,~备择假设为:,或12112HH一般为::总体中r=0~b=0,:总体中01PP,PP,~或,。 ,e,G1212rb,,0,0~检验统计量d相关系数、系数的检验:G系数描述的是两个定yx2rn(2),Fdfdfn,,,,(1,2)序变量的相关程度与方向~若样本中G不等于零~~n为样本1221,r我们就要检验在总体中G是否也不为零~即变量间大小~r为样本相关系数。这个检验统计量是以变量的关系是真的。因此~原假设为:G=0~备择假设为x和y成线性关系为前提的~两个变量若是非线性关nn,sd系~这一方法就不适用了。 判断两变量在总体中是n~检验统计量~为ZG,G,0s2否有线性关系的方法:一般可用F检验值进行检验~(1)nG,此时: n同序对~为异序对~n为样本大小~G是样本的dH:x与y在总体中是线性关系~即r=E 0dGamma值。由于系数与G系数的计算公式中都yxrE,H:x与y在总体中是非线性关系~即~检1nnnn,是以同序对及异序对的差作为分子的,sdsd验统计量 nn,故均可通过=S的检验来推断总体的情况。 sd 第31页 袁方《社会学研究方法教程》笔记 222,的统计显著性一方面受相关关系强弱的影响~另Ernk,,,,Fdfkdfnk,,,,,(2,)12,,2一方面也受到样本规模的影响~同样的相关强度~样12,,Ek,,本规模不同~就会具有不同的显著性水平~即使是一~k为x变量值的类别数~E为样本相关比率系数~r个很弱的相关~但只要样本足够大~也会具有统计显为样本线性相关系数。 著性。因此~在大样本统计检验显著时~还需要进一<8>非参数检验,复旦97<简>:什么叫做非参数检步确定相关强度的高低~以确定这种相关有无实际意2,验, 其适用范围和优缺点,:,A,检验是目前义。 统计中应用最广泛的非参数检验法~要求:,a,两 第十六章:变量分析的逻辑和策略 ,样本必须随机抽取。 个变量均为定类变量。,b 2,,B,检验一般用于: 119、 分析的逻辑是指进行分析时所遵循的逻辑方,a,列联表的检验:列联表通过将两变量交互分法和推理过程~分析的策略指的是分析程序的设计及类~旨在发现其间是否存在某种联系~因此在对列联分析的技巧等。 掌握变量分析的逻辑表进行检验时~原假设应为:变量x与变量y无关,与策略不仅能使资料分析更深入、更全面而且还能澄备择假设应为:变量x与变量y相关。检验统计量:清和防止某些逻辑错误~是理论解释更符合实际~或2cr()fE,发现新的理论和问题。 ijij2E。公式中~为期望频,,ij,,统计调查的变量分析最早是由法国社会学家杜尔克姆E,,ij11ij运用到社会研究中来的~以后经斯多弗、拉扎斯菲尔 德、罗森伯格等人的发展与完善~已经形成了一套较ffij**2E,,。在查 次~可由边缘分布求得:系统的统计调查的资料分析模式----详析模式。 ijf120、 变量关系的类别: 2,1,变量间的关系:统计相关或统计无关。两个从,分布表求临界值时~需要用到自由度的概念~统统计上看无关或弱相关的变量~实际上可能的确无2,计量的自由度为:df=,r-1,,c-1,。当算出的关~但也可能有关系~两变量间的这种统计上无关而 值大于某一显著性水平下的临界值时~则原假设在这实际上相关的情况~称为虚假无关。而两个从统计上2看具有相关关系的变量~它们之间的真实关系有可能,一显著性水平下被拒绝。在用值对列联表进行检是:实际上无关、实际上相关、实际上具有因果关E验时~每一格值的要保持一定数目之上~若其中ij系。,2,统计相关的不同类型: <1>统计相关~实际无关。这种情况称为对称关系或E有的格值太小则有可能引起判断失误。一般要求ij虚假关系~即从统计上看有关系的两个变量实际上相E,5在r*c的表中的格数不应超过20%~也有人互独立、互不影响~并无有意义的联系。对称关系用ij XY,符号表示为:。<2>统计相关~实际也相认为所有格值不应小于10 。 关。这种情况称为相互关系~所谓相互关系是指统计 ,b,二分变量的相关测量~所谓二分变量就是取值上相关的两变量实质上也是有关系的~这种关系是一2,只有两类的定类变量。对于2*2的列联表~可用种交互影响的关系~在这种关系中~两个变量相互作 值来测定变量间的相关~较为常用的有:第一~系,用、相互加强。有时~我们虽然明知有因果关系存 在~却难于指出何者为因、何者为果~谁影响了谁~2,实际上是互相影响~互为因果。相互关系在调查中极数~,n为样本大小,~其值在0-1之,,n为常见~符号表示为: XY, <3>实际的因果关系:这种情况是指统计上相关的两间。系数也可用于r*c列联表~但这时值会超过,,个变量之间实际上存在因果关系。因果关系是变量分1~为克服这一缺点~设计出了V系数。第二:V系析中所要探讨的最重要的课题。社会研究中所说的因22,,果关系是指在两个变量中~一个变量的变化伴有另一数~~其中n是样本的V,,变量的变化~即一个变量影响另一个变量~但是反过nmm(1)1,,来不成立。在因果关系中~能够影响其他变量发生变大小~m是表的行数r与列数c中的较小数~即化的变量称为自变量~依赖于其他变量~但其本身不m=min(r.c)~V值由0-1。显然~在2*2表时~能影响其他变量的称为因变量~后者通常是我们希望2解释说明的变量。因果关系用符号表示为:,V=,。第三~C系数~~其值最小C,。 2XY,,n,判断因果关系的原则:<1>时间的先后。<2>变量的为零~表示两变量完全无关~但其上限是可变的~最不变性与可变性。时间的因素固然重要~但并不是决大不超过0.707~即使两变量完全相关~亦无法达到定关系方向的不变的标准。在社会研究中常将一些具1。 有固定性、持久性的变量作为自变量~如性别、年,c,正态总体方差检验:这时原假设为:龄、民族等。社会研究中还有一些主要的变量~它们2之具有相对持久性~如社会地位、居住地以及社会阶(1)ns,222,,,~检验统计量为~自由,,0层等就属于这种变量。这类变量比行为、态度等变量2,0更为固定持久~因而往往被当作自变量。<3>需要指度df=n-1。 出的是~这里所讲的因果关系~也称为非对称关系2,检验是检验两变量间在总体中关系的有无~而不,即,~它是指在特定条件下的两变量关XY, 系中~一个变量影响另一个变量~反过来~后者对前是关系的强弱程度~因此显著的话能说明相关关系存 者没有影响。这种非对称关系于自然科学所讲的因果在~但并不能说明这种相关关系在实际中是否重要。 关系有一定区别~后者的定义要更严格一些。 第32页 袁方《社会学研究方法教程》笔记 121、 详析模式,北大93<名>,北大2001<论>:举例:,,,,,,,,,年医学统计表明~在过去试举例说明详析模式的分析方法,北大2002<论>:一个世纪中~精神病患者的比例大为增加。对于这一试论述详析模式的方法和主要作用,: 关系~不难做出下述解释:在过去一个世纪中~生活,1,两变量的交互分类:多数研究是从变量间关系环境的迅速改变造成了严重的社会紧张~可能是这种的假设开始的。对两变量间关系进行描述的最基本的社会紧张导致了精神病患者的增加。但是~引入年龄方法是交互分类法~又称列联表。 这一变量加以检验~发现二者虚假相关。进一步的解,2,引入检验因素。,A,检验两个变量间关系的释:年纪大的人中老年性痴呆症增加~这种病是生理最重要、最系统的方法是引入第三个变量~然后检查衰退而不是精神紧张造成的。医学进步使得人的寿命引入第三个变量后自变量与因变量原有关系得变化情延长~也增加了老年人在人口中的比重~因此产生大况~由此澄清与深化对原关系的认识~并解释两变量量老年性痴呆患者。 的真实关系。这种引入第三变量对两变量关系进行检上述例子说明~一个看起来精密的理论架构~就因为 没有考虑到外在变量~事实上却是错误的。 验~以解释或确定这种关系的过程叫做分析的详析化 引入外在变量的做法~能增进研究者对于这两变量间,浙大2000、2001<名>,南大2000<名>,~被引入 具有内在关系的信心~但不能完全断定这一关系是真的变量叫做检验因素或控制变量。 ,B, 的。因为它也许还受其他外在变量的影响。 分表法:,a,首先描述变量X与Y的关系~这时的,2,变量关系的具体化:社会学常常有些极为笼统关系称为原关系。,b,依据理论或经验选择检验因的命题~它们的涵盖能力很大~但却无助于增进对问素。,c,将检验因素分成不同层次或不同类别~然题的了解。为了使变量间这种笼统的关系具体化~找后在每一类别中做X与Y的分列联表~分表中X与出一个复杂且涵括极广的自变量中对因变量起主要作Y的关系称为部分关系。,d,对各分表中X与Y的用的因素~往往采用引入检验因素的办法。作为检验关系,部分关系,进行考察:,甲,若X与Y的原因素的就是自变量中被理论或经验推测为对因变量器关系在各分表中消失了~证明原关系主要是由检验因主要作用的那个因素。能使变量件关系具体化的变量素引起的,,乙,若X与Y的原关系在各分表中仍称为内含变量。 然存在,即各分表中X与Y的关系与原表相近,~举例:杜尔克姆研究婚姻中哪个因素影响自杀率~包说明X与Y的关系不受检验因素的影响,,丙,若括性的满足、夫妻感情、不孤独等影响已婚者的自杀X与Y的原关系在各分表中存在但较原关系减弱~证率。在这种情形中~两变量的关系是建立在涵括的概明X与Y间的关系部分收到检验因素的影响。,3,念上~但实际上这一关系确是由概念所包含的某个因详析模式的主要作用:<1>详析模式的一个主要作用素引起的~是总体“代表”了局部。用图示表示就是:是使调查研究可分享实验设计的一些优点。它是一种 近似的实验设计。在详析模式中~控制的项目越多~A,则两个群体出了一个变量不同外~其他可能越接近相,B,,同。这样详析模式就使得调查近似于事后实验设计~Y。与此相反~还有另外一种情形存,从而成为社会科学中最有利的证明模式之一。<2>可C,以充分利用统计资料~并将研究引向深入~一方面能X,,对变量关系作出描述,另一方面通过引入第三变量~ 他还可以澄清事实真相~包括两变量间关系的真伪、在~即关系是由某个因素引起的~但实际起作用的却这一关系存在的条件和存在的原因等等~从而使变量是涵盖这个因素的更宽的概念~是局部代表总体。 间的关系更具体、更精确可靠。分析的目的在于解,3,追寻关系产生的原因:在实际中常常碰到这样 一种情况:变量X与Y之间的关系是另一变量A的释~详析模式在解释上的贡献很大~不仅能证实解 释~也能排除错误的解释~并能获得新的解释。因此“媒介”作用的结果~即X导致A~而A又导致Y~X 通过A的作用产生与Y的关系~用图表示就是:它是建立理论和开发资料的有力工具。<3>在详析模 式中~部分关系与原关系进行比较时~可出现三种情。变量A对X与Y之间关系的建立XAY,,况:,A,关系相同。,B,关系减小或消失。,C,起了中介作用~故称为中介变量。如果能证实X确关系分列。即一些部分关系与原关系相似或加强~而经A影响Y~就可以说:X与Y关系之所以如此~另一些部分关系则有所减弱或完全消失。,A,是因为A的作用的结果。因此~将中介变量作为检,B,是一般关系分析的主题~,C,是条件关系分验因素引入到两变量之间这一检验模式~可以说明自析的主题。 变量是如何影响Y的~即对变量关系发生的过程进122、 变量关系的检验: ,1,行注释。指出中介变量有助于更进一步了解两个变量虚假关系的检验,北大97<论>:试比较详析模式间的关系~如果不考虑这种中介因素~我们就会止于中~条件关系分析与变量关系检验的异同。北大事实~而缺乏完整深入的了解。 2002<名>,:两变量间的虚假关系是指两变量表面是,4,寻找因果次序:前导变量的引入可以说是源于一个非对称关系~但实际上是一个对称关系~两变量社会学研究中对因果次序的探寻。~AXY,,间并无有意义的或内在联系~他们之所以有关系是因这里~A因素就是前导变量。前导变量的引入步实施为此两变量恰巧与其他某一变量相关联。造成两变量自变量与因变量之间的关系消失~而是使它得到澄虚假关系的这“某一变量”就叫做外在变量。它与自变清。 量及因变量的关系用图来表示就是:举例:父亲的教育水平影响儿子的教育水平从而影响(X自变量)投票率。 A。所以~若某一变量为外在变量~则检验一个变量是否为前导变量的具体做法是:注意检(因变量)Y 验这个变量能否满足下述三个统计上的条件~若能满将其控制之后~自变量与因变量的关系应当消失。因 足~则是前导变量~否则不是:<1>三个变量:前导此~根据理论或经验选定可能成为外在变量的变量作 变量、自变量、因变量~必须两两相关。<2>控制前为检验因素~使用分表法将检验因素控制~就可以判 导变量后~自变量与因变量的关系应不消失。<3>控断一个关系是否虚假。引入外在变量的最重要贡献是 制自变量后~前导变量与因变量间的关系应当消失。 能够防止做出错误的解释。 第33页 袁方《社会学研究方法教程》笔记 ,5,防止将真关系误判为假关系:两变量间真实关果善于运用条件关系~就能在相当程度上解决这一困 系不能表现是由于第三个变量的闯入抑制、取消或削难。 弱了这一真实关系。这种使真实关系隐而不彰的或减,2,对关系进行说明、澄清及描述:所谓说明一个 关系~就是将分表里具有特殊意义的关系指出来~并弱的变量就叫做抑制变量。 且指明这种特殊的意义。<1>清除原关系中的干扰因举例:年龄抑制工人会龄与种族态度的关系。控制年 素。<2>明确指出加强或抑制原关系的一些条件。龄后~会龄与种族态度的相关性表现出来。 <3>可以说明两变量关系成立的必要条件。一般说一个抑制性变量在某种意义上是与外在变量相对应 来~所有的关系都是条件关系~即每一种关系都是在的。后者用于检验假设是否被当作真~他从假设两变 某种条件之下才成立。但通常研究中并不特别指出关量具有真相关开始~继而引入检验因素~此因素对原 系成立所应具备的条件~因为一般情况下他们的存在来的两个变量来说是外在的~假如发现原来的关系消 是内含的、公认的。然而在某些情况下~若能说明一失了~则称原关系是虚假的。而前者则用于检验镇是 个关系的同时~指出这种关系成立所必需的条件~则否被当作假~它从两个变量间无关系开始~然后引入 会增加人们对研究对象的深入了解~也使分析更加完检验因素~这个因素对原来的两个变量来说也是外在 整~条件关系可以完成这一使命。<4>条件关系可澄的~假如在每一个分表中出现了关系~则称原来的无 清自变量与因变量的本质。为进行实证的社会研究~相关是虚假的。 必须将概念操作化~变成具体的指标或指数~然而这正像外在变量可以判断关系为假而无法断言关系为真 些指数与指标往往并不能精确代表概念~因此在解释一样~抑制变量可以判断关系为真却不能断定关系为 指标时~常常超过或达不到这个指数或指标的范围~假。但是外在变量虽不能判断两关系为真~却可以通 从而做出错误的解释。条件关系有时可以帮助分析者过对多个外在变量的检验~加强它是真关系的信心。 澄清调查资料所表现的指数的意义。<5>条件关系还同样~抑制变量虽然不能判断两变量关系为假~但却 可以使描述性的说明更精确。 可以通过对多个抑制变量的检验~加强它是假关系得 124、 联合作用的检查:将第三个变量作为一个自信心。 变量~以了解它与原来的自变量以怎样的互动方式对,6,恢复变量间关系的真貌:歪曲变量是使两变量 因变量产生作用。这种作用就是联合作用。它包括四间真是关系扭曲、变形的变量~它既可以将真扭曲为 种类型: ,1,独立作用:如果将两假~也可以将假变为真~甚至完全改变一个关系的真 实方向。因此~对歪曲变量的检验~能够将两变量间个变量X与Y间的不对称关系用表示~引XY, 真是关系袒露出来~从而使研究者避免抛弃正确的假入第三个变量A~将其视为自变量并假设A与Y也 设或接受错误的假设。 存在着非对称关系~则变量间的关系就变成 123、 条件关系的分析:在利用分表发对分表中的X关系与原关系进行比较时~我们发现这些分表中的关Y。X与A对Y的作用可分为: <1>两系或减弱、消失,或维持原状,或从无相关到有相A关、弱相关到强相关,或与原关系的下相关方向相 个自变量在不受对方作用的下对Y的独立作用。反。在这些情形中~我们假定所有分表中关系的大小 <2>X与A对Y的共同作用。<3>X与A形成新的变与方向是相似的。但是~在有些情况下~各分表中的 量后对Y的作用。 关系可能并不一致~即有的分标关系强、有的弱~有 独立作用又分为两种情况:第一~两自变量之间彼此的分表是正相关~有的是负相关。在前一种情况下~ 无关~各自独立的对因变量起作用。 第二~两自变由于所有分表中自变量与因变量的关系都相同,或相 量彼此密切相关地对因变量发生作用~每一自变量在似,~因此可以说这一关系是普遍的、无条件的。而 一定程度上反映着另一自变量。 在后一种情形中~自变量与因变量的关系因表而异~ ,2,相对作用:假定每个自变量军对因变量有独立也就是说这一关系是有条件的~因此~我们称其为条的影响~那么何者大,这就是所谓相对作用的问题。件关系。这里所说的条件~可以是检验因素的不同分相对作用研究在社会学研究中有着极为重要的作用~类、不同层次、不同阶段~以及任何具有分类意义的许多理论问题可以从检验相对作用的大小获得解决。东西。 如:是教育还是经济对个人的生育行为影响大, 条件关系在社会学分析研究中作用很大~不仅可以帮,3,累积作用:是指两个自变量对因变量Y的共同助解释~对理论的建立做出贡献~还能说明、澄清两作用~这种共同作用并不一定是两个自变量各自影响变量间的关系~促进对事物的了解,而且他对科学的力的单纯相加~决定其强度的因素很多~但其中以两主要目标之一:预测~也有重要贡献,它使得调查资自变量间的相关程度为最重要。累积作用的大小主要料的分析更丰富、更深入、更正确。 决定因素是两自变量间的相关程度。 ,1,帮助解释:<1>促进修正原解释或发现新解释。,4,类型作用:有时两个自变量或其中某一自变量<2>支持或强化原解释。<3>帮助选择正确的解释。与因变量并不相关~然后当它们融合在一起时~却能对同一个现象~人们常常做出各种不同的解释~这些够产生另外独特的作用~这种情形相当于两个自变量解释似乎都同样令人信服~都同样切合结果~使人难融合之后形成一个新的自变量~它是超于组成它的两辨真伪。条件关系的检验往往能帮助分析者摆脱这种个单个自变量之上一个新的实体为与原自变量区别~困境~选择恰当、合理的解释。<4>帮助发现隐而不我们称这种变量为“类型”。“类型”与各个自变量的关彰的事实。在虚假无关中~由于各个分表中的关系方系就像整体与部分的关系部分组成整体~但整体性质向相反~因而可以用两种方式进行解释。第一~分别不等于个部分之和。 解释~也就是对正关系与负关系各自做出解释。第按自变量的融合方式~“类型”可分为四种:<1>特殊二~整合的解释~即将两种对立的发现融合起来~只类型:指新生成的自变量的涵意不同于原来两个自变给出一个搞抽象层次的解释。<6>帮助了解事物发展量的涵意。<2>修正类型:指新合成的自变量修改了趋势或过程。具体做法就是将时间作为检验因素。在原自变量的本质与特性。<3>一致---不一致类型:指横剖研究中调查资料大多是于某一时点或某一段时间新自变量由两个性质一致或两个性质不一致的自变量收集到的~将他们用于社会动态研究颇受限制~但如 第34页 袁方《社会学研究方法教程》笔记 合成。<4>相对的类型:指通过两个自变量相互地位,3,偶然重大发现的利用:科学的历史充满了未曾的比较所产生的新变量。 假设的意外发现。实际研究中~这种以偶然或智慧获由以上介绍可见~详析过程式统计分析与理论分析密得发现极为重要~因此对于这种偶然性发现的警觉是切结合的过程研究者不仅要运用缜密的逻辑推理~而研究策略的关键要素。这种意外地发现可以促使产生且要运用理论的洞察力和想象力对调查资料中所反映新的理论或对原有理论作出修正。有时意外发现的贡的客观事实或现象间关系做出理论解释。因此~在现献不一定是突破性的~但对于资料的意外可能性保持代社会调查中调查研究人员不仅要努力掌握先进的统高度警觉~研究这就能够更充分的利用这些资料~并计技术~而且更重要的是要掌握科学的思维方式和推增进对社会学理论与知识的贡献。 理方法~提高对社会现象的分析能力和洞察力。 ,4,证据的分析:任何科学的目的是达到概括论125、 调查分析的策略: ,1,详析断~即由具体的事物得到一般的原则或模式。概括论的程序: <1>确定两断可分为两类:经验的与理论的~前者是指根据一些变量间关系的类型。若两者相关关系较显著就要进一个案所得到的结果概推到较普遍的总体。而后者是指步分析它们之间的是对称关系、还是相互关系或因果从各种不同情况中得出一般原则~在这种概括论断关系~如果是相互关系~我们则要进一步检查其相互中~具体的变量被看作是较抽象的概念的一个指标。 由经验得到概括论断~应进一步加以确证~以增加他影响~比较两者谁是更具持久性和固定性的变量~以 尽可能决定影响的主要方向。如果是因果关系~则要的可信度和解释力。对于经验型概括一般是通过复验确定谁是自变量~谁是因变量。 进行证实的~ 复验的主要方法有: <2>确定关系的真伪。分两种情况:,A,两变量统<1>将资料与来自同一或可比总体的其他样本作比计相关:应考虑这种关系是否有内在的或有意义的关较。<2>在不同的总体中作相同的经验性概括论断。系是否受到某外在变量影响的结果。,B,两变量统<3>配对比较方法。 计无关或相关不显著:要看其关系是否被抑制变量所证实理论性概括论断的基本方法是选择代表同一概念抑制~特别是在理论和实际观察都表明他们有可能有的不同指标。杜尔克姆对自杀的分析提供了整理证据关系时。当量变量间的原关系的方向与我们所了解的的卓越例子~他将许多经验性概推整合成单一的理论和理论所提供的方向相反时~就要考虑是否歪曲变量性概推~即高度的社会整合与低自杀率相关。将相同在起作用。 <3>将量变命题的证据累积起来就使其论点特别有说服力。需要量间的关系具体化。确定两变量关系为真之后~则可指出的是~在验证理论性概推时~对于同一个研究与检查内含变量~以使这一关系更具体。 理论命题相关的一切资料都需要加以检查~而不能任<4>寻找变量间的因果链。进行中介变量的检验~目意进行选择。 的是对这一关系做出说明。有时~我们可以进一步通证据分析对于理论性概推的主要贡献主要有以下几过追寻前导变量来扩大因果链条。 点:<1>可以支持对结果的解释~由此可以产生更强<5>检查是否存在条件关系。许多有价值的资料都是有力和更有包容力的理论概推。<2>可以对某一理论由这一步骤获得的。 <6>进行的解释提出问题~从而使我们注意寻找更符合事实的联合作用的考察。进一步考察两两个变量是否存在独其他解释。<3>可使在对原有结果的不同解释间作出立作用。如果两变量彼此独立起作用时~就要进一步正确的解释。<4>可在同一研究中进行验证~经验的考察两者何者为大~此外还要考察累积作用。最后可概推除“配对比较”外~不可能在同一研究中对自身的检查两自变量是否可以建立一个新的变量类型。 结果进行验证。<5>有时能使我们对理论概推比经验需要特别指出的是:在调查分析中~两变量关系只是概推在统计上更有信心。 代表分析的开始~而非结束。实际上在详析的过程,5,事后解释:是先有资料~然后再找符合它的解中~每一部的分析都会得到一些结果~这些结果会产释。因此事后解释只是一种可信性的解释~而无法达生一些新的问题~需要进行进一步的分析。分析是一到“证据确凿”的解释,高度肯定,~即这种解释知识个不断探寻的过程~每一步分析都会产生一个新的问与一套资料相符而已。 题~而须检验新的资料~进行新的分析~新的资料又事后解释的三大缺陷:<1>伸缩性过大~即对一种调产生其他问题~如此循环反复就使得我们对于调查资查结果~可有多种解释。<2>不能将其完全抛弃。料的利用更加充分并进而导致对社会现象的认识不断<3>无法以来外在的确证。事后解释因为是有了资料深化。 后才加以解释的因此无法肯定这一解释的正确性我们,2,假设检验与概念追踪:在调查研究中~虽然假无法再检查资料以获得确证。 设检验具有极大的价值~但它并不是唯一的~有时甚对于上述三大缺点~我们可以通过详析程序和证据分至不是最主要的一种方法。这是因为即使假设是由理析程序部分加以克服。这两个程序都是由解释抽取出论抽离出来的~也能获得资料的支持~但资料并不能推论~然后将其付诸验证。因此~事后解释并非分析证明理论~资料只能给理论以支持~虽然研究的发现的结束而只是它的开始。社会调查研究中不得不使用与假设所根据的理论一致~但这些发现也可能与其他事后解释~但在使用这种方法时~必须注意他所具有理论一致。实际上~经验研究远远超出了检验理论的的局限性~必须运用上述的程序对他们进行处理。 被动功能~它不仅仅是证实或反驳假设。如果能适当 第十七章:多元分析概论 的运用其他一些分析的策略与技巧~经验研究在创 造、改进、反思和澄清理论上也能发挥积极的作用。126、 多元分析的一般概念:,1,详析模式与多许多调查分析采用一种所谓“概念追踪”的分析方法~元分析:控制多个变量的方法与控制一个变量的方法它是一个理论与资料动态地交互作用的复杂过程。概一样~也可采用分表法~只是分表的层次更多而已。念追踪与纯粹假设检验模型不同。假设检验是由理论实际上~当变量数目超过4个时~由于表的层次过起~理论发展出假设~收集相关资料~然后检验假设多、过大~使用这一方法是很困难的~特别是当要从一决定其是否获得支持或否定。概念追踪则是在理论一组因素去确定一定数目的变量~而且希望分析这些与资料间进行互动~它由资料出发~资料常迫使理论变量之间的关系时~困难就更大。为解决这一困难~家进一步对其加以解释~而这些解释与理论又指引适所用办法是将上述的逻辑程序倒转过来~即“不摸索当的资料以进一步验证理论或使理论更为周密。 第35页 袁方《社会学研究方法教程》笔记 着去推断数据的结构性质”~而是先提出某一结构的便起见~我们常把变量编号表示成如假设~然后考察这个结构是否真正符合数据。 xxx、、的形式~这是偏相关系数中的变123,2,多元分析的类型和应用:<1>类型:,A,美国r量符号仅用变量的顺序号表示即可~例如用表库利和柯尼斯按变量的组数和群体数分为下述四类:12345因素分析~复相关、偏相关和典型相关,多因方差分xx与xxx、、示控制后~变量的偏相关。 34512析,判别分析和聚类分析。,B,英国统计学家根据一阶相关的偏相关系数:研究目的将多元分析方法分为两大类:相依性分析和 rrr,()()互相依性分析。回归分析、判别分析、典型相关分析121323~式中的r,123均属于相依性分析~他们的共同特点是分析所涉及的221()1(),,rr1323变量是不平等的~即有自变量与因变量之分。相依分 rrr、、分别表示两个变量析的目的在于分析多个变量对某个或某些变量的共同121323所涉及的变量是平等影响或相对效应。互相依性分析xxxxxx与、与、与的全相关~它就是测量121323的~分析的目的是变量之间的相互关系~以简化这种两个定距变量相关关系的皮尔森相关系数。实际上它相互关系。因素分析、聚类分析等均属于互相依性分是偏相关系数的一个特例~即控制变量个数为零时的析。 偏相关~故又称零阶相关。一阶相关的偏相关系数的每一种多元分析方法都是建立在一些列假设前提的基计算是建立在零阶相关基础上的~这是与偏相关分析础之上的~这些假设既包括这一方法所涉及的变量的的原理分不开的。偏相关分析的目的是排除其他变量测量层次~而且也包括这些变量间相互关系的性质~ 以及资料的不同来源等。因此~在选择一种多元分析r的影响~以测量两个变量间的“净关系”~式中是12方法时~应首先考察这一方法所要求的前提条件是否xx为排除其他变量的影响时变量对的全作用~但21得到满足~若某些条件未获得满足~就要想办法进行 这种作用中有一部分可能是另一个变量的作用所致~某种统计处理~例如定类变量~可先将其变为虚拟变 量后再引入回归模型。 rr、xxxx分别表示对与对的影响力~则13233132<2>优点和局限:多元分析较之于单变量和双变量分rrr,xxx,就是从对的总作用中剔除,121323213析能更真实反映复杂的社会现象之间相互联系与相互 所造成的影响后的净作用。同理~二阶相关的公式:依存的关系~但其局限是:,A,大多数多元分析方 法都是在分析前先形成一个假设~然后再探寻与资料rrr,()()123143243。三阶相关的r,的符合程度~因此多元分析大多是与事先的理论研究1234221()1(),,rr密切联系在一起的~这就要求研究者具备很好的专业143243训练。此外~选择何种理论假设模型是由研究者决定rrr,()()123415342534公式: 的~这就是它很难避免研究者主观因素的影响。 r,1234522,B,多元分析是一种高级分析手段~一般要求变量1()1(),,rr15342534具有较高的测量层次~在社会研究中这种要求往往很偏相关系数也可用于详析分析~具体做法: 难达到。为此研究人员利用许多统计手段将这些低层r,A,计算x与y的全相关系数 ,B,引xy次变量转化为定距变量处理~从而使多元分析的影哟 国内范围得到一定程度的扩大 r入检验变量A~计算x与y的偏相关系数。 xyA,C,多元分析一般要求每一项记录来自同一时点和rrrr,C,比较与~若=~说明x与y的同一单位~这在大规模的社会调查研究中也是难于保xyxyAxyAxy证的~这就为进行同一时点上地区差异的分析和同一r关系不受变量A的影响,若=0~说明x与y的xyA单位的历史变化的分析带来了困难。 ,D,多元分析包括了高深的数学问题并涉及大量的关系完全由A引起,若~说rrr,,0,且xyAxyAxy数字处理与运算~随着计算机技术的发展和统计软件明x与y间的关系部分由A引起的。 包的问世~这方面的困难有了很大克服。但当变量的分表法与偏相关系数法比较:,A,相同点:都是利数目太多~或设备缺乏以及受过专业训练的统计人员用统计控制区除其他变量的影响~以揭示两变量统计不足时多元分析方法实际应用仍受到很大限制。 关系的真伪~进行更深入的因果分析。,B,不同,E,多元分析常碰到一个问题是对于结果的解释。点:分表法适应于各种类型变量~除可对变量关系进由于分析中变量的选择~使用的分析方法是因研究者行检验外~还可进行条件关系分析和联合作用分析。而异的~而且由于多个变量间相互作用的复杂性等~缺点是当类别很多、表很大时~这种直观分析方法困使得对于分析结果的解释要较之于双变量和单变量分哪较大~而且为了保证分表中每个单元有足够的案析更为困难。 例~需要的样本规模也较大。偏相关系数在这两个方127、 相依性分析: 面优于分表法~缺点是不宜于条件关系和联合作用的,1,多元相关分析:<1>偏相关:是指用一个统计分析~应用范围受到限制。 值来测量当控制了其他变量的影响后~某一变量与另若计算两个定序变量的偏相关系数~则采用Gamma一变量间关系的有无和大小。根据控制的变量的数系数。以一阶相关为例~具体做法:依据变量A的目~可以将相关分为:一阶段相关、二阶段相关、三N值将样本分组~然后分组计算个组中的同序对数s阶段相关等等。 偏相关分析的要求:所有变 量为定距变量~测量偏相关关系的统计值称为偏相关和异序对数N~则偏相关Gamma系数为:dr系数~其值由-1到+1。偏相关系数用符号表XXXXX()NN,,sd示~在r下标点前面的是欲测偏相关的两个变量的名~其中控制变量A可以是定G,p()NN,r称~点后面是控制变量的个数与名称。例如~,sXYZd表示控制变量Z后~变量X与Y的偏相关。为了简 第36页 袁方《社会学研究方法教程》笔记 '序变量~也可以是定类变量。当控制变量为两个或更xaxaxaxaxax,,,,,1111221331441551多个时~计算偏相关系数的公式是相同的 其是:'当变量x与y均为定类变量,或一个为定类变量、一ybybyby,,,1111122133',个为定序变量,时~应当采用偏,或偏系,yxby中表示变量的贡献,表示变量对其axikijjik数,。具体做法是:根据控制变量的值将样本分组~'y典型变量的贡献。 以每组个案数与样本所含个案总数的比例为权数~计i ''算各个分组的相关系数值的加权平均数~即: x、y建构典型变量的准则是使两者间的相关系数 N(),,ii最大~称为第一典型相关系数。因此~典rr'''',,N其中是每组Lambda值~,xyxypii1111N型相关就是两组变量的线性组合的最大相关。应当指是每组个案数~N为样本个案总数。 出的是~因为每个变量组都有多个变量~第一典型变<2>复相关:不是在对某一变量的众多因素中区别出量不能完全解释所有误差~故而还应做第二次组合~某个变量的单独作用~而是用一个统计值来测量多个 这次组合的准则是:,A,第二对典型变量x、y变量对一个变量的共同作用。复相关系数用符号:22r表示~在r下标的点前面是被作用变量的名的相关也是最强的。,B,第二个典型变量与第rxxxx''xy22称~点后面的是作用变量的个数与名称。复相关系数一个典型变量无关~即。rr,,0''''值在0到1之间~其平方值称为决定系数~具有消减xxyy1212'x误差比例的含义。其原理是线引入变量~以其来1xaxaxaxaxax,,,,,2112222332442552由此x尽量解释y~然后再引入~以其尽量解释所剩余'2ybybyby,,,22112222332x的误差~然后再引入依此类推~则r3y123。同理可得第三对典型变可得第二个典型相关r''xy22所代表的是对y的最大解释~其平方根~即复相关系量和第三个典型相关。 r''数~就是各个x与y的最大相关。 xy33复相关也要求所有变量均为定距变量~其相关系数的典型相关要求所有变量均为定距变量~典型相关系数计算也是以皮尔森相关系数为基础的。两变量值在0到1之间~其平方值具有消减误差比例的含xx和,义。显然~当两组变量中某一组变量的个数为1时~12典型相关就是复相关。 222rrrr,,,(1)当资料是由概率抽样调查获得的~则无论是偏相关系yyyy1231231212 数、还是复相关系数或是典型相关系数均要进行假设xxxyrr、、、yy12312检验。 ,2,多元方差分析:是对多个定类变量与一个定距22rrrrr,,2()()()yyyy121212222变量关系的分析~他是由相关分析到因果分析的一个xxrrrrr和,,,(1)yyyyy12121211212过渡。多元方差分析与一元方差分析的原理一样~都1,r12是将总方差分为两部分:消减方差和剩余方差~通过,与某一变量,y,的复相关系数为:计算F值和相关系数E的值来检验和测量定类变量对222定距变量的作用。不同的是~多元方差分析定类变量rrrr,,,(1)~将偏相关系数ryyyy121211y21的数目增多~因此分析内容较多。 的值按上面所讲的公式带入本式~可得:,3,多元因果分析:通常采用建立因果模型的方22法~所谓建立因果模型就是利用统计手段将变量间的rrrrr,,2()()()yyyy121212其中r,因果关系用一个或一组数学方程式表达出来。在社会y1221,r研究中因果模型受到高度重视~主要原因在于它与实12 际估计模式参数的方法论结为一体~从而为人们提供xxy、、为变量两两全相关系数。rrr、、121212yy一种以高度可读性因果图表去表述理论的手段。因果 xxx、、同理可得三个变量,,与某一变量y的模型所用技术一般具有某种可对理论进行检验的、精123确严格的假设式演绎方法。最著名的因果模型是多元复相关系数计算公式:线性回归分析模型。此外还有路经分析模型和对数线222rrrr,,,(1)。即每高一阶的性分析模型等。在这些模型中因果关系一般是某一特yyyy1231231212 定时间内个体单位数兴建的一种非对称关系~而不是复相关系数可以低一阶复相关系数为基础计算出来。 一定时间内有序时间的相互关系。 当变量不全为定距变量时~要进行复相关分析~必须<1>多元线性回归:它是社会研究中多个变量之间数先将定序或定类变量转换为一组虚拟变量。转换的方量关系最简单的表达方式~是研究两个或多个自变量法:如果是一个二分变量~则只要将赋予其中一值 1与一个因变量之间的线性关系的方法。所谓线性关系分~另一值0分~这一定序或定类变量就转变为定距是指定量表达式的各项之间是可加的~所以这种表达变量了。统计学上将这种由非定距变量通过赋值0与式又叫做线性可加模型。1两值而变为定距变量称为“虚拟变量”。虚拟变量因,为是定距变量~因而可以运用复相关分析。 ,其中:为yxxx,,,,,,,,,00112233<3>典型相关:是一种分析两组变量之间的相关关系 的方法~它所测量的是两组变量的最大相关。其基本,xx、xy轴的截距。为当保持不变时~变1231原理是利用标准化直线方程分别将每组变量组合为一,个典型变量~然后计算这两个典型变量的相关。例如y化一个单位~的变化量。其他类推。有5个x变量与3个典型变量~其对应的典型变量 第37页 袁方《社会学研究方法教程》笔记 ,r中选出与y相关性最强的自变量引入方程~假定2yy,,,、、称为偏回归系数。为当123,xxx、、一定取值时~随机变量y的平均x最大~则应被引入回归方程:即yabx,,1232122数。 xxxx、、、,C,逐一考虑其余变量与已被选1345多元线性回归出要求自变量间的关系是线性可加的之 x入回归方程的变量对y的共同作用~即计算复相外~还要求所有变量均为定距变量。和相关分析不2 同~不得将一组虚拟变量均引入回归方程~必须放弃关系数~并从中选出相关最强的自变量进入回归方其中一个虚拟变量~否则回归系数无解。 rx程~假若最大~则应被引入~得到二元线性y233根据抽样数据建立的多元线性回归~必须经过F检,验~以确认回归直线以及每一个自变量偏回归系数的回归方程:。,D,同第三步yabxbx,,,12233建立。由于抽样误差的可能性不会大于给定的显著性 一样~逐一考虑其余变量与被选入变量对y的共同作水平~从而以最大的限度保证了所建多元直线方, 用~再从中选出复相关最强的自变量进入回归方程~程和偏回归系数的可靠性。 依此类推。在每引入一个自变量后~都须进行F检在多元直线回归中~我们要计算复相关系数 验~以确定引入后回归方程对于y的解释是否显著增~即全部自变量与因变量的相关程度。决定ry12345加~若达到研究所要求的显著度~则保留该步中引入2的变量~否则将其舍弃。通过逐个引入自变量注册检系数表示使用所确立的多元线性回归方程解ry12345验最后所得到的回归方程包含的都是对因变量作用显释y时~所能减少的误差的比例~其值越大~表示多著的自变量~这些自变量的重要性与其被引入的次序元回归对y的解释力越强。 相同~即最先引入的变量最重要~其次被引入的第二决定系数是鉴别多元线性回归方程品质的一个非常重重要。显然~逐步回归中进入回归方程的自变量多个要的指标~如果决定系数过小~表示在所使用的回归数多少与研究所要求的显著性水平有关。 方程中很可能遗漏了某些重要因素。在此情况下~不逐步回归不仅可以从众多的自变量中找出一些最重要仅表示所选择的自变量意义不大~而且很可能破坏了的自变量~从而使研究得以简化~而且当个自变量之使用多元线性回归的假定~从而使所求得的偏回归系间相关程度较高时~使用一般线性回归方程将会出现数有误。但也不能由此采用相反的做法~即引进的自系数失真或无解情况~逐步回归通过自动的放弃一些变量多多益善。实际上如果引进了许多与y无关的变变量~从而避免了上述问题。逐步回归可与一般回归量或彼此间相关性很强的自变量~都会引起所求回归混合使用。 方程偏回归系数的失真或甚至无解。为了判别在多元<3>路径分析:一般回归分析和逐步回归分析都是研线性回归中应引进哪些自变量~那些自变量更重要~究多因一果型关系~路径分析则是对多层次因果关系从而应先引入方程~常采用逐步回归的方法。但是任的分析方法。 何一种统计技术或计算机程序都是由人去操作运用与一般回归分析不同~路径分析不使用一个而是用一的~他们不能代替人的思考。只有当对现象的本质和组线性回归方程刻画多个变量之间的关系~对于各因内部联系有了一定的认识之后~才能考虑某种确定的变量的分析不仅要分析其受直接作用力的大小~也要统计工具。否则~轻率的选择某种统计工具~或者干分析其受间接作用力的大小。此外~路径分析也不同脆靠计算技术出来代替分析~所的结论都是不可靠于逐步回归分析~它不是寻找一个有效的因果模型~的~甚至是危险的。 而是以一个有效的因果模型为出发点~这一因果模型多元线性回归除了适用于多个自变量的情况外~还适其实是一个内容复杂的假设~然后用资料验证这一假用于虽然自变量只有一个~但它与因变量的关系却是设。 非线性的。例如:<4>对数线性分析:由L.古德曼,Goodman,所首23k即x与yyabxbxbxbx,,,,,,创~多用于自变量与因变量均为定类变量的多元因果123k分析。分析时先将数据制成列联表~再将列联表中所的关系是一个多项式的关系。实际上~只要将有格值分别取对数~这也也是本法称作对数线性分析2kxx与、当作不同变量~就可以将上述多项x的缘故。因为取了对数~各自变量对格值的影响就可式回归转化为k元线性回归。 以看成是线性可加的了~然后以各种模型与调查结果回归分析不仅在横剖因果研究中得到广泛应用~同样进行拟合检验~以确定最佳的模型分析。 在纵贯的时间系列分析中也有广泛的应用。把回归分对数分析不仅可对因变量每一自变量间的直接关系及析运用于社会分析时~还要注意因果联系中的滞后效美对自变量间的关系进行分析~更重要的是可对三变应。 量或多个变量之间的关系~即对变量间的多种交互作<2>逐步回归:它不是首先建假想模型~不是一次将用进行分析。 我们认为对因变量有影响的因素作为自变量引入回归,4,判别分析:目的就是描述由几个已知类别得来方程~而是逐步引入~若引入的自变量对因变量有显的对象的差异性~试着寻找一“判别物”~依其将这些著影响~就将其保留,反之则将其去掉。这样~最后群体分离。在判别分析中~作为判别物的是由若干判得到的回归方程之中只包含那些对因变量作用显著的别因子组成的线性判别函数:自变量~而未引入回归方程的其余因素~增加任何一ycxcxcx,,,,其中称ccc、1122pp12p个对回归效果都没有显著的改进。 逐步回归的具体步骤是: 为判别系数~表示各个判别变量的贡献~它是由过去,A,确定有可能影响因变量y的自变量~假定在某的资料求得的。 项研究中我们确定了5个自变量判别分析中~判别变量均要求为定距变量。 128、 互相依性分析:目的是研究多个变量之间的xxxxx、、、、。,B,计算每个自变量与y12345相互关系~从中找出一个简单的结构。常用的方法rrrrr、、、、的皮尔森相关系数~然后从有:,1,聚类分析:是一种分类技术~它是依据研1y2y3y4y5y 究者的理论或对变量的实际相关情况将变量分类~然 第38页 袁方《社会学研究方法教程》笔记 后测量这一分类方式是否有效。分类是人类认识世界会资本是不是信任,是不是一个义务团体的问题,那么我指最基础的手段之一~但在古老的分类学中~人们主要的社会资本坚持用社会网络概念来讲,就是因为它量化的是依靠经验进行分类~聚类分析则是依靠科学的定量基础特别的强。我举两个例子。一个是我们有个新的方法,方法进行分类~因而更精确可靠。 ,然后问调查对象叫做定位法,是指给出十几种不同的职业在社会研究中~一个概念往往要通过一组指标,或变认不认识,比如说你认不认识一个小学老师、律师或警量,来进行测量~但这些变量往往并不是互不相关察。不认识的时候,是不是可以经过配偶(爱人) 来认识。的~有些变量甚至呈现出很高的相关性~因此可通过这样很简单就可以区分这个老师是男的还是女的,是黑聚类分析将变量聚合为若干类~从而使我们能更清晰人、白人,还是西班牙语系的,这样运用到中国的话就是具地了解问题。聚类分析适合于各种测量层次的变量。 体的民族了,是少数民族的,还是多数民族的。从这个表格根据聚类的准则~可分为两类: 中你很快可以看出来他所可以接触到的是哪一类的人物,<1>距离法:通过变量间的距离量度变量的相似性~因为我们的职业的选择是一个社会的选样(抽样) ,就是社距离越短~相似性越佳~越可合并为一类。在距离法会上比较普通的,一般人可以接触到的职业。而且可以发中~变量被看作多维空间的一个点~则两变量现在这个网络中,他们接触到的人是同质的,还是异质的。 我们当然很希望看到异质化程度(高) ,因为这样资源运用n2比较灵活。也许我们会发现多数民族异质程度强,而少数xx与的欧氏距离为:其dxx,,()ij,ijikjk民族异质化程度比较弱。这在研究中是可能得出的结论,,1k 在方法中是有这样一个优势。 dxx与x中表示变量之距离~表示第K个个案ijijik 《中镇》:林德夫妇所作的著名社区研究~采用了人类学xxx上的观测值~为第K个个案在上的观测在jkji方法~对美国中部的城镇市民生活,包括谋职、成家、养值~n为个案数。 子、闲暇、宗教及社会活动等六个方面,作了全面考察。d根据计算的距离~通常采用谱系聚类法将变量间P45 ij 的关系理顺成谱。其基本思想是先把P个变量各自看《江村经济》,1939年,:我国社会学家费孝通先生的成一类~然后选择距离最小的合并为一新类,再计算社区研究名著。该书具有丰富的社会学内容~但却吸取了新类和其他类的距离~然后将距离最近的合并为新的人类学分析方法和观点。尤其是他导师~著名社会人类学一类,这样每次减少一类~直到所有变量成为一类为家马林诺夫斯基所开创的功能分析法对该项研究影响最止。 深。 <2>相关系数法:是通过变量间的相关系数来量度聚 类中变量的相似性的~相关系数越大~相似性越佳~“霍桑实验”:梅奥、罗斯利兹伯格等人于20世纪二三十越可合并为一类。相关系数不限于适用于定距变量的年代所作的社会学实验~被认为是组织管理理论的转折皮尔森相关系数r~如果是定类变量~可采用系数,点。在这次实验中~研究者发现工人们之间的人际关系是或系数等。相关系数求出后~仍采用谱系聚类法进,影响其工作效率的一个重要因素。这一结论在以后学者所行聚类~但与距离法不同的是首先将相关系数最大的作的反复实验中都得到了印证。他突破了传统管理学派所合并为一类~然后再逐步合并~直到所有变量成为一谓“经济人”的概念~成为新一代管理理论即人际关系学派类的谱系图。 的出发点。 谱系图作出后~应将变量分为几类为宜~一般用归类 系数进行判断:《伦敦人民的生活和劳动》:英国19世纪著名的调查~ 由经验社会学代表人物布思奋斗18年写成。他将伦敦划组内平均相关系数归类系数=归类系数应分为50个区~依5个不同标准排列:贫穷率、人口密组外平均相关系数度、出生率、死亡率、早婚率。而居民被划分为高级、中大于1。通常要求归类系数~作为分类的标,1.3级和低级与这50个区相对应。为了区际比较~布思制定准。对于所分类别还应作出社会学的解释~这样聚类了综合指数~并对50个区用不同色彩在伦敦地图上画的结果才有意义。 出~形成一幅直观的社会世态生活图。英国政府根据布思以上介绍了变量群的聚类分析~它又称为R型聚类的调查报告于1908年颁布了《老年抚恤金条例》~实行分析。但如果研究个案群的归类~则称为Q型聚类了失业保险~并规定了重体力劳动的最低工资限度。 分析。 ,2,因素分析:也是旨在简化大量变量之间的关系“春田调查”,南大95<名>,:该调查对中国20年代的调的方法~但它不是像聚类分析那样~将这众多的变量查颇有影响~春田市位于美国南北中央~是一典型美国城归成少数几类而是从众多变量的相关变量中抽取若干市。这次调查是应当地居民的要求而展开的~旨在改善市共同因子。 内的公共事业。调查内容包括教育、工商业、市政管理、,3,最小空间分析:是一种较新但极有发展潜力的公共卫生、居住条件、娱乐场所、治安等~并针对调查结分析方法~可适用于各种尺度的变量~最小空间分析果提出了具体建议。结果不仅达到了改善公共事业的目以相关系数为基础~通过绘图的方法来简化多个变量的~而且还在大范围的宣传中使群众对该是有了新的了之间的相互关系。多个变量之间的相互关系~可用一解~促使他们更积极的参与自己城市的市政建设。 维空间来表示~也可用二维空间或多维空间表示~空 《自杀论》:杜尔克姆经典著作~标志着社会研究进入现间越大~情况越复杂~最小空间分析就是要找出一个 代阶段。《自杀论》的重要意义不仅在于其中包含着关于最小而又最能代表实际情况的空间达到简化变量间关 自杀现象的精辟论述~而且还在:,1,它是孔德实证主系得目的。 义思想在社会研究中第一次得到完备的经验的体现。证实 了杜尔克姆关于社会事实独立于个人之外的说法。,2, 《街角社会》:作者怀特通过三年半的参与观察而得到的它是理论与经验结合的首次范例。,3,促进了社会研究 结果。P44我们现在研究社会资本是个量化的问题。社会从单变量的描述性的研究转向多变量的解释性的研究。 资本涉及的面很广,可以从各种不同的角度来讲,比如说社 第39页 袁方《社会学研究方法教程》笔记 ,4,就研究方法而言~杜尔克姆首次将“多元分析法”引数,(4)年龄X岁的人在一年内的生存率,(5)年龄X岁的 入了社会学。,5,此外~它还为如何利用统计资料、如人在一年内的死亡率。 何从经验现象中概括出理论认识提供了范例。 《欧洲和美国的波兰农民》:托马斯和美籍波兰学者兹南尼斯基选取了几百个样本~使用文献法和个案分析法~将移居美国的波兰农民与波兰本国的农民做了对照研究~写成此书。该书被认为是社会学个案研究的经典范例之一。 斯托弗:美国社会研究方法大师~早年就读于著名统计学家皮尔逊和菲舍尔门下~并受到了严格的统计学训练。主要研究有:美国黑人地位的研究,30年代,、美国士兵的研究,40年代,、移民方式的研究,40年代,~以及在麦卡锡时期的政治民意测验,50年代,。他所研制的研究设计、抽样方法、问卷设计以及分析逻辑等已成为目前广泛应用的社会统计调查研究的模式。 拉扎斯菲尔德:美国社会学家~主要贡献是~在斯托弗等人的《美国士兵》的研究基础上~提出了社会统计分析的“详析模型”。此外~他还组织了哥伦比亚大学的应用社会研究机构~培养了一批在后来的美国应用研究界起主导作用的年轻人。他于其门徒的理论和方法被社会学界称为哥伦比亚学派。 《定县社会概况调查》,1933年,,李景汉历时七年之久完成的社区研究的杰作~在中国社会调查史上占有重要地位~该调查采用实地调查与统计调查相结合的方法~使用了随机抽样与分层抽样~亲自设计了314个统计表格~初步建立了中国农村调查的统计指标体系。 毛泽东对社会调查的贡献:毛泽东本人就是社会调查的身体力行者~他的“没有调查就没有发言权”、“实事求是”、“走群众路线”的观点以及他所总结和倡导的“深入实地”、“召开座谈会”、“解剖麻雀”、“典型调查”等工作方法对社会调查的普及起了很大的推动作用。毛泽东撰写的《中国社会各阶层的分析》,1926,、《湖南农民运动考察报告》,1927,、《寻乌调查》,1930,、《长岗乡调查》,1933,等调查报告以及《调查工作》,又名《反对本本主义》~1930,、《实践论》,1937,、《关于农村调查》,1941,等理论性文章。在他的倡导下~中共在40年代组织了对陕北地区大规模的社会调查研究~写出了《绥德、米脂土地问题初步研究》、《米脂县扬家沟调查》等大批调查报告~这些调查为认识中国社会制定革命策略奠定了基础。 人口社会学: 生命表: 又称“死亡表”~是反映一个国家或一个地区人口生存死亡规律的调查统计表。生命表不是简单初步的会计资料~而是根据一定的调查时期所获得的有关国家或地区的人口普查资料(或有关部门的统计资料)~经过分析整理~折算成以10万或100万同年龄人为基数的逐年生存与死亡的数字编制而成。生命表以年岁为纲~全面、完整地反映了某一国家或地区一定人群从诞生直至全部死亡的生死规律。生命表的编制为经营人寿保险业务奠定了科学的数理基础~是计算人身保险的保险费、责任准备金、退保金的主要依据。世界上第一张生命表是英国天文学家哈莱于1693年编制而成的。20世纪90年代中国人民保险(集团)公司组织了大量的专家~成功地编制出《中国人民保险业务经验生命表》~并于1997年4月1日起正式运用于人寿保险业务的经营核算中。生命表统计的主要项目一般分为五项:(1)年龄~用X代表~表示年龄X岁,(2)年龄X岁的生存人数,(3)年龄X岁至X+1岁内的死亡人 第40页 袁方《社会学研究方法教程》笔记
/
本文档为【社会学研究方法教程》笔记】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
热门搜索

历史搜索

    清空历史搜索