为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 03-第三章 简单随机抽样

03-第三章 简单随机抽样

2010-03-15 50页 ppt 1MB 65阅读

用户头像

is_285767

暂无简介

举报
03-第三章 简单随机抽样null第三章 简单随机抽样 第三章 简单随机抽样 本章要点本章要点 简单随机抽样是抽样中最基本、最成熟、也 是最简单的抽样设计方式,是所有概率抽样方法 发展、比较的基础。 ①要求通过学习熟练掌握简单随机抽样的抽 样方式和样本抽选方法; ②熟知总体均值、总体总值和总体比例的简 单估计; ③掌握样本量的确定;了解子总体的估计。null第一节 抽样方式null 简单随机抽样也称纯随机抽样。对于大小为N的总 体,抽取样本量为n的样本,若全部可能的样本被抽...
03-第三章  简单随机抽样
null第三章 简单随机抽样 第三章 简单随机抽样 本章要点本章要点 简单随机抽样是抽样中最基本、最成熟、也 是最简单的抽样设计方式,是所有概率抽样方法 发展、比较的基础。 ①要求通过学习熟练掌握简单随机抽样的抽 样方式和样本抽选方法; ②熟知总体均值、总体总值和总体比例的简 单估计; ③掌握样本量的确定;了解子总体的估计。null第一节 抽样方式null 简单随机抽样也称纯随机抽样。对于大小为N的总 体,抽取样本量为n的样本,若全部可能的样本被抽中 的概率都相等,则称这样的抽样为简单随机抽样。根 据抽样单位是否放回可分为放回简单随机抽样和不放 回简单随机抽样。 (一)放回简单随机抽样 (二)不放回简单随机抽样 (三)不放回与放回简单随机抽样的比较 一、什么是简单随机抽样(一)放回简单随机抽样(一)放回简单随机抽样 如果抽样是有放回的,那么每次抽取都都是从 个总体单位中抽取,这时可能的样本为 个(考虑样本单位的顺序),每个样本被抽中的概率为 ,这种抽样方式就是放回简单随机抽样,所得的样本称为放回简单随机样本。放回简单随机抽样,有一个特点,即同一个单位有可能在同一个样本中重复出现。(二)不放回简单随机抽样 (二)不放回简单随机抽样 如果抽样是无放回的,即同一个单位不能 在样本中重复出现,那么,若不考虑样本单位的顺序,则可能的样本为 个,每个样本被抽中的概率为 。这样的抽样方式就是不放回简单随机抽样,所得的样本称为不放回简单随机样本。 (三)不放回与放回简单随机抽样的比较 (三)不放回与放回简单随机抽样的比较 1、每次抽取样本单位面对的总体结构不同。这是二者的主要不同之处。这一点使得前者的数学处理相对简单。 2、样本提供的信息量不同。显然,在样本量一定的条件下,由于后者提供的信息量大于前者,其抽样效率更高。 在实践中,一般多采用不考虑顺序的不放回简单随机抽样,所以以下讨论如无特别说明,都指这一类简单随机抽样。 二、简单随机样本的抽选方法二、简单随机样本的抽选方法 简单随机样本的抽选,首先要将总体 个单位从1到 编号,每个单位对应一个号;然后从所编的号中抽号,如果抽到某个号,则对应的那个单位入样,直到抽够 个单位为止。 (一)抽签法 (二)随机数法 (一)抽签法 (一)抽签法 当总体不大时,可分别采用两种方法抽取。一种是全样本抽选法,另一种是逐个抽选法,按这两种方法抽到的 个单位的样本是等价的,每个被抽到的样本的概率都等于 。null抽签法-简单随机抽样(二)随机数法 (二)随机数法 当总体较大时,抽签法实施起来比较困难,这时可以利用随机数表、随机数骰子、摇奖机、计算机产生的伪随机数进行抽样。 1、利用随机数表进行抽选。 随机数表是一张由0,1,2,…,9这十个数字组成的,一般常用的是五位数的随机数字表,10个数字在表中出现的顺序是随机的,每个数字都有同样的机会被抽中。 随机数表 随机数表null 用随机数表抽选简单随机样本时,一般可根据总体大小 的位数决定在随机数表中随机抽取几列,比如 =768,要从中抽取 =10的简单随机样本,则在随机数表中随机抽取相邻的3列,顺序往下(或往上),选出前10个001到768之间的互不相同的数,如果这3列随机数字不够,可另选其他3列继续,直到抽够个 单位为止。null 用此种方法,当 的最高位数较小,比如小于5,且 不小 时,由于读到的随机数被舍弃不用的比例较大,抽选效率较差。此时采用下面的方法。在随机数表中随机抽取3列,顺序往下,如果得到的随机数大于247,小于989(因为247的4倍为988,因此000及989到999的数字应舍弃),则用这个数除以247,得到的余数入样,显然这种方法效率要高得多。随机数表的起始页和起始点都应用随机数产生。null 3、利用摇奖机进行抽选。 4、利用计算机产生的伪随机数进行抽选(比如Excel中的RAND函数)。通常产生的伪随机数有循环周期。因此在有条件的情况下,一般不建议使用此种方法。 2、利用随机数骰子进行抽选(正20面体)。null (一)简单随机抽样在抽样理论中的地位 它是抽样中最容易掌握的技术、也是发展最成熟的技术,建立了最完备的理论。简单随机抽样也是比较其他抽样设计方法优劣的基础。其他抽样方法技术都是在它的理论技术基础上,针对它的局限发展起来的。 三、简单随机抽样在抽样理论中的地位 与局限性null 若总体单位数 很大时,编制抽样框困难;抽样框中即使有辅助信息也不加利用,使得估计的统计效率较其他利用辅助信息的抽样设计方法低;由于样本在总体中的地理分布范围较广,如果采取面访,则费时、费钱、费力,困难较大;可能得到一个“差”的简单随机样本;若不用计算机,而用随机数表或随机数骰子抽取一个大样本,比较劳神单调。 (二)简单随机抽样的局限性四、有关指标与符号四、有关指标与符号null第二节 总体均值与总体总值 的简单估计null(一)简单估计量的定义 (三)简单估计量 的方差(四)简单估计量 的方差的无偏估计 (二)简单估计量 的无偏性(五)放回简单随机抽样的简单估计 (六)设计效应(七)影响估计量精度的因素一、总体均值的简单估计 (一)简单估计量的定义(一)简单估计量的定义 对于简单随机抽样,最简单的估计是利用样本均值作为总体均值的估计,即总体均值的简单估计量为: 也就是说,样本均值是总体均值的简单估计量。(二)简单估计量 的无偏性(二)简单估计量 的无偏性对于简单随机抽样, 是 的无偏估计,即有 证明: 这就是对称性论证法。由于总体中每一个单位的入样概率都相等,所以不放回简单随机抽样是一种等概率抽样。 (三)简单估计量 的方差 (三)简单估计量 的方差 式中, 抽样比; 为有限总体校正系数。 证明: 根据对称性论证法,有 null因此有 (四)简单估计量 的方差的无偏估计 (四)简单估计量 的方差的无偏估计 的无偏估计是: 式中 为样本方差。 证明: null根据对称性论证法及 的表达式,有 由此可得: (五)放回简单随机抽样的简单估计 (五)放回简单随机抽样的简单估计 现实中许多情况下,抽样必须是放回的, 即从总体中抽中的单位每次都要放回总体中。 例如在城市中对行人、车辆的调查,对超市顾 客、影剧院观众的调查等抽样都是有放回的, 从而,有可能重复抽中某些单位。 对于每次抽到的结果(视为随机变量) 都有 null由此可以证明: 注意到 null因此样本方差 是无限总体方差 的无偏估计量。 方差 的一个无偏估计是: 考虑样本单位顺序的放回简单随机抽样也是 等概率抽样。 null放回简单随机抽样的 为:这说明除非 =1,否则在相同的样本量下,放回简单随机抽样的方差总是大于不放回的方差,即它的抽样效率一般比不放回简单随机抽样的低。根据抽样设计效应定义: null【例3-3】为调查某大学学生的电信消费水平,在全校=15230名学生中,用简单随机抽样的方法抽得一个n=36的样本。对每个抽中的学生调查其上个月的电信支出金额(如表3-6所示)。试以95%的置信度估计该校大学生该月电信消费的平均支出额。 null , , , , , 。 因此,对该校大学生某月的电信消费的人均支出额的估计为53.64(元),由于置信度95%对应的 =1.96,所以,可以以95%的把握 说该校大学生该月的电信消费的人均支出额大约在53.64±1.96×6.1355,即41.61~65.67元之间。 若采取放回简单随机抽样,则: , , ,以95%的把握估计该校大学生该月的电信消费的人均支出额大约在53.64±1.96×6.1428,即41.60~65.68元之间。 计算结果说明,不放回比放回简单随机抽样估计的置信区间略小一些。由于总体较大而抽样比较小,所以两者之间相差很小。 解:依据题意和表中数据,可计算得:null 总体总值为总体均值的 倍,即 (一)简单估计量的定义 N倍的样本均值是总体总值的简单估计量, 即 二、总体总值的简单估计 只要我们有了总体均值的估计结果,就可以很容易地推出总体总值的估计结果。null 由于总体总值是总体均值的N倍,其简单估计量也是总体均值估计量的N倍,而N是固定常数,所以总体总值的简单估计量的性质由总体均值的简单估计量的性质来决定。 容易证明的无偏估计为 (二)简单估计量的性质null【例3.4】试以95%的置信度估计例3.3中该校大学生该月电信消费的总支出额。 解:依题意,N=15230,根据例3.3计算的结果,可估计该校大学生该月电信消费的总支出额为 (元)。在不放回简单随机抽样下, =1523037.6444 =1523037.6444=8731 727 749(元), (元), 以95%的把握估计该校大学生该月电信消费的总支出额为: 816 937.2±1.96×93 443.71元即在633 787.53~1 000 086.87元之间。 若为放回简单随机抽样,则可得: 1523037.7336 =8752417947(元), (元),以95%的把握估计该校大学生该月电信消费的总支出额为816 937.2±1.96×93 554.36元,即在633 570.65~1 000 303.75元之间。 null第三节 总体比例的简单估计null规定 设总体中有 个单位,具有某种属性的单位数为 ;不具有该种属性的单位数为 。具有某种属性的单位比例为: 不具有该种属性的单位的比例为: 因此对总体比例的估计就是对总体均值的估计, 对总体中具有某种属性单位的总个数 的估计是 对总体总值估计的一个特例。 一、问题的提法 null(一)简单估计量的定义 二、总体比例的简单估计量及其性质 根据调查要求,利用简单随机抽样的方式随机抽取 个单位组成样本,其中 个具有某种属性,则样本比例 (样本均值) 就是总体比例 的简单估计量; 就是总体中具有某种属性单位的总个数 的简单估计量。 null(二)估计量的性质1、 是 的无偏估计。即有:2、 的方差为:3、 的无偏估计量是 ,即null当 都比较大时,我们以正态分布给出 及 的近似置信区间(置信度为 )为:修正后的 与 的置信区间分别为:null 【例3.5】试以95%的置信度估计例3.3中该校大学生该月电信消 费支出超出80元的人数及其比例。 解:根据例3.3所给的资料可知, =15230, =36, 7, =1.96。由此可计算得: 于是 的95%的置信区间为 的95%的置信区间为(0.0496 ,0.3392 )=(755,5166)。 =(0.0496,0.3392)null第四节 样本量的确定null 在抽样调查的理论方法研究中,样本量的确定既有重要的理论意义,又有现实的实用价值。样本量过大,不符合抽样调查的宗旨;过小,则抽样误差偏大,无法保证估计精度的要求。样本量的确定主要受两个方面因素的影响和制约: 一是对抽样估计量精度的要求。对于一个确定的抽样设计,估计量的精度要求高意味着要求的抽样误差小,而要想抽样误差小,就必须样本量大。而总体单位调查标志的变异程度、总体的大小、样本设计和所使用的估计量、回答率等都是影响估计精度的因素,从而也是影响样本量的因素。一、确定样本量主要考虑的因素null 二是实际调查运作的限制。调查的经费能支持多大的样本?允许调查持续的时间有多长?需要多少调查人员?虽然有些限制因素在样本量的计算公式中还无法体现,但是在确定最终所需的样本量时必须加以考虑。实践中样本量的确定是在多种约束条件下进行的折衷过程。 由于大部分限制约束条件不便于量化,确定样本量的计算公式时往往只在抽样精度与调查费用两者之间权衡。采用两种不同的方式来确定:一种是在总费用一定的条件下使精度最高;另一种是在满足一定精度要求的条件下使费用最小。 样本量的确定 样本量的确定通过费用函数确定样本量通过费用函数确定样本量一、确定的原则与主要因素 简单随机抽样的总费用: 若CT,C0定,则最大的n就确定了。 样本量的确定 样本量的确定费用 总费用 固定费用 可变费用 设计费 分析费 办公费 管理费 场租费 等访问员费 交通费 礼品费 电话费 等null 通过总体均值的方差公式可推导出样本量公式为: 其中二、估计总体均值(总值)的样本量确定null 给定绝对误差限 、相对误差限 和变异系数 的允许上限的样本量确定公式,即分别有: 二、估计总体均值(总值)的样本量确定null 由于总体方差 和总体均值 未知,因此在利用上述公式时,必须事先对它们做出估计。实际工作中,可以通过以往对同类问题调查积累的经验来估计,也可以通过预调查来估计,或通过其他调查方法和定性分析方法获得。 对于复杂抽样设计方法,由于确定样本量的公式比较复杂,常常难于计算。在同样精度要求的条件下,简单随机抽样的样本量 相对容易获得,这时可以利用(3.21)式先计算复杂抽样设计的设计效应 ,然后再间接推算复杂抽样设计方法所需要的样本量 ,即有: null【例3.6】在例3.3中,如果要求以95%的置信度估计该校大学生该月人均电信消费支出的绝对允许误差不超过5元,样本量应确定为多少? 解:依据所给条件: =15230, =5,置信度95%对应的正态分布表的上侧分位数为 1.96,且 =1358.41,据此可计算得: = 也就是说,至少应抽取一个样本量为206的简单随机样本,才能满足95%置信度条件下绝对误差不超过5元的精度要求。null根据样本比例 的方差公式 可以推得: 其中 同样可求得给定绝对误差限 、相对误差限 和变异系数 的允许上限的样本量确定公式,即分别有: 在无限总体或放回抽样情形下, 即为所确定的样本量。 三、估计总体比例的样本量确定null【例3.7】 在例3.5中,如果要求以95%的置信度估计该校大学生该月电信消费支出超出80元的人数比例的相对允许误差不超过10%,样本量至少应为多少? 解:根据例3.5所给的资料和计算的结果可知: =15230, =36, 7, =1.96。 ,由此可计算得: 计算结果说明,至少应抽取一个样本量为1442的简单随机样本,才能满足95%置信度条件下相对允许误差不超过10%的精度要求。null 习题:联想集团希望了解购买“天禧”品牌计算机的消费者满意比例,集团确信“天禧”品牌计算机满意比例不会小于70%。如果集团想使抽样绝对允许误差在±2%,置信度为99%,则需要多大的样本? 上一页下一页返回本节首页null 样本量与总体规模N有关吗?按照总体比例确定样本量合适吗? 例:简单随机抽样估计P,置信度95%,允许误差5%,在P=0.5条件下 总体规模(N) 所需样本量(n) 50 44 100 80 500 222 1000 286 5000 370 10000 385 100000 398 1000000 400 10000000 400 抽样调查中的样本量null 由此可知,在精度要求相同条件下,在广州 市进行一项调查和在全国进行一项调查,样 本量的差别并不大。 总体规模越大,进行抽样调查的效率越高。 若分类、分区、分层分别进行估计则另当别 论。抽样调查中的样本量null 总体规模越大,抽样调查的效率越高。 对于很小规模的总体,要取得所期望的精度,通常必须调查较大比例的样本,在经济上不合算。所以,从抽样理论而言,抽样调查与“满足各级政府需要”存在矛盾。抽样调查中的样本量四、逆抽样法四、逆抽样法 现实中有这样一种情况,即总体中具有所考虑属性的单位数很少,也就是说 值很小。对于此类稀有事件的比例估计问题,利用前面给出的公式确定样本量有困难。 霍丹(Haldane)1945年提出一种称为逆抽样的方法,专门用于此类小比例的抽样,即事先确定一个整数m(m>1),进行逐个抽样,直到抽到m个所考虑特征的单元为止。null第五节 子总体估计一、问题的提出一、问题的提出 我们把总体中具有某种共同属性特征的单位的集合称为子总体。 对子总体的处理有多种方法:若每个子总体在编制抽样框时就可以区分开,可以采用分层抽样方法进行估计;若事先不能将各个子总体区分开来,但是事先可以知道各个子总体的单位数 ,则可采用事后分层的方法进行估计;还有一种情况是,既不能事先将各个子总体区分开来,又无法事先知道各个子总体的单位数 。本节的讨论仅限于后一类子总体的估计 。null 二、子总体均值的估计样本均值是子总体均值的无偏估计量null其方差为 式中 为第 个子总体的抽样比,子总体的方差未知,可用其样本方差 来估计。至此我们的问题并没有解决,因为 未 知,所以 也是未知的。 null 我们可以将单位是否属于第 个子总体看作是总体 单位的一个属性特征,那么 就是总体的比例 , 而 就是其样本的比例 , 是 的无偏估计,因 此有 因为 和 都是固定的,所以 因此可用 来估计 据此我们可得到 的无偏估计量为null 上一小节解决了子总体均值的估计问题,但是由于 未知,子总体总值的估计问题依然没有得到解决。 定义记它们可以分别用 , 进行估计。三、子总体总值的估计null于是有 null 总体总值 (也就是子总体总值 )的一个简单无偏估计为 它的方差为 null而样本方差 因此 的一个无偏估计为 编号为奇数的习题答案编号为奇数的习题答案3.1判断以下抽取方式是否为等概率抽样:(1)是 (2)否 (3)是 (4)否null3.3为调查某中学学生的每月购书支出水平,在全校名学生中,用不放回简单随机抽样的方法抽得一个的样本。对每个抽中的学生调查其上个月的购书支出金额 (如表1所示)。 (1)在95%的置信度下估计该校学生该月平均购书支出额; (2)试估计该校学生该月购书支出超出70元的人数; (3)如果要求相对误差限不超过10%,以95%的置信度估计该校学生该月购书支出超出70元的人数比例,样本量至少应为多少。null 表1 30名学生某月购书支出金额的样本数据null3.3解:(1)依据题意和表1的数据,有: 因此,对该校学生某月的人均购书支出额的估计为56.07(元),由于置信度95%对应的 所以,可以以95%的把握说该学生该月的人均购书支出额大约在56.07±1.96×5.115,即50.96~61.19元之间。,null(2)易知,N=1750,n=30, 的95%的置信区间为:的95%的置信区间为:(159,776)null(3)N=1750,n=30, 由此可计算得: 计算结果说明,至少应抽取一个样本量为1237的简单随机样本,才能满足95%置信度条件下相对误差不超过10%的精度要求。null3.5要调查甲乙两种疾病的发病率,从历史资料得知,甲种疾病的发病率为8%,乙种疾病的发病率为5%,求: (1)要得到相同的标准差0.05,采用简单随机抽样各需要多大的样本量? (2)要得到相同的变异系数0.05,又各需要多大的样本量?null3.5解:(1)已知 , 由得: 由得:(2)
/
本文档为【03-第三章 简单随机抽样】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索