为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

北大附中高考数学专题复习概率与统计经点答疑(一)

2020-03-06 20页 doc 223KB 2阅读

用户头像

is_260251

暂无简介

举报
北大附中高考数学专题复习概率与统计经点答疑(一) 学科:数学 教学内容:概率与统计经点答疑(一)     【学法旨要】 1.本章应达到的学习目标是什么? (1)了解随机变量、离散型随机变量、连续型随机变量的概念,会求出某些离散型随机变量的分布列. (2)了解连续型随机变量的概率密度曲线及概率密度函数的定义、区间概率的几何意义. (3)了解离散型随机变量的期望和方差的意义,能根据离散型随机变量的分布列求出其期望和方差. (4)理解简单随机抽样、系统抽样和分层抽样等常用的抽样方法的意义及适用范围,能用上述三种方法从总体中抽取样本. (5)掌握总体分布的估...
北大附中高考数学专题复习概率与统计经点答疑(一)
学科:数学 教学内容:概率与统计经点答疑(一)     【学法旨要】 1.本章应达到的学习目标是什么? (1)了解随机变量、离散型随机变量、连续型随机变量的概念,会求出某些离散型随机变量的分布列. (2)了解连续型随机变量的概率密度曲线及概率密度函数的定义、区间概率的几何意义. (3)了解离散型随机变量的期望和方差的意义,能根据离散型随机变量的分布列求出其期望和方差. (4)理解简单随机抽样、系统抽样和分层抽样等常用的抽样方法的意义及适用范围,能用上述三种方法从总体中抽取样本. (5)掌握总体分布的估计方法,即用样本频率分布去估计总体分布.了解累积频率分布的意义,能由样本的频率分布求其累积频率分布. (6)掌握正态分布和正态总体的概率密度函数的性质,了解生产过程中的质量控制图的原理和使用方法,了解假设检验的基本思想. (7)会用 去估计总体方差 ,会用S去估计总体差 . 2.学好本章的关键在哪里? 概率论与其他的数学分支有密切的联系,同时它又具有自己的特点.这主要现为以下两个方面:一是它与其他数学分支一样具有严格的数学形式;二是它特有的“概率思想”.概率这门学科与现实世界的联系非常密切,它的许多概念和关系都有其现实背景,因此我们常常将概率的结论放在一些现实模型中去思考.在研究概率的过程中,直观常常是理论的先导,为了引进概率论的基本概念和理解它的某些结论,我们必须反复地往返于现实背景和数学理论之间:把某一实际问题归结为概率论的某一模型,用概率的理论加以解释;或是通过现实例子来解释和理解概率论的概念和结论.这是初学者在学习过程中遇到的主要困难,同时也是学好概率的关键. 数理统计是概率论的姊妹学科,和概率论具有相同的现实背景,并且数理统计以概率论为基础.一般来说,概率论是从数学模型出发来推导现实模型的性质,而数理统计则是从观测数据来推测模型的性质,是一种搜集观测数据然后进行分析和推断的数学方法. 【经点答疑】 1.为什么要引入随机变量这个概念呢? 为了说明这个问题,我们要先从随机现象谈起.在现实生产、生活中,我们经常会遇到这样一类现象:在相同条件下多次进行同一试验,或对同一现象进行多次观测,我们得到的结果却不总是相同的,往往存在一些差异;而且在每次试验或观测之前,不能确切预料会发生哪一种结果,这样的现象我们称之为随机现象.例如: (1)检测一批同型号灯泡的使用寿命,有的灯泡能连续使用1000小时,有的却只能用600小时. (2)用同一门炮在相同条件下连续对目标射击,结果弹着点并不完全相同,总是在一定的范围内或是偏左一点,或是偏右一点,要么偏上一点,要么偏下一点. 对于上面两项试验,为什么在相同条件下试验或观测的结果却出现差异呢?这是因为除了我们能人为控制的基本影响因素以外,客观上还存在大量不断变化着的次要因素对试验的结果施加影响.比如,在大炮的射击中,排除初始速度,发射角度等主要因素之外,其他的次要因素诸如弹药成分、炮弹飞行时受到的风力、摩擦力的变化等都会或多或少地对炮弹的最终着地位置产生影响,而且所有这些次要因素的作用都是随机出现的,这就造成了随机现象的结果是不可预测的.那么随机现象结果的发生是不是毫无规律可寻呢? 从表面上看,随机现象似乎是一种没有规律性的现象.因为对随机现象只做个别地观测时,一般是看不出规律性的.但是,当对随机现象做大量的观测时就会发现它有某种明显的规律性.比如,用大炮对同一目标射击时,射击次数不多时只有几个零星的弹着点,但当多次射击时,就会看出弹着点的分布呈现出某种规律性——即弹着点差不多关于目标中心对称,而且越靠近中心,弹着点就越密集等等.随着射击次数的增加,这种规律性就表现的越为明显. 在研究随机现象中所包含的统计规律性的过程中,逐步建立了概率与统计这门数学学科.概率与统计是从数量关系上来研究随机现象的统计规律的;为了便于数学上的理论推导与计算,我们就必须把对随机事件结果的描述数量化. 在随机现象中,有很大一部分问题都直接与数值发生关系.例如,在产品检验中总是随机抽取一批产品进行检验,而我们所关心的是抽样中出现的次品的数目;在电话呼叫问题中,我们关心的是某段时间中的话务量,这与呼叫次数和每次呼叫所占用交换设备的时间长短有关;在掷骰子问题中,我们关心的是每次出现的点数等等. 但是,也有许多随机事件的结果看起来与数字无关.如射击目标时的命中或未命中;选举中的当选与落选等等.对于这样的问题,为了研究的方便我们可以通过适当的途径对其进行“数量化”.例如,在掷硬币的试验中,每次出现的结果不是正面向上就是反面向上,与数值没什么直接的联系.但如果我们用如下对应关系,便可将试验结果“数量化”:规定正面朝上时对应数字“1”,反面向上时对应数字“0”.一般地,对于某一随机事件A,一定可以通过如下所示函数与数值建立对应关系: 例如,对产品进行抽样检验,每一样品都有合格、不合格两种情况.用希腊字母ξ来表示产品性能则可以规定: 上述的量 ,ξ的取值会发生变化,并且这些量取各种值的可能性有大有小.我们称这种随结果出现的可能性大小而取这个值或那个值的变量为随机变量.概括来讲,在某一随机现象中,对于每一个随机事件,都对应惟一的一个数,这样依不同随机事件而取不同值的量就是随机变量.随机变量通常用希腊字母ξ,η来表示. 例  有100件产品需要检验,其中有5件次品,就是说次品率为5%,现从这100件产品中任意抽取5件,用随机变量表示“抽得的次品的件数为n”的概率. 思路启迪  显然在抽取的5件产品中,次品数可能为0,1,2,3,4,5,不同的抽取批次其次品数可能不同,但任何一批的抽取结果又是完全确定的.所以次品数是一个随抽取结果而变化的量,我们用随机变量η来表示抽取结果,则{η=n}表示“抽取的5件产品中有n件次品”(其中n=0,1,2,3,4,5). 规范解法 点评  在引入了随机变量之后,对事件的表示和对概率的计算都是很方便的.尤其是在进行事件的运算时,随机变量的优势变得更加明显.例如,对上例中事件“次品数不多于两件”可用{η≤2}来表示;而事件“次品数多于两件”可用{η>2}来表示.又因为“次品数不多于两件”包含三个基本事件,即“次品数为0件”,“次品数为1件”,“次品数为2件”.分别用{η=0},{η=1}和{η=2}来表示,且这三个基本事件互相独立,所以计算概率P(η≤2)就是上面三个事件的概率之和.所以有: P(η≤2)=P(η=0)+P(η=1)+P(η=2) ≈0.7736+0.2036+0.0214 =0.9986. 同样的道理,计算P(η>2)的过程为: P(η>2)=P(η=3)+P(η=4)+P(η=5) ≈0.0011+0.0000+0.0000 =0.0011. 通过这个例子可以看出,用随机变量来描述随机试验的结果简洁、方便,而且便于进行数学运算,这对我们的研究非常重要. 2.所有的随机变量都是相同的吗? 在第一个问题中,我们介绍了随机变量的产生和应用,列举了一些随机变量的例子.其中有的随机变量所能取值的全体是有限个,如我们在产品检验中所说的废品数;有的随机变量所能取值的全体是可列无穷多个,如话务台接到的呼叫的次数,可以取值为1,2,….这些值的共同特点是能够被一一列举,如果某一随机变量的可能取值是可被一一列举的,这个随机变量就称为离散型随机变量,否则就称为非离散型随机变量. 另外,还有的随机现象,其结果是某个范围内连续变化的数.如灯泡的寿命,从资料中得知某厂生产的灯泡寿命不会超过2000小时,也就是说灯泡的寿命值可取区间[0,2000]中的任何一个数(不一定是有理数).用来描述灯泡寿命的随机变量,由于其取值是[0,2000]中的任意实数,是不能被一一列举的,我们就称这种随机变量为连续型随机变量. 随机变量是用来描述随机现象的结果的一类特殊的变量,根据其取值的不同,分为离散型随机变量和连续型随机变量.这两种类型的变量在本质上是相同的,但表现形式和研究方法却存在较大的差异.所以说,随机变量之间是有区别的.其中离散型随机变量较为简单,用我们已有的知识就能对它加以运算,而连续型随机变量的各种运算将涉及到微分和积分等高等数学的方法,所以暂时不加讨论. 3.离散型随机变量的分布规律是如何表示的? 要想掌握离散型随机变量的统计规律性,必须要知道它所有可能取的值及取每一个值的概率.将这些信息用表格形式表达出来就得到了离散型随机变量的分布列.设离散型随机变量η的所有可能的取值为 取每一个值的概率为 (k=1,2,…),则η的分布列可表示为表1-1. η … … P … …             表1-1 由表1-1可以看出,求η的分布列的主要任务是计算η取各个值时的概率 ,我们可以通过以下方法来求 . (1)利用古典概率的计算方法算出事件 (k=1,2,…)的概率.古典概率又称等可能概率,具有以下两个特点: ①试验的结果有有限个; ②试验中每个结果出现的可能性相同. 由这两个限定条件可知掷硬币和掷骰子的试验是古典概率问题.如果设古典概率问题的结果数为n,则很容易知道随机变量取任一结果的概率都是 . (2)根据有关分布的概率计算公式来计算事件的概率. 我们常见的一些简单分布有两点分布、二项分布和几何分布等.它们各自有不同的特点. ①两点分布:对于一个随机试验,如果它的结果只有两种情况,则我们可用随机变量 来描述这个随机试验的结果.如果甲结果发生的概率为P,则乙结果发生的概率必定为1-P,所以两点分布的分布列为表1—2. 1 0 P P 1-p       表1-2 ②二项分布:二项分布是两点分布的推广.二项分布同时满足以下四个条件: Ⅰ.每次试验都只有两种结果:成功或失败; Ⅱ.共进行n次试验,n为给定的正整数; Ⅲ.各次试验互相独立; Ⅳ.任何一次试验中成功的概率都是一样的. 如果我们设在每次试验中成功的概率都为P,则在n次重复试验中,试验成功的次数是一个随机变量,用ξ来表示,则ξ服从二项分布.则在n次试验中恰好成功k次的概率为: 所以二项分布的分布列为表1—3: ξ 0 1 …   … n P … …               表1-3 ③几何分布:重复进行独立试验,每次试验只有成功、失败两种可能,如果每次试验成功的概率为p,重复试验直到出现一次成功为止,则需要的试验次数是一个随机变量,用ξ表示,因此事件{ξ=n}表示“第n次试验成功且前n-1次试验均失败”.所以 ,其分布列如表1—4所示: ξ 1 2 … n … P p p(1-p) … …             表1-4 除了这三种简单的分布外,还有超几何分布和泊松分布等,这里就不一一列举了. (3)根据离散型随机变量的分布函数也可以确定其分布列. 现对上面几种方法分别举例说明: 例1  将一个骰子连续投掷两次,以随机变量η表示两次所掷点数之和,请写出随机变量η的分布列. 思路启迪  一个骰子连掷两次,两次出现的点数相互独立,因此基本事件总数可用重复排列公式计算,应为 .η表示两次所得总数之和,则η的所有可能取值为2,3,4,…,12.为了计算P(η=k),则必须先求出{η=k}所包含的基本事件数.其基本事件数为满足k=m+n(m≤6,n≤6,m,n为自然数)的m和n的所有正整数解的个数,并且每个基本事件发生的概率都为 . 规范解法  因为{η=2}={第一、二次出现的点数均为1},故 {η=3}={第一次出现1点,第二次出现2点}+{第一次出现2点,第二次出现1点},事件{η=3}共包括两个基本事件.故 {η=4}={第一次出现1点,第二次出现3点}+{第一次出现3点,第二次出现1点}+{第一、二次均出现2点},即{η=4}共包含三个基本事件,故 . 一般地,设第一个骰子出现的点数为 ,第二个骰子出现的点数为 ,显然 与 相互独立,且 则 由上式容易计算出η的分布列为: 2 3 4 5 6 7 8 9 10 11 12 P                         表1-5 例2  某种传染病进入羊群,已知此种传染病的发病率为 ,为了检验一种新药针剂是否对此传染病有防治疗效,给50头羊注射该种针剂,结果注射后有25头羊发病,试判断针剂是否有效? 思路启迪  考虑在未注射针剂时,羊群中发病的羊的数量,因为每头羊只会出现两种情况:发病与未发病,所以发病的羊的数量服从二项分布. 规范解法  假定新药无效.将考查一头羊是否发病作为一次试验,则50头羊中发病头数η服从二项分布.即: 由 ,可得η的分布列的部分值如下: ≤20 21 22 23 24 25 ≥26 P 0.0001 0.0002 0.0005 0.0012 0.0028 0.0059 0.9893                 表1-6 由此可得P(η≤25)=0.0107,即事件“发病羊的数目少于26头”发生的概率仅为0.0107,由概率的频率解释可知,在100次试验中,这种情况才可能出现一次,这类事件我们称之为 “小概率事件”.由实际推断原理可知小概率事件在一次试验中基本不发生.也就是说,在“新药无效”的假设下推断出来的结论“发病羊的数目少于26头”几乎不会发生.这就与我们实际观察到的结果“发病率为 ”相互矛盾,因此推翻“新药无效”这一假设.从而该药品对羊群中的传染病确有疗效,使羊群发病率由 减少到了 .[注:上述推断的依据是:小概率事件在一次试验中基本不发生,推断的方法类似于通常用的反证法.] 例题中我们见到的小概率事件在生活中相当普遍.比如我们在购买彩票时,一张彩票中头奖的概率仅为十万分之一.所以买一张彩票就中头奖的事几乎不会发生.但由于我们的推断方法带有概率性质,所以我们不能说中头奖的事必然不会发生,否则买彩票就没什么意义了,这一点是概率论所研究的随机现象和我们以前数学所研究的确定性现象之间的主要区别,下面看一道例题: 例3  一篮球运动员投篮的命中率为60%,以η表示他首次投中时累计已投篮的次数,求η的分布列. 思路启迪  通过分析题目中的条件可知,事件{η=k}表示该运动员共投篮k次,第k次投中且前k-1次均未投中,所以该事件发生的概率为: 规范解法  设随机变量η表示运动员首次投中时累计已投篮的次数.易知η服从几何分布,又因为运动员投中的概率为0.6,故投不中的概率为1-0.6=0.4,从而 所以随机变量η的分布列为: 1 2 3 4 … k … P 0.6 0.24 0.096 0.0384 … …                 表1-7 点评  由上表观察,该运动员投5次时几乎总能投中,因为P(η>4)=0.0256,即事件“四次都未投中”的概率只有0.0256,属于小概率事件. 4.离散型随机变量分布列有什么应用? 离散型随机变量的分布列是用来表示离散型随机变量取各个值的可能性大小的表格.一般地,对于离散型随机变量η,其分布列为: … … P … …               表1-8 所有离散型随机变量的分布列中的各概率值都必须满足上面两个条件. 问题一:判断某一数列是否可以成为某一离散型随机变量的分布列. 离散型随机变量的分布列又可称为离散型随机变量的概率分布列.对于一个已知的数列,我们可以由条件一和条件二来判断它是否可以成为一个离散型随机变量的分布列. 例1  设η为一个离散型随机变量,下列选项中可以作为η的分布列的是    (    ) B.0.1,0.2,0.3,0.4 思路启迪:对于四个选,我们可以分别用分布列成立的条件一和条件二来判断.同时满足这两个条件的选项才能作为η的分布列. 规范解法  先来判断选项A,因为数列 ,1, 中含有负数,不满足条件一.所以不能作为η的分布列. 选项B中,数列0.1,0.2,0.3,0.4均为正数且和为1,所以可以作为η的分布列. 对于选项C和选项D,都含有无穷项,且每一项都是正数,满足条件一.但是在选项C中, ,故C中的数列不能做为η的分布列;而在选项D中, ,故选项D中的数列 也可作为η的分布列. 问题二:给定的分布列中含有未知常数,该如何求它? 有的时候,我们遇到的分布列中,随机变量η取各可能值的概率与某一未知数有关,这时我们可以用分布列存在的条件一和条件二来确定题目中的未知数. 点评:离散型随机变量的取值可以是有限个也可能是无限个,因此其分布列可以是有限数列也可能是无穷数列. 例2  设离散型随机变量η的分布列为: η 1 2 3 4 5 6 P               表1-9 试确定分布列中的未知常数a. 思路启迪  由题目可知,随机变量η可能取的值为1,2,3,4,5,6六个值.取每个值的概率由未知数a来表示,这时我们可以用条件二来求a的值. 规范解法  由题设可知,数列 , , , , , 是随机变量η的分布列,所以下式成立: 解之得 ,因而随机变量η的分布列应为: η 1 2 3 4 5 6 P               表1-10 问题三:如何根据随机变量的分布列来计算给定事件发生的概率? 对于这类问题,其目的往往是让我们计算随机变量η落在某一区间内的概率.主要方法是将题目中要求计算的事件的概率用分布列表示出来,然后再利用概率的运算法则加以计算. 例3  设随机变量η的分布列为: η -1 2 3 P         表1-11 思路启迪 首先要知道事件 和事件 各包含哪些基本事件.由η的分布列可知,η可能取的值为-1,2,3,事件 包含基本事件{η=-1},所以 同理可求出 规范解法  由随机变量,η的分布列可知,因为事件 只包含基本事件{η=-1}, 同理,事件 包含基本事件{η=2}和{η=3},所以 点评  计算给定的事件的概率的关键是看它所包含的基本事件的数目,然后将各基本事件发生的概率相加就得到我们要求的事件的概率. 例4  设自动生产线在调整后出现废品的概率为0.1,而且一旦出现废品就要重新调整,求在两次调整之间所生产的合格品的数目不小于5的概率. 思路启迪  如果用随机变量η表示两次调整之间生产的产品的个数,而且我们知道一旦出现废品就重新调整生产线,所以两次调整之间所生产的合格品是连续出现的,那么随机变量η的取值就服从几何分布,我们在解题时应先求出η的分布列.然后再计算事件“合格品数不小于5”即{η>5}的概率. 规范解法  设随机变量η表示两次调整之间生产线所生产的产品的个数,则η服从几何分布,事件{η=k}就表示生产了k-1件合格品,且第k件产品是废品.容易求得: P(η=1)=0.1, P(η=2)=(1-0.1)×0.1=0.09, 写成分布列的形式为: 1 2 3 4 5 6 … P 0.1 0.09 0.81 0.0729 0.06561 0.059049 …                 表1-12 题目中要求计算“所生产的合格品数不小于5”的概率,即P(η>5),因为事件{η>5}所包含的基本事件为{η=6},{η=7},…,{η=n},…,所以有 P(η>5)=P(η=6)+P(η=7)+…+P(η=n)+… 我们应用分布列的性质计算上式的值.因为P(η>5)=1-P(η≤5),所以 P(η>5)=1-[P(η=1)+P(η=2)+P(η=3)+P(η=4)+P(η=5)] =1-(0.1+0.09+0.081+0.0729+0.06561) =0.49049, 所以事件“两次调整之间所生产的合格品数不小于5”的概率为0.49049. 点评  这是一道综合例题,包括了分列的计算及分布列的应用两个步骤.该题对于我们巩固所学知识,深入了解分布列有很大帮助.
/
本文档为【北大附中高考数学专题复习概率与统计经点答疑(一)】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索