概率论与数理统计期末复习重要知识点
第二章知识点:
1.离散型随机变量:设X是一个随机变量,如果它全部可能的取值只有有限个或可数无穷个,则称X为一个离散随机变量。
2.常用离散型分布:
(1)两点分布(0-1分布):
若一个随机变量X只有两个可能取值,且其分布为,
则称X服从处参数为p的两点分布。
两点分布的概率分布:
两点分布的期望:;两点分布的方差:
(2)二项分布:
若一个随机变量X的概率分布由式
给出,则称X服从参数为n,p的二项分布。记为X~b(n,p)(或B(n,p)).
两点分布的概率分布:
二项分布的期望:;二项分布的方差:
(3)泊松分布:
若一个随机变量X的概率分布为,则称X服从参数为的泊松分布,记为X~P ()
泊松分布的概率分布:
泊松分布的期望:;泊松分布的方差:
4.连续型随机变量:
如果对随机变量X的分布函数F(x),存在非负可积函数,使得对于任意实数,有,则称X为连续型随机变量,称为X的概率密度函数,简称为概率密度函数。
5.常用的连续型分布:
(1)均匀分布:
若连续型随机变量X的概率密度为,则称X在区间(a,b)上服从均匀分布,记为X~U(a,b)
均匀分布的概率密度:
均匀分布的期望:;均匀分布的方差:
(2)指数分布:
若连续型随机变量X的概率密度为,则称X服从参数为的指数分布,记为X~e ()
指数分布的概率密度:
指数分布的期望:;指数分布的方差:
(3)正态分布:
若连续型随机变量X的概率密度为
则称X服从参数为和的正态分布,记为X~N(,)
正态分布的概率密度:
正态分布的期望:;正态分布的方差:
(4)
正态分布:,
标准正态分布表的使用:
(1)
(2)
(3)故
定理1: 设X~N(,),则
6.随机变量的分布函数:
设X是一个随机变量,称为X的分布函数。
分布函数的重要性质:
7.求离散型的随机变量函数、连续型随机变量函数的分布
(1)由X的概率分布导出Y的概率分布步骤:
①根据X写出Y的所有可能取值;
②对Y的每一个可能取值确定相应的概率取值;
③常用表格的形式把Y的概率分布写出
(2)由X的概率密度函数(分布函数)求Y的概率密度函数(分布函数)的步骤:
①由X的概率密度函数随机变量函数Y=g(X)的分布函数
②由求导可得Y的概率密度函数
(3)对单调函数,计算Y=g(X)的概率密度简单
:
定理1 设随机变量X具有概率密度,又设y=g(x)处处可导且恒有(或恒有),则Y=g(X)是一个连续型随机变量,其概率密度为
;其中是y=g(x)的反函数,且
练习
:
2.4 第7、13、14
总习题 第3、6、9、10、11、13、14、17、18、19
第三章重要知识点:
1.离散型二维随机变量X与Y的联合概率分布表:
Y
X
…
…
…
…
…
…
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
…
…
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
…
…
1
(1)要会由X与Y的联合概率分布,求出X与Y各自概率分布或反过来;类似 P63 例2
(2)要会在X与Y独立的情况下,根据联合概率分布表的部分数据,求解其余数据;
类似 P71 例3
(3)要会根据联合概率分布表求形如的概率;
(4)要会根据联合概率分布律之类求出相应的期望、方差、协方差、相关系数等。
2. 二维连续型随机变量X与Y的联合概率密度:
设(X,Y)为二维随机变量,F(x,y)为其分布函数,若存在一个非负可积的二元函数f(x,y),使对任意实数(x,y),有,则称(X,Y)为二维连续型随机变量。
(1) 要会画出积分区域使得能正确确定二重积分的上下限;
(2) 要会根据联合概率密度求出相应的分布函数F(x,y),以及形如等联合概率值;P64 例3
(3) 要会根据联合概率密度求出的边缘密度;类似 P64 例4
(4) 要会根据联合概率密度求出相应的期望、方差、协方差、相关系数等。
3.联合概率分布以及联合密度函数的一些性质:
(1);(2)
要会根据这些性质解类似P68 第5,6题。
4.常用的连续型二维随机变量分布
二维均匀分布:设G是平面上的有界区域,其面积为A。若二维随机变量(X,Y)具有概率密度函数,则称(X,Y)在G上服从均匀分布。
5.独立性的判断:
定义:设随机变量(X,Y)的联合分布函数为F(x,y),边缘分布函数为,,若对任意实数x,y,有
(1)离散型随机变量的独立性:
①由独立性的定义进行判断;
②所有可能取值,有,则X与Y相互独立。
(2)连续型随机变量的独立性:
①由独立性的定义进行判断;
②联合概率密度 ,边缘密度,
有几乎处处成立, 则X 与Y相互独立。
(3)注意与第四章知识的结合
X与Y相互独立
因此 X与Y不独立。
6.相互独立的两个重要定理
定理1 随机变量X与Y相互独立的充要条件是X所生成的任何事件与Y生成的任何事件独立,即,对任意实数集A,B,有
定理2 如果随机变量X与Y独立,则对任意函数,相互独立。
(1)要求会使用这两个定理解决计算问题
练习题:
习题2-3 第3、4题
习题2-4 第2题
习题3.2 第5,7,8题
总习题三 第4,9(1)-(4), 12,13
第四、五章知识点
设总体密度函数如下,是
,试求未知参数的矩估计值,最大似然估计值。
(1)
,由此可推出,
从而参数,的矩估计值为
(2)似然函数为:
其对数似然函数为:
由上式可以看出,是的单调增函数,要使其最大,的取值应该尽可能的大,由于限制,这给出的最大似然估计值为
将关于求导并令其为0得到关于的似然方程
,解得
第四章重要知识点:
1.随机变量X数学期望的求法:
(1)离散型 ;(2)连续型
2.随机变量函数g(X) 数学期望的求法:
(1)离散型 ;(2)连续型
3.二维随机向量期望的求法:
(1)离散型 ;
(2)连续型
4.随机变量X方差的求法:
(1)简明公式
(2)离散型
(3)连续型
5. 随机变量X协方差与相关系数的求法:
(1)简明公式
(2)离散型
(3)连续型
(4)
6.数学期望、方差、协方差重要的性质:
(1)
(2) 设X与Y相互独立,则
(3)
若X与Y相互独立,则
(4)
(5)
(6)
若X与Y相互独立,则
(7) 若(X,Y)服从二维正态分布,则X与Y相互独立,当且仅当
7. n维正态分布的几个重要性质:
(1)n维正态变量()的每个分量()都是正态变量,反之,若都是正态变量,且相互独立,则()是n维正态变量。
(2)n维随机向量()服从n维正态分布的充分必要条件是的任意线性组合均服从一维正态分布均服从一维正态分布(其中不全为零)。
(3)若()服从n维正态分布,设是的线性函数,则()服从k维正态分布。
(4)设()服从n维正态分布,则“相互独立”等价于“两两不相关”
练习题:
1. 设(X,Y)的联合密度函数为,求及
解:
同理
又因
从而
2. 习题4.3第10题
8.中心极限定理
(1)定理4(棣莫佛—拉普拉斯定理)
设随机变量相互独立,并且都服从参数为的两点分布,则对任意实数,有
(2)定理3(独立同分布的中心极限定理)
设随机变量相互独立,服从同一分布,且
则
练习题:习题4-4 11题 12题 总习题四 24,25,26题
第五章重要知识点
确定或求证统计量所服从的分布
1.三大分布
(1)分布::设是取自总体N(0,1)的样本,称统计量服从自由度为n的分布。
(2)t分布:设X~N(0,1), ,且X与Y相互独立,则称服从自由度为n的t分布。
(3)F分布:设,且X与Y相互独立,则称服从自由度为(m,n)的F分布。
2.三大抽样分布
(1)设总体是取自X的一个样本,为该样本的样本均值,则有,
(2)定理2设总体,是取自X的一个样本,与为该样本的样本均值与样本方差,则有
,
与相互独立
(3)定理3 设总体,是取自X的一个样本,与为该样本的样本均值与样本方差,则有,
练习题:
1.设是来自正态总体的样本,求统计量
的分布。
解:因为,故
由样本的独立性及分布的定义,有
再由样本的独立性以及t分布的定义,有
2. 总习题五 14题
3.求样本函数相关的概率问题
练习题:习题5-3 2 总习题五 16、17
第六章重要知识点:
1.矩估计的求法:
设总体X的分布函数中含有k个未知参数的函数,则
(1)求总体X的k阶矩它们一般都是
是这k个未知参数的函数,记为
(2)从(1)中解得
(3)再用的估计量分别代替上式中的,即可得的估计量:
注:求,类似于上述步骤,最后用,代替,求出矩估计
2.最大似然估计的求法:
求最大似然估计的一般方法:
(1) 写出似然函数
(2) 令或,求出驻点
(3)判断并求出最大值点,在最大值点的表达式中,用样本值代入就得参数的最大似然估计值。比如P154 例4—6。
3. 估计量的优良性准则
(1)无偏性
定义1 设是未知参数的估计量,若,则称为的无偏估计量。
(2)有效性
定义2 设和都是参数的无偏估计量,若,则称较有效。
4 置信区间
(1)双侧置信区间:
设为总体分布的未知参数,是取自总体X的一个样本,对给定的数,,若存在统计量,
,使得,则称随机区间为的双侧置信区间,称为置信度,又分别称与为的双侧置信下限与双侧置信上限。
(2)单侧置信区间:
设为总体分布的未知参数,是取自总体X的一个样本,对给定的数,,若存在统计量,
满足 ,则称为的置信度为的单侧置信区间,称为的单侧置信下限;若存在统计量,满足
则称为的置信度为的单侧置信区间,称为的单侧置信上限。
5.寻求置信区间的方法:
一般步骤:
(1) 选取未知参数的某个较优估计量
(2)围绕构造一个依赖于样本与参数的函数
(3)对给定的置信水平,确定与,使
通常可选取满足与的与,在常用分布情况下,这可由分位数表查得。
(4)对不等式作恒等变形后化为
则就是的置信度为的双侧置信区间。
6.置信区间的公式:
(1)0-1分布参数的置信区间:
(2)设总体,其中已知,而为未知参数,是取自总体X的一个样本。
均值的置信区间为:(,)
(3)设总体,其中,未知, 是取自总体X的一个样本。
均值的置信区间为:(,)
(4)设总体,其中,未知, 是取自总体X的一个样本。
方差的置信区间为:
的置信区间为:
练习题:
习题6-2 第1,2,5,6题
习题6-3 第3,4,5,6题
习题6-4 第4题
总习题六 第7,8,9,10,16,17,18,20,21题
第1章 随机事件及其概率
(1)排列组合公式
从m个人中挑出n个人进行排列的可能数。
从m个人中挑出n个人进行组合的可能数。
(2)加法和乘法原理
加法原理(两种方法均能完成此事):m+n
某件事由两种方法来完成,第一种方法可由m种方法完成,第二种方法可由n种方法来完成,则这件事可由m+n 种方法来完成。
乘法原理(两个步骤分别不能完成这件事):m×n
某件事由两个步骤来完成,第一个步骤可由m种方法完成,第二个步骤可由n 种方法来完成,则这件事可由m×n 种方法来完成。
(3)一些常见排列
重复排列和非重复排列(有序)
对立事件(至少有一个)
顺序问题
(4)随机试验和随机事件
如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。
试验的可能结果称为随机事件。
(5)基本事件、样本空间和事件
在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质:
①每进行一次试验,必须发生且只能发生这一组中的一个事件;
②任何事件,都是由这一组中的部分事件组成的。
这样一组事件中的每一个事件称为基本事件,用来表示。
基本事件的全体,称为试验的样本空间,用表示。
一个事件就是由中的部分点(基本事件)组成的集合。通常用大写字母A,B,C,…表示事件,它们是的子集。
为必然事件,Ø为不可能事件。
不可能事件(Ø)的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件(Ω)的概率为1,而概率为1的事件也不一定是必然事件。
(6)事件的关系与运算
①关系:
如果事件A的组成部分也是事件B的组成部分,(A发生必有事件B发生):
如果同时有,,则称事件A与事件B等价,或称A等于B:A=B。
A、B中至少有一个发生的事件:AB,或者A+B。
属于A而不属于B的部分所构成的事件,称为A与B的差,记为A-B,也可表示为A-AB或者,它表示A发生而B不发生的事件。
A、B同时发生:AB,或者AB。AB=Ø,则表示A与B不可能同时发生,称事件A与事件B互不相容或者互斥。基本事件是互不相容的。
-A称为事件A的逆事件,或称A的对立事件,记为。它表示A不发生的事件。互斥未必对立。
②运算:
结合率:A(BC)=(AB)C A∪(B∪C)=(A∪B)∪C
分配率:(AB)∪C=(A∪C)∩(B∪C) (A∪B)∩C=(AC)∪(BC)
德摩根率: ,
(7)概率的公理化定义
设为样本空间,为事件,对每一个事件都有一个实数P(A),若满足下列三个条件:
1° 0≤P(A)≤1,
2° P(Ω) =1
3° 对于两两互不相容的事件,,…有
常称为可列(完全)可加性。
则称P(A)为事件的概率。
(8)古典概型
1° ,
2° 。
设任一事件,它是由组成的,则有
P(A)= =
(9)几何概型
若随机试验的结果为无限不可数并且每个结果出现的可能性均匀,同时样本空间中的每一个基本事件可以使用一个有界区域来描述,则称此随机试验为几何概型。对任一事件A,
。其中L为几何度量(长度、面积、体积)。
(10)加法公式
P(A+B)=P(A)+P(B)-P(AB)
当P(AB)=0时,P(A+B)=P(A)+P(B)
(11)减法公式
P(A-B)=P(A)-P(AB)
当BA时,P(A-B)=P(A)-P(B)
当A=Ω时,P()=1- P(B)
(12)条件概率
定义 设A、B是两个事件,且P(A)>0,则称为事件A发生条件下,事件B发生的条件概率,记为。
条件概率是概率的一种,所有概率的性质都适合于条件概率。
例如P(Ω/B)=1P(/A)=1-P(B/A)
(13)乘法公式
乘法公式:
更一般地,对事件A1,A2,…An,若P(A1A2…An-1)>0,则有
…………。
(14)独立性
①两个事件的独立性
设事件、满足,则称事件、是相互独立的。
若事件、相互独立,且,则有
若事件、相互独立,则可得到与、与、与也都相互独立。
必然事件和不可能事件Ø与任何事件都相互独立。
Ø与任何事件都互斥。
②多个事件的独立性
设ABC是三个事件,如果满足两两独立的条件,
P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A)
并且同时满足P(ABC)=P(A)P(B)P(C)
那么A、B、C相互独立。
对于n个事件类似。
(15)全概公式
设事件满足
1°两两互不相容,,
2°,
则有
。
(16)贝叶斯公式
设事件,,…,及满足
1° ,,…,两两互不相容,>0,1,2,…,,
2° ,,
则
,i=1,2,…n。
此公式即为贝叶斯公式。
,(,,…,),通常叫先验概率。,(,,…,),通常称为后验概率。贝叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断。
(17)伯努利概型
我们作了次试验,且满足
◆ 每次试验只有两种可能结果,发生或不发生;
◆ 次试验是重复进行的,即发生的概率每次均一样;
◆ 每次试验是独立的,即每次试验发生与否与其他次试验发生与否是互不影响的。
这种试验称为伯努利概型,或称为重伯努利试验。
用表示每次试验发生的概率,则发生的概率为,用表示重伯努利试验中出现次的概率,
,。
第二章 随机变量及其分布
(1)离散型随机变量的分布律
设离散型随机变量的可能取值为Xk(k=1,2,…)且取各个值的概率,即事件(X=Xk)的概率为
P(X=xk)=pk,k=1,2,…,
则称上式为离散型随机变量的概率分布或分布律。有时也用分布列的形式给出:
。
显然分布律应满足下列条件:
(1),, (2)。
(2)连续型随机变量的分布密度
设是随机变量的分布函数,若存在非负函数,对任意实数,有
,
则称为连续型随机变量。称为的概率密度函数或密度函数,简称概率密度。
密度函数具有下面4个性质:
1° 。
2° 。
(3)离散与连续型随机变量的关系
积分元在连续型随机变量理论中所起的作用与在离散型随机变量理论中所起的作用相类似。
(4)分布函数
设为随机变量,是任意实数,则函数
称为随机变量X的分布函数,本质上是一个累积函数。
可以得到X落入区间的概率。分布函数表示随机变量落入区间(– ∞,x]内的概率。
分布函数具有如下性质:
1° ;
2° 是单调不减的函数,即时,有 ;
3° , ;
4° ,即是右连续的;
5° 。
对于离散型随机变量,;
对于连续型随机变量, 。
(5)八大分布
0-1分布
P(X=1)=p, P(X=0)=q
二项分布
在重贝努里试验中,设事件发生的概率为。事件发生的次数是随机变量,设为,则可能取值为。
, 其中,
则称随机变量服从参数为,的二项分布。记为。
当时,,,这就是(0-1)分布,所以(0-1)分布是二项分布的特例。
泊松分布
设随机变量的分布律为
,,,
则称随机变量服从参数为的泊松分布,记为或者P()。
泊松分布为二项分布的极限分布(np=λ,n→∞)。
超几何分布
随机变量X服从参数为n,N,M的超几何分布,记为H(n,N,M)。
几何分布
,其中p≥0,q=1-p。
随机变量X服从参数为p的几何分布,记为G(p)。
均匀分布
设随机变量的值只落在[a,b]内,其密度函数在[a,b]上为常数,即
a≤x≤b
其他,
则称随机变量在[a,b]上服从均匀分布,记为X~U(a,b)。
分布函数为
a≤x≤b
0, x
b。
当a≤x1x1时,有F(x2,y)≥F(x1,y);当y2>y1时,有F(x,y2) ≥F(x,y1);
(3)F(x,y)分别对x和y是右连续的,即
(4)
(5)对于
.
(4)离散型与连续型的关系
(5)边缘分布
离散型
X的边缘分布为
;
Y的边缘分布为
。
连续型
X的边缘分布密度为
Y的边缘分布密度为
(6)条件分布
离散型
在已知X=xi的条件下,Y取值的条件分布为
在已知Y=yj的条件下,X取值的条件分布为
连续型
在已知Y=y的条件下,X的条件分布密度为
;
在已知X=x的条件下,Y的条件分布密度为
(7)独立性
一般型
F(X,Y)=FX(x)FY(y)
离散型
有零不独立
连续型
f(x,y)=fX(x)fY(y)
直接判断,充要条件:
①可分离变量
②正概率密度区间为矩形
二维正态分布
=0
随机变量的函数
若X1,X2,…Xm,Xm+1,…Xn相互独立, h,g为连续函数,则:
h(X1,X2,…Xm)和g(Xm+1,…Xn)相互独立。
特例:若X与Y独立,则:h(X)和g(Y)独立。
例如:若X与Y独立,则:3X+1和5Y-2独立。
(8)二维均匀分布
设随机向量(X,Y)的分布密度函数为
其中SD为区域D的面积,则称(X,Y)服从D上的均匀分布,记为(X,Y)~U(D)。
例如图3.1、图3.2和图3.3。
y
1
D1
O 1 x
图3.1
y
D2
1
1
O 2 x
图3.2
y
D3
d
c
O a b x
图3.3
(9)二维正态分布
设随机向量(X,Y)的分布密度函数为
其中是5个参数,则称(X,Y)服从二维正态分布,
记为(X,Y)~N(
由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,
即X~N(
但是若X~N(,(X,Y)未必是二维正态分布。
(10)函数分布
Z=X+Y
根据定义计算:
对于连续型,fZ(z)=
两个独立的正态分布的和仍为正态分布()。
n个相互独立的正态分布的线性组合,仍服从正态分布。
,
Z=max,min(X1,X2,…Xn)
若相互独立,其分布函数分别为,则Z=max,min(X1,X2,…Xn)的分布函数为:
分布
设n个随机变量相互独立,且服从标准正态分布,可以证明它们的平方和
的分布密度为
我们称随机变量W服从自由度为n的分布,记为W~,其中
所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。
分布满足可加性:设
则
t分布
设X,Y是两个相互独立的随机变量,且
可以证明函数
的概率密度为
我们称随机变量T服从自由度为n的t分布,记为T~t(n)。
F分布
设,且X与Y独立,可以证明的概率密度函数为
我们称随机变量F服从第一个自由度为n1,第二个自由度为n2的F分布,记为F~f(n1, n2).
第四章 随机变量的数字特征
(1)一维随机变量的数字特征
离散型
连续型
期望
期望就是平均值
设X是离散型随机变量,其分布律为P()=pk,k=1,2,…,n,
(要求绝对收敛)
设X是连续型随机变量,其概率密度为f(x),
(要求绝对收敛)
函数的期望
Y=g(X)
Y=g(X)
方差
D(X)=E[X-E(X)]2,
标准差
,
矩
①对于正整数k,称随机变量X的k次幂的数学期望为X的k阶原点矩,记为vk,即
νk=E(Xk)= , k=1,2, ….
②对于正整数k,称随机变量X与E(X)差的k次幂的数学期望为X的k阶中心矩,记为,即
=, k=1,2, ….
①对于正整数k,称随机变量X的k次幂的数学期望为X的k阶原点矩,记为vk,即
νk=E(Xk)=
k=1,2, ….
②对于正整数k,称随机变量X与E(X)差的k次幂的数学期望为X的k阶中心矩,记为,即
=
k=1,2, ….
切比雪夫不等式
设随机变量X具有数学期望E(X)=μ,方差D(X)=σ2,则对于任意正数ε,有下列切比雪夫不等式
切比雪夫不等式给出了在未知X的分布的情况下,对概率
的一种估计,它在理论上有重要意义。
(2)期望的性质
(1) E(C)=C
(2) E(CX)=CE(X)
(3) E(X+Y)=E(X)+E(Y),
(4) E(XY)=E(X) E(Y),充分条件:X和Y独立;
充要条件:X和Y不相关。
(3)方差的性质
(1) D(C)=0;E(C)=C
(2) D(aX)=a2D(X); E(aX)=aE(X)
(3) D(aX+b)= a2D(X); E(aX+b)=aE(X)+b
(4) D(X)=E(X2)-E2(X)
(5) D(X±Y)=D(X)+D(Y),充分条件:X和Y独立;
充要条件:X和Y不相关。
D(X±Y)=D(X)+D(Y) ±2E[(X-E(X))(Y-E(Y))],无条件成立。
而E(X+Y)=E(X)+E(Y),无条件成立。
(4)常见分布的期望和方差
期望
方差
0-1分布
p
二项分布
np
泊松分布
几何分布
超几何分布
均匀分布
指数分布
正态分布
n
2n
t分布
0
(n>2)
(5)二维随机变量的数字特征
期望
函数的期望
=
=
方差
协方差
对于随机变量X与Y,称它们的二阶混合中心矩为X与Y的协方差或相关矩,记为,即
与记号相对应,X与Y的方差D(X)与D(Y)也可分别记为与。
相关系数
对于随机变量X与Y,如果D(X)>0, D(Y)>0,则称
为X与Y的相关系数,记作(有时可简记为)。
||≤1,当||=1时,称X与Y完全相关:
完全相关
而当时,称X与Y不相关。
以下五个命题是等价的:
①;
②cov(X,Y)=0;
③E(XY)=E(X)E(Y);
④D(X+Y)=D(X)+D(Y);
⑤D(X-Y)=D(X)+D(Y).
协方差矩阵
混合矩
对于随机变量X与Y,如果有存在,则称之为X与Y的k+l阶混合原点矩,记为;k+l阶混合中心矩记为:
(6)协方差的性质
(i) cov (X, Y)=cov (Y, X);
(ii) cov(aX,bY)=ab cov(X,Y);
(iii) cov(X1+X2, Y)=cov(X1,Y)+cov(X2,Y);
(iv) cov(X,Y)=E(XY)-E(X)E(Y).
(7)独立和不相关
(i) 若随机变量X与Y相互独立,则;反之不真。
(ii) 若(X,Y)~N(),
则X与Y相互独立的充要条件是X和Y不相关。
第五章 大数定律和中心极限定理
(1)大数定律
切比雪夫大数定律
设随机变量X1,X2,…相互独立,均具有有限方差,且被同一常数C所界:D(Xi)规定的检验法则,应当否定H0。这时,我们把客观上H0成立判为H0为不成立(即否定了真实的假设),称这种错误为“以真当假”的错误或第一类错误,记为犯此类错误的概率,即
P{否定H0|H0为真}=;
此处的α恰好为检验水平。
第二类错误
当H1为真时,而样本值却落入了相容域,按照我们规定的检验法则,应当接受H0。这时,我们把客观上H0。不成立判为H0成立(即接受了不真实的假设),称这种错误为“以假当真”的错误或第二类错误,记为犯此类错误的概率,即
P{接受H0|H1为真}=。
两类错误的关系
人们当然希望犯两类错误的概率同时都很小。但是,当容量n一定时,变小,则变大;相反地,变小,则变大。取定要想使变小,则必须增加样本容量。
在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显著性水平α。α大小的选取应根据实际情况而定。当我们宁可“以假为真”、而不愿“以真当假”时,则应把α取得很小,如0.01,甚至0.001。反之,则应把α取得大些。
单正态总体均值和方差的假设检验
条件
零假设
统计量
对应样本
函数分布
否定域
已知
N(0,1)
未知
未知