为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

6推断统计学的假设检验假设检验(可编辑)

2017-12-01 44页 doc 75KB 23阅读

用户头像

is_574951

暂无简介

举报
6推断统计学的假设检验假设检验(可编辑)6推断统计学的假设检验假设检验(可编辑) 6推断统计学的假设检验假设检验 《 《 《 《 统计与数据分析 统计与数据分析 统 计与数据分析 统计与数据分析 》 》 》 》 Statistics & Data Statistics & Data Statistics & Data Statistics & Data Analysis Analysis Analysis Analysis ? ? ? ?6 6 6 6推断统计学的 推断统计学的 推断统计学的 推断统计 学的 假设检验 假设检验 假设检验 假设检验 Z Z...
6推断统计学的假设检验假设检验(可编辑)
6推断统计学的假设检验假设检验(可编辑) 6推断统计学的假设检验假设检验 《 《 《 《 统计与数据分析 统计与数据分析 统 计与数据分析 统计与数据分析 》 》 》 》 Statistics & Data Statistics & Data Statistics & Data Statistics & Data Analysis Analysis Analysis Analysis ? ? ? ?6 6 6 6推断统计学的 推断统计学的 推断统计学的 推断统计 学的 假设检验 假设检验 假设检验 假设检验 Z Z Z Zh h h h h h h hu u Hua u u Hua Hua Huaii ii iiiiii ii q q q qiiiiu u u u @Peking University @Peking University @Peking University @Peking University The strongest arguments prove nothing so long as the conclusions are not verified by experience. Experimental science is the queen of sciences and the goal of all speculation. Roger Bacon 1214 ? 1294 Philosop pher and friar 现代实验科学的真正始祖α粒子数的Poisson分布研究 n 0-2 345 678 9 10 11 12 13 14 151617+ Observed 18 28 56 105 126 146 164 161 123 101 74 53 23 15 9 5 159.1 130.6 Expected 12.2 27.0 56.5 94.9 132.7 166.9155.6 99.7 69.7 45.0 27.0 15.1 7.9 7.1 2 χ 2.76 0.04 0.01 1.07 0.34 1.08 0.05 0.19 0.44 0.02 0.27 1.42 0.59 0.00 0.57 0.57 问 问题 估计参数:根据观察的数据来估计Poisson分布的参数 λ 讨论 讨论 : : 2 χ 14 1 估计值的概率分布性质 2 参数 参数 估计 的数 的数 学方 法 法 3 总体分布的拟合检验 0.83 8.99 假设检验 (hypothesis test): 根据(简单随机抽样)抽取的样本信息来判别总体是否具有某 种性质 ??总体X ??(简单随机抽样)样本X , X , „, X 1 2 n ??原假设(null hypothesis): 总体X的概率分布性质 ( ( 如参数 如参数 、 、 分布类型 分布类型 ) ) ?? 对对假 立 假设设 (alternative hyp ypothesis ) : 总体 总体X的概率分 的概率分 布性质(如参数、分布类型)? ? ? ?6.1 6.1 假 假 设检 设检 设检 设检 验概述 验概述 ? ?6.1.1 6.1.1 问题的提出 问题的提出 【Example 6.1 】某药品生产车间用粉剂定量自动包装机包装 粉剂药品,每袋标准重量为50mg。长期实践表明该设备包装 的这一药品重量服从正态分布 的这一药品重量服从正态分布 , , 且标准差为 且标准差为15 1.5mg 。 。 现从某天的包装产品中随机抽取9袋,精确秤得它们的重量分 别为 别为 49.5,50.6,51.8,52.1,49.3,51.1,52.0,51.5,50.0 其平均值为50.9mg 。 问当日该包装机工作是否正常? 问题 问题 : 假定方差不变 假定方差不变 , 根据样本数据的平均值 根据样本数据的平均值50 50.9 9来判断正态分 来判断正态分 2 布N50, 1.5 是否成立? 2 【Example 6.2 】 将0.1ml受细菌污染的牛奶均匀涂在1cm 的 切片上 切片上 , , 用显微镜观察切片每个小网格内的细菌菌落数目 用显 微镜观察切片每个小网格内的细菌菌落数目 。 。 根据400(20×20)个小网格的计数结果,统计出如下: 菌落数: 012 3 4 5 6 7 8 9 1019 频数: 56104806242279 9 5 3 2 1 试问菌落数是否服从 试问菌落数是否服从Poisson分布 分布 ? ? 问题 问题 : 根据样本信息,判别随机变量X 是否服从Poisson 分 布 布 。 (Bliss C. and Fisher R. A., 1953. Fitting the negative binomial distribution to biological data. Biometric, 9: 174-200 )参数假设检验问题 参数假设检验问题 ( ( 【 【 例 例61 6.1 】 】 ) ) ??已知总体的分布函数类型 已知总体的分布函数类型 , , 对分布函数中的未知参数提出 对分布函数中的未知参数提出 某种假设 ??要求利用样本的信息对所提出的假设进行检验,根据检验 结果作出接受或者拒绝所提假设的判断 非参数假设检验问题 ( 【例6.2】) ??总体的分布类型未知 ??要求根据样本的信息来对分布类型的假设进行检验 要求根据样本的信息来对分布类型的假设进行检验 , , 对总 对总 体的分布类型作出判断 ? ?6.1.2 6.1.2 假设检验的基本思想与 假设检验的基本思想与N- N-P P ( (Neyman Neyman- -Pearson Pearson)理论 )理论 【Example 6.1 】某药品生产车间用粉剂定量自动包装机包装 粉剂药品,每袋标准重量为50mg。长期实践表明该设备包装 的这一药品重量服从正态分布,且标准差为1.5mg 。 现从某天的包装产品中随机抽取 现从某天的包装产品中随机抽取9 9 袋 袋 , , 精确秤得它们的重量分 精确秤得它们的重量分 别为 49.5, 49.5,50.6, 50.6,51.8, 51.8,52.1, 52.1,49.3, 49.3,51.1, 51.1,52.0, 52.0,51.5, 51.5,50.0 50.0 其平均值为50.9mg 。 问当日该包装机工作是否正常?2 假设方差不变,根据样本的信息,正态分布N μ μ, σ 的 μ μ = μ 50.0是否成立? 0 原假设 原假设 null hypothesis 2 2 Y Yes N N μ, σ : 2 ??Given σ H : μ= μ 0 0 ??μ μ = μ μ 50.0 50.0? ? 0 0 对立假设 No No alternative alternative hypothesis hypothesis H H : : μ?μ μ?μ 1 0 H H andH d H : whi hich h can we accept t b based d on th the 0 1 sampling evidence? Jury system原假设的分类 原假设的分类 简单假设 (Simple hypothesis ) ??指定了总体X 的分布形式和参数值, 2 2 如:X~N μ, σ , σ 已知,H : μ= μ (点信息) 0 0 ??简单假设的参数自由度为 简单假设的参数自由度为0 ; ; 复合假设 (Composite hypothesis ) ??对于总体X 的分布形式未知,或者虽然指定了分布形式但参 数值没有全部指定,即复合假设的参数自由度 ?1 。 如: 2 2 (1)X~N μ , σ , μ 已知, σ 未指定(区间信息)。 0 0 ( (2 2) )X X ~ ~ 某种 某种Pi Poisson分布 分布 , , 其参数 其参数 λ λ未指定 未指定 ( ( 区间信息 区间信息 ) ) ; ; (3)X~B100, p , p0.5 (区间信息) 。 对立假设的分类 对立假设的分类 单边对立假设 (one-sided alternative hypothesis ) 在原假设指定或部分指定参数时,参数的互补区域(即对立假 设的参数区间)由一个连续区间构成 单边假设对应的假设检验问题称为单边检验 。 双边对立假设 (two-sided alternative hypothesis ) 在原假设指定或部分指定参数时,参数的互补区域(即对立假 设的参数区间 设的参数区间 ) ) 由两个不相交的连续区间构成 由两个不相交的连续区间构成 双边假设对应的假设检验问题称为双边检验 。【Example 6.1 】某药品生产车间用粉剂定量自动包装机包装粉剂药品, 每袋标准重量为 每袋标准重量为50mg g 。 。 长期实践表明该设备包装的这一药品重量服从正 长期实践表明该设备包装的这一药品重量服从正 态分布,且标准差为1.5mg 。 现从某天的包装产品中随机抽取9袋,精确秤得它们的重量分别为 49.5, 49.5, 50.6, 50.6, 51.8, 51.8, 52.1, 52.1, 49.3, 49.3, 51.1, 51.1, 52.0, 52.0, 51.5, 51.5, 50.0 50.0 其平均值为50.9mg 。 问当日该包装机工作是否正常? 2 问题:给定 σ =1.5 ,H : μ= μ 50.0;H : μ?μ 0 0 1 0 HE HE XX? 00 X μ 0 若H 成立 : 0 X X 0 0 ~ N 0 0 ,1 1/ n 构造小概率事件 构造小概率事件 ( ( 如小概率 如小概率 α 0 0.001 001, 0 0.01 01, 0 0.05 05, 0 0.10 10 ) ) : X? 0 PZ PZ? / n 2 X? 0? / / nn? 2 2 2 2 ?Z Z? 0 2 2 0.05 X50.9,? 50.0 0 X? 50.950.0 0 1.8? Z? 1.96?/1 n .5/9 2 2 X? 0? / / nn? 2 2 2 2 ?Z Z? 0 2 2 若H 成立 : 0 检验统计量 X X 0 0 U U检验 检验 tt test st tat tiist tiic ~ N 0 0 ,1 1/ n 构造小概率事件 构造小概率事件 ( ( 如小概率 如小概率 α0 0.001 001, 0 0.01 01, 0 0.05 05, 0 0.10 10 ) ) : X X 0 0 显著性水平 显著性水平 PZ PZ significance level/ n 2 检验统计量 (test statistic ) 为检验原假设和对立假设,根据样本(随机变量)、样本容量 和总体参数构的随机变量,具有较明确的概率分布性质 显著性水平 (significance level ) 根据检验统计量的概率分布性质 根据检验统计量的概率分布性质 , , 定 义小概率事件来推断拒绝 定义小概率事件来推断拒绝 原假设发生的条件X? 0/ n 2 2 ?Z Z? 0 2 2 拒绝域 拒绝域 接受域 接受域 拒绝域 拒绝域 (rejection region ) (acceptance region ) (rejection region ) C C C 1 0 1 假设检验的两类错误 假设检验的两类错误 抽样的随机性、实际推断中小概率事件仍然有可能发生 第一类错误 (Type I error )(弃真错误): 原假设H 为真,但经过检验统计量观察值的判断, H 被拒绝。 0 0 P拒绝 拒绝H |H 为真 为真 = α 0 0 第二类错误 第二类错误 ( (T Ty ype pe II II err error or)( )( 纳伪 错误 纳伪错误 ): ): 原假设 原假设H 非真 非真 , 但 但 经过 检 检 验 统计 统计 量 观察 值的判断 观察值的判断 , H 被接受 被接受 。 0 0 0 0 P接受H |H 非真 = β 0 0 或者 或者 P拒绝 拒绝H |H 非真 非真 =1?β 0 0假设检验的两类错误 假设检验的两类错误 α :显著性水平 1- β : 检验功效 (Power of test ) 1- α: 置信水平 (Confidence Level ) 第一类错误 α与第二类错误 β的关系 2 2 【Example 6.3 】设总体X~N μ, σ , σ 已知,而 μ只能取两个值 μ 、 μ , 0 1 且 μ μ ,现有总体X中抽取的容量为n 的样本X , X , „, X ,在显著 性水 0 1 1 2 n 平 平 α α下检验假设 下检验假设 : : H : μ μ ;H : μ = μ μ 。 0 0 1 1 0 试讨论第一类错误与第二类错误的关系 试讨论第一类错误与第二类错误的 关系 。 。Accept H Reject H 0 0 Correct Decision Type I Error H is true 0 1- α: Confidence Level α : Significance level Type II Error Correct Decision H is false 0 β 1- β : Power of a test 关于检验功效1- β的讨论 双边检验的功效函数呈现“U”字形,“U”展得越宽, 检验的功效越差 检验的功效越差 。 1 1- β β Power curve μ μ 0假设检验的Neyman-Pearson理论 在控制出现第一类错误 α的条件下,寻求使出现第 二类错误 二类错误 β β尽可能小 尽可能小 ( ( 或检验功效 或检验功 效1 1- β β尽可能大 尽可能大 ) ) 的 的 检验。 在实际操作中 在实际操作中 , 当样本容量 当样本容量n给定时 给定时 , 优先考虑对 优先考虑对 出现第一类错误的概率并加以控制,再适当考虑出 现第 现第 二 类错误的概率 类错误的概率 , 即显著性检验优先的基本原 即显著性检验优先的基本原 则。 Jerzy Neyman Egon Pearson ( (1894 1894- -1981 1981) ) ( (1895 1895- -1980 1980 ) ) 美国波兰裔统计学家 英国统计学家? ? ? ?613 6 66131 1..3 3 假设检验小结 假设检验小结 假设检验小结 假设检验小结 一、假设检验程 验 过 程中中个 两 个 重要的思想 想 (1 ) 反证法思想 反证法思想 保护原假设的思想 保护原假设的思想 , 没有充分的理由就不能拒绝原假设 没有充分的理由就不能拒绝原假设 。 ( (2 2 ) ) 小概率原理 小概率原理 小概率事件在 小概率事件在 一 次试验中几乎是不会发生的 次试验中几乎是不会发生的 , 如果小概率事件 如果小概率事件 发生了,就认为出现了不合理现象。 二、 假设检验的 假设检验的 一 般步骤 般步骤 (1 ) 根据实际问题提出原假设 根据实际问题提出原假设H 和对立假设 和对立假设H ; 0 1 (2 ) 选择合 选择合 理 的检验统计量 的检验统计量 , 根据原假设 根据原假设H 和对立 和对立 0 假设H 来确定拒绝域的表达式; 1 (3)选取适当的显著性水平 α ,求出使出现第一类错 误的概率不超过 误的概率不超过 α的临界值 的临界值 、 拒绝域 拒绝域C ( ( 和接受域 和接受域 1 C ); 0 (4)根据样本观察值计算检验统计量的观察值,判 断属于拒绝域或接受域 断属于拒绝域或接受域 , 从而拒绝或接受原假设 从而拒绝或接受原假设H 。 0? ? ? ?614 6 66141 1..4 4 置信区间与接受域的对偶性 置信区间与接受域的对偶性 置信区间与接受域的对偶性 置信区间与接受域的对偶性 置信区间 置信区间 以 以 一定的置信度 定的置信度 ( (1001 1001 - α% % ) ) 给出未知参数的所在范围 给出未知参数的所在范围 。 接受域 接受域 在某 在某一显著性水 著性水 平 α 下判定未知参数 下判定未知参数 是 否接受 否接受 原 假设给定的取 假设给定的取 值。 ??二者的解决途径和都相通 【Example 6.1 】某药品生产车间用粉剂定量自动包装机包装粉剂药品, 每袋标准重量为 每袋标准重量为50mg g 。 。 长期实践表明该设备包装 的这一药品重量服从正 长期实践表明该设备包装的这一药品重量服从正 态分布,且标准差为1.5mg 。 现从某天的包装产品中随机抽取9袋,精确秤得它们的重量分别为 49.5, 49.5, 50.6, 50.6, 51.8, 51.8, 52.1, 52.1, 49.3, 49.3, 51.1, 51.1, 52.0, 52.0, 51.5, 51.5, 50.0 50.0 其平均值为50.9mg 。 问当日该包装机工作是否正常? 2 问题:给定 σ =1.5 ,H : μ= μ 50.0;H : μ?μ 0 0 1 0 X? 0/ / nn 2 2 Z ?Z? 0 0 2 2 2 2 C C C 1 0 1定理 定理 设 设 Θ Θ为随机变量 为随机变量X X 的分布函数 的分布函数f f X X || θ θ 的参数空间 的参数空间 , , 对任 对任 一 θ θ ? ? Θ Θ , , 0 都存在显著性水平 α下的对假设H : θ = θ 的检验,且接受域为 0 0 Aθ 。则集合CX X?Aθ为关于 θ 的1001 - α% 置信区 0 0 间。 定理 定理 设 设 Θ Θ为随机变量 为随机变量X X 的分布函数 的分布函数f f X X || θ θ 的参数空间 的参数空间 , , 若 若C C X X 为关 为关 于 θ 的1001 - α%置信区间,即 PC PC XX ||1100 00 则在显著性水平 α下的对假设H : θ = θ 的检验,接受域为 0 0 A?XC |X00 ? ? ? ?6.2 6.2 正 正 态总 态总 态总 态总 体 体 的参数 的参 数 的参数 的参数 假 假 设检 设检 设检 设检 验 验 Sl Sample: X X , X X , „, X X 1 2 n Random sampling Population distribution? ? ? ?6.2.1 6.2.1 单个 单个 单个 单个 总体 总体 总体 总体 均值 均值 均值 均值 μ μ的检验 的检验 的检验 的检验 一、 均值 均值 μ的双边检验 的双边检验 2 2 1 1 已知方差 已知方差 σ , , 检验 检验H H : μ = = μ , ,H H : μ ? ? μ 0 0 1 0 2 2 设设体 总 体X~N μ μ,, σ , σ 已 知 知 ,X ,, X ,,,., X 是来自 是来自 总 体 体X 的 的 ( 简 简 1 1 2 2 n n 单随机抽样)样本。 采用 采用U U检验 检验 , 检验统计量为 检验统计量为 : X X 0 UN~0,1/ n X? 0/ n 2 2 ?Z Z? 0 2 2 拒绝域 拒绝域 接受域 接受域 拒绝域 拒绝域 (rejection region ) (acceptance region ) (rejection region )Significance level 0.10 Significance level 0.05 2 2 未知方差 σ ,检验H : μ= μ ,H : μ ? μ 0 0 1 0 2 2 2 2 设总体 设总体XN X~N μ, σ , , σ 未知 未知 , ,X X , X X ,., X X 是来自总体 是来自总体X X 的样本 的样本 。 。 1 2 n 选取的检验统计量为(即T 检验 ): X? 0 Tt~n 1 Sn Sn / / 显著性水平 α下的拒绝域形式和接受域形式: X? X? 0 0 tn1 tn1? Sn Sn 2 2 2t t25 25 X X 0 Tt~n 1 Sn / tn1 tn1 ?? 2 2 拒绝域 接受域 拒绝域 (rejection region ) (acceptance region ) (rejection region ) 二、均值 μ的单边检验 2 1已知方差 σ ,检验H : μ= μ ,H : μ μ 0 0 1 0 2 2 设总体 设总体X~N X~N μ μ, σ σ , σ σ 已知 已知 ,X X , X X ,., X X 是来自总体 是来自总体X X 的样本 的样本 。 1 2 n 采用U检验 ,检验统计量为: X? 0 UN~0,1? / / nn 若拒绝原假设H : μ= μ ,意味着接受对立假设H : μ μ ,只 0 0 1 0 有 有 当 样本均值 样本均值 的 观察值 观察值 比 μ μ 小 很 很 多 时, 才有才有拒假 理由 拒 绝原 假 设。 0 0给定显著性水平 给定显著性水平 α α的拒绝域和接受域形式 的拒绝 域和接受域形式 : : X X X X 0 0ZZ / n/ n X? 0/ / n?Z0 拒绝域 拒绝域 接受域 接受域 (rejection region ) (acceptance region ) 2 2 未知方差 σ ,检验H : μ= μ ,H : μ μ 0 0 1 0 2 2 设总体X~N μ, σ , σ 未知,X , X ,., X 是来自总体X 的样本。 1 2 n 采用 采用T T检验 检验 , , 给定显著性水平 给定显著性水平 α α的拒 绝域和接受域形式 的拒绝域和接受域形式 : : X? 0tn1 ?Sn Sn / / X X 0tn1 ?Sn /t 25 X 0 0 T T~tn1 1 Sn / tn1 拒绝域 拒绝域 接受域 接受域 (rejection region ) (acceptance region ) 2 3 未知方差 σ ,检验H : μ?μ ,H : μ μ 0 0 1 0 2 2 设总体X~N μ, σ , σ 未知,X , X ,., X 是来自总体X 的样本。 1 2 n 采用 采用T T检验 检验 , , 将原假设分解为两种更简单的情况 将原假设 分解为两种更简单的情况 : : ( (1) ) 若 若 μ μ = = μ μ 成立 成立 0 0 (2)若 μ μ 成立 0给定显著性水平 α的拒绝域和接受域形式: X X X X 0 0 tn1 tn1? Sn / Sn / t25 tn1 ? 接受域 拒绝域 (acceptance region ) (rejection region ) 讨论: (1)假设检验的关键: ??对立假设是否在小概率情况下成立 ??对立假设是否显著地满足 对立假设是否显著地满足 ( (2 2) ) 显著地满足对立假设的区域 显著地满足对立假设的区域? 拒绝 域 拒绝域 显著的程度:显著性水平 α (3)对立假设拒绝域接受域原假设? ? ? ?6.2.2 6.2.2 两正态总体 均值差的检验 两正态总体均值差的检验 两正态总体均值差的检验 两正态总体 均值差的检验 2 2 2 2 设总体 设总体XN X~N μ , σ 和 和YN Y~N μ , σ 相互独立 相互 独立 ,X X , X X ,., X X 是来 是来 1 1 2 2 1 2 n1 自总体X的样本,Y , Y ,., Y 是来自总体Y 的样本。 1 2 n2 2 2 1 已知方差 σ 和 σ ,检验 1 2 H H : : μ μ = = μ μ , ,H H : : μ μ ?μ ?μ 0 0 1 1 2 2 1 1 1 1 2 2 EXY 12 22? 12 XY?N ,? 12 nn nn 12 12 XY 12 UN? 0,122 22? 12nn 12 采用U检验,选取U 为检验统计量,即: XY XY? UN? 0,1? 22 12nn nn 12 12 给定显著性水平 α的拒绝域和接受域形式为: XYXY? ZZ? 22 22 2 2 12 12 2 2 12? nn nn 12 122 2 2 2 2 未知方差 σ 和 σ ,但已知 σ = σ , 1 1 2 2 1 1 2 2 检验H : μ = μ ,H : μ ?μ 0 1 2 1 1 2 EXY? 12 XY XY?? 12 12 Tt~2 2nn? 12 11 Sw nn nn 12 22 nS1n? 1 S 2 2 11 11 22 22 SSw nn2 12 n 1 其中 其中 : : 1 1 22 SX??X, 1i n1 i1 1 n 2 1 22 SY??Y2 i n1 i1 2 采用T检验,选取T 为检验统计量,即: XY XYTt~nn?2 12 11 Sw nn nn 12 给定显著性水平 α的拒绝域和接受域形式为: XYtn2 n?12 11 2 Sw w nn 12 XY XYtn2 n?12 11 2 Sw nn nn 12 122 2 2 2 3已知方差 已知方差 σ 和 和 σ , , 检验 检验H : μ = = μ , ,H : μ μ 1 2 0 1 2 1 1 2 采用 采用U U检验 检验 , , 选取 选取U U 为检验统计量 为检验统计 量 , , 即 即 : : XY UN UN 01 0 ,122 12nn nn 12 给定显著性水平 α的拒绝域和接受域形式为: XYXY? ZZ? 22 22 12 12 12 12nn nn 12 12 2 2 2 2 ? ? ? ?6.2.3 6.2.3 单个正态总体 单个正态总体 单个正态总体 单 个正态总体方差 方差 方差 方差 σ σ 的检验 的检验 的检验 的检验 2 2 一、 方差 方差 σ 的的双边检验 的的双边检验 2 2 设总体 设总体X~N μ, σ ,X , X ,., X 是来自总体 是来自总体X 的样 本 的样本 。 1 2 n 2 2 2 2 2 2 2 2 1 1 未知均值 未知均值 μ μ , , 检验 检验H H : : σ σ = = σ σ , ,H H : : σ σ ?σ ?σ 0 0 1 0 n 1 22 SX SX?? XX? i n1 i ?1 n1 1 22 Sn ~?1 2 ?2 选取检验统计量(称为 χ 检验 ): nn1 1 22 2222? Sn ~1 20 给定显著性水平 α的拒绝域和接受域形式为:nn nn 11 11 22 2 2 Sn1? S? 1n? 22 10022 n1 222 1nS ?n?1 2 1 0 0 22 22 nn1 1 22 2222? Sn ~?1 20 2 21 n ? ?1 n ?? 12 2 2 2 拒绝域 拒绝域 拒绝域 接受域 (rejection region ) (rejection region ) (acceptance region )2 2 2 2 2 已知均值 μ,检验H : σ = σ ,H : σ ?σ 0 0 1 0 2 采用 χ 检验,选取检验统计量为: n 2 X X i 22 i ?1? n 20 给定显著性水平 α的拒绝域和接受域形式为: nn22 22XX?ii 22 ii 11nn? 22 1 1 00 22 nn 2 X? i 22 i ?1 nn nn ? 2 1? 0 22 n 2 X X i 22 i ?1? n 20 2 2 n? n12 2 2 2 拒绝域 拒绝域 拒绝域 接受域 (rejection region ) (rejection region ) (acceptance region )2 二 二 、 、 方差 方差 σ σ 的的单边检验 的的单边检验 2 设总体 设总体XXN ~N μ μ, σ σ , ,X X , X X ,., X X 是来自总 体 是来自总体X X 的样本 的样本 。 。 1 1 2 2 n 2 2 2 2 1 未知均值 未知均值 μ μ , , 检验 检验H : σ ? ? σ , ,H : σ σ 0 0 0 0 1 1 0 0 2 将原假设分解为更为简单的两种情况。采用 χ 检验,选取检验 统计量为 统计量为 : : n1 22 Sn ~?1 2? 0 给定显著性水平 α的拒绝域和接受域形式为: n1 n1 22 22 Sn ?1 Sn ?1? 2 20 0 0 0 n1 22 Sn ~? 1 2 20 α α 2 2 ?1 n ?接受域 拒绝域 (acceptance region)(rejection region )2 2 2 2 2 2 2 2 2 2 未知均值 未知均值 μ , , 检验 检验H : σ ?σ , ,H : σ σ 0 0 1 0 2 2 采用 采用 χ 检验 检验 , 选取检验统计量为 选取检验统计量为 : n1 22 22 SS ~?1 1 n ? 20 给定显著性水平 α的拒绝域和接受域形式为: n1 n1 22 22 Sn1 Sn1 1? 1? 2 20 0 0 0 n1 1 22 Sn ~?1 22 21 1 n ? 1? 拒绝域 接受域 (acceptance region )? ? ? ?6.2.4 6.2.4 两正态总体方差 两正态 总体方差 两正态总体方差 两正态总体方差 比较的 比较的 比较的 比较的 检 验 检验 检验 检验 2 2 2 2 设总体 设总体XN X~N μ , σ 和 和YN Y~N μ , σ 相互独立 相互 独立 ,X X , X X ,., X X 是来 是来 1 1 2 2 1 2 n1 自总体X的样本,Y , Y ,., Y 是来自总体Y 的样本。 1 2 n2 1 未知均值 μ 、 μ ,检验 1 2 2 2 2 2 H H : : σ σ = = σ σ , ,H H : : σ σ ? ? σ σ 0 0 1 1 2 2 1 1 1 1 2 2 22 S /11 FF FF~ 1 1nn,,nn 11 12 12 22 S /22 nn 12 11 222 2 SX??X,S? Y?Y 12ii nn11 ii 11 12 采用F检验,选取检验统计量为: 2 S 1 FF~n 1,n?1 12 2 S 2 2 给定显著性水平 α的拒绝域和接受域形式为: 22SS 11 Fn1,n?1Fn?1,n?1? 12 12 22 1SS22222 S 1 Fn Fn1 1,nn 11??FF 1 nn1,nn 1 1 ?12 ?12 2 1S 22 22 S 1 1 FF FF~ 1 1nn,nn 11 12 2 S 2 F25, 25 Fn1,n 1 ?12 12 Fn Fn1 1,nn 1 1 ?12 2 拒绝域 拒绝域 拒绝域 接受域 (rejection region ) (rejection region ) (acceptance region ) 2 未知均值 μ 、 μ ,检验 1 1 2 2 2 2 2 2 H : σ = σ ,H : σ σ 0 1 2 1 1 2 采用 采用F检验 检验 , , 选取检验统计量为 选取检验统计量为 : : 2 S 1 1 FF FF~ 1 1nn ,?1 1 12 2 S 2 给定显著性水平 α的拒绝域和接受域形式为: 2 SS 1 Fn1,n?1 ?12 2 S 2 2 S 1 F nn 1,?1?12 12 2 2 SS 22 S 1 1 FF FF~ 1 1nn,nn 11 12 2 S 2 F25, 25 Fn1,n 1 ?12 拒绝域 拒绝域 接受域 (rejection region ) (acceptance region ) ? ? ? ?63 6 6633 3 似然比假设检验 似然比假设检验 似然比假设检验 似然比假设检验 Neyman Neyman- -Pearson Pearson ( (1928 1928 ) ) ??更一般条件下的、统一的似然比(Likelihood ratio)检验 方法 方法 ??检验统计量在一般的条件下有统一的渐近分布 ??包括非正态分布? ? ? ?6631 66313 3..1 1 N N N N- -P P P P引理 引理 引理 引理 : : : :似然比检验 似然比检验 似然比检验 似然比检验 方法 方法 方法 方法 N N-P P引理 引理 ( (Neyman-Pearson Lemma ) ) 设原假设 设原假设H H 和对立假设 和对立假设H H 均为简单假设 均为简单假设 , , 它们分别给出随机 它们分别给出随机 0 1 变量总体X 的概率分布密度函数(或分布律)f x| θ 和f x| θ 。 0 0 1 1 对于 对于X X ,X , X ,,.,., X X 是来自总体 是来自总体X X 的 的 ( ( 简单随机抽样 简单随机抽样 ) ) 样本 样本 , , 定 定 1 1 2 2 n 义似然比 (LR, Likelihood Ratio)为检验统计量: n ff X ||? 00 i lik f 01 iLRn lik lik ff 1 f X |11 i i ?1 (1 ) ) 在给定显著性水平 在给定显著性水平 α条件下 条件下 , 假设当 假设当LR c 满足 满足 (c 为临 为临 界值),则可拒绝原假设H ,称为 似然比检验(LR test ) 。 0 (2)则任给显著性水平 α* ? α 的假设检验,均有: 1 - β* ? 1 - β 其中, β*为该检验的第二类错误的概率, β为似然比检验的第 二 类错误 类错误 的 概率 概率 。N-P引理讨论 引理讨论 : : ( (1 1 ) ) 当似然比取值越大 当似然比取值越大 , , 表明随机变量的分 布越趋近原假设 表明随机变量的分布越趋近原假设 , , 反之,越小越趋近对立假设。 (2 )在给定显著性水平 α 的条件下,似然比检验发生的第二 类错误概率 β β 最小,即似然比检验方法是最大功效的检验方法。 (3)适用条件:原假设和对立假设均为简单假设。 2 2 【Example 6.4 】 设总体X~N μ, σ , σ 已知,而 μ只能取两个 值 值 μ 、 、 μ , ,X , X , „, X 为来自总体 为来自总体X 的容量为 的容量为n的简单随机 的简单随机 0 1 1 2 n 抽样样本,试在显著性水平 α下运用似然比检验假设:H : 0 μ μ μ μ ; ;H H : : μ μ = = μ μ 。 。 ( ( 不妨假定 不妨假定 μ μ μ μ ) ) 0 1 1 0 1 基本步骤 基本步骤 : ??写出LR的表达式 ??根据LR取值趋小的形式找到拒绝原假设的统计量形式 ??根据抽样分布求出临界点的值? ? ? ?632 632 6 6..3 3..2 2 广义似然比检验方法 广义似然比检验方法 广义似然比检验方法 广义似然比检验方法 ??广义似然比检验 广义似然比检验 ( (GLR test, Generalized Likelihood Ratio test ) 已知X , X ,., X 是来自总体X 的(简单随机抽样)样本,根 1 2 n 据 据 总 体分布函数可得到 体分布函数可得到 它 们的联合概率密度形 式为 们的联合概率密度形式为 : n fX|,i i ?1 Θ为参数空间 为参数空间 , 其维数可能大于 其维数可能大于1 。 设原假设 设原假设H H 定义的参数范围为 定义的参数范围为 : : θ θ ? ? ω ω? Θ Θ ,对立假设 对立假设H H 定义 定义 0 0 1 的参数范围为: θ? ωΘ,且 ω ?ω ? ,记 Θ’ ω ? ω ,显 1 0 1 0 1 然有 。 定义 广义似然比 (GLR , Generalized Likelihood Ratio)为: ma [ x[lik lik ? ] ] n? 0 GLR, lik? f X |? i [ [ lik ?]] ii?1 1 1 以GLB*为检验统计量,显然有GLR*越小,原假设越有可能 被拒绝 被拒绝 。 通常更多地采用下列广义似然比的定义 通常更多地采用下列广义似然比的 定义 : : [lik]0 GL GLR R? [lik]?讨论 讨论 : : lik lik ? 0 ( (1) ) 当原假设 当原假设H 为简单假设时 为简单假设时 , , 有 有 : : GLR0 [lik]? * (2) GLRmin GLR ,1? 2 2 【 【Example 6.5 】 】 设总体 设总体X~N μ, σ , , σ 已知 已 知 , ,X , X , „, X 为 为 1 2 n 来自总体X 的容量为n的简单随机抽样样本,试在显著性水平 α α下运用广义似然比检验假设 下运用广义似然比检验假设 : :H H : : μ μ μ μ ; ;H H : : μ μ ? ? μ μ 。 。 0 0 1 0 nn 2 1 2XX XX?XX? ii 0 2 2ii 11 GLR ?e 2 nX 0 2 2? GL GLRR2l 2logGL GLRR 1 1 2 ?定理 定理 在概率密度函数或分布律函数充分光滑的条件下 在概率密度函数或分布律 函数充分光滑的条件下 , , 当样本容量 当样本容量 n趋近无穷大时,检验统计量GLR’ -2logGLR 的抽样分布 2 趋近 趋近 χ χ 分布 分布 , , 其自由度 其自由度k 为 为 : :kdimdim 0 ? ? ? ?633 633 6 6..3 3..3 3 多项分布的广义似然比检验 多项分布 的广义似然比检验 多项分布的广义似然比检验 多项分布的广义似然比检验 多项分布问题 多项分布问题 : 设 设X X , X X , „, X X 为分布在 为 分布在m个格子中 个格子中 、 满足多 满足多 1 2 m XXX ?n 项分布的采样计数(即样本),且 。令 12 m pp pppp ?1 落入每个格子的概率分别为 落入每个格子的概率分别为p p ,p , p ,„ , „,,p p , , 且 且 。 。 12 12 m m 1 1 2 2 m 原假设H :给出多项分布概率密度矢量pp θ ? ω ,其中 θ 为 0 0 本问题的参数或待定未知参数。 pp pp??pp1 1 对立假设 对立假设H H : 所有满足 所有满足 的概率密度矢量 的概率密 度矢量 12 m 1 p ? Θ’ 。[lik ]0 GL GLRR[lik ]? 分子: m m m nn! ! X nn! !? i MLE X i p i m p i m X ! i ?1 p? 0i i ?1 X ! i ?1? ii ii ?1 1 分母(MLE): m X n! iiX X p , ii m pi X ! i ?1i n i ?1 [lik ]0 GL GLRR[lik ]? 2 2 χ χ 分布 分布 mmpO pO ? ii2 logGLR2n p log2 O log i iE p ii 11 i i Onp, E np ? dim? dimmk? 10 ii i i定理 定理 对于同一多项分布的假设检验问题 对于同一多项分布的假设检验问题 , , 在原假设 在原假设H H 成立的条件 成立的条件 0 下,当样本容量n趋近无穷大时,GLR 检验统计量 mm? pO ii2 logGLR?2n p log2 O log i ip E ii 11 i i 2 与Pearson χ 检验统计量 2 2mm Xn ?pOEii 2 ii X? E E np np ? ii 11 i i近似等价,且二者的抽样分布趋近自由度为 dim dim 0 2 的 χ 分布。 ? ? ? ?64 64 6 6..4 4 非参数假设检验简介 非参数假设检验简介 非 参数假设检验简介 非参数假设检验简介 参数假设检验问题 参数假设检验问题 ( 【例6.1】) ??已知总体的分布函数类型 已知总体的分布函数类型 , 对分布函数中的 未知参数提出 对分布函数中的未知参数提出 某种假设 ?? ??要求利用样本的信息对所提出的假设进行检验 要求利用样本的信息对所提出的假设进行检验 , , 根据检验 根据检验 结果作出接受或者拒绝所提假设的判断 非参数假设检验问题 ( 【例6.2】) ??总体的分布类型未知 ??要求根据样本的信息来对分布类型的假设进行检验 要求根据样本的信息来对分布类型的假设进行检验 , 对总 对总 体的分布类型作出判断? ? ? ?6641 641 6..4 4..1 1 K K K K- -S S S S检验 检验 检验 检验 ( ( ( (Kolmogor Kolmogorov? ov?Smirnov test Smirnov test ) ) ) ) 定义 设X , X , „, X 为来自总体X 的样本,x , x , „, x 为其 1 2 n 1 2 n 观察值,将它们按照观察值的大小递增顺序排列生成x ? 1 1 x ?„?x ,并作函数: 2 n 0, xx? 1 1 ? kFx , x x?x ,k?1,2,,n?1nk k ?1 nn? 1, xx? n称 称F F x 为总体 为总体X X 的 的经验分布函数 经验分布函数 ( (empii iricall di distti ribbutition n function ) 。对应地,总体X的分布函数Fx 称为理论分布函 数 数 ( (theor theore etical tical d distribution istribution function function ) ) 。 。
/
本文档为【6推断统计学的假设检验假设检验(可编辑)】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索