[有机化学第五版第五章]第五章
[有机化学第五版第五章]第五章 篇一 : 第五章
推开里厅的门,四周旋视一番,柔和的灯光下,清楚的看到沙发坐着4个人。
将叔,老爹出生入死的好兄弟;老吴,从小照顾我的哑巴奶爸;媛媛,蒋叔的女儿,跟我一起长大的好姐妹;陌生面孔,不认识。
门被轻推的‘咿呀’声,室内的四双眼睛齐刷刷落在门外。
不出奇,她,冥帮未来继承人,归来了,所有人的脸颊,露出浅浅的笑意。
棕色卷发,水灵灵的媚眼,樱桃似的小红唇,兴奋的小跑过来,修长的纤手拉住樱的手:“樱~~你终于回来了,我好想你噢。”语毕,反抱住,
达自己的想念。
“嗯,我回来了。”
惊愕一番,露出回来后的第1个浅笑,同时间,余光落向老吴身上,
示意自己回来了,老吴欣慰的笑了。
看见自家小姐毫发无损的站在面前,这比什么都要让他舒心。
一侧‘咳咳咳……’蒋叔适时的咳嗽了几声说道,几近悔意的说道:“媛媛,过来,不要没大没小的。”
他,深知,眼前这个看似纤弱的女子,即将成为他的帮主。
当初,自己也有百万个不愿意,但,她用实力,证明,除她外,再无人能胜任。
心里泛起对她的敬佩,对她的尊敬。
嘟起嘴巴,脸涨红,媛媛不满道:“人家想樱了嘛,当初爹爹又不给人家搬去跟樱一起住,哼哼……”
“你这丫头……越大越没规矩。”
蒋叔作势要上前揪住媛媛,媛媛嘟起嘴,东躲,样子很是滑稽。
“蒋叔,你就由着她吧,都习惯了不是。”樱甚是浅笑,都长那么大
了,这丫头居然一点没变。
何不让她保持一颗童心,反抗世界的灰暗呢。
“对嘛对嘛,爹爹难不成还没习惯么。”翻翻白眼,媛媛调皮的揪了一眼蒋叔。
这对父女,真是一对活宝。
就在樱看得发愣之际,陌生面孔不知何时移动到了樱的旁边。
陌生面孔挑着眉,跟关冥一般冷峻的脸对着樱左看右看,紧锁的嘴巴有规则的一张一闭:“你就是樱樱,”
从未,有人如此盯看自己,感觉,由如赤露露的暴露在众人眼底,心情,异常的愤怒,脸部表情,变的僵硬,眼睛,霸气慢热灼烧。
突然,陌生面孔居然跟关冥一样,来了个180度大转变,笑意,致使表情变得极其夸张,眼睛几近眯成一条缝,让樱惊愕一番。
“老冥啊,这个儿媳妇我是要定了,真是越看越喜欢。”男人呼出明朗的笑意,以表此刻心情。
“那是那是,也不看看是谁家的女儿。”关冥沾沾自喜的说道,脸上同样隐藏不住他的骄傲。
樱却听得一塌糊涂,为何男人一惊一乍的变脸,他口中所谓的儿媳妇,跟自己有什么关系吗。
好似醒起什么,眼光飘向关冥身上:“等等,老爹……”樱用看外星人的眼光看着狠狠瞪着,示意他是不是背着自己又乱答应了什么事。
关冥突然反应过来,笑意沾脸的介绍道:“噢噢,对了,樱樱,都忘记跟你介绍了,这位是玄帮的老大洛玄,跟你老爹年轻时可是出生入死的好兄弟噢。”
这,似乎不是樱想要的
,听罢有些许模糊,但还是礼貌性的向洛玄问声好:“伯父好。”
然至,又回头对自己老爹轻声问:“你们刚说的儿媳妇什么意思,”
听罢,关冥开始头冒冷汗,倘若,让樱知道自己十八年前帮她定了娃娃亲,如今,人家找上门来,她不一掌劈掉自己才怪,灵光一闪,拉着樱走到一边。
稳稳演技,撞撞胆子,赌一把。
一把鼻涕,一把泪,关冥满脸无奈的说道:“我的樱樱啊,这话说来长……”
十八年,早已知道眼前这个男人想打什么注意,于便很不客气的顶了一句:“那就长话短说。”
关冥一吓,看己得好好斟酌清楚,一句话不对点,他,下一秒,下一分钟,就得找人把他抬去医院。
再次稳稳演技:“哎~你知道的,老爹十八年前走投无路,你玄伯父好心收留了我,为我拼死拼活的才保住老爹这条命,为了报答他老人家,我,关冥,扬言,只要他看中老爹身上的任何事物,老爹二话不说都答应,可没想到,他老人家看中了你,要你当儿媳妇,我……”关冥作势擦着自己眼角硬挤也挤不出的泪珠。
“什么……”樱听罢有些激动的吼道。
关冥受到的惊吓不小,倒退几步,忙解释道:“呜呜,老爹也不想的,你看人家都找上门来了,你也不好让老爹1个堂堂男子汉说话不
算数吧。”
樱握紧自己的拳头,真想就这么一拳,把眼前这个自称是自己老爹的男人砸晕了。
可,想想,虽然他不是自己的亲爹,从小到大却待自己如亲生女儿般,还为了自己十八年以来不曾娶妻,就是怕娶了老婆待自己不好,如此的
10 趋势面回归分析 ? 11 非线性回归分析一 ? 12 非线性回归二
?
? ? ?
13 方差分析 14 多因素二水平排列组合方 差分析 15随机配伍组与对照组的方 差分析
采用GLM过程进行 回归和方差分析
? 1、
GLM应用背景 相关分析只能反映两变量之间的相 关性强弱及趋势,但无法给出变量间因 果关系的函数关系,即函数方程。 回归分析可以给出因变量与自变量的相关关系 的函数关系式,GLM就是研
究相关关系 广泛的使用的
。
Sas软件----GLM过程
2、 GLM原理简介
? 最小二乘法原理
GLM原理,是使用最小二乘法 ,研讨一个线 性模型。
Sas软件----GLM过程
最小二乘法原理
? 一、背景基本介绍
在实际应用中如,金融、经济变量之 间的关系,大体上可以分为两种: ? 函数关系:Y=f, 其中Y的值是由Xi所唯一确 定的。 ? 相关关系: Y=f , 这里Y的值不能由Xi精确的 唯一确定。
?
Sas软件----GLM过程
最小二乘法原理
?图5-1表示的是我国货币供
应量M2
?与经过季节调整的GDP 之间的关系
?。
Sas软件----GLM过程
最小二乘法原理
?
但有时候我们想知道当x变化一单位时,y平均变化多少, 可以看到,由于图中所有的点都相对的集中在图中直线
周围,因此我们可以以这条直线大致代表x与y之间的关
系。如果我们能够确定这条直线,我们就可以用直线的 斜率来表示当x变化一单位时y的变化程度,由图中的点 确定线的过程就是回归。
Sas软件----GLM过程
最小二乘法原理
?
但有时候我们想知道当x变化一单位时,y平均变化多少, 可以看到,由于图中所有的点都相对的集中在图中直线
周围,因此我们可以以这条直线大致代表x与y之间的关
系。如果我们能够确定这条直线,我们就可以用直线的 斜率来表示当x变化一单位时y的变化程度,由图中的点 确定线的过程就是回归。
Sas软件----GLM过程
最小二乘法原理
?
对于变量间的相关关系,我们可以根据大量的 统计资料
,找出它们在数量变化方面的规律
,这种统计规律所揭示
的关系就是回归关系,所表示的数学方程就是回归方程
或回归模型
。
Sas软件----GLM过程
最小二乘法原理
?
图5-1中的直线可表示为
根据上式,在确定α、β的情况下,给定一个x 值,我们就能够得到一个确定的y值,然而根 据式得到的y值与实际的y值存在一个
?
y= ? ? ? x
误差。
Sas软件----GLM过程
最小二乘法原理
?
如果我们以,表示误差,则方程变为: y= ? ? ? x ? u
yt ? ? ? ?xt ? ut
其中t表示观测数。 式即为一个简单的双变量回归模型的基本形
式。
Sas软件----GLM过程
最小二乘法原理
?
其中yt被称作因变量
?
xt被称作自变量 解释变量
、 、 被解释变量
、 、 结果变量 ; 原因变量
Sas软件----GLM过程
最小二乘法原理
α、β为参数,或称回归系数 ; ? ,t通常被称为随机误差项,或随机扰动项,简称误差项, ? 在回归模型中它是不确定的,服从随机分布 。
?
Sas软件----GLM过程
? 为什么将,t
最小二乘法原理 包含在模型中,
? 有些变量是观测不到的或者是无
法度量的,又或者影响因变量yt的因素 太多; ? 在yt的度量过程中会发生偏误, 这些偏误在模型中是表示不出来的; ? 外界随机因素对yt的影响也很难 模型化,比如:恐怖事件、自然灾害、 设备故障等。
Sas软件----GLM过程
最小二乘法原理
假设线性回归模型为 yt ? ?1 ? ? 2 x2t ? ?3 x3t ? ......? ? k xkt ? ut ?
?
?
t=1,2,3….T
对y产生影响的解释变量共有k-1 个,系数分别衡量了解释变量对因 变量y的边际影响的程度。
?
最小二乘法的基本原则是:最优拟合直线应该使 各点到直线的距离的和最小,也可表述为距离的 平方和最小。
Sas软件----GLM过程
最小二乘法原理
? ?
方差分析 SST=SSE+SSR SST、SSE、SSR的关系以下图来表示更加直观一些:
Sas软件----GLM过程
图5,2 SST、SSE、SSR的关系
最小二乘法原理
?t ? y? ? ? yt ? y ? = ? ? y
2
2
2 ? u +? t
2 ?
? ? y ? y 是被模型所解释的部分,称为回归平方 ?
和;
是不能被模型所解释的残差平方和,
2 ? u 即 ?t
=
2 t
? ?u
? ?y
t
?t ? ?y
2
配置最佳线性方程的条件是: 1、 SSR达到最小 2、因变量的偏
离其均值的偏差和为零。
Sas软件----GLM过程
采用GLM过程进行 回归和方差分析
?
? ?
?
? ? ? ? ?
Sas软件----GLM过程
1、 GLM应用背景 2、 GLM原理简介 3、 GLM的功能 4、 GLM
的格式 5、 GLM作一元线性 回归 6、 GLM作多元线性回归 7 、
GLM作多项式回归 8、虚拟变量的设置 9、多个随机实验组协方差
分析
10 趋势面回归分析 ? 11 非线性回归分析一 ? 12 非线性回归二
?
? ? ?
13 方差分析 14 多因素二水平排列组合方 差分析 15随机配伍组
与对照组的方 差分析
GLM中语句的格式
GLM [ data=dataname][output =输出 统计量][order=formated | freq| data|internal]; ? Class 分类变量;/*此为第二条语句,后面 需model配合*/ ? Model 因变量 Y=自变量 X [/NOINT| INT|intercept|NounI
|solution| tolerrance| E |E1 |E2|E3|E4 |SS1 |SS2|SS3
|SS4|P|CLM|CLI|ALPHA= | XPX|INVERSE|SINGULAR=1E-8或
0|ZETA=1E-8或0] 本章目录
? Proc
概述 Statistical Computation
统计计算 Statistical Computation
统计计算
GLM 中语句的格式 ? CONTRAST ‘对照说明 。10个汉字,20
个
字符’ 向量 L及元素[/E|E=effect或默认 为
MS|ETYPE=n|SINGULAR=number]; ? ESTIMATE ‘估计的说明,
小于20个字符’ 值1 值2 …[/E|DIViSOR=number |SINGULAR=number]; ? LSMEANS effect [/E|=effect|ETYPE=n|SINGULAR=number| STDERR|PDIFF]; ?
NMAMES=names PREFIX=name[/PRINTH PRINTE HTYPE=n
ETYPE=nCANONICAL
Statistical Computation GLM 过程
统计计算 Statistical Computation
统计计算
? [output
GLM 中语句的格式 out= 数据集名称 predicted=变量
表|P=变量表[RESIDUAL=变量表|R=变量 表]]; ? Random effect/Q; ?
[REPEATED 因变量名 因子1 因子2 因子 3 … ] ? [转换的关键字/选项;]/*详见ANOVA一章*/ [TEST H=effects
E=effect/HTYPE=ETYPE=;] ] /*详见 ANOVA一章*/
统计计算 Statistical Computation
统计计算 Statistical Computation GLM 过程
GLM中语句的格式
BY 变量表; ? ABSORB 变量表;/*变量表须预先sort。此语句使 GLM无法产生预测值或输出一个数据集*/ ? FREQ 变量表;/*按变量表中的观察值n,显示n次*/ ? ID 变量表;/*要求在同行上显示出各变量值、预测 值及残差*/ ? MEANS Effcet/ 选项; ]/*详见ANOVA一章means 语句*/
?
统计计算 Statistical Computation
统计计算 Statistical Computation GLM 过程
GLM中各语
句的格式说明
? 1、主语句
proc GLM 的说明 ? Proc GLM [ data=dataname][output =输出统 计量][order=formated | freq| data|internal]; ? order=关键字, [order=formated | freq| data|internal可选4个中的某个: ? order=formated :要求人为指定数据显示格 式 ? order= freq:要求按观察值频次降序排列
统计计算 Statistical Computation
统计计算 Statistical Computation GLM 过程
GLM中各语句的格式说明
data:要求按数据录入顺序显示数据行。 ? order=internal:按系统默认格式显示数据行。
? order=
统计计算 Statistical Computation
统计计算 Statistical Computation GLM 过程
GLM中各语句的格式说明
? 2、Class
? 格式为:
分类变量;
class V1 V2… ? V1 V2…均为分类变量,字符型变量限于10 个字符内。 ? Class 分类变量;/*此为第二条语句,后面必 需与model配合*/
?
统计计算 Statistical Computation
统计计算 Statistical Computation GLM 过程
GLM中各语句的格式说明
? Model语句
? Model语句,用于建立各种回归
模型或方差分析模型。 ? 例:设A、B、C代表分类变量,V1-V3代表 连续变量,可用Model语句建立三类模型,
统计计算 Statistical Computation
统计计算 Statistical Computation GLM 过程
GLM MODEL 模型中各语句的格式说明 模型具体名称
Model y=v1 简单回归 多元回归 多项式回归 多变量回归 单因子
ANOVA 主效应模 型 含交互效应因子模型
嵌套模型
回归模型
Model y=v1 V2 Model y=v1 V1*V2 Model y1 y2=v1 V2 Model Y=A
Model Y=A B C Model Y=A B A* B
Model Y=A BC
方差分析模型
统计计算 Statistical Computation
统计计算
混合模型
Statistical Computation GLM 过程
多变量方差分析 Model Y=A V1 协方差分析模型 Model Y=A V1 分离斜率模型 Model Y=A V1*A 均一 Model y1 y2=A B
GLM中各语句的格式说明
备注 : ? 1)model Y= A b c a*b a*c b*c a*b*c 等效 于 model Y=a
|b|c; ? 等号右边为自变量或独立变量,比如 A b ? 等号左边为因变量
? Model
统计计算 Statistical Computation
统计计算 Statistical Computation GLM 过程
3、控制
假设检验方面的选项
? E:要求GLM显示所有估计函数的一般格式。
? E1:显示每个效应第一类
的估计函数。 ? E2:显示每个效应第二类 的估计函数。 ? E3:显示每个效应第三类 的估计函数。 ? E4:显示每个效应第四类 的估计函数。
3、控制标准假设检验方面的选项
? ss1:显示每个效应配合type1估计函数所产生
的平方和ss ? ss2:显示每个效应配合
type2估计函数所产生 的平方和ss ? ss3:显示每个效应配合
type3估计函数所产生 的平方和ss ? ss4:显示每个效应配合type4估计函数所产生 的平方和ss
4、预测值与残差值的选项
? P:要求GLM显示每个观测值、预测值、残
差及DW统计量。 ? Clm 显示每个观测值、预测值的置信度 ? Cli显示每个观测值置信度 ? ALPHA=p :指定置信区间的ALPHA值
5、显示中间结果
? XPX:要求显示XTX矩阵
? Inverse:显示XTX矩阵逆矩阵或一般化矩阵 ?
6、调整模型
=值n: ? 调整回归模型对线性关系的敏感性。默认值 为n=1E-8 ? ZETA= 值m:对可估计的type3和type4两检 验函数的敏感性进行检验。m=1E-8 ? Proc glm; ? Class a b c ; ? Model y=a|b|c| E2 E3
ZETA=1E-6
? Singular
Contrast 语句
格式 ? contrast ‘对照说明’ [向量L 值1 值2 …]/选 项; ? 该
语句可以对结果进行假设检验 ? 如 单变量 多变量
? Contrast
统计计算 Statistical Computation
统计计算 Statistical Computation GLM 过程
Contrast 语句
? 例如
统计计算 Statistical Computation
统计计算
Model Y= A B;A有五种值,B有三种值 ? 向量L元素为: ? ? H0:A合并线性与A二次效 应为0 ? L矩阵 ?
Statistical Computation GLM 过程
Contrast 语句
?/
后的选项 ? E 要求显示整个L向量 ? E=effect: 在模型中指定一个effect项为误差项。 省略用估计的MS作为误差项 ? ETYPE=n n=1 2
3 4 指明E=effect类型 ? Singular =number:用于检查估计值。
统计计算 Statistical Computation
统计计算 Statistical Computation GLM 过程
Contrast 语句
glm; ? Class a b c ; ? Model y=a|b|c| E2 E3 ZETA=1E-6 ? Contrast
‘A的线性与二次效应’ ? A -2 -1 0 1 2 ? A 2 -1 -2 -1 2 ? / E Singular
=1E-2;
? Proc
统计计算 Statistical Computation
统计计算 Statistical Computation GLM 过程
Estimate语句
? 该句用于估计参数的线性函数,它必须紧跟
在MODEL之后 ? 格式: ? model … ? estimate ‘标签内容’ ? 向
量名称 元素1 … ? /E divisor=m singular=n;
统计计算 Statistical Computation
统计计算 Statistical Computation GLM 过程
Lsmeans 语句
格式: ? Lsmeans ,B C/E stderr pdiff E=effct ? Etype=n
singular=number; ? 说明同上。 ? Proc glm; ? Class a b c ; ? Model y=a b c a*b; ? Lsmeans y=a b c a*b; ? Lsmeans 语句要求显示 a b c 主效应及 a*b 交互效 应中每个水平的最小二乘法的均值。
?
Statistical Computation GLM 过程
统计计算 Statistical Computation
统计计算
Manova 语句
H=effect E=effect M=式1 ,
式 2,… Mnames=V1…; ? Prefix=被转换的变量名/ printh printe
short ? Canonical summary; ? 说明见 ANOVA
? Manova
统计计算 Statistical Computation
统计计算 Statistical Computation GLM 过程
Output语句
out= 数据及名称 predicted|P=Vn ? Residual|R=vn ? Vn 为新变量名 ? 例如: ? Proc glm; ? Class a b c ; ? Model y=a b c a*b; ?
Output out= new1 P=Yhat R=Resid; ? Run;
? Output
Statistical Computation GLM 过程
统计计算 Statistical Computation
统计计算
RANDOM
? 该语句指定模型中具有随机性的effect项,以
便显示type1-type4中每个effect的期望值。 ? 格式: ? Random a b c/q; ? /Q x显示出主效应中期望均方 的完整二次型。 ? Eg: ? Random sex edc/q;
统计计算 Statistical Computation
统计计算 Statistical Computation GLM 过程
?
Repeated 语句
? 该语句表示同一试验单位下,在model语句中
因变量值具有的重复测量 ? 格式 ? repeated 因变量名 因子1 因
子2…
统计计算 Statistical Computation
统计计算 Statistical Computation GLM 过程
其他语句
? Absorb
V1 V2 … ? BY V1 V2 … ? Freq V; ? ID V1 V2…
统计计算 Statistical Computation
统计计算 Statistical Computation GLM 过程
GLM过程实例1
?
?
? ? ? ? ? ? ?
?
? ? ?
options nodate nonumber; proc format; value groupfmt
1=„HydrolysateI? 2=„Hydrolysate-II? 3=„Casein?; data aconova1; do i=1
to 8; do group=1 to 3; input age food weight @@; output; end; end;
? ? ?
?
? ? ? ?
?
? ? ? ? ? ?
format group groupfmt.; cards; 6 281.7 37 5 309.8 24 8 259.3 82 10 274.0 47 6 317.8 43 5 241.2 66 8 253.8 37 10 326.1 60 6 248.5 74 5 261.4 34 8 322.1 50 7 242.8 79 7 272.8 42 7 323.5 47 8 255.7 82 5 272.2 27 6 321.2 42 7 254.3 76 6 272.3 32 5 311.8 39 5 244.6 73 7 293.2 44 10 324.5 53 10 243.8 90 ; proc glm; class group; model weight=group age food/solution; lsmeans group/pdiff stderr; run;
GLM过程实例1
?
The SAS System
The GLM Procedure Dependent Variable: weight Sum of Squares
8557.689709 285.643625 8843.333333
? ? ? ? ? ? ? ?
Source Model Error Corrected Total
DF 4 19 23
Mean Square 2139.422427 15.033875
F Value 142.31
Pr > F F
group 2 7364.333333 3682.166667 244.92 F
?
?
2 4452.034676 1 868.748973 1 69.150708
148.07 入到回归模型时model的增加值
?
GLM过程实例1解释
?
? ? ?
Parameter
Standard Estimate
Error
t Value
Pr > |t|
? ?
Intercept -52.36421256 B 32.01484931 -1.64 0.1184 group Casein
49.08673657 B 7.51889522 6.53 |t| 3.5301129 1.5696985 4.2399044
LSMEAN Number 1 2 3
group
Casein Hydrolysate-I Hydrolysate-II
|t| for H0: LSMean=LSMean
Dependent Variable: weight i/j 1 2 3
1 ?
无偏:意味着平均而言,实际得 ? ? ? ? 到的 、 值与其真实值是一致的; 最优:意味着在所有线性无偏估计量 ? ? 里,OLS估计量 具有最小方差。
?
? ?
OLS估计量的方差、标准差和其概率分布 1.OLS估计量的方差、标准差。 给定假设,,估计量的标准差计算方程如 下:
?? ? s SE??
?x T ? ?x ? x ?
2 t t
2
?s
?x T ??? x ? ? Tx ?
2 t 2 t 2
? ?s SE ?
? ?x ? x ? ? u ? 其中, s ? 是残差的估计标准差。 T ?2
2 t
2 t
??
1
?s
1 2 2 x ? T x ? t
? ?
参数估计量的标准差具有如下的性质: 样本容量T越大,参数估计值的标准差越 小;
? ? 都取决于s2。 s2是残差的方差 ? ?和SE?? SE??
?
估计量。 s2越大,残差的分布就越分散,这样
模型的不确定性也就越大。如果s2很大,这意
味着估计直线不能很好地拟合散点;
?
? ?xt ? x ? 成反比。 参数估计值的方差与
2
其值越小,散点越集中,这样就越难准确地估
? ? xt ? x ? 计拟合直线;相反,如果
并且可信度也大得多。
?
2
越大,散点
越分散,这样就可以容易地估计出拟合直线,
比较图2,2就可以清楚地看到这点。
图2,2 直线拟合和散点集中度的关系
2 x ? ?t
项只影响截距的标准差,不影响斜率 衡量的是散点与y轴的 越大,
散点离y轴越远,就越难准确
2 x ?t 的标准差。理由是:
距离。
地估计出拟合直线与 y轴的交点; 2 反之,则相反。
?x
t
? ?
2(OLS估计量的概率分布
yt 给定假设条件,即u t ,N ?0, ? 2 ? ,则
从正态分布 系数估计量也是服从正态分布的:
也服
?
? ~ N ?? , var?? ?? ?
? ~ N ?? , var?? ?? ?
?
需要注意的是:如果残差不服从正态分布,即 假设不成立,但只要CLRM的其他假设条件
还成立,且样本容量足够大,则通常认为系数
估计量还是服从正态分布的。
? 其标准正态分布为:
?,? ? ,N?0,1? var?? ?
??? ? ~ N ?0,1? var ?? ?
?
但是,总体回归方程中的系数的真实标准差是 得不到的,只能得到样本的系数标准差
? )。用样本的标准差去替代总体 ,这一平方和可以分成两部分:
?t ? y? ? ? yt ? y ? = ? ? y
2
2
2 ? u +? t
2 ? 是被模型所解释的部分,称为回归平方 ? ? y ? y ?
和;
是不能被模型所解释的残差平方和,
2 ? u 即 ?t
=
2 t
? ?u
? ?y
t
?t ? ?y
2
?
TSS、ESS、RSS的关系以下图来表示更加直 观一些:
图2,4 TSS、ESS、RSS的关系
ESS ? 拟合优度 R , TSS
2
?
因为
TSS=ESS+RSS
?
所以
ESS 2 R,
2
R ? ?0,1?
TSS ? RSS RSS ? ? 1? TSS TSS TSS
? R2越大,说明回归线拟合程度越好;R2越小,说 明回归线拟合程度越差。由上可知,通过考察R2 的大小,我们就能粗略地看出回
归线的优劣。
?
但是,R2作为拟合优度的一个衡量标准也存在
一些问
:
如果模型被重新组合,被解释变量发生了 变化,那么R2也将随之改变,因此具有不同被 解释变量的模型之间是无法来比较R2的大小的。
增加了一个解释变量以后, R2只会 增大而不会减小,除非增加的那个解释 变量之前的系数为零,但在通常情况下 该系数是不为零的,因此只要增加解释 变量, R2就会不断的增大,这样我们就 无法判断出这些解释变量是否应该包含 在模型中。 R2的值经常会很高,达到0.9或更高, 所以我们无法判断模型之间到底孰优孰
?
为了解决上面第二个问题,我们通常用调整过 的R2来代替未调整过的R2 。对R2进行调整主要 是考虑到在引进一个解释变量时,会失去相应 的自由度。调整过的R2用 R 2 来表示,公式为: 其中
T为样本容量 ,K为自变量个数
?
? T ?1 2 ? R ? 1? ? 1? R ? ?T ? K ?
2
?
?
?
?
二、假设检验
假设检验的基本任务是根据样本所提供的信息,
对未知总体分布某些方面的假设做出合理解释
?
假设检验的程序是,先根据实际问题的要求提
出一个论断,称为零假设
或原假设,记为H0,记为H1 )
?
然后根据样本的有关信息,对H0的真伪进行判 断,做出拒
绝H0或不能拒绝H0的决策。
? ?
假设检验的基本思想是概率性质的反证法。 概率性质的反证法的根据是小概率事件原理。该 原理认为“小概率事件在一次实验中几乎是不可 能发生的”。在原假设H0下构造一个事件,这个事件在“原假设H0是正确
的”的条件下是一个小概率事件,如果该事件发
生了,说明“原假设H0是正确的”是错误的,
因为不应该出现的小概率事件出现了,应该拒绝 原假设H0 。
? 假设检验有两种方法: ? 置信区间检验法和显著性检验法。
? 显著性检验法中最常用的是t检验和F检
验,前者是对单个变量系数的显著性检
验,后者是对多个变量系数的联合显著 性检验。
? ?
t检验 下面我们具体介绍对方程的系数进行t 检验的主要步骤。 用OLS方法回归方程,得到β的
?? SE ? ? ? 估计值 ? 及其标准差 。
假定我们建立的零假设是: H0 : ? ? ? * , 备则假设是 H1 : ? ? ? *
选择一个显著性水平,我们 就可以在t分布中确定拒绝区域和非拒绝区域, 如图2-5。如果选择显著性水平为5%,则表明有 5%的分布将落在拒绝区域
图2-5 双侧检验拒绝区域和非拒绝区域分布
?
选定显著性水平后,我们就可以根据t分 布表求得自由度为T-2的临界值,当检验统计值
的绝对值大于临界值时,它就落在拒绝区域,
因此我们拒绝的原假设,而接受备则假设。反 之则相反。
?
可以看到,t检验的基本原理是如果参数的假设 值与估计值差别很大,就会导致小概率事件的
发生,从而导致我们拒绝参数的假设值。
(二)置信区间法
?
仍以方程2.3的系数β为例,置信区间法的基本 思想是建立围绕估计值
? 的一定的限制范围, ?
推断总体参数β是否在一定的置信度下落在此
区间范围内。
置信区间检验的主要步骤。
?
用OLS法回归方程,得到β的估 ?? ? 及其标准差SE ? ? 计值? 。
?
选择一个显著性水平,这
相当于选择95%的置信度。查t分布表,获得自
由度为T-2的临界值 tcrit 。
?
所建立的置信区间为
? ? tcrit SE ? ? ? ?) ? ? tcritSE ? ?
?
如果零假设值 ? * 落在置信区间外,我们就 拒绝 H0 : ?
??
*
的原假设;反之,则不能拒绝。
?
需要注意的是,置信区间检验都是双侧检
篇四 : 第五章GLM过程
,)