为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

sas软件教程

2011-07-14 50页 ppt 2MB 45阅读

用户头像

is_014593

暂无简介

举报
sas软件教程nullSAS软件介绍 SAS软件介绍 湖北工业大学理学院一、概述一、概述SAS系统全称为Statistics Analysis System,最早由北卡罗来纳大学的两位生物统计学研究生编制,并于1976年成立了SAS软件研究所,正式推出了SAS软件。SAS是用于决策支持的大型集成信息系统,但该软件系统最早的功能限于统计分析,至今,统计分析功能也仍是它的重要组成部分和核心功能。SAS现在的版本为9.0版,大小约为1G。经过多年的发展,SAS已被全世界120多个国家和地区的近null三万家机构所采用,直接用户则超过三百万人,遍及...
sas软件教程
nullSAS软件介绍 SAS软件介绍 湖北工业大学理学院一、概述一、概述SAS系统全称为Statistics Analysis System,最早由北卡罗来纳大学的两位生物统计学研究生编制,并于1976年成立了SAS软件研究所,正式推出了SAS软件。SAS是用于决策支持的大型集成信息系统,但该软件系统最早的功能限于统计分析,至今,统计分析功能也仍是它的重要组成部分和核心功能。SAS现在的版本为9.0版,大小约为1G。经过多年的发展,SAS已被全世界120多个国家和地区的近null三万家机构所采用,直接用户则超过三百万人,遍及金融、医药卫生、生产、运输、通讯、政府和教育科研等领域。在英美等国,能熟练使用SAS进行统计分析是许多公司和科研机构选材的条件之一。在数据处理和统计分析领域,SAS系统被誉为国际上的标准软件系统,并在96~97年度被评选为建立数据库的首选产品。堪称统计软件界的巨无霸。在此仅举一例如下:在以苛刻严格著称于世的美国FDA新药审批程序中,新药试验结果的统计分析只能用SAS进行,其他软件的计算结果一律无效!哪怕只是简单的均数和标准差也不行!由此可见SAS的权威地位。 nullSAS系统是一个组合软件系统,它由多个功能模块组合而成,其基本部分是BASE SAS模块。BASE SAS模块是SAS系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。也就是说,SAS系统的运行,首先必须启动BASE SAS模块,它除了本身所具有数据管理、程序设计及描述统计计算功能以外,还是SAS系统的中央调度室。它除可单独存在外,也可与其他产品或模块共同构成一个完整的系统。各模块的安装及更新都可通过其安装程序非常方便地进行。nullSAS系统具有灵活的功能扩展接口和强大的功能模块,在BASE SAS的基础上,还可以增加如下不同的模块而增加不同的功能:SAS/STAT(统计分析模块)、SAS/GRAPH(绘图模块)、SAS/QC(质量控制模块)、SAS/ETS(经济计量学和时间序列分析模块)、SAS/OR(运筹学模块)、SAS/IML(交互式矩阵程序设计语言模块)、SAS/FSP(快速数据处理的交互式菜单系统模块)、SAS/AF(交互式全屏幕软件应用系统模块)等等。SAS有一个智能型绘图系统,不仅能绘各种统计图,还能绘出地图。SAS提供多个统计过程,每个过程均含有极丰富的任选项。用户还可以通过对数据集的一连串加工,实现更为复杂的统计分析。此外,SAS还提供了各类概率分析函数、分位数函数、样本统计函数和随机数生成函数,使用户能方便地实现特殊统计要求。二、初识SAS 二、初识SAS 安装SAS 哪位要是连软件的安装和打开都要我啰嗦的话,我劝您还是买一套洪恩的《开天辟地》好好热热身吧。 不过,安装SAS时,应首先将系统时间改到2002年以前,安装完以后,再crack,然后将时间修改还原,切记!null启动SAS null启动后,出现如图 的SAS运行界面,术语称为"SAS工作空间(SAS Application WorkSpace)"。它象其它Windows应用程序一样,在一个主窗口内,包含若干个子窗口,并有菜单条、工具栏、状态栏等。 SAS有三个最重要的子窗口:程序窗口(PROGRAM EDITOR)、运行记录窗口(LOG)、输出窗口(OUTPUT)。 Program Editor的窗口(窗口标签为Editor)就是用来输入SAS语句的,编程操作的所有内容都是在该窗口内完成的,各位还是要跟它先多熟悉一下。 null简单运行样例 假设我们有一个班学生的数学成绩和成绩,数学满分为100,语文满分为120,希望计算学生的平均分数(按百分制)并按此排名,可以在程序窗口输入此程序: nulltitle '0401班学生成绩排名'; data c0401; input name $ 1-10 sex $ math chinese; avg = math*0.5 + chinese/120*100*0.5; cards; 李明 男 92 98 张红艺 女 89 106 王思明 男 86 90 张聪 男 98 109 刘颍 女 80 110 ; run; proc print;run; proc sort data=c0401; by descending avg; run; proc print;run; null实际上,上述程序是文本,完全可以在任何文本编辑工具中输入,比如Windows中的记事本,甚至Word也可用来输入这样包含中文的程序。输入后使用复制复制、粘贴命令将输入的程序粘贴到SAS系统程序窗口。(即在记事本中复制输入的程序,然后在SAS系统程序窗口中使用粘贴命令,把程序复制到SAS中)。 要运行此程序,只要用鼠标单击工具栏的提交(Submit)图标 ,或用Run菜单下的Submit命令,或者直接按下F8键,就可运行程序。如果选中某一段程序,然后进行调用,则系统只执行被选中的部分。null运行后,输出窗口出现如下结果: 0401班学生成绩排名 1 11:40 Saturday, November 10, 2004 Obs name sex math chinese avg 1 李明 男 92 98 86.8333 2 张红艺 女 89 106 88.6667 3 王思明 男 86 90 80.5000 4 张聪 男 98 109 94.4167 5 刘颍 女 80 110 85.8333 运行记录窗口则记录每段程序的运行情况、所用时间、生成数据保存情况。如果有错误还会用红色指示错误。 三、SAS程序的使用常识 三、SAS程序的使用常识 从上面的例子程序可以看出SAS程序的一些特点。 SAS程序的基本结构    SAS程序由语句组成,语句用分号结束。语句一般由特定的关键词开始,语句中可包含变量名、运算符等,它们以空格分隔。SAS对语句所占的行数无限制,一个语句可占多行,同样,多个语句也可占一行。 nullSAS程序的程序组成    SAS程序可以非常复杂,但其基本结构一般由数个完成单个动作的程序步和环境设置语句构成。而程序步分为两种,一种叫数据步(data step),一种叫过程步(proc step),分别以DATA语句和PROC语句开始。数据步和过程步由若干个语句组成,一般以RUN语句结束。前者用来创建和修改用于统计分析的数据集,后者则利用已创建的数据集完成特定的统计分析任务。比如下面的例子: nulllibname a 'd:\sysdata\'; data a.aaaa; input x @@; cards; 1 2 3 4 5 ; proc print; var x; run; quit; 第1句就是一个环境设置语句,其作用是设定一个逻辑库,逻辑库名称为a, 第2~6句构成数据步,其功能是新建一个数据集,数据集名称为aaaa,并且输入数据, 第7~9句构成过程步,其功能是将数据集aaaa中变量x的数值在output窗口中输出。nullSAS程序的书写规则与程序注释    前面已经提到,SAS对程序的书写格式比较灵活,大小写一般不区分(字符串中要区分大小写),但我们仍提倡SAS程序与其它编程语言相似,采用缩进格式,使得源程序结构清楚,容易读懂。    SAS程序的程序注释有以下两种格式:    注释语句:以星号“*”开始,可占多行,以分号“;”结束。~    注释段落:用“/*”和“*/”包括起来的任何字符,可占多行。    同样,我们提倡在程序中要有适当的注释,使程序的可读性强。四、SAS程序的数据步 四、SAS程序的数据步 数据集(dataset)和库      SAS数据集(SAS Datasets)可以看作由若干行和若干列组成的表格,类似于一个矩阵,但各列可以取不同的类型值,比如整数值、浮点值、时间值、字符串、货币值等等。比如,前面的例子生成了一个名为C0401的数据集,它的逻辑形式如下表:null表1 数据集的逻辑形式null数据集的每一行叫做一个观测(Observation),每列叫做一个变量(Variable)。SAS数据集等价于关系数据库系统中的一个表,实际上一个SAS数据集有时也称作一个表。在数据库术语中一个观测称作一个记录,一个变量称作一个域。在C0401数据集中有5个观测,分别代表5个学生的情况,而每个学生有5个数据,分别为姓名、性别、数学成绩、语文成绩、平均分,所以此数据集有5个变量,变量名依次为NAME、SEX、MATH、CHINESE和AVG。 null从上面看出,数据集要有名字,变量要有名字,所以SAS中对名字(数据集名、变量名、数据库名,等等)有约定:SAS名字由英文字母、数字、下划线组成,第一个字符必须是字母或下划线,名字最多用8个字符,大写字母和小写字母不区分。比如,name,abc,aBC,x1,year12,_NULL_等是合法的名字,且abc和aBC是同一个名字,而class-1(不能有减号)、a bit(不能有空格)、serial#(不能有特殊字符)、Documents (超长)等不是合法的名字。 null逻辑库    SAS系统将所使用的文件以库的形式组织起来,而数据集则存放在一个库中,这个库就称为逻辑库。前面见到过的libname命令就用于指定库标记。其一般格式为:     Libname 库名称 ‘文件夹位置’ 选项; 例如 libname a 'd:\sysdata\'; data a.aaaa; input x @@; cards; 1 2 3 4 5 ; proc print; var x; run; quit; 第一行就指定d:\sysdata\为逻辑库位置,其名称为a. null   引用在逻辑库中数据集时要使用两级名称来指定,第一级为库名称,第二级为数据集名,中间用句点“.”隔开。即用    库名称.数据集名 的格式来引用该数据集。    仍然是上面的例子,第2~6句新建一个数据集,数据集名称为aaaa,就可用a.aaaa来引用该数据集。 null数据步的基本结构    数据步均以DATA语句开始,用于创建和处理数据集。数据步中常用的语句如下表:       表2 数据步的常用语句 nullnull下面是几个例子。 Data语句: Data abc; data work.abc data sasuser.abc; data a.abc; INPUT语句: Input x y z; /*输入变量x,y,z*/ Input x1-x10; /*输入10个变量x1到x10*/ Input x$y@@; /*输入变量x,y,符号$指明x为字符变量,@@表示数据是连续读入*/null完整例子: libname a 'd:\sysdata\';/*设定逻辑库,库名为a*/ data a.aaaa; /*建立数据集,其名为aaaa*/ input x @@; /*输入变量x, @@表示数据是连续读入*/ cards; /*准备输入数据*/ 1 2 3 . 5 ; /*输入数据,注意有缺失值(缺失值用单独的小数点代表)*/ 五、SAS程序的过程步 五、SAS程序的过程步 通俗地说,SAS程序的过程步就是用于实现各种统计分析功能的SAS命令,我们只需要按照其格式调用它们。过程步总是以一个proc语句开始,后面紧跟着过程步名。下表列出一些常用的过程步名及功能。nullnull过程步的基本结构 SAS过程步的一般形式为: PROC 过程名 DATA=输入数据集 选项; 过程语句 / 选项; 过程语句 / 选项; …… RUN;     其中PROC语句的选项是可选的,用来规定过程运行的一些设置,如果有多个选项用空格分开。DATA=输入数据集也是可选的,如果缺省的话使用最近生成的数据集。过程步一般以RUN 语句结束。通常情况下,过程语句与数据步中的语句不同,数据步中的语句不能用在过程步中。过程步语句一般以某一个关键字开头,比如VAR、BY、TABLES、WEIGHT等,语句中有一些有关说明,如果有选择项的话要写在斜杠后。nullSAS过程步常用语句 本小节简单介绍几个在SAS过程步中常见的语句,更具体的用法可以在以后实际用到时再仔细体会。 1.DATA选项 用于指明所需要处理的数据集,如果缺省的话使用最近生成的数据集。 2.VAR语句 VAR语句在很多过程中用来指定分析变量。在VAR后面给出变量列表: VAR 变量名1 变量名2 … 变量名n; 变量名列表可以使用省略的形式,如X1-X3, MATH--CHINESE等。例如: Proc print; var math chinese; run; null3.MODEL语句 MODEL语句在一些统计建模过程中用来指定模型的形式。其一般形式为 MODEL 因变量 = 自变量表 / 选项; 比如,将下列语句放在某一过程步中 model math=chinese; 则用语文成绩预测数学成绩。 4.BY语句和CLASS语句 5.OUTPUT语句 6.FREQ语句和WEIGHT语句 7.ID语句 8.WHERE语句 9.LABEL语句和FORMAT语句六、SAS语言入门 六、SAS语言入门 SAS是一种专用的数据处理、统计计算语言,但是它也包含一般的高级语言编程能力并扩充了许多数学、统计等方面的函数。由于SAS的数据处理功能非常强大,我们并不提倡用它来编复杂的程序,因此,我们只介绍SAS语言用来进行一般编程计算的功能。 SAS语言的编程计算能力主要由SAS数据步提供(另外SAS还提供了一个SAS/IML模块可以进行向量、矩阵运算,读者有兴趣可以自己学习)。所以,下面给出的例子如果没有写DATA语句实际应该在例子前面加上DATA语句,在后面加上RUN语句才能运行。注意DATA语句总是以关键字DATA 开头,后面给出一个数据集名,就是本数据步要生成的数据集的名字,例如: data tmp1; 也可以省略数据集名,这时SAS自动生成一个临时数据集名。 null1.赋值语句 在SAS中用赋值语句计算一个值并存放到变量中。 格式为   变量名 = 表达式; 例如: avg = (math + chinese/120*100)/2;/* 计算平均分数,赋值给变量avg*/ isfem = (sex='女'); /*先生成一个取值为0或1的值,性别为女时为1,否则为0*,然后赋值给变量isffem*/ newv = .; /*将变量赋了缺失值*/ 注意想试验上述语句要把它们放入数据步中,并且等号右边的表达式中的各变量应该是存在的,否则会得到缺失值结果。 null2.输出语句 SAS数据步的输出一般是数据集,用赋值语句计算的结果会自动写入数据集。SAS也提供了一个PUT语句,可以象其它语言程序的PRINT、WRITE(*,*)、printf等语句一样立即打印输出结果。PUT的基本语法很多,只举几例:nulldata; x=0.5; y=sin(x); put 'Sine function value of ' x 'is ' y; run; 结果将在运行记录窗口显示一行 Sine function value of 0.5 is 0.4794255386 null在PUT语句中使用“变量名=”来指定输出项可以显示带有变量名的输出结果,比如把上程序中的PUT语句改为 put x= y=; 则结果在LOG窗口显示为 X=0.5 Y=0.4794255386 null分支结构 如果需要在某条件满足时执行某一操作,可以用 IF 条件 THEN 程序块 ELSE 程序块 的结构,其中Else语句及其后的程序块可以省略。需要注意的是,如果程序块只有一句,则可直接写出,否则应以DO开始,以END结束。 null比如, if max(a)<20 then p=0; else p=1; 上述程序当max(a)<20时p=0,否则p=1。 下述程序则是复合的IF结构。 IF x>0 THEN DO; PUT ' X为正数'; x = 2*x; PUT x=; END; 注意SAS的分支结构的写法与其它语言有些不同,它不用ENDIF结束。 null循环结构 SAS数据步可以使用循环结构,主要的是两种:计数DO循环和当型、直到型循环。 计数DO循环的写法是:  DO 计数变量 = 起始值 TO 结束值 BY 步长; 循环体语句…… END; 在循环体中可以用LEAVE语句跳出循环,相当于C语言的break语句;用CONTINUE语句可以立即结束本轮循环并转入下一轮循环的判断与执行 .null当型循环的语法是: DO WHILE(循环继续条件); 循环体语句…… END; 程序先判断循环继续条件是否成立,成立时执行循环体语句,再判断循环继续条件,如此重复,直到循环继续条件不再成立。 直到型循环的写法是: DO UNTIL (循环退出条件); 循环体语句…… END; 程序先执行循环体,然后判断循环退出条件是否成立,成立则结束循环,否则继续。注意每轮循环都是先执行循环体再判断是否退出。 null如: data; DO i = 1 TO 20 BY 2; j = i**3; put i 3. j 5.; END; run; 可以输出一个1,3,5,7,…,19的立方表。 七、SAS的基本统计分析功能 ---SAS Analysis 模块七、SAS的基本统计分析功能 ---SAS Analysis 模块前面我们已经对SAS系统进行了简要的介绍,下面我们讲如何利用SAS Analysis 模块计算描述统计量、进行假设检验、拟合曲线以及进行回归分析1、启动Analyst模块1、启动Analyst模块 选择Solutions菜单下的Analysis,然后再选择下面的Analyst,如图: null得到Analyst界面 null 2、数据集相关操作 一、依分布产生数据 利用Data菜单中Random Variates可以产生服从特定分布的随机数,可以选择的分布类型包括: 正态分布 均匀分布 二项分布 卡方分布 泊松分布 指数分布 Beta分布 Gama分布 几何分布 极值分布 null例1、利用Analyst模块生成100个服从标准正态分布的数据,并把生成的数据命名为Normal保存在Sasuser下。 操作步骤: (1)在Data菜单中选择Random Variates,然后选择分布类型——Normal(正态分布),则弹出现一对话框: (2)在Number of values to generate中填100,在New column name (变量名称)中填 X,在Mean中填0,在Standard deviation 中填1,单击OK(2)在Number of values to generate中填100,在New column name (变量名称)中填 X,在Mean中填0,在Standard deviation 中填1,单击OKnull(3)可以看到数据集中产生了新的一列,在File菜单中选Save As By SAS Name,保存数据集 null(4)在弹出的对话框中双击Sasuser,并在Member Name中填数据集名称 Normal,单击Save即可 null二、随机抽样 使用Data中Random Sample可以从数据集中随机抽取记录。 例:在刚才生成的正态数据集normal中随机抽取50个数据。 步骤如下: (1)首先选择Data菜单下Random Sample命令,弹出对话框: nullnull(2)在Rows中填50,单击OK即可得到一个表格含有随机抽取的50个样本,如图: 3、绘制统计图3、绘制统计图一、绘制变量直方图并在图上拟合分布曲线 利用Grphs中Histogram可以绘制变量直方图并拟合分布曲线。 例:以上节normal数据集中X为对象绘制直方图,并在直方图上拟合正态分布曲线。 操作步骤: (1)打开Normal文件:File→Open By SAS Name→Sasuser→Normal→OK nullnull(2)在Grphs下选Histogram,单击绘图变量X,再单击Analysis将其加入 null(3)选择Fit在直方图上拟合正态分布曲线,单击Fit弹出对话框 null(3)选择Normal,单击OK回到原对话框,再单击OK即得: null二、概率图 在直方图基础上我们可以猜想变量是服从正态分布的,通过绘制概率图可以来证实我们的想法。概率图将数值排序,给出每个数值对应的分位数,然后打点作图。如果这些点呈现线性特征,说明他们与理论分布相符,同时又在图像上加上一条给定分布的曲线,并给出分布的系数。null例:绘制Normal数据集中X的概率图,步骤如下: (1)首先选择Graphs下Probality Plot,弹出对话框 null(2)单击X,再单击Analysis,然后选择分布为Normal,单击Ok得到概率图: null 可以看到X的分布与正态分布基本吻合,图中还给出了正态分布的参数:均值为-0.06217,标准差为0.996833。null一、绘制散点图 使用Graphs下的Scatter Plot可以绘制散点图 例:病人在服用某种放射性药物后,体内的放射性物质的含量y与时间x具有一定的关系,绘制二者的散点图,然后找出他们的关系,数据如下: null1、首先将数据输入建立一个名为Test的数据集,然后在ANALYST模块下打开 2、然后打开Scatter Plot对话框 null3、在绘制散点图对话框中将x放在X轴,y放在Y轴,单击OK可以得到二者的散点图,为容易观察,可在Display中选择用线连接散点图 null4、绘制的图形如下,可以看到放射性物质的含量和时间具有负指数衰减关系 4、统计分析与计算4、统计分析与计算一、计算描述性统计量 利用Statistics 的Descriptive菜单可以计算 描述性统计量,Descriptive下有4个选项: Summary Statistics计算简单统计量 Distribution 计算分布信息 Correlations 计算变量间的相关系数 Frequency Counts统计变量的频数nullnull例1:计算上例Test中放射性物质y的简单统计量 1、打开Test数据集,选Statistics—Descriptive—Summary Statistics,出现对话框,选择y分析: null2、在Statistics中设置需要计算哪些统计量,单击OK即可得所需统计量。 null3、输出结果如下 null例2:计算x与y间的相关系数 1、打开Test数据集,选择Statistics—Descriptive—Correlations,在对话框中将x与y选入Analysis,然后单击OK null2、输出结果如下,可见x与y间的相关系数为-0.70152 二、列联表分析二、列联表分析 使用Statistics菜单下的Table Analysis可以进行列联表分析(即属性频数数据分析) 例1:为了考察法院判决是否与被告种族有关,调查了326位被告的判决情况如表所示: null1、首先建立数据集 Data panjue ; Input A B freq@@;\*其中A取1表有罪,2无罪;B取1表黑人,2表白人*\ Cards; 1 1 17 1 2 19 2 1 149 2 2 141 ; Run;null2、选择Table Analysis,打开对话框 null3、将A放在Row,将B放在Column,将freq放在Cell Counts null4、在Statistics中设置Exact Test检验,单击OK null5、结果如下,大致分为3部分,第一部分是频数和列百分比表;第二部分是四种检验方法结果,p值都大于0.15水平;第三部分是Fisher精确检验结果,p值位0.7246,远远大于0.15,可见判决情况与被告种族是没有关系的。 5、假设检验5、假设检验 在Statistics菜单下的Hypothesis Tests可以进行各种假设检验,大致可以分为单样本检验和两样本检验,其中单样本包括: 单样本均值Z检验:One Sample Z Tests 单样本均值t检验:One Sample t Tests 单样本比例检验:One Sample Proportion Tests 单样本方差检验:One Sample test for a variance null两样本的检验包括 两样本均值t检验:Two Sample t Test For Means 成对样本均值t检验:Two Sample paired t test for means 两样本比例检验:Two Sample test for proportions 两样本方差检验:Two Sample test for Variancenull2. 正态总体均值的假设检验 一、单个总体N(μ,σ2)均值μ的检验 1.σ已知时的μ检验(单样本均值Z检验:One Sample Z Tests ) 例2 某车间用一台包装机包装葡萄糖。包得的袋装糖重是一个随机变量,它服从正态分布。当机器正常时,其均值为0.5公斤,标准差为0.015公斤。某日开工后为检验包装机是否正常,随机地抽取它所包装的糖9袋,称得净重为(公斤): 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512 问机器是否正常? null解 按题意需检验假设 操作步骤: (1)首先输入数据,程序为 data u_weight; input weight@@; cards; 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512 ; run; 运行上述程序。null(2)选择Solutions→Analysis→Analyst菜单, (3)选择File→Open By SAS Name→Work→u_weight, (4) 选择Statistics→Hypothesis, (5) 选择One-Sample z-test for a mean,出现图2, null图2 u-检验的变量设置null(6)在图2的窗口中设置变量,我们选择变量为weight,Null:Mean处是零假设,填入0.5,Alternate处是备择假设,我们选^=,Tests按钮可以选择显著性水平,默认是0.05,Std.Dev.处填入标准差0.015。null(7)单击OK,产生输出结果。 One Sample Z Test for a Mean Sample Statistics for weight N Mean Std. Dev. Std. Error ------------------------------------------------- 9 0.51 0.01 0.00 Hypothesis Test Null hypothesis: Mean of weight = 0.5 Alternative: Mean of weight ^= 0.5 With a specified known standard deviation of 0.015 Z Statistic Prob > Z ----------- -------- 2.244 0.0248null结果分析: 由上可见,平均值为0.51,标准差为0.01,z统计量是2.244, Prob > Z的值为0.0248<α=0.05,因此应该拒绝H0,即认为这天包装机不正常。 null2.σ未知时的μ检验( One-Sample t-test for a mean ) 例3.某种电子元件的寿命x(以小时计)服从正态分布, μ, σ2均未知.现测得16只元件的寿命如下: 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 问是否有理由认为元件的平均寿命大于225(小时)? null解 按题意需检验假设 操作步骤: (1)首先输入数据,程序为 data lifetest; input life@@; cards; 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512 ; run; 运行上述程序。null(2) 选择Solutions→Analysis→Analyst菜单, (3) 选择File→Open By SAS Name→Work→lifetest, (4) 选择Statistics→Hypothesis, (5) 选择One-Sample t-test for a mean,出现图3, null图3 t-检验的变量设置null(6)在图3的窗口中设置变量,我们选择变量为life,Null:Mean处是零假设,填入225,Alternate处是备择假设,我们选>=,Tests按钮可以选择显著性水平,默认是0.05。null(7)单击OK,产生输出结果。 One Sample t-test for a Mean Sample Statistics for life N Mean Std. Dev. Std. Error ------------------------------------------------- 16 241.50 98.73 24.68 Hypothesis Test Null hypothesis: Mean of life <= 225 Alternative: Mean of life > 225 t Statistic Df Prob > t --------------------------------- 0.669 15 0.2570null结果分析: 由上可见,平均值为241.50,标准差为98.73,标准偏差为24.68,t统计量是0.669, Prob > t 的值为0.2570>α=0.05,因此应该接受H0,即认为元件的平均寿命不大于225小时。二、两个正态总体均值差的检验二、两个正态总体均值差的检验例4.在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的得率,试验是在同一只平炉上进行的.每炼一炉钢时除操作方法外,其它条件尽可能做到相同.先用标准方法炼一炉,然后用建议的新方法炼一炉以后交替进行,各炼了10炉,其得率分别为: 1.标准方法 78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.5 76.7 77.3 2.新方法 79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1 设这两个样本相互独立,且分别来自正态总体N(μ1, σ2)和N(μ2, σ2), μ1, μ2, σ2均未知.问建议的新的操作方法能否提高得率?(取α=0.05)(Two-Sample Paired t-test for a mean)null解 按题意需检验假设 操作步骤: (1)首先输入数据,程序为 data mydata; input olddata newdata@@; cards; 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512 ; run; 运行上述程序。null(2) 选择Solutions→Analysis→Analyst菜单, (3) 选择File→Open By SAS Name→Work→mydata, (4) 选择Statistics→Hypothesis, (5) 选择Two-Sample Paired t-test for a mean,出现图4null图4 两个样本u-检验的变量设置null(6)在图4的窗口中设置变量,依次选择两个变量,零假设处填入0,Alternate处是备择假设,我们选<0,Tests按钮可以选择显著性水平,默认是0.05。 null(7)单击OK,产生输出结果。 Two Sample Paired t-test for the Means of olddata and newdata Sample Statistics Group N Mean Std. Dev. Std. Error ---------------------------------------------------- olddata 10 76.23 1.8233 0.5766 newdata 10 79.43 1.4915 0.4717 Hypothesis Test Null hypothesis: Mean of (olddata - newdata) => 0 Alternative: Mean of (olddata - newdata) < 0 t Statistic Df Prob > t --------------------------------- -4.202 9 0.0012null结果分析: 由上可见,t统计量是-4.202, Prob > t 的值为0.0012<α=0.05,因此应该拒绝H0,即认为新方法比标准方法为优。3. 正态总体方差的假设检验3. 正态总体方差的假设检验由于在SAS中,单个总体与两个总体的情况在操作上差不多,下面只举两个总体的情况。 例5 对例4中的数据检验假设(取α=0.01) (Two-Sample Test for Variances)null操作步骤: (1) 首先输入数据,我们就利用前面输入的数据集mydata。 (2) 选择Solutions→Analysis→Analyst菜单, (3) 选择File→Open By SAS Name→Work→mydata, (4) 选择Statistics→Hypothesis, (5) 选择Two-Sample Test for Variances,出现图5null图5 两个样本的方差检验null(6)在图5的窗口中设置变量,选择Two variables(两个变量),依次选一个变量,按Group1按钮及Group2按钮,Alternate处是备择假设,我们选<1,Intervals按钮可以选择显著性水平,默认是0.05,我们选0.01。null(7)单击OK,产生输出结果。 Two Sample Test for Variances of olddata and newdata Sample Statistics Group N Mean Std. Dev. Variance -------------------------------------------------- olddata 10 76.23 1.8233 3.324556 newdata 10 79.43 1.4915 2.224556 Hypothesis Test Null hypothesis: Variance 1 / Variance 2 = 1 Alternative: Variance 1 / Variance 2 ^= 1 - Degrees of Freedom - F Numer. Denom. Pr > F ---------------------------------------------- 1.49 9 9 0.5590null结果分析: 由上可见,F统计量是1.49, Pr > F的值为0.5590>α=0.01,因此应该接受H0,即认为两总体方差相等。6、回归分析6、回归分析 利用Statistics菜单下的Regression可以进行回归分析,包括: Simple回归:单一的自变量,单一的因变量,但自变量次数可以是一次、二次或三次 Linear回归:多个自变量,多个因变量,但是对因变量分别进行回归 null一、Simple回归 例1:著名统计学家K.Pearson收集大量父亲身高x与儿子身高y的资料,其中10对数据如下: X 60 62 64 65 66 67 68 70 72 74 Y 63.6 65.2 66.0 65.5 66.9 67.1 67.4 68.3 70.1 70.0 假设对给定的x, y为正态变量,且方差与x 无关,求回归方程y=a + bx,并指出回归效果是否显著。(显著水平取0.05)null1、首先建立数据集: data sasuser.reg; input x y@@; cards; 60 63.6 62 65.2 64 66.0 65 65.5 66 66.9 67 67.1 68 67.4 70 68.3 72 70.1 74 70.0 ; run; 2、再利用菜单完成回归分析: (1) 选择Solutions→Analysis→Analyst菜单, (2) 选择File→Open By SAS Name→sasuser→reg (3) 选择Statistics→Regression, (4) 选择Simple Linear Regression出现一窗口 null在出现的窗口中设置变量,我们选择变量dependent为y,选择Explanatory为x, Model处选择Linear, Tests按钮可以选择显著性水平,默认是0.05。 。null(6) 单击OK,产生输出结果 null首先由模型的方差分析表可以看到, Prob > F 的值为0.0001<α=0.05,因此该回归方程显著,再由下面的参数估计可以得出回归方程为: y=35.97681+0.46457xnull二、Linear回归 例2:外贸数据分析 1、首先建立数据集 data reg; input n x1-x3 y@@; cards; 1 149.3 4.2 108.1 15.9 2 161.2 4.1 114.8 16.4 3 171.5 3.1 123.2 19.0 4 175.5 3.1 126.9 19.1 5 180.8 1.1 132.1 18.8 6 190.7 2.2 137.7 20.4 7 202.1 2.1 146.0 22.7 8 212.4 5.6 154.1 26.5 9 226.1 5.0 162.3 28.1 10 231.9 5.1 164.3 27.6 11 239.0 0.7 167.6 26.3 ; run;null2、再利用菜单完成回归分析: (1) 选择Solutions→Analysis→Analyst菜单, (2) 选择File→Open By SAS Name→work→reg (3) 选择Statistics→Regression, (4) 选择 Linear Regression出现一窗口null在出现的窗口中设置变量,我们选择变量dependent为y,选择Explanatory为x1,x2,x3, Tests按钮可以选择显著性水平,默认是0.05。 null(6)单击OK产生结果 null 首先由模型的方差分析表可以看到, Prob > F 的值为0.0001<α=0.05,因此该回归方程显著,再由下面的参数估计可以得出回归方程为: y=-10.13-0.05x1+0.59x2+0.29x3 但从数表来看,随着国内生产总值(X1)的增加进口总额(y)也增加,所以该方程并不一定是真实的反映了他们间的关系,进一步的探讨需要专门的回归分析理论,在此不作进一步讨论,此例只是想给大家一个抛砖引玉的作用。
/
本文档为【sas软件教程】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索