SAS应用举例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据分析是一项困难且繁琐的工作,需要从大量数据中找出一定规律,为下一步研究提供必要的支持。为此,就需要掌握一定的方法,并拥有一套沟通能力强大的分析工具。SAS软件的出现,解决了以上问题,它具有完备的数据访问,分析和呈现功能的功能,在数据处理和分析上得天独厚的优势,使得其在各个领域都占有一席之地。本文根据笔者理论的学习和实践,结合实际生活中的应用对t检验,单因素方差分析与多重比较,多因素方差分析,以及相关性和线性回归加以论述,以便在今后的学习中更好的应用。
新建excel---输入数据保存,关闭excel----打开SAS---file—导入文件—桌面文件excel---命名---下一步----完成-----statistics—analysis---analyst(出现表格)---file(import data by sas)---analysis---one way ---
1.t检验
1.1样本均数与总体均数比较。
t检验是当前论文中使用较广的一种统计分析方法。t检验主要用于单因素K≤2水平设计的定量资料差别的检验。
例:已知某地成年男子脉搏均数为72次/min,现在该地临近的山区随机调查了20名健康成年男子,测得其脉搏数字如下:(75,74,72,74,79,78,76,69,77,76,70,73,76,71,78,77,76,74,79,77次/min)问山区成年男子的脉搏数与该地成年男子有无显著差异?
解:
方法:新建Excel,输入数据→打开SAS,导入数据→应用系统分析(one-sample t-test for a mean)→得出结果
由上图可知P=0.0002<0.05,因此,山区成年男子的脉搏数与该地成年男子的脉搏数有极显著差异。
1.2两样本均数比较的t检验
例:一研究生用两种方法(⑴哥特里-罗紫法,和⑵脂肪酸水解法)对乳酸饮料中脂肪含量进行测定(%),得出结果:⑴0.84,0.591,0.674,0.632,0.687,0.978,0.750,0.730,1.200,0.870;⑵
0.580,0.509,0.500,0.316,0.337,0.517,0.454,0.512,0.997,0.506 问两种方法之间有无显著差异?
解:
方法:新建Excel,输入数据→打开SAS,导入数据→应用系统分析(two-sample t-test for means)→得出结果
由上图结果可知,P=0.0041<0.05,存在显著差异,因此两种方法之间存在显著差异。
2单因素方差分析与多重比较
例1:为了鉴定四种果汁的品质,随机抽调36名感官评定者,分为四组,每组9名,四种果汁的得分如下:
用方差分析推断以上四种果汁的平均得分差异是否显著?
解:
方法:新建Excel,输入数据→打开SAS,导入数据→应用系统分析(One-Way ANOVA)→得出结果
通过SAS的运行,结果如下显示:
由以上结果可知,P>0.05不存在显著差异,因此四种果汁的平均得分差异不显著,因此不用做多重比较。
例2:用方差分析推断以下六种施肥法的小麦植株含氮量平均得分差异是否显著?若差异显著做出多重比较。
6种施肥法的小麦植株含氮量
1 2 3 4 5 6
Ⅰ 2.9 4 2.6 0.5 4.6 4
Ⅱ 2.3 3.8 3.2 0.8 4.6 3.3
Ⅲ 2.2 3.8 3.4 0.7 4.4 3.7
Ⅳ 2.5 3.6 3.4 0.8 4.4 3.5
Ⅴ 2.7 3.6 3 0.5 4.4 3.7
解:方法同上。
运行结果如下:
由以上结果可知:P<0.0001。差异极其显著。因此需要进行多重比较。
比较后结果如下:
由以上结果可知,第五组与第二,六,三,一,四组都差异显著;第
二组与第六组差异不显著,但与三,一,四组差异都显著;第三,一,四组之间都差异显著。如果用图显示会更加直观,图示如下:
每组的平均值,标准差与标准误差
图表:
1
2
3
4
5
6
123
456方法含氮量平均值
每组平均含氮量柱状图
3双因素方差分析
例:某工厂产品生产中,采取不同的温度和不同的催化剂处理样品,重复实验两次,得到的产量如下:试确认反应温度和催化剂种类对产量的影响是否显著?
温度
60 80 100 120
催化剂1 2.7 1.38 2.35 2.26
3.3 1.35 1.95 2.13
催化剂2 1.7 1.74 1.67 3.41
2.14 1.56 1.5 2.56
催化剂3 1.9 3.14 1.63 3.17
2 2.29 1.05 3.18
催化剂4 2.72 3.51 1.39 2.22
1.85 3.15 1.72
2.19 解:根据以上数据,导入SAS中,运行结果如下:
由上图可以看出总体P=0.0001<0.05,极其显著,表明反应温度,催化剂种类对产量的影响极其显著。单独催化剂(P=0.2927>0.05)而言,它的改变对产量的影响不具有显著性,而温度的改变对产量的影响极其显著P=0.0002<0.05。温度为120度与80度,100度之间产量存在显著差异;温度为60度与80度和120度之间产量不存在显著差异,但与60度之间存在显著差异。温度为80度与100度之间也存在显著差异。
4相关分析与回归分析
例:为了研究苹果树白粉病的始病期x1、嫩叶历期x2、发病期雨天数x3与最终病情指数y直接的关系,统计了自1992-2009年的白粉病预报要素和最终病情指数级值数据如下: