sas第九章 t检验和方差分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第九章 t 检验和方差分析

在科研中,我们往往是根据样本之间的差异,去推断其总体之间是否有差异。样本差异可能是由抽样误差所致,也可能是由本质的不同所致。应用统计学方法来处理这类问题,称为“差异的显著性检验”。若已知总体为正态分布,进行差异的显著性检验,称为“参数性检验”,SAS 中MEANS 、TTEST 、ANOVA 、GLM 等均属此类检验;若未知总体分布,进行差异的显著性检验,称为“非参数性检验”,SAS 中采用NPAR1WAY 过程。

第一节 t 检验

9.1.1 简介

t 检验是用于两组数据均值间差异的显著性检验。它常用于以下场合:

1.样本均值与总体(理论)均值差别的显著性检验

检验所测得的一组连续资料是否抽样于均值已知的总体

根据大量调查的结果或以往的经验,可得到某事物的平均数(例如生理生化的正常值),以此作总体均值看待。

SAS 中采用MEANS 过程,计算出观察与总体均值的差值,再对该差值的均值进行t 检验。

2.同一批对象实验前后差异的显著性检验(自身对照比较)或配对资料差异的显著性检验(配对比较检验)

比如,在医学研究中,我们常常对同一批病人治疗前后的某些生理生化指标(如血压、体温等)进行测量,以观察疗效;或对同一批人群进行预防接种,以观察预防效果;或把实验对象配成对进行测定,比较其实验结果。

SAS 中采用MEANS 过程,计算出两样本观察的差值(如治疗前、后实验数据的差值),再对该差值的均值进行t 检验。

3.两样本均值差异的显著性检验

作两样本均值差异比较的两组原始资料各自独立,没有成对关系。两组样本所包含的个数可以相等,也可以不相等。每组观测值都是来自正态总体的样本。 设1X 与2X 为两样本的均值,1n 与2n 为两样本数,21s ,22s 为两样本方差,分两种情形,其数学模型为:

(1)方差齐(相等)时:

)/1/1(2122

1n n s x x t +-=

)2/(])1()1[(212222112-+-+-=n n s n s n s

(2)方差不齐时: 2221212

1//n s n s x x t +-=

SAS 中采用TTEST 过程,先作方差齐性检验(F 检验),然后根据方差齐(EQUAL)和方差不齐(UNEQUAL)输出t 值和P 值以及基本统计量。

在作方差齐性检验时,用F 检验。F 值计算公式为:

)

,(),(22212221S S Min S S Max F =

9.1.2 用MEANS 过程作t 检验

1.过程格式

PROC MEANS MEAN STD STDERR T PRT ;

VAR 变量表;

2.说明

(1)PROC MEANS 语句中,选择了5个统计量:均值、标准差、标准误差、t 值、P 值。

(2)VAR 语句中的变量是分析变量。缺省时,计算所有数值型变量。

3.举例

例1: 样本均值与总体均值差别的显著性检验。

已知某水样中含CaCO 3的真值为20.7mg /L ,现用某方法重复测定该

水样11次,CaCO 3的含量为:20.99,20.41,20.10,20.00,20.91,22.60,

20.99,20.41,20,23,22。问用该法测CaCO 3的含量所得的均值与真值

有无显著差别 ?

程序: (yp111.sas)

编程说明:

在数据步中,变量x 读取测定值,产生一个差值变量y(y=x-20.7),在过程步中,计算出Y 的均值、标准差、标准误差、t 值、P 值。

结果说明:

因t =1.0636907,0.05

的均值与真值间无显著差异。此法可信。

例2:配对比较的t 检验。

研究食物中维生素E 与肝脏中维生素A 含量的关系。将大白鼠按性别、体重配对。每对随机分配,一个用正常饲料,一个用缺乏维生素E 的饲料。经过一个时期饲养,杀死动物测定肝中维生素A 的含量,结果如下表:

大白鼠肝脏中维生素A含量(IU/g)

配对号 1 2 3 4 5 6 7 8

正常饲料3550 2000 3000 3950 3800 3750 3450 3050 缺乏E饲料2450 2400 1800 3200 3250 2700 2500 1750

程序:(yp112.sas)

编程说明:

数据步中,把每对数据中的一个作为x,另一个作为y,计算出差数d(d=x-y),在过程步中,计算差数d的均值、标准差、标准误差、t值、P值。

结果说明:

因t=4.21 p=0.0040<0.05,故有非常显著差异,即正常饲料组鼠肝维生素A含量比维生素E缺乏组的含量大。

例3 自身对照比较的t检验。

应用克矽平治疗矽肺患者10名,治疗前后血红蛋白的含量如下表,问该药是否会引起血红蛋白的变化?

治疗前后血红蛋白的含量(mg%)

治疗前11.3 15.0 15.0 13.5 12.8 10.0 11.0 12.0 13.0 12.3 治疗后14.0 13.8 14.0 13.5 13.5 12.0 14.7 11.4 13.8 12.0

程序:(yp113.sas)

编程说明:

数据步中,把每对数据中的一个作为x,另一个作为y,计算出差数d(d=x-y),在过程步中,计算差数d的均值、标准差、标准误差、t值、P值。

结果说明:

因t=1.1989377,O.05

9.1.3用TTEST过程作t检验

1.过程格式

PROC TTEST [DATA=数据集];

CLASS变量;

VAR变量表;

2.说明

(1)CLASS语句中的变量是分类变量,其水平值只能有两个,并对应两组观察。是必选语句。

(2)VAR语句中的变量是被分析的变量,如果缺省,则对所有的数值型变量进行分析。

相关文档
最新文档