SAS统计分析及应用_ 方差分析_

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SS组内 SS总 - SS组间
v组内 N k
MS 组内
SS 组内 v 组内
*
三种变异的关系
k ni
k ni
SS总
(xij x )2
[(xij xi ) (xi x )]2
i 1 j 1
i 1 j 1
k
k ni
ni(xi x )2
[(xij xi )2
i 1
i 1 j 1
• 消费者协会想知道这几个行业之间的服务质量是否有显著差异?
4组两两t检验不犯第1类错误的概率0.956=0.7351; 6次t检验中至少有一次犯第一类错误的概率为0.2649
*
方差分析中的有关概念
方差分析(analysis of variance,ANOVA)是通过方 差比较的方式来对不同总体的参数进行假设检验
• Error1: H真值为1.13,但你错误的认为它不为1.13 • Error2: H真值不为1.13,但你错误地认为它为1.13
*
问题的引入
零售业
57 66 49 40 44
消费者对四个行业的投诉次数
旅游业
68 39 29 45 56
航空公司
31 49 21 34 40
家电制Leabharlann Baidu业
44 51 65 77 58
方差分析的目的就是在 H0: μ1=μ2=…=μk 成立的条件下,通过分析 各处理组均数 之间差别 大小,推断k个总体均数 间有无差别,从而说明处 理因素的效果是否存在。
*
方差分析的基本原理
方差分析的前提条件
各组样本必须是独立的 各组样本所代表的总体服从正态分布 各组的方差相等
方差分析的零假设 H0: μ1=μ2=…=μk
*
方差分析的SAS程序
(1) ANOVA过程
PROC ANOVA[DATA=<数据集>]; CLASS <自变量列表>; MODEL <因变量名>=<自变量表达式>[/<选项列表>]; MEANS <效应>[/<选择项>];
RUN;
CLASS语句中的变量是分类变量,分类变量的个数反映了方差分析的因素个数。 MODEL语句给出模型表达式: 主效应模型:MODEL y=a b c; 交互模型: MODEL y=a b c a*b a*c a*b*c; 嵌套效应模型: MODEL y=a b c(a b); 混合效应模型: MODEL y=a b(a) c(a) b*c(a); MEANS语句:进行均数间的检验
组内方差
• 水平内部方差,即组内离均差平方和除以自由度n-k,其中n为样本容 量。仅包括随机性因素。
*
方差分析的思路
方差分析的统计量:
F
MS组间 MS组内
• 方差分析解决问题的思路是:将总方差分解为由于随机抽样引起的差异(个体间差 异,随机误差)和由于研究因素所造成的差异(系统误差)两部分,然后比较这两 部分差异在总方差中所占的比重。
SS组间 SS组内
总自由度 N 1 V组间 V组内
*
单因子方差分析的结果
零售业
57 66 49 40 44
旅游业
68 39 29 45 56
航空公司
31 49 21 34 40
家电制造业
44 51 65 77 58
• 四个行业之间的服务质量是否有显著差异? • H0:μ1=μ2=μ3=μ4 H1:至少有两个总体的均数不相等
• 两个或多个样本均数间的比较;分析两个或多个因素间的 交互作用;回归方程的线性假设检验;多元线性回归分析 中偏回归系数的假设检验;两样本的方差齐性检验等。
*
总变差=组间差别+组内误差
• ANOVA在只考虑组间变差和误差变差时称为单向方差分析(One-Way ANOVA)
• ANOVA判断由各组间的不同引起的变差L组是否比纯粹由机会引起的变差L误要大 ▶ 如果L组> L误,各组均值很可能是不同的。
k ni
SS总
(xij x )2
i 1 j 1
k ni
SS组内
(xij xi )2
i 1 j 1
k
SS组间 ni(xi x )2 i 1
*
总变差=组间差别+组内误差
不同的条件构成 的差异
测量条件造成的 误差
总变差
组间 变差
*
三种变异的关系
完全随机设 计的单因素
方差分析
总的离均差平 方和(SS总)
组间离均差平方和为各组样本均数与总均数差值的平方和
k
SS组间 ni(xi x )2 i 1
MS 组间
SS 组间 V组间
V组间 k - 1
*
组内离均差平方和、自由度和均方
组内离均差平方和为各处理组内部观察值与其均数差值的平方和之和
k ni
SS组内
(xij xi )2
i 1 j 1
数理统计证明,总离均差平方和等于各部分离均差平方和之和
• 两者差别不大,说明试验条件的变化(因素水平的不同)对试验结果影响不大;如果 两者相差较大,且系统误差大的多,说明系统条件变化引出的误差不可忽视。
*
方差分析
方差分析的应用条件为:
• 各样本须是相互独立的随机样本; • 各样本来自正态分布总体; • 各总体方差相等,即方差齐性。
方差分析的用途很广,包括:
组间离均 差平方和 (SS组间)
• 相应的总自由度也分解为组间自由度和 组内自由度两部分。
组内离均 差平方和 (SS组内)
*
总离均差平方和及自由度
总变异的离均差平方和为各变量值与总均数差值的平方和,离均差平方和和自由度为
k ni
SS总
(xij x )2
i 1 j 1
总自由度=N-1
*
组间离均差平方和、自由度和均方
第七章 方差分析
武汉大学
主要内容
7.1 方差分析的基本概念 7.2 单因子方差分析 7.3 双因子方差分析 7.4 均值估计与多重比较
2
7.1 方差分析概述
3
假设检验概念回顾
第一类错误
• 你的假设是正确的,但你拒绝该假设。
第二类错误
• 你的假设是错误,但你接受该假设。
比如: 假设 H=1.13
• 例:分析影响某种商品的销售额(不同的价格、包装方 式、推销人员的形象等)
方差分析由英国统计学家R.A.Fisher首先提出,以F 命名其统计量,故方差分析又称F检验。
F
MS组间 MS组内
*
方差分析的基本原理
将N个受试对象随机分为k (k≥2)组,分别接受不同 的处理,第i组的样本量为ni, 第i处理组的第j个测量值用 Xij表示。
*
单因子方差分析的结果
*
了解术语
了解 术语
因变量或者分析变量(dependent)
• 待分析的变量
自变量或者分类变量、因子、因素(independent)
• 影响分析变量的因素
因素的水平
• 因素的不同取值称为因素的不同水平
组间方差
• 水平间的方差,即组间离均差平方和除以自由度k-1,其中k为水平数。 它既包括系统性因素,也包括随机性因素。
相关文档
最新文档