方差分析研2012-1

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
念Fisher,以F命名,故方 差分析又称F 检验 (F
test)。用于推断多个总 体均数有无差异.
2020/8/8
8
第一节 方差分析的基本思想和应用条件
• 方差分析的含义
– 方差是描述研究对象变异程度的一种指标 – 方差分析是一种假设检验的方法,就是对变异
的分析 – 用于两组或两组以上多个均数之间的比较
由于抽样误差所致,而不是由于处理因素的作用所 致。
2020/8/8
20
如果各样本均数间的差异,不仅是由抽样误差所 致,还有处理因素的作用。此时的组间变异远大
于组内变异,两者的比值即统计量F 明显大于1。 因此就要拒绝H0,接受H1,可认为各样本均数间
的差异,并不是由于抽样误差所致,而是处理因 素的作用。
1与3 1与6 1与7 1与9 2.061 2.329 2.372 2.272 0.013 0.025 0.023 0.029
1与10 2.918 0.006
实际犯第一类错误的概率:5/45=0.11
2020/8/8
7
Analysis of Variance ( ANOVA)由英国统计学 家R.A.Fisher首创,为纪
– 2、可能是由于各组所接受的处理不同,不同 的处理引起不同的作用和效果,导致各处理组 之间均数不同。
2020/8/8
11
• 方差分析的基本思想:
– 将所有观察值之间的变异(称总变异)根据离
均差平方和划分的原理,按设计和需要分解成
两个或多个部分。每一部分变异都反映了研究
工作中某种特定的内容(如某种处理因素的作
章第 十
黄志刚
公共卫生学院
流行病与统计教研室
2020/8/8
1
例: 某医生为研究一种降糖新药的疗效,以统一的纳 入标准和排除标准选择了60名2型糖尿病患者,按 完全随机设计方案将患者分为三组进行双盲临床 试验。其中,降糖新药高剂量组21人、低剂量组 19人、对照组20人。对照组服用公认的降糖药物, 治疗4周后测得其餐后2小时血糖的下降值 (mmol/L),结果如表9-1所示。
X (观察值)与该组均数 的差异
2020/8/8
i
13
1.总变异
– 24只大鼠的全肺湿重大小各不相等,它们之间 的变异称为总变异。
• 用每个观察值与总均数的离均差平方和来表示, 称为总离均差平方和SS总
SS总
(xij x)2
ij
总 N 1
2020/8/8
14
2. 组间变异
SS组间反映了各组均数 X i
1
组间

2
组内
F 值接近于 l,就没有理由拒绝 H0;反之,F 值越大,拒绝 H0 的理由越充分。
方差分析的检验假设:
H0:为各样本来自均数相等的总体 H1:为各总体均数不等或不全相等
如果组间变异与组内变异相等,两者的比值即
统计量F为1;由于存在抽样误差,两者往往不恰 好相等,但相差不会太大,统计量F应接近于1。 因此不拒绝H0,可认为各样本均数间的差异,是
2020/8/8
21
F
组间变异 组内变异
MS组间 MS组内
• F值要大到何种程度才有统计学意义呢? • 即,F值要大到何种程度才能认为各组均数间的
差异是由处理因素引起而非随机误差呢? • 可以通过查F界值表,确定P值作出统计推断
间的变异程度 组间变异=①随机误差+ ②处理因素效应
mi mj
SS组间 ni (xi x )2
i
组间 k 1
3. 组内变异
在同一处理组内,虽然 每个受试对象接受的处 理相同,但测量值仍各 不相同,这种变异称为 组内变异。
SS组内仅仅反映了随机误 差的影响。也称SS误差
SS组内
(xij xi )2
ij
mi
组内 (ni 1) N k
i
三种“变异”之间的关系
SS总 = SS组间 + SS组内,
且 ν总 =ν组间 +ν组内
组内变异 SS : 组内
随机误差
组间变异 SS 组间:处理因素 + 随机误差
均方(mean square,MS)
变异程度除与离均差平方和的大小有关外, 还与其自由度有关,由于各部分自由度不相等, 因此各部分离均差平方和不能直接比较,须将 各部分离均差平方和除以相应自由度,其比值 称为均方差,简称均方(mean square,MS)。组 间均方和组内均方的计算公式为:
2020/8/8
9
例:某研究者为研究煤矿粉尘作业环境对尘肺的影响,将24只 Wistar 大鼠随机分到甲、乙、丙三个组,每组8只, 分别在地面 办公楼、煤炭仓库和矿井下染尘,12周后测量大鼠全肺湿重,三组 大鼠的全肺湿重有无差别?
2020/8/8
10
• 样本均数的差异,可能有两种原因所致:
– 1、可能由随机误差所致,随机误差包括两种 成分-个体间的变异和测量误差两部分;
用、随机误差的影响等),通过对平均变异的
比较,做出相应的统计判断。
2020/8/8
12
Hale Waihona Puke Baidu
X ij X
• 总变异(Total variation):全部测量值与总均数 X
间的差别
• 组间变异( between group variation ) 各组的均数 X i
与总均数 X 间的差异
• 组内变异(within group variation )每组的8个测量值
问治疗4周后,餐后2小时血糖下降值的三组总体 平均水平是否不同?
2020/8/8
2
2020/8/8
3
不能用t检验分析两组以上多个均数的比较
• 1、与资料最初的设计要求不符 • 2、增加犯第一类错误的概率
2020/8/8
4
2020/8/8
5
实例演示
从已知正态总体N(10,52)随机抽取10个样本(ni=10)的结果
MS组间
SS组间
组间
MS组内
SS组内
组内
均方之比=F 值
如果各组样本的总体均数相等(H0: m1 m2 … mk ),
即各处理组的样本来自相同总体,无处理因素的作用,则组 间变异同组内变异一样,只反映随机误差作用的大小。组间 均方与组内均方的比值称为 F 统计量
F MS组间 MS组内
样本
编号 1
2
3
4
5
6
7
8
9 10
X 12.61 10.85 9.23 9.11 10.9 9.24 9.55 10.28 9.12 8.75
S 4.29 5.44 3.93 6.55 4.83 4.86 3.88 3.89 5.38 4.08
2020/8/8
6
比较组 t P
45次比较中5次有统计学意义的结果
相关文档
最新文档