13方差和协方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10
CASE:教学评估
在ห้องสมุดไป่ตู้学质量评价中,重要的依据是不同 老师任教的水平相近的班级参加同一考 试后的成绩。通常的做法是比较各个班 级的平均分数是否存在差别。
甲班 85 73 86 77 94 68 82 83 90 88 乙班 75 90 62 98 73 75 75 76 83 66
两位老师分别任教两个班(原成绩相近 ,不存在差异),考试后的成绩是否存 在差异?
对于大学生新生的入学成绩可以通过 t检验 来考察男女学生间的入学成绩是否有差异。 但是要想知道来自江苏、广东、浙江、湖南 的学生其入学成绩是否有差异,该如何做?
17
零售商、批发商、代理商对厂家的分销 政策态度一致吗?
顾客对商店熟悉程度(高、中、低)对 商店的偏好有什么影响?
以下所涉及问题其实就是在单一处理因 素之下,多个不同水平(或简单理解多 组)之间的连续性观察值的比较,目的 是通过对多个样本的研究,来判断这些 样本是否来自于同一总体。
1. t检验基础 2. 单因子方差分析 3. 协方差分析
3
1 t 检验
在针对连续变量的统计推断方法中,最 常用的有t 检验和方差分析两种,其中t 检验是最基本的检验方法,也是统计学 中跨里程碑的一个杰作。
它最初由W. S. Gosset在1908年以笔名 student发表一篇关于t 分布的论文中提 出,并从此开创了小样本计量资料进行 统计推断的先河。
t 单样本检验是一个非常稳健的统计方 法,只要没有明显的极端值,其分析结 果都是稳定的。
9
1.2成组设计两样本均值的比较
在实际问题中,除了一个总体的检验问 题外,还常碰到两个总体均值比较的问 题,此时可以考虑使用成组设计的t 检 验来进行分析。
数据应满足以下三个条件:正态性、各 个样本均来自于正态分布的总体:方差 齐性,各个样本所在总体的方差相等; 独立性,各个观察值之间相互独立的, 不能相互影响。
7
首先应建立相应的假设: H0: μ=μ0 , 打包机工作正常 H0: μ≠μ0, 打包机工作不正常
α=0.05 由结果可知P值为0.957,它大于检
验水平0.05,因此不拒绝H0,还不能
认为样本所在总体的均数与假设的总体无数 不同,即可认为打包机工作正常。
8
t检验的适用条件
只要数据分布不是强烈的偏态,一般而 言单样本t 检验都是适用的。
11
1.3 配对样本均值的比较
在很多科学研究中,常采用配对设计来 提高研究效率,常见的配对设计有四种 情况:
1. 同一被试处理前后数据 2. 同一被试两个部位的数据 3. 同一样品用两种方法检验的结果 4. 配对的两个被试分别接受两种处理后的
数据
12
方法原理
当配对设计所测量到的数据为定距变量 时,就可以考虑采用配对t检验加以分 析。其原理是求出每对的差值:如果两 种处理实际上没有差异,则差值的总体 均值应当为0,从该总体中抽出的样本 其均值也应当在0附近波动;反之,如 果两种处理有差异,差值的总体均值就 应当远离0,其样本均值也应当远离0。
4
案例
某工厂用自动打包机打包,每包标准质 量为100KG。为了保证生产的正常运行 ,每天开工前需要先行试机,检查打包 机是否有系统偏差,以及时进行调整。 某日开工后在试机中共打了9个包,测 得9包的质量(KG)为:
99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5
这样通过检验该差值总体均值是否为0 ,就可以得知两种处理是否有差异
13
相应假设如下:
H0: μd=0 , 两种处理没有差别 H0: μd≠0,两种处理存在差别
14
CASE: 高血压的治疗
用某种药治疗10名高血压病人,对每一 病人治疗前、后舒张压(mmHg)进行了 测量,问该药有无降压作用
配对 1 2 3 4 5 6 7 号
新药 4.4 5 组
5.8 4.6 4.9 4.8 6
安慰 6.2 5.2 5.5 5
剂组
4.4 5.4 5
8 9 10
5.9 4.3 5.1
6.4 5.8 6.2
16
2 单因子方差分析
前面所提到有关统计推断的方法,如单样本 、两样本 t检验等,其所涉及的对象千变万 化,但归根结底都可视为两组间的比较,如 果有一组的总体均值已知,则为单样本 t 检 验,如果两组都只有样本信息,则为两样本t 检验。但是遇到以下情形,该如何处理?
现希望做出判断,明确打包机是否需要 进行调整
5
1.1样本均值与总体均值的比较
本研究的目的就是为了推断实际上该样 本所载总体的均数是否等于这一已知总 体均数(100KG)
这是一个样本均数与总体均数的比较问 题
6
单个样本均数检验问题是一种关于总体 均数的假设检验问题。
这种问题只有一个随机抽取的样本,研 究目的是推断这个样本相应的总体是否 等于(或大于,或小于)某个已知总体 均数。
病1
2
3
4
例
治 120 127 141 107 疗 前
治 123 108 120 107 疗 后
5
6
7
110 114 115
100 98 102
8
9
10
138 127 122
152 104 107
15
实验任务1
为研究女性服用某避孕药后是否影响其血 清总胆固醇,将20名女性按年龄配成10对 。每对中随机抽取一人服用新药,另一人 服用安慰剂。经过一定时间后,测得血清 总胆固醇含量(mmol/L),结果如表所 示。问该新药是否影响女性血清总胆固醇
18
多个均值比较时不宜采用t检验
R. A. Fisher爵士为后人奠定了方差分析 (Analysis of Variance,简写为ANOVA) 的理论基础:将总变异分解为由研究因 素所造成的部分和由抽样误差所造成的 部分,通过比较来自于不同部分的变异 ,借助F分布做出统计推断。
市场调查与预测
12 方差和协方差分析
雷超 leichaohotmail 广东药学院医药商学院
1
上次课程回顾—频数分布、列联 表和假设检验
1. 频数分布 2. 与频数分布有关的统计量 3. 假设检验介绍 4. 假设检验的一般步骤 5. 列联表 6. 与列联表有关的统计量 7. 参数/非参数检验
2
本章内容—方差和协方差分析
CASE:教学评估
在ห้องสมุดไป่ตู้学质量评价中,重要的依据是不同 老师任教的水平相近的班级参加同一考 试后的成绩。通常的做法是比较各个班 级的平均分数是否存在差别。
甲班 85 73 86 77 94 68 82 83 90 88 乙班 75 90 62 98 73 75 75 76 83 66
两位老师分别任教两个班(原成绩相近 ,不存在差异),考试后的成绩是否存 在差异?
对于大学生新生的入学成绩可以通过 t检验 来考察男女学生间的入学成绩是否有差异。 但是要想知道来自江苏、广东、浙江、湖南 的学生其入学成绩是否有差异,该如何做?
17
零售商、批发商、代理商对厂家的分销 政策态度一致吗?
顾客对商店熟悉程度(高、中、低)对 商店的偏好有什么影响?
以下所涉及问题其实就是在单一处理因 素之下,多个不同水平(或简单理解多 组)之间的连续性观察值的比较,目的 是通过对多个样本的研究,来判断这些 样本是否来自于同一总体。
1. t检验基础 2. 单因子方差分析 3. 协方差分析
3
1 t 检验
在针对连续变量的统计推断方法中,最 常用的有t 检验和方差分析两种,其中t 检验是最基本的检验方法,也是统计学 中跨里程碑的一个杰作。
它最初由W. S. Gosset在1908年以笔名 student发表一篇关于t 分布的论文中提 出,并从此开创了小样本计量资料进行 统计推断的先河。
t 单样本检验是一个非常稳健的统计方 法,只要没有明显的极端值,其分析结 果都是稳定的。
9
1.2成组设计两样本均值的比较
在实际问题中,除了一个总体的检验问 题外,还常碰到两个总体均值比较的问 题,此时可以考虑使用成组设计的t 检 验来进行分析。
数据应满足以下三个条件:正态性、各 个样本均来自于正态分布的总体:方差 齐性,各个样本所在总体的方差相等; 独立性,各个观察值之间相互独立的, 不能相互影响。
7
首先应建立相应的假设: H0: μ=μ0 , 打包机工作正常 H0: μ≠μ0, 打包机工作不正常
α=0.05 由结果可知P值为0.957,它大于检
验水平0.05,因此不拒绝H0,还不能
认为样本所在总体的均数与假设的总体无数 不同,即可认为打包机工作正常。
8
t检验的适用条件
只要数据分布不是强烈的偏态,一般而 言单样本t 检验都是适用的。
11
1.3 配对样本均值的比较
在很多科学研究中,常采用配对设计来 提高研究效率,常见的配对设计有四种 情况:
1. 同一被试处理前后数据 2. 同一被试两个部位的数据 3. 同一样品用两种方法检验的结果 4. 配对的两个被试分别接受两种处理后的
数据
12
方法原理
当配对设计所测量到的数据为定距变量 时,就可以考虑采用配对t检验加以分 析。其原理是求出每对的差值:如果两 种处理实际上没有差异,则差值的总体 均值应当为0,从该总体中抽出的样本 其均值也应当在0附近波动;反之,如 果两种处理有差异,差值的总体均值就 应当远离0,其样本均值也应当远离0。
4
案例
某工厂用自动打包机打包,每包标准质 量为100KG。为了保证生产的正常运行 ,每天开工前需要先行试机,检查打包 机是否有系统偏差,以及时进行调整。 某日开工后在试机中共打了9个包,测 得9包的质量(KG)为:
99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5
这样通过检验该差值总体均值是否为0 ,就可以得知两种处理是否有差异
13
相应假设如下:
H0: μd=0 , 两种处理没有差别 H0: μd≠0,两种处理存在差别
14
CASE: 高血压的治疗
用某种药治疗10名高血压病人,对每一 病人治疗前、后舒张压(mmHg)进行了 测量,问该药有无降压作用
配对 1 2 3 4 5 6 7 号
新药 4.4 5 组
5.8 4.6 4.9 4.8 6
安慰 6.2 5.2 5.5 5
剂组
4.4 5.4 5
8 9 10
5.9 4.3 5.1
6.4 5.8 6.2
16
2 单因子方差分析
前面所提到有关统计推断的方法,如单样本 、两样本 t检验等,其所涉及的对象千变万 化,但归根结底都可视为两组间的比较,如 果有一组的总体均值已知,则为单样本 t 检 验,如果两组都只有样本信息,则为两样本t 检验。但是遇到以下情形,该如何处理?
现希望做出判断,明确打包机是否需要 进行调整
5
1.1样本均值与总体均值的比较
本研究的目的就是为了推断实际上该样 本所载总体的均数是否等于这一已知总 体均数(100KG)
这是一个样本均数与总体均数的比较问 题
6
单个样本均数检验问题是一种关于总体 均数的假设检验问题。
这种问题只有一个随机抽取的样本,研 究目的是推断这个样本相应的总体是否 等于(或大于,或小于)某个已知总体 均数。
病1
2
3
4
例
治 120 127 141 107 疗 前
治 123 108 120 107 疗 后
5
6
7
110 114 115
100 98 102
8
9
10
138 127 122
152 104 107
15
实验任务1
为研究女性服用某避孕药后是否影响其血 清总胆固醇,将20名女性按年龄配成10对 。每对中随机抽取一人服用新药,另一人 服用安慰剂。经过一定时间后,测得血清 总胆固醇含量(mmol/L),结果如表所 示。问该新药是否影响女性血清总胆固醇
18
多个均值比较时不宜采用t检验
R. A. Fisher爵士为后人奠定了方差分析 (Analysis of Variance,简写为ANOVA) 的理论基础:将总变异分解为由研究因 素所造成的部分和由抽样误差所造成的 部分,通过比较来自于不同部分的变异 ,借助F分布做出统计推断。
市场调查与预测
12 方差和协方差分析
雷超 leichaohotmail 广东药学院医药商学院
1
上次课程回顾—频数分布、列联 表和假设检验
1. 频数分布 2. 与频数分布有关的统计量 3. 假设检验介绍 4. 假设检验的一般步骤 5. 列联表 6. 与列联表有关的统计量 7. 参数/非参数检验
2
本章内容—方差和协方差分析