应用统计方法课件 4-2
常用统计方法培训课件(PPT 39页)
目前人们在描述统计方法时,都将以上 3 种方法列入,统称为统计方 法。
在生产现场,描述性方法和思考性方法应用频率特别高,许
多生产中的问题均可以通过简单的描述性方法和思考性方法配合使用 ,分析问题,寻找真因,然后应用固有专业技术解决问题,实现持续 改进。
值得注意的是统计技术是一种管理技术,可以帮助你发现问题、发现 变异和寻找事物发展的规律,但并不能帮你解决问题,解决问题要依 靠固有专业技术去实现!
常用统计方法培训
绍兴信佳密封制品有限公司 技术开发部&品管部 张伟波
1
培训提纲
一、统计学应用介绍 二、常用统计图表制作及应用 1、箱线图 2、柏拉图 3、直方图 4、散布图 5、雷达图 6、折线趋势图、柱状图、饼图 7、过程能力分析 8、统计过程控制图
2
培训目标
• 学习常用统计方法的应用 • 学习使用EXCEL和Minitab制作统计图表 • 更方便的进行日常工作和提高工作质量,进
9
一、箱线图
箱线图是利用数据中的五个统计量(最小值(MIN)、上四分位
数(Q1)、中位数(Q2)、下四分位数(Q3)、最大值(MAX))以及异常 值来描述这批数据分布轮廓的一种图示方法,可以从中粗略地看出数 据是否具有对称性,分布的分散程度等信息。
LG-181403 B
3.0
2.5
散布层厚度/mm
15
二、柏拉图 柏拉图又称为排列图,由此图的发明者19世纪意大利经济学
家柏拉图(Pareto)的名字而得名。柏拉图最早用排列图分析社会财 富分布的状况,他发现当时意大利80%财富集中在20%的人手里,后 来人们发现很多场合都服从这一规律,于是称之为Pareto定律,也被
称为“二八原则”,主要用途是找出“重要的少数”。
4-2专题四_第二讲_遗传的基本规律和伴性遗传_课件_Hooker
高频考点·命题示例
2.汇总遗传基本定律的验证方法 (1)自交法
第2讲
①自交后代的分离比为 3∶1 ,则符合基因的分离定律。
本 讲 栏 目 开 关
②若 F1 自交后代的分离比为 9∶3∶3∶1 ,则符合基因的自 由组合定律。 (2)测交法 ①若测交后代的性状比例为 1∶1 , 则符合基因的分离定律。 ②若测交后代的性状比例为 1∶1∶1∶1 , 则符合基因的自 由组合定律。
解析 由 9∶6∶1 比例可推出:扁盘状、圆形、长形南瓜分 别为双显性、单显性、双隐性。对单显性个体测交,后代无 双显性个体,圆形与长形比为 2∶1。
高频考点·命题示例
第2讲
必考点 1 遗传基本规律技巧总结 1.巧辨相对性状的显、隐性
本 讲 栏 目 开 关
(1)据子代性状判断 ①不同性状亲本杂交→后代只出现一种性状→ 显性 性状 ②相同性状亲本杂交→后代出现不同于亲本的性状→ 隐
解析
Aabb 和 AAbb 两种类型个体自由交配,交配类型有
四种,1/2Aabb 和 1/2Aabb;1/2Aabb 和 1/2AAbb;1/2AAbb 和 1/2Aabb ; 1/2AAbb 和 1/2AAbb 。 后 代 纯 合 体 为 : 1/4× (1/2×1/2)+1/4×1/2+1/4×1/2+1/4=5/8。 2×
本 讲 栏 目 开 关
型分别为①AATTdd、②AAttDD、③AAttdd、④aattdd。 下列说法正确的是 ③杂交 B.若采用花粉鉴定法验证基因的自由组合定律,可以选择亲 本①和②、①和④杂交 C.若培育糯性抗病优良品种,应选择亲本①和④杂交 D.将②和④杂交所得的 F1 的花粉直接于显微镜下观察,预 期结果有四种,比例为 1∶1∶1∶1 ( ) A.若采用花粉鉴定法验证基因的分离定律, 应选择亲本①和
应用统计学PPT课件
二项分布的应用
在统计学中广泛应用于计数数据,如成功率、故障率等。
二项分布
描述n次独立、相同、成功概率为p的伯努利试验的总成功次数的概率分布。
二项分布
正态分布曲线
呈钟形,对称分布于均值μ处,曲线下的面积为1。
数据质量评估
01
02
03
数据收集
数据清洗
对数据进行清洗,处理缺失值、异常值、错误值等问题,确保数据质量。
数据转换
对数据进行必要的转换,以满足统计分析的要求,如变量编码、类别转换等。
数据可视化
将数据以图表、图像等形式进行展示,帮助人们更好地理解数据和发现数据中的规律。
数据整理与展示
03
预测性分析
利用历史数据和算法模型对未来趋势进行预测,如时间序列分析、机器学习模型等。
实验设计
04
CHAPTER
统计学的基本概念
统计学中研究的全部数据,代表某一特定群体的所有个体。
总体
从总体中选取的一部分数据,用于推断总体的特征和规律。
样本
总体与样本
描述总体特性的数值,通常由总体数据计算得出。
描述样本特性的数值,通常由样本数据计算得出。
参数与统计量
统计量
参数
定量数据
可以量化的数据,如年龄、身高、体重等。
金融统计分析
对不同产业的经营数据进行分析,以评估产业发展和竞争态势,为企业决策提供依据。
产业统计分析
经济学
社会调查统计
通过问卷调查、访谈等方式收集数据,并运用统计分析方法研究社会现象和问题。
人口统计学
统计学完整ppt课件完整版
假设检验中的两类错误:第一类错误 、第二类错误
假设检验的步骤:建立假设、选择检 验统计量、确定拒绝域、计算p值、 作出决策
假设检验的实例分析:单样本t检验 、双样本t检验等
方差分析(ANOVA)方法介绍
方差分析的基本原理:F分布与 方差分析的关系
多因素方差分析的实现方法: 析因设计、随机区组设计等
通过观察数据的峰度,判 断是否存在尖峰或平峰分 布
03
推论性统计方法
参数估计原理及应用
01
参数估计的基本概念: 点估计、区间估计
02
估计量的评价标准:无 偏性、有效性、一致性
03
参数估计的方法:矩估 计法、最大似然估计法
04
参数估计的应用:总体 均值的区间估计、总体 比例的区间估计等
假设检验流程与实例分析
ABCD
数据筛选与排序
介绍如何使用Excel进行数据筛选和排序,以便 更好地查看和分析数据。
函数与公式应用
分享一些常用的Excel函数和公式,以便更高效 地处理和分析数据。
案例分享:使用统计软件解决实际问题
案例一
使用SPSS进行市场调研数据分析,包 括描述性统计、交叉表分析、回归分析
等。
案例三
使用Python进行电商数据分析,包 括用户行为分析、销售预测、推荐系
据的科学。
统计学的作用
描述数据特征
推断总体参数 预测未来趋势
评估决策效果
数据类型与来源
数据类型 定量数据(连续型与离散型)
定性数据(分类数据与顺序数据)
数据类型与来源
01
数据来源
02
03
04
观察数据(实验数据与观测数 据)
第四章 统计整理 《应用统计学——以Excel为分析工具》PPT课件
• (2)递减排序:可表示为: x(1)>x(2)>…>x(n)。
• 无论是定性数据还是定量数据,其排序均 可借助EXCEL完成。下面通过实例说明 EXCEL2007中进行数据排序的操作。
• 编制好的统计台账和加工整理后的统计资料,必须 妥善保管,不得损坏和遗失。
• 以上五个方面是相互衔接的,其中,统计分组是统 计整理的基础,统计汇总是统计整理的中心内容, 统计表和统计图是统计整理结果的表现形式。
第二节 统计调查资料的预处理
• 统 计 调 查 资 料 的 预 处 理 (Statistical data pretreatment) 是 数 据 分 组 整 理 的 先 前 步 骤 ,内容包括调查数据的审核与插补、筛选 (第三章已经介绍)、排序、分类汇总等 过程
一、统计分组的含义
• 统计分组是根据统计研究的目的和任务要 求,按照统计分组标志将总体划分成性质 不同的若干个部分或组别,使组和组之间 具有差异性,而同一组内具有同质性。
二、统计分组的作用
• 1、区分事物的性质 • 如企业按照经济性质分组,分为国有经济、集体
经济、私营经济、个体经济、外商投资经济、港 澳台经济。 • 2、研究事物内部结构 • 如将国民生产总值按照三次产业划分,计算出各 个产业所占比重,以便研究内部结构是否合理。 • 3、研究现象之间的关系 • 在统计分作的基础上,研究现象和现象之间的相 互依存关系。如施肥量和亩产量之间的关系;商 业企业规模和商品流通费用率之间的关系等。
三、统计调查资料的分类汇总
• 在对数据进行预处理时,有时需要对某些 字段按条件进行汇总,称为数据的分类汇 总。如果只是针对一个字段进行分类汇总 ,称为单字段分类汇总;如果同时对两个 及两个以上字段进行分类汇总称为多字段 分类汇总。
《SPSS统计分析方法及应用》第四章--基本统计分析课件
学习交流PPT
17
(4)均值标准误差(Standard Error of Mean):描述 样本均值与总体均值之间的平均差异程度的统计量。 其计算公式为:
S.E.of .Mean ( x X )2 n
按Variables框中的排列顺 序输出
按各变量的字母顺序输出 按均值的升序排列 按均值的降序排列
Options 对话框
学习交流PPT
28
在上面窗口中,用户可以指定分析多变量时结 果输出的次序(Display Order)。其中,Variable list表示按变量在数据窗口中从左到右的次序输出; Alphabetic表示按字母顺序输出;Ascending Means 表示按均值升序输出;Descending Means表示按均 值降序输出。
至此,SPSS便自动计算所选变量的基本描述统 计量并显示到输出窗口中。
学习交流PPT
29
• 5.2.3 计算基本描述统计量的应用举例
1. 利用商品房购买意向的调查数据,对月住 房开销变量计算基本描述统计量。
有以下分析目标:计算月住房开销的基本描述 统计量,并分别对不同居住类型进行比较分析: 首先按居住类型对数据进行拆分(Split file), 然后计算月住房开销的基本描述统计量。
学习交流PPT
19
常见的刻画离散程度的描述统计量如下:
(1)全距(Range):也称极差,是数据的最大值 (Maximum)与最小值(Minimum)之间的绝对离差。
(2)方差(Variance):也是表示变量取值距均值的离 散程度的统计量,是各变量值与算数平均数离差平方 的算术平均数。其计算公式为:
《应用统计学》PPT课件
3.统计学与其他学科的关系
➢与数学的关系
以数学为基础,但不同于数学
数学:抽象 无量纲 演绎为主
统计学:具体 有量纲 归纳与演绎
➢与专业课程的关系
是专业课程的工具,通过使用可以帮助我们发现研究领域 所存在的规律,进一步结合专业知识对它进行阐释可以形 成新的理论
统计工作不是把数字随便填到几个格格里去,而应 当是用数字来说明所研究的现象在实际生活中已经 充分呈现出来和正在呈现出来的各种社会类型。
总结:统计学——数据的科学 设置科学的指标 获取真实的数据 运用科学的分析方法
第二章 统计数据的描述
学习内容
• 统计数据的来源 • 统计数据的整理 • 分布集中趋势的测度 • 分布离散程度的测度 • 统计图与统计表
学习目标
了解统计数据的来源和数据的质量要求 掌握数值型数据的整理方法 掌握数据集中趋势和离散程度的测度方
2. 标志和指标
标志: (变量) 说明总体单位属性和特征的名称
品质标志:总体单位质的特征 数量标志:总体单位量的特征 姓名 性别 年龄 学历 工龄 收入 王小二 男 56 研究生 28 30万
标志名称 标志值
企业名称 所属行业 员工人数 年销售额
指标:综合反应总体数量特征的概念和数值 具有可量性和综合性
极限定理等)
反映客观现象 的数据
样本数据 总体数据
描述统计
(统计数据的搜集、整理、 显示和分析等)
推断统计
(利用样本信息和概率论对 总体的数量特征进行估计和
检验等)
总体内在的数 量规律性
2.应用领域 理论统计学与应用统计学
➢ 理论统计 研究统计学的一般理论 研究统计方法的数学原理
➢ 应用统计 研究统计学在各领域的具体应用 国民经济统计学,人口统计学,管理统计学
常用统计量及其应用课件
应用
在科学、工程、医学等领 域广泛使用,例如在产品 质量检测、医学诊断等方 面。
方差分析
定义
方差分析是一种统计方法,用于 比较两个或多个样本均值是否存
在显著差异。
方法
通过计算方差,将样本均值与总体 均值的差异分解为可解释部分和不 可解释部分,从而判断不同样本之 间是否存在显著差异。
应用
在工业、农业、社会科学等领域都 有广泛的应用,例如在生产过程控 制、市场调研等方面。
极差是描述一组数据离散程度 的另一个常用统计量,是最大 值与最小值的差。
优点:计算简单,直观易懂。
缺点:不能反映数据的整体分 布情况,容易受到极端值的影响。
03
推论性统计量
假设检验
01
02
03
定义
假设检验是统计推断的重 要组成部分,通过样本数 据对总体参数进行推断。
方法
根据样本数据做出假设, 然后利用适当的统计量进 行检验,根据检验结果判 断原假设是否合理。
缺点:不适用于所有数据分布,有些 数据分布可能没有标准差。
方差
方差是描述一组数据离散程度的另一个常用统计量,是 标准差的平方。
优点:能够反映数据的波动情况,计算简单。
计算方法:先求出每个数据与平均数的差值,然后平方 这些差值,最后求平均数。
缺点:不适用于所有数据分布,有些数据分布可能没有 方差。
极差
统计量的意义
统计量的意义在于它能够帮助我们更 好地理解数据,掌握数据的分布特征 和规律,为决策提供科学依据。
通过统计量,我们可以对数据样本进 行比较和分析,从而得出有关总体分 布的结论,为进一步研究和应用提供 支持。
统计量的分类
常用统计量包括平均数、中位数、众数、方差、标准差、四 分位数等。
应用统计学课件第四章回归分析
X ki
X 1i X
X
2 ki
ki
ˆ0 ˆ1
ˆ k
1 X 11
X k1
1 X 12
X k2
1 Y1 X 1n Y2 X kn Yn
(XX)βˆ XY
条件?
βˆ (XX)1 XY
点估计
•
OLS估计的矩阵表示
Q
n
ei2
ee (Y Xβˆ )(Y Xβˆ )
例:二元回归模型的参数估计
ˆ1 (
yi x1i )( x2i ) ( yi x2i )( x1i x2i ) ( x12i )( x22i ) ( x1i x2i )2
Var(ˆ1)
2
x12i (1 r122 )
1的OLS估计量的标准误为:Se(ˆ1) Var(ˆ1) 1的置信区间:
样本回归函数(SRF)
Yˆi ˆ0 ˆ1 X1i ˆ2 X 2i ˆki X ki
Yi ˆ0 ˆ1 X1i ˆ2 X 2i ˆki X ki ei
ei称为残差或剩余项(residuals),可看成是总体
回归函数中随机扰动项i的近似替代。
• 样本回归函数的矩阵表达:
Yˆ Xβˆ
一个身高60的妇女体重平均111.5,最大偏差12
猜体重平均值,最大偏差:31
160
155
150 总变异 (wi w)2 4606.8
140
130
体重均值123.6
120
POUN
110
体 重 100
93
90
56
58
60
62
64
66
68
70
身高INCH
POUN
160身高相同的人体重 不一定相同
湘教版高中同步学案数学选择性必修第二册精品课件 第4章 统计 4.2.2 一元线性回归模型的应用
,回归方程 = + t 中
=1
^
解 (1)由折线图看出,y 与 t 之间存在较强的正相关关系,理由如下:
7
7
=1
i=1
7
∵ ∑ yi=9.32, ∑ tiyi=40.17,
∑ ( -) =0.55, =
=1
7
∴r=
=
i=1
2 7
2
∑ ( -) ∑ (y i -y)
i=1
城市
1
2
3
4
5
A指标数x
4
6
2
8
5
B指标数y
4
4
3
5
4
经计算得
5
2
∑ ( -) =2 5,
=1
5
2
∑ ( -) = 2.
i=1
(1)试求y与x间的相关系数r,并利用r说明y与x是否具有较强的线性相关关
系(若|r|>0.8,则线性相关程度很高,可用线性回归模型拟合);
(2)建立y关于x的回归方程,并预测当A指标数x为7时,B指标数y的估计值.
成本y与生产的产品数量x的回归方程模型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程.
(3)试估计生产该产品1万件时,每件产品的非原料成本为多少元?
1
参考数据:ui= .
8
2
∑ uiyi
u
u
183.4
0.34
0.115
i=1
8
∑
i=1
1.53
u2i
8
0.61
(3)当 x=10
100
时,=11+ =21,
统计设计-应用统计学-课件完整版本
一、统计表的意义和构成
(一)统计表的意义 统计表是以纵横交叉的线条所绘制的表格
来表现统计资料的一种形式。广义的统 计表包括统计活动各个阶段中所用的一 些表格,在搜集资料、整理资料、积累 资料和分析资料时都要用到。
2 - 31
统计表是表现统计资料最常用的形式,其 显著优点是:
1、能使统计资料的排列条理化、系统化、 标准化,一目了然;
一般来说,统计表的主题栏列在横行标题 的位置,叙述栏列在纵栏标题的位置, 但有时为了合理安排或阅读方便,也可 以互换位置。
2 - 37
统计表的种类
(一)统计表按用途分为调查表、汇总表和分 析表
1、调查表 是指在统计调查中用于登记、搜集原
始统计资料的表格。调查表只记录调查 单位的特征,不能综合反映统计总体的 数量特征。
指标数值列在各横行标题和各纵栏标题的交叉处 ,具体反映其数字状况。
此外,有些统计表还增列补充资料、注解、资料 2 - 36来源、填表时间、填表单位等表脚。
统计表的基本结构
从内容上看,统计表由主体栏和叙述栏两 部分组成,主体栏是反映统计表所要说 明的单位、总体及其分组;叙述栏则是 说明主题栏的各种统计指标。
2、能科学的、合理地组织统计资料,便于 阅读、对照、比较和分析。
2 - 32
统计表的构成
从形式上看,统计表主要有总标题、横行 标题、纵栏标题和指标数值四部分组成 。(参看书上的统计表)
总标题是统计表的名称,一般位于表的上 端中央。用来概括说明统计表所反映的 统计资料的内容。
2 - 33
统计表的结构
意义(1)只有通过统计设计才能保证 统计工作协调、统一、顺利地进行 ,避免统计标准不统一;(2)只有 通过设计才能按需要与可能,分清 主次,采取各种统计方法,避免重 复和遗漏。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
补充:某厂有三条生产线,从三条生产线生产的纤维中分别抽取了一些样品,测得纤维强度数据见表4-6,试考察它们生产的纤维在强度上是否有显著差异?表4-6自动生产线纤维强度甲乙丙7.0 7.4 6.1 6.5 7.55.56.77.2 5.86.77.28.2 7.3 7.5 6.9分析:由于从三条生产线中抽取的样品个数不同,即相当不同水平所做重复试验次数r不相等,因此需对例4-1中使用的公式进行适当的修正。
解:令1235,4,6r r r ===,由表4-6的数据可以算出:T ⋅⋅=∑∑==k i r j ijiy 11=103.5S 总2=22111ir kijki j ii Tyr⋅⋅===-∑∑∑2322111721.21103.57.0654615ir iji j T y ⋅⋅===-=-⨯=++∑∑T y j j 1115345⋅===∑. T y j j 2214252⋅===∑. ∑=⋅==61338.43j jy T22211ki ki iii T T Sr r⋅⋅⋅===-∑∑组间=++-=345525244386103515242222.....∑∑==-=k i r j i ijiy y S 1122)(误=S 总2-S 组间2=7.06-2.4=4.66F S k S n k =--组间误221/()/()=24246612..≈3.09将上述计算结果列入方差分析表方差分析表方差来源 平方和 自由度 平均平方和 F 值 因素(组间) 2.4 3-1 1.2 3.09 误差(组内) 4.66 15-3 0.3883 总 和 7.06 15-1对给定水平α=0.05,由P F {}.>=λ005查F ()212,分布表得λ=3.89。
显然F <λ,所以不能认为三条生产线生产的纤维在强度上有显著差异。
2§4.2 多因素方差分析Variance analysis of multiple factor 建立模型参数估计统计检验一.建立模型设A 、B 为两个因子,A 有k 个水平1A ,2A ,k A , ,B 有r 个水平r B B B ,,, 21,两个因子共有kr 个水平组合j i B A (k i ,,3,2,1 =;r j ,,3,2,1 =)。
设对每一个水平组合j i B A 做了n 次试验(这里只讨论每个水平组合所作试验次数相同的情形),试验结果为ijn ij ij y y y ,,,21 (k i ,,3,2,1 =;r j ,,3,2,1 =)。
假定对水平组合j i B A 试验结果的理论值为ij μ, 即ijl Ey =ij μ,则ijl y 可分解为modelingijl ij ijl y εμ+= k i ,,3,2,1 =;r j ,,3,2,1 =; n l ,,2,1 = (4-9)其中ijl ε为试验误差,它是一个随机变量。
ijl ε(k i ,,3,2,1 =;r j ,,3,2,1 =;n l ,,2,1 =)独立同分布)0(2σ,N 。
通常假定 为了反映因子A 、B 的水平变化对试验结果影响的大小,将ij μ再进行分解,记∑∑===ki rj ijkr 111μμ∑==rj ij i r 11μμ(k i ,,,21=) (4-10) ∑==ki ij j k v 11μ(r j ,,, 21=) (4-11)于是有=ij μ+μ+-)(μμi +-)(μj v )(μμμ+--j i ij v μ=ˆ++i α+j βijγ其中,i α=μμ-i ,j β=μ-j v ,ij γ=μμμ+--j i ij v ,不难验证:∑=k i i 1α=0, ∑==r j j 10β, ∑∑====k i rj ij ij 110γγ,两个因素方差分析的一般数学模型:⎪⎪⎩⎪⎪⎨⎧===⋅⋅==++++=∑∑∑∑====,,1,,1,,1),0( 0= 0= 0,2111r 1j n l r j k i dN i i y ijl k i k i r j ij ij j i ijl ij j i ijl ;;,,,,σεγγβαεγβαμ(4-12) 需要解决如下问题:(1)估计未知参数μ,i α,j β,ijγ(n l r j k i ,,1,,1,,1 ===;;);(2)考察因子A 和因子B 的水平变化对试验结果的影响有无显著差异,以及因子A 和因子B 有无交互作用,归结为下述三个假设检验:需要解决如下问题:(1)估计未知参数μ,i α,j β,ij γ(n l r j k i ,,1,,1,,1 ===;;);(2)考察因子A 和因子B 的水平变化对试验结果的影响有无显著差异,以及因子A 和因子B 有无交互作用,归结为下述三个假设检验: 02101====k H ααα :; 02110====r H βββ :;:11H ij γ=0,r j k i ,,1,,1 ==;。
二.参数估计记∑∑∑====k i r j ijlnl y nkr y 1111∑∑==⋅=r j ijlnl i y nr y 111∑∑==⋅=k i ijlnl j y nk y 111∑==nl ijlij y n y 11完全类似于单因素方差分析,得未知参数μ,i α,j β,ij γ的矩估计为y =μˆ,y y i i -=⋅αˆ,y y j j -=⋅βˆ y y y y j i ij ij +--=⋅⋅γˆ,r j k i ,,2,1,,2,1 ==; (4-13)易证它们分别是μ,i α,j β,ij γ的无偏估计。
Parameter estimate三.统计检验=2总S ∑∑∑===-k i r j ijl nl y y 1121)(∑∑∑==⋅⋅=+--+-=k i r j j i ij ij ijl nl y y y y y y 111)()[(2)]()(y y y y j i -+-+⋅⋅∑∑∑===+-=ki r j ij ijl nl y y 1121)(∑∑∑==⋅=-ki r j i nl y y 1121)(∑∑∑==⋅=+-+ki rj j nl y y 1121)(0)(1121++--∑∑∑==⋅⋅=ki r j j i ij nl y y y y 22ˆA S S +=误2BS +2ABS +(4-14)Statistical tests其中,交叉项全为零,例如∑∑∑==⋅=--k irjiijijlnlyyyy111))((∑∑∑===⋅--=kirjijijlnliyyyy111)()())((1=--=∑=⋅⋅⋅kiiiiynrynryy2误S=∑∑∑===-kirjijijlnlyy1121)((4-15)2AS=∑∑∑==⋅=-kirjinlyy1121)(=∑=⋅-kiiyyrn12)((4-16)2BS=∑∑∑==⋅=-kirjjnlyy1121)(=∑=⋅-rjjyykn12)((4-17)2ABS=∑∑∑==⋅⋅=+--kirjjiijnlyyyy1121)(2ABS =∑∑∑==⋅⋅=+--k i r j j i ij nl y y y y 1121)( =∑∑==⋅⋅+--k i rj j i ij y y y y n 112)( (4-18)类似于单因素方差分析,22A S S 、误2B S 、2AB S 、的相对大小分别反映了因子A 和因子B 的水平单独以及联合对试验结果的影响大小。
可以证明 当02101====k H ααα :成立时 ))1(1(~)1(/)1/(221----=n kr k F n kr S k S F A ,误 (4-19)当02110====r H βββ :成立时))1(1(~)1(/)1/(222----=n kr r F n kr S r S F B ,误 (4-20) 当:11H ij γ=0,r j k i ,,1,,1 ==;成立时 ))1()1)(1((~)1(/)1)(1/(223------=n kr r k F n kr S r k S F AB,误(4-21)因此可利用上述三个统计量对假设111001H H H 、、进行F 检验。
若以因子f 表示相应于2因子S 的因子的自由度,上述三个统计量可统一写成)1(//22-=n kr S f S F 误因子因子表4-7 方差分析表方差来源平方和 自由度 平均平方和 F 值因素A 2A S 1-k2A S /(1-k) )1(/)1/(221--=n kr S k S F A 误 因素B 2B S 1-r 2B S /(1-r) )1(/)1/(222--=n kr S r S F B 误 B A ⨯ 2AB S )1()1(-⨯-r k )1)(1(2--r k S ABF S k r S kr n AB 322111=---/()()/()误误差 2误S )1(-n kr 2误S /(1)kr n -总和 2总S 1-krn=2总S ∑∑∑===-k i r j ijl nl y y 1121)(∑∑∑==⋅⋅⋅=-=k i r j ijlnl krnT y 112212A S =∑∑∑==⋅=-k i r j i nl y y 1121)(=∑=⋅-ki i y y rn 12)(=krn T T rn k i i 2121⋅⋅⋅=⋅⋅-∑2B S =∑∑∑==⋅=-k i r j j n l y y 1121)(=∑=⋅-r j j y y kn 12)(=krn T T kn r j j 2121⋅⋅⋅=⋅⋅-∑2ABS ∑∑∑==⋅⋅=+--=k i r j j i ij nl y y y y 1121)(∑∑==⋅⋅⋅⋅---=ki rj B A ij S S krnT T n 1122221 2误S =∑∑∑===-ki r j ij ijl nl y y 1121)(=2总S 222AB BAS S S --- =⋅⋅⋅T ∑∑∑===k i r j ijl nl y 111,∑=⋅=nl ijlij y T 1∑∑==⋅⋅=nl ijlrj i y T 11∑∑==⋅⋅=k i ijlnl j y T 11rj k i ,,1,,1 ==;例4-2 考虑合成纤维弹性,影响因素为收缩率A和拉伸倍数B,BA、各有四个水平,每个水平分别作了两次试验,相应的试验结果见表4-8表4-8试验因子结果A A1A2A3A4因子B0 4 8 12 B460 71 73 73 75 76 73 75 731B520 72 73 76 74 79 77 73 72 2B580 75 73 78 77 74 75 70 71 3640 77 75 74 74 74 73 69 69 B4解:由题意知 ,,,244===n r k 又由表4-8得 =2总S ∑∑∑==⋅⋅⋅=-k i r j ijlnl krnT y 112212A S =krnT T rn k i i 2121⋅⋅⋅=⋅⋅-∑ 2B S =krnT T kn r j j 2121⋅⋅⋅=⋅⋅-∑ 2AB S =∑∑==⋅⋅⋅⋅---k i r j BA ij S S krnT T n 11222215891=⋅⋅T ,6012=⋅⋅T ,6013=⋅⋅T ,5724=⋅⋅T ,5891=⋅⋅T ,5962=⋅⋅T ,5933=⋅⋅T ,5854=⋅⋅T ,=⋅⋅⋅T 2363,⋅ij T 见表4-8中两数之和。