数理统计(研究生课程):第四章方差分析
第四章方差分析
第四章⽅差分析第四章⽅差分析⼀、填空题1、⽅差分析就是通过对实验数据进⾏分析,检验⽅差时,各正态总体的是否相等,以判断各因素对试验指标的影响是否相等。
2、单因素⽅差分析的数学模型为。
3、在单因素⽅差分析中,总偏差平⽅和分解公式为。
4、对于具有s 个⽔平的单因素A 实验⽅差分析(⽔平i A 对应的总体为),(2σµi N (i =1,2,…,s ),现取样,设各⽔平下的样本容量之和为n ,以T e A S S S ,,分别表⽰因素A 的效应平⽅和、误差平⽅和、总偏差平⽅和,则(1)T e A S S S ,,之间的关系是___________;(2)在s µµ==...1成⽴的条下,~)/()1/(s n S s S E A --___________;(3)在显著性⽔平α下,假设“s H µµ==...:10,s H µµ,...,:11不全相等”的拒绝域形式是_________4、⽅差分析的⽬的是_______ .解:推断各因素对试验结果影响是否显著.5、在⼀个单因⼦试验中,因⼦A 有4个⽔平,每个⽔平下重复次数分别为:5,7,6,8 那么误差平⽅和的⾃由度,因⼦A 的平⽅和的⾃由度为。
6、单因素试验⽅差分析的数学模型含有的三个基本假定是_______ . 解:正态性、⽅差齐性、独⽴性.⼆、简述题1、简述⽅差分析解决什么问题。
2、单因素⽅差分析的数学模型是什么?3、单因素⽅差分析中的总偏差平⽅和分解公式是什么?4、单因素⽅差分析中,总偏差平⽅和、组间偏差平⽅和(因⼦平⽅和)、组内偏差平⽅和(误差平⽅和)分别是由什么引起的?5、⽅差分析的检验⼀般⽤什么检验法?6、⽅差分析的⽬的及思想(结合单因素)。
三、单选题1、⽅差分析是⼀个()问题。
A 、假设检验B 、参数估计C 、随机试验D 、参数检验2、在⽅差分析中,()反映的是样本数据与其组平均值的差异 A 总离差 B 组间误差 C 组内误差 D A,B,C 全错3、∑∑==-si n j i ij iX X 112)(是()B 组间平⽅和C 总离差平⽅和 D4、单因素⽅差分析中,数据i ij n j r i X ,,2,1;,,2,1, ==可以看作是取⾃()。
单因素方差分析
2.0
0.7
1.5
0.9
0.9
0.8
1.1
-0.3
-0.2
0.7
1.3
1.4
概率论与数理统计
3
❖ 前言 方差分析的思想
➢ 我们可以计算出各组的均值与方差,但是如何通过这些数据 结果来判断呢?这就需要进行方差分析.
➢ 在实际问题中, 影响一个数值型随机变量的因素一般会有很多, 例如影响农作物产量的因素就有种子品种,肥料、雨水等; 影 响化工产品的产出率的因素可能有原料成分、剂量、催化剂 、反应温度、机器设备和操作水平等;影响儿童识记效果的 因素有教学材料、教学方法等. 为了找出影响结果(效果)最显 著的因素, 并指出它们在什么状态下对结果最有利, 就要先做 试验, 方差分析就是对试验数据进行统计分析, 鉴别各个因素 对对我们要考察的指标(试验指标)影响程度的方法.
概率论与数理统计
7
❖ 1.单因素试验的方差 概念
➢ 推断三种治疗方案是否存在差异的问题,就是要辨别治 疗方案的差异主要是由随机误差造成的,还是由不同方 案造成的,这一问题可归结为三个总体是否有相同分布 的讨论.根据实际问题的情况,可认为血红蛋白的增加 值服从正态分布,且在安排试验时,除所关心的因素( 这里指的是这里方案)外,其它试验条件总是尽可能做 到一致,这就使我们可以近似的认为每个总体的方差相 同,即xi~N(μi,σ2) i = 1,2,3.
概率论与数理统计
❖2. 单因素方差分析的数学模型
➢ 单因素方差分析问题的一般提法为: ➢ 因素A有m个水平A1, A2, …, Am, 在Ai水平下, 总体Xi~N(μi,
σ2), i = 1, 2, …, m.其中μi和σ2均未知, 但方差相等, 希望 对不同水平下总体的均值进行比较. 设xij表示第i个总体的第j个观测值(j = 1, 2, …, ni, i = 1, 2, …, m), 由于Xij~N(μi, σ2), i = 1, 2, …, m.单因素方差分 析模型常可表示为:
研究生课程数理统计习题及答案
研究生课程数理统计习题及答案数理统计习题答案 第一章1.解: ()()()()()()()12252112222219294103105106100511100519210094100103100105100106100534n i i n i i i i X x n S x x x n ===++++====-=-⎡⎤=-+-+-+-+-⎣⎦=∑∑∑2. 解:子样平均数 *11l i i i X m x n ==∑()118340610262604=⨯+⨯+⨯+⨯=子样方差 ()22*11l i i i S m x x n ==-∑()()()()222218144034106422646018.67⎡⎤=⨯-+⨯-+⨯-+⨯-⎣⎦=子样标准差4.32S ==3. 解:因为i i x ay c-=所以 i i x a cy =+11ni i x x n ==∑()1111ni i ni i a cy n na cy n ===+⎛⎫=+ ⎪⎝⎭∑∑1nii c a y n a c y==+=+∑ 所以 x a c y =+ 成立()2211n x i i s x x n ==-∑()()()22122111ni i ini i nii a cy a c y n cy c yn c y y n====+--=-=-∑∑∑因为 ()2211nyi i s y yn ==-∑ 所以222x ys c s = 成立()()()()()172181203.2147.211.2e n n e nM X X R X X M X X +⎛⎫ ⎪⎝⎭⎛⎫+ ⎪⎝⎭====-=--====4. 解:变换 2000i i y x =-11n i i y y n ==∑()61303103042420909185203109240.444=--++++-++= ()2211n y i i s y y n ==-∑()()()()()()()()()222222222161240.444303240.4441030240.4449424240.44420240.444909240.444185240.44420240.444310240.444197032.247=--+--+-+⎡⎣-+-+-+⎤--+-+-⎦=利用3题的结果可知2220002240.444197032.247x y x y s s =+===5. 解:变换 ()10080i i y x =-13111113n i i i i y y y n ====∑∑[]12424334353202132.00=-++++++-+++++=()2211nyi i s y y n ==-∑()()()()()()22222212 2.0032 2.005 2.0034 2.001333 2.003 2.005.3077=--+⨯-+-+⨯-⎡⎣⎤+⨯-+--⎦=利用3题的结果可知2248080.021005.30771010000yx yx s s -=+===⨯ 6. 解:变换()1027i i y x =-11li i i y m y n ==∑()13529312434101.5=-⨯-⨯+⨯+=-2710yx =+=26.85 ()2211lyi i i s m y y n ==-∑()()()()22221235 1.539 1.5412 1.534 1.510440.25⎤=⨯-++⨯-++⨯+++⎡⎣⎦= 221 4.4025100x y s s ==170 170174178*11li i i x m x n ==∑()1156101601416426172121682817681802100166=⨯+⨯+⨯+⨯+⨯+⨯+⨯=()22*11l i i i s m x x n ==-∑()()()()()()()2222222110156166141601662616416628168166100121721668176166218016633.44=⨯-+⨯-+⨯-+⨯-⎡⎣⎤+⨯-+⨯-+⨯-⎦= 8解:将子样值重新排列(由小到大)-4,-2.1,-2.1,-0.1,-0.1,0,0,1.2,1.2,2.01,2.22,3.2,3.21()()()()()172181203.2147.211.2e n n e nM X X R X X M X X +⎛⎫ ⎪⎝⎭⎛⎫+ ⎪⎝⎭====-=--====9解: 121211121211n n i ji j n x n x n n x n n ==+=+∑∑112212n x n xn n +=+()12221121n n ii s x x n n +==-+∑试写出子样的频数分布,再写出经验分布函数并作出其图形。
医学统计学--方差分析
笃学
精业
修德
6
厚生
2)组间变异
各处理组间的均数大小也不同,这种变异称 为组间变异。其大小可用组间均数与总均数的 离均差平方和表示:
k
SS组间 ni(xi x)2 i1
自由度 组间k1
笃学
精业
修德
7
厚生
3)组内变异 各处理组内部观察值也大小不等,这种变异称
为组内变异。其大小可用个体观察值与组均数的
பைடு நூலகம்i1 j1
i1 j1
k
k ni
ni(xi x)2
(xij xi)2
i1
i1 j1
ss组间ss组内
总 = N-1= (k-1)+(N-k) = 组间+组内
笃学
精业
修德
9
厚生
通过上述分解可以看出,方差分析的基本思想 就是根据资料的设计类型,将全部观测值的总 变异按影响结果的诸因素分解为相应的若干部 分变异,构造出反映各部分变异作用的统计量, 在此基础上,构建假设检验统计量,以实现对 总体参数的推断。
=0.05
(2) 计算检验统计量F值; (3) 查F界值表、确定P值并作出推断结果。
笃学
精业
修德
16
厚生
第二节 完全随机设计的方差分析
完全随机设计(completely random design) 不考虑个体差异的影响,仅涉及一个处理因素, 所以亦称单因素实验设计或单因素方差分析 (one-way ANOVA)。在实验研究中按随机化原 则将受试对象随机分配到一个处理因素的多个 水平中去,然后观察各组的试验效应;
笃学
精业
修德
11
厚生
F MS 组间 MS 组内
方差分析(共66张PPT)
18~岁 21.65 20.66
… … 18.82 16 22.07 8.97
30~岁 27.15 28.58
… … 23.93 16 25.94 8.11
45~60岁 20.28 22.88 … … 26.49 16 25.49 7.19
基本步骤
(1)建立假设,确定检验水准
H0:三个总体均数相等,即三组工作人员的 体重指数总体均数相等
单因素方差分析
例1 在肾缺血再灌注过程的研究中,将36只雄性大鼠随机等分成三组, 分别为正常对照组、肾缺血60分组和肾缺血60分再灌注组,测得 各个体的NO数据见数据文件,试问各组的NO平均水平是否相同?
单因素方差分析
分析:
对于单因素方差分析,其资料在SPSS中的数据结构应当由两 列数据构成,其中一列是观察指标的变量值,另一列是用以表 示分组变量。实际上,几乎所有的统计分析软件,包括SAS, STATA等,都要求方差分析采用这种数据输入形式,这一点也暗 示了方差分析与线性模型间千丝万缕的联系。
H1:三个总体均数不等或不全相等
(2)计算检验统计量F值
变异来源
SS 自由度(df)
MS
F
组间 组内 总变异
143.406 363.86 507.36
2
71.703
8.87
45
8.09
47
(3)确定p值,作出统计推断
,本次F值处于F界值之外,说明组间均方组内 均方比值属于小概率事件,因此拒绝H0,接受 H1,三个总体均数不等或不全相等
分凝血活酶时间有无不同?
方差分析步骤 :
(1)提出检验假设,确定检验水准
H0:μ1=μ2=μ3 H1:μ1,μ2,μ3不全相同 a=
方差(概率论与数理统计)
方差分析通过比较不同组数据的分散程度,判断不同因素对数据变 异的贡献程度,从而进行多因素比较。
方差分析的适用条件
进行方差分析前需要满足独立性、正态性和方差齐性等条件,以确 保分析结果的准确性和可靠性。
方差分析的步骤
包括建立假设、计算自由度、计算F值、进行显著性检验等步骤,最 终得出各因素对数据变异的贡献程度和显著性水平。
统计学推断
在统计学中,方差分析、回归分析和生存分析等方法都涉及到方差的 概念和应用。
质量控制
在生产过程中,方差分析可以用于检测产品质量的一致性和稳定性。
社会科学研究
在社会学、心理学和经济学等社会科学领域,方差分析常用于研究不 同组别之间的差异和变化。
02
方差的计算方法
离差平方和的分解
离差平方和是由数据点与平均值的偏差平方和组成的,即每个数据点与平 均值的差的平方的总和。
其中,n是数据点的数量,组内离差平方和是每个数据点 与其所属类别的平均值的偏差平方和的总和,组间离差平 方和是不同类别的平均值之间的偏差平方和。
方差的计算实例
首先计算每个数据点与平均值的偏差的平方: {0, 1, 2, 3, 4}。
最后,根据方差的计算公式,方差 = (5-1) / 5 * 30 + 1 / 5 * 0 = 24。
假设有一个数据集{1, 2, 3, 4, 5},其平均值为3。
然后求出偏差的平方的总和:0 + 1 + 4 + 9 + 16 = 30。
03
方差与其他统计量的关 系
方差与期望值的关系
方差是衡量数据离散程度的统计量,而期望值是数据的平均 水平。方差和期望值之间存在密切的关系,通常表示为方差 等于期望值的平方减去数据点的平方。
数理统计--参数估计、假设检验、方差分析(李志强) (3)讲解
教学单元案例: 参数估计与假设检验北京化工大学 李志强教学内容:统计量、抽样分布及其基本性质、点估计、区间估计、假设检验、方差分析 教学目的:统计概念及统计推断方法的引入和应用(1)理解总体、样本和统计量等基本概念;了解常用的抽样分布;(2)熟练掌握矩估计和极大似然估计等方法; (3)掌握求区间估计的基本方法; (4)掌握进行假设检验的基本方法; (5) 掌握进行方差分析的基本方法;(6)了解求区间估计、假设检验和方差分析的MA TLAB 命令。
教学难点:区间估计、假设检验、方差分析的性质和求法 教学时间:150分钟教学对象:大一各专业皆可用一、统计问题 引例例1 已知小麦亩产服从正态分布,传统小麦品种平均亩产800斤,现有新品种产量未知,试种10块,每块一亩,产量为:775,816,834,836,858,863,873,877,885,901问:新产品亩产是否超过了800斤?例2 设有一组来自正态总体),(2σμN 的样本0.497, 0.506, 0.518, 0.524, 0.488, 0.510, 0.510, 0.512. (i) 已知2σ=0.012,求μ的95%置信区间; (ii) 未知2σ,求μ的95%置信区间; (iii)求2σ的95%置信区间。
例3现有某型号的电池三批, 分别为甲乙丙3个厂生产的, 为评比其质量, 各随机抽取5只电池进行寿命测试, 数据如下表示, 这里假设第i 种电池的寿命),(.~2σμi i N X .(1) 试在检验水平下,检验电池的平均寿命有无显著差异? (2) 利用区间估计或假设检验比较哪个寿命最短.二 统计的基本概念: 总体、个体和样本(1)总体与样本总体 在数理统计中,我们将研究对象的某项数量指标的值的全体称为总体,总体中的每个元素称为个体比如,对电子元件我们主要关心的是其使用寿命.而该厂生产的所有电子元件的使用寿命取值的全体,就构成了研究对象的全体,即总体,显然它是一个随机变量,常用X 表示 为方便起见,今后我们把总体与随机变量X 等同起来看,即总体就是某随机变量X 可能取值的全体.它客观上存在一个分布,但我们对其分布一无所知,或部分未知,正因为如此,才有必要对总体进行研究.简单随机样本对总体进行研究,首先需要获取总体的有关信息. 一般采用两种方法:一是全面调查.如人口普查,该方法常要消耗大量的人力、物力、财力.有时甚至是不可能的,如测试某厂生产的所有电子元件的使用寿命. 二是抽样调查. 抽样调查是按照一定的方法,从总体X 中抽取n 个个体.这是我们对总体掌握的信息.数理统计就是要利用这一信息,对总体进行分析、估计、推断.因此,要求抽取的这n 个个体应具有很好的代表性.按机会均等的原则随机地从客观存在的总体中抽取一些个体进行观察或测试的过程称为随机抽样.从总体中抽出的部分个体,叫做总体的一个样本.从总体中抽取样本时,不仅要求每一个个体被抽到的机会均等,同时还要求每次的抽取是独立的,即每次抽样的结果不影响其他各次的抽样结果,同时也不受其他各次抽样结果的影响.这种抽样方法称为简单随机抽样.由简单随机抽样得到的样本叫做简单随机样本.往后如不作特别说明,提到“样本”总是指简单随机样本.从总体X 中抽取一个个体,就是对随机变量X 进行一次试验.抽取n 个个体就是对随机变量X 进行n 次试验,分别记为X1,X2,…,Xn.则样本就是n 维随机变量(X1,X2,…,Xn).在一次抽样以后, (X1,X2,…,Xn)就有了一组确定的值(x1,x2,…,xn),称为样本观测值.样本观测值(x1,x2,…,xn)可以看着一个随机试验的一个结果,它的一切可能结果的全体构成一个样本空间,称为子样空间.(2)样本函数与统计量设n x x x ,,,21 为总体的一个样本,称ϕϕ= (n x x x ,,,21 )为样本函数,其中ϕ为一个连续函数。
概率论与数理统计PPT课件第四章数学期望与方差
在回归分析中,数学期望和方差 等统计指标用于描述因变量和自 变量之间的关系,以及预测未来
的趋势。
假设检验
在假设检验中,数学期望和方差等 统计指标用于比较两组数据或样本 的差异,判断是否具有显著性。
方差分析
方差分析利用数学期望和方差等统 计指标,分析不同组别或处理之间 的差异,确定哪些因素对数据变化 有显著影响。
质量控制
统计分析
在统计分析中,方差分析是一种常用 的统计方法,通过比较不同组数据的 方差,可以判断它们是否存在显著差 异。
在生产过程中,方差用于度量产品质 量波动的程度,通过控制产品质量指 标的方差,可以提高产品质量稳定性。
03
期望与方差的关系
期望与方差的关系式
期望值是随机变量取值的平均数 ,表示随机变量的“中心趋势”
方差的性质
方差具有可加性
当两个随机变量相互独立时,它们组 合而成的随机变量的方差等于它们各 自方差的线性组合。
方差与期望值的关系
方差与期望值之间存在一定的关系, 如方差等于期望值减去偏差的平方和 再求平均值。
方差的应用
风险评估
在金融和经济学中,方差被用来度量 投资组合的风险,通过计算投资组合 中各个资产的方差和相关系数,可以 评估投资组合的整体风险。
期望与方差的拓展
期望与方差在金融中的应用
金融风险评估
利用数学期望和方差计算 金融资产的风险,评估投 资组合的风险和回报。
资产定价
利用数学期望和方差等统 计指标,对金融资产进行 定价,确定其内在价值。
保险精算
通过数学期望和方差等统 计方法,评估保险产品的 风险和回报,制定合理的 保费和赔付方案。
期望与方差在统计学中
期望与方差在其他领域的应用
第四章 方差检验
i 1 j 1
ij
各处理组均数为
X i X ij / ni
j 1
ni
总例数为N=nl+n2+…+ng, g为处理组数。
1.总变异 全部测量值大小不同,这种变异称 为总变异。 总变异的大小可以用离均差平方和(sum of squares of deviations from mean,SS)表示, 即各测量值Xij与总均数差值的平方和,记为SS 总。 总变异SS总反映了所有测量值之间总的变异程 度
g 个处理组的试验结果
处理分 组 1 水平 2 水平 … g 水平 测量值 统计量 … …
X 1n1 X 2n2
X11 X21 Xg1
…
X12 X22 Xg2
…
… … …
X1j X2j
…
n1 n2
…
X1 X2
S1 S2
…
… Xgj
……Leabharlann …X gngng
…
Xg
Sg
完全随机设计资料在进行统计分析时,需根据数 据的分布特征选择方法,对于正态分布且方差齐 同的资料,常采用完全随机设计的单因素方差分 析(one-way ANOVA)或成组资料的 t 检验( g=2); 对于非正态分布或方差不齐的资料,可进行数据 变换或采用Wilcoxon秩和检验。 g ni 记总均数为 X X /N
主要内容
第一节 方差分析的基本概念
第二节 完全随机设计的单因素方差分析
第三节 随机区组设计的两因素方差分析
第四节 多个样本均数间的多重比较
第一节 方差分析的基本概念
一、方差分析的几个名词 什么是方差? 离均差 离均差平方和SS 方差(2 S2 )均方(MS) 标准差:S 自由度: 关系: MS= SS/
西安交大研究生课程之应用数理统计作业
研究生教材《应用数理统计》——课后习题答案详解学号:3113312042姓名:齐以年班级:硕3079班目录第一章数理统计的基本概念 (1)第二章参数估计 (18)第三章假设检验 (36)第四章方差分析与正交试验设计 (46)第五章回归分析 (51)第六章统计决策与贝叶斯推断 (56)对应书目:《应用数理统计》施雨编著西安交通大学出版第一章 数理统计的基本概念1.1 解:∵ 2~(,)X N μσ∴ 2~(,)n X N σμ∴~(0,1)N 分布∴(1)0.95P X P μ-<=<=又∵ 查表可得0.025 1.96u = ∴ 221.96n σ=1.2 解:(1) ∵ ~(0.0015)X Exp∴ 每个元件至800个小时没有失效的概率为:8000.001501.2(800)1(800)10.0015x P X P X e dxe -->==-<=-=⎰∴ 6个元件都没失效的概率为: 1.267.2()P e e --==(2) ∵ ~(0.0015)X Exp∴ 每个元件至3000个小时失效的概率为:30000.001504.5(3000)0.00151x P X e dxe--<===-⎰∴ 6个元件没失效的概率为: 4.56(1)P e -=-1.3解:(1) X ={(x 1,x 2,x 3)|x k =0,1,2,…,k =1,2,3},p (x 1,x 2,x 3)=λx 1+x 2+x 3x 1!x 2!x 3!e −3λ,x k =0,1,2,…;k =1,2,3(2) X ={(x 1,x 2,x 3)|x k ≥0;k =1,2,3},f (x 1,x 2,x 3)=λ3e −λ(x 1+x 2+x 3), x k ≥0;k =1,2,3(3) X ={(x 1,x 2,x 3)|a ≤x k ≤b;k =1,2,3},f (x 1,x 2,x 3)=1(b−a)3, a ≤x k ≤b;k =1,2,3(4) X ={(x 1,x 2,x 3)|−∞<x k <+∞;k =1,2,3}=R 3,f (x 1,x 2,x 3)=1(2π)3/2e −12∑(x k −μ)23k=1,−∞<x k <+∞;k =1,2,31.4 解:ini n x n x ex x x P ni i 122)(ln 2121)2(),.....,(122=--∏∑==πσμσ1.5证:21122)(na a x n x a x n i ni i i +-=-∑∑==∑∑∑===-+-=+-+-=ni i ni i n i i a x n x x na a x n x x x x 1222211)()(2221.6证明 (1) ∵22112211221()()()2()()()()()nnii i i nni i i i ni i XX X X X X X X X n X X X n X μμμμμ=====-=-+-=-+--+-=-+-∑∑∑∑∑(2) ∵2221112221221()22ii i nn ni i i i i ni ni XX X X X nX X nX nX X nX =====-=-+=-+=-∑∑∑∑∑1.7证明:a) 证:)(11111+=+++=∑n n i i n x x n x)(11)(1111n n n n n x x n x x x n n -++=++=++b )证:221111()1nn n i i S x x n ++==-+∑ 221112211121111[()]11121[()()()()]11(1)n n n i n i nn n n n n i i n n i i x x x x n n n x x x x x x x x n n n +=++++===---+++=----+-+++∑∑∑221112112[()()((1))111() ]1n n n n n n n n n nS x x x x nx x n x n n x x n ++++=+---+-+++-+22n122n 11[nS ()] 111[S ()]11n n n n n x x n n n x x n n ++=+-++=+-++ 1.8证明:显然: Zm+n ̅̅̅̅̅̅̅=nX ̅+mY ̅m+nS Z2=1m +n[∑(X i −Z m+n ̅̅̅̅̅̅̅)2n i=1+∑(Y i −Z m+n ̅̅̅̅̅̅̅)2mi=1] =1m +n[∑X i 2ni=1−2Zm+n ̅̅̅̅̅̅̅∗nX ̅+∑Y i 2−2Z m+n ̅̅̅̅̅̅̅∗mY ̅+(m +n)mi=1Zm+n ̅̅̅̅̅̅̅2] 因为: nS X 2=∑X i 2n i=1−nX ̅2 nS Y 2=∑Y i 2n i=1−nY ̅2所以:S Z2=nS X2+nS Y2m+n+1m+n[nX̅2+nY̅2−(nX̅+mY̅)2m+n] =nS X2+nS Y2m+n+m∗n(n+m)2(X̅−Y̅)21.10解:(1).∑∑====niiniixEnxnEXE11)(1)1()(=1n∙n∙mp=mpnpmpxDnxnDXDniinii)1()(1)1()(121-===∑∑==))(1()(122∑=-=niixxnESE)1(1)])1(1())1(([1)])()(())()(([1])()([1])([12222212212212p mp nn p m p mp n n p m p mp n n x E x D n x E x D n x nE x E n x x E n n i i i n i i n i i --=+--+-=+-+=-=-=∑∑∑=== 同理,(2).λ===∑∑==ni i n i i x E n x n E X E 11)(1)1()(λnx D n x n D X D ni ini i 1)(1)1()(121===∑∑==λnn x E x D n x E x D n x nE x E n S E n i i i n i i 1)])()(())()(([1])()([1)(2122122-=+-+=-=∑∑==(3).2)(1)1()(11ba x E n x n E X E n i i n i i +===∑∑==na b x D nx n D X D ni in i i 12)()(1)1()(2121-===∑∑==12)(1)])()(())()(([1])()([1)(22122122a b n n x E x D n x E x D n x nE x E n S E ni i i n i i -⋅-=+-+=-=∑∑==(4).λ===∑∑==ni i n i i x E n x n E X E 11)(1)1()(nx D nx n D X D ni in i i 2121)(1)1()(λ===∑∑==221221221)])()(())()(([1])()([1)(λnn x E x D n x E x D n x nE x E n S E n i i i n i i -=+-+=-=∑∑==(5).μ===∑∑==ni i n i i x E n x n E X E 11)(1)1()(nx D nx n D X D ni in i i 2121)(1)1()(σ===∑∑==221221221)])()(())()(([1])()([1)(σ⋅-=+-+=-=∑∑==nn x E x D n x E x D n x nE x E n S E n i i i n i i1.11 解:由统计量的定义知,1,3,4,5,6,7为统计量,5为顺序统计量 1.12 解:顺序统计量:-4,-2.1,-2.1,-0.1,-0.1,0,0,1.2,1.2,2.01,2.22,3.2,3.21中位数Me=0 极差R=(3.21+4)=7.21 再抽一个样本2.7,则顺序统计量变为:-4,-2.1,-2.1,-0.1,-0.1,0,0,1.2,1.2,2.01,2.22,2.7,3.2,3.21 此时,样本中位数Me=(0+1.2)/2=0.61.13解: F 20x={ 0 , x <0620, 0≪x <11320, 1≪x <21620, 2≪x <31820, 3≪x <41 , x ≫41.14解:利用伽马分布的可加性 X~Γ(α,λ) 则Y =∑X i ~Γ(nα,λ)n i=1X ̅=Y nf Y (y )=λnαy nα−1Γ(nα)e −λy,y >0根据随机变量函数的概率密度公式得:f X ̅(x )=λnα(nx)nα−1Γ(nα)e −λnx∗n =λnαn nαx nα−1Γ(nα)e −λnx ,x >01.15解:运用顺序统计量的概率密度公式 (1) f (m)(x )=n!(m−1)!(n−m )![F (x )]m−1[1−F (x )]n−m f(x) 1≪m ≪n (2) f (k)(j)(x )=n!(k−1)!(j−k−1)!(n−j )![F (x )]k−1[F (y )−F (x )]j−k−1[1−F (y )]n−j f(x)f(y) 1≪k<j ≪n (3) 样本极差R =X (n)−X (1), 其中X (n)和X (1)的概率密度可由(1)得到,再根据函数关系可推出R 的概率密度函数 1.16解:X i −μσ~N(0,1)(X i −μσ)2~χ2(1)故:∑(X i −μσ)2~ni=1χ2(n )1.17 证:),(~ λαΓXx ex x f λαααλ--Γ=∴1)()( 令kXY =ke ky kke ky yf ky ky⋅Γ=⋅Γ=∴----λαααλαααλαλ11)()( )()()(即 ),(~ky Y αΓ1.18 证:),(~ b a X β),()1()( 11b a B x xx f b a ---=∴),(),( ),()1()( 11b a B b k a B b a B x x x X E b a k k +=-=∴⎰∞+∞---),(),1()( b a B b a B X E +=∴ba a ab a b a b a a a a b a b a a a b b a b a b a +=Γ+Γ++ΓΓ=Γ++Γ+Γ+Γ=ΓΓ+Γ⋅++ΓΓ+Γ=)()()()()()()1()()1()()()()1()()1(),(),2()(2b a B b a B X E +=))(1()1()()()()2()()2(b a b a a a a b b a b a b a ++++=ΓΓ+Γ⋅++ΓΓ+Γ= 22)]([)()( X E X E X D -=∴2))(1())(1()1(b a b a ab ba ab a b a a a +++=+-++++=1.19 解:∵ ~(,)X F n m 分布2212(1)022()((1))()(1)()()()(1)()()n n m n mn m yn m y n mn nP Y y P X X y m myP X y n n n x x dx m m m++--+≤=+≤=<-Γ=+ΓΓ⎰2222122221122()()()1()(1)()()11(1)(1)(,)n n m n m n mn m n mf y P Y y y y y y y yy B ++----'=≤Γ=+ΓΓ----=∴ 22(1)(,)n mn n Y X X m mβ=+分布1.20 解:∵ ~()X t n 分布122212()()(()2)n n P Y y P X y P X xdxn ++-≤=≤=≤≤Γ=+112211221212122()()()(1)()1()(1)()()()n n n n n f y P Y y y y n y y n n n+++--+--'=≤Γ=+Γ=+ΓΓ∴ 2~(1,)2nY X F =分布1.21 解: (1) ∵ ~(8,4)X N 分布∴ 4~(8,)25X N 分布,即5(8)~(0,1)2X N - ∴ 样本均值落在7.8~8.2分钟之间的概率为:5(7.88)5(8)5(8.28)(7.88.2)()2220.383X P X P ---≤≤=≤≤=(2) 样本均值落在7.5~8分钟之间的概率为:5(7.58)5(8)5(88)(7.58)()2225(8)(0 1.25)20.3944X P X P X P ---≤≤=≤≤-=≤≤=若取100个样品,样本均值落在7.5~8分钟之间的概率为:10(7.88)10(8)10(8.28)(7.88.2)()2222*(0.84130.5)0.6826X P X P ---≤≤=≤≤=-= 单个样品大于11分钟的概率为:P 1=1−0.9333=0.0667 25个样品的均值大于9分钟的概率为: P 2=1−0.9938=0.0062 100个样品的均值大于8.6分钟的概率为P 3=1−0.9987=0.0013 所以第一种情况更有可能发生1.22 解:μ=2.5 2σ=36 n=5 (1)44302<<s ⇔)955,625(22∈σns 而)1(~222-n ns χσ即 )4(36522χ∈s通过查表可得 P =0.1929(2)样本方差落在30~40的概率为0.1929 样品均值-x 落在1.3~3.5的概率即:P{1.3<-x <3.5} ⇔P{-0.4472<σμ)(--x n <0.3727}又σμ)(--x n ~N(0,1)查标准正态分布表可得:P{1.3<-x <3.5}=0.3179 由于样本均值与样本方差相互独立,故:这样两者同时成立的概率为P =0.1929⨯0.3179=0.06131.23 解:(1) ∵2~(0,)X N σ分布 ∴ 2~(0,)X N nσ分布∴ 22()~(1)nXχσ∵ 22221()()ni i a X an X an σσ===∑∴ 21a n σ=同理 21b m σ= (2) ∵ 2~(0,)X N σ分布 ∴222~(1)X χσ分布由2χ分布是可加性得:2221~()ni i X n χσ=∑()nic X t m ==∑ ∴c =(3) 由(2)可知2221~()ni i X n χσ=∑ 2221122211~(,)nni ii i n mn mi ii n i n X d Xnn dF n m XmXmσσ==++=+=+=∑∑∑∑∴ m d n =1.24证明:X n+1~N(μ,σ2) X̅~N(μ,σ2/n) X n+1−X ̅~N(0,n +1n σ2)X n+1−X̅√n +1nσ2~N(0,1)(n −1)S n∗2σ2~χ2(n −1) 所以:Y =X n+1−X ̅S n ∗√n n +1~t(n −1) 1.25 证明:∵ 211~(,)X N μσ分布∴2211()~(1)i X μχσ-∴ 1221111()~()n i i X n μχσ=-∑同理 2222212()~()n i i Y n μχσ=-∑ 1122222112211111222221122112()()~(,)()()n n i i i i n n i i i i X n n X F n n Y n Y n μσμσμσμσ====--=--∑∑∑∑第二章 参数估计2.1 (1) ∵ ~()X Exp λ分布∴ ()1E X λ=令 ˆ1X λ= 解得λ的矩估计为:ˆ1X λ= (2) ∵ (,)X U a b 分布∴ ()2a bE X +=2()()12b a D X -=令 1ˆˆ2ab A X +==22221ˆˆˆˆ()()1124n i i b a a b A X n =-++==∑ (22211n i i X X S n =-=∑)解得a 和b 的矩估计为:ˆˆaX bX =-=(3) 110()1E X x x dx θθθθ-=*=+⎰令 1ˆˆ1A X θθ==+ ∴ˆ1XXθ=- (4) 110()(1)!kk x kE X x x e dx k βββ--=*=-⎰令 ˆkX β=∴ ˆkXβ=(5) 根据密度函数有2221()22()E X a aE X a λλλ=+=++根据矩估计有1222221ˆˆˆ22ˆˆˆa A X aa A S X λλλ+==++==+解得λ和a 的矩估计为:ˆˆaX λ==(6) ∵ (,)X B m p∴ ()E X mp =令 1ˆmpA X == 解得p 的矩估计为:ˆX pm= 2.2解:(1)X 服从指数分布,λ的似然函数为:L (λ)=λn e −λ∑x i n i=1, x i>0,i =1,2,⋯,nlnL (λ)=nlnλ−λ∑x i ni=1∂lnL (λ)∂λ=nλ−∑x i ni=1解得:λ̂=1x̅(2)f (x )=1b−a,a <x <b似然函数为:L (a,b )=1(b −a)n,a <x i <b显然:a ̂=X (1) b ̂=X (n) (3)f (x )={θ x θ−1 ,0<x <10, 其他似然函数为:L (θ)=θn ∗∏x i θ−1ni=1,0<x i <1lnL (θ)=nlnθ+(θ−1)∑lnx i ni=1∂lnL (θ)∂θ=nθ+∑lnx i ni=1=0 解得:θ̂=−n ∑lnx in i=1(4) f (x )={βk(k−1)!x k−1e −βx ,x >00, x ≤0似然函数为:L (β)=(βk(k −1)!)n ∗∏x i k−1ni=1∗e −β∑x i n i=1 ,x i >0 i =1,2,⋯,n lnL (β)=nk ∗lnβ−n ∗ln (k −1)!+(k −1)∑lnx i ni=1−β∑x i ni=1∂lnL (β)∂β=nkβ−∑x i ni=1=0解得:θ̂=−kx̅(5) f (x )={λ x −λ(x−a),x >a 0, x ≤a似然函数为:L (a,λ)=λn x −λ∑(x i ni=1−a) ,x i >a,i =1,2,⋯,nlnL (a,λ)=n ∗lnλ−λ∑x i ni=1+nλa ∂lnL (a,λ)∂λ=nλ−∑(x i ni=1−a)=0 解得:a ̂=X (1) , λ̂=−1X ̅−X (1)(6) X~B(m , P)P {X =k }=(m k)P k(1−P)m−k ,k =0,1,⋯,m似然函数为:L (p )=(m k)n P ∑xi n i=1(1−P)∑(m−x i )n i=1,x i =0,1,2,⋯,nlnL (p )=n ∗ln (mk)+∑x i n i=1∗lnp +∑(m −x i )ni=1∗ln (1−p)∂lnL (p )∂p=∑x in i=1p−∑(m −x i )n i=11−p=0解得:p ̂=−X̅m2.3解:∵ X 服从几何分布,其概率分布为:1()(1)k P X k p p -==-故p 的似然函数为: 1()(1)ni i x nnL p p p =-∑=-对数似然函数为:1ln ()ln ()ln(1)ni i L p n p x n p ==+--∑令 1ln ()1()01nii L p n x n p p p=∂=--=∂-∑ ∴ 1ˆpX= 2.4 解:由题知X 应服从离散均匀分布,⎪⎩⎪⎨⎧≤≤==其它01 1)(Nk N k x pE (X )=N+12矩估计: 令N ̂+12=710 ∴N̂=1419 极大似然估计:⎪⎩⎪⎨⎧≤≤=其它07101 1)(NN N L要使)(N L 最大,则710=N710=∴∧N2.5 解:由题中等式知:2196.196.196.1)025.01(025.0)(1S X +=+=∴+=+-Φ=∴=-Φ-∧∧∧-σμθσμμσθσμθ2.6 解:(1) 05.009.214.2=-=R0215.005.04299.05=⨯==∴∧d Rσ(2)将所有数据分为三组如下所示:0197.005.03946.005.0)05.005.005.0(316=⨯==∴=++=∴∧d R R σ 2.7 解:(1)⎩⎨⎧+<<=其它 01x 1)(θθx f θθθθθθ≠+==+=++=∴∧21)()(2121)(X E E X E ∴ X =∧θ不是θ的无偏估计,偏差为21=-∧θθ(2) θ=-)21(X E 21-=∴∧X θ是θ的无偏估计(3) 22))(()())(()(θθθθ-+=-+=∧∧X E X D E D M S E41121+=n 2.8 证:由例2.24,令2211x a x a +=∧μ,则∧μ 为μ无偏估计应 满足121=+a a因此1μ,2μ,3μ都是μ的无偏估计)()()()(21)()(2513)()(95)9491)(()())(()()(1233212221212∧∧∧∧∧∧=∧<<===+=∴+==∑μμμμμμμD D D X D D X D D X D X D D a a X D X D a D i i i2132121X X +=∴∧μ最有效2.9 证: )(~λp X λλ==∴)( )(X D X EX 是λ=)(X E 的无偏估计,2*S 是λ=)( X D 的无偏估计 )()1()())1((2*2*S E X E S X E αααα-+=-+∴λλααλ=-+=)1(∴ 2*)1(SX αα-+是λ的无偏估计2.10 解:因为2222((1))()(1)()(1)()1(1)()11(1)1E X S E X E S na E S n n a E S n n n a n nααααλαλαλαλλ**+-=+-=+--=+---=+-=- 所以 2(1)X S αα*+-是λ的无偏估计量2.11证明:X~P (λ)假设T(X 1)为θ=e −2λ的无偏估计,即: E[T(X 1)]= θ, E [T (X1)]=∑T (X )∞x=0∗λx x!e−λ=e −2λ=∑T (X )∞x=0∗λx x!=e−λ=∑(−λ)xx!∞x=0=∑(−1)x λx x!∞x=0(泰勒展开)所以T (X 1)=(−1)X 1是θ=e −2λ的唯一无偏估计。
第四章方差分析2
H A0 : µ1 = µ2 = L = µr ; H A1 : 至少存在一对µi ≠ µ j ,
1 s 1 设 : x i ⋅ = ∑ x ij , ( i = 1, 2, L , r ), x ⋅ j = s j =1 r 1 x = rs
H B 0 : µ1 = µ 2 = L = µr ; H B1 : 至少存在一对µi ≠ µ j ,
Y i ~ N ( µ i , σ 2 ), ( i = 1, 2 , L , r ), 且 相 互 独 立 , y ij 是 Y ij的 样 本 值 , 在 同 一 Y i 下 , 样 本 Y ij ~ N ( µ i , σ 2 )( j = 1, 2 , L , n i ) 也 相 互 独 立 ,
∴ µ i的 1 − α 置 信 区 间 为 : Yi ⋅ − tα / 2 ( n − r )
2 SE , Yi ⋅ + tα / 2 ( n − r ) ni ( n − r ) 2 SE ni ( n − r )
9
结束
就例1而言 就例 而言, 而言
αˆ 1 = y 1 ⋅ − y = 1 7 3 . 5 − 1 9 0 . 3 3 = − 1 6 . 8 3 , αˆ 2 = y 2 ⋅ − y = 1 8 7 . 7 5 − 1 9 0 . 3 3 = − 2 . 5 8 , αˆ 3 = y 3 ⋅ − y = 2 0 9 . 7 5 − 1 9 0 . 3 3 = 1 9 . 4 2 .
2 A
2 A
( r − 1) , S = S
2 E
2 E
2 SA ( n − r ) , F = 2 ~ F ( r − 1, n − r ). SE
6
第四章 方差分析
个数据合计后平方, 将第i组的j个数据合计后平方, 组的平方值合计。 再将所有各i组的平方值合计。 表示变异由处理因素 ( 4 ) 变异来源 ① SS 总 : 表示变异由 处理因素 及随机误差共同所致;②SS组间:表示变异来自处 随机误差共同所致; 表示变异来自处 共同所致 理因素的作用或影响 的作用或影响; 表示变异由个体 理因素的作用或影响;③SS组内:表示变异由个体 差异和测量误差等随机因素所致 等随机因素所致。 差异和测量误差等随机因素所致。 (3 )
也称为拉丁方设计( 3、三因素方差分析 也称为拉丁方设计(Latin design)的方差分析。该设计特点是, square design)的方差分析。该设计特点是,可 以同时分析三个因素对试验结果的作用, 以同时分析三个因素对试验结果的作用,且三个 因素之间相互独立,不能有交互作用。 因素之间相互独立,不能有交互作用。 4 、 析 因 设 计 ( factorial design ) 的 方 差 分 析 当两个因素或多个因素之间存在相互影响或交互 作用时,可用该设计来进行分析。 作用时 , 可用该设计来进行分析 。 该设计不仅可 以分析多个因素的独立作用, 以分析多个因素的独立作用 , 也可以分析多个因 素间的交互作用,是一种高效率的方差分析方法。 素间的交互作用 , 是
ν 组内
1978.32 = = 82.43 24
MS 组间 =
SS 组间
ν 组间
=
8965.98 = 4482.99 2
υ组内=N-k =27-3=24
界值表, 界值: 24,查附表8 组内 = 24 , 查附表 8 , F 界值表 , 得 F 界值 :
见表4 (3) 列方差分析表 见表4-3。 确定P 根据α 05, (4)确定P值 根据α=0.05,υ1=υ组间=2,υ2=υ
数理统计方差分析
证明:对每个X总i(体 i 1,2,,k)的样本均X值i与样本方差
ni
(Xij Xi)2
Si2 j1 ni 1 相互独立;又全体相样互本独立,于是
n1
n2
nk
(X1, (X1j X1)2),(X2, (X2j X2)2),,(Xk, (Xkj Xk)2)
记:
Xi
1 n
ni j 1
Xij
将Q进行分解:
1 k ni
X n i1
Xij
j1
k ni
SST(Xij X)2 i1 j1
k n i
S S T
(X ijX i) (X i X )2
i 1j 1
kn i
kn i
kn i
(X ij X i)2 (X i X )2 2 (X ij X i)X ( i X )
这意味着四个样本分别来自均值不同的四个正态总体
f(X)
X
m3 m1 m2 m4
第二节 单因素方差分析
一、数据结构 二、单因素方差分析的步骤 三、单因素方差分析中的其它问题
f(X)
X
m1 m2 m3 m4
一、数据结构
观察值 ( j )
1 2 : : n
水平A1
x11 x21 : : xn1
j1
j1
j1
相互独立,从(而 X1, X2,,, Xk )与SSE相互独立,由此推出
SSA与SSE独立。ni
由于(ni 1)Si2 j1
2
(Xij
2
Xi
)2
~ 2(ni
1),i
1,2,,k且相互独立。于
ni
双因素方差分析
1)(m
1))
在H0B 成立时, 检验统计量
FB
SSMB (m 1) SSE (l 1)(m 1)
H0B真
~ F(m
1,(l
1)(m
1))
概率论与数理统计
❖ 1.无交互作用的双因素方差分析
➢ 要说明因素A有无显著影响, 就是要检验如下假设:
H0A:1 = 2 = … = l = 0, H1A:1, 2, …,l 不全为零
lm
➢ 误差平方和: SSE
( xij xi. x. j x )2
i1 j1
lm
➢ 总离差平方和: SST
( xij x )2
i1 j1
➢ 可以证明: SST = SSMA + SSMB + SSE
概率论与数理统计
❖ 1.无交互作用的双因素方差分析
➢ 可以证明: 构造检验统计量
ij~N(0, 2), 且相互独立, 1 ≤ i ≤ l, 1 ≤ j ≤ m,
l
ai 0,
i 1
m
j 0
j1
其中表示平均的效应, i和j分别表示因素A的第i个水 平和因素B的第j个水平的附加效应, ij为随机误差,假定ij
相互独立并且服从等方差的正态分布.
概率论与数理统计
❖1. 无交互作用的双因素方差分析
SSMA SSMB SSE
SSMA / (l – 1) MSA / MSE PA SSMB / (m – 1) MSB / MSE PB SSE / (l – 1)(m – 1)
全部
lm – 1
SSMA + SSMB +SSE
其中MSA = SSMA/(l – 1), MSB = SSMB/(m – 1),
数理统计第四章 方差分析
B1
B2
B3
B4
A1
A2
32
35
35.5
38.5
33.5
36
36.5
37.5
38
39.5
39.5
43
A3
• •
问不同促进剂、不同份量氧化锌分别对定强有无显著影响? 此例中有A,B二个因子,因而因子A有三种水平A1,A2, A3,因子B有四种水平B1,B2,B3,B4 ,在每种组合Ai Bj上 作一次试验获得了试验值,问因子A、B分别对试验结果有无显著 影响?
1
2
3
4
1
2
3
4
1
2
3
4
0
1
2
3
4
4
下面对更一般问题建立数学模型
母体
X X
1
子样
X X
11
子样均值
X X
12
X X
1 n1
X X
1
2
21
22
2 n2
2
X
r
X
r1
X
r2
X
rnr
X
r
2
假定 那么
X
i
N ( i ,
2
) ,
则
ij
X ij i N (0 , ).
t(n r )
13
•
给定置信概率 1 ,使 得
p { | T | t ( n r ) } 1 .
2
即
p{ X i X
j
t ( n r ) S E
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
反映X ij 之间的波动.令
ST ( X ij X ) 2
i 1 j 1 r ni
1 r ni 其中X X ij n i 1 j 1
令
r
X i . X ij ,
j 1
ni r ni
ni
1 Xi. ni
X
j 1
ni
ij
则ST ( X ij X ) 2 ( X ij X i . X i . X ) 2
因此
(ni 1) Si2
~ 2 (ni 1), i 1,2,, r
SE
2
i 1
r
(ni 1) Si2
2
~ 2 (n r )
柯赫伦(Cochran)分解定理 : 设X 1 , X 2 ,..., X n为n个 相互独立的N (0,1)随机变量, Q j 是某些X 1 , X 2 ,..., X n的 线性组合的平方和, 其自由度分别为f j , 如果 Q1 Q2 ... Qk ~ 2 (n) 且 则 f1 f 2 ... f k n Q j ~ 2 ( f j ), j 1,2,..., k
§1 单因子方差分析
§1.1 基本概念
为了考察某个因素 A 对试验指标(即随机变量 X) 的影响,在试验时,保持其他因素不变,而仅让因素 A 改变,这种试验称为单因子(单因素)试验. 设试验结 果如下表:
水平 A1 A2 … Ar
观测值 x11 x21 … xr1 x12 x22 … xr2 ... … … … x1n1 x2n2 … xrnr
§1.4 检验过程
由此可知,当H 0 : 1 2 ... n 0为真时, S A /(r 1) F ~ F (r 1, n r ) S E /(n r ) 按照显著性检验程序, 对给定的显著性水平 , 当F
F1 (r 1, n r )时, 拒绝假设H 0 , 认为因子各水平间在显 著性水平下有显著差异.否则接受H 0 , 认为因子各水平 间在显著性水平下无显著差异.
• 在实际问题中影响总体均值的因素可能不止一 个.我们按试验中因子的个数,可以有单因子方差 分析,双因子分析,多因子分析等.例中是一个单因 子方差分析问题. • 设在某试验中,因子A有r个不同水平 A1,A2,...,Ar,在Ai水平下的试验结果Xi服从正态 分布N(μi,σ2),i=1,2,...,r,且X1,X2,...,Xr间 相互独立.现在水平Ai下做了ni次试验,获得了ni 个试验结果Xij,j=1,2,...,ni这可以看成是取自Xi 的一个容量为ni的样本,i=1,2,...,r.
这里r 5, t 4, n 20
xij 5236
i 1 j 1
5
i 1
记 S E ( X ij X i .) 2
i 1 j 1
r
ni
S A ni ( X i . X ) 2
i 1
rHale Waihona Puke 则 ST S E S A 为一个平方和分解式.
下面我们来看各式的意义 1 r ni X X ij 是所有数据的平均值, 称为总平均值. n i 1 j 1 1 ni X i . X ij 是从第i个总体中抽得的样本平均值, 称 ni j 1
为组平均值.
ST ( X ij X ) 表示所有数据与总平均值
2 i 1 j 1
r
ni
的离差平方和, 是描述全部数据离散程度的一个 指标, 称为总偏差平方和(总离差平方和).
S E ( X ij X i .) 2 表示每个数据与其组平均值
i 1 j 1 r ni
fr n 1 f A r 1 fE n r
其中n ni为试验的总次数, X i. X ij , T.. X ij .
i 1 j 1 i 1 j 1
r
ni
等重复试验计算表 试验号 1 水平 1 2 … r x11 x21 … xr1 2 x12 x22 … xr2 … 各水平的 t 和 xi. 和平方 x2i.
且Q1 , Q2 ,..., Qk 相互独立.
由于
ST
2
SA
2
SE
2
及n 1 (r 1) (n r )
可知柯赫伦分解定理的条件全部满足, 故有
SA
2
~ (r 1)
2
且S A与S E 相互独立.
由于S A反映的是因子不同水平均值之间的差 异程度, 故当假设H 0 : 1 2 ... r 0为真时, S A的值不应太大, 从而 S A /(r 1) F S E /(n r ) 也不应太大, 当F值过大时, 可以认为假设H 0不真.
的离差平方和, 反映了试验中的随机误差, 称为误差 偏差平方和(组内离差平方和).
S A ni ( X i . X ) 2 表示组平均值与总平均值的离差
i 1 r
平方和, 反映了各总体(因子A的不同水平)均值之间的 差异程度, 称为因子偏差平方和(组间离差平方和).
§1.3 检验统计量的构造
• 由于Xij~N(μi,σ2) ,故Xij与μi的差可以看成一个 随机误差εij~N(0,σ2) .这样一来,可以假定Xij具有下 述数据结构式:
Xij= μi+ εij,i=1,2,...,r;j=1,2,...,ni 其中诸εij~N(0,σ2),且相互独立.要检验的假设是 H0:μ1=μ2=…=μr • 为了今后方便起见,把参数的形式改变一下,并 r 记 1 r ni i n ni
… x1t … x2t … … … xrt
方差分析表 方差来源 平方和 自由度 均方和 F 值 显著性 SA r-1 SA /(r-1) 因子影响 F SE n-r SE /(n-r) 随机误差 ST n-1 总和
• 例:为寻求适应本地区的高产油菜品种,今选了 五种不同品种进行试验,每一品种在四块试验田上 得到在每一块田上的亩产量如下:
• 我们要研究的问题是诸不同品种的平均亩 产量是否有显著差异.
• 在本例中只考虑品种这一因子对亩产量的影响 ,五个不同品种就是该因子的五个不同水平.由于 同一品种在不同田块上的亩产量不同,我们可以认 为一个品种的亩产量就是一个总体,在方差分析中 总假定各总体独立地服从同方差正态分布,即第i 个品种的亩产量是一个随机变量,它服从分布 N(μi,σ2), i=1,2,3,4,5.
品种 A1 A2 A3 A4 A5 田块 1 256 244 250 288 206 2 222 300 277 280 212 3 280 290 230 315 220 4 298 275 322 259 212
• 我们要研究的问题是诸不同品种的平均亩 产量是否有显著差异.
• 解:先列表计算
计算表 田块 品种 A1 A2 A3 A4 A5 1 256 244 250 288 206 2 222 300 277 280 212 3 280 290 230 315 220 4 和 各水平的 和平方 1115136 1229881 1164241 1304164 722500 298 1056 275 1109 322 1079 259 1142 212 850
• 例:为寻求适应本地区的高产油菜品种,今选了 五种不同品种进行试验,每一品种在四块试验田上 得到在每一块田上的亩产量如下:
品种 A1 A2 A3 A4 A5 田块 1 256 244 250 288 206 2 222 300 277 280 212 3 280 290 230 315 220 4 298 275 322 259 212
当H 0 : 1 2 ... n 0为真时, 一切X ij ~ N ( , 2 ), 且相互独立.
r ni
ST ( X ij X ) 2 (n 1) S 2
i 1 j 1
其中S 2是全体样本的样本方差 .
故 ST (n 1) S 2 ~ 2 (n 1)
n
i 1 i 1
i i ,
i 1,2,..., r ,
称μ为一般平均,αi为因子A的第i 个水平的效应.
• 在这样的改变下,单因子方差分析模型中的数 据结构式可以写成:
X ij i ij , i 1,2,..., r; j 1,2,..., ni
i 1 j 1
ni
i 1 j 1
ni
( X ij X i .) 2 ( X i . X ) 2 2 ( X ij X i .)( X i . X )
i 1 j 1 i 1 j 1 i 1 j 1
r
r
r
ni
( X ij X i .) ni ( X i . X ) 2
• 试验的目的就是要检验假设 H0:μ1=μ2=μ3=μ4=μ5
是否成立.若是拒绝 ,那么我们就认为这五种品种 的平均亩产量之间有显著差异;反之,就认为各品 种间产量的不同是由随机因素引起的.方差分析就 是检验假设的一种方法.
• 实际上,方差分析是检验同方差的若干正态总体 均值是否相等的一种统计方法.
2
2
对于各组样本有
( X ij X i. ) 2 (ni 1) S i2