第3章 统计假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 1 2 2
df = n1+ n2-2
当n1=n2=n时,
sx1 x
2
S S n
2 1
2 2
df=2(n-1)
例3, [例4-5]
已知:n=6,x1 =98.467,x2=132.650 s1=2.886, s2=2.288
第一步 建立假设
H0:μ1=μ2(两种罐头SO2含量无差异) HA:μ1≠μ2(两种罐头SO2含量有差异)
0.545 (6 1) 0.557 (5 1) 1 1 ( ) 0.333 652 6 5
x1 x 2 28 .15 28 .61 t 1.381 s x1 x 2 0.333
第四步 查表找临界值tα,并作统计推断
查表3 得,t0.05(9)=2.262, t0.01(9)=3.250
第四步 查表找临界值tα,并作统计推断
查表3 得,t0.05(10)=2.228, t0.01(10)=3.169
∵|t|=22.728>t0.01(10),p<0.01 ∴否定H0 ,认为差异极显著。即两种罐 头SO2含量有极显著差异。
例4, [例4-6]
已知:n1=6,x1=28.150, s1 =0.545 n2=5,x =28.610, s2=0.557
应用条件:两个样本所在总体都服 从正态分布(计量资料),并且
2 1 2 2
2
x1 x 2 t sx1 x
2
自由度df= n1+n2-2 其中 差异标准误
S x1 x2
2 e 2 e
样本合并方差
2 1 1 s s 2se 2 se ( ) n1 n2 n n1 n2 n1 n2 n
成对数据平均数的 t 检验:差值的均值 t值公式
d t sd
(d d ) n(n 1)
2
差值的标准差
差异标准误公式
sd sd n d ( d ) n n(n 1)
2 2
自由度公式
df=n-1
例5, [例4-8]
第一步 建立假设
H0:μd=0(处理与对照钙离子含量无差异) HA:μd≠0(处理与对照钙离子含量有差异) 第二步 确定显著水准α=0.05、0.01(两尾)
第三步 计算统计量 u 值
u
均 数 标 准 误
x 0
x
x 0
n
502 .7 500 1.067 8 10
第四步 查表找uα值,并作统计推断
由α=0.05、0.01查表2得,
u0.05=1.96, u0.01=2.58
因|u| =1.067< u0.05,因而p> 0.05,不能
第四步 查表找临界值 tα,并作统计推断
由α=0.05、0.01和df =15查表3得,
t0.05(15)=2.131, t0.01(15)=2.947 ∵|t|=6.667> t0.01(15)=2.947
∴ p<0.01,否定H0,认为新旧工艺每百 克山楂出果冻量有极显著差异,即采用 新工艺可提高每百克山楂出果冻量。
注:统计假设检验是依据“小概率事件 的实际不可能性原理”来进行统计推 断的,因而有可能犯错误。 统计假设检验中可能犯的两类错误: 第一类错误:否定了本来是正确的H0, 犯此错误的概率是α; 第二类错误:接受了本来是错误的H0, 犯此错误的概率是β。 α与β呈反比关系。减少犯错误概率的有 效办法是增大重复数n。
2
第一步 建立假设
H0:μ1=μ2(两种工艺茶多糖含量无差异) HA:μ1≠μ2(两种工艺茶多糖含量有差异)
第二步 确定显著水准α=0.05、0.01(两尾)
第三步 计算统计量 t 值和自由度 df
df=n1+n2-2=6 + 5-2=9
s x1 x 2
2 s12 (n1 1) s2 (n2 1) 1 1 ( ) n1 n2 2 n1 n2 2 2
df=n-1=10-1=9
第四步 查表找临界值tα,并作统计推断
查表3得,t0.05(9)=2.262,
t0.01(9)=3.250 ∵|t|=8.356>t0.01(9),p<0.01 ∴否定H0 :μd =0,认为差异极显著。即
处理与对照钙离子含量有极显著差异。
第三节 二项百分率的 假设检验
第一节 统计假设检验的 意义与步骤
一、统计假设检验的意义
在食品科学研究中,经常遇到: ①检验某产品是否达到某项质量标准 ②检测某种有害物质含量是否超标 ③比较两种工艺方法的优劣 ④两种食品内含物含量的比较 ⑤两种仪器(方法)测定同一样品 ……
在上述工作中,都可得到两组数据,而这 两组数据的平均数之间存在着差异。
二项变量 X(次数)
x 二项百分率 p (成数、频率)。如 n
合格率、废品率、裂果率等。
一、单个样本百分率的检验(u 检验)
应用条件:n>30,p不很小,np、nq>5 在H0:p=p0下
2 2 2
s x1 s x 2
2
t ( n 1)
㈡成对数据平均数的假设检验(t 检验)
成对数据:来自于配对试验,其数据是成 对获取的,格式如下
样号
处理 甲
乙 d=x1-x2
1
2 … n
均值
x11 x12 … x1n x21 x22 … x2n d1 d2 … d n
x1 x2 d = x1 - x 2
n≥30;
或n<30,但X~N(μ,σ2)(计量资 料),且σ2已知。
方法步骤 例1, [例4-1] 已知:μ0=500,σ=8,n=10, =502.700,X~N x
求:μ-μ0=0?
解:
第一步 建立假设 H0:μ=μ0 = 500(该日装罐机每罐平均净
重与标准净重一样)
HA:μ≠μ0 第二步 确定显著水准α=0.05、0.01(两尾)
二、统计假设检验的步骤
⑴建立假设
统计假设检验是在一定假设下进行统 计量的概率计算,再由概率大小作出 接受或拒绝该假设的推断,进而回答 差异由误差所引起 平均数间差异是否显著。 ——差异不显著 存在本质差异 通常假设有两种: ——差异显著 无效假设H0:μ=μ0(μ1=μ2) 备择假设HA:μ≠μ0(μ1≠μ2)
ss ( x x) s df s 2 (n 1 1) s 2 ( n n
2 2
s df1 s df 2 ss1 ss2 s df1 df 2 df1 df 2
2 e 2 1 2 2
1
1
2
2
1)
n1 n2 2
S x1 x2
s (n1 1) s (n2 1) 1 1 n1 n2 2 n1 n2
第二步 确定显著水准α=0.05、0.01(两尾)
第三步 计算统计量 t 值和自由度 df
df=2(n-1)=2(6-1)=10
s x1 x 2
s s n
2 1
2 2
2.886 2.288 1.504 6
2 2
x1 x 2 98 .467 132 .65 t 22 .728 s x1 x 2 1.504
第二节 样本平均数的 假设检验
单个样本平均数的检验
由问题类型
两个样本平均数的检验
u检验
由统计量
t检验 成组检验 计量资料的检验 成对检验 由资料类型 百分数(二项成数)资料检验
①检验某产品是否达到某项质量标准 一、单个样本平均数的假设检验 ②检测某种有害物质含量是否超标 ㈠单个样本平均数的u检验 应用条件:
∵|t|=1.381<t0.05(9), p>0.05 ∴接受H0 ,认为差异不显著。即两种工 艺的粗提物中茶多糖含量无显著差异。
近似 t 检验
当
, 12和 22应分别由 s12和s22估计,则
2 1 2 2
s1 x 2 x
s s n1 n2
2 1
2 2
x1 x 2 此时的 t 不再准确地服从 t 分布。 s1 x 2 x
因而只能作近似的 t 检验(t检验) 。
近似 t 检验有两种方法:
①对自由度作矫正:
k S
2 x1 2 x1 2 x2
S S
S S n1
2 x1
2 1
S S n2
2 x2
2 2
1 df 2 2 k (1 k ) df1 df 2
df1 n1 1
df 2 n2 1
⑶检验统计量计算 首先要根据样本资料选择适合的统计
量。不同的统计量对应的概率分布
不同,计算公式各异,对样本资料
要求的条件也不一样。
⑷统计推断 U为统计量 根据计算的概率值大小来推断无效假设是 uα叫做临界u值 否被接受。对于常用的显著水平0.05、 0.01,有三种可能结果: ①p>0.05(|U|<u0.05),接受H0,推断 “差异不显著” ②0.01<p≤0.05(u0.05≤|U| <u0.01),否 定H0,推断“差异显著”,记* ③p≤0.01(|U|≥u0.01),否定H0。推断 “差异极显著”,记**
⑵确定显著水平α
因为统计假设检验是根据“小概率事件 小概率事件: 指发生的概率很小的事 的实际不可能性原理”来作出接受或拒 件。小概率如<0.25、0.2、0.1、0.05、 0.01等。 绝无效假设推断的,故显著水平通常为 小概率。实际中常用0.05、0.01。但也 小概率事件的实际不可能性原理: 指 可以根据试验的目的、要求、条件和试 小概率事件在一次试验中可以被认为 验结论的重要性等因素综合考虑而定。 是不可能事件。
第三步 计算统计量 t 值和自由度df 由资料求差值d,并求其平均、标准差
得
d 35.18 3.518 d
n 10
sd
(d d )
n 1
2
1.331
sd 1.331 sd 0.421 n 10
d 3.518 t 8.356 * * sd 0.421
源自文库
③比较两种工艺方法的优劣 二、两个样本平均数差异的假设检验 ④两种食品内含物含量的比较 ⑤两种仪器(方法)测定同一样品 ㈠成组数据平均数的假设检验(t 检验)
成组数据
甲 x11 , x12 x1n x1
1
乙 x21, x22 , x2 n 其中n1、n2可等可不等。
2
x2
两处理的完全随机试验资料为成组数据。
例如,
①半叶法试验资料 ②不同仪器用两种方法测定同一样品资料
③同一供试单元上作处理前后的对比资料 ④单因素两水平随机区组试验资料
配对试验中,各对试验单位间存在系统误 差,这可以由每对数据求差值来加以消 除。故成对数据资料的统计假设检验不 同于成组数据资料,先要求出各对数据 的差值d(d 值可正、可负、可为零), 然后由d 值来进行有关统计假设检验计算。 因此,其无效假设与备择假设为 H0:μd=μ1-μ2=0 HA:μd≠0
②对临界 t 值作矫正,公式为
t
其中
s x1 t ( df1 ) s x 2 t ( df2 )
2 2
s x1 s x 2
2 2
s s x1 n1
2
2 1
,
s sx2 n2
2
2 2
df1=n1-1,
df2=n2-1
当
n1=n2=n ,
t
s x1 t ( n 1) s x 2 t ( n 1)
否定H0,推断该日装罐机每罐平均净重
与标准净重差异不显著,表明该日装罐 机工作属正常状态。
㈡ 单个样本平均数t 检验 应用条件:X~N(μ,σ2)(计量资料)
方法步骤:
例2, [例4-2] 已知:μ0=500, n=16, =520, x s=12
解:
第一步 建立假设 H0:μ=μ0=500g,即新旧工艺每百克
山楂出果冻量没有差异。
HA:μ≠μ0,即新旧工艺每百克山楂出
果冻量有差异。
第二步 确定显著水准α=0.05、0.01(两尾)
第三步 计算统计量 t 值和自由度df
x 0 x 0 520 500 t 6.667 * * s sx 3 n
df = n -1= 16-1=15
这个“差异”可能纯粹是由随机误差引起; 也可能不仅仅是误差引起,更主要是两组 数据有本质的差异,即存在“处理效应”。
要想根据实际数据作出正确判断,须借助 两种牛奶蛋白质含量比较: 统计假设检验方法。如果经检验推断出 甲的15个样品测定值平均为1.35% “差异”仅由随机误差所引起,则为差异 不显著,反之为差异显著(显著性检验)。 乙的15个样品测定值平均为1.32%
df = n1+ n2-2
当n1=n2=n时,
sx1 x
2
S S n
2 1
2 2
df=2(n-1)
例3, [例4-5]
已知:n=6,x1 =98.467,x2=132.650 s1=2.886, s2=2.288
第一步 建立假设
H0:μ1=μ2(两种罐头SO2含量无差异) HA:μ1≠μ2(两种罐头SO2含量有差异)
0.545 (6 1) 0.557 (5 1) 1 1 ( ) 0.333 652 6 5
x1 x 2 28 .15 28 .61 t 1.381 s x1 x 2 0.333
第四步 查表找临界值tα,并作统计推断
查表3 得,t0.05(9)=2.262, t0.01(9)=3.250
第四步 查表找临界值tα,并作统计推断
查表3 得,t0.05(10)=2.228, t0.01(10)=3.169
∵|t|=22.728>t0.01(10),p<0.01 ∴否定H0 ,认为差异极显著。即两种罐 头SO2含量有极显著差异。
例4, [例4-6]
已知:n1=6,x1=28.150, s1 =0.545 n2=5,x =28.610, s2=0.557
应用条件:两个样本所在总体都服 从正态分布(计量资料),并且
2 1 2 2
2
x1 x 2 t sx1 x
2
自由度df= n1+n2-2 其中 差异标准误
S x1 x2
2 e 2 e
样本合并方差
2 1 1 s s 2se 2 se ( ) n1 n2 n n1 n2 n1 n2 n
成对数据平均数的 t 检验:差值的均值 t值公式
d t sd
(d d ) n(n 1)
2
差值的标准差
差异标准误公式
sd sd n d ( d ) n n(n 1)
2 2
自由度公式
df=n-1
例5, [例4-8]
第一步 建立假设
H0:μd=0(处理与对照钙离子含量无差异) HA:μd≠0(处理与对照钙离子含量有差异) 第二步 确定显著水准α=0.05、0.01(两尾)
第三步 计算统计量 u 值
u
均 数 标 准 误
x 0
x
x 0
n
502 .7 500 1.067 8 10
第四步 查表找uα值,并作统计推断
由α=0.05、0.01查表2得,
u0.05=1.96, u0.01=2.58
因|u| =1.067< u0.05,因而p> 0.05,不能
第四步 查表找临界值 tα,并作统计推断
由α=0.05、0.01和df =15查表3得,
t0.05(15)=2.131, t0.01(15)=2.947 ∵|t|=6.667> t0.01(15)=2.947
∴ p<0.01,否定H0,认为新旧工艺每百 克山楂出果冻量有极显著差异,即采用 新工艺可提高每百克山楂出果冻量。
注:统计假设检验是依据“小概率事件 的实际不可能性原理”来进行统计推 断的,因而有可能犯错误。 统计假设检验中可能犯的两类错误: 第一类错误:否定了本来是正确的H0, 犯此错误的概率是α; 第二类错误:接受了本来是错误的H0, 犯此错误的概率是β。 α与β呈反比关系。减少犯错误概率的有 效办法是增大重复数n。
2
第一步 建立假设
H0:μ1=μ2(两种工艺茶多糖含量无差异) HA:μ1≠μ2(两种工艺茶多糖含量有差异)
第二步 确定显著水准α=0.05、0.01(两尾)
第三步 计算统计量 t 值和自由度 df
df=n1+n2-2=6 + 5-2=9
s x1 x 2
2 s12 (n1 1) s2 (n2 1) 1 1 ( ) n1 n2 2 n1 n2 2 2
df=n-1=10-1=9
第四步 查表找临界值tα,并作统计推断
查表3得,t0.05(9)=2.262,
t0.01(9)=3.250 ∵|t|=8.356>t0.01(9),p<0.01 ∴否定H0 :μd =0,认为差异极显著。即
处理与对照钙离子含量有极显著差异。
第三节 二项百分率的 假设检验
第一节 统计假设检验的 意义与步骤
一、统计假设检验的意义
在食品科学研究中,经常遇到: ①检验某产品是否达到某项质量标准 ②检测某种有害物质含量是否超标 ③比较两种工艺方法的优劣 ④两种食品内含物含量的比较 ⑤两种仪器(方法)测定同一样品 ……
在上述工作中,都可得到两组数据,而这 两组数据的平均数之间存在着差异。
二项变量 X(次数)
x 二项百分率 p (成数、频率)。如 n
合格率、废品率、裂果率等。
一、单个样本百分率的检验(u 检验)
应用条件:n>30,p不很小,np、nq>5 在H0:p=p0下
2 2 2
s x1 s x 2
2
t ( n 1)
㈡成对数据平均数的假设检验(t 检验)
成对数据:来自于配对试验,其数据是成 对获取的,格式如下
样号
处理 甲
乙 d=x1-x2
1
2 … n
均值
x11 x12 … x1n x21 x22 … x2n d1 d2 … d n
x1 x2 d = x1 - x 2
n≥30;
或n<30,但X~N(μ,σ2)(计量资 料),且σ2已知。
方法步骤 例1, [例4-1] 已知:μ0=500,σ=8,n=10, =502.700,X~N x
求:μ-μ0=0?
解:
第一步 建立假设 H0:μ=μ0 = 500(该日装罐机每罐平均净
重与标准净重一样)
HA:μ≠μ0 第二步 确定显著水准α=0.05、0.01(两尾)
二、统计假设检验的步骤
⑴建立假设
统计假设检验是在一定假设下进行统 计量的概率计算,再由概率大小作出 接受或拒绝该假设的推断,进而回答 差异由误差所引起 平均数间差异是否显著。 ——差异不显著 存在本质差异 通常假设有两种: ——差异显著 无效假设H0:μ=μ0(μ1=μ2) 备择假设HA:μ≠μ0(μ1≠μ2)
ss ( x x) s df s 2 (n 1 1) s 2 ( n n
2 2
s df1 s df 2 ss1 ss2 s df1 df 2 df1 df 2
2 e 2 1 2 2
1
1
2
2
1)
n1 n2 2
S x1 x2
s (n1 1) s (n2 1) 1 1 n1 n2 2 n1 n2
第二步 确定显著水准α=0.05、0.01(两尾)
第三步 计算统计量 t 值和自由度 df
df=2(n-1)=2(6-1)=10
s x1 x 2
s s n
2 1
2 2
2.886 2.288 1.504 6
2 2
x1 x 2 98 .467 132 .65 t 22 .728 s x1 x 2 1.504
第二节 样本平均数的 假设检验
单个样本平均数的检验
由问题类型
两个样本平均数的检验
u检验
由统计量
t检验 成组检验 计量资料的检验 成对检验 由资料类型 百分数(二项成数)资料检验
①检验某产品是否达到某项质量标准 一、单个样本平均数的假设检验 ②检测某种有害物质含量是否超标 ㈠单个样本平均数的u检验 应用条件:
∵|t|=1.381<t0.05(9), p>0.05 ∴接受H0 ,认为差异不显著。即两种工 艺的粗提物中茶多糖含量无显著差异。
近似 t 检验
当
, 12和 22应分别由 s12和s22估计,则
2 1 2 2
s1 x 2 x
s s n1 n2
2 1
2 2
x1 x 2 此时的 t 不再准确地服从 t 分布。 s1 x 2 x
因而只能作近似的 t 检验(t检验) 。
近似 t 检验有两种方法:
①对自由度作矫正:
k S
2 x1 2 x1 2 x2
S S
S S n1
2 x1
2 1
S S n2
2 x2
2 2
1 df 2 2 k (1 k ) df1 df 2
df1 n1 1
df 2 n2 1
⑶检验统计量计算 首先要根据样本资料选择适合的统计
量。不同的统计量对应的概率分布
不同,计算公式各异,对样本资料
要求的条件也不一样。
⑷统计推断 U为统计量 根据计算的概率值大小来推断无效假设是 uα叫做临界u值 否被接受。对于常用的显著水平0.05、 0.01,有三种可能结果: ①p>0.05(|U|<u0.05),接受H0,推断 “差异不显著” ②0.01<p≤0.05(u0.05≤|U| <u0.01),否 定H0,推断“差异显著”,记* ③p≤0.01(|U|≥u0.01),否定H0。推断 “差异极显著”,记**
⑵确定显著水平α
因为统计假设检验是根据“小概率事件 小概率事件: 指发生的概率很小的事 的实际不可能性原理”来作出接受或拒 件。小概率如<0.25、0.2、0.1、0.05、 0.01等。 绝无效假设推断的,故显著水平通常为 小概率。实际中常用0.05、0.01。但也 小概率事件的实际不可能性原理: 指 可以根据试验的目的、要求、条件和试 小概率事件在一次试验中可以被认为 验结论的重要性等因素综合考虑而定。 是不可能事件。
第三步 计算统计量 t 值和自由度df 由资料求差值d,并求其平均、标准差
得
d 35.18 3.518 d
n 10
sd
(d d )
n 1
2
1.331
sd 1.331 sd 0.421 n 10
d 3.518 t 8.356 * * sd 0.421
源自文库
③比较两种工艺方法的优劣 二、两个样本平均数差异的假设检验 ④两种食品内含物含量的比较 ⑤两种仪器(方法)测定同一样品 ㈠成组数据平均数的假设检验(t 检验)
成组数据
甲 x11 , x12 x1n x1
1
乙 x21, x22 , x2 n 其中n1、n2可等可不等。
2
x2
两处理的完全随机试验资料为成组数据。
例如,
①半叶法试验资料 ②不同仪器用两种方法测定同一样品资料
③同一供试单元上作处理前后的对比资料 ④单因素两水平随机区组试验资料
配对试验中,各对试验单位间存在系统误 差,这可以由每对数据求差值来加以消 除。故成对数据资料的统计假设检验不 同于成组数据资料,先要求出各对数据 的差值d(d 值可正、可负、可为零), 然后由d 值来进行有关统计假设检验计算。 因此,其无效假设与备择假设为 H0:μd=μ1-μ2=0 HA:μd≠0
②对临界 t 值作矫正,公式为
t
其中
s x1 t ( df1 ) s x 2 t ( df2 )
2 2
s x1 s x 2
2 2
s s x1 n1
2
2 1
,
s sx2 n2
2
2 2
df1=n1-1,
df2=n2-1
当
n1=n2=n ,
t
s x1 t ( n 1) s x 2 t ( n 1)
否定H0,推断该日装罐机每罐平均净重
与标准净重差异不显著,表明该日装罐 机工作属正常状态。
㈡ 单个样本平均数t 检验 应用条件:X~N(μ,σ2)(计量资料)
方法步骤:
例2, [例4-2] 已知:μ0=500, n=16, =520, x s=12
解:
第一步 建立假设 H0:μ=μ0=500g,即新旧工艺每百克
山楂出果冻量没有差异。
HA:μ≠μ0,即新旧工艺每百克山楂出
果冻量有差异。
第二步 确定显著水准α=0.05、0.01(两尾)
第三步 计算统计量 t 值和自由度df
x 0 x 0 520 500 t 6.667 * * s sx 3 n
df = n -1= 16-1=15
这个“差异”可能纯粹是由随机误差引起; 也可能不仅仅是误差引起,更主要是两组 数据有本质的差异,即存在“处理效应”。
要想根据实际数据作出正确判断,须借助 两种牛奶蛋白质含量比较: 统计假设检验方法。如果经检验推断出 甲的15个样品测定值平均为1.35% “差异”仅由随机误差所引起,则为差异 不显著,反之为差异显著(显著性检验)。 乙的15个样品测定值平均为1.32%