【生物统计】第七章 卡平方测验PPT课件
合集下载
【卫生统计学-资料】_医学统计学课件--第七章_卡方检验
n R nC N
式中符号含义:
A:实际频数,表中实际 发生的阳性或阴性频数
T:理论频数,按某H0假 设计算理论上的阳性或阴 性频数
表7-1两组疗法降低颅内压有效率(%)
疗法 有效人数 无效人数 合计 有效率
试验组 99(90.48) 5(13.52) 104 95.2
对照组 75(83.52) 21(12.48) 96 78.1
无效数 合计 有效率%
5(A12) 104
21(A22) 96
26
200
95.20 78.13 87.00
问:两组有效率差别是否是抽样误差或是不同药
物的作用?
组别 +
—
四格表
甲 99 5
的数字
乙 75 21
Pearson 2 检验的基本公式
(公式7-1)
2 (AT)2
T
(公式7-3)
T RC
Expected=T
90.48 13.52 83.52 12.48
2 (A T )2
T
T=n ×π
2 (9990.48)2 (513.52)2 (7583.52)2 (2112.48)2 12.86
90.48
13.52
83.52
12.48
TRC
nR nC N
T11
104 174 200
表 100例高血压患者治疗后临床记录
编号
1 2 3 4
年龄 X1
37 45 43 59
性别 治疗组 舒张压 体温
X2 X3 X4 X5
男 A 11.27 37.5 女 B 12.53 37.0 男 A 10.93 36.5 女 B 14.67 37.8
《卡方检验正式》课件
卡方检验的结果可以直接解释为实际意义 ,例如,如果卡方值较大,则说明观察频 数与期望频数存在显著差异。
缺点
对数据要求高
卡方检验要求数据量较大,且各分类的期望频数不能太小,否则可能 导致结果不准确。
对离群值敏感
卡方检验对离群值比较敏感,离群值可能会对结果产生较大的影响。
无法处理缺失值
卡方检验无法处理含有缺失值的数据,如果数据中存在缺失值,需要 进行适当的处理。
案例二:市场研究中的卡方检验
总结词
市场研究中,卡方检验用于评估不同市 场细分或产品特征与消费者行为之间的 关联。
VS
详细描述
在市场研究中,卡方检验可以帮助研究者 了解消费者对不同品牌、产品或服务的偏 好。例如,通过比较不同年龄段消费者对 某品牌的选择比例,企业可以更好地制定 市场策略和产品定位。
案例三:社会调查中的卡方检验
小,表示两者之间的差异越小。通常根据卡方值的概率水平来判断差异
是否具有统计学显著性。
02
卡方检验的步骤
建立假设
假设1
观察频数与期望频数无显著差异
假设2
观察频数与期望频数有显著差异
收集数据
从样本数据中获取观察频数 确定期望频数,可以使用理论值或预期频数
制作交叉表
将收集到的数据整理成二维表格形式,行和列分别表示分类变量
卡方检验的基本思想
01
基于假设检验原理
卡方检验基于假设检验的原理,通过构建原假设和备择假设,利用观测
频数与期望频数的差异来评估原假设是否成立。
02
比较实际观测频数与期望频数
卡方检验的核心是比较实际观测频数与期望频数,通过卡方值的大小来
评估两者之间的差异程度。
03
生物统计学—卡方检验PPT课件
0.5 2 301.63
Ei
(4)推断:由CHIDIST(301.63, 1)=1.45E-67,即P c 2 301.63 0.01
故应否定H0,接受HA,认为鲤鱼体色F2性状比不符合3:1比率
(4)推断:由CHIINV(0.025,
1)=5.02,
即
cc2
c2 0.05(1)
,即P
0.05
c2 1
和c
2
c
2
2
2
第10页/共31页
例:已知某农田受到重金属污染,经抽样测定铅浓度分别为:
4.2, 4.5, 3.6, 4.7, 4.0, 3.8, 3.7, 4.2 (ug/g),方差为0.150, 试检验受到
污染的农田铅浓度的方差是不是和正常浓度铅浓度的方差
(0.065)相同
分析:1)一个样本方差同质性检验
论值记为:Ei,即 k c2
Oi Ei 2 , (df k 1)
i1
Ei
第12页/共31页
卡方检验的原理和方法
Pearson定理的基本含义: 如果样本确实是抽自由(P1,P2,…,Pk)代
表的总体,Oi和Ei之间的差异就只是随机误差, 则Pearson统计量可视为服从卡方分布
反之,如果样本不是抽自由(P1,P2,…,Pk) 代表的总体,Oi和Ei之间的差异就不只是是随机 误差,从而使计算出的统计量有偏大的趋势
解:(1)假设 H0 : 鲤鱼体色F2性状分离符合3:1 对 H A : 鲤鱼体色F2性状分离不符合3:1
(2)选取显著水平 0.05
第17页/共31页
(3)检验计算: 计算鲤鱼体色的理论值
体色 F2理论尾数
青灰色 1201.5
卡方检验正式文稿演示
组别 甲组 乙组 合计
阳性数 a c
a+c
阴性数 b d
b+d
合计 a+b=n1 c+d=n2
N
率% a/n1 c/n2 (a+c)/N
各组样 本例数 是固定 的
另一个同样重要的分布—χ2卡方分布(Chisquared distribution)。
此分布在1875年,首先由F. Helmet所提出, 而且是由正态分布演变而来的,即标准正态 分布Z值之平方而得
设Xi为来自正态总体的连续性变量。
ui
Xi
u2 i
(Xi )2 2
12
n
u2 i
类似于方差的计算思想,
(x i X ) (A T 0 )2 (A T )2
Pearson χ2检验的基本公式
残差大小是一个相对的概念,
相对于期望频数为10时,20
的残差非常大;可相对于期
望频数为1000时20就很小了。
因此又将残差平方除以期望
频数再求和,以标准化观察
Karl Pearson (1857 – 1936) 频数与期望频数的差别。
检验统计量:χ2 应用:计数资料
基本概念
例1 某院比较异梨醇(试验组)和氢氯塞嗪 (对照组)降低颅内压的疗效,将200名患者 随机分为两组,试验组104例中有效的99例,对 照组96例中有效的78例,问两种药物对降低颅 内压疗效有无差别?
表 200名颅内高压患者治疗情况
编号 年龄 性别 治疗组 舒张压 体温 疗效
行分类
列分类(Y)
合计
(X) 发生数 未发生数
甲
a=a99
b=b5
1a0+4b
生物统计第七章卡平方测验幻灯片课件
常见心律失常心电图诊断的误区诺如 病毒感 染的防 控知识 介绍责 任那些 事浅谈 用人单 位承担 的社会 保险法 律责任 和案例 分析现 代农业 示范工 程设施 红地球 葡萄栽 培培训 材料
第七章
卡平方( 2)测验
第一节 卡平方( 2)的定义和分布
第二节 2在方差同质性测验中的应用
第三节 适合性测验 第四节 独立性测验
第二节 2在方差同质性测验中的应用
一个样本方差与已知总体方差的统计测验
若从一个总体抽取一个大小为n的样本,算得样本方差
为s2,想了解此总体方差 2是否与已知方差02间有显
著的差异。
两个样本方差是否来自同一总体方差的统计测验
若样本方差s12来自总体方差12,样本方差s22来自总体 方差22,想了解这两个总体方差之间是否有显著差异。
第二节
2在方差同质性测验中的应用
1如值两.果,针尾一是直对测个大 接研验样样 与究时本本u的方u比,问差较计题H与0:,算提2已做出出知22出的一总=推对体2值断0统2方2v可。计v差s利即假1的用:设H统A正:。计态测2分验≠布转02为u
(大端)一尾测验时 H0: 2 ≤ 02 vs HA: 2 > 02 (小端)一尾测验时 H0: 2 ≥ 02 vs HA: 2 < 02
常见心律失常心电图诊断的误区诺如 病毒感 染的防 控知识 介绍责 任那些 事浅谈 用人单 位承担 的社会 保险法 律责任 和案例 分析现 代农业 示范工 程设施 红地球 葡萄栽 培培训 材料
第一节
卡平方( 2)的定义和分布
以前几章介绍u和t的抽样分布,本章引进另一种在统计 推断中十分重要的统计数的抽样分布,即卡平方分布。
第一节
卡平方( 2)的定义和分布
第七章
卡平方( 2)测验
第一节 卡平方( 2)的定义和分布
第二节 2在方差同质性测验中的应用
第三节 适合性测验 第四节 独立性测验
第二节 2在方差同质性测验中的应用
一个样本方差与已知总体方差的统计测验
若从一个总体抽取一个大小为n的样本,算得样本方差
为s2,想了解此总体方差 2是否与已知方差02间有显
著的差异。
两个样本方差是否来自同一总体方差的统计测验
若样本方差s12来自总体方差12,样本方差s22来自总体 方差22,想了解这两个总体方差之间是否有显著差异。
第二节
2在方差同质性测验中的应用
1如值两.果,针尾一是直对测个大 接研验样样 与究时本本u的方u比,问差较计题H与0:,算提2已做出出知22出的一总=推对体2值断0统2方2v可。计v差s利即假1的用:设H统A正:。计态测2分验≠布转02为u
(大端)一尾测验时 H0: 2 ≤ 02 vs HA: 2 > 02 (小端)一尾测验时 H0: 2 ≥ 02 vs HA: 2 < 02
常见心律失常心电图诊断的误区诺如 病毒感 染的防 控知识 介绍责 任那些 事浅谈 用人单 位承担 的社会 保险法 律责任 和案例 分析现 代农业 示范工 程设施 红地球 葡萄栽 培培训 材料
第一节
卡平方( 2)的定义和分布
以前几章介绍u和t的抽样分布,本章引进另一种在统计 推断中十分重要的统计数的抽样分布,即卡平方分布。
第一节
卡平方( 2)的定义和分布
第7章 卡平方(X2)测验
比较, 比较,
则否定H 接受H 如果 ,则否定H0接受HA,即试验总体 不符合理论假设.反之则相反.(P147,例题) 不符合理论假设.反之则相反. P147,例题) 例题
2 X 2 ≥ X α ,( df )
当属性类别数大于2 当属性类别数大于2时,可利用下面的简化 2 公式计算。 公式计算。
Oi 1 χ = ∑ −T T pi
2 0.025
f (χ 2 )
0.6 0.5
不同自由度的分布曲线
0.4
ν =1
0.3
0.2
ν =3
ν =5
0.1
0.0 0 2 4 6 8 10 12
χ2
(二).X2分布的特点
1.X2分布是连续性分布,取值区间为[0, +∞),平 分布是连续性分布,取值区间为[0, ),平 连续性分布 方差为2df 均数µ x2 = df 方差为2df 分布的形状决定于自由度df, df=1时 形状决定于自由度df 2.X2分布的形状决定于自由度df,当df=1时,曲线极 度左偏,呈反J 随着df增大, df增大 度左偏,呈反J形;随着df增大,曲线逐渐趋向对称而 接近于正态分布. df→∞时为正态分布 时为正态分布. 接近于正态分布.当df→∞时为正态分布. 分布是一组动态变化曲线. 一组动态变化曲线 3.X2分布是一组动态变化曲线. 2分布具有可加性,若 x ~ χ 2 , x ~ χ 2 可加性, 4.X 分布具有可加性 1 (n) 2 (m) 则
第三节 独立性测验
什么是独立性测验? 一.什么是独立性测验? 对次数资料探求两个变量间是否彼此独立 的假设检验. 的假设检验.
二.独立性测验的步骤
1.提出假设H 两个变量相互独立; 1.提出假设H0:两个变量相互独立; HA两个 提出假设 变量彼此相关. 变量彼此相关. 2.确定显著水平 2.确定显著水平 3.根据2个变量相互独立的假设, 3.根据2个变量相互独立的假设,计算每一 根据 组的理论数,再计算X 组的理论数,再计算X2值. 4.推断:当算得的X ,则接受 则接受H 4.推断:当算得的X2值< X α2,( df ) ,则接受H0,即 推断 两个变量独立.反之则相反. 两个变量独立.反之则相反.
第7章 卡平方测验
的属性类别分配符合已知属性类别分配的理论或
学说;
若 ≤ (或
2 0.05
2
2 2 ,0.01< c )< 0.01
p≤0.05,表
明实际观察次数与理论次数差异显著,实际观察
的属性类别分配显著不符合已知属性类别分配的
理论或学说;
若 (或
2
2 c )≥
2 0.01
,p ≤0.01,表明实际
2
当df≥2时, (Oi Ei )2
i 1
k
Ei
式计算的 2 与
连续型随机变量 2 相近,这时,可不作连续
性矫正,但要求各组内的理论次数不小于5。
如果某一组的理论次数小于5,则应把它与其
相邻的一组或几组合并 ,直到合并组的理论
次数大于5为止。
第二节 在方差的同质性测验中的应用
homogeneity among variances)。
2 2 H 0 : 12 2 k2 , 对H A : 12、 2、 、 k2不全相等。
这一测验由Bartlett(1937)提出,故又称为 Bartlett测验(Bartlett test)
假如有k个独立的方差估计值:
2
(n 1) s
2
2
(4 1) 175.6 10.54 50
查附表6,在ν=n-1=3时, χ2的临界值为:
2 0.025
9.35,
2 0.975
0.22
现χ2=10.54>
H0被否定。
02.025 9.35 ,在0.22~9.35的范围之外,
总体方差σ2的置信区间
第七章卡平方测验
一个样本方差与已知总体方差的统计测验
若从一个总体抽取一个大小为n的样本,算得样本方差
为s2,想了解此总体方差 2是否与已知方差02间有显
著的差异。
两个样本方差是否来自同一总体方差的统计测验
若样本方差s12来自总体方差12,样本方差s22来自总体 方差22,想了解这两个总体方差之间是否有显著差异。
2020/5/9
附表5是各种ν 1和ν 2下右尾概率为
0.05和0.01时的临界F值表。
该显表著时大专于S供2测2的验总S体12方的差总而体设方计差的是。否
2020/5/9
2020/5/9
第三节 适合性测验
适合性测验是比较实际比率与理论比率之间是否有显
著差异的方法。
例题: 玉米花粉粒中形成淀粉粒或糊精是由一对等位
附表6为时的右尾概率表,当v=12时,
2
0.05
=21.03,它的
统计意义是从总体中以n=13进行抽样,计算出的值大于21.03
的概率有5%。
K.Pearson 根据的定义从属性性状的分布推导出用于次 数资料分析的公式:
2
2020/5/9
(OE)2 其中:O为观察次数,E为理论次数。 E
第二节 2在方差同质性测验中的应用
根据各因素的水平数多少分为:
2×2 相依表的独立性测验 2×C 相依表的独立性测验
R×C 相依表的独立性测验
2020/5/9
2020/5/9
2020/5/9
2020/5/9
2020/5/9
2020/5/9
2020/5/9
第七章 卡平方测验
2020/5/9
第七章 卡平方( 2)测验
第一节 卡平方( 2)的定义和分布
若从一个总体抽取一个大小为n的样本,算得样本方差
为s2,想了解此总体方差 2是否与已知方差02间有显
著的差异。
两个样本方差是否来自同一总体方差的统计测验
若样本方差s12来自总体方差12,样本方差s22来自总体 方差22,想了解这两个总体方差之间是否有显著差异。
2020/5/9
附表5是各种ν 1和ν 2下右尾概率为
0.05和0.01时的临界F值表。
该显表著时大专于S供2测2的验总S体12方的差总而体设方计差的是。否
2020/5/9
2020/5/9
第三节 适合性测验
适合性测验是比较实际比率与理论比率之间是否有显
著差异的方法。
例题: 玉米花粉粒中形成淀粉粒或糊精是由一对等位
附表6为时的右尾概率表,当v=12时,
2
0.05
=21.03,它的
统计意义是从总体中以n=13进行抽样,计算出的值大于21.03
的概率有5%。
K.Pearson 根据的定义从属性性状的分布推导出用于次 数资料分析的公式:
2
2020/5/9
(OE)2 其中:O为观察次数,E为理论次数。 E
第二节 2在方差同质性测验中的应用
根据各因素的水平数多少分为:
2×2 相依表的独立性测验 2×C 相依表的独立性测验
R×C 相依表的独立性测验
2020/5/9
2020/5/9
2020/5/9
2020/5/9
2020/5/9
2020/5/9
2020/5/9
第七章 卡平方测验
2020/5/9
第七章 卡平方( 2)测验
第一节 卡平方( 2)的定义和分布
7卡平方测验
第七章 卡平方(
χ
2
)测验
Contents
第一节 卡平方(
χ2
)的定义和分布
第二节 适合性测验
第三节 独立性测验
卡平方( 第一节 卡平方 χ )的定 的定 义和分布
2
一、问题的引入 (Introduction) )
表7-1
羔羊性别实际观察次数与理论次数
所谓
χ
2 是指相 ,
互独立的多个正态离 差平方值的总和, 差平方值的总和,即:
第二节
一、适合性
适合性测验
χ
2
测验的方法
二、各种遗传分离比例的适合性测验 三、次数分布的适合性测验
一、适合性 χ 2 测验的方法
玉米花粉粒中形成淀粉粒或糊精是一对相对性状。 例:玉米花粉粒中形成淀粉粒或糊精是一对相对性状。 玉米花粉粒中形成淀粉粒或糊精是一对相对性状 淀粉粒遇碘呈蓝色反应, 淀粉粒遇碘呈蓝色反应,因而可以用碘试法直接观察花粉 粒的分离现象。某项实验观察淀粉质与非淀粉质玉米杂交 粒的分离现象。 代花粉粒,经碘处理后有3437粒呈蓝色反应,3482粒 粒呈蓝色反应, 的F1代花粉粒,经碘处理后有 粒呈蓝色反应 粒 呈非蓝色反应。根据遗传学理论可假设玉米花粉粒碘反应 呈非蓝色反应。 粒花粉中, 为1∶1,由此可以计得 ,由此可以计得3437+3482=6916粒花粉中,蓝色 粒花粉中 反应与非蓝色反应的理论次数应各为3459.5粒。设以O代 粒 设以 代 反应与非蓝色反应的理论次数应各为 表观察次数,E代表理论次数,可将上列结果列成表7.2。 表观察次数, 代表理论次数,可将上列结果列成表 。 代表理论次数
=0.2926小于 χ 0.05,1 ,所以接受H0。即认为观察次数和理 小于 2 所以接受 χ
χ
2
)测验
Contents
第一节 卡平方(
χ2
)的定义和分布
第二节 适合性测验
第三节 独立性测验
卡平方( 第一节 卡平方 χ )的定 的定 义和分布
2
一、问题的引入 (Introduction) )
表7-1
羔羊性别实际观察次数与理论次数
所谓
χ
2 是指相 ,
互独立的多个正态离 差平方值的总和, 差平方值的总和,即:
第二节
一、适合性
适合性测验
χ
2
测验的方法
二、各种遗传分离比例的适合性测验 三、次数分布的适合性测验
一、适合性 χ 2 测验的方法
玉米花粉粒中形成淀粉粒或糊精是一对相对性状。 例:玉米花粉粒中形成淀粉粒或糊精是一对相对性状。 玉米花粉粒中形成淀粉粒或糊精是一对相对性状 淀粉粒遇碘呈蓝色反应, 淀粉粒遇碘呈蓝色反应,因而可以用碘试法直接观察花粉 粒的分离现象。某项实验观察淀粉质与非淀粉质玉米杂交 粒的分离现象。 代花粉粒,经碘处理后有3437粒呈蓝色反应,3482粒 粒呈蓝色反应, 的F1代花粉粒,经碘处理后有 粒呈蓝色反应 粒 呈非蓝色反应。根据遗传学理论可假设玉米花粉粒碘反应 呈非蓝色反应。 粒花粉中, 为1∶1,由此可以计得 ,由此可以计得3437+3482=6916粒花粉中,蓝色 粒花粉中 反应与非蓝色反应的理论次数应各为3459.5粒。设以O代 粒 设以 代 反应与非蓝色反应的理论次数应各为 表观察次数,E代表理论次数,可将上列结果列成表7.2。 表观察次数, 代表理论次数,可将上列结果列成表 。 代表理论次数
=0.2926小于 χ 0.05,1 ,所以接受H0。即认为观察次数和理 小于 2 所以接受 χ
第七章卡方检验
? 重点与难点
? 重点:适合性检验、独立性检验的方法 ? 难点: χ 2分布与分割
? 思考题及作业 1、χ 2检验与t检验、F检验在应用上有什么区别? 2、什么情况下检验需作矫正?如何矫正?为什么? 3、为什么要应用分解法来分解总值? 4、习题作业:《标准化综合测试题》第七章1—7题
? 参考书
1.贵州农学院(主编).2001.《生物统计附试验设计》教材. 中国农 业出版社. 115~137页
仅适用
于df=1,而不适用于df>1。当n的数量很大,非连续性作用,即使df=1的情况改
变 ? 2 值也很小。如果df=1,n又很小,不足以计算无偏倚的 ? 2 值,可用直接概
率计算法来计算较为精确的 ? 2 值(计算方法详见本章补充内容)。df=1的资料,
当理论次数很小时,而总的分组格子数中E<5的理论次数不能超过1/5。若遇到
两对性状是否符合9︰3︰3︰1的比例等符合程度的检验。需应用? 2 检验中的
适合性检验来作检验。又如:在方差分析中的方差齐性检验和对所取资料分布 类型是否符合所属的理论分布,都需作适合性检验。此外,对于次数资料两因
子之间是相关性的研究,需应用 ? 2检验中独立性检验,来检验两因子之间是
相互独立还是关联的。如:注射某种疫苗与对该病的防治有无关联。在畜牧生 产中,常对一些数量性状,通过划分不同等级以次数资料的形式表示。如:奶 牛产奶量。以某一产奶量范围而定出高产牛、低产牛,对牛群产量的高低,将 奶牛分成两类。羊的产毛量以剪毛量多少也可分为高、中、低三个等级。这就 是说把数量性状的资料又转化以次数资料的形式来表示时,对其作显著性检验 也必须用独立性检验。 二、? 2 检验的原理
2.扬茂成(主编).1990.兽医统计学。中国展望出版社. 116~134页
? 重点:适合性检验、独立性检验的方法 ? 难点: χ 2分布与分割
? 思考题及作业 1、χ 2检验与t检验、F检验在应用上有什么区别? 2、什么情况下检验需作矫正?如何矫正?为什么? 3、为什么要应用分解法来分解总值? 4、习题作业:《标准化综合测试题》第七章1—7题
? 参考书
1.贵州农学院(主编).2001.《生物统计附试验设计》教材. 中国农 业出版社. 115~137页
仅适用
于df=1,而不适用于df>1。当n的数量很大,非连续性作用,即使df=1的情况改
变 ? 2 值也很小。如果df=1,n又很小,不足以计算无偏倚的 ? 2 值,可用直接概
率计算法来计算较为精确的 ? 2 值(计算方法详见本章补充内容)。df=1的资料,
当理论次数很小时,而总的分组格子数中E<5的理论次数不能超过1/5。若遇到
两对性状是否符合9︰3︰3︰1的比例等符合程度的检验。需应用? 2 检验中的
适合性检验来作检验。又如:在方差分析中的方差齐性检验和对所取资料分布 类型是否符合所属的理论分布,都需作适合性检验。此外,对于次数资料两因
子之间是相关性的研究,需应用 ? 2检验中独立性检验,来检验两因子之间是
相互独立还是关联的。如:注射某种疫苗与对该病的防治有无关联。在畜牧生 产中,常对一些数量性状,通过划分不同等级以次数资料的形式表示。如:奶 牛产奶量。以某一产奶量范围而定出高产牛、低产牛,对牛群产量的高低,将 奶牛分成两类。羊的产毛量以剪毛量多少也可分为高、中、低三个等级。这就 是说把数量性状的资料又转化以次数资料的形式来表示时,对其作显著性检验 也必须用独立性检验。 二、? 2 检验的原理
2.扬茂成(主编).1990.兽医统计学。中国展望出版社. 116~134页
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(大端)一尾测验时 H0: 2 ≤ 02 vs HA: 2 > 02 (小端)一尾测验时 H0: 2 ≥ 02 vs HA: 2 < 02
2.利用试验数据计算一个统计量的值。
计3.算根统据计“量小:概率2 事(件n实01际2)s上2 不可用能d发f=生n-”1原查理2作分判布断表。。
两尾测验时, 2> 2/2或 2 < 21-/2有(1-)概率推翻H0;
两尾测验时,F >F/2或 F < F1-/2有(1-)概率推翻H0;
(大端)一尾测验时, F > F ,则有(1-)概率推翻H0;10
第i 四s节i2 方dfi差S的Si=同dfis质i2 性测lns验i2
1 160.4 19 3047.6 5.0776712多个11样9.本4 方1差9 是否22来68自.6同一总4.体782方47差9 的统计9测0.8验671
计算统计量:
的曲线。
3
第一节 卡平方( 2)的定义和分布
样本容量n不同,计算出的值不同,所以分布与自由度有 关,分布曲线是一系列曲线而不是一条曲线,它随着自由度 的改变而改变,值最小为0,最大为+∞,因而在坐标轴的第 一象限。自由度小时呈偏态,随着自由度增加,偏度降低, 至+∞时,呈现对称分布。该分布的平均数为v,方差为2v。
F ( 1 , 2 )
s 12
s
2 2
7
第二节 2在方差同质性测验中的应用
不同自由度下的F分布曲线
8
第二节 2在方差同质性测验中的应用
F分布的特点:
1、是平均数 F 1 ,取值区间为[0,∞)的一组曲线;
2、在 11和2 2F分布是反向J型,在 1 3 时,曲线转为偏态; 3、F分布下一定区间的概率可以通过书中的附表5查得。
附表5是各种ν 1和ν 2下右尾概率为
0.05和0.01时的临界F值表。 该显表著时大专于S供2测2的验总S体12方的差总而体设方计差的是。否
9
第二节 2在方差同质性测验中的应用
p.4两10个的样附本表方6的差数是值否是来专自为同(一大总端体)一方尾差测的验统使计用测的验。
若两大尾小测为验n怎1的么样办本?方用差附s表12来6只自能总用体方=0差.1或12,=0大.0小2做为。n2的 Fp=样.11121本.94之2例方/间04差.1.是141s7否2属=2 1来有两3.自显尾06总著测, d体差验f 1方异,=1差。H20-:1=21212,=1,想d22f了2v=解s9-这H1A=:两8,个12≠因总为体22方差 F1=.1针3.对06研>究F0的.02/问2 =题F0提.01出= 一5.7对4,统拒计绝假H设0,。判断12 ≠22 。
第七章 卡平方( 2)测验
第一节 卡平方( 2)的定义和分布
第二节 2在方差同质性测验中的应用
第三节 适合性测验 第四节 独立性测验
1
第一节 卡平方( 2)的定义和分布
以前几章介绍u和t的抽样分布,本章引进另一种在统计 推断中十分重要的统计数的抽样分布,即卡平方分布。
从正态总体中抽取n个观察值,构成一个样本,对于每 一个观察值都进行正态标准化,则
附表6为时的右尾概率表,当v=12时,
2
0.05
=21.03,它的
统计意义是从总体中以n=13进行抽样,计算出的值大于21.03
的概率有5%。
K.Pearson 根据的定义从属性性状的分布推导出用于次 数资料分析的公式:
2
(OE)2 其中:O为观察次数,E为理论次数。 E
4
第二节 2在方差同质性测验中的应用
一个样本方差与已知总体方差的统计测验
若从一个总体抽取一个大小为n的样本,算得样本方差
为s2,想了解此总体方差 2是否与已知方差02间有显
著的差异。
两个样本方差是否来自同一总体方差的统计测验
若样本方差s12来自总体方差12,样本方差s22来自总体 方差22,想了解这两个总体方差之间是否有显著差异。
两尾测验时 H0: 12 = 22 vs HA: 12 ≠22
(大端)一尾测验时 H0: 12 ≤ 22 vs HA: 12 >22
2.利用试验数据计算一个统计量用的d值f 1=。n1-1, df 2= n2-1
计算统计量:F s大 2 / s小 2
查 F 分布表。
3.根据“小概率事件实际上不可能发生”原理作判断。
若3总共8有5.7k个样19本,1第62i个8.3样本的4.样45本08方53差si2来8自4.总56体62方
差4i21。26想.1了解1这9 k个2总39体5.9方差之4间.83是70否75有显著9差1.异904。43 21..H利 针0:用对试研12 验 究= 数 的72据 问62 计题= 算提…93一出4=0个一.4统对k2计统vs量计1用9的假.dH1fA4值设=:8k0。。-并8 1非查都相23分6等3布.8表135。
(大端)一尾测验时,
2>
2
,则有(1-)概率推翻H0;
(小端)一尾测验时, 2 < 21- ,则有(1-)概率推翻H0。6
第二节 2在方差同质性测验中的应用
F分布与F测验
从一个正态总体N (μ,σ2)中,分别随机抽取两个 独立样本,分别求得其均方S21和S22 ,将S21和S22 的比值定义为F:
u 1y1,u 2y2, ,u nyn
u 1 2 u 2 2 u n 2 ( y ) 2 ( y 2 ) 2 ( y 2 y ) 2 ( n 1 2 ) s 2
定义为 2
2
第一节 卡平方( 2)的定义和分布
以一定的样本容量n进行抽样,每个样本可以计算一个
2值,这样可以从总体中抽取很多个样本,就可以得到很 多个 2值,得到 2分布的衍生总体,就可以做出 2分布
多个样本方差是否来自同一总体方差的统计测验
若总共有k个样本,第i个样本的样本方差si2来自总体方
差i2。想了解这k个总体方差之间是否有显著差异。
5
第二节 2在方差同质性测验中的应用
1如值两.果,针尾一是直对测个大 接研验样样 与究时本本u的方u比,问差较计题H与0:,算提2已做出出知22出的一总=推对体2值断0统2方2v可。计v差s利即假1的用:设H统A正:。计态测2分验≠布转02为u
2.利用试验数据计算一个统计量的值。
计3.算根统据计“量小:概率2 事(件n实01际2)s上2 不可用能d发f=生n-”1原查理2作分判布断表。。
两尾测验时, 2> 2/2或 2 < 21-/2有(1-)概率推翻H0;
两尾测验时,F >F/2或 F < F1-/2有(1-)概率推翻H0;
(大端)一尾测验时, F > F ,则有(1-)概率推翻H0;10
第i 四s节i2 方dfi差S的Si=同dfis质i2 性测lns验i2
1 160.4 19 3047.6 5.0776712多个11样9.本4 方1差9 是否22来68自.6同一总4.体782方47差9 的统计9测0.8验671
计算统计量:
的曲线。
3
第一节 卡平方( 2)的定义和分布
样本容量n不同,计算出的值不同,所以分布与自由度有 关,分布曲线是一系列曲线而不是一条曲线,它随着自由度 的改变而改变,值最小为0,最大为+∞,因而在坐标轴的第 一象限。自由度小时呈偏态,随着自由度增加,偏度降低, 至+∞时,呈现对称分布。该分布的平均数为v,方差为2v。
F ( 1 , 2 )
s 12
s
2 2
7
第二节 2在方差同质性测验中的应用
不同自由度下的F分布曲线
8
第二节 2在方差同质性测验中的应用
F分布的特点:
1、是平均数 F 1 ,取值区间为[0,∞)的一组曲线;
2、在 11和2 2F分布是反向J型,在 1 3 时,曲线转为偏态; 3、F分布下一定区间的概率可以通过书中的附表5查得。
附表5是各种ν 1和ν 2下右尾概率为
0.05和0.01时的临界F值表。 该显表著时大专于S供2测2的验总S体12方的差总而体设方计差的是。否
9
第二节 2在方差同质性测验中的应用
p.4两10个的样附本表方6的差数是值否是来专自为同(一大总端体)一方尾差测的验统使计用测的验。
若两大尾小测为验n怎1的么样办本?方用差附s表12来6只自能总用体方=0差.1或12,=0大.0小2做为。n2的 Fp=样.11121本.94之2例方/间04差.1.是141s7否2属=2 1来有两3.自显尾06总著测, d体差验f 1方异,=1差。H20-:1=21212,=1,想d22f了2v=解s9-这H1A=:两8,个12≠因总为体22方差 F1=.1针3.对06研>究F0的.02/问2 =题F0提.01出= 一5.7对4,统拒计绝假H设0,。判断12 ≠22 。
第七章 卡平方( 2)测验
第一节 卡平方( 2)的定义和分布
第二节 2在方差同质性测验中的应用
第三节 适合性测验 第四节 独立性测验
1
第一节 卡平方( 2)的定义和分布
以前几章介绍u和t的抽样分布,本章引进另一种在统计 推断中十分重要的统计数的抽样分布,即卡平方分布。
从正态总体中抽取n个观察值,构成一个样本,对于每 一个观察值都进行正态标准化,则
附表6为时的右尾概率表,当v=12时,
2
0.05
=21.03,它的
统计意义是从总体中以n=13进行抽样,计算出的值大于21.03
的概率有5%。
K.Pearson 根据的定义从属性性状的分布推导出用于次 数资料分析的公式:
2
(OE)2 其中:O为观察次数,E为理论次数。 E
4
第二节 2在方差同质性测验中的应用
一个样本方差与已知总体方差的统计测验
若从一个总体抽取一个大小为n的样本,算得样本方差
为s2,想了解此总体方差 2是否与已知方差02间有显
著的差异。
两个样本方差是否来自同一总体方差的统计测验
若样本方差s12来自总体方差12,样本方差s22来自总体 方差22,想了解这两个总体方差之间是否有显著差异。
两尾测验时 H0: 12 = 22 vs HA: 12 ≠22
(大端)一尾测验时 H0: 12 ≤ 22 vs HA: 12 >22
2.利用试验数据计算一个统计量用的d值f 1=。n1-1, df 2= n2-1
计算统计量:F s大 2 / s小 2
查 F 分布表。
3.根据“小概率事件实际上不可能发生”原理作判断。
若3总共8有5.7k个样19本,1第62i个8.3样本的4.样45本08方53差si2来8自4.总56体62方
差4i21。26想.1了解1这9 k个2总39体5.9方差之4间.83是70否75有显著9差1.异904。43 21..H利 针0:用对试研12 验 究= 数 的72据 问62 计题= 算提…93一出4=0个一.4统对k2计统vs量计1用9的假.dH1fA4值设=:8k0。。-并8 1非查都相23分6等3布.8表135。
(大端)一尾测验时,
2>
2
,则有(1-)概率推翻H0;
(小端)一尾测验时, 2 < 21- ,则有(1-)概率推翻H0。6
第二节 2在方差同质性测验中的应用
F分布与F测验
从一个正态总体N (μ,σ2)中,分别随机抽取两个 独立样本,分别求得其均方S21和S22 ,将S21和S22 的比值定义为F:
u 1y1,u 2y2, ,u nyn
u 1 2 u 2 2 u n 2 ( y ) 2 ( y 2 ) 2 ( y 2 y ) 2 ( n 1 2 ) s 2
定义为 2
2
第一节 卡平方( 2)的定义和分布
以一定的样本容量n进行抽样,每个样本可以计算一个
2值,这样可以从总体中抽取很多个样本,就可以得到很 多个 2值,得到 2分布的衍生总体,就可以做出 2分布
多个样本方差是否来自同一总体方差的统计测验
若总共有k个样本,第i个样本的样本方差si2来自总体方
差i2。想了解这k个总体方差之间是否有显著差异。
5
第二节 2在方差同质性测验中的应用
1如值两.果,针尾一是直对测个大 接研验样样 与究时本本u的方u比,问差较计题H与0:,算提2已做出出知22出的一总=推对体2值断0统2方2v可。计v差s利即假1的用:设H统A正:。计态测2分验≠布转02为u