重庆大学生物统计学_第五章 卡方检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

卡方 (χ2) 分布的函数
( ) CHIDIST:自由度为n的卡方分布在x点处的单尾概率 P χ2 > x
CHIINV: 返回自由度为n的卡方分布的单尾概率函数的逆函 数• CHIDIST •
X•
需要计算分布的数字(X非负值) •
Degrees_freedom • 自由度 •
CHIINV • Probability • 卡方分布的单尾概率 • Degrees_freedom • 自由度 •
没有关联 • 2. 规定显著性水平 • 3. 根据无效假设计算出理论数 • 4. 根据规定的显著水平和自由度计算出卡方值,
再和计算的卡方值进行比较。 • 如果接受假设,则说明因子之间无相关联,
是相互独立的 • 如果拒绝假设,则说明因子之间的关联是显
著的,不独立 •
一、2X2列联表的独立性检验 •
设A、B是一个随机试验中的两个事件,其中A可能 出现r1、r2个结果,B可能出现c1、c2个结果,两 因子相互作用形成4个数,分别以O11、O12、O21、 O22表示,即 • 2X2列联表的一般形式 •
故应否定H0,接受HA,认为鲤鱼体色F2性状比不符合3:1比率
(4)推断:由CHIINV(0.025, 1)=6.63, 即 χ c 2 > χ0 2.05(1),即P<0.05
故应否定H0,接受HA,认为鲤鱼体色F2性状比不符合3:1比率
独立性检验 •
步骤: • 1. 提出无效假设,即认为所观测的各属性之间
故应否定H0,接受HA,认为吸烟与患气管病极显著相关
(4)推断:由CHIINV(0.025, 1)=6.63, 即 故应否定H0,接受HA,认为吸烟与患气管炎病密切相关
二、rXc列联表的独立性检验 •
rXc列联表是指r>2, c>2的计数资料,一般形式如下 rXc列联表的一般形式 •
1
2

c
总和
1
∑ 概率分布时,统计量 2 k (ni −npi) 2
χ= i=1
npi
随着n的增加渐近于自由度df=k-1的卡方分布。其中 P1,P2,…,Pk为k种不同属性出现的频率,n为样
本容量,ni为样本中第i种属性出现的次数,是观 测值,记为Oi,pi为第i种属性出现的概率,npi则 可以看成理论上该样本第i种属性出现的次数,理
(3)检验计算: • 计算鲤鱼体色的理论值 •
体色 F2理论尾数
青灰色 1201.5
红色 400.5
总数 1602
k
( ) 2 ∑ χc =
i=1
2
Oi −Ei −0.5 =301.63
Ei
( ) (4)推断:由CHIDIST(301.63, 1)=1.45E-67,即P χ 2 >301.63 <0.01
CHITEST Actual_range Expected_range
观察值的数据区域
行列汇总的乘积与总计值之比率的 数据区域
不同年龄用碘剂治疗甲状腺肿效果比较 •
年龄 11~30 31~50 50岁以上 总和
治愈 67 32 10 109
显效 9 23 11 43
好转 10 20 23 53
计算联表中的各项的理论次数 •Actual_range
由度df=1时,有较大偏差,为此需要进行矫正: •
• •
k
( ) 2 ∑ χc =
i=1
2
Oi − Ei −0.5 Ei
当自由度df>1时,与连续型随机变量卡方分相 近似,这时可以不做连续性矫正 •
注意:要求各个组内的理论次数不小于5,如某 组理论次数小于5,则应把它与其相邻的一组或 几组合并,知道理论次数大于5为止 •

对 HA : 治疗效果与年龄有关
(2)选取显著水平 α = 0.05
(3)检验计算: • 计算联表中的各项的理论次数 •
年龄 11~30 31~50 50岁以上 总和
治愈 45.29 39.32 24.39 109
显效 17.87 15.51 9.62
43
好转 20.02 19.12 11.86
论值记为:Ei,即 •
卡方检验的原理和方法 •
Pearson定理的基本含义: •
如果样本确实是抽自由(P1,P2,…,Pk)代 表的总体,Oi和Ei之间的差异就只是随机误差, 则Pearson统计量可视为服从卡方分布 •
反之,如果样本不是抽自由(P1,P2,…,Pk) 代表的总体,Oi和Ei之间的差异就不只是是随机 误差,从而使计算出的统计量有偏大的趋势 •
r1 r2 总和
c1 O11 O21 C1=O11+O21
c2 O12 O22 C2=O12+O22
总和 R1=O11+O12 R2=O21+O22
T
一、2X2列联表的独立性检验 •
2X2列联表的卡方检验步骤: •
1、提出无效假设H0:事件A和B无关,即事件A和B 相互独立,同时给出HA:事件A和B有关联关系 •
不同年龄用碘剂治疗甲状腺肿效果比较 •
年龄
治愈
显效
好转 无效 总和
11~30
67
9
10
5
91
31~50
32
23
20
4
79
50岁以上
10
11
23
5
49
总和
109
43
53
14
219
分析:1)独立性检验问题 • 2) 自由度为df=(4-1)*(3-1)=6,不需要连续性矫正 •
解:(1)假设 H0 : 治疗效果与年龄无关
应用统计学
第五章 卡方检验
主讲:涂昀 • 重庆大学生物工程学院 •
卡方检验的用途 •
同质性检验 适合性检验 独立性检验
一个样本方差和 • 总体方差是否相同 •
观察值和理 论值是否符合 •
两个或两个 以上因素之 间是否相关 •
计数 资料 和 属性 资料 •
卡方检验的原理和方法 •
Pearson定理:当(P1,P2,…,Pk)是总体的真实
年龄 11~30 31~50 50岁以上 总和
治愈 45.29 39.32 24.39 109
显效 17.87 15.51 9.62
43
好转 20.02 19.12 11.86
53
CHITEST=3.81E-8 •
无效 5 4 5 14
总和 91 79 49 219
Expected_range
无效 总和
因此,对Pearson统计量进行单尾检验(即 右尾检验)可用于判断离散型资料的观测值与理 论值是不是吻合 •
卡方检验的原理和方法 •
统计假设: •
H0:观测值与理论值的差异是由随机误差引起 • HA:观测值与理论值之间有真实差异 • •
所以卡方值是度量实际观测值与理论值偏南 程度的一个统计量 • •
5.82
91
5.05
79
3.13
49
14
219
谢谢
适合性检验 •
适合性检验(吻合性检验或拟合优度检验) • 步骤: •
1. 提出无效假设,即认为观测值和理论值之间 没有差异 •
2. 规定显著性水平 • 3. 计算样本卡方值 • 4. 根据规定的显著水平和自由度计算出卡方值, 再和实际计算的卡方值进行比较 •
例:有一鲤鱼遗传试验,以荷包鲤鱼(红色,隐性)与湘江 野鲤(青灰色,显性)杂交,其F2获得下表的所列的体色分 离尾数,问这一资料的实际观测值是否符合孟德尔一对等位 基因的遗传规律? •
(2)选取显著水平 α = 0.05
(3)检验计算: • 计算联表中的各项的理论次数 •
不同人群 吸烟人群 不吸烟人群
总和Cj
患病 33 22 55
不患病 267 178 445
总和Ri 300 200
T=500
k
( ) 2 ∑ χc =
i=1
2
Oi −Ei −0.5 = 23.174
Ei
( ) (4)推断:由CHIDIST(23.174, 1)=1.48E-6,即 P χ 2 > 23.174 <0.01
53
无效 5.82 5.05 3.13 14
总和 91 79 49 219
( ) (4)推断:由CHIDIST(46.988, 6)=1.88E-8,即 P χ 2 > 23.174 <0.01
故应否定H0,接受HA,认为治疗效果与年龄极显著相关
卡方 (χ2) 检验的函数
CHITEST:相关性检验函数,得到相关性的概率值
卡方值越小,表明观测值与理论值越接近 • 卡方值越大,表明观测值与理论值相差越大 •
卡方值为0,表明H0严格成立,且它不会有下侧 否定区,只能进行右尾检验 •
卡方检验的原理和方法 •
由于离散型资料的卡方检验只是近似地服从连 续型变量的卡方分布,所以在对离散型资料进行 卡方检验计算的时,结果常常偏低,特别是当自
O11
O12

O1c
R1
2
O21
O22

O2c
R2
……



r
Or1
Or2

Orc
总和 C1
C2

Cc
T
二、rXc列联表的独立性检验 •
rXc列联表的一般理论值形式 •
1
1 2 … r 总和
R1C1/T R2C1/T
… RrC1/T
C1
2
R1C2/T R2C2/T
… RrC2/
C2

c
总和
… R1Cc/T R1
2、给出显著水平 •
3、依据H0,可以推算出理论值,计算卡方值 • 4、进行推断 •
2X2列联表的一般理论值形式 •
r1
r2 总和
c1 R1*C1/T R2*C1/T C1=O11+O21
c2 R1*C2 /T R2*C2/T C2=O12+O22
总和
R1=O11+O12 R2=O21+O22
T
例:现随机抽样对吸烟人群和不吸烟人群是否患有气管炎病 进行了调查,其调查结果如下表,试检验吸烟与患气管炎病 有无关联? •
… R2Cc/T R2


… RrCc/T

Cc
T
二、rXc列联表的独立性检验 •
rXc列联表中各项理论频率的计算方法如2X2列联
表,即:Eij=(RiCj/T),由于自由度df=(r-1)( c-1),由
于r>2, c>2,故自由度df>1,因而不需要进行连续性矫
正,其计算公式如下:

例:某医院用碘剂治疗地方性甲状腺肿,不同年龄的治疗效 果如下表,试检验不同年龄的治疗效果有无差异? •
不同人群患气管炎病调查 •
不同人群 吸烟人群 不吸烟人群 总和Cj
患病 50 5 55
不患病 250 195 445
总和Ri 300 200
T=500
分析:1)独立性检验问题 • 2) 自由度为df=(2-1)*(2-1)=1,需要连续性矫正 •
解:(1)假设 H0 : 吸烟与患气管炎无关

对 HA : 吸烟与患气管炎有关联
鲤鱼遗传试验F2观测结果 •
体色 F2观测尾数
青灰色 1503
红色 99
总数 1602
分析:1)适合性检验问题 • 2) 自由度为(2-1)=1,需要连续性矫正 •
解:(1)假设 H0 : 鲤鱼体色F2性状分离符合3:1

对 HA : 鲤鱼体色F2性状分离不符合3:1 •
(2)选取显著水平 α = 0.05
相关文档
最新文档