生物统计学—卡方检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

CHIINV Probability Degrees_freedom
卡方分布的单尾概率 自由度
精品课件
卡方检验基础
2检验是以2分布为基础的一种假设检验 方法,主要用于分类变量,根据样本数据推 断总体的分布与期望分布是否有显著差异, 或推断两个分类变量是否相关或相互独立。
精品课件
卡方检验基础
2值的计算:
其否定 2 区 2为 和 2 : 2
1
2
2
精品课件
例:已知某农田受到重金属污染,经抽样测定铅浓度分别为:
4.2, 4.5, 3.6, 4.7, 4.0, 3.8, 3.7, 4.2 (ug/g),方差为
0.150, 试检验受到污染的农田铅浓度的方差是不是和正常 浓度铅浓度的方差(0.065)相同
分析:1)一个样本方差同质性检验
由于离散型资料的卡方检验只是近似地服
从连续型变量的卡方分布,所以在对离散型资料
进行卡方检验计算的时,结果常常偏低,特别是
当自由度df=1时,有较大偏差,为此需要进行矫
正:
k c2 i1

精品课件
卡方 (c2) 分布
总体
m
选择容量为n 的 简单随机样本 计算样本方差S2
计算卡方值
2 = (n-1)S2/σ2
计算出所有的
2值
精品课件
不同容0
2
卡方 (c2) 分布的特点
不同容量样本的抽样分布
1、 2分布是一个以自由度n为参数
的分布族,自由度n决定了分布的 形状,对于不同的n有不同的卡方 分布
如果样本确实是抽自由(P1, P2,…,Pk)代表的总体,Oi和Ei之间的差异就只
是随机误差,则Pearson统计量可视为服从卡方 分布
反之,如果样本不是抽自由(P1, P2,…,Pk)代表的总体,Oi和Ei之间的差异就不
只是是随机误差,从而使计算出的统计量有偏大 的趋势
因此,对Pearson统计量进行单尾检 验(即右尾检验)可用于判断离散型资料的观测 值与理论值是不是吻合
精品课件
卡方检验的用途
同质性检验 适合性检验 独立性检验
一个样本方差和 总体方差是否相同
观察值和理论 值是否符合
两个或两个以 上因素之间是 否相关
计数 资料 和 属性 资料
精品课件
一个样本方差的同质性检验
从标准正态总体中抽取k个独立u2之和为
卡方2
2x m212xm2
当用样本平均数估计总体平均数时,有:
2)事先不知道受污染的农田与正常农田的铅浓度 方差的大小,故双尾检验
解:(1)假设 H0:2 0.065
即受到污染的农田铅
浓度的方差与正常农田铅浓度的方H差A:相2 同0,.0对65
(2)选取显著水平 0.05
((34))检推验断计:2 当算d(k f= 1 2 )8s-21 =87 ,0 1 .0 由0 .6 1 CHI5 5 IN10 V.(1 6 0.5 025,7)=16.01,
X ~ 2(n1) ,Y ~ 2(n精2)品课件则 X + Y ~ 2(n1+
卡方 (c2) 分布的函数
CHIDIST:自由度为n的卡方分布在x点处的单尾概率 P2x
CHIINV: 返回自由度为n的卡方分布的单尾概率函数的逆函数
CHIDIST X
Degrees_freedom
需要计算分布的数字 (X>0) 自由度
212 xx2
将样本方差代入,则:2
(k
1)s2
2
其2服从自由度为(k-1)的卡方分布
精品课件
卡方函数的使用
假设 H0:20 2, 适用右 , 尾 其 检 否 验 定 2区 2 为
假设 H0:20 2, 适用左 , 尾 其 检 否 验 定 2区 12 为
假设 H0:20 2, 适用双 , 尾检验
精品课件
卡方检验的原理和方法
统计假设:
H0:观测值与理论值的差异是由随机误差
引起
HA:观测值与理论值之间有真实差异
所以卡方值是度量实际观测值与理论值 偏南程度的一个统计量
卡方值越小,表明观测值与理论值越接近 卡方值越大,表明观测值与理论值相差越 大
精品课件
卡方值为0,表明H 严格成立,且它不会有
卡方检验的原理和方法

2
2 0.025
否定H0,接受HA,即样本方差与
总体方差试不同质的,认为受到污染的农田铅浓度的
方差与正常农田的方差有显著差异
精品课件
卡方检验的原理和方法
Pearson定理:当(P1,P2,…,Pk)是总体的真实
概率分布时,统计量 2 k ni npi2
i1 npi
随着n的增加渐近于自由度df=k-1的卡方分布。其
中P1,P2,…,Pk为k种不同属性出现的频率,n为 样本容量,ni为样本中第i种属性出现的次数,是 观测值,记为Oi,pi为第i种属性出现的概率,npi 则可以看成理论上该样本第i种属性出现的次数,
理论值记为:Ei,即 k 2
Oi Ei2,(dfk1)
E i1
i
精品课件
卡方检验的原理和方法
Pearson定理的基本含义:
n=1 n=4 n=10
n=20
2、卡方分布于区间[0, ),是一种 非对称分布。一般为正偏分布 c2
3、卡方分布的偏斜度随自由度降低而增大,当自由度
为1时,曲线以纵轴为渐近线;当自由度增大的时,
分布曲线渐趋近左右对称,当自由度大于等于30的 时候,卡方分布接近正态分布
4、卡方分布具有“可加性”
X、Y 独立,
应用统计学
第五章 卡方检验
精品课件
卡方 (c2) 分布
设总体服从正态分布N ~ (μ, σ2 ), X1 ,X2,…,Xn为来自该正态总体的样本, 则样本方差 s2 的分布为
(n1)s2
2
~2(n1)
将2(n – 1)称为自由度为(n-1)的卡方
分布
主要适用于对拟合优度检验和独立
性检验,以及对总体方差的估计和检验
2 (A E)2 E
由英国统计学家Karl Pearson首次提出,故被 称为Pearson 2 。
精品课件
卡方检验基础-用途
检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态 分布等
检验某个分类变量各类的出现概率是否等于指定概率 检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关 检验控制某种或某几种分类变量因素的作用之后,另两个分类变量是 否独立,如上例控制年龄、性别之后,吸烟是否与呼吸道疾病有关 检验两种方法的结果是否一致,如两种诊断方法对同一批人进行诊断, 其诊断结果是否一致
相关文档
最新文档