第四章 卡方检验.ppt
合集下载
《卡方检验正式》课件
卡方检验的结果可以直接解释为实际意义 ,例如,如果卡方值较大,则说明观察频 数与期望频数存在显著差异。
缺点
对数据要求高
卡方检验要求数据量较大,且各分类的期望频数不能太小,否则可能 导致结果不准确。
对离群值敏感
卡方检验对离群值比较敏感,离群值可能会对结果产生较大的影响。
无法处理缺失值
卡方检验无法处理含有缺失值的数据,如果数据中存在缺失值,需要 进行适当的处理。
案例二:市场研究中的卡方检验
总结词
市场研究中,卡方检验用于评估不同市 场细分或产品特征与消费者行为之间的 关联。
VS
详细描述
在市场研究中,卡方检验可以帮助研究者 了解消费者对不同品牌、产品或服务的偏 好。例如,通过比较不同年龄段消费者对 某品牌的选择比例,企业可以更好地制定 市场策略和产品定位。
案例三:社会调查中的卡方检验
小,表示两者之间的差异越小。通常根据卡方值的概率水平来判断差异
是否具有统计学显著性。
02
卡方检验的步骤
建立假设
假设1
观察频数与期望频数无显著差异
假设2
观察频数与期望频数有显著差异
收集数据
从样本数据中获取观察频数 确定期望频数,可以使用理论值或预期频数
制作交叉表
将收集到的数据整理成二维表格形式,行和列分别表示分类变量
卡方检验的基本思想
01
基于假设检验原理
卡方检验基于假设检验的原理,通过构建原假设和备择假设,利用观测
频数与期望频数的差异来评估原假设是否成立。
02
比较实际观测频数与期望频数
卡方检验的核心是比较实际观测频数与期望频数,通过卡方值的大小来
评估两者之间的差异程度。
03
《卡方检验》课件
制作交叉表
确定交叉表的行列变量
根据研究目的和内容,选择合适的行列变量,构建交叉表。
制作交叉表
将分组后的数据按照行列变量制作成交叉表,以便于进行卡 方检验。
计算理论频数
确定期望频数
根据交叉表中的数据,结合各组 的概率计算期望频数。
计算理论频数
根据期望频数和实际频数计算理 论频数,为后续的卡方检验提供 依据。
计算卡方值
计算卡方值
使用卡方检验的公式计算卡方值,该 值反映了实际频数与理论频数的差异 程度。
自由度的确定
在计算卡方值时,需要确定自由度, 自由度通常为行数与列数的减一。
显著性水平的确定
选择显著性水平
显著性水平是衡量卡方值是否显著的指标,通常选择0.05或0.01作为显著性水 平。
判断显著性
根据卡方值和自由度,结合显著性水平判断卡方检验的结果是否显著,从而得 出结论。
3.84、6.63等),可以确定观测频数与期望频数之间的差异是否具有统
计学显著性。
02
卡方检验的步骤
收集数据
确定研究目的
制定调查问卷或收集程序
在开始收集数据之前,需要明确研究 的目的和假设,以便有针对性地收集 相关数据。
根据研究目的和内容,制定合适的调 查问卷或建立数据收集程序,确保数 据的完整性和准确性。
详细描述
例如,在市场调研中,我们可以通过卡方检验来分析不同年龄段、性别、职业等 人群对于某产品的态度或购买意愿是否有显著差异,从而为产品定位和营销策略 提供依据。
实际案例二:医学研究中的应用
总结词
在医学研究中,卡方检验常用于病例 对照研究和队列研究中的分类变量关 联性分析。
详细描述
例如,在病例对照研究中,我们可以 通过卡方检验来比较病例组和对照组 在某些基因型、生活方式或暴露因素 上的分布是否有统计学差异,从而探 讨病因或危险因素。
医学统计方法之卡方检验PPT课件
3、查界值表,确定P值,做出推断结论
查χ2界值表,υ=6,χ20.05(6)=12.59, χ2 > χ20.05(1) ,则 P<0.05,在α=0.05的水准下,拒绝H0,认为三个不同地区 的人群血型分布总体构成比有差别。
.
38
二、多个样本率间多重比较
行×列表χ2检验的结果说明差异有统计学意义,需作两 两比较时,先调整α值,再进行率的两两比较。
配对检验公式推导:
bc
(+,)和(,+)两个格子中的理论频数均为
2
b c 40时
2
(AT)2(b b c )2 2(c b c)22
T
bc
bc
2
2
(b c)2
bc
~ 2 分布
同理可得b c 40时
1
校正公式: 2 (| A T | 0.5)2 (| b c | 1)2
表8-5 两种培养基的培养结果
B培养基
A培养基
+
-
合计
+
48
24
72
-
20
106
126
合计
68
130
198
A 培养基 B培养基
痰标本 1 2 3 4 5 6 7 8 9 10 11 12 13 14
结果统计
A培养基 + + + + + + + + + + -
B培养基 + + + + + + + -
合计
145 109 254 57.09
1.建立检验假设并确定检验水准
卡方检验ppt课件
2检验 (chi-square test)
.5
.4
ν=1
.3
.2
ν=3
ν=6
.1
ν=பைடு நூலகம்0
0.0
0
5
10
15
20
25
1
主要内容
2分布
– 了解2分布的基本思想和2分布曲线
四格表资料的2检验
– 掌握应用条件、基本思想和检验过程
配对设计资料的2检验
– 掌握应用条件、基本思想和检验过程
2分布的形状依赖于自由度ν的大小,当 ν≤2时,曲线呈L型;随着ν的增加,曲线 逐渐趋于对称;当ν→∞时, 2分布趋向正 态分布。
3
2分布曲线
.5
.4
ν=1
.3
.2
ν=3
ν=6
.1
ν=10
0.0 0
5
10
15
20
25
4
2 检验
2检验是一种用途非常广泛的以2分布 为理论依据的假设检验方法,主要用于:
14
本例的2检验
H0:π1=π2,即两种给药方法的总体不良 反应发生率相同
H1:π1≠π2,即两种给药方法的总体不良 反应发生率不同
α=0.05
15
本例的2检验
2 (A T )2 (35 30.76)2 (74 78.24)2 (22 26.24)2 (71 66.76)2 1.771
实际频数:表内各格数字为实际资料的数字。
10
2 检验的基本思想
实际频数和理论频数差异的大小可以用2值的大
小来说明,当样本量n和各个按检验假设计算的理
论频数T都足够大时,比如n≥40,T≥5, 似于2分布,n越大,近似程度越好。
.5
.4
ν=1
.3
.2
ν=3
ν=6
.1
ν=பைடு நூலகம்0
0.0
0
5
10
15
20
25
1
主要内容
2分布
– 了解2分布的基本思想和2分布曲线
四格表资料的2检验
– 掌握应用条件、基本思想和检验过程
配对设计资料的2检验
– 掌握应用条件、基本思想和检验过程
2分布的形状依赖于自由度ν的大小,当 ν≤2时,曲线呈L型;随着ν的增加,曲线 逐渐趋于对称;当ν→∞时, 2分布趋向正 态分布。
3
2分布曲线
.5
.4
ν=1
.3
.2
ν=3
ν=6
.1
ν=10
0.0 0
5
10
15
20
25
4
2 检验
2检验是一种用途非常广泛的以2分布 为理论依据的假设检验方法,主要用于:
14
本例的2检验
H0:π1=π2,即两种给药方法的总体不良 反应发生率相同
H1:π1≠π2,即两种给药方法的总体不良 反应发生率不同
α=0.05
15
本例的2检验
2 (A T )2 (35 30.76)2 (74 78.24)2 (22 26.24)2 (71 66.76)2 1.771
实际频数:表内各格数字为实际资料的数字。
10
2 检验的基本思想
实际频数和理论频数差异的大小可以用2值的大
小来说明,当样本量n和各个按检验假设计算的理
论频数T都足够大时,比如n≥40,T≥5, 似于2分布,n越大,近似程度越好。
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4.1 适合度检验
④ SPSS 点击确定。再点击菜单分析→非参数检验 →旧对话框→卡方:
4.1 适合度检验
④ SPSS
弹出对话框,将数量选择到检验变量列表中,在 期望值下面选择值,按比例从小到大分别输入1, 添加,3,添加:
4.1 适合度检验
④ SPSS
点击确定,即可得到结果:
4.1 适合度检验
4.1 适合度检验
①卡方M值ini为tab302.629,p=0.000<0.01,表明 点实击际比确率定与,理即论可比得有到非结常果显:著的差异。
4.1 适合度检验
② 6SQ统计插件 输入数据,第一列为分类,这里为颜色,
即青灰色与红色;第二列为实际的观测值; 第三列为理论比率,要小数形式,这里为 0.75与0.25。选择数据,点击菜单6SQ统 计→表格→卡方拟合优度检验(单变量):
④ SPSS 定义变量,输入数据,点击菜单数据→
加权个案,弹出对话框,选择加权个案, 将数量选择到频率变量下面,点击确定。 再点击菜单分析→非参数检验→旧对话框 →卡方,弹出对话框,将数量选择到检验 变量列表中,在期望值下面选择值,按比 例从小到大分别添加1,3,3,9:
4.1 适合度检验
④ SPSS 点击确定,即可得到结果:
4.1 适合度检验
① Minitab 输入数据,点击菜单统计→表格→卡方
拟合优度检验(单变量):
4.1 适合度检验
① Minitab 弹出对话框,将实际选择到观测计数后面, 颜色选择到类别名称(可选)后面。检验 下面选择按历史计数制定的比率,下拉条 选择输入列,将理论选择到按历史计数制 定的比率后面:
nN
1 6 00
4.1 适合度检验
利用Excel函数BINOMDIST(i,n,p,0)计算二 项分布的理论概率:
4.1 适合度检验
将理论概率乘以苹果总箱数(N=60),得 到理论次数:
4.1 适合度检验
将计算理并论合并次了数理小论概于率5与的理组论与次数邻后近,组就可合以并用,Mi直nita到b、 次6数S是Q数统服大计从插二于件项5、分;D布同P的S解时。题合,并p=0实.94际31观>0.测05,次因数此与苹果理变论质 概率:
4.1 适合度检验
② 6SQ统计插件 弹出对话框,无需修改设置:
4.1 适合度检验
②卡方6S值Q为统3计02插.6件29,p=0.000<0.01,表明 点观击测确值定比,例即 与可 理得 论到 比结 有果 非: 常显著的差异。
4.1 适合度检验
③ DPS (1)输入数据与选择数据,点击菜单分类 数据统计→模型拟合优度检验:
4.1 适合度检验
例 4.3 某批苹果进行保存实验,共60箱, 每箱10个,实验结束后检查每箱苹果的变 质情况,结果如下表,试检验苹果的变质 数是否服从二项分布?
4.1 适合度检验
设每个苹果变质的平均概率为p,变质数x 服测从值二的项平分均布 数,p即估x计~B:(10,p)。p根据实际观
p f x0 8 1 1 5 2 2 0 3 1 0 4 5 5 2 0.1
第四章 卡方检验
卡方(χ2)检验主要有三种类型:
第一是适合性检验,比较观测值与理论值 是否符合;
第二是独立性检验,比较两个或两个以上 的因子相互之间是独立还是相互有影响。
4.1 适合度检验
例4.1 有一鲤鱼遗传试验,以红色和青灰色 杂交,其F2代获得不同分离尾数,问观测 值是否符合孟德尔3:1遗传定律?
4.2 独立性检验
又叫列联表(contigency table)χ2检验,它 是研究两个或两个以上因子彼此之间是独 立还是相互影响的一类统计方法。
4.2.1 2×2列联表(四格表资料)的独ห้องสมุดไป่ตู้性检验
4试.2检.1验.1两需种要人校群正患的病四比格例表有资无料显的著χ2差检异验? 例4.4 现随机抽取吸烟人群与不吸烟人群,检查 是否患有气管炎,结果如下表所示:
4.2.1.1 需要校正的四格表资料的χ2检验
本例资料经整理成四格表形式,即有两个 处理组,每个处理组的例数由发生数和未 发生数两部分组成。表内有
4.1 适合度检验
① Minitab 弹出对话框,将实际选择到观测计数后
面,豌豆性状选择到类别名称(可选)后 面。检验下面选择按历史计数制定的比率, 下拉条选择输入列,将理论选择到按历史 计数制定的比率后面:
4.1 适合度检验
①卡方M值ini为tab0.470024,p=0.925>0.05,表明 点实击际分确离定比,与即理可论得比到无结显果著:的差异。
例4.2 孟德尔用豌豆的两对性状进行杂交试 验,黄色圆滑种子与绿色皱缩种子的豌豆 杂交后,F2 分离情况为:黄圆315粒,黄 皱101粒,绿圆108粒,绿皱32粒,共556 粒,问结果是否符合理论比9:3:3:1?
4.1 适合度检验
① Minitab 输入数据,点击菜单统计→表格→卡方
拟合优度检验(单变量):
4.1 适合度检验
③ DPS (1)输入数据与选择数据,点击菜单分类 数据统计→模型拟合优度检验:
4.1 适合度检验
③结果D中P卡S 方值为0.4700(即Pearson卡方值,对 立应的刻p得值到为0结.9果25:4,大于0.05,说明实际观测值
与孟德尔理论分离比9:3:3:1无显著差异。
4.1 适合度检验
4.1 适合度检验
③根据D理P论S比3:1,结果给出了理论值为1201.5与400.5。 立结值果为刻中0.得0卡00方到0值,结为小果3于0:01..0612,63说(明即实Pe际ar观so测n卡值方与值孟,德对尔应理的论p
分离比3:1是有非常显著差异的。
4.1 适合度检验
④ SPSS 定义变量,输入数据,点击菜单数据→加 权个案,弹出对话框,选择加权个案,将 数量选择到频率变量下面:
4.1 适合度检验
② 6SQ统计插件 输入数据,第一列为分类,这里为豌豆
性状;第二列为实际的观测值;第三列为 理论比率,要小数形式。选择数据,点击 菜单6SQ统计→表格→卡方拟合优度检验 (单变量):
4.1 适合度检验
弹出对话框,无需修改设置:
4.1 适合度检验
点卡击方确值定为,0.4即70可0得,到p=结0.果92:5>0.05,表明观 测值的分离比与理论比无显著的差异。