最新 人教A版 选修2-3数学 公开课课件:3.2《独立性检验的基本思想及其初步应用》ppt课件

合集下载

(独立性检验的基本思想及其初步应用)人教版高中数学选修2-3教学课件(第3.2课时)

(独立性检验的基本思想及其初步应用)人教版高中数学选修2-3教学课件(第3.2课时)

5.024 6.635 7.879 10.83
(2)利用K2公式,计算随机变量K2的观测值k.
(3)如果k>k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过a;否则,就认为在犯错误的概率不超过a的前提下不能 推断“X与Y有关系”.
第十九页,共三十四页。
新知探究
例题
在一次恶劣气候的飞行航行中调查男女乘客在机上晕机的情况如下表所示,据此资料你是否能认为在恶劣气候飞行中男 性比女性更容易晕机?
第二十八页,共三十四页。
课堂练习
2.解答题 (1)在研究某种新药对小白兔的防治效果时,得到下表数据:
未用新药 用新药 总计
存活数 101 129 230
死亡数 38 20 58
试分析新药对防治小白兔是否有效?
总计 139 149 288
第二十九页,共三十四页。
课堂练习
解答
根据上表计算出随机变量的观测值
第二页,共三十四页。
课前导入
假设“面包分量足”,则一年购买面包的质量数据的平均值应该不少于1000g ; “这个平均值不大于950g”是一个与假设“面包分量足”矛盾的小概率事件; 这个小概率事件的发生使庞加莱得出推断结果. 庞加莱应是如何证明自己的假设呢?
第三页,共三十四页。
新知探究
知识要点
1.分类变量 变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. 举例:性别,是否吸烟,宗教信仰,国籍等. 在日常生活中,我们常常关心两个分类变量之间是否具有关系.例如,吸烟是否与患肺癌有关系?性别是否对于
第十三页,共三十四页。
新知探究
2. 独立性检验
上面这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立 性检验. 知识要点 独立性检验的基本思想类似于数学上的反证法.

3.2独立性检验的基本思想及其初步应用 课件(人教A版选修2-3)

3.2独立性检验的基本思想及其初步应用 课件(人教A版选修2-3)

3. 独立性检验临界值表
P(K2 ≥k 0 ) k0
0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
想一想:在K2运算时,在判断变量相关时,若K2的观测值k= 56.632,则P(K2≥6.635)≈0.01和P(K2≥10.828)≈0.001, 哪种说法是正确的? 提示 两种说法均正确.
兴趣不浓厚的
总计

86
73
103
95
189
判断学生的数学成绩好坏与对学习数学的兴趣是否有关?
解 由公式得 K 的观测值
解 由公式得 K 的观测值 86×103×95×94
2
189× 64×73-22×30 k189 = ×64×73-22×302 ≈38.459. 86 × 103 × 95 × 94 k= ≈38.459.
想一想:如何理解分类变量?
提示
(1)这里的“变量”和“值”都应作为“广义”的变量和值
来理解.例如:对于性别变量,其取值有“男”和“女”两 种,这里的“变量”指的是“性别”,这里的“值”指的是“男”
或“女”.因此,这里说的“变量”和“值”不一定是取具体的
数值. (2)分类变量是大量存在的.例如:吸烟变量有吸烟与不 吸烟两种类别,而国籍变量则有多种类别.
2.独立性检验 利用随机变量K2来判断“两个分类变量有关系”的方法 定义 称为独立性检验
公式
n ad-bc2 a+bc+da+c b+d K2=_______________________ 其中n=___________ a+b+c+d

人教A版数学选修2-3全册课件:第三章 3.2 独立性检验的基本思想及其初步应用

人教A版数学选修2-3全册课件:第三章 3.2 独立性检验的基本思想及其初步应用

50
100
(6分)
此处易犯错误有两点: ①计算失误;②将公 式中的数据搞错.
解析:在四幅图中,D图中两个深色条的高相差最明显,说 明两个分类变量之间关系最强. 答案:D
答案:C
3.独立性检验所采用的思路是:要研究A,B两类型变量彼 此相关,首先假设这两类变量彼此________,在此假设下 构造随机变量K2,如果K2的观测值较大,那么在一定程度 上说明假设________. 答案:无关 不成立
答案:③
P(K2≥k0) k0
0.025 5.024
0.010 6.635
0.005 7.879
[课时达标检测]
假设结论不成立
列联表和等高条形图的应用
考查独立性检验的原理
[解题流程]
[规范解答]
(2)根据所给的数据可以完成列联表,如下表所示:
生产能力分组 [110,130) [130,150) 总 计
工人类别
A类 工人
20
5
25
B类 工人
30
45
75
总计
பைடு நூலகம்
50
[导入新知]
个体所属
{y1,y2}
{x1,x2}
a+b+c+d 类变量有关系
两个分
[化解疑难]
独立性检验的思想
吸烟与患肺癌“列联表”中,事件A表示不吸烟,B表示不患肺癌. 问题1:事件A,B发生的频率可求吗? 提示:可以. 问题2:通常情况下,为研究问题方便,常用什么近似于概率? 提示:频率. 问题3:事件A,B无关有怎样的概率公式? 提示:P(AB)=P(A)P(B).
3.2
独立

性检 验的
三 基本
章 思想

高中数学人教A版选修2-3课件:3.2独立性检验的基本思想及其初步应用

高中数学人教A版选修2-3课件:3.2独立性检验的基本思想及其初步应用
x
).
问题导学
当堂检测
一、用列联表和等高条形图分析两变量间的关系
活动与探究 问题 1:怎样从列联表判断两个分类变量有无关系? 提示:|ad-bc|越小,说明两个分类变量 x,y 之间的关系越弱;|ad-bc|越 大,说明 x,y 之间的关系越强.
x
问题 2:等高条形图对分析两个分类变量是否有关系,有何帮助? 提示:通过画等高条形图,我们可以通过观察两个变量的比例关系, 直观判断两个变量是否有关系.
问题导学
当堂检测
(1)利用列联表直接计算 分类变量之间有关系.
������ ������ 和 ,如果两者相差很大,就判断两个 ������+������ ������+������
(2)在等高条形图中展示列联表数据的频率特征,比较图中两个深 色条的高可以发现两者频率不一样而得出结论 ,这种直观判断的不足 之处在于不能给出推断“两个分类变量有关系”犯错误的概率.
问题导学
当堂检测
相应的等高条形图如图所示.
图中两个深色条的高分别表示甲在生产现场和甲不在生产现场样 本中次品数的频率.从图中可以看出,甲不在生产现场样本中次品数的 频率明显高于甲在生产现场样本中次品数的频率 .因此可以认为质量 监督员甲在不在生产现场与产品质量好坏有关系 .
问题导学
当堂检测
迁移与应用 某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格 内向的学生 426 人中有 332 人在考前心情紧张,性格外向的学生 594 人 中有 213 人在考前心情紧张,作出等高条形图,利用图形判断考前心情 紧张与性格类别是否有关系. 解:作列联表如下:
2
其中 n=a+b+c+d 为样本容量.

人教版选修2-3第三章2独立性检验的基本思想及其初步应用 (共24张PPT)教育课件

人教版选修2-3第三章2独立性检验的基本思想及其初步应用 (共24张PPT)教育课件





















































































































































–■
患其他病 175 597 772
总计 389 1048 1437

人教版高中数学选修2-3课件:3.2 独立性检验的基本思想及其初步应用(共38张PPT)

人教版高中数学选修2-3课件:3.2 独立性检验的基本思想及其初步应用(共38张PPT)

P(K2≥k0) 0.05 0.025 0.010 0.005 0.001
例如:
k0
3.841 5.024 6.635 7.879 10.828
①如果k≥10.828,就有99.9%的把握认为“X与Y有关系”;
②如果k≥7.879,就有99.5%的把握认为“X与Y有关系”;
③如果k≥6.635,就有99%的把握认为“X与Y有关系”;
≈7.8.
备课素材
附表:P(K2≥k0) k0
0.050 3.841
0.010 6.635
0.001 10.828
参照附表,得到的正确结论是 (A ) A.有99%以上的把握认为“爱好该项运动与性别有关” B.有99%以上的把握认为“爱好该项运动与性别无关” C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
表(称为2×2列联表)为
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计 a+c
b+d a+b+c+d
若要推断的论述为H1:“X与Y有关系”,则可以按如下步骤判断H1成立的可能性:
预习探究
预习探究
P(K2≥k0) 0.50 0.40 0.25 0.15 0.10
k0
0.455 0.708 1.323 2.072 2.706
考点类析
考点一 两分类变量之间关联关系的定性分析
例1 为考察某种药物预防某种疾病的效果,进行了一 项动物试验,得到如下列联表:
服用药 未服用药

最新3.2独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)教学讲义ppt课件

最新3.2独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)教学讲义ppt课件
进 入 夏 天 ,少 不了一 个热字 当头, 电扇空 调陆续 登场, 每逢此 时,总 会想起 那 一 把 蒲 扇 。蒲扇 ,是记 忆中的 农村, 夏季经 常用的 一件物 品。 记 忆 中 的故 乡 , 每 逢 进 入夏天 ,集市 上最常 见的便 是蒲扇 、凉席 ,不论 男女老 少,个 个手持 一 把 , 忽 闪 忽闪个 不停, 嘴里叨 叨着“ 怎么这 么热” ,于是 三五成 群,聚 在大树 下 , 或 站 着 ,或随 即坐在 石头上 ,手持 那把扇 子,边 唠嗑边 乘凉。 孩子们 却在周 围 跑 跑 跳 跳 ,热得 满头大 汗,不 时听到 “强子 ,别跑 了,快 来我给 你扇扇 ”。孩 子 们 才 不 听 这一套 ,跑个 没完, 直到累 气喘吁 吁,这 才一跑 一踮地 围过了 ,这时 母 亲总是 ,好似 生气的 样子, 边扇边 训,“ 你看热 的,跑 什么? ”此时 这把蒲 扇, 是 那 么 凉 快 ,那么 的温馨 幸福, 有母亲 的味道 ! 蒲 扇 是 中 国传 统工艺 品,在 我 国 已 有 三 千年多 年的历 史。取 材于棕 榈树, 制作简 单,方 便携带 ,且蒲 扇的表 面 光 滑 , 因 而,古 人常会 在上面 作画。 古有棕 扇、葵 扇、蒲 扇、蕉 扇诸名 ,实即 今 日 的 蒲 扇 ,江浙 称之为 芭蕉扇 。六七 十年代 ,人们 最常用 的就是 这种, 似圆非 圆 , 轻 巧 又 便宜的 蒲扇。 蒲 扇 流 传 至今, 我的记 忆中, 它跨越 了半个 世纪, 也 走 过 了 我 们的半 个人生 的轨迹 ,携带 着特有 的念想 ,一年 年,一 天天, 流向长
0 不吸烟
吸烟
从二维条形图能看出,吸烟者中
患肺癌的比例高于不患肺癌的比例。
4、等高条形图
1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1

高二下学期人教A版选修2-3第三章3.2独立性检验的基本思想及其初步应用课件(共17张PPT)

高二下学期人教A版选修2-3第三章3.2独立性检验的基本思想及其初步应用课件(共17张PPT)

2021年上学期
长沙市长郡中学
2、列联表: 【探究】为了调查吸烟是否对肺癌有影响,某肿瘤研
究所随机地调查了9965人,得到如下结果
不吸烟 吸烟 总计
不患肺癌 7 775 2 099 9 8747 817 2 148 9 965
那么吸烟是否对患肺癌有影响?
像上表这样列出两个分类变量的频数表,称为列联表
2021年上学期
长沙市长郡中学
问题1:在不吸烟者中患肺癌的比重是
;在
吸烟者中患肺癌的比重是

问题2:吸烟与不吸烟,患病的可能性的大小是否
有差异?
问题3:差异大到什么程度才能作出“吸烟与患病
有关”的判断?能否用数量刻画出“有关”的程度?
2021年上学期
长沙市长郡中学
3、独立性检验: 通过数据和图表分析,得到结论是:吸烟与患肺癌有关 思考:结论的可靠程度如何?
2021年上学期
长沙市长郡中学
一、新课内容
1、分类变量: 对于性别变量,其取值为男和女两种.这种变量的
不同“值”表示个体所属的不同类别,像这样的变量称 为分类变量.在现实生活中,分类变量是大量存在的, 例如是否吸烟,宗教信仰,国籍,等等.
在日常生活中,我们常常关心两个分类变量之间是 否有关系.例如,吸烟与患肺癌是否有关系?性别是否 对喜欢数学课程有影响?等等.
不患肺癌
患肺癌
7775
42
2099
49
9874
91
总计 7817 2148 9965
通过公式计算k= .
统计学家经过研究后发现,在H0成立的情况下, P(K26.635)0.01
2021年上学期
长沙市长郡中学
即在H0成立的情况下,K2的观测值超过6.635概率非常 小,近似为0.01;现在的K2的观测值远大于6.635,出现这 样的观测值的概率不超过0.01;故有有理由认为H0不成立, 即认为“患肺癌与吸烟有关系”,但这种判断犯错的概率 不会超过0.01.

高中数学(A版)选修2-3 3.2独立性检验的基本思想

高中数学(A版)选修2-3 3.2独立性检验的基本思想
观测数据a、b、c、d都不小于5的独立性检验
中。
对于上节吸烟与患肺癌的问题,计算可得:
6578 (56 4567 1932 23) 2 2 62.698 1988 4590 79 6499
2 因为: 6.635
所以:有99%以上的把握认为吸烟与患肺癌是有关
当等式两边相差很大时, 变量间就不独立。
b ab bd 如当 很大时,A 1 与 B2 就不独立。 n n n
新课讲解
? ?
那么,这些量究竟要达到什么样的程度,
才能够说明变量之间不独立呢??能否选择
一个量,用它来检验变量之间的独 的大小来检验 变量间是否独 立,称它为卡 方统计量。
的,即吸烟与患肺癌不是相互独立的。
例题分析
某地震观测站对地下水位的变化和发生地震的情 况进行了1700次观测,数据如下:
试问观测结果是否说明地下水位的变化与地震的
发生有关系??
分析: 根据列联表的数据,可得:
2 1.59 2.706
所以,没有充分的证据显示地下水位的变化与 地震的发生相关。
(3)当 2 3.841 时,有95%的把握判定变量A、B
有关联; (4)当 2 6.635 时,有99%的把握判定变量A、B 有关联。
由于抽样的随机性,由样本得到的推断有
可能正确,也有可能错误。利用 2进行独立性
检验,可以对推断的正确性的概率作出估计,
样本量n越大,估计越准确。此法一般适用于
2
A、B有关联; (2)当 2 2.706 时,有90%的把握判定变量A、B
有关联; (3)当 2 3.841 时,有95%的把握判定变量A、B
有关联;

高中数学人教A版选修2-3课件:3-2 独立性检验的基本思想及其初步应用

高中数学人教A版选修2-3课件:3-2 独立性检验的基本思想及其初步应用
2
=
89× (24×26-31×8) 55×34×32×57
2
≈3.689>2.706,因此,
可以在犯错误的概率不超过 0.1 的前提下认为“在天气恶劣的飞行 航程中,男乘客比女乘客更容易晕机”.
栏目 导引
第一章 典例透析三角函数
题型一 题型二 题型三 题型四
反思解独立性检验问题的基本步骤: (1)认真读题,根据相关数据,得出2×2列联表; (2)根据2×2列联表中的数据,计算K2的观测值k; (3)比较观测值k与临界值k0; (4)给出结论.
第一章 典例透析三角函数
题型一 题型二 题型三 题型四
解:由列联表中的数据求得 K2 的观测值为 k=
189× (54×63-40×32)2 94×95×86×103
≈10.759.
试画出列联表的等高条形图,分析铅中毒病人与对照组的尿棕色素 阳性数有无差别,并判断铅中毒病人与尿棕色素为阳性是否有关系?
栏目 导引
第一章 典例透析三角函数
题型一 题型二 题型三 题型四
解:等高条形图如图.
其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕 色素为阳性的频率. 由图可以直观地看出铅中毒病人与对照组相比较尿棕色素为阳 性差异明显,因此铅中毒病人与尿棕色素为阳性存在相关关系.
栏目 导引
第一章 典例透析三角函数
题型一 题型二 题型三 题型四
【变式训练 2】某大型企业人力资源部为了研究企业员工工作 积极性和对待企业改革态度的关系,随机抽取了 189 名员工进行调 查,所得数据如下表所示:
积极支持企业改革 工作积极 工作一般 总计 54 32 86 不太赞成企业改革 40 63 103 总计 94 95 189

(教师用书)高中数学 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修2-3

(教师用书)高中数学 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修2-3

(2)2×2 列联表的定义 假设有两个分类变量 X 和 Y,它们的取值分别为{x1,x2} {y1,y2} 和 ,其样本频数列联表(称为 2×2 列联表)为:
y1 x1 x2 a c y2 b d 总计
a+b c+d
总计 a+c b+d a+b+c+d
2.随机变量 K2 为了使不同样பைடு நூலகம்容量的数据有统一的评判标准,我们构
●教学流程
演示结束
1.了解分类变量、2×2列联表、随 机变量K2的意义. 课标 2.通过对典型、案例的分析,了 解读 解独立性检验的基本思想方法. 3.通过典型、案例的分析,了解 两个分类变量的独立性检验的应用.
独立性检验及其应用
【问题导思】 山东省 2011 年大力推行素质教育, 增加了高中生的课外 活动时间,某校调查了学生的课外活动方式,结果整理成下 表:
●教学建议 教学时通过引导学生探究“吸烟是否与患肺 癌有关 系”引出独立性检验的问题,借助样本数据的列联表、等高 条形图展示在吸烟人中患肺癌的比例比不吸烟人中患肺癌 的比例要高,使学生直观感觉到吸烟和患肺癌可能有关系, 在教学中可以把假设检验的方法与反证法作对比,以加深学 生对独立性检验思想的理解.
2×2 列联表如下:
物理优秀 物理非优秀 总计 数学优秀 228 b 360
143 d 880 数学非优秀 371 1 240 b+d 总计 ∴b=360-228=132,d=880-143=737,b+d=132
+737=869. 代入公式可得 K2 的观测值为 k1≈270.114.
(2)按照上述方法列出数学与化学优秀的 2×2 列联表如 下:
●重点、难点 重点:理解独立性检验的基本思想及实施步骤. 难点:(1)了解独立性检验的基本思想; (2)了解随机变量 K2 的含义,K2 的观测值很大,就认为 两个分类变量是有关系的. 引导学生通过类比反证法来体会假设检验,从而理解 k2 的含义,通过例题与练习更进一步了解独立性检验的基本思 想.

高中数学人教A版选修2-3第三章:3.2独立性检验的基本思想及其初步应用 课件

高中数学人教A版选修2-3第三章:3.2独立性检验的基本思想及其初步应用 课件

具体做法:
(1)根据实际问题需要的可信程度确定临界值 k0; (2)利用公式(1),由观测数据计算得到随机变量 K 2观测值k;
(3)如果 k k0 ,就以(1 P(K 2 k0 )) 100%的把握认为“X
与Y有关系”;否则就说样本观测数据没有提供“X与Y有关系” 的充分证据。
在实际应用中,要在获取样本数据之前通过下表确定临界值:
K2
n(ad bc)2
,
(a b)(c d )(a c)(b d )
(1)
其中n a b c d为样本容量。
若 H0成立,即“吸烟与患肺癌没有关系”,则K2应很小。
根据表中的数据,利用公式(1)计算得到K2的观测值为:
9965(7775 49 42 2099)2
k
56.632
吸烟与患肺癌列联表
称为列联表
不患肺癌
患肺癌
总计
不吸烟
7775
42
7817
吸烟
2099
49
2148
总计
9874
91
9965
那么吸烟是否对肺癌有影响?
不吸烟 吸烟 总计
不患肺癌 7775 2099 9874
42 100% 0.54% 7817
患肺癌 42 49 91
总计 7817 2148 9965
|ad-bc|越大
高中数学人教A版选修2-3第三章:3.2 独立性 检验的 基本思 想及其 初步应 用 课件【精品】
吸烟与患肺癌之间的关系越强
独立性检验 高中数学人教A版选修2-3第三章:3.2独立性检验的基本思想及其初步应用 课件【精品】
为了使不同样本容量的数据有统一的评判标准,基于上述分
析,我们构造一个随机变量-----卡方统计量
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

某学校对高三学生作了一项调查,发现:在平 时的模拟考试中, 性格内向的学生 426 人中有 332 人在考前心 情紧张, 性格外向的学生 594 人中有 213 人在考前心情紧张. 作 出等高条形图, 利用图形判断考前心情紧张与性格类别是否有 关系.
【思路启迪】 利用 2×2 列联表作出等高条形图,观察 两分类变量的差异,作出判断.
单位:人 分数段 69~90 91~100 101~110 111~120 121~130 131~140 141~150 系. 午休 不午休 23 47 30 21 14 31 14 17 51 67 15 30 17 3
3.2 独立性检验的基本思想及其初步应用
自 主 预 习
学习目标 1.了解分类变量的意义. 2.了解2×2列联表的意义. 3.了解随机变量K2的意义. 4.通过对典型案例分析,了解 独立性检验的基本思想和方 法.
目标解读 1.重点是2×2列联 表的意义及随机 变量K2的计算与 应用. 2.难点是独立性 检验的基本思想 .
提示:利用 K2 进行独立性检验,可以对推断的正确性的 概率作出估计,样本容量 n 越大,这个估计值越准确.如果抽 取的样本容量很小,那么利用 K2 进行独立性检验的结果就不 具有可靠性.
要 点 导 学
要点一 等高条形图判断分类变量是否相关
若要推断的论述为 H1:“X 与 Y 有关系”可以用等高条 形图来直观地分析两个分类变量 X 与 Y 是否有关系. 其原理是: 分析 2×2 列联表中满足条件 X=x1 的个体中具有 Y=y1 的个体 a 所占的比例 ,与满足条件 X=x2 的个体中具有 Y=y1 的个 a+b c 体所占的比例 , 两个比例的值相差越大, H1 成立的可能性 c+d 就越大.
【解】
作列联表如下: 性格内向 性格外向 总计
考前心情紧张 考前心情不紧张 总计
332 94 426
213 381 594
545 475 1 020
相应的等高条形图如图所示:
图中阴影部分表示考前心情紧张与考前心情不紧张中性 格内向的比例. 从图中可以看出考前心情紧张的样本中性格内 向占的比例比考前心情不紧张样本中性格内向占的比例高, 可 以认为考前紧张与性格类型有关.
提示:在列联表中,如果两个分类变量没有关系,则应满 足 ad-bc≈0,因此|ad-bc|越小,说明两个分类变量之间关系 越弱;|ad-bc|越大,说明两个分类变量之间关系越强.
3.独立性检验 (1)独立性检验的定义 2 nad-bc K2= a+bc+da+cb+d
, 其中 n=a+b+c+d
总计 a+c b+d a+b+c+d
2.等高条形图 (1)等高条形图与表格相比, 更能直观地反映出两个分类变 量间是否 相互影响 ,常用等高条形图展示列联表数据的频率
特征
a c (2)观察等高条形图发现 a+b 和 c+d 相差很大, 就判

断两个分类变量之间有关系.
问题思考 1: 列联表中|ad-bc|的值与两个分类变量之间关 系的强弱有什么关系?
要点二 K2与独立性检验
解决一般的独立性检验问题,首先由所给 2×2 列联表确 定 a,b,c,d,n 的值,然后代入随机变量的计算公式 K2= nad-bc2 ,求出观测值 k,将 k 与临界值 k0 进 a+ba+cb+dc+d 行对比,确定有多大的把握认为两个分类变量有关系.
1.分类变量和列联表 (1)分类变量 变量的不同“值”表示个体所属的 不同类别 ,这样的变 量称为 分类变量 ;
(2)列联表 一般地,假设有两个分类变量 X 和 Y,它们的取值分别为 {x1,x2}和{y1,y2},其样本频数表称为 列联表 ,其形式为 y1 x1 x2 a c y2 b d 总计 a+b c+d
解:根据题目所给的数据得到如下 2×2 列联表 患心脏病 未患心脏病 合计 每一晚都打鼾 不打鼾 合计 30 24 54 224 1 355 1 579 254 1 379 1 633
相应的等高条形图如图
图中两个深色的高分别表示每一晚都打鼾和不打鼾的人 中患心脏病的频率,从图中可以看出,每一晚都打鼾样本中患 心脏病的频率明显高于不打鼾样本中患心脏病的频率, 因此可 以认为打鼾与患心脏病有关系.
值 k. ③如果 k≥k0,就推断“X 与 Y 有关系”,这种推断犯错 误的概率不超过 α;否则,就认为在犯错误的概率不超过 α 的 前提下不能推断“X 与 Y 有关系”, 或者在样本数据中没有发 现足够证据支持结论“X 与 Y 有关系”.
问题思考 2: 利用 K2 进行独立性检验, 估计值的准确度与 样本容量有关吗?
条形图能形象直观地反映两个分类变量之间频率大小差 异的关系,进而可以推断它们之间是否具有相关关系,但这只 是一种粗略的估计, 不能够精确地反映两个分类变量有关系的 可信程度.
打鼾不仅影响别人休息,而且还可能与患 某种疾病有关,在某一次调查中,其中每一晚都打鼾的 254 人 中,患心脏病的有 30 人,未患心脏病的有 224 人,在不打鼾 的 1 379 人中, 患心脏病的有 24 人, 未患心脏病的有 1 355 人, 利用图形判断打鼾与患心脏病是否有关.
某学校发现有大批学生不进行正常午休, 于是 开始对学生进行正确教育,并施行了一些奖罚措施,但是仍有 些学生不能正确午休, 教师进行谈话教育时这些学生总能找到 许多理由,如“不午休不影响我的学习,不午休是我多年的习 惯,我下午、晚上精力仍然很充沛”等等,使教师的说服教育 效果很差, 于是一位数学老师就对一次数学考试成绩进行了如 下的统计(数据如下表).
为样本容量. 利用随机变量 K2 来判断“两个分类变量有关系” 的方法称为 独立性检验 . (2)独立性检验的步骤 ①根据实际问题的需要确定容许推断“两个分类变量有 关系”犯错误概率的上界 α,然后查表确定临界值 k.
2 n ad - bc ②利用公式 K2= 计算 K
相关文档
最新文档