高中数学:新人教A版选修1-2 1.2独立性检验的基本思想及其初步应用(同步练习)
高中数学 1-2《独立性检验的基本思想及其初步应用》同步 新人教A版选修1-2
根据列联表中所给的数据,有 a=38,b=442,c=6,
d=514,a+b=480,c+d=520,a+c=44,b+d=956,n
=1000,得 K2 的观测值
k=(a+b)(cn+(add-)(ab+c)c2)(b+d)
=
1000×(38×514-442×6)2 480×520×44×956
本节重点:理解独立性检验的基本思想及实 施步骤.
本节难点:(1)了解独立性检验的基本思想.
(2)了解随机变量K2的含义.
在学习中要多从实际问题考虑,对一些典型 案例的数据的处理,了解和使用一些常用的 统计方法,树立应用数学的意识,树立数学 为实践服务的思想.
1.2×2列联表是传统的调查研究中最常用 的方法之一,用于研究两个变量之间相互独 立还是存在某种关联性,它适用于分析两个 变量之间的关系.
一般地,假设两个分类变量X和Y,它们的取值分 别为{x1,x2} 和 {y1,y2},其样本频数列联表(也称 为2×2列联表)为下表.
x1
x2 总计
y1 a
c a+c
y2 b
d b+d
总计 a+b c+d a+b+c+d
2.等高条形图
(1)等高条形图与表格相比,更能直观地反映 出两个分类变量间是否 互相影响 , 常 用 等 高
2.在实际问题中,判断两个分类变量的关 系的可靠性时,一般利用随机变量K2来确定, 而不利用三维柱形图和二维条形图.
1.分类变量和列联表
(1)分类变量
变量的不同“值”表示个体所属的不同类别 , 像 这样的变量称为分类变量.
(2)列联表 ①定义:列出的两个分类变量的 频数表 称 为 列 联表.
②2×2列联表
[例2] 下面2×2列联表的K2的值为________. [答案] 1.780
人教A版选修1-2《1.2独立性检验的基本思想及其初步应用》课件
其中n=a+b+c+d为样本容量.
3.独立性检验的具体做法
(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率 的上界α,然后查表确定 临界值k0 . (2)利用公式计算随机变量K2的 观测值.k (3)如果 k≥k0 ,就推断“X与Y有关系”,这种推断犯错误的概率不超过α; 否则,就认为在 犯错误的概率 不超过α的前提下不能推断“X与Y有关 系”,或者在样本数据中 没有发现足够证据 支持结论“X与Y有关系”.
P(K2≥k0) k0
0.10 2.706
0.05 3.841
0.01 6.635
解答
类型三 独立性检验的综合应用
例3 电视传媒公司为了解某地区观众 对某类体育节目的收看情况,随机抽 取了100名观众进行调查,其中女性有 55名.如图所示的是根据调查结果绘制 的观众日均收看该体育节目时间的频 率分布直方图. 将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知 “体育迷”中有10名女生.
数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?
解答
反思与感悟
(1)等高条形图实质上是列联表中的数据的频率特征. (2)由于高度相等的条形分别用两种不同颜色表示,其频率差异更能直观 地表现出来.
跟踪训练1 网络对现代人的生活影响较大,尤其是对青少年,为了解 网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随 机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人 期末考试不及格,而另外800人中有120人不及格.利用图形判断学生经常 上网与学习成绩有关吗?
知识点二 等高条形图
1.与表格相比,图形更能直观地反映出两个分类变量间是否 相互,影常响用 等
人教版A版高中数学选修1-2:1.2独立性检验的基本思想及其初点应用
即在 H0 成立的情况下K,2 大于6.635概率非 常小,近似为0.010
现在的K 2 =56.632的观测值远大于6.635, 出现这样的观测值的概率不超过0.010。
故有99%的把握认为H0不成立,即有99%的把 握认为“患病与吸烟有关系”。
选修1-2
1.2独立性检验的基本思想及其初步应用
问题引入
选修1-2
1.2独立性检验的基本思想及其初步应用
问题引入
知识梳理
例核题心精考炼点
知识小结
-25-
方法总结有关独立性检验的问题要注意: (1)两个明确:
推断H0 不成立,且
该推断犯错误的概 率不超过这个小概 率.
选修1-2
1.2独立性检验的基本思想及其初步应用
问题引入
知识梳理
例题精炼
知识小结
独立性检验的基本思想: 类似于数学上的反证法,对“两个分类变量有关系” 这一结论成立的可信程度的判断: (1)假设该结论不成立,即假设结论“两个分类变量 没有关系”成立.
根据这些数据能否断定:患肺癌与 吸烟有关吗?
选修1-2
1.2独立性检验的基本思想及其初步应用
问题引入
知识梳理
例题精炼
知识小结
-5-
知识梳理 双击自测
列2×2联
为了研究这个问题,我们将上述问题用下表表表示:
不患肺癌 患肺癌 总计
不吸烟 7775
42
7817
吸烟
2099
49
2148
总计
9874
91
9965
选修1-2
1.2独立性检验的基本思想及其初步应用
问题引入
知识梳理
例题精炼
知识小结
高中数学 1.2独立性检验的基本思想及其初步应用课件 新人教A版选修1-2
首页 1 2 3
XINZHIDAOXUE 新知 ZHONGNANTANJIU 重难探究 DANGTANGJ 当堂 导学 检测
测一测 3
在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟 与患肺癌有关”的结论,并且在犯错误的概率不超过 0.01 的前提下认为这个 结论是成立的.下列说法中正确的是( ) A .在 100 个吸烟者中至少有 99 人患肺癌 B.如果 1 个人吸烟,那么这个人至少有 99%的概率患肺癌 C.在 100 个吸烟者中一定有患肺癌的人 D.在 100 个吸烟者中可能一个患肺癌的人也没有 解析 :K2 的观测值与临界值比较有多大把握是说两个分类变量之间的 关系 ,但不是因果关系,因此,A,B,C 均不正确,应选 D. 答案 :D
首页 1 2 3
XINZHIDAOXUE 新知 ZHONGNANTANJIU 重难探究 DANGTANGJ 当堂 导学 检测
3.独立性检验
定义 公式 利用随机变量 K2 来判断“两个分类变量有关系”的方法称为独立性检 验 K
2
������ (������ ������ -������ ������ )2 = ,其中 (������ +������ )(������ +������ )(������ +������ )(������ +������ )
n=a+b+c+d.
①根据实际问题的需要,确定容许推断“两个分类变量有关系”犯错误 具体 步骤 概率的上界 α.然后查表确定临界值 k0. ②利用公式计算随机变量 K2 的观测值 k. ③如果 k≥k0,就推断“X 与 Y 有关系”,这种推断犯错误的概率不超过 α; 否则就认为在犯错误的概率不超过 α 的前提下不能推断“X 与 Y 有关 系”,或者在样本数据中没有发现足够证据支持结论“X 与 Y 有关系”.
【数学】1.2《独立性检验的基本思想及其初步应用》课件(新人教A版选修1—2)
a 与女生中喜欢数学课的人数比例 c 应该
ab
cd
相差很多,即 a ab
c
c d
a
ac bd
bc
d
应很大.
将上式等号右边的乘 式以 子常数因子
abcdabcd acbd
,
然后平方得
K2 abncadcabdc2bd,
其中 nabcd.因此 K2越大 ,"性别与喜 欢数学课之间"成 有立 关的 系可能.性越大
个柱体都能看到.
9000 8000 7000 6000 5000 4000 3000 2000 1000
0
不患肺癌 不吸烟
患肺癌 吸烟
图1.22
图1.2 2 是叠在一起的二维条形图,其中绿色
条高表示不患肺癌的人数,黑色条高表示患肺
癌的人数.从图中可以看出,吸烟者中患肺癌的
比例高于不吸烟者中患肺癌的比例.
1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00
不吸烟
吸烟
图1.23
为了更清晰地表达这个特征, 我们还可用如下的等 高条形图表示两种情况下患肺癌的比例.如图1.2 3 所示 , 在等高条形图中, 绿色的条高表示不患肺癌 的百分比;黑色的条高表示患肺癌的百分比.
所以在H
成立的条件下应有
0
a a b a c ,其中n a b c d为样本容 nn n
量,即 a b c da a ba c,即 ad bc.
因此,| ad bc | 越小,说明吸烟与患肺癌之间关
系越弱;| ad bc | 越大,说明吸烟与患肺癌之间
关系越强. 为了使不同样本容量的数据有统一的评判标
高二数学人教A版选修1-2课件:1.2 独立性检验的基本思想及其初步应用
1234
4.独立性检验
(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.
(2)公式
K2=(������
+������
������ )(������
+(������������������)-(���������������+��� )���2���)(������+������),其中
知识精要
典题例解
迁移应用
某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情 紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,试利用列联表和等高条形图判断考 前心情紧张与性格类型是否有关系.
一二
知识精要
典题例解
迁移应用
解:考前心情紧张与性格类型列联表如下:
n=a+b+c+d
为样本容量.
目标导航
预习导引
1234
预习交流2 在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以 上的把握认为这个结论是成立的.下列说法中正确的是( ) A.100个吸烟者中至少有99人患肺癌 B.1个人吸烟,那么这个人至少有99%的概率患有肺癌 C.在100个吸烟者中一定有患肺癌的人 D.在100个吸烟者中可能一个患肺癌的人也没有 答案:D
y1
a c a+c
y2
b d b+d
总计
a+b c+d a+b+c+d
目标导航
预习导引
1234
预习交流1 下面是2×2列联表:
y1
(新课程)高中数学1.2 独立性检验的基本思想及其初步应用教案 新人教A版选修1-2
1.2独立性检验的基本思想及其初步应用(二)教学要求:通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的实施步骤与必要性.教学重点:理解独立性检验的基本思想及实施步骤.教学难点:了解独立性检验的基本思想、了解随机变量2K 的含义.教学过程:教学过程:一、复习准备:独立性检验的基本步骤、思想二、讲授新课:1. 教学例1:例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?① 第一步:教师引导学生作出列联表,并分析列联表,引导学生得出“秃顶与患心脏病有关”的结论;第二步:教师演示三维柱形图和二维条形图,进一步向学生解释所得到的统计结果; 第三步:由学生计算出2K 的值;第四步:解释结果的含义.② 通过第2个问题,向学生强调“样本只能代表相应总体”,这里的数据来自于医院的住院病人,因此题目中的结论能够很好地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出现错误,除非有其它的证据表明可以进行这种推广.2. 教学例2:例2 为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机由表中数据计算得到的观察值. 在多大程度上可以认为高中生的性别与是否数学课程之间有关系?为什么?(学生自练,教师总结)强调:①使得2( 3.841)0.05P K ≥≈成立的前提是假设“性别与是否喜欢数学课程之间没有关系”.如果这个前提不成立,上面的概率估计式就不一定正确;②结论有95%的把握认为“性别与喜欢数学课程之间有关系”的含义;③在熟练掌握了两个分类变量的独立性检验方法之后,可直接计算2K 的值解决实际问题,而没有必要画相应的图形,但是图形的直观性也不可忽视.3. 小结:独立性检验的方法、原理、步骤 三、巩固练习: 某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:请问有多大把握认为“高中生学习状况与生理健康有关”?。
人教版数学高二新人教A版选修1—2 1.2 独立性检验的基本思想及其初步应用 素材
生活中的独立性检验问题
独立性检验在实际生活中有广泛的应用,解决该类问题的关键是准确的运算。
根据上述数据,试问色盲与性别是否是相互独立的?
依据公式得
()2
2
1000442638514
27.139
95644480520
K
⨯⨯-⨯
=≈
⨯⨯⨯。
由于27.13910.828
>,∴有99%的把握认为色盲与性别是有关的,从而拒绝原假设,可以认为色盲与性别不是相互独立的。
评注:根据假设检验的思想,比较计算出的2
K与临界值的大小,选择接受假设还是拒绝例2 考察黄烟经过培养液处理与否跟发生青花病的关系,调查了457株黄烟,得到下表
解析:根据公式得
()2
2
4572514280210
41.61
235222105352
K
⨯⨯-⨯
=≈
⨯⨯⨯
由于41.6110.828
>,说明黄烟经过培养液处理与否跟发生青花病是有关系的。
评注:计算2
K的值与临界值的大小进行比较即可。
练习:
试问新措施对防治猪白痢是否有效?
2.在一次恶劣气候的飞行航程中,调查男女乘客在机上晕机的情况如下表所示,据此资料你是否认为在恶劣气候飞行中男性比女性更容易晕机?
答案:
K≈>,有99%的把握认为新措施对防治猪白痢是有效的
1.提示:27.317 6.635
K≈<,我们不能认为在恶劣气候飞行中男性比女性更容易晕机2.提示:2 2.149 2.706。
高二数学同步教学课件:1.2《独立性检验的基本思想及其初步应用》(新人教A版选修1-2)
• 牛刀小试 • 1.下表是一个2×2列联表: y1 y2 总计 x1 a 21 73 x2 2 25 27 b 46 100 总计 • 则表中a、b处的值分别为( ) • A.94,96 B.52,50C.52,54 54,52 a+21=73 a=52 [解析] 由 ,得 . b=54 • [答案] Ca+2=b D.
• 独立性检验的基本思想 • 思维导航 • 日常生活及生产、科研中,经常需要考虑某 个量的变化是否由某种因素引起,与这种因 素的相关程度有多大?怎样判断呢?
• 新知导学 • 1.分类变量 • 分类变量也称为属性变量或定性变量,分类 不同类别 变量的取值是离散的,其不同的取值仅表示 个体所属的__________,除了起分类作用外 区分 ,无其他含义,有时也把分类变量的不同取 值用数字表示,但这些数字只起__________ 作用,无数值意义.
第一章
统计案例
第一章 3.3
1.2
导数在研究函数中的应用
独立性检验的基本思想及其初步应用
1
自主预习学案
2典例探究学案3来自课 时 作 业自主预习学案
• 学习目标解读 • 通过对案例的探究,了解独立性检验的基本 思想、方法及初步应用.
• 重点:理解独立性检验的基本思想及实施步 骤. • 难点:独立性检验基本思想的理解及应用.
[分析]
求出分类变量 对变量进行分类 → → 的不同取值
a c 作出2×2列联表 → 计算 与 的值作出判断 a+b c+d
• [解析] 2×2列联表如下:
年龄在六十岁 年龄在六十岁 总 以上 以下 计
饮食以蔬菜 为主 饮食以肉类 为主
43
27
21
33
64
60
(新课程)高中数学《1.2 独立性检验的基本思想及其初步应用》课件 新人教A版选修1-2
(1)分类变量
变量的不同“值”表示个体所属的 不同类别 ,像这样的变 量称为分类变量. (2)列联表 ①定义:列出的两个分类变量的 频数表 ,称为列联表.
②2×2列联表
一般地,假设两个分类变量X和Y,它们的取值分别为
{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为 总计 a+b c+d
误区警示 因未理解P(K2≥k0)的含义而致错 【示例】 某小学对232名小学生调查中发现:180名男生中有98名 有多动症,另外82名没有多动症,52名女生中有2名有多动症, 另外50名没有多动症,用独立性检验方法判断多动症与性别 是否有关系?
[错解] 由题目数据列出如下列联表:
多动症 无多动症 总计
类别,而国籍变量则有多种类别.
2.独立性检验
定义 利用随机变量 K2 来判断“两个分类变量 有关系”的方法称为独立性检验
nad-bc2 K2= , a+bc+da+cb+d 公式 其中 n=
a+b+c+d
①根据实际问题的需要,确定容许推断“两个分类变量有 关系”犯错误概率的上界α.然后查表确定 临界值k0 . 具体 步骤 ②利用公式计算随机变量K2的 观测值k . ③如果 k≥k0 ,就推断“X与Y有关系”,这种推
k0
题型一 有关“相关的检验”
【例1】 某校对学生课外活动进行调查,结果整理成下表:
试用你所学过的知识进行分析,能否在犯错误的概率不超过 0.005的前提下,认为“喜欢体育还是文娱与性别有关系”? 体育 文娱 总计 男生 女生 总计 21 6 27 23 29 52 44 35 79
[思路探索] 可用数据计算 K2,再确定其中的具体关系. 解 判断方法如下: 假设 H0“喜欢体育还是喜欢文娱与性别没有关系”,若 H0 成立, 则 K2 应该很小. ∵a=21,b=23,c=6,d=29,n=79, nad-bc2 ∴k= a+bc+da+cb+d 79×21×29-23×62 = ≈8.106. 21+23×6+29×21+6×23+29
人教A版高中数学选修1-2《独立性检验的基本思想及其初步应用》共7页word资料
课题:独立性检验的基本思想及其初步应用教材:人教A版·普通高中课程标准实验教科书·数学·选修1-2一、教学任务分析1. 在统计学中,独立性检验就是检验两个分类变量是否相关的一种统计方法. 高中数学研究的是两个分类变量各取2个值即2×2列联表的情况:2. 独立性检验与回归分析都可以判断两个变量的相关关系. 两者既有联系又有区别,回归分析适用于定量变量的问题,独立性检验适用于分类变量的问题.二、教学目标(1)能够用列联表、三维柱形图、二维条形图、等高条形图直观地判断两个分类变量是否相关.(2)了解独立性检验的基本思想,能够按照独立性检验的步骤去检验两个分类变量的关系.(3)通过独立性检验的学习,了解数学在统计与概率中的确定性思维特点,体会直观与抽象、感性与理性的联系.三、教学重点、难点教学重点:理解独立性检验的基本思想及实施步骤.教学难点:(1)了解独立性检验的基本思想.(2)了解随机变量卡方的含义.四、教学方法与手段采用“活动(课前)→问题→解决问题→总结”的教学方法,即:在教师的引导下,通过开放性问题的设置来启发学生思考,在思考中体会数学概念的形成过程中所蕴涵的数学思想和方法,加强学生能力的培养.利用计算器进行数据计算,通过Excel软件作图,通过制作的课件呈现更丰富的教学素材.五、课前准备(1)布置实习作业学完《§1.1回归分析的基本思想及其初步应用》后,让学生完成判断两个变量是否相关的题目,一类是可以用回归分析解决的(如问题一),另一类则不行(如问题二). 把这两类问题以实习作业的形式要求学生进行收集数据、整理分析数据、得出结论并进行估计与预测. 作业要求思路清晰、图文并茂、言之有理.(2)本节课前的实习作业问题一:课外学习时间与学习成绩的关系问题二:高中学生是否喜欢音乐与性别的关系这里是我的一个实习作业的范例。
六、教学流程(一)创设情景,问题引入(二)观察感知,启发引导(三)自主探究,体会思想(四)例题学习,变式巩固(五)知识应用,尝试练习(六)解决疑问,尝试小结(七)课后作业,自主学习板书设计八、教学反思1. 注重系统学习,课后作业为下一节课作铺垫.课前作业(即前面学习的作业)的中“问题二”与熟悉的问题有些类似,都是两个变量的相关关系,但却不能使用回归分析的方法来做. 尽管如此,学生还是能够利用比例、图形去解决问题,为新课学习提供了很好的铺垫. 本节课的作业,除了巩固所学知识,也要为下一节课作铺垫.2. 解决疑问,尝试小结在教学设计过程中,预留时间给学生提出自己的问题,尝试自己去小结,可让学生做到自主学习,进行课堂复习,有时还能克服学生在下课前的疲劳状态.给时间学生思考本节课还不懂的问题,可写在小纸上. 对于学生提出的问题,适当解决. 这样可方便进行教学反思,也为下一节课的设计提供一些材料.独立性检验的基本思想及其初步应用的教案说明教材:人教A版·普通高中课程标准实验教科书·数学·选修1-2 针对所教班级的数学基础比较弱,本节课通过之前准备的两个实习作业,让学生在一定的感性认识的基础上,带着问题与好奇心,感受数学从感性认识上升到理性认识,共同经历从定性描述到定量描述的过程,从中认识数学解决问题的方法. 根据新课程的特点,本课以学生发展为本,遵循学生的认知规律,体现循序渐进、共同探究与启发式的教学原则,充分发挥学生的主体作用与教师在适当环节的引导作用.一、对教学目标和教学重难点的认识:根据数学学科的特点、学生身心发展的合理需要,本节课从认知、能力、情感等层面确定了相应的教学目标.重点是理解独立性检验的基本思想及实施步骤;而难点是了解独立性检验的基本思想及随机变量卡方的含义二、教学方法的选择:采用“活动(课前)→问题→解决问题→总结”的教学方法,即:在教师的引导下,通过开放性问题的设置来启发学生思考,在思考中体会数学概念的形成过程中所蕴涵的数学思想和方法,加强学生能力的培养.三、教学手段的利用:采用多媒体技术,通过各种素材的呈现,提高学生学习兴趣、激活学生思维、加深理解.四、教学过程的说明:针对学生已有的体验以及学生的认知水平,把教学过程分为了七个环节:。
(教师用书)高中数学 1.2 独立性检验的基本思想及其初步应用课件 新人教A版选修1-2
总计 a+c b+d a+b+c+d
等高条形图
【问题导思】 表格和图形哪一个更能直观地反映出两个分类变量间是 否相互影响?
【提示】 图形.
(1)定义:将列联表中的 数据
用高度相同的两个条形
图表示出来,其中两列的 数据 分别对应不同的颜色,这就 是等高条形图. (2)特征:等高条形图与表格相比,更能直观地反映出两 个分类变量间是否 相互影响 ,常用等高条形图展示列联表数 据的 频率特征 .
1.作2×2列联表时,注意应该是4行4列,计算时要准 确无误. 2.作2×2列联表时,关键是对涉及的变量分清类别.
题中条件不变,尝试用|ad-bc|的大小判断饮食习惯与 年龄是否有关.
【解】 将本例2×2列联表中的数据代入可得
|ad-bc|=|43×33-21×27|=852. 相差较大,可在某种程度上认为饮食习惯与年龄有关 系.
作等高条形图―→对比乘积的差距判断 两个分类变量是否有关
【自主解答】 作列联表如下: 性格内向 性格外向 总计 考前心情紧张 考前心情不紧张 总计 332 94 426 213 381 594 545 475 1 020
相应的等高条形图如图所示:
图中阴影部分表示考前心情紧张与考前心情不紧张中性 格内向的比例.从图中可以看出,考前紧张的样本中性格内 向占的比例比考前心情不紧张样本中性格内向占的比例高, 可以认为考前紧张与性格类型有关.
a c (3)用法:观察等高条形图发现 和 相差很大,就 a+b c+d 判断两个分类变量之间有关系.
独立性检验
(1)定义:利用随机变量K2来判断“两个分类变量有关系” 的方法称为独立性检验.
2 n ad - bc (2)公式:K2= ,其中n a+bc+da+cb+d
高二数学 《1.2独立性检验的基本思想及其初步应用(二)》教案 文 新人教A版选修1-2
高中数学《1.2独立性检验的基本思想及其初步应用(二)》教案教学过程: 复习引入 1. 分类变量2. 2×2列联表(样本频数列联表)粗略估计相关数据的总体状况3.三维柱形图和二维条形图(频数)更直观地反映出相关数据的总体状况4.等高条形图(百分比)5.|ad -bc |越小,说明吸烟与患肺癌关系越弱, |ad -bc |越大,说明吸烟与患肺癌关系越强.6.独立性检验))()()(()(22d b c a d c b a bc ad n K ++++-= d c b a n +++=其中基本步骤1.确定临界值;2.求K 2;3.下结论.讲授新课例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶. 利用图形判断秃顶与患心脏病是否有关系.能够以99%的把握认为秃顶与患心脏病有关系吗?为什么? 患心脏病 患其他病 总计 秃顶 214 175 389 不秃顶 451 597 1 048 总计6657721 437相应的三维柱形图如图所示,比较来说,底面副对角线上两个柱体高度的乘积要大一些,因此可以在某种程度上认为“秃顶与患心脏病有关”.根据列联表中的数据,得K 2的观测值为.635.6373.167726651048389)451175597214(143722>≈⨯⨯⨯⨯-⨯⨯=K所以有99%的把握认为“秃顶与患心脏病有关”.秃顶不秃顶患心脏病患其他病2004006001003005000患心脏病患其他病通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种 判断无法精确地给出所得结论的可靠程度.(1)在三维柱形图中,主对角线上两个柱形高度的乘积ad 与副对角线上两个柱形高度的乘 积bc 相差越大,H 1成立的可能性就越大.(2)在二维条形图中,可以估计满足条件X =x 1的个体中具有Y =y 1的个体所占的比例,ba a+也可以估计满足条件X =x 2的个体中具有Y =y 1的个体所占的比例dc c+ .两个比例的值相差越大,H 1成立的可能性就越大.课堂练习1.在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高 度的乘积相差越大,两个变量有关系的可能性就( A )A. 越大B. 越小C. 无法判断D.以上都不对2. 下列关于三维柱形图和二维条形图的叙述正确的是( C ) A. 从三维柱形图中可以看出两个分类变量是否有关系B. 从二维条形图中可以看出两个变量频数的相对大小,从三维柱形图中无法看出相对频数的大小C. 从三维柱形图和二维条形图可以粗略地看出两个分类变量是否有关系D. 以上说法都不对3. 为了探究色盲是否与性别有关,在调查的500名男性中有39名色盲患者,500名女性中有6名色盲患者,那么你认为色盲与性别有关的把握为( C )A. 0B. 95%C. 99.9%D. 99%作业:《习案》作业(五)、(六).。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 2 独立性检验的基本思想及其初步应用
例题:
1.三维柱形图中柱的高度表示的是( )
A .各分类变量的频数
B .分类变量的百分比
C .分类变量的样本数
D .分类变量的具体值 解析: 三维柱形图中柱的高度表示图中各个频数的相对大小.选A
2. 统计推断,当______时,有95 %的把握说事件A 与B 有关;当______时,认为没有充分的证据显示事件A 与B 是有关的.
解析:当841.3>k 时,就有95 %的把握说事件A 与B 有关,当076.2≤k 时认为没有充分的证据显示事件A 与B 是有关的.
3.为了探究患慢性气管炎与吸烟有无关系,调查了却339名50岁以上的人,结果如下表所示,据此数据请问:50岁以上的人患慢性气管炎与吸烟习惯有关系吗?
患慢性气管炎 未患慢性气管炎 合计 吸烟 43 162 205 不吸烟 13
121 134 合计
56
283
339
分析:有表中所给的数据来计算2
K 的观测值k,再确定其中的具体关系.
解:设患慢性气管炎与吸烟无关.
a=43,b=162,c=13,d=121,a+b=205,c+d=134, a+c=56,b+d=283,n=339
所以2K 的观测值为469.7)
)()()(()(2==+++-=d b c a d c b a bc ad n k .因此635.6>k ,故有99%的把握认为患
慢性气管炎与吸烟有关.
课后练习:
1. 在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就( )
A.越大
B.越小
C.无法判断
D.以上都不对
2.下列关于三维柱形图和二维条形图的叙述正确的是: ( ) A .从三维柱形图可以精确地看出两个分类变量是否有关系
B .从二维条形图中可以看出两个变量频数的相对大小,从三维柱形图中无法看出相对频数的大小
C .从三维柱形图和二维条形图可以粗略地看出两个分类变量是否有关系
D .以上说法都不对
3.对分类变量X 与Y 的随机变量2
K 的观测值K ,说法正确的是() A . k 越大," X 与Y 有关系”可信程度越小; B . k 越小," X 与Y 有关系”可信程度越小; C . k 越接近于0," X 与Y 无关”程度越小 D . k 越大," X 与Y 无关”程度越大
4. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
A.若K 2
的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;
B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;
C.若从统计量中求出有95% 的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判出现错误;
D.以上三种说法都不正确.
5.若由一个2*2列联表中的数据计算得k 2
=4.013,那么有 把握认为两个变量有关系
6.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
性别 专业
非统计专业
统计专业 男 13 10 女
7
20
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到
250(1320107) 4.84423272030
k ⨯⨯-⨯=≈⨯⨯⨯
因为2
3.841K ≥,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为 ____;
7.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人。
女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动。
(1)根据以上数据建立一个2×2的列联表; (2)判断性别与休闲方式是否有关系。
1.2 独立性检验的基本思想及其初步应用参考答案 1.A
2.C
3.B
4.C
5. 95%
6. 5%
7.解:(1)2×2的列联表 性别 休闲方式
看电视
运动
总计
女 43 27 70 男 21 33 54 总计
64
60
124
(2)假设“休闲方式与性别无关”
计算
2124(43332721) 6.20170546460
k ⨯⨯-⨯=≈⨯⨯⨯
因为 5.024k ≥,所以有理由认为假设“休闲方式与性别无关”是不合理的,
即有97.5%的把握认为“休闲方式与性别有关”。