2017-2018版高中数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用学案 新人教
高中数学第一章统计案例1.2独立性检验的基本思想及其初步应用课件1新人教A版选修1_22017083032
笛卡儿
能否用数量来刻画“有关”程度
不吸烟但患病的人数约为 n• •
不吸烟也不患病的人数约为 n• •
怎样估计实际观测值与理论估计值的误差?
采用如下的量(称为K2 统计量)来刻画这个差异:
+
+
+
化简得
K2 = K2 =11.8634
K 2统计量
解决问题的思路
• • • • • 思路:反证法思想 (1)假设:H0:患病与吸烟无关 即 P(A)P(B)= P(AB) (2)在 H0成立的条件下进行推理 (3)如果实际观测值与由(2)推出的值 相差不大,则可以认为这些差异是由随机 误差造成的,假设H0不能被否定;否则, 假设H0不能被接受
(2)若观测值K2>6.635, 则有99%的把握认为“Ⅰ与Ⅱ有关系”;
(3)若观测值K2>2.706, 则有90%的把握认为“Ⅰ与Ⅱ有关系”;
(4)若观测值K2<2.706, 则没有充分的证据显示“Ⅰ与Ⅱ有关 系”,但也不能作出结论“H0成立
题型一 有关“相关的检验” 【例1】 某校对学生课外活动进行调查,结果整理成 下表: 试用你所学过的知识进行分析,能否在犯错误的概 率不超过 0.005 的前提下,认为“喜欢体育还是文娱 与性别有关系”?
解:提出假设
H0:药的效果与给药方式无关系。
根据列联表中的数据可以求出:
2 193 (58 31 40 64) K2 1.3896 2.706 122 71 98 95
当H0成立时,K 2 1.3896 的概率大于10%, 这个概率比较大,所以根据目前的调查数 据,不能否定假设H0,即不能作出药的效 果与给药方式有关的结论。
数据整理
患病 吸烟 37 21 未患病 183 274 合计 220 295 515
高中数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用学案 新人教A版选修1-2(2
2017-2018版高中数学第一章统计案例1.2 独立性检验的基本思想及其初步应用学案新人教A版选修1-2编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2017-2018版高中数学第一章统计案例1.2 独立性检验的基本思想及其初步应用学案新人教A版选修1-2)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2017-2018版高中数学第一章统计案例1.2 独立性检验的基本思想及其初步应用学案新人教A版选修1-2的全部内容。
1。
2 独立性检验的基本思想及其初步应用1.理解独立性检验的基本思想及其实施步骤.(重点)2.能利用条形图、列联表探讨两个分类变量的关系.(易混点)3.了解K2的含义及其应用.4.通过对数据的处理,来提高解决实际问题的能力.(难点)[基础·初探]教材整理1 分类变量与列联表阅读教材P10~P13的内容,完成下列问题.1.分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.2.列联表(1)定义:列出的两个分类变量的频数表,称为列联表.(2)2×2列联表:一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:y 1y2总计x1a b a+bx2c d c+d总计a+c b+d a+b+c+d下面是一个2×2列联表:y 1y2总计x1a2173x282533总计b46则表中a【解析】∵a+21=73,∴a=52.又b=a+8=52+8=60.【答案】52,60教材整理2 等高条形图阅读教材P14的内容,完成下列问题.1.定义:将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分别对应不同的颜色,这就是等高条形图.2.等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.3.观察等高条形图发现错误!和错误!相差很大,就判断两个分类变量之间有关系.观察下列各图,其中两个分类变量x,y之间关系最强的是________.图1 2.1【解析】在四幅图中图(4)中两个深色条的高相差最明显,说明两个分类变量之间关系最强,故选(4).【答案】(4)教材整理3 独立性检验阅读教材P12的内容,完成下列问题.1.定义利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.2.公式K2=错误!,其中n=a+b+c+d.1.关于分类变量x与y的随机变量K2的观测值k,下列说法正确的是________(填序号).(1)k的值越大,“X和Y有关系”可信程度越小;(2)k的值越小,“X和Y有关系”可信程度越小;(3)k的值越接近于0,“X和Y无关”程度越小;(4)k的值越大,“X和Y无关”程度越大.【解析】k的值越大,X和Y有关系的可能性就越大,也就意味着X和Y无关系的可能性就越小.【答案】(2)2.式子|ad-bc|越大,K2的值就越________.(填“大”或“小”)【解析】由K2的表达式知|ad-bc|越大,(ad-bc)2就越大,K2就越大.【答案】大[小组合作型]用2×2列联表分析两变量间的关系70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用错误!与错误!判断二者是否有关系.【精彩点拨】错误!→错误!→错误!→错误!【自主解答】2×2列联表如下:年龄在六十岁以上年龄在六十岁以下总计饮食以蔬菜为主432164饮食以肉类为主273360总计7054124将表中数据代入公式得错误!=错误!=0。
1.2独立性检验的基本思想及其初步应用
试用图形判断服用药和患病之间是否有关系?
解析:相应的等高条形图如下:
从图形可以看出,服用药的样本中患病的比例明显低于 没有服用药的样本中患病的比例,因此可以认为:服用药和 患病之间有关系.
独立性检验方法——K2公式
在调查的480名男士中有38名患有色盲,520名女 士中有6名患有色盲,能否在犯错误的概率不超过0.001的前 提下认为性别与患色盲有关系? 分析:
4.下面是一个2×2列联表: x1 x2 总计 y1 a 2 b y2 21 25 46 总计 73 27 100
则表中a、b的值分别为( C ) A.94、96 C.52、54 B.52、50 D.54、52
5.性别与身高列联表如下: 男 女 总计 高(165 cm以上) 37 6 43 矮(165 cm以下) 4 13 17 总计 41 19 60
作出2×2列联表 → 计算随机变量K2的值 → 对照临界值作出结论 解析:根据题目所给的数据作出如下的列联表:
色盲 不色盲 总计
男
女 总计
38
6 44
442
514 956
480
520 1 000
根据列联表中所给的数据可以得: a=38,b=442,c=6,d=514,a+b=480,c+d= 520,a+c=44,b+d=956,n=1 000.
3.独立性检验. 利用随机变量K2来判断“两个分类变量有关系”的方法 定义 称为独立性检验.
nad-bc2 公式 K2=_____________________ a+bc+da+cb+d ,其中n=______________. a+b+c+d
①根据实际问题的需要确定容许推断“两个分类变量有 临界值 k0 .② 关系”犯错误概率的上界α,然后查表确定 ________ k________ ≥k0 利用公式计算随机变量K2的 ________ , 观测值 k .③如果 具体 就推断“X与Y有关系”,这种推断犯错误的概率不超过 步骤 α;否则,就认为在犯错误的概率不超过α的前提下不能 推断“X与Y有关系”,或者在样本数据中没有发现足够 证据支持结论“X与Y有关系”.
高中数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用自我小测 新人教A版选修1-2(
测新人教A版选修1-2编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第一章统计案例1.2 独立性检验的基本思想及其初步应用自我小测新人教A版选修1-2)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第一章统计案例1.2 独立性检验的基本思想及其初步应用自我小测新人教A版选修1-2的全部内容。
我小测新人教A版选修1—21.下面是2×2列联表:则表中a,b的值分别为(A.94,96 B.52,50 C.52,54 D.54,522.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是( )A.k越大,推断“X与Y有关系”,犯错误的概率越大B.k越小,推断“X与Y有关系”,犯错误的概率越大C.k越接近于0,推断“X与Y无关",犯错误的概率越大D.k越大,推断“X与Y无关”,犯错误的概率越小名学生进行了作业量的调查,数据如下表:3.某班主任对全班50A.99% B.95%C.90% D.无充分根据4.在列联表中,相差越大,两个分类变量之间的关系越强的两个比值是()A.错误!与错误! B.错误!与错误!C.错误!与错误! D.错误!与错误!5.在一项打鼾与患心脏病是否有关的调查中,共调查了1 978人,经过计算K2=28.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是__________的.(填“有关"、“无关”) 6.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果.7.为研究学生的数学成绩与学习数学的兴趣浓厚是否有关,对某年级学生作调查,得到如下数据:成绩好坏与学习数学的兴趣浓厚有关?8.在500个用血清的人身上试验某种血清预防感冒的作用,把一年中的记录与另外500个未用血清的人作比较,结果如下:9.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29。
2017-2018版高中数学 第一章 统计案例 1.1 独立性检验 新人教B版选修1-2
题型探究
类型一 2×2列联表和χ2统计量
命题角度1 2×2列联表及应用 例1 为了解人们对于国家新颁布的“生育二孩放开”政策的热度,现在某 市进行调查,随机抽调了50人,他们年龄的频数分布及支持“生育二孩放 开”人数如下表:
年龄
[5,15) [15,25) [25,35) [35,45)
频数
5 10 15 10
第一章 统计案例
§1.1 独立性检验
学习目标 1.理解两事件独立的概念,并会用独立事件的概率公式进行简单的计算. 2.理解2×2列联表的意义,会依据列联表中数据判断两个变量是否独立. 3.掌握统计量χ2的意义和独立性检验的基本思想.
内容索引
知识梳理 题型探究 当堂训练
知识梳理
知识点一 独立事件的概念
支持“生育二孩放开” 4
5
12
8
由以上统计数据填下面2×2列联表:
支持 不支持
合计
年龄不低于45岁的人数 a= b=
年龄低于45岁的人数 c= d=
解答
反思与感悟 准确理解给定信息,找准分类变量,然后依次填入相应空格内数据.
跟踪训练1 某校高二年级共有1 600名学生,其中男生960名,女生640名, 该校组织了一次满分为100分的数学学业水平模拟考试.根据研究,在正式 的 学 业 水 平 考 试 中 , 本 次 成 绩 在 [80,100] 的 学 生 可 取 得 A 等 ( 优 秀 ) , 在 [60,80]的学生可取得B等(良好),在[40,60]的学生可取得C等(合格),不到 40分的学生只能取得D等(不合格).为研究这次考试成绩优秀是否与性别有 关,现按性别采用分层抽样的方法抽取100名学生,将他们的成绩按从低 到高分成[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],
2017年高中数学第一章统计案例1.2独立性检验的基本思想及其初步应用习题课件新人教A版选修1_2
9.某高校“统计初步”课程的教师随机调查了选该课的一 些学生情况,具体数据如下表: 专业 性别 男 女 非统计专业 13 7 统计专业 10 20
为了判断主修统计专业是否与性别有关系, 根据表中数据得 到,
5013×20-10×72 k= ≈4.844,因为 k>3.841,所以确定主 20×30×23×27 修统计专业与性别有关系,那么这种判断出错的可能性为____.
解析:由 a+21=73,得 a=52,由 b+46=100,得 b=54.
答案:C
3.观察下列各图,其中两个分类变量 x,y 之间关系最强的 是( )
解析:在四幅图中,D 图中两个深色条的高相差最明显,说 明两个分类变量之间关系最强,故选 D.
答案:D
4.考察棉花种子经过处理跟生病之间的关系得到如下表数 据: 种子处理 生病 不生病 合计 32 61 93 种子未处理 101 213 314 合计 133 274 407
2 n ad - bc 解析:由 K2= 知,(ad-bc)2 越大, a+bc+da+cb+d
K2 值越大,说明 x 与 y 的关系越强.
答案:C
6.某班主任对全班 50 名学生进行了作业量多少的调查,数 据如下表: 认为作业多 认为作业不多 总数 喜欢玩电脑游戏 不喜欢玩电脑游戏 总数 18 8 26 9 15 24 27 23 50
试问新措施对防治猪白痢是否有效果? 附: P(K2≥k) k 0.050 3.841 0.010 6.635 0.001 10.828
2 n ad - bc K2 = a+bc+da+cb+d
答案:50%
8.利用独立性检验来考虑两个分类变量 X 和 Y 是否有关系 时,通过查阅下表来确定断言“X 和 Y 有关系”的可信度.如果 k>5.024, 那么就有把握认为“X 和 Y 有关系”的百分比为______. P(K2>k) k P(K2>k) k 0.50 0.40 0.25 0.15 0.10
高中《第一章统计案例1.2独立性检验的基本思想及其初步应用》1069PPT课件 一等奖
求根据女大学生的身高预报体重的回归方程,并预 报一名身高为172 cm的女大学生的体重.
案例1 女大学生的身高与体重
编号 身高/cm 体重/kg
例如,编号为6的女大学生的体重并没有落在水平直
线上,她的体重为61kg.解释变量(身高)和随机误
差共同把这名学生的体重 从54.5kg“推”到了61kg, 相差6.5kg,所以6.5kg是 解释变量和随机误差的 组合效应.
体重/kg
65 60 55 50 45 40
身高/cm
150 155 160 165 170 175 180
涉及到统计的一些思想: 模型适用的总体; 模型的时间性; 样本的取值范围对模型的影响; 模型预报结果的正确理解.
课堂小结
一般地,建立回归模型的基本步骤为:
(1)确定研究对象,收集数据,明确哪个变量是 解释变量,哪个变量是预报变量.
(2)画出确定好的解释变量和预报变量的散点 图,观察它们之间的关系 (如是否存在线性 关系等). (3)由经验确定回归方程的类型(如我们观察 到数据呈线性关系,则选用线性回归方程 y=bx+a).
湖南省长沙市一中卫星远程学校
新课讲授
用这种方法可以对所有预报变量计算组合效应.
数学上,把每个效应(观测值减去总的平均值) 的平方加起来,即用:
n
( yi y)2 表示总的效应,称为总偏差平方和.
i 1
在例1中,总偏差平方和为354.
湖南省长沙市一中卫星远程学校
新课讲授
那么,在这个总的效应(总偏差平方和)中,有多 少来自于解释变量(身高)?有多少来自于随机 误差?
2017_2018版高中数学第1章统计案例1.1独立性检验课件苏教版选修1_2
分钟的观众称为“体育迷”,已知
“体育迷”中有10名女生.
(1)根据已知条件完成下面的2×2列联表,据此资料你是否认为“体育迷” 与性别有关? 非体育迷 男 体育迷 总计
女
总计
解答
(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已 知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人, 求至少有1名女性观众的概率.
性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为
492人,请作出性别与喜欢吃甜食的列联表.
解 作列联表如下: 喜欢甜食 男 女 合计 117 492 609 不喜欢甜食 413 178 591 合计 530 670 1 200
解答
反思与感悟
分清类别是列联表的作表关键步骤.表中排成两行两列的数据是调查得来
解 作列联表如下:
性格内向 性格外向 合计
考前心情紧张 考前心情不紧张 合计
332 94 426
213 381 594
545 475 1 020
解答
类型二
由χ2进行独立性检验
例2 对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进 行3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示.
类1
Ⅰ 合计 类A a
类2
b
合计
______ a+b
类B
c
______ a+c
d
______ b+d
______ c+d
a+b+c+d
(2)χ2统计量的求法
2 n ad - bc 公式 χ2= . a+bc+da+cb+d
知识点二 独立性检验的概念
独立性检验
2017_2018学年高中数学第一章统计案例1.1独立性检验课件新人教B版选修1_220117082
, 计算χ2 的数值;
(3)将χ2的数值与两个临界值3.841与6.635进行比较,作出统计推 断:当χ2>3.841时,有95%的把握说事件A与B有关;当χ2>6.635时,有 99%的把握说事件A与B有关;当χ2≤3.841时,认为事件A与B是无关 的.
1
2
2.独立性检验的基本思想是什么? 剖析:独立性检验的基本思想类似于数学中的反证法.要确认“两 个分类变量有关系”这一结论成立的可信度,首先假设该结论不成 立,即假设结论“两个分类变量没有关系”成立,在该假设下,我们构 造的随机变量χ2应该很小,如果由观测数据计算得到的χ2很大,则在 一定程度上说明假设不合理,根据统计量χ2的含义,可以通过χ2的大 小来评价假设不合理的程度有多大,从而说明“两个分类变量有关 系”这一结论成立的可信程度有多大. 警示:(1)由于χ2的计算量较大,所以应准确代入数据并计算,然后 进行比较与判断.(2)使用χ2统计量作2×2列联表的独立性检验时, 要求表中的4个数据都大于等于5.
1
2
3
【做一做 1-2】 甲、乙两人射击时命中目标的概率分别为 , ,
2 3
1 1
现两人同时射击, 则两人都命中目标的概率为
.
解析:设“甲命中目标”为事件A,“乙命中目标”为事件B,则A与B相 互独立,
于是 P(AB)=P(A)P(B) = × = . 答案:
1 6 2 3 6 1 1 1
1
2
3
1
2
1.如何使用χ2统计量作2×2列联表的独立性检验? 剖析:步骤如下: (1)检查2×2列联表中的数据是否符合要求,即表中的4个数据都 要大于等于5;
(2)由公式 χ2 =
������ (������ 11 ������ 22 -������ 12 ������ 21 )2 ������ 1+������ 2+������ +1 ������ +2
高中数学 第一章 统计案例 1.2 独立性检验的基本思想
为你深度剖析独立性检验的基本思想吃透独立性检验的基本思想,对于广大出学者来说都是首先要解决的一个问题.但这一问题并不是通过一段文字就能说明白的,也不是通过几个数据就能解决的.下面我们就从几个方面加以剖析、说明.一. 列联表相关的概念:1.分类变量:变量的不同“值”表示个体所属的不同类别的变量称为分类变量. 分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级,等等. 分类变量的取值有时可用数字来表示,但这时的数字除了分类以外没有其他的含义. 如用“0”表示“男”,用“1”表示“女”.2.列联表:分类变量的汇总统计表(频数表). 一般我们只研究每个分类变量只取两⨯. 如右图吸烟与患个值,这样的列联表称为22 Array肺癌的列联表:由列联表可以粗略估计出吸烟者和不吸烟者患肺癌的可能性存在差异.二. 独立性检验的基本思想:1.独立性检验的必要性(为什么不能只凭列联表的数据和图形下结论?):列联表中的数据是样本数据,它只是总体的代表,具有随机性,故需要用列联表检验的方法确认所得结论在多大程度上适用于总体.关于这一点在下面的例题中还要进一步说明.2.独立性检验的步骤及原理(与反证法类似):3.独立性检验的案例展示案例.某医疗机构为了了解患肺癌与吸烟是否有关,进行了一次抽样调查,共调查了9965个成年人,其中吸烟者2148人,不吸烟者7817 人,调查结果是:吸烟的2148 人中49人患肺癌,2099人不患肺癌;不吸烟的7817人中42人患肺癌,7775人不患肺癌.根据这些数据能否断定:患肺癌与吸烟有关?从问题“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表,柱形图,和条形图的展示,使学生直观感觉到吸烟和患肺癌可能会有关系.在不吸烟者中患肺癌的比重是0.54% ;在吸烟者中患肺癌的比重是 2.28% .说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大. 通过数据和图表分析,得到结论是:吸烟与患肺癌有关.但这种结论能否推广到总体呢?要回答这个问题,就必须借助于统计理论来分析. 独立性检验就是检验两个分类变量是否有关的一种统计方法:用字母表示吸烟与患肺癌的列联表: 不患肺癌 患肺癌 合计 不吸烟 a b a+b 吸烟 c d c+d 合计a+cb+da+b+c+d样本容量 d c b a n +++=假设H 0 :吸烟与患肺癌没有关系。
高中数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用导学案 新人教A版选修1-2(
河北省承德市高中数学第一章统计案例1.2 独立性检验的基本思想及其初步应用导学案新人教A版选修1-2编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(河北省承德市高中数学第一章统计案例1.2 独立性检验的基本思想及其初步应用导学案新人教A版选修1-2)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为河北省承德市高中数学第一章统计案例1.2 独立性检验的基本思想及其初步应用导学案新人教A版选修1-2的全部内容。
1.2 独立性检验的基本思想及其初步应用1.教学重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法——相关指数和残差分析2.教学难点:解释残差变量的含义,回归直线系数的计算求解.方法:自主学习合作探究师生互动一、选择题1.下列关于等高条形图的叙述正确的是()A.从等高条形图中可以精确地判断两个分类变量是否有关系B.从等高条例形图中可以看出两个变量频数的相对大小C.从等高条形图可以粗略地看出两个分类变量是否有关系D.以上说法都不对2.在2×2列联表中,两个比值________相差越大,两个分类变量之间的关系越强()A.错误!与错误!B.错误!与错误!C.错误!与错误!D.错误!与错误!3.独立性检验中,不需要精确计算就可以粗略地判断两个分类变量是否有关的是()A.散点图 B.等高条形图 C.假设检验的思想 D.以上都不对4.在一个2×2列联表中,由其所给的数据计算得K2=5。
672,则其两个变量间有关系的可能性为()A.99% B.95% C.90% D.无关系5.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()课堂随笔:①若K2的观测值满足K2≥6。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.2 独立性检验的基本思想及其初步应用1.理解独立性检验的基本思想及其实施步骤.(重点)2.能利用条形图、列联表探讨两个分类变量的关系.(易混点)3.了解K2的含义及其应用.4.通过对数据的处理,来提高解决实际问题的能力.(难点)[基础·初探]教材整理1 分类变量与列联表阅读教材P10~P13的内容,完成下列问题.1.分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.2.列联表(1)定义:列出的两个分类变量的频数表,称为列联表.(2)2×2列联表:一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:下面是一个2×2列联表:【解析】 ∵a +21=73,∴a =52. 又b =a +8=52+8=60. 【答案】 52,60 教材整理2 等高条形图阅读教材P 14的内容,完成下列问题.1.定义:将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分别对应不同的颜色,这就是等高条形图.2.等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.3.观察等高条形图发现aa +b 和cc +d相差很大,就判断两个分类变量之间有关系.观察下列各图,其中两个分类变量x ,y 之间关系最强的是________.图121【解析】 在四幅图中图(4)中两个深色条的高相差最明显,说明两个分类变量之间关系最强,故选(4).【答案】 (4)教材整理3 独立性检验阅读教材P 12的内容,完成下列问题. 1.定义利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验. 2.公式K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d .1.关于分类变量x 与y 的随机变量K 2的观测值k ,下列说法正确的是________(填序号). (1)k 的值越大,“X 和Y 有关系”可信程度越小; (2)k 的值越小,“X 和Y 有关系”可信程度越小; (3)k 的值越接近于0,“X 和Y 无关”程度越小; (4)k 的值越大,“X 和Y 无关”程度越大.【解析】 k 的值越大,X 和Y 有关系的可能性就越大,也就意味着X 和Y 无关系的可能性就越小.【答案】 (2)2.式子|ad -bc |越大,K 2的值就越________.(填“大”或“小”) 【解析】 由K 2的表达式知|ad -bc |越大,(ad -bc )2就越大,K 2就越大. 【答案】 大[小组合作型]70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用a a +b 与cc +d 判断二者是否有关系.【精彩点拨】 对变量进行分类→求出分类变量的不同取值→ 作出2×2列联表→计算aa +b 与cc +d的值作出判断【自主解答】 2×2列联表如下:将表中数据代入公式得a +b =64=0.671 875. cc +d =2760=0.45. 显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.1.作2×2列联表时,关键是对涉及的变量分清类别.注意应该是4行4列,计算时要准确无误.2.利用2×2列联表分析两变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将aa +b 与c c +d ⎝ ⎛⎭⎪⎫或b a +b 与d c +d 的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.[再练一题]1.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:【解析】 因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即ba +b =1858,dc +d =2742,两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄有关.【答案】 有关426人中332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.【精彩点拨】 作出2×2列联表―→根据列联表数据作等高条形图―→ 对比乘积的差距判断两个分类变量是否有关 【自主解答】 作列联表如下:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.从图中可以看出,考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.1.判断两个分类变量是否有关系的两种常用方法(1)利用数形结合思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法.(2)一般地,在等高条形图中,aa +b 与cc +d相差越大,两个分类变量有关系的可能性就越大.2.利用等高条形图判断两个分类变量是否相关的步骤[再练一题]2.为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表:药物效果试验列联表【解】相应的等高条形图如下:从图形可以看出,服用药的样本中患病的比例明显低于没有服用药的样本中患病的比例,因此可以认为:服用药和患病之间有关系.70人、男性50人.女性中有40人主要的休闲方式是看电视,另外30人主要的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外30人主要的休闲方式是运动.(1)根据以上数据建立一个2×2的列联表;(2)休闲方式与性别是否有关?【精彩点拨】先根据已知数据建立2×2列联表,再通过列联表中的数值求K2,再根据K2的值作出判断.【自主解答】(1)2×2的列联表为k=-270×50×60×60=247≈3.429.而2.706<3.429<3.841.因为P(K2>2.706)≈0.10.所以,在犯错误的概率不超过0.10的前提下,认为休闲方式与性别有关.解决一般的独立性检验问题的步骤[再练一题]3.为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.试分析学生选报文、理科与对外语的兴趣是否有关?【导学号:81092004】【解】根据题目所给的数据得到如下列联表:k=-732236×125×211×150≈1.871×10-4.因为1.871×10-4<2.706,所以据目前的数据不能认为学生选报文、理科与对外语的兴趣有关,即可以认为学生选报文、理科与对外语的兴趣无关.[探究共研型]探究1【提示】利用K2进行独立性检验,可以对推断的正确性的概率作出估计,样本容量n 越大,这个估计值越准确,如果抽取的样本容量很小,那么利用K2进行独立性检验的结果就不具有可靠性.探究2 在K2运算后,得到K2的值为29.78,在判断变量相关时,P(K2≥6.635)≈0.01和P(K2≥7.879)≈0.005,哪种说法是正确的?【提示】两种说法均正确.P(K2≥6.635)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两个变量相关;而P(K2≥7.879)≈0.005的含义是在犯错误的概率不超过0.005的前提下认为两个变量相关.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件.试分别用列联表、独立性检验的方法分析监督员甲对产品质量好坏有无影响.能否在犯错误的概率不超过0.001的前提下,认为质量监督员甲是否在生产现场与产品质量有关?【精彩点拨】解答本题可先列出2×2列联表,然后具体分析.【自主解答】(1)2×2列联表如下:为“质量监督员甲是否在生产现场与产品质量有关系”.(2)由2×2列联表中数据,计算得到K2的观测值为k=-2990×510×1 475×25≈13.097>10.828,因此在犯错误不超过0.001的前提下,认为质量监督员甲是否在生产现场与产品质量有关.判断两个变量是否有关的三种方法[再练一题]4.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据:出生时间在晚上的男婴为24人,女婴为8人;出生时间在白天的男婴为31人,女婴为26人.(1)将下面的2×2列联表补充完整;(2)【解】(1)2×2列联表如下:k=-2 55×34×32×57≈3.689>2.706.根据临界值表知P(K2≥2.706)≈0.10.因此在犯错误的概率不超过0.10的前提下认为婴儿的性别与出生时间有关系.1.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A.平均数与方差B.回归分析C.独立性检验D.概率【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.【答案】 C2.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算K2=8.01,则认为“喜欢乡村音乐与性别有关系”的把握性约为( )C.99% D.99.9%【解析】因为K2=8.01>6.635,所以有99%以上的把握认为“喜欢乡村音乐与性别有关系”.【答案】 C3.以下关于独立性检验的说法中,错误的是( ) A .独立性检验依赖小概率原理 B .独立性检验得到的结论一定正确 C .样本不同,独立性检验的结论可能有差异 D .独立性检验不是判定两事物是否相关的唯一方法【解析】 受样本选取的影响,独立性检验得到的结论不一定正确,选B. 【答案】 B4.在2×2列联表中,两个比值aa +b与________相差越大,两个分类变量有关系的可能性越大. 【导学号:81092005】【解析】 根据2×2列联表可知,比值aa +b 与cc +d相差越大,则|ad -bc |就越大,那么两个分类变量有关系的可能性就越大.【答案】cc +d5.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:方面有差异”.【解】 将2×2列联表中的数据代入公式计算,得k =n ad -bc 2a +bc +d a +cb +d=-270×30×80×20=10021≈4.762. 因为4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.学业分层测评 (建议用时:45分钟)[学业达标]一、选择题1.如果在犯错误的概率不超过0.05的前提下认为事件A 和B 有关,那么具体算出的数据满足( )A.K2>3.841 B.K2<3.841C.K2>6.635 D.K2<6.635【解析】对应P(K2≥k0)的临界值表可知,当K2>3.841时,在犯错误的概率不超过0.05的前提下认为事件A与B有关.【答案】 A2.下列关于等高条形图的叙述正确的是( )A.从等高条形图中可以精确地判断两个分类变量是否有关系B.从等高条形图中可以看出两个变量频数的相对大小C.从等高条形图中可以粗略地看出两个分类变量是否有关系D.以上说法都不对【解析】在等高条形图中仅能粗略判断两个分类变量的关系,故A错.在等高条形图中仅能够找出频率,无法找出频数,故B错.【答案】 C3.分类变量X和Y的列联表如下,则( )A.ad-bcB.ad-bc越大,说明X与Y的关系越强C.(ad-bc)2越大,说明X与Y的关系越强D.(ad-bc)2越接近于0,说明X与Y的关系越强【解析】结合独立性检验的思想可知|ad-bc|越大,X与Y的相关性越强,从而(ad -bc)2越大,说明X与Y的相关性越强.【答案】 C4.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.下列说法中正确的是( )A.100个心脏病患者中至少有99人打鼾B.1个人患心脏病,则这个人有99%的概率打鼾C.100个心脏病患者中一定有打鼾的人D.100个心脏病患者中可能一个打鼾的人都没有【解析】这是独立性检验,在犯错误的概率不超过0.01的前提下认为“打鼾与患心脏病有关”.这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义可知答案应选D.【答案】 D5.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:( ) 【导学号:81092006】A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关【解析】根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.【答案】 D二、填空题6.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射后14天内的结果如表所示:【解析】由独立性检验的步骤知第一步先假设两分类变量无关,即假设电离辐射的剂量与小白鼠的死亡无关.【答案】假设电离辐射的剂量与小白鼠的死亡无关7.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据:设H0服用此药的效果与患者的性别有关,这种判断出错的可能性为________.【解析】由公式计算得K2的观测值k≈4.882,∵k>3.841,∴有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.【答案】 4.882 5%8.在对某小学的学生进行吃零食的调查中,得到如下表数据:【解析】由公式可计算得k=-2 39×63×61×41≈2.334.【答案】 2.334三、解答题9.对某校小学生进行心理障碍测试得到如下列联表:附:k =30×80×20×90≈6.366>5.024,所以有97.5%的把握认为心理障碍与性别有关.10.某市地铁即将于2017年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下:与“认为价格偏高者”的月平均收入的差距是多少(结果保留2位小数);(2)由以上统计数据填下面2×2列联表,分析是否有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.附:K 2=a +bc +d a +c a +d. x 1=20×1+30×2+40×3+50×5+60×3+70×41+2+3+5+3+4≈50.56.“认为价格偏高者”的月平均收入为x 2=20×4+30×8+40×12+50×5+60×2+70×14+8+12+5+2+1=38.75,∴“赞成定价者”与“认为价格偏高者”的月平均收入的差距是x 1-x 2=50.56-38.75=11.81(百元).(2)根据条件可得2×2列联表如下:K 2=10×40×18×32≈6.27<6.635,∴没有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.[能力提升]1.假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其2×2列联表为:A .a =5,b =4,c =3,d =2B .a =5,b =3,c =4,d =2C .a =2,b =3,c =4,d =5D .a =3,b =2,c =4,d =5【解析】 对于同一样本,|ad -bc |越小,说明x 与y 相关性越弱,而|ad -bc |越大,说明x 与y相关性越强,通过计算知,对于A ,B ,C 都有|ad -bc |=|10-12|=2.对于选项D ,有|ad -bc |=|15-8|=7,显然7>2.【答案】 D2.有两个分类变量X ,Y ,其一组观测值如下面的2×2列联表所示:其中a,15-a 的前提下认为X ,Y 有关,则a 的值为( )A .8B .9C .8,9D .6,8【解析】 根据公式,得 k =65×[a +a --a -a220×45×15×50=a -220×45×3×2>3.841,根据a >5且15-a >5,a ∈Z ,求得a =8,9满足题意. 【答案】 C3.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:=________(保留三位小数),所以判定________(填“有”或“没有”)95%的把握认为主修统计专业与性别有关系.参考公式:K 2=n ad -bc 2a +bc +d a +cb +d;【解析】 根据提供的表格,得k =23×27×20×30≈4.844>3.841,∴可以判定有95%的把握认为主修统计专业与性别有关系. 【答案】 4.844 有4.某地震观测站对地下水位的变化和发生地震的情况共进行1 700次观测,列联表如下:分的证据显示二者有关系.【解】 相应的等高条形图如图所示.图中两个阴影条的高分别表示水位有变化和水位无变化的样本中有震的频率.由图可看出,水位有变化样本中有震的频率与水位无变化样本中有震的频率相差不大,因此不能判断地震与水位变化有关系.根据列联表中的数据,得K 2的观测值为 k =1 -21 000×700×180×1 520≈1.594<2.072,所以题中数据没有充分的证据显示地下水位的变化与地震的发生有关系,但也不能认为二者无关系.。