精品数学 高中数学人教A版选择性必修三第八章 §8.3 列联表与独立性检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§8.3列联表与独立性检验
学习目标 1.通过实例,理解2×2列联表的统计意义.2.通过实例,了解2×2列联表独立性检验及其应用.
知识点一分类变量
为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.
知识点二2×2列联表
1.2×2列联表给出了成对分类变量数据的交叉分类频数.
2.定义一对分类变量X和Y,我们整理数据如下表所示:
X
Y
合计Y=0Y=1
X=0 a b a+b
X=1 c d c+d
合计a+c b+d n=a+b+c+d
像这种形式的数据统计表称为2×2列联表.
知识点三独立性检验
1.定义:利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”.简称独立性检验.
2.χ2=n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)
,其中n=a+b+c+d.
3.独立性检验解决实际问题的主要环节
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.
(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.
(3)根据检验规则得出推断结论.
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.思考独立性检验与反证法的思想类似,那么独立性检验是反证法吗?
答案不是.因为反证法不会出错,而独立性检验依据的是小概率事件几乎不发生.
1.分类变量中的变量与函数的变量是同一概念.(×)
2.等高堆积条形图可初步分析两分类变量是否有关系,而独立性检验中χ2取值则可通过统计表从数据上说明两分类变量的相关性的大小.( √ )
3.事件A 与B 的独立性检验无关,即两个事件互不影响.( × ) 4.χ2的大小是判断事件A 与B 是否相关的统计量.( √ )
一、等高堆积条形图的应用
例1 为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:
组别 尿棕色素 合计 阳性数 阴性数 铅中毒病人 29 7 36 对照组 9 28 37 合计
38
35
73
试画出列联表的等高堆积条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系? 解 等高堆积条形图如图所示:
其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率. 由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系. 反思感悟 等高堆积条形图的优劣点
(1)优点:较直观地展示了a a +b 与c
c +d
的差异性.
(2)劣点:不能给出推断“两个分类变量有关系”犯错误的概率.
跟踪训练1 网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成
绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.利用等高堆积条形图判断学生学习成绩与经常上网有关吗?
解根据题目所给的数据得到如下2×2列联表:
学习成绩
上网
合计经常不经常
不及格80120200
及格120680800
合计200800 1 000
得出等高堆积条形图如图所示:
比较图中阴影部分高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此可以认为学习成绩与经常上网有关.
二、由χ2进行独立性检验
命题角度1有关“相关的检验”
例2某校对学生课外活动进行调查,结果整理成下表:试根据小概率值α=0.005的独立性检验,分析喜欢体育还是文娱与性别是否有关系.
性别
喜欢
合计体育文娱
男生212344
女生62935
合计275279 解零假设为H0:喜欢体育还是喜欢文娱与性别没有关系.
∵a =21,b =23,c =6,d =29,n =79, ∴χ2=
n (ad -bc )2
(a +b )(c +d )(a +c )(b +d )
=79×(21×29-23×6)244×35×27×52
≈8.106>7.879=x 0.005.
根据小概率值α=0.005的独立性检验,我们推断H 0不成立,即认为喜欢体育还是喜欢文娱与性别有关.
反思感悟 用χ2进行“相关的检验”步骤 (1)零假设:即先假设两变量间没关系. (2)计算χ2:套用χ2的公式求得χ2值.
(3)查临界值:结合所给小概率值α查得相应的临界值x α. (4)下结论:比较χ2与x α的大小,并作出结论.
跟踪训练2 甲、乙两机床加工同一种零件,抽检得到它们加工后的零件尺寸x (单位:cm)及个数y ,如下表:
由表中数据得y 关于x
的经验回归方程为y ^
=-91+100x (1.01≤x ≤1.05),其中合格零件尺寸为1.03±0.01(cm).完成下面列联表,并依据小概率值α=0.01的独立性检验,分析加工零件的质量与甲、乙是否有关.
解 x =1.03,y =a +495
,
由y ^
=-91+100x ,知a +49
5
=-91+100×1.03,
所以a =11.由于合格零件尺寸为1.03±0.01 cm , 故甲、乙加工的合格与不合格零件的数据表为:
零假设为H 0:加工零件的质量与甲、乙无关.则 χ2=n (ad -bc )2
(a +b )(c +d )(a +c )(b +d )
=60×(24×18-6×12)230×30×36×24
=10,
因为χ2=10>6.635=x 0.01,根据小概率值α=0.01的独立性检验,我们推断H 0不成立.即认为加工零件的质量与甲、乙有关. 命题角度2 有关“无关的检验”
例3 下表是某届某校本科志愿报名时,对其中304名学生进入高校时是否知道想学专业的调查表:
根据表中数据,则下列说法正确的是________.(填序号) ①性别与知道想学专业有关; ②性别与知道想学专业无关; ③女生比男生更易知道所学专业. 答案 ②