高中数学(人教A选修1-2)课件:1.2 独立性检验的基本思想及其初步应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相互影响
频率特征
a
c
ab cd
3.独立性检验
利用随机变量K2来判断“两个分类变量有关 定义
系”的方法称为独立性检验
公式 K2
n(ad bc)2
,其中n _a___b__c___d_
(a b)(c d)(a c)(b d)
①根据实际问题的需要,确定容许推断“两个
分类
变临量界值有k0关系”犯错误概率的上界α,然后查表
(2)分类变量是大量存在的.例如,吸烟变量有吸烟与不吸烟两种类别,而国籍变 量则有多种类别. (3)注意区分分类变量与定量变量的不同.如身高、体重、考试成绩等就是定 量变量,它们的取值一定是实数,并且取值大小有特定的含义.
【微思考】
分类变量只有两个“取值”吗? 提示:不是.有些分类变量取值有很多,但本节只研究只有两个“取值”的分类 变量.
【解析】(1)错误.事件A与B的检验无关,只是说事件的相关性较小,并不一定 两事件互不影响. (2)正确.由K2的意义易知此说法正确. (3)错误.判断A与B是否相关的方式很多,可以用列联表,也可以借助图形或概 率运算. 答案:(1)× (2)√ (3)×
2.做一做(请把正确的答案写在横线上)
(1)统计中有一个非常有用的统计量K2,在2×2列联表中它的表达式
确定
观测值k
______k_≥_k.0 ②犯利错用误的公概式率计算随机变量K2的________.
③如果_____,就推断“X与Y有关系”,这种推
具体
断 步骤
没有发现足够证据
_____________不超过α;否则,就认为在犯错
误的
1.判一判(正确的打“√”,错误的打“×”) (1)事件A与B的检验无关,即两个事件互不影响. ( ) (2)事件A与B关系越密切,K2就越大. ( ) (3)K2的大小是判断事件A与B是否相关的唯一数据. ( )
当k≥3.841,即在犯错误的概率不超过0.05的前提下认为“X与Y有关系”. 当k≥2.706,即在犯错误的概率不超过0.1的前提下认为“X与Y有关系”. 当k<2.706,即认为没有充分的证据显示“X与Y有关系”. 像这样利用随机变量K2的观测值k来确定在多大程度上可以认为“两个分类 变量有关系”的方法称为两个分类变量的独立性检验.
答案:K2≥6.635 n(ad bc)2
(答3案)由:大K2的表(达a 式 b知)(|cadd-b)(ca|越 c大)(b,(add-)bc)2就越大,K2就越大.
【要点探究】
知识点1 分类变量 对“分类变量”的三点说明
(1)这里的“变量”和“值”都应作为“广义”的变量和值进行理解.例如,对 于性别变量,其取值为男和女两种.那么这里的变量指的是性别,同样这里的 “值”指的是“男”和“女”.因此,这里所说的“变量”和“值”不一定取 的是具体的数值.
【知识拓展】临界值表 当k≥10.828,即在犯错误的概率不超过0.001的前提下认为“X与Y有关系”. 当k≥7.879,即在犯错误的概率不超过0.005的前提下认为“X与Y有关系”. 当k≥6.635,即在犯错误的概率不超过0.010的前提下认为“X与Y有关系”. 当k≥5.024,即在犯错误的概率不超过0.025的前提下认为“X与Y有关系”.
1.2 独立性检验的基本思想及其初步应用
1.分类变量的概念是什么?什么是列联表, 问 什么是2×2列联表? 题 2.等高条形图的优点是什么?如何利用等 引 高条形图判断两个变量之间的关系? 航 3.独立性检验的概念是什么?怎样进行独
立性检验?
1.分类变量和列联表 (1)分类变量 变量的不同“值”表示个体所属的_________,像这样的变量称为分类变量.
【微思考】
(1)K2≥6.635是指两个分类变量有关系的概率为99%,这种理解正确吗? 提示:不正确.K2≥6.635是指两个分类变量有关系这一结论成立的可信度为 99%而不是有关系的概率为99%. (2)等高条形图与列联表相比有何优点? 提示:更直观,更明了.
2.独立性检验与反证法的异同点 (1)思想类似:独立性检验的思想来自于统计学的假设检验思想,它与反证法类 似,假设检验和反证法都是先假设结论不成立,然后根据是否能够推出“矛盾” 来断定结论是否成立. (2)“矛盾”的含义不同:反证法中的“矛盾”是指不符合逻辑的事件的发生; 而假设检验中的“矛盾”是指不符合逻辑的小概率事件的发生,即在结论不 成立的假设下,推出利用结论成立的小概率事件的发生.
不同类别
(2)列联表
①定义:列出的两个分类变量的_______称为列联表.
②2×2列联表.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本
频数列联表(称为2×2列联表)为
频数表
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计 a+c b+d a+b+c+d
2.等高条形图 (1)等高条形图和表格相比,更能直观地反映出两个分类变 量间是否_________,常用等高条形图展示列联表数据的 _________. (2)观察等高条形图发现_____和_____相差很大,就判断两个分类变量之间 有关系.
【即时练】
下列不是分类变量的是 ( )
A.近视
B.身高
C.血压
D.药物反应
【解析】选B.判断一个量是否是分类变量,只需看变量的不同值是否表示个体
的不同类别,A,C,D选项的不同值都可以表示个体的不同类别,只有B选项的不
同值不表示个体的不同类别.
知识点2 等高条形图与独立性检验 1.等高条形图和独立性检验的特点 (1)通过等高条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断 无法精确地给出所得结论的可靠程度. (2)利用独立性检验来判断两个分类变量是否有关系,能够精确地给出这种判 断的可靠程度,也常与图形分析法结合.

Байду номын сангаас
.
(2)在独立性检验中,选用K2作统计量,当K2满足条件 时,
在犯错误的概率不超过0.010的前提下认为事件A与B有关.
(3)式子|ad-bc|越大,K2的值就越
(填大或小).
【解析】(1)在2×2列联表中K2= 答案:K2=
n(ad bc)2
.
(2)当K2≥6.635时在犯错误的概率不超过(a0.0b1)0(c的前d提)(a下认c)为(bA与d)B有关系.
相关文档
最新文档