高二数学1-2独立性检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
独立性检验
教学重点、独立性检验的基本方法,独立性检验的步骤
难点:.基本思想的领会及方法应用.
知识点
一、独立性检验的基本概念和原理
独立性检验是研究相关关系的方法。
1.分类变量:变量的不同“值”表示个体所属的不同类别的变量称为分类变量.比如男女、是否吸烟、是否患癌症,宗教信仰、国籍等等。
2 列联表:分类变量的汇总统计表(频数表). 一般我们只研究每个分类变量只取两个
患病未患病合计
吸烟37 183 220
不吸烟21 274 295
合计58 457 515
3.条形图
为了更清晰地表达这个特征,我们还可用如下的等高条形图表示两种情况下患肺癌的比例.如图一3 所示,在等高条形图中,浅色的条高表示不患肺癌的百分比;深色的条高表示患肺癌的百分比.
通过分析数据和图形,我们得到的直观印象是“吸烟和患肺癌有关”.那么我们是否能够以一定的把握认为“吸烟与患肺癌有关”呢
4.独立性检验的步骤
:吸烟与患肺癌没有关系,看看能够得到什么样为了回答下面问题,我们先假设H
的结论。
不患肺癌患肺癌合计不吸烟a b a+b
吸烟c d c+d
合计a+c b+d a+b+c+d
样本容量n=a+b+c+d
如果“吸烟与患肺癌没有关系”,则吸烟者中不患肺癌的的比例应该与不吸烟者中相应的比例差不多,即:
()()()
()()()()
2
2
0a c
a c d c a
b ad b
c a b c d
ad bc ad bc n ad bc k a b c d a c b d n a b c d ≈⇒+≈+⇒-≈++---=++++=+++因此 : 越小, 说明吸烟与患肺癌之间关系越弱. 越大, 说明吸烟与患肺癌之间关系越强构造随机变量 其中
为样本容量
若 H 0 成立,即“吸烟与患肺癌没有关系”,则 K “应该很小.根据表3一7中的数据,
利用公式(1)计算得到 K “的观测值为
()2
2
996577754942209956.63278172148987491
K ⨯-⨯=≈⨯⨯⨯,
这个值到底能告诉我们什么呢
统计学家经过研究后发现,在 H 0成立的情况下,
2( 6.635)0.01P K ≥≈. (2)
(2)式说明,在H 0成立的情况下,2K 的观测值超过 6. 635 的概率非常小,近似为0 . 01,是一个小概率事件.现在2K 的观测值k ≈ ,远远大于6. 635,所以有理由断定H 0不成立,即认为“吸烟与患肺癌有关系”.但这种判断会犯错误,犯错误的概率不会超过,即我们有99%的把握认为“吸烟与患肺癌有关系” .
在上述过程中,实际上是借助于随机变量2K 的观测值k 建立了一个判断H 0是否成立的规则:
如果k ≥6. 635,就判断H 0不成立,即认为吸烟与患肺癌有关系;否则,就判断H 0成立,即认为吸烟与患肺癌没有关系.
在该规则下,把结论“H 0 成立”错判成“H 0 不成立”的概率不会超过
2( 6.635)0.01P K ≥≈,
即有99%的把握认为H 0不成立.
你觉得和反证法有没有什么共同点
反证法 假设检验 要证明结论A
备择假设H 1
在A 不成立的前提下进行推理 在H 1不成立的条件下,即H 0成立的条件下进行推理 推出矛盾,意味着结论A 成立 推出有利于H 1成立的小概率事件(概率不超过α的事件)发生,意味着H 1成立的可能性(可能性为(1-α))很大 没有找到矛盾,不能对A 下任何结论,即反证法不成功
推出有利于H 1成立的小概率事件不发生,接受原假设
上例的解决步骤
第一步:提出假设检验问题 H 0:吸烟与患肺癌没有关系↔ H 1:吸烟与患肺癌有关系
第二步:选择检验的指标 2
2
()K ()()()()
n ad bc a b c d a c b d -=++++
(它越小,原假设“H 0:吸烟与患肺癌没有关系”成立的可能性越大;它越大,备择假设“H 1:吸烟与患肺癌有关系”成立的可能性越大. 第三步:查表得出结论
注意:1观测值是2
K 的值
2.假设没有关系,如果2K 大,则H 0不成立,即两个量有关系。 如果2K 小,说明没有足够证据证明H 0不成立,即两个量没有关系 3.查表后,大于某个值0k 的可能性很小,如果大于0k ,则得出两个量有关系 4得到两个量有(没有)关系的结论是在概率基础上决定的,存在犯错误的概率
5有99%的把握(相当于正确概率99%)认为 有关 在犯错误的概率不超过1%的前提下,认为“ 有关”
说明:95%就是概率,可以说成有95%的把握,这种事件出现的可能性极大 5%当然也是概率,这种事件出现的可能性极小,
在新闻中播报的水灾20年一遇,就是概率5%事件发生了 题型一概念辨析
例题 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
A .若K 2的观测值为k =,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病
B .从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病
C .若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推判出现错误
D .以上三种说法都不正确
A 变式1下列关于独立性检验的说法中,错误的是( ) A .独立性检验得到的结论一定正确
B .独立性检验依赖小概率原理
C .样本不同,独立性检验的结论可能有差异
D .独立性检验不是判定两事物是否相关的唯一方法
考点:独立性检验的基本思想.
分析:对选项进行判断,独立性检验取决于样本、独立性检验是依据小概率原理,用样本计
算统计量的、样本不同,观测值统计量也不同、对于检验两个事件是否相关除了统计量外,还可以根据两个分类变量之间频率大小差异进行粗略判断,即可得出结论.