原创1:3.2 独立性检验的基本思想及其初步应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

根据所选择的193个病人的数据,能否作出药的效果和给药方式有
关的结论?
口服 注射 合计
有效 58 64 122
无效 40 31 71
合计 98 95 193
解:设H0:药的效果与给药方式没有关系.
K2
19358 31 64 402
1.3896
122 71 98 95
因当H0成立时,K2≥1.3896的概率大于15%,故不能否定假设 H0,即不能作出药的效果与给药方式有关的结论.
独立性检验的基本思想 对“两个分类变量有关系”这一结论成立的可信程度的判断: (1)假设该结论不成立,即假设结论“两个分类变量没有关系” 成立.
(2)在假设条件下,计算构造的随机变量K2,如果由观测数据 计算得到的K2很大,则在一定程度上说明假设不合理. (3)根据随机变量K2的含义和临界值可以确定 “两个分类有关 系”这一结论成立的可信程度.
1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1
0 不吸烟
不吸 烟
患肺癌 比例
吸烟 吸烟
不患肺癌 比例
等高条形图更清晰地表达了两种情况下患肺癌的比例.
问题探究二
你有多大的把握认为它们有关系? 我们先假设:
H0:吸烟与患肺癌没有关系
看看能推出什么样的结论
把表1-7中的数字用字母代替,得到如下用字母表示的列联表:
275 70 245 100
因当H0成立时,K2≥10.828的概率为0.001,故有99.9%的把握认 为,两种药物的疗效有差异.
课堂小结
独立性检验
K2
( n ad - bc)2
(a b)(c d )(a c)(b d )
(a b)(c d )(a c)(b d )
若H0成立,即“吸烟和患肺癌没有关系”K2 应该很小
独立性检验
不吸烟 吸烟 总计
吸烟与肺癌列联表
不患肺癌
患肺癌
7775
42
2099
49
9874
91
总计 7817 2148 9965
通过公式计算
K 2 9965(7775 49 42 2099)2 56.632 7817 2148 9874 91
1.如果k>10.828,就有99.9%的把握认为“X与Y有关系” 2.如果k>6.635,就有99%的把握认为“X与Y有关系” 3.如果k>2.706,就有90%的把握认为“X与Y有关系” 4.如果k<=2.706,就认为没有充分的证据显示“X与Y有关系”
例Baidu Nhomakorabea解析
例1.在某医院,因为患心脏病而住院的665名男性病人中,有214 人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有 175人秃顶。问你有多大的把握认为秃顶与患心脏病有关系?
9965人,得到如下结果(单位:人)
吸烟与肺癌列联表
不患肺癌
患肺癌
总计
不吸烟
7775
42
7817
吸烟
2099
49
2148
总计
9874
91
9965
在不吸烟者中患肺癌的比重是_0_._5_4_%___. 在吸烟者中患肺癌的比重是2_._2_8_%_______
问题探究一
从直观上你能得出什么结论?
直观结论:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟 者患肺癌的可能性大.
例题解析
例2.在500人身上试验某种血清预防感冒作用,把他们一年中的感
冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所
示.
使用血清 未使用血清
合计
未感冒 252 224 476
感冒 248 276 524
合计 500 500 1000
判断这种血清能否起到预防感冒的作用?
解:设H0:感冒与是否使用该血清没有关系.
2.气管炎是一种常见的呼吸道疾病,医药研究人员对两种中草药 治疗慢性气管炎的疗效进行对比,所得数据如表所示,问:它们 的疗效有无差异?
复方江剪刀草 胆黄片 合计
有效 184 91 275
无效 61 9 70
合计 245 100 345
解:设H0:两种中草药的治疗效果没有差异. K 2 345184 9 61 912 11.098
这个小概率事件的发生使庞加莱得出推断结果.
定量变量 变量 分类变量 (定性变量) 对于性别变量,其取值为男和女两种,这种变量的不同“值” 表示个体所属的不同类别,像这样的变量称为分类变量.
如是否吸烟、宗教信仰、是否患肺癌、国籍等等.
问题探究
列联表
为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了
问题探究三
这个值到底能告诉我们什么呢?怎样判断K2的观测k值是大还是 小呢? H0成立的情况下
P( K 2 6.635) 0.01 k 56.632
这是一个小概率事件.现在K2的观测值为56.632,远远大于6.635, 所以有理由断定H0不成立,即认为“吸烟与患肺癌有关系”. 但这种判断会犯错误,犯错误的概率不会超过0.01,即我们有99 %的把握认为“吸烟与患肺癌有关系”.
不吸烟 吸烟 总计
不患肺癌 a c
a+c
患肺癌 b d
b+d
总计 a+b c+d a+b+c+d
若吸烟与患肺癌没有关系。则吸烟者中不患肺癌的的比例应该与不吸 烟者中相应的比例差不多,即:
为了使不同样本容量的数据有统一的评判标准,基于上述分析,
统计学家构造一个随机变量
K2
( n ad - bc)2
独立性检验: 利用随机变量K2来判断“两个分类变量是否有关系”的方法称 为两个分类变量的独立性检验.
临界值
P(K 2 k) 0.50 0.40 0.5 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 0.445 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
第三章 统计案例 §3.2独立性检验的基本思想及其初步应用
高中数学选修2-3·精品课件
问题引入
问题: 数学家庞加莱每天都从一家面包店买一块1000g 的面包, 并记录下买回的面包的实际质量.一年后,这位数学家发现,所记 录数据的均值为950g.于是庞加莱推断这家面包店的面包分量不足.
假设“面包份量足”,则一年购买面包的质量数据的平均值应该不少于 1000g ; “这个平均值不大于950g”是一个与假设“面包份量足”矛盾的小概率事件;
K 2 1000258 284 242 2162 7.075
474 526 500 500
因当H0成立时,K2≥6.635的概率约为0.01,故有99%的把握认
为该血清能起到预防感冒的作用.
巩固练习
1.为研究不同的给药方式(口服与注射)和药的效果(有效与无
效)是否有关,进行了相应的抽样调查,调查的结果列在表中,
解:列联表为
秃顶 不秃顶 总计
患心脏病 不患心脏病
214
175
451
597
665
772
总计 389
1048
1437
根据联表1-13中的数据,得到
K 2 1437 (214 597 175 451)2 16.373 6.635. 389 1048 665 772
所以有99%的把握认为“秃顶患心脏病有关”.
相关文档
最新文档