8.4列联表独立性分析案例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

解:
由于 7.469>6.635,所以在犯错概率不超过 1%的前提下认 为 50 岁以上的人患慢性气管炎与吸烟有关系.
2.在从烟台——大连的某次航运中,海上出现恶劣气候.
随机调查男、女乘客在船上晕船的情况如表所示: 晕船 男人 32 不晕船 51 总计 83
女人
8
24
32
40 75 115 总计 据此资料,你是否认为在恶劣气候中航行,男人比女人更 容易晕船?
第四步:查对临界值表,作出判断。
P(k≥k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
反证法原理与假设检验原理 反证法原理:
吸烟 不吸烟 总计 患病 a c a+c 不患病 b d b+d 总计 a+b c+d a+b+c+d
第三步:引入一个随机变量:卡方统计量
k
2
a b c d a c b d
其中n a b c d
n ad bc
2
第四步:查对临界值表,作出判断。
高二数学 选修2-3
第三章
统计案例
8.4列联表独立性分析案例
2017/11/6
在许多实际问题中,我们需要考察两种因素的关系。例如: 数学解题能力是否与性别有关。为了分析这些问题,我们需要获 取一些数据,并对数据进行分析处理,对所得的结论作出判断。
某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽 样调查,共调查了 100 个成年人,其中吸烟者 54 人,不吸烟者 46 人,调查结果是:吸烟的 54 人中 39 人患病, 15 人不患病; 不吸烟的 46 人中 21 人患病, 25 人不患病。
n11 n1 n1 若 ,则吸烟是与肺癌无关联,可以认为它们相 n n n n1 n1 互独立。这个式子还可以改写为:n11 .在吸烟与患肺癌 n n1 n1 32.4<39 ,这说明既吸烟又患肺癌的人数比独 问题中, n
立时要多,在这种情况下,吸烟会使患肺癌的人数增加。
(I ) 从乙班随机抽取 2 名学生的成绩,记“成绩优秀”的个数为 ,求 的分布列 和数学期望;
(II )根据频率分布直方图填写下面 2 x2 列联表,并判断是否有 95%的把握认为: “成绩优秀”与教学方式有关.
甲班( A 方式) 成绩优秀 成绩不优秀 总计
乙班(B 方式)
总计
1.为了探究患慢性气管炎是否与吸烟有关,调查了339名
怎样描述实际观测值与估计值的差异呢? 统计学中采用
2 ( 观测值 预期值 ) 用卡方统计量: 2 预期值 来刻画实际观测值与估计值的差异.

ab bd 2 ab ac 2 (b n ) (a n ) n n n n k2 ab ac ab bd n n n n n n cd ac 2 cd bd 2 (c n ) (d n ) n n n n cd ac cd bd n n n n n n
2
独立性检验 解:H0: 吸烟和患病之间没有关系 患病 吸烟 不吸烟 总计 通过公式计算 39 21 60 不患病 15 25 40 总计 54 46 100
100 39 25 15 21 7.307 54 46 60 40
2 2
已知在 H 0 成立的情况下,
P(2 ≥x0) 0.50 0.40 0.25 0.15 x0 0.10 0.05 0.025 0.010 0.005 0.001 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
P(2 ≥x0) 0.50 0.40 0.25 0.15 x0
2
500 500 1000
解:设H0:感冒与是否使用该血清没有关系。
1000 258 284 242 216 2 7 .075 474 526 500 500 因当H0成立时,χ2≥6.635的概率约为0.01,故有99%的把握认 为该血清能起到预防感冒的作用。
0.10
0.05 0.025 0.010 0.005 0.001
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
2 n ( ad bc ) 随机变量-----卡方统计量 K 2 , ( a b )( c d )( a c )(b d )
其中 n a b c d 为样本容量。
3、独立性分析的步骤
第一步:H0: 吸烟和患病之间没有关系 第二步:列出2×2列联表
患病 不患病 总计
吸烟
不吸烟 总计
a
c a+c
2
b
d b+d
2
a+b
c+d a+b+c+d
第三步:计算
n ( ad bc ) K ( a c )( b d )( a b )( c d )
课堂小结 1.在统计学中,独立性检验就是检验两个分类变量是否有关 系的一种统计方法。
2.为使不同的样本容量的数据有统一的评判标准,构造了一
2 n ( n n n n ) 11 22 12 21 个随机变量 2 n1 n2 n1n2
P(2 ≥x0) 0.50 0.40 0.25 0.15 x0
50岁以上的人,调查结果如下表所示: 患慢性气管炎 43 13 56 未患慢性气管炎 162 121 283 总计 205 134 339
吸烟 不吸烟 总计
50岁以上的人患慢性气管炎与吸烟有关系吗?
2 339 × 43 × 121 - 162 × 13 K2= ≈7.469. 205×134×56×283
根据这些数据能否断定:患肺癌与吸烟有关吗?
案例 患肺癌与吸烟是否有关? 肺癌与吸烟的调查数据 患肺癌 吸烟 不吸烟 总计 未患肺癌 总计
n11 =39
n12 =15 n22 =25 n2 =40
n1 =54
n2 =46
n21 =21 n1 =60
n =100
分析: 吸烟的人在调查总人数中所占的百分比:54% 患肺癌的人在调查总人数中所占的百分比:60% 既吸烟又患肺癌的人在调查总人数中所占的百分比:39% 显然, 54% 60% 39%。 我们有理由相信吸烟是与肺癌有关的。
例 2:为研究不同的给药方式(口服与注射)和药的效 P(χ≥x 0.10 0.05 0.025 0.010 0.005 0.001 0) 0.50 0.40 0.25 0.15 果(有效与无效)是否有关,进行了相应的抽样调查, x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 调查的结果列在表中,根据所选择的193个病人的数 据,能否作出药的效果和给药方式有关的结论? 口服 注射 合计 有效 58 64 122 无效 40 31 71
例 1. 在 500 人身上试验某种血清预防感冒作用,把他们 P(2 ≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 一年中的感冒记录与另外 500 名未用血清的人的感冒记 x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 录作比较,结果如表所示。问:该种血清能否起到预防 感冒的作用? 未感冒 感冒 合计 使用血清 未使用血清 合计 258 216 474 242 284 526
0.10
0.05 0.025 0.010 0.005 0.001
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
Baidu Nhomakorabea
例如 0.1%把握认为A 99.9%把握认 10.828 与B无关 为A与B有关 1%把握为A与B 99%把握认 2 6.635 无关 为A与B有关 90%把握认 10%把握认为 2 2.706 为A与B有关 A与B无关 没有充分的依据显示A与B有关 2 2.706 ,但也不能显示A与B无关
2 n ( ad bc ) 化简得 k 2 ( a c )(b d )( a b )(c d )
独立性检验
用K2统计量研究这 类问题的方法 步骤
通过数据和图表分析,得到 结论是:吸烟与患病有关 结论的可靠 程度如何?
第一步:H0: 假设吸烟和患病之间没有关系
第二步:列出2×2列联表
P ( 6.635) 0.010
2
2 即在 H 0 成立的情况下, 大于6.635概率非常 小,近似为0.010 2 现在的 =7.307的观测值远大于6.635,出 现这样的观测值的概率不超过0.010。
故有99%的把握认为H0不成立,即有99%的把 握认为“患病与吸烟有关系”。
2
合计 98 95 193
解:设H0:药的效果与给药方式没有关系。
2
193 58 31 64 40 1 .3896 <2.072 122 71 98 95 因当H0成立时,χ2≥1.3896的概率大于15%,故不能否定假设 H0,即不能作出药的效果与给药方式有关的结论。
在一个已知假设 下,如果推出一 个矛盾,就证明 了这个假设不成 立。
假设检验原理:
在一个已知假设 下,如果一个与 该假设矛盾的小 概率事件发生, 就推断这个假设 不成立。
例 3、(2011 省质检)某中学将 100 名高一新生分成水平相同的甲、 乙两个“平行班”,每班 50 人.陈老师采用 A、 B 两种不同的教学 方式分别在甲、乙两个班级进行教改实验.为了解教学效果,期末 考试后,陈老师对甲、乙两个班级的学生成绩进行统计分析,画出 频率分布直方图(如下图).记成绩不低于 90 分者为“成绩优秀”
解:由公式得K2的观测值为 115×32×24-51×82 k= ≈1.870. 83×32×40×75 因为1.870<2.706, 所以我们没有理由说晕船跟性别有关.
相关文档
最新文档