独立性检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

此可以建立规则:当W 的观测值W ≥ w0 时,就判断“ X 和Y 有关系”。(其
中∵wK0 为2 正 实(a数,b且)(在cn“(addX)和(abYc没)c2)有(b关系d”) 的且前P提(K下2,≥P(Wk0≥) w00 ).0100.010 (a c)(b d ) 作业:《优化设计训练》第一章测评
不吸烟样本中的不患肺癌的比例为 a , c d
如果
H0
成立,那么
a
a
b
c
c
d
,∴
ab
a(c d)
c(a
b)
,
∴ ad bc 0 , 因此 ad bc 越小,说明吸烟与患肺癌
之间的关系越弱, ad bc 越大,说明吸烟与患肺癌之间
的关系越强.
独立性检验:
为使不同样本容量的数据有统一的评判标准,统计
k0
0.708 1.323 2.706 3.841 6.635 10.828
如K 2 9965(7775 49 42 2099)2 56.632 > 10.828 7817 2148 9874 91
所以,有 99.9%的把握认为吸烟与患肺癌有关.
独立性检验的步骤:
一般地,假设有两个分类变量 X 和Y ,它们的取值分
别为x1, x2 和 y1, y2.
第一步:列出 2 2 列联表;
y1
y2
总计
x1
a
b
ab
x2
c
d
c d
总计 a c b d a b c d
第二步:计算 K 2
n(ad bc)2
;
(a b)(c d )(a c)(b d )
第三步:查对临界值表,作出判断.
P(K 2 ≥ k0 ) 0.40 0.25 0.10 0.05 0.010 0.001
y1
y2
总计
x1
a
b
ab
x2
c
d
c d
总计
ac
b d
abcd
定义W a c ,根据独立性检验,如何用W 构造一个判断 ab cd
X 和Y 是否有关系的规则,使得在该规则下把“ X 和Y 没有关系”错
解判:成根“据WX 和的Y定有义可关发系现”:的W概越率大不,超越过有0利.01于0结?论“ X 和Y 有关系”,因
断是否可靠呢?
(3) 独立性检验(可知判断犯错误的概率).
现在想知道能够以多大的把握认为“吸烟与患肺
癌有关”,为此先假设 H0 :吸烟与患肺癌没有关系.
把表中的数字用字母代替,得到如下用字母表示的列联表
不患肺癌 患肺癌
总计
不吸烟
aБайду номын сангаас
b
ab
吸烟
c
d
c d
总计
ac
bd abcd
那么吸烟样本中的不患肺癌的比例为 c ,
所以有 99.9%的把握认为“秃顶患心脏病有关”
练习:在 500 人身上试验某种血清预防感冒作用,把他们
一年中的感冒记录与另外 500 名未用血清的人的感冒记
录作比较,结果如表所示。
未感冒 感冒
合计
使用血清
252
248
500
未使用血清 224
276
500
合计
476
524
1000
能否认为这种血清能起到预防感冒的作用?
k0
0.708 1.323 2.706 3.841 6.635 10.828
注意:所给临界值表中的概率是认为无关的概率.
例 1.在某医院,因为患心脏病而住院的 665 名男性病人中,
有 214 人秃顶;而另外 772 名不是因为患心脏病而住院的
男性病人中有 175 人秃顶。分别利用图形和独立性检验方
解:设 H0 :感冒与是否使用该血清没有关系.
K 2 1000258 284 242 2162 7.075
474 526 500 500
因当 H0 成立时, K 2 ≥ 6.635 的概率约为 0.01 ,
故有 99%的把握认为该血清能起到预防感冒的作用.
思考:考察两个分类变量 X 和Y ,其 2 2 列联表如下:
w0 k0 n(a b)(c d ) 第1, 2, 3,4,6,8,9,11,13,15, 20, 22 题
(不用交)
1.分类变量: 变量的取“值”表示不同类别. 如性别、国籍、是否吸烟、成绩好坏、是否喜欢等.
2.探究两个分类变量是否有关系? (1) 由2列2列联联表表通:列过出计的算两比个例分可类变粗量略的判频断数是表否如有P10关表 1-7.
(2) 等高条形图:如 P11 图 1.2-1
可直观判断:吸烟与患肺癌有关,那么这种判
法判断秃顶与患心脏病是否有关系?你所得的结论在什么
范围内有效?
解:根据题目所给数据得到如下列联表:
患心脏病 不患心脏病
总计
秃顶
214
175
389
不秃顶 451
597
1048
总计
665
772
1437
K 2 1437 (214 597 175 451)2 16.373 10.828. 3891048 665 772
独立性检验的基本思想及其初步应用
开门见山引入
独立性分析依据
独立性检验
独立性检验步骤
课本例1
练习及作业布置
课本第14页思考
独立性检验的基本思想及其初步应用
吸烟与患肺癌是否有关系? 喜欢理科与性别是
否有关系?性别是否对喜欢数学课程有影响?等等.这
些问题的回答可以通过统计分析做科学回答——独
立性检验.(阅读 P10─P15 内容)
学家构造了一个随机变量—卡方统计量.
K2
n(ad bc)2
(其中n a b c d )
(a b)(c d )(a c)(b d )
在 H0 成立的情况下, K 2 的值应该很小.
K
2
统计学家经过研究发现,在 H 的观测值发生的概率情况如下表:
0
成立的情况下,
P(K 2 ≥ k0 ) 0.40 0.25 0.10 0.05 0.010 0.001
相关文档
最新文档