课件独立性检验.ppt
合集下载
832独立性检验课件(共19张PPT)
效果是否比甲种疗法好.
解:零假设为H0:疗法与疗效独立,即两种疗法效果没有差异.
根据列联表中的数据,经计算得到
×
(
×
−
×
)
=
≈ . > . = . .
× × ×
根据小概率值=0.05的 独立性检验,我们推断 H0不成立,即可以认为两种疗法
癌有关系”.
讲
课
人
:
邢
启
强
16
根据表中的数据计算不吸烟者中不患肺癌和患肺癌的频率分别为
7775
42
0.9946,
0.0054
7817
7817
吸烟者中不患肺癌和患肺癌的评率分别为
2099
49
0.9772,
0.0228
2148
2148
0.0228
由
4.2
0.0054
可见,在被调查者中,吸烟者患肺癌的频率是不吸烟者患肺癌频率的4
2
复习巩固
两个分类变量之间关联关系的定性分析的方法:
(1)频率分析法:通过对样本的每个分类变量的不同类别事件发生的频率大
小进行比较来分析分类变量之间是否有关联关系.
如可以通过列联表中
与
值的大小粗略地判断分类变量x和Y之间有无
+
+
关系.一般其值相差越大,分类变量有关系的可能性越大.
(2)图形分析法:与表格相比,图形更能直观地反映出两个分类变量间是否互
8.3列联表与独立性检验
8.3.2 独立性检验
复习巩固
2×2列联表的概念
按研究问题的需要,将数据分类统计,并做成表格加以保存,这种形
解:零假设为H0:疗法与疗效独立,即两种疗法效果没有差异.
根据列联表中的数据,经计算得到
×
(
×
−
×
)
=
≈ . > . = . .
× × ×
根据小概率值=0.05的 独立性检验,我们推断 H0不成立,即可以认为两种疗法
癌有关系”.
讲
课
人
:
邢
启
强
16
根据表中的数据计算不吸烟者中不患肺癌和患肺癌的频率分别为
7775
42
0.9946,
0.0054
7817
7817
吸烟者中不患肺癌和患肺癌的评率分别为
2099
49
0.9772,
0.0228
2148
2148
0.0228
由
4.2
0.0054
可见,在被调查者中,吸烟者患肺癌的频率是不吸烟者患肺癌频率的4
2
复习巩固
两个分类变量之间关联关系的定性分析的方法:
(1)频率分析法:通过对样本的每个分类变量的不同类别事件发生的频率大
小进行比较来分析分类变量之间是否有关联关系.
如可以通过列联表中
与
值的大小粗略地判断分类变量x和Y之间有无
+
+
关系.一般其值相差越大,分类变量有关系的可能性越大.
(2)图形分析法:与表格相比,图形更能直观地反映出两个分类变量间是否互
8.3列联表与独立性检验
8.3.2 独立性检验
复习巩固
2×2列联表的概念
按研究问题的需要,将数据分类统计,并做成表格加以保存,这种形
独立性检验PPT课件
第三步:引入一个随机变量:卡方统计量 K 2ab c n a d d a b c c 2bd
第四步:查对临界值表(教材P13),作出判断。
利用独立性检验来考察两个分类变量是否有关系,
能较精确地给出这种判断的可靠程度. 具体作法是:
(1)根据实际问题需要的可信程度确定临界值k0; (2)由观测数据计算得到随机变量K2的观测值k; (3)如果k>6.635,就以 1-P(K2≥6.635)×100%的 把握认为“X与Y有关系”;否则就说样本观测数据没 有提供“X与Y有关系”的充分证据.
变 量 分 类 变 量 — — 独独立立性性检检验相 验关 指 数 R2、 残 差 分 析 )
本节研究的是两个分类变量的独立性检验问题。
某医疗机构为了了解呼吸道疾病与吸 烟是否有关,进行了一次抽样调查,共调 查了515个成年人,其中吸烟者220人,不 吸烟者295人,调查结果是:吸烟的220人 中37人患病, 183人不患病;不吸烟的 295人中21人患病, 274人不患病。
根据这些数据能否断定:患病与 吸烟有关吗?
为了研究这个问题,我们将上述列问2题×用2列下表联表表示:
患病 不患病 总计
吸烟
37
不吸烟
21
183
220
274
295
总计
58
457
515
两个分类变量之间是否有关系?
1.从列联表分别计算患病在两类中的频率。
在不吸烟者中患病的比重是 7.12% 在吸烟者中患病的比重是 16.82% 上述结论能说明吸烟与患病有关吗?
(2)利用图形判断性别与是否喜爱看《新 还珠格格》有关?
有一个颠扑不破的真理,那就是当 我们不能确定什么是真的时,我们就 应该去探求什么是最可能的。
《独立性检验的基本思想及其初步应用》PPT课件
0.05 3.841
0.025 5.024
0.010 0.005 6.635 7.879
0.001 10.828
K2的观测值为k
如果 k k0,就以 (1 P(K 2 k0 )) 100%的把握
认为“X与Y有关系”;而这种判断有可能出错,出
错的概率不会超过 P(K 2 k0 )。
7
例如 :
1如果k 10.828,就有99.9%把握认为" X与Y有
❖ 试用你所学过的知识进行分析,能否在犯错 误的概率不超过0.005的前提下,认为“喜欢 体育还是文娱与性别有关系”?
体育 文娱 总计
男生 21 23 44
女生 6 29 35
总计 27 52 79
16
[思路探索] 可用数据计算 K2,再确定其中的具体关系. 解 判断方法如下: 假设 H0“喜欢体育还是喜欢文娱与性别没有关系”,若 H0 成立, 则 K2 应该很小. ∵a=21,b=23,c=6,d=29,n=79, ∴k=a+bcn+add-ab+cc2b+d =21+237×9×6+212×9×29-212+3×66×223+29≈8.106.
12
例4:为研究不同的给药方式(口服与注射)和药的效果(有效 与无效)是否有关,进行了相应的抽样调查,调查的结果列 在表中,根据所选择的193个病人的数据,能否作出药的效果 和给药方式有关的结论?
口服 注射 合计
有效 58 64 122
无效 40 31 71
合计 98 95 193
P(k≥k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
高中数学选修课件第一章:独立性检验
注意事项与误区提示
在进行独立性检验前,需要确保样本 的随机性和代表性,以避免因样本偏 差导致结果失真。
需要注意的是,独立性检验只能判断 两个变量之间是否存在统计上的独立 性,并不能说明它们之间是否存在因 果关系或其他形式的关联。
在解读结果时,需要注意概率值(p 值)或临界值表的具体含义和适用条 件,避免误用或滥用。
高中数学选修课件第一 章:独立性检验
汇报人:XX 20XX-01-30
contents
目录
• 独立性检验基本概念 • 独立性检验基本思想解读 • 独立性检验方法介绍及应用场景分析 • 独立性检验结果解读与注意事项 • 独立性检验在统计学中地位和作用 • 高中数学选修课程中其他相关知识点回
顾与拓展
01
在实际应用中,还需要结合其他统计 方法和专业知识进行综合分析和判断 。
05
独立性检验在统计学中地位和作用
独立性检验在统计学中地位
独立性检验是统计学 中一种重要的假设检 验方法。
在数据分析、市场调 研、医学研究等领域 具有广泛应用。
它用于判断两个或多 个分类变量之间是否 相互独立。
独立性检验对后续统计分析影响
高中数学选修课程中其他相关知识点梳理
排列组合与二项式定理
回顾排列组合的基本概念、计算公式及应用,掌握二项式定理的展开式及通项公式的应 用。
概率与统计的综合应用
梳理概率与统计在高中数学选修课程中的综合应用,如概率与统计在解决实际问题中的 结合,以及概率与统计在其他数学知识点中的交叉应用等。
数学建模与数学探究
独立性检验的基本思想
通过抽样调查获取数据,根据样本数据来判断两个分类变量 是否独立。
独立性检验的方法
通常采用列联表的形式整理数据,然后计算相关统计量的值 (如χ²值),并根据统计量的值及给定的显著性水平作出判 断。
独立性检验PPT课件
用“假设检验”解决此问题
Page 3
请看下面的表格
表(一)
表(二)
Page 4
(一)反证法思想
结论如下:
︱ad – bc ︱越小,说明吸 烟与患肺癌之间的关系越 弱。
︱ad – bc ︱越大,说明吸 烟与患肺癌之间的关系越 强。
Page 5
(二)统一的评判标准
一般认为,小概率事件在一次 试验中不会发生,据此原则, 如果在某种假设下小概率事件 在一次试验中发生了,则认为 此假设不成立。(即H0不成立)
谢 谢 !ຫໍສະໝຸດ Page 6表(三) K2检验的临界值表
Page 7
(三) 假设检验的基本步骤:
(1)假设H0:两个分类变量没有关系; (2)求K2的观测值k; (3)⒈给定显著性水平α ,查表(三)定出临界值k0,与k进行 比较;⒉未给定显著性水平α,根据实际问题的需要确定容 许推断“两个分类变量有关系”犯错误概率的上界α,然后查 表(三)确定临界值k0 与k进行比较;
(4)若k≥k0,则拒绝H0,认为两个分类变量有关系; 若k<k0, 则接受H0,认为两个分类变量没有关系。
Page 8
小结: 反证法原理与假设检验原理
反证法原理
在一个已知假 设下,如果推 出一个矛盾, 就证明了这个 假设不成立。
Page 9
假设检验原理
在一个已知假设 下,如果推出一 个小概率事件发 生,则推断这个 假设不成立的可 能性很大。
1.2 独立性检验的基本 思想及其初步应用
樊永丽
樊永丽
-
1
有一个颠扑不破的真理,那就是当我 们不能确定什么是真的时候,我们就
应该去探求什么是最可能的。 ----------笛卡尔
Page 3
请看下面的表格
表(一)
表(二)
Page 4
(一)反证法思想
结论如下:
︱ad – bc ︱越小,说明吸 烟与患肺癌之间的关系越 弱。
︱ad – bc ︱越大,说明吸 烟与患肺癌之间的关系越 强。
Page 5
(二)统一的评判标准
一般认为,小概率事件在一次 试验中不会发生,据此原则, 如果在某种假设下小概率事件 在一次试验中发生了,则认为 此假设不成立。(即H0不成立)
谢 谢 !ຫໍສະໝຸດ Page 6表(三) K2检验的临界值表
Page 7
(三) 假设检验的基本步骤:
(1)假设H0:两个分类变量没有关系; (2)求K2的观测值k; (3)⒈给定显著性水平α ,查表(三)定出临界值k0,与k进行 比较;⒉未给定显著性水平α,根据实际问题的需要确定容 许推断“两个分类变量有关系”犯错误概率的上界α,然后查 表(三)确定临界值k0 与k进行比较;
(4)若k≥k0,则拒绝H0,认为两个分类变量有关系; 若k<k0, 则接受H0,认为两个分类变量没有关系。
Page 8
小结: 反证法原理与假设检验原理
反证法原理
在一个已知假 设下,如果推 出一个矛盾, 就证明了这个 假设不成立。
Page 9
假设检验原理
在一个已知假设 下,如果推出一 个小概率事件发 生,则推断这个 假设不成立的可 能性很大。
1.2 独立性检验的基本 思想及其初步应用
樊永丽
樊永丽
-
1
有一个颠扑不破的真理,那就是当我 们不能确定什么是真的时候,我们就
应该去探求什么是最可能的。 ----------笛卡尔
独立性检验ppt课件
解:(Ⅰ)调查的500位老年人中有70位需要志愿者提供 帮助,因此该地区老年人中,需要帮助的老年人的比 例的估算值为 70 14%
500
(Ⅱ)K 2 500 (40 270 30160)2 9.967 200 300 70 430
由于9.967>6.635,所以有99%的把握认为该地区的老年 人是否需要帮助与性别有关。
者提供帮助,用简单随机抽样方法从该地区调查了500位 老人,结果如下:
是否需要志愿者 性别
男
女
需要
40
30
不需要
160
270
(Ⅰ)估计该地区老年人中,需要志愿者提供帮助的 老年人的比例; (Ⅱ)能否有99℅的把握认为该地区的老年人是否 需要志愿者提供帮助与性别有关? (Ⅲ)根据(Ⅱ)的结论,能否提出更好的调查办法 来估计该地区的老年人中,需要志愿者提供帮助的 老年人的比例?说明理由。
优秀
非优秀
总计
甲班
10
乙班
合计
30 105
已知在全部 105 人中抽到随机抽取 1 人为优秀的概率为27
(1)请完成上面的列联表;
(2)根据列联表的数据,若按照 95%的可靠性要求,能
否认为“成绩与班级有关系”.
有甲乙两个班级进行数学考试,按照大于等于85分为
优秀,85分以下为非优秀统计成绩后,得到如下的列
P(K2 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 ≥k) k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
【例1】在对人们的休闲方式的一次调查中,共调查了124人,其中女 性70人,男性54人。
独立性检验ppt课件
患病B
n11 n21 n+1
未患病 合计
n12
n1+
n22
n2+
n+2
n
·
5
(1)假设吸烟与患慢性气管炎无关。
事件A与B独立,有P(AB)=P(A)P(B) 成立。我们用H0表示上式,即H0: P(AB)=P(A) P(B)。并称之为统计假 设,当H0成立时,下面的三个式子也 成立:
·
6
P( AB)=P( A)P(B) P(A B)=P(A)P( B) P( A B)=P( A)P( B)
n1+n2+n+1n+2 用它的大小可以决定是否拒绝原
来的统计假设H0,如果χ2值较大,
就拒绝H0,即拒绝“事件A与事件B 无关”,从而就认为它们是有关的。
·
10
(3)两个临界值:3.841与6.635。
当根据具体的数据算出χ2>3.841
时,有95%的把握说事件A与事件B有
关;当χ2 >6.635时,有99%的把握 说事件A与事件B有关;当χ2 ≤3.841
时,认为事件A与事件B无关。
·
11
3.独立性检验含义:
像以上这种用χ2 统计量研究
吸烟与患慢性气管炎是否有关等问 题的方法称为独立性检验。
·
12
4.例题解答: 解:由公式得
χ2=
339 (43×121-162×13)2 205×134×56×283 ≈7.469
因为7.469>6.635,所以我们有 99%的把握说:50岁以上的人患慢性 支气管炎与吸烟有关。
独立性检验
教材版本:人教B版 学 科:数 学 年 级:高二年级 单位名称:辽宁省阜新市彰武县
第二高级中学 主讲教师:张秀旗
8.3.2独立性检验课件(人教版)
肺癌
合计
非肺癌患者
42
7817
吸烟者
2099
49
2148
合计
9874
91
9965
7775
42
0.9946,
0.0054
7817
7817
吸烟者中不患肺癌和患肺癌的频率分别为
2099
49
0.9772,
0.0228
2148
2148
由
0.0228
4.2
0.0054
可见,在被调查者中,吸烟者患肺癌的频率是不吸烟者患肺癌频率的4倍以
上。于是,根据频率稳定于概率的原理,我们可以认为吸烟者患肺癌的概率明
显大于不吸烟者患肺癌概率,即吸烟更容易引发肺癌。
六、方法总结
应用独立性检验解决实际问题大致应包括以下几个主要环节:
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.
P(Y=1|X=0)=P(Y=1|X=1)
三、零假设(原假设)的等价条件:
三、零假设(原假设)的等价条件:
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
问题:根据频率稳定于概率的原理,你能构造一个能对分类变量X和Y的独立性作出推断的统计量吗?
四、卡方统计量:
≈ . 和
因此可以推断乙种疗法的效果比甲种疗法好。
问题2:根据同一抽查数据推断两个分类变量之间是否有关联,应用不同的小概率值,
为什么会得出不同的结论?
《独立性检验》PPT文档共37页
《独立性检验》
51、山气日夕佳,飞鸟相与还。 52、木欣欣以向荣,泉涓涓而始流。
53、富贵非吾愿,帝乡不可期。 54、雄发指危冠,猛气冲长缨。 55、土地平旷,屋舍俨然,有良田美 池桑竹 之属, 阡陌交 通,鸡 犬相闻 。
61、奢侈是舒适的,否则就不是奢侈 。——CocoCha nel 62、少而好学,如日出之阳;壮而好学 ,如日 中之光 ;志而 好学, 如炳烛 之光。 ——刘 向 63、三军可夺帅也,匹夫不可夺志也。 ——孔 丘 64、人生就是学校。在那里,与其说好 的教师 是幸福 ,不如 说好的 教师是 不幸。 ——海 贝尔 65、接受挑战,就可以享受胜利的喜悦 。——杰纳勒 尔·
51、山气日夕佳,飞鸟相与还。 52、木欣欣以向荣,泉涓涓而始流。
53、富贵非吾愿,帝乡不可期。 54、雄发指危冠,猛气冲长缨。 55、土地平旷,屋舍俨然,有良田美 池桑竹 之属, 阡陌交 通,鸡 犬相闻 。
61、奢侈是舒适的,否则就不是奢侈 。——CocoCha nel 62、少而好学,如日出之阳;壮而好学 ,如日 中之光 ;志而 好学, 如炳烛 之光。 ——刘 向 63、三军可夺帅也,匹夫不可夺志也。 ——孔 丘 64、人生就是学校。在那里,与其说好 的教师 是幸福 ,不如 说好的 教师是 不幸。 ——海 贝尔 65、接受挑战,就可以享受胜利的喜悦 。——杰纳勒 尔·
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
断是否可靠呢?
(3) 独立性检验(可知判断犯错误的概率). 演示课件
现在想知道能够以多大的把握认为“吸烟与患肺
癌有关”,为此先假设 H0 :吸烟与患肺癌没有关系.
把表中的数字用字母代替,得到如下用字母表示的列联表
不患肺癌 患肺癌
总计
不吸烟
a
b
ab
吸烟
c
d
c d
总计
ac
bd abcd
那么吸烟样本中的不患肺癌的比例为 c ,
独立性检验的基本思想及其初步应用
开门见山引入
独立性分析依据
独立性检验
独立性检验步骤
课本例1
练习及作业布置
课本第14页思考
演示课件
独立性检验的基本思想及其初步应用
吸烟与患肺癌是否有关系? 喜欢理科与性别是
否有关系?性别是否对喜欢数学课程有影响?等等.这
些问题的回答可以通过统计分析做科学回答——独
立性检验.(阅读 P10─P15 内容)
1.分类变量: 变量的取“值”表示不同类别. 如性别、国籍、是否吸烟、成绩好坏、是否喜欢等.
2.探究两个分类变量是否有关系? (1) 由2列2列联联表表通:列过出计的算两比个例分可类变粗量略的判频断数是表否如有P10关表 1-7.
(2) 等高条形图:如 P11 图 1.2-1
可直观判断:吸烟与患肺癌有关,那么这种判
y1
y2
总计
x1
a
b
ab
x2
c
d
c d
总计
ac
b d
abcd
定义W a c ,根据独立性检验,如何用W 构造一个判断 ab cd
X 和Y 是否有关系的规则,使得在该规则下把“ X 和Y 没有关系”错
解判:成根“据WX 和的Y定有义可关发系现”:的W概越率大不,超越过有0利.01于0结?论“ X 和Y 有关系”,因
k0
0.708 1.323 2.706 3.841 6.635 10.828
如K 2 9965(7775 49 42 2099)2 56.632 > 10.828 7817 2148 9874 91
所以,有 99.9%的把握认为吸烟与患肺癌有关.
演示课件
独立性检验的步骤:
一般地,假设有两个分类变量 X 和Y ,它们的取值分
不吸烟样本中的不患肺癌的比例为 a , c d
如果
H0
成立,那么
a
a
b
c
c
d
,∴
ab
a(c d)
c(a
b)
,
∴ ad bc 0 , 因此 ad bc 越小,说明吸烟与患肺癌
之间的关系越弱, ad bc 越大,说明吸烟与患肺癌之间
的关系越强.
演示课件
独立性检验:
为使不同样本容量的数据有统一的评判标准,统计
别为x1, x2 和 y1, y2.
第一步:列出 2 2 列联表;
y1
y2
总计
x1
a
b
ab
x2
c
d
c d
总计 a c b d a b c d
第二步:计算 K 2
n(ad bc)2
;
(a b)(c d )(a c)(b d )
第三步:查对临界值表,作出判断.
P(K 2 ≥ k0 ) 0.40 0.25 0.10 0.05 0.010 0.001
解:设 H0 :感冒与是否使用该血清没有关系.
K 2 1000258 284 242 2162 7.075
474 526 500 500
因当 H0 成立时, K 2 ≥ 6.635 的概率约为 0.01 ,
故有 99%的把握认为该血清能起到预防感冒的作用.
演示课件
思考:考察两个分类变量 X 和Y ,其 2 2 列联表如下:
k0
0.708 1.323 2.706 3.841 6.635 10.828
注意:所给临界值表中的概演示率课件是认为无关的概率.
例 1.在某医院,因为患心脏病而住院的 665 名男性病人中,
有 214 人秃顶;而另外 772 名不是因为患心脏病而住院的
男性病人中有 175 人秃顶。分别利用图形和独立性检验方
法判断秃顶与患心脏病是否有关系?你所得的结论在什么
范围内有效?
解:根据题目所给数据得到如下列联表:
患心
175
389
不秃顶 451
597
1048
总计
665
772
1437
K 2 1437 (214 597 175 451)2 16.373 10.828. 3891048 665 772
学家构造了一个随机变量—卡方统计量.
K2
n(ad bc)2
(其中n a b c d )
(a b)(c d )(a c)(b d )
在 H0 成立的情况下, K 2 的值应该很小.
K
2
统计学家经过研究发现,在 H 的观测值发生的概率情况如下表:
0
成立的情况下,
P(K 2 ≥ k0 ) 0.40 0.25 0.10 0.05 0.010 0.001
此可以建立规则:当W 的观测值W ≥ w0 时,就判断“ X 和Y 有关系”。(其
中∵wK0 为2 正 实(a数,b且)(在cn“(addX)和(abYc没)c2)有(b关系d”) 的且前P提(K下2,≥P(Wk0≥) w00 ).0100.010
(a c)(b d ) 作业:《优化设计训练》第一章测评
所以有 99.9%的把握认为“秃顶患心脏病有关”
演示课件
练习:在 500 人身上试验某种血清预防感冒作用,把他们
一年中的感冒记录与另外 500 名未用血清的人的感冒记
录作比较,结果如表所示。
未感冒 感冒
合计
使用血清
252
248
500
未使用血清 224
276
500
合计
476
524
1000
能否认为这种血清能起到预防感冒的作用?
w0
k0
n(a
b)(c
d
)
第 1,
演示课件
2,
3,
4,
6,
8,
9,
11,
13,
15,
20,
22
题
(不用交)
(3) 独立性检验(可知判断犯错误的概率). 演示课件
现在想知道能够以多大的把握认为“吸烟与患肺
癌有关”,为此先假设 H0 :吸烟与患肺癌没有关系.
把表中的数字用字母代替,得到如下用字母表示的列联表
不患肺癌 患肺癌
总计
不吸烟
a
b
ab
吸烟
c
d
c d
总计
ac
bd abcd
那么吸烟样本中的不患肺癌的比例为 c ,
独立性检验的基本思想及其初步应用
开门见山引入
独立性分析依据
独立性检验
独立性检验步骤
课本例1
练习及作业布置
课本第14页思考
演示课件
独立性检验的基本思想及其初步应用
吸烟与患肺癌是否有关系? 喜欢理科与性别是
否有关系?性别是否对喜欢数学课程有影响?等等.这
些问题的回答可以通过统计分析做科学回答——独
立性检验.(阅读 P10─P15 内容)
1.分类变量: 变量的取“值”表示不同类别. 如性别、国籍、是否吸烟、成绩好坏、是否喜欢等.
2.探究两个分类变量是否有关系? (1) 由2列2列联联表表通:列过出计的算两比个例分可类变粗量略的判频断数是表否如有P10关表 1-7.
(2) 等高条形图:如 P11 图 1.2-1
可直观判断:吸烟与患肺癌有关,那么这种判
y1
y2
总计
x1
a
b
ab
x2
c
d
c d
总计
ac
b d
abcd
定义W a c ,根据独立性检验,如何用W 构造一个判断 ab cd
X 和Y 是否有关系的规则,使得在该规则下把“ X 和Y 没有关系”错
解判:成根“据WX 和的Y定有义可关发系现”:的W概越率大不,超越过有0利.01于0结?论“ X 和Y 有关系”,因
k0
0.708 1.323 2.706 3.841 6.635 10.828
如K 2 9965(7775 49 42 2099)2 56.632 > 10.828 7817 2148 9874 91
所以,有 99.9%的把握认为吸烟与患肺癌有关.
演示课件
独立性检验的步骤:
一般地,假设有两个分类变量 X 和Y ,它们的取值分
不吸烟样本中的不患肺癌的比例为 a , c d
如果
H0
成立,那么
a
a
b
c
c
d
,∴
ab
a(c d)
c(a
b)
,
∴ ad bc 0 , 因此 ad bc 越小,说明吸烟与患肺癌
之间的关系越弱, ad bc 越大,说明吸烟与患肺癌之间
的关系越强.
演示课件
独立性检验:
为使不同样本容量的数据有统一的评判标准,统计
别为x1, x2 和 y1, y2.
第一步:列出 2 2 列联表;
y1
y2
总计
x1
a
b
ab
x2
c
d
c d
总计 a c b d a b c d
第二步:计算 K 2
n(ad bc)2
;
(a b)(c d )(a c)(b d )
第三步:查对临界值表,作出判断.
P(K 2 ≥ k0 ) 0.40 0.25 0.10 0.05 0.010 0.001
解:设 H0 :感冒与是否使用该血清没有关系.
K 2 1000258 284 242 2162 7.075
474 526 500 500
因当 H0 成立时, K 2 ≥ 6.635 的概率约为 0.01 ,
故有 99%的把握认为该血清能起到预防感冒的作用.
演示课件
思考:考察两个分类变量 X 和Y ,其 2 2 列联表如下:
k0
0.708 1.323 2.706 3.841 6.635 10.828
注意:所给临界值表中的概演示率课件是认为无关的概率.
例 1.在某医院,因为患心脏病而住院的 665 名男性病人中,
有 214 人秃顶;而另外 772 名不是因为患心脏病而住院的
男性病人中有 175 人秃顶。分别利用图形和独立性检验方
法判断秃顶与患心脏病是否有关系?你所得的结论在什么
范围内有效?
解:根据题目所给数据得到如下列联表:
患心
175
389
不秃顶 451
597
1048
总计
665
772
1437
K 2 1437 (214 597 175 451)2 16.373 10.828. 3891048 665 772
学家构造了一个随机变量—卡方统计量.
K2
n(ad bc)2
(其中n a b c d )
(a b)(c d )(a c)(b d )
在 H0 成立的情况下, K 2 的值应该很小.
K
2
统计学家经过研究发现,在 H 的观测值发生的概率情况如下表:
0
成立的情况下,
P(K 2 ≥ k0 ) 0.40 0.25 0.10 0.05 0.010 0.001
此可以建立规则:当W 的观测值W ≥ w0 时,就判断“ X 和Y 有关系”。(其
中∵wK0 为2 正 实(a数,b且)(在cn“(addX)和(abYc没)c2)有(b关系d”) 的且前P提(K下2,≥P(Wk0≥) w00 ).0100.010
(a c)(b d ) 作业:《优化设计训练》第一章测评
所以有 99.9%的把握认为“秃顶患心脏病有关”
演示课件
练习:在 500 人身上试验某种血清预防感冒作用,把他们
一年中的感冒记录与另外 500 名未用血清的人的感冒记
录作比较,结果如表所示。
未感冒 感冒
合计
使用血清
252
248
500
未使用血清 224
276
500
合计
476
524
1000
能否认为这种血清能起到预防感冒的作用?
w0
k0
n(a
b)(c
d
)
第 1,
演示课件
2,
3,
4,
6,
8,
9,
11,
13,
15,
20,
22
题
(不用交)