选修1-2.1.2独立性检验ppt课件
合集下载
苏教版选修1-2高中数学1.1《独立性检验》ppt课件
【训练2】 某大型企业人力资源部为了研究企业员工工 作积极性和对待企业改革态度的关系,随机抽取了 189名员工进行调查,所得数据如下表所示:
积极支持 不太赞成 企业改革 企业改革
合计
工作 积极
54
40
94
工作 一般
32
63
95
对于人合力计 资源部86 的研究项10目3 ,根据上1述89数据能得出 什么结论?
解 提出假设 H0:工作积极性与是否积极支持企业改革无关. χ2=1899×4×549×5×638-6×401×03322≈10.759. 当 H0 成立时,χ2>6.635 的概率约为 0.010, 因为 10.759>6.635,所以有 99%的把握说:抽样员工对待企业改 革的态度与工作积极性是有关的,可以认为企业的全体员工对待 企业改革的态度与其工作积极性是有关的.
44
合计 480 520 1 000
依据公式得
χ2=1
000×442×6-38×5142 480×520×956×44
≈27.139.
当 H0 成立时,χ2≥10.828 的概率约为 0.001, 因为 χ2≈27.139>10.828,
所以我们有 99.9%的把握认为色盲与性别是有关的.
题型二 独立性检验的基本思想
如P(χ2≥6.635)≈0.01,由实际计算得χ2>6.635说明假设不 合理的程度约为99%,即两个分类变量有关系这一结论 成立的可信程度为99%.
2.利用χ2的值判定两个研究对象Ⅰ和Ⅱ之间的关系
(1)若χ2>10.828,则有99.9%的把握认为“Ⅰ与Ⅱ有 关系”;
(2)若χ2>6.635,则有99%的把握认为“Ⅰ与Ⅱ有关 系”;
人教A版高中数学选修1-2课件独立性检验的基本思想及其初步应用.ppt
这个值是不是很大呢?
在H0成立的情况下,统计学家估算出如下概率
PK2 6.635 0.01.
2
即在H0成立的情况下K 2的值大于6.635的概率 非常小,近似于0.01, 是一个小概率事件。
现在K2观测值k 56.632,远远大于6.635,所以 我们有理由断定H0不成立,即认为"吸烟与 肺癌有关系"。但这种判断会犯错误,犯错 误的概率不会超过0.010,即:我们有 99% 的把握认为H 0不成立,即有99%的把握认为 "吸烟与肺癌有关系".
为了回答上述问题, 我们先假设 H0 :吸烟与患肺癌没有关系.
把表1 7中的数字用字母代替 ,得到如下用字
母表示的列联表 :
表1 8 吸烟与患肺癌列联表
不吸烟 吸烟 总计
不患肺癌 患肺癌 总计
a
b
ab
c
d
cd
ac
bd abcd
如果“吸烟与患肺癌没有关系”,那么 吸烟样本中不患肺癌的比例应该与不吸烟样 本中相应的比例差不多,即
ac ab cd
ac d ca b
ad bc 0 因此, ad bc 越小,说明吸烟与患肺癌之间关 系越弱; ad bc 越大,说明吸烟与患肺癌之间 关系越强.
为了使不同样本容量的数据有统一的评判标
准, 基于上面的分析, 我们构造一个随机变量
K
2
a
b
n ad bc2 c d a cb
探究 为调查吸烟是否对患肺癌有影响,某 肿瘤研究所随机地调查了9 965人,得到如下 结果 (单位: 人) :
表1 7吸烟与患肺癌列联表
不患肺癌 患肺癌 总计
不吸烟 吸烟 总计
2014年人教A版选修1-2课件 1.2 独立性检验的基本思想及其初步应用
问题1. 下表是对吸烟和不吸烟的人中患肺癌的调 查数据, 你能从中分析吸烟对患肺癌的影响程度吗?
不吸烟 吸烟 总计 不患肺癌 7775 2099 9874 患肺癌 42 49 91 总计 7817 2148 9965
对于某种变量取不同的 “值” 表示不同的类别, 这样的变量称为分类变量. 如: 是否吸烟, 是否信仰宗教, 男性或女性等. 如上表这样, 列出两个分类变量的频数表, 称为 列联表.
不患肺癌 患肺癌 总计 不吸烟 a b a+ b 即 |ad -bc| 越小, 吸烟与患肺癌之间的关系越弱 ; 吸烟 c d c+d 反之越强.总计 a+ c b+ d a+b+c+d
为了使不同容量的数据有统一的评判标准, 我们 我们把列联表中的数字用字母代替, 并计算: 把检查 |ad-bc| 的大小转换成检查 a ; “不吸烟” 样本中 “不患肺癌” 的比例 : n(ad - bc)2 a+ b 2 K , (a + b)(c + d )(a的比例 + c)(b +c “吸烟” 样本中 “不患肺癌” :d ) . c+d 其中 na+b+c+d 为样本容量. 假设 H0: 吸烟与患肺癌没有关系 , 则需 2 若 H0 成立, a则 K c 应该很小. , ad-bc≈0. a + b c + d H0 成立与否呢? 小到什么程度来判断
0.4
0.2 0 不吸烟 吸烟
问题1. 下表是对吸烟和不吸烟的人中患肺癌的调 查数据, 你能从中分析吸烟对患肺癌的影响程度吗?
不吸烟 吸烟 总计 不患肺癌 7775 2099 9874
1
人教A版选修1-2《1.2独立性检验的基本思想及其初步应用》课件
nad-bc2 2.K2= a+bc+da+cb+d.
其中n=a+b+c+d为样本容量.
3.独立性检验的具体做法
(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率 的上界α,然后查表确定 临界值k0 . (2)利用公式计算随机变量K2的 观测值.k (3)如果 k≥k0 ,就推断“X与Y有关系”,这种推断犯错误的概率不超过α; 否则,就认为在 犯错误的概率 不超过α的前提下不能推断“X与Y有关 系”,或者在样本数据中 没有发现足够证据 支持结论“X与Y有关系”.
P(K2≥k0) k0
0.10 2.706
0.05 3.841
0.01 6.635
解答
类型三 独立性检验的综合应用
例3 电视传媒公司为了解某地区观众 对某类体育节目的收看情况,随机抽 取了100名观众进行调查,其中女性有 55名.如图所示的是根据调查结果绘制 的观众日均收看该体育节目时间的频 率分布直方图. 将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知 “体育迷”中有10名女生.
数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?
解答
反思与感悟
(1)等高条形图实质上是列联表中的数据的频率特征. (2)由于高度相等的条形分别用两种不同颜色表示,其频率差异更能直观 地表现出来.
跟踪训练1 网络对现代人的生活影响较大,尤其是对青少年,为了解 网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随 机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人 期末考试不及格,而另外800人中有120人不及格.利用图形判断学生经常 上网与学习成绩有关吗?
知识点二 等高条形图
1.与表格相比,图形更能直观地反映出两个分类变量间是否 相互,影常响用 等
其中n=a+b+c+d为样本容量.
3.独立性检验的具体做法
(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率 的上界α,然后查表确定 临界值k0 . (2)利用公式计算随机变量K2的 观测值.k (3)如果 k≥k0 ,就推断“X与Y有关系”,这种推断犯错误的概率不超过α; 否则,就认为在 犯错误的概率 不超过α的前提下不能推断“X与Y有关 系”,或者在样本数据中 没有发现足够证据 支持结论“X与Y有关系”.
P(K2≥k0) k0
0.10 2.706
0.05 3.841
0.01 6.635
解答
类型三 独立性检验的综合应用
例3 电视传媒公司为了解某地区观众 对某类体育节目的收看情况,随机抽 取了100名观众进行调查,其中女性有 55名.如图所示的是根据调查结果绘制 的观众日均收看该体育节目时间的频 率分布直方图. 将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知 “体育迷”中有10名女生.
数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?
解答
反思与感悟
(1)等高条形图实质上是列联表中的数据的频率特征. (2)由于高度相等的条形分别用两种不同颜色表示,其频率差异更能直观 地表现出来.
跟踪训练1 网络对现代人的生活影响较大,尤其是对青少年,为了解 网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随 机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人 期末考试不及格,而另外800人中有120人不及格.利用图形判断学生经常 上网与学习成绩有关吗?
知识点二 等高条形图
1.与表格相比,图形更能直观地反映出两个分类变量间是否 相互,影常响用 等
高中数学课件-人教版选修【1-2】1.2《独立性检验的基本思想及其初步应用》ppt课件
看到这个课题,你能想到什么?
案 例:某医疗机构为了了解呼吸道疾病与吸 烟是否有关,进行了一次抽样调查,共调查了 515个成年人,其中吸烟者220人,不吸烟者 295人。
调查结果:吸烟的220人中有37人患呼吸道疾 病,183人未患呼吸道疾病;不吸烟的295人中 有21人患病,274人未患病。
根据这些数据,能否断定:患呼吸道疾 病与吸烟有关?
274 295
457
515
一般化:
P(A)、P(B)不知道,怎么办?
频率估计概率
P(A)
P(B)
P(AB)
•
由此估计: 吸烟且患病的人数约为
n•
•
同理,吸烟但不患病的人数约为
n•
•
不吸烟但患病的人数约为
n•
•
不吸烟也不患病的人数约为
n•
•
怎样估计实际观测值与理论估计值的误差?
采用如下的量(称为χ2 统计量)来刻画这个差异:数据整理吸烟 Fra bibliotek吸烟合计
患病
37 21 58
未患病
183 274 457
合计
220 295 515
问题:判断的标准是什么?
吸烟与不吸烟,患病的可能性的大小是否有差异?
频率估计概率
患 病 未患病 合 计(n)
吸烟 不吸烟
16.82% 83.18% 100%(220) 7.12% 92.88% 100%(295)
卡方临界值表:
0.5 0.4 0.25 0.15 0.1 0.05 0.025 0.01 0.005 0.001
P( 2 x0 )
xo
0.4 0.7 1.32 2.07 2.7 3.84 5.024 6.63 7.879 10.82
人教版高中数学选修1-2第一章第2节《独立性检验的基本思想及其初步应用》(共18张PPT)教育课件
作时间(单位:min)绘制了如图所示的茎叶图:
总计
第一种生产方式 15
5
20
第二种生产方式
5
15
20
总计
20
20
40
0.050 0.010 0.001 3.841 6.635 10.828
讲练结合
练习:某校在高一年级学生中,对自然科学类、社会科学类校本选修课程的选课意向进行调 查.现从高一年级学生中随机抽取 180 名学生,其中男生 105 名;在这 180 名学生中选择社 会科学类的男生、女生均为 45 名. (1)试问:从高一年级学生中随机抽取 1 人,抽到男生的概率约为多少? (2)根据抽取的 180 名学生的调查结果,完成下面的 2×2 列联表.并判断能否在犯错误的概 率不超过 0.025 的前提下认为科类的选择与性别有关?
条形图
柱形图
列联表
分类变量间的关系
独立性检验
2.条形图、柱形图、列联表:生活中,常常关心两个分类变量之间是否有关系.
抽样调查
样本
直观形象 易于观察
可靠?
列联表:列出两个分类变量的频数表称为列联表.
由于列联表中的数据是样本数据,它只是总体的代表,具有随机性.因此,需要用列 联表检验的方法提供所得结论犯错误概率的信息.
心
安
;
书
一
笔
清
远
,
盈
一
抹
恬
淡
,
浮
华
三
千
,
只
做
自
己
;
人
间
有
情
,
心
中
有
爱
,
携
一
米
高中数学1-2独立性检验的基本思想及其初步应用同步课件新人教A版选修1-2.ppt
与性别是有关的.
根据列联表中所给的数据,有 a=38,b=442,c=6,
d=514,a+b=480,c+d=520,a+c=44,b+d=956,n
=1000,得 K2 的观测值
k=(a+b)(cn+(add-)(ab+c)c2)(b+d)
=
1000×(38×514-442×6)2 480×520×44×956
第一种剂量 第二种剂量
合计
死亡 14 6 20
存活 11 19 30
合计 25 25 50
三、解答题
7.在500个人身上试验某种血清预防感冒的作用,把一年中的记录与另外500个未用血 清的人作比较,结果如下表所示.
试画出列表的条形图,并通过图形判断这种血清能否起到预防感冒的作用?并进行独立
性检验.
[答案] 0.005
[解析] k=8.654>7.879,就推断“X与Y有关”犯错误的 概率不超过0.005.
6.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射 照射小白鼠.在照射后14天内的结果如下表所示:
进行统计分析时的统计假设是__________________. [答案] 假设电离辐射的剂量与人体受损程度无关.
≈27.1.
由
于
k≈27.1>10.828,所以我们有 99.9%的把握认为色盲与性
别有关系.这个结论只对所调查的 480 名男人和 520 名
女人有效.
[点评] 本题应首先作出调查数据的列联表,再根据列联 表画出二维条形图或三维柱形图,并进行分析,最后利用 独立性检验作出判断.
1.利用图形来判断两个分类变量是否有关系,可以画出三 维柱形图,也可以画出二维条形图,仅从图形上只可以粗 略地判断两个分类变量是否有关系,可以结合所给的数值 来进行比较.作图应注意单位统一,图形准确,但它不能 给我们两个分类变量有关或无关的精确的可信程度,若要 作出精确的判断,可以作独立性检验的有关计算.
人教版高中数学 选修1-2 第一章 2独立性检验的基本思想及其初步应用 (共38张PPT)教育课件
a+b c+d
因此,
|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强.
为了使不同样本容量的数据有统一的评判 标准,基于上述分析,我们构造一个随机变量:
K2 =
n(ad - bc)n
(a + b)(c + d)(a + c)(b + d)
其中n=a+b+c+d为样本容量.
P(k2>k) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 0.455 0.708 1.323 2.072 2.706 3.84 5.024 6.635 7.879 10.83
(2)利用K2公式,计算随机变量K2的观测值k.
(3)如果k>k0,就推断“X与Y有关系”,这 种推断犯错误的概率不超过a;否则,就认为在犯 错误的概率不超过a的前提下不能推断“X与Y有关 系”.
若H0成立,即“吸烟与患肺癌没有关系”, 则K2应该很小.
不吸烟 吸烟 总计
不患肺癌 7775 2099 9874
患肺癌 42 49 91
总计 7817 2148 9965
利用上述公式得
K2 = 9965(7775 49 - 42 2099)2 56.632 7817 2148 9874 91
不吸烟
吸烟
患肺癌 不患肺癌
探究
通过数据和图形分析,我们得到的直观判 断是“吸烟和患肺癌有关”,那么这种判断是否 可靠呢? 我们先假设
H0:吸烟与患肺癌没有关系. 用A表示不吸烟,B表示不患肺癌,则“吸烟 与患肺癌没有关系”等价于“吸烟与患肺癌独 立”,即假设H0等价于
因此,
|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强.
为了使不同样本容量的数据有统一的评判 标准,基于上述分析,我们构造一个随机变量:
K2 =
n(ad - bc)n
(a + b)(c + d)(a + c)(b + d)
其中n=a+b+c+d为样本容量.
P(k2>k) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 0.455 0.708 1.323 2.072 2.706 3.84 5.024 6.635 7.879 10.83
(2)利用K2公式,计算随机变量K2的观测值k.
(3)如果k>k0,就推断“X与Y有关系”,这 种推断犯错误的概率不超过a;否则,就认为在犯 错误的概率不超过a的前提下不能推断“X与Y有关 系”.
若H0成立,即“吸烟与患肺癌没有关系”, 则K2应该很小.
不吸烟 吸烟 总计
不患肺癌 7775 2099 9874
患肺癌 42 49 91
总计 7817 2148 9965
利用上述公式得
K2 = 9965(7775 49 - 42 2099)2 56.632 7817 2148 9874 91
不吸烟
吸烟
患肺癌 不患肺癌
探究
通过数据和图形分析,我们得到的直观判 断是“吸烟和患肺癌有关”,那么这种判断是否 可靠呢? 我们先假设
H0:吸烟与患肺癌没有关系. 用A表示不吸烟,B表示不患肺癌,则“吸烟 与患肺癌没有关系”等价于“吸烟与患肺癌独 立”,即假设H0等价于
北师大版高中数学选修1-2 独立性检验 课件(54张)
∵a+21=73, ∴a=52. 又∵a+2=b, ∴b=54. 答案:52,54
1.独立性检验的理论依据
独立性检验的基本思想类似于数学中的反证法,要确认两个变
量A,B是否独立,首先假设“两个变量相互独立”成立,在该
假设下我们构造的随机变量χ2应该很小,如果由观测数据计 算得到的χ2数值很大,说明变量之间不独立,则在一定程度 上说明假设不合理,根据随机变量χ2的含义,由实际计算出 χ2>6.635,说明假设不合理的程度约为99%,也就是两个变 量A,B有99%的把握有关联.
总计 70 54 124
124 43 33 27 21 70 54 64 60
6.201 3.841 ,
a ab ac 第5步:比较 与 并作出判断. n n n
【典例训练】 1.在一项有关医疗保健的社会调查中,调查的男性为530人, 女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢 吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.
2.打鼾不仅影响别人休息,而且可能与患某种疾病有关,调查
(2)判断休闲方式与性别是否有关系?
【解析】1.由于χ2>3.841时,有95%的把握认为两个变量之
间相关,所以有95%的把握认为选修统计专业与性别有关 . 答案:95%
2.(1)依据题意得“性别与休闲方式”2×2列联表如下:
看电视 女 男 总计 (2)计算 2 43 21 64
2
运动 27 33 60
2.独立性检验中的统计假设就是假设相关事件A,B _____.
【解析】根据独立性检验的基本思想知独立性检验中的统计假 设就是假设相关事件A,B相互独立. 答案:相互独立
3.下面是一个2×2列联表,则表中a,b处的值分别为______. B
1.独立性检验的理论依据
独立性检验的基本思想类似于数学中的反证法,要确认两个变
量A,B是否独立,首先假设“两个变量相互独立”成立,在该
假设下我们构造的随机变量χ2应该很小,如果由观测数据计 算得到的χ2数值很大,说明变量之间不独立,则在一定程度 上说明假设不合理,根据随机变量χ2的含义,由实际计算出 χ2>6.635,说明假设不合理的程度约为99%,也就是两个变 量A,B有99%的把握有关联.
总计 70 54 124
124 43 33 27 21 70 54 64 60
6.201 3.841 ,
a ab ac 第5步:比较 与 并作出判断. n n n
【典例训练】 1.在一项有关医疗保健的社会调查中,调查的男性为530人, 女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢 吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.
2.打鼾不仅影响别人休息,而且可能与患某种疾病有关,调查
(2)判断休闲方式与性别是否有关系?
【解析】1.由于χ2>3.841时,有95%的把握认为两个变量之
间相关,所以有95%的把握认为选修统计专业与性别有关 . 答案:95%
2.(1)依据题意得“性别与休闲方式”2×2列联表如下:
看电视 女 男 总计 (2)计算 2 43 21 64
2
运动 27 33 60
2.独立性检验中的统计假设就是假设相关事件A,B _____.
【解析】根据独立性检验的基本思想知独立性检验中的统计假 设就是假设相关事件A,B相互独立. 答案:相互独立
3.下面是一个2×2列联表,则表中a,b处的值分别为______. B
人教A版高中数学选修1-2课件:1.2独立性检验的基本思想及其初步应用 (共39张PPT)
1.2 独立性检验的基本思想及其初步应用
梅青中学
高二备课组
1.2×2列联表
(1) 分 类 变 量 : 变 量 的 不 同 “ 值 ” 表 示 个 体 所 属 的
不同类别 ________,像这类变量称为分类变量.
(2)2×2列联表 假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和 {y1,y2},其样本频数列联表(也称为2×2列联表)为 变 量 x1 x2 总 计 表. y1 a c a+c y2 b d b+d 总 计 a+b c+d a+b+c+d
像上表这样列出的两个分类变量的 __________ 频数表 称为列联
在列联表中,如果两个分类变量没有关系,则应满足ad-
bc≈0.因此|ad-bc|越小,说明两个分类变量之间关系越弱; |ad -bc|越大,说明两个分类变量之间关系越强.
2.独立性检验 为了使不同样本容量的数据有统一的评判标准,我们构造
独立性检验 【例2】 某大学餐饮中心为了解新生的饮食习惯,在全校
一年级学生中进行了抽样调查,调查结果如下表所示:
学 生 喜欢甜品 60 10 70 不喜欢甜品 20 10 30 合 计 80 20 100
南方学生 北方学生 合 计
根据表中数据,问是否有 95%的把握认为“南方学生和北 方学生在选用甜品的饮食习惯方面有差异”?
关系很大; 如果 K2 的值比较小,则说明二者之间关系不明 显.
2.某大型企业人力资源部为了研究企业员工工作态度和 对待企业改革态度的关系,经过调查得到如下列联表: 态 度 积极支持企业改革 不太支持企业改革 总计 32 63 95 工作一般 86 103 189 总 计 根据列联表,能否在犯错误的概率不超过 0.005 的前提下 认为工作态度与对待企业改革态度之间有关系?
梅青中学
高二备课组
1.2×2列联表
(1) 分 类 变 量 : 变 量 的 不 同 “ 值 ” 表 示 个 体 所 属 的
不同类别 ________,像这类变量称为分类变量.
(2)2×2列联表 假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和 {y1,y2},其样本频数列联表(也称为2×2列联表)为 变 量 x1 x2 总 计 表. y1 a c a+c y2 b d b+d 总 计 a+b c+d a+b+c+d
像上表这样列出的两个分类变量的 __________ 频数表 称为列联
在列联表中,如果两个分类变量没有关系,则应满足ad-
bc≈0.因此|ad-bc|越小,说明两个分类变量之间关系越弱; |ad -bc|越大,说明两个分类变量之间关系越强.
2.独立性检验 为了使不同样本容量的数据有统一的评判标准,我们构造
独立性检验 【例2】 某大学餐饮中心为了解新生的饮食习惯,在全校
一年级学生中进行了抽样调查,调查结果如下表所示:
学 生 喜欢甜品 60 10 70 不喜欢甜品 20 10 30 合 计 80 20 100
南方学生 北方学生 合 计
根据表中数据,问是否有 95%的把握认为“南方学生和北 方学生在选用甜品的饮食习惯方面有差异”?
关系很大; 如果 K2 的值比较小,则说明二者之间关系不明 显.
2.某大型企业人力资源部为了研究企业员工工作态度和 对待企业改革态度的关系,经过调查得到如下列联表: 态 度 积极支持企业改革 不太支持企业改革 总计 32 63 95 工作一般 86 103 189 总 计 根据列联表,能否在犯错误的概率不超过 0.005 的前提下 认为工作态度与对待企业改革态度之间有关系?
人教版高中数学选修1-2(A版)课件:第一章 1.2独立性检验的基本思想及其初步应用 (共92张PPT)
1、只要有坚强的意志力,就自然而然地会有能耐、机灵和知识。2、你们应该培养对自己,对自己的力量的信心,百这种信心是靠克服障碍,培养意志和锻炼意志而获得的。 3、坚强的信念能赢得强者的心,并使他们变得更坚强。4、天行健,君子以自强不息。5、有百折不挠的信念的所支持的人的意志,比那些似乎是无敌的物质力量有更强大 的威力。6、永远没有人力可以击退一个坚决强毅的希望。7、意大利有一句谚语:对一个歌手的要求,首先是嗓子、嗓子和嗓子……我现在按照这一公式拙劣地摹仿为:对 一个要成为不负于高尔基所声称的那种“人”的要求,首先是意志、意志和意志。8、执着追求并从中得到最大快乐的人,才是成功者。9、三军可夺帅也,匹夫不可夺志也。 10、发现者,尤其是一个初出茅庐的年轻发现者,需要勇气才能无视他人的冷漠和怀疑,才能坚持自己发现的意志,并把研究继续下去。11、我的本质不是我的意志的结果, 相反,我的意志是我的本质的结果,因为我先有存在,后有意志,存在可以没有意志,但是没有存在就没有意志。12、公共的利益,人类的福利,可以使可憎的工作变为可 贵,只有开明人士才能知道克服困难所需要的热忱。13、立志用功如种树然,方其根芽,犹未有干;及其有干,尚未有枝;枝而后叶,叶而后花。14、意志的出现不是对愿 望的否定,而是把愿望合并和提升到一个更高的意识水平上。15、无论是美女的歌声,还是鬓狗的狂吠,无论是鳄鱼的眼泪,还是恶狼的嚎叫,都不会使我动摇。16、即使 遇到了不幸的灾难,已经开始了的事情决不放弃。17、最可怕的敌人,就是没有坚强的信念。18、既然我已经踏上这条道路,那么,任何东西都不应妨碍我沿着这条路走下 去。19、意志若是屈从,不论程度如何,它都帮助了暴力。20、有了坚定的意志,就等于给双脚添了一对翅膀。21、意志坚强,就会战胜恶运。22、只有刚强的人,才有神 圣的意志,凡是战斗的人,才能取得胜利。23、卓越的人的一大优点是:在不利和艰难的遭遇里百折不挠。24、疼痛的强度,同自然赋于人类的意志和刚度成正比。25、能 够岿然不动,坚持正见,度过难关的人是不多的。26、钢是在烈火和急剧冷却里锻炼出来的,所以才能坚硬和什么也不怕。我们的一代也是这样的在斗争中和可怕的考验中 锻炼出来的,学习了不在生活面前屈服。27、只要持续地努力,不懈地奋斗,就没有征服不了的东西。28、立志不坚,终不济事。29、功崇惟志,业广惟勤。30、一个崇高 的目标,只要不渝地追求,就会居为壮举;在它纯洁的目光里,一切美德必将胜利。31、书不记,熟读可记;义不精,细思可精;惟有志不立,直是无着力处。32、您得相 信,有志者事竟成。古人告诫说:“天国是努力进入的”。只有当勉为其难地一步步向它走去的时候,才必须勉为其难地一步步走下去,才必须勉为其难地去达到它。33、 告诉你使我达到目标的奥秘吧,我唯一的力量就是我的坚持精神。34、成大事不在于力量的大小,而在于能坚持多久。35、一个人所能做的就是做出好榜样,要有勇气在风 言风语的社会中坚定地高举伦理的信念。36、即使在把眼睛盯着大地的时候,那超群的目光仍然保持着凝视太阳的能力。37、你既然期望辉煌伟大的一生,那么就应该从今 天起,以毫不动摇的决心和坚定不移的信念,凭自己的智慧和毅力,去创造你和人类的快乐。38、一个有决心的人,将会找到他的道路。39、在希望与失望的决斗中,如果 你用勇气与坚决的双手紧握着,胜利必属于希望。40、富贵不能淫,贫贱不能移,威武不能屈。41、生活的道路一旦选定,就要勇敢地走到底,决不回头。42、生命里最重 要的事情是要有个远大的目标,并借助才能与坚持来完成它。43、事业常成于坚忍,毁于急躁。我在沙漠中曾亲眼看见,匆忙的旅人落在从容的后边;疾驰的骏马落在后头, 缓步的骆驼继续向前。44、有志者事竟成。45、穷且益坚,不坠青云之志。46、意志目标不在自然中存在,而在生命中蕴藏。47、坚持意志伟大的事业需要始终不渝的精神。 48、思想的形成,首先是意志的形成。49、谁有历经千辛万苦的意志,谁就能达到任何目的。50、不作什么决定的意志不是现实的意志;无性格的人从来不做出决定。我终 生的等待,换不来你刹那的凝眸。最美的不是下雨天,是曾与你躲过雨的屋檐。征服畏惧、建立自信的最快最确实的方法,就是去做你害怕的事,直到你获得成功的经验。 真正的爱,应该超越生命的长度、心灵的宽度、灵魂的深度。生活真象这杯浓酒,不经三番五次的提炼呵,就不会这样可口!人格的完善是本,财富的确立是末能力可以慢 慢锻炼,经验可以慢慢积累,热情不可以没有。不管什么东西,总是觉得,别人的比自己的好!只有经历过地狱般的折磨,才有征服天堂的力量。只有流过血的手指才能弹 出世间的绝唱。对时间的价值没有没有深切认识的人,决不会坚韧勤勉。第一个青春是上帝给的;第二个的青春是靠自己努力的。不要因为寂寞而恋爱,孤独是为了幸福而 等待。每天清晨,当我睁开眼睛,我告诉自己:我今天快乐或是不快乐,并非由我所遭遇的事情造成的,而应该取决于我自己。我可以自己选择事情的发展方向。昨日已逝,
人教版2017高中数学(选修1-2)1.2独立性检验的基本思想及其初步应用PPT课件
的概率不超过0.005的前提下可以认为居民32)2 解:由公式得k= 44×56×70×30 ≈10.019>7.879,所以在犯错误
首页
课前预习案
课堂探究案
思考辨析 判断下列说法是否正确,正确的在后面的括号内打“√”,错误的打 “×”. (1)分类变量与定量变量的含义是相同的. ( × ) ������ ������ 与 (2)在等高条形图中,如果 ������ + ������ ������ + ������ 非常接近,说明两个变量之 间有关系. ( × ) (3)利用列联表求得的K2的值越大,说明两个变量有关系的可能性 越大. ( √ ) (4)在独立性检验中,如果K2的观测值k≥k0(k0为某一临界值),就可 推断两个变量没有关系. ( × )
1.2 独立性检验的基本思想及其初步应用
-1-
首页
课前预习案
课堂探究案
学 习 目 标 思 维 脉 络 1.理解分类变量及列联表 的概念. 2.了解独立性检验的基本 思想. 3.了解利用等高条形图进 行独立性检验的方法. 4.掌握利用列联表进行独 立性检验的方法与步骤.
首页
课前预习案
课堂探究案
1.分类变量与列联表 (1)分类变量 变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类 变量. (2)2×2列联表 ①列出的两个分类变量的频数表,称为列联表. ②2×2列联表 一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和 {y1,y2},其样本频数列联表(称为2×2列联表)为
性格内向 考前心情紧张 考前心情不紧张 总计 332 94 426 性格外向 213 381 594 总计 545 475 1 020
首页 探究一 探究二 探究三 思维辨析 当堂检测
选修1-2《独立性检验》课件
独立性检验的一般步骤: (1)假设两个分类变量X与Y没有关系; (2)计算出K2的观测值k; (3)把k的值与临界值比较确定X与Y有关的程度或 无关系.
(2)分类变量的取值有时可用数字来表示,但这时 的数字除了分类以外没有其他的含义,如用“0” 表示“男”,用“1”表示“女”.
某医疗机构为了了解患肺癌与吸烟是否有 关,进行了一次抽样调查,共调查了9965 个成年人,其中吸烟者2148人,不吸烟者 7817人,调查结果是:吸烟的2148人中49 人患肺癌, ;不吸烟的7817人中42人患肺 癌.
由观测 数据计算 得到随机变量K 2的观测 值k.
(3)如果k≥k0 ,就以(1-P(K2≥k0)) ×100%的把握 认为“X与Y有关系”;否则就说样本观测数据 没有提供“X与Y有关系”的充分证据.
反证法原理与假设检验原理
反证法原理:
在一个已知假 设下,如果推 出一个矛盾, 就证明了这个 假设不成立。
问题3:能否用数量刻画出“有关”的程度?
独立性检验
通过数据和图表分析,得到 结论是:吸烟与患呼吸道疾 病有关
H0: 吸烟和患肺癌之间没有关系
结论的可靠 程度如何?
不吸烟 吸烟 总计
吸烟与呼吸道疾病列联表
不患肺癌
患肺癌
a
b
c
d
a+c
b+d
不吸烟的人中不患肺癌的比例: 吸烟的人中不患肺癌的比例:
a ab
假设检验原理:
在一个已知假设 下,如果一个与 该假设矛盾的小 概率事件发生, 就推断这个假设 不成立。
例题解析:
例1、在某医院,因为患心脏病而住院的665名男性病 人中,有214人秃顶,而另外772名不是因为患心脏病而住 院的男性病人中有175人秃顶.(1)利用图形判断秃顶与患 心脏病是否有关系;(2)能否在犯错误的概率不超过0.01 的前提下认为秃顶与患心脏病有关系?
(2)分类变量的取值有时可用数字来表示,但这时 的数字除了分类以外没有其他的含义,如用“0” 表示“男”,用“1”表示“女”.
某医疗机构为了了解患肺癌与吸烟是否有 关,进行了一次抽样调查,共调查了9965 个成年人,其中吸烟者2148人,不吸烟者 7817人,调查结果是:吸烟的2148人中49 人患肺癌, ;不吸烟的7817人中42人患肺 癌.
由观测 数据计算 得到随机变量K 2的观测 值k.
(3)如果k≥k0 ,就以(1-P(K2≥k0)) ×100%的把握 认为“X与Y有关系”;否则就说样本观测数据 没有提供“X与Y有关系”的充分证据.
反证法原理与假设检验原理
反证法原理:
在一个已知假 设下,如果推 出一个矛盾, 就证明了这个 假设不成立。
问题3:能否用数量刻画出“有关”的程度?
独立性检验
通过数据和图表分析,得到 结论是:吸烟与患呼吸道疾 病有关
H0: 吸烟和患肺癌之间没有关系
结论的可靠 程度如何?
不吸烟 吸烟 总计
吸烟与呼吸道疾病列联表
不患肺癌
患肺癌
a
b
c
d
a+c
b+d
不吸烟的人中不患肺癌的比例: 吸烟的人中不患肺癌的比例:
a ab
假设检验原理:
在一个已知假设 下,如果一个与 该假设矛盾的小 概率事件发生, 就推断这个假设 不成立。
例题解析:
例1、在某医院,因为患心脏病而住院的665名男性病 人中,有214人秃顶,而另外772名不是因为患心脏病而住 院的男性病人中有175人秃顶.(1)利用图形判断秃顶与患 心脏病是否有关系;(2)能否在犯错误的概率不超过0.01 的前提下认为秃顶与患心脏病有关系?
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
上面这种利用随机变量K2来确定在多大程度上可以认 为“两个分类变量有关系”的方法称为两个分类变量 的独立性检验。
9
临界值表:
P(K 2 k0 ) 0.50
0.40
0.25
0.15
0.10
0.05
0.02 5
0.01 0.45 0.70 1.32 2.07 2.70 3.84 5.02 6.63 7.87 10.82
“光盘”与性别列联表
不患肺癌 患肺癌 总计
不吸烟
a
b
a+b
吸烟
c
d
c+d
总计
a+c
b+d a+b+c+d
5
不吸烟 吸烟 总计
不患肺癌 a c
a+c
患肺癌 b d
b+d
总计 a+b c+d a+b+c+d
如果”吸烟与患肺癌没有关系”,则在吸烟样本中不 患肺癌的比例应该与不吸烟样本中相应的比例差不多,
即 a c ac d ca b ad bc 0
课题引入:
在现实中,我们会遇到类似下面的问题: 肺癌是严重威胁人类生命的一种疾病,吸烟 与患肺癌有关系吗? 性别对是否喜欢数学课程有影响吗?
1
1.2 独立性检验的基本思想及其初步应用
对于性别变量,其取值为男和女两种。 这种变量的 不同“值”表示个体所属的不同类别,像这样的变 量称为“分类变量”。在现实生活中,分类变量是 大量存在的,例如是否吸烟,宗教信仰,国籍…… 日常生活中,我们常常关心两个分类变量之间是否 有关系,例如吸烟是否与患肺癌有关系?性别是否 对于喜欢数学课程有影响等等。
0.54%
0% 不吸烟
2.28%
吸烟
患病比例
不患肺癌 患肺癌
不患病比例
4
上面我们通过分析数据和图形,得到的直观印象是“吸 烟和患肺癌有关”。这一直觉来自于观测数据,即样本。
问题是我们有多大的把握认为“吸烟和患肺癌有关”
我们假设
H0:吸烟与患肺癌没有关系 看看能推出什么样的结论。
为了研究的一般性,在列联表1-7中中用字母代替数字:
在统计学中,独立性检验是检验 两个分类变量是否有关系的一种 统计方法。
2
探究:
为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机 地调查了9965人,得到如下结果(单位:人)
表1-7 吸烟与患肺癌列联表
不患肺癌 患肺癌 总计
不吸烟
7775
42
7817
吸烟
2099
49
2148
列联表:两个 分类变量的频 数表
(5)如果k 3.841,就有95%的把握认为" X与Y有关系"
(6)如果k 2.706,就有90%的把握认为" X与Y有关系"
(7)如果k 2.706,就认为没有充分的证据显示" X 与Y
有关系"
10
思考:
你能从上述探究过程中总结出判断两个分类变量有关 系的思路吗? 一般地,假设有两个分类变量X 和Y ,它们的取值分别为
若H0成立,即“吸烟与患肺癌没有关系”,则
2
K
应
该很小。
7
接下来,我们就利用卡方统计量K2来判断探究中“吸 烟与患肺癌有关”的可靠程度。
例:现在,根据表1-7中的数据
不吸烟
不患肺癌 7775
患肺癌 42
总计 7817
吸烟
2099
49
2148
总计
9874
91
9965
利用公式(1)计算得K2的观测值为:
99657775 49 42 20992
k
56.632
7817 2148 9874 91
8
在H0成立的情况下,统计学家估算出如下的概率:
P K 2 6.635 0.010
即在H0成立的情况下,K2的值大于6.635的概率非常小, 近似于0.010。
现在的观测值56.632远大于6.635,即假设成立的概率 为0.010,是小概率事件,所以有理由断定H0不成立, 即认为“吸烟与患肺癌有关系”。但这种判断会犯错 误,犯错误的概率不会超过0.010 。即有99%的把握认 为“吸烟与患肺癌有关”。
{x1, x2}和{y1, y2}, 其样本频数列联表(称为2 2列联表)为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d a+b+c+d
若要推断的结论为H1:”X与Y有关系”,可用如下方法: 1、频率比较法:根据列联表。
2、图形分析法:通过等高条形图。
11
3.独立性检验法 步骤:
(1)列出列联表, (2)假设 两分类变量没有关系, (3)计算K2观测值k, (4)查临界值表,作出判断(两分类变量有关
系的程度).
12
例题解析:
例1 春节期间,“厉行节约,反对浪费”之风悄然吹开, 某市随机询问100名性别不同的居民是否能做到“光 盘”行动, (1)完成如下列联表。 (2)有多大的把握认为居民能否做到“光盘”与性 别有关系? (3)能否在犯错误的概率不超过0.010的前提下认为 居民能否做到“光盘”与性别有关系?
5
8
3
2
6
1
4
5
9
8
(1)如果k 10.828,就有99.9%的把握认为" X与Y有关系" (2)如果k 7.879,就有99.5%的把握认为" X与Y有关系"
(3)如果k 6.635,就有99%的把握认为" X与Y有关系"
(4)如果k 5.024,就有97.5%的把握认为" X与Y有关系"
“光盘”与性别列联表
做不到光盘 做到光盘 总计
男
45
55
女
15
总计
75
100
13
例题解析:
例1 春节期间,“厉行节约,反对浪费”之风悄然吹开, 某市随机询问100名性别不同的居民是否能做到“光盘” 行动,
(1)完成如下列联表。 (2)有多大的把握认为居民能否做到“光盘”与性 别有关系?
(3)能否在犯错误的概率不超过0.010的前提下认为居 民能否做到“光盘”与性别有关系?
(四行四列)
总计
9874
91
9965
那么吸烟是否对患肺癌有影响?
在不吸烟者中患肺癌的比例是 0.54% 在吸烟者中患肺癌的比例是 2.28%
与表格相比, 等高条形图能 更直观地反映 出相关数据的 总体状况
因此,直观上得到结论:
吸烟者和不吸烟者患肺癌的可能性存在差异。
3
等高条形图
100% 80% 60% 40% 20%
ab cd
结论:|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强;
6
为了使不同样本容量的数据有统一的评判标准,基于 上述分析,我们构造一个随机变量(卡方统计量)
2
K
nad bc2 abcd acbd (1)
其中n a b c d为样本容量
9
临界值表:
P(K 2 k0 ) 0.50
0.40
0.25
0.15
0.10
0.05
0.02 5
0.01 0.45 0.70 1.32 2.07 2.70 3.84 5.02 6.63 7.87 10.82
“光盘”与性别列联表
不患肺癌 患肺癌 总计
不吸烟
a
b
a+b
吸烟
c
d
c+d
总计
a+c
b+d a+b+c+d
5
不吸烟 吸烟 总计
不患肺癌 a c
a+c
患肺癌 b d
b+d
总计 a+b c+d a+b+c+d
如果”吸烟与患肺癌没有关系”,则在吸烟样本中不 患肺癌的比例应该与不吸烟样本中相应的比例差不多,
即 a c ac d ca b ad bc 0
课题引入:
在现实中,我们会遇到类似下面的问题: 肺癌是严重威胁人类生命的一种疾病,吸烟 与患肺癌有关系吗? 性别对是否喜欢数学课程有影响吗?
1
1.2 独立性检验的基本思想及其初步应用
对于性别变量,其取值为男和女两种。 这种变量的 不同“值”表示个体所属的不同类别,像这样的变 量称为“分类变量”。在现实生活中,分类变量是 大量存在的,例如是否吸烟,宗教信仰,国籍…… 日常生活中,我们常常关心两个分类变量之间是否 有关系,例如吸烟是否与患肺癌有关系?性别是否 对于喜欢数学课程有影响等等。
0.54%
0% 不吸烟
2.28%
吸烟
患病比例
不患肺癌 患肺癌
不患病比例
4
上面我们通过分析数据和图形,得到的直观印象是“吸 烟和患肺癌有关”。这一直觉来自于观测数据,即样本。
问题是我们有多大的把握认为“吸烟和患肺癌有关”
我们假设
H0:吸烟与患肺癌没有关系 看看能推出什么样的结论。
为了研究的一般性,在列联表1-7中中用字母代替数字:
在统计学中,独立性检验是检验 两个分类变量是否有关系的一种 统计方法。
2
探究:
为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机 地调查了9965人,得到如下结果(单位:人)
表1-7 吸烟与患肺癌列联表
不患肺癌 患肺癌 总计
不吸烟
7775
42
7817
吸烟
2099
49
2148
列联表:两个 分类变量的频 数表
(5)如果k 3.841,就有95%的把握认为" X与Y有关系"
(6)如果k 2.706,就有90%的把握认为" X与Y有关系"
(7)如果k 2.706,就认为没有充分的证据显示" X 与Y
有关系"
10
思考:
你能从上述探究过程中总结出判断两个分类变量有关 系的思路吗? 一般地,假设有两个分类变量X 和Y ,它们的取值分别为
若H0成立,即“吸烟与患肺癌没有关系”,则
2
K
应
该很小。
7
接下来,我们就利用卡方统计量K2来判断探究中“吸 烟与患肺癌有关”的可靠程度。
例:现在,根据表1-7中的数据
不吸烟
不患肺癌 7775
患肺癌 42
总计 7817
吸烟
2099
49
2148
总计
9874
91
9965
利用公式(1)计算得K2的观测值为:
99657775 49 42 20992
k
56.632
7817 2148 9874 91
8
在H0成立的情况下,统计学家估算出如下的概率:
P K 2 6.635 0.010
即在H0成立的情况下,K2的值大于6.635的概率非常小, 近似于0.010。
现在的观测值56.632远大于6.635,即假设成立的概率 为0.010,是小概率事件,所以有理由断定H0不成立, 即认为“吸烟与患肺癌有关系”。但这种判断会犯错 误,犯错误的概率不会超过0.010 。即有99%的把握认 为“吸烟与患肺癌有关”。
{x1, x2}和{y1, y2}, 其样本频数列联表(称为2 2列联表)为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d a+b+c+d
若要推断的结论为H1:”X与Y有关系”,可用如下方法: 1、频率比较法:根据列联表。
2、图形分析法:通过等高条形图。
11
3.独立性检验法 步骤:
(1)列出列联表, (2)假设 两分类变量没有关系, (3)计算K2观测值k, (4)查临界值表,作出判断(两分类变量有关
系的程度).
12
例题解析:
例1 春节期间,“厉行节约,反对浪费”之风悄然吹开, 某市随机询问100名性别不同的居民是否能做到“光 盘”行动, (1)完成如下列联表。 (2)有多大的把握认为居民能否做到“光盘”与性 别有关系? (3)能否在犯错误的概率不超过0.010的前提下认为 居民能否做到“光盘”与性别有关系?
5
8
3
2
6
1
4
5
9
8
(1)如果k 10.828,就有99.9%的把握认为" X与Y有关系" (2)如果k 7.879,就有99.5%的把握认为" X与Y有关系"
(3)如果k 6.635,就有99%的把握认为" X与Y有关系"
(4)如果k 5.024,就有97.5%的把握认为" X与Y有关系"
“光盘”与性别列联表
做不到光盘 做到光盘 总计
男
45
55
女
15
总计
75
100
13
例题解析:
例1 春节期间,“厉行节约,反对浪费”之风悄然吹开, 某市随机询问100名性别不同的居民是否能做到“光盘” 行动,
(1)完成如下列联表。 (2)有多大的把握认为居民能否做到“光盘”与性 别有关系?
(3)能否在犯错误的概率不超过0.010的前提下认为居 民能否做到“光盘”与性别有关系?
(四行四列)
总计
9874
91
9965
那么吸烟是否对患肺癌有影响?
在不吸烟者中患肺癌的比例是 0.54% 在吸烟者中患肺癌的比例是 2.28%
与表格相比, 等高条形图能 更直观地反映 出相关数据的 总体状况
因此,直观上得到结论:
吸烟者和不吸烟者患肺癌的可能性存在差异。
3
等高条形图
100% 80% 60% 40% 20%
ab cd
结论:|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强;
6
为了使不同样本容量的数据有统一的评判标准,基于 上述分析,我们构造一个随机变量(卡方统计量)
2
K
nad bc2 abcd acbd (1)
其中n a b c d为样本容量