独立性检验(备课件)高二数学系列(2019选择性必修第二册)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
由此推断, 吸烟群体比不吸烟群体患肺癌的可能性大.
疑问:是不是就可以下结论:吸烟群体比不吸烟群体患肺癌的可能性大, 你有多大把握?能不能用一个数据来刻画呢?
数学探究
不患肺癌 患肺癌 总计
不吸烟
a
吸烟
c
b
a+b
d
c+d
总计
a+c
b+d a+b+c+d
“不吸烟” 样本中 “患肺癌”的比例: b ;
ab
nn
nn
nn
(n c d b d - d)2 (n a b b d - b)2 (n c d a c - c)2 (n a b a c - a)2
2
nn ncd bd
nn nab bd
nn ncd ac
nn nab ac
nn
nn
nn
nn
数学探究
不患肺癌 患肺癌 总计
不吸烟
a
吸烟
c
(2)若观测值 2 6.635 ,则有99% 的把握认为“Ⅰ与Ⅱ有 关系”;
ቤተ መጻሕፍቲ ባይዱ
(3)若观测值 2 2.706 ,则有90% 的把握认为“Ⅰ与Ⅱ有关系”;
(4))若观测值 2 2.706 ,则认为没有成分证据显示“Ⅰ与Ⅱ有关系”,
但也不能作出结论“ H 0 成立”,即不能认为Ⅰ与Ⅱ没有关系.
“吸烟”样本中“患肺癌” 的比例: d .
cd
假设 H0: 吸烟与患肺癌没有关系,即它们是独立的,则需
b d ad-bc≈0. ad-bc越接近0,吸烟与患肺癌越没关系
ab cd
ad-bc有正负差异 (ad-bc)2越接近0,吸烟与患肺癌越没关系
疑问1.不同的样本,数据不同,比例不同,数据所体现的差异性不同, 怎样针对不同样本数据设置统一的评判标准?
b d ad-bc≈0. ad-bc越接近0,吸烟与患肺癌越没关系
ab cd
ad-bc有正负差异 (ad-bc)2越接近0,吸烟与患肺癌越没关系
为了统一标准,我们构 造了一个随机量 (2 读作:卡方)来刻画 独立性
2
n(ad - bc)2
(a b)(c d)(a c)(b d)
数学探究
9.2独立性检验
学习目标 通过典型案例的探究,了解独立检验的基本思想和方法.
情景创设
你能说说下面两个变量之间有关系吗?
高中生恋爱对学习成绩有影响吗?
高中流行这样一句话“文科就怕数学不好,理科就怕英语不好.”试问:文科学生总成绩不 好与数学成绩不好有关系吗?
高中生吸烟对学习成绩有影响吗?
吸烟与患肺癌有关吗?
我们构造这个随机变量 2来刻画独立性,有没有 理论依据呢?
2
n(ad - bc)2
(a b)(c d )(a c)(b d )
下面我们从概率的角度来探究
数学探究
不患肺癌 患肺癌 总计
不吸烟
a
吸烟
c
频率代替概率 总计
a+c
b
a+b
d
c+d
b+d a+b+c+d 记:n=a+b+c+d
将事件"某人抽烟"记为A, 将事件"某人患病"记为B 假设 H0: 吸烟与患肺癌没有关系,即它们是独立的
P(AB) c d a c 估计:吸烟且不患病人数 : nP(AB) n c d a c
nn
nn
估计值- 观测值: n c d a c - c nn
P(AB) a b a c 估计:不吸烟且不患病人数: nP(AB) n a b a c 估计值- 观测值: n a b a c - a
调查研究
情景创设
情景1. 下表是对吸烟和不吸烟的人中患肺癌的调查数据, 你能从中分析吸烟对患 肺癌的影响程度吗?
不患肺癌 患肺癌
总计
不吸烟
21
274
220
吸烟
37
183
295
总计
58
457
515
(答) 由如上的列联表分析:在不吸烟的样本中, 有7.12 % 的人患肺癌; 在吸烟的样本中, 有16.82 % 的人患肺癌.
B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,可以说某 人吸烟,那么他有99%的可能性患肺病。
C.若从统计数据中求出有95%的把握认为吸烟与患肺病有关,是指有 5%的可能性使推断出现错误。
D.以上三种说法都不对。
课堂达标
2、对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行3 年跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:
x0
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
课堂达标
1、在吸烟与患肺病是否有关的检验中,下列说法正确 的是 ( C )
A.若χ2>6.635,则有99%的把握认为吸烟与患肺病有关,那么100名吸烟 者中,有99个患肺病。
b
a+b
d
c+d
总计
a+c
b+d a+b+c+d 记:n=a+b+c+d
将事件"某人抽烟"记为A, 将事件"某人患病"记为B 假设 H0: 吸烟与患肺癌没有关系,即它们是独立的
(n c d b d - d)2 (n a b b d - b)2 (n c d a c - c)2 (n a b a c - a)2
课堂总结
1、独立性检验步骤: (1)提出假设H0 : 与 没关系; (2)列2 2列联表
(3)计算 2的值
(4)根据卡方临界值表,做出判断。
2、卡方公式:
2
n(ad - bc)2
(a b)(c d )(a c)(b d )
3、卡方临界值表:
P( 2 x0 ) 0.5 0.4
0.25 0.15 0.1[来源:学科网] 0.05 0.025 0.01 0.005 0.001
数学建构
这种用 2统计量研究“ 与 两类是否有关”的方法 叫独立性检验
步骤如下: (1)提出假设H0 : 与 没关系; (2)列2 2列联表
(3)计算 2的值
(4)根据卡方临界值表,做出判断。
假设该结论不成立 构造卡方统计量 根据卡方 观测值的大小判断假设的合理程度 得到原
结论成立的可信程度
数学应用
卡方临界值表:
P( 2 x0 ) 0.5 0.4
0.25 0.15 0.1[来源:学科网] 0.05 0.025 0.01 0.005 0.001
x0
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
(1)若观 测值 2 10.828 ,则有99.9% 的把握认为“Ⅰ与Ⅱ有关系”;
优秀
不优秀
总计
甲班
10
35
45
乙班
7
38
45
总计
17
73
90
请根据列联表的独立性检验, 能否在犯错误的概率不超过0.01 的前提下认为
成绩与班级有关系?
解: 2 90 (10 38 - 35 7)2 ≈0.653 <6.635.
45 45 17 73
∵P(χ2≥6.635)≈0.01.
有关,可以认为病人又发作心脏病与否跟他做过何种手术无关。
总计 389 1048 1437
2 1437 (214 597 -175 451)2
389 1048 665 772
≈16.373>6.635.
∵P(χ2≥6.635)≈0.01.
∴认为在犯错误的概率不超过 0.01 的前提下, 秃顶与患心脏病有关系.
数学应用
例2、有甲乙两个班级进行一门课程的考试, 按照学生考试成绩优秀和不优 秀统计成绩后, 得到如下的列联表:
∴在犯错误的概率不超过 0.01 的前提下, 不能认为 “成绩与 班级有关”.观察条形图所得的直观判断不可靠.
数学应用
例3. 为考察某种药物预防疾病的效果, 进行动物试验, 得到如下列联表:
药物效果与动物试验列联表
服用药 没服用药
总计
患病 10 20 30
未患病 45 30 75
总计 55 50 105
2
nn ncd bd
nn nab bd
nn ncd ac
nn nab ac
nn
nn
nn
nn
2
n(ad - bc)2
(a b)(a c)(c d)(b d)
2越大,估计值 - 观测值差异越大,独立 性越小,越相关
2越小,估计值 - 观测值差异越接近 0,独立性越大,越不相 关
数学探究
心脏搭桥手术 血管清障手术
合计
又发作过心脏 病
39 29 68
未发作过心 脏病
157 167 324
合计
196 196 392
试根据上述数据比较两种手术对病人又发作心脏病的影响有没有差别。
解:
2
392(39 167 - 29 157)2 68 324196196
1.780
因为1.780<3.841,我们没有理由说“心脏搭桥手术”与“又发生过心脏病”
例 1. 在某医院, 因为患心脏病而住院的 665 名男性病人中, 有 214 人秃顶; 而 另外 772 名不是因为患心脏病而住院的男性病人中, 有 175 人秃顶. 能否在犯错误的概率不超过 0.01 的前提下认为秃顶与患心脏病有关系?
解:
秃顶 不秃顶
总计
患心脏病 214 451 665
患其他病 175 597 772
能否在犯错误的概率不超过 0.025 的前提下认为药物有效呢?
解:χ2的观测值为 2 105 (10 30 - 45 20)2 ≈6.109.
55 50 30 75
查表得 P(χ2≥5.024)≈0.025, 而 6.109>5.024,
所以认为在犯错误的概率不超过 0.025 的前提下, “患病与服用药有 关系”.
疑问2.针对不同的样本数据,可能做出不同的判断,那么你有多大的把 握认为自己的判断是正确的?
数学探究
不患肺癌 患肺癌 总计
不吸烟
a
吸烟
c
b
a+b
d
c+d
总计
a+c
b+d a+b+c+d
“不吸烟” 样本中 “患肺癌”的比例: b ;
ab
“吸烟”样本中“患肺癌” 的比例: d .
cd
假设 H0: 吸烟与患肺癌没有关系,即它们是独立的,则需
P(AB) c d b d 估计:吸烟且患病人数: nP(AB) n c d b d
nn
nn
估计值- 观测值: n c d b d - d nn
P(AB) a b b d 估计:不吸烟且患病人数 : nP(AB) n a b b d
nn
nn
估计值- 观测值:n a b b d - b nn