人教A版数学选修2-3全册课件-独立性检验的基本思想及其初步应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4.独立性检验与统计的综合应用
[典例] (12 分)某工厂有工人 1 000 名,其中 250 名工人参 加过短期培训(称为 A 类工人),另外 750 名工人参加过长期培 训(称为 B 类工人).现用分层抽样的方法(按 A 类、B 类分两层) 从该工厂的工人中抽取 100 名工人,调查他们的生产能力(此处 生产能力指一天加工的零件数),结果如下表.
生产能力分组 [110,130) [130,150) 总计
工人类别
A 类工人
B 类工人
总计
附:K2=a+bcn+add-ab+cc2b+d,
P(K2≥k0)
0.050 0.010 0.001
k0
3.841 6.635 10.828
[解題流程]
[規範解答]
(1) ∵ 从 该 工 厂 的 工 人 中 抽 取 100 名工人,且该工厂中有 250 名 A 类工人,750 名 B 类工人,
(1)根据以上数据完成下列2×2列联表: 主食蔬菜 主食肉类 总计
50岁以下 50岁以上
总计 (2)能否在犯错误的概率不超过0.01的前提下认为其亲属 的饮食习惯与年龄有关?并写出简要分析.
解:(1)2×2列联表如下:
主食蔬菜 主食肉类 总计
50岁以下
4
8
12
50岁以上
16
2
18
总计
20
10
30
答案:D
2.下面是一个2×2列联表:
y1
y2
总计
x1
a
21
73
x2
2
25
27
总计
b
46
则表中a、b处的值分别为
()
A.94,96
B.52,50
C.52,54
D.54,52
解析:由aa+ +221==b7,3, 得ab= =5524, .
答案:C
3.獨立性檢驗所採用的思路是:要研究A,B兩類型變數彼 此相關,首先假設這兩類變數彼此________,在此假設下 構造隨機變數K2,如果K2的觀測值較大,那麼在一定程度 上說明假設________. 答案:無關 不成立
(2)因为K2=123× 0×188×-2102×8120=10>6.635,
P(K2>6.635)=0.01
所以可以在犯错误的概率不超过0.01的前提下认为其亲
属的饮食习惯与年龄有关.
[随堂即时演练] 1.观察下列各图,其中两个分类变量x,y之间关系最强
的是
()
解析:在四幅圖中,D圖中兩個深色條的高相差最明顯, 說明兩個分類變數之間關係最強.
解:根据题意,列出 2×2 列联表如下:
晕机 不晕机 总计
男乘客 24
31
55
女乘客
8
26
34
总计
32
57
89
假设在天气恶劣的飞机航程中男乘客不比女乘客更容易晕机.
由公式可得 K2 的观测值
k=a+bcn+add-ab+cc2b+d =89552×4×342×6-323×1×5782≈3.689>2.706, 故在犯错误的概率不超过 0.10 的前提下,认为“在天气恶劣的 飞机航程中男乘客比女乘客更容易晕机”.
表 1:A 类工人生产能力的频数分布表
生产能力分组 [110,120) [120,130) [130,140) [140,150)
人数
8
x
3
2
表 2:B 类工人生产能力的频数分布表
生产能力分组 [110,120) [120,130) [130,140) [140,150)
人数
6
y
27
18
(1)确定 x,y 的值; (2)完成下面 2×2 列联表,并回答能否在犯错误的概率不超过 0.001 的前提下认为工人的生产能力与工人的类别有关系?
一部分,试分析实验效果.
70及70分以下 70分以上 总计
对照班
32
18
50
试验班
12
38
50
总计
44
56
100
附:
P(K2≥k0) k0
0.025 5.024
0.010 6.635
0.005 7.879
解:根据列联表中的数据,由公式得K2的观测值 k=a+bcn+add-ab+cc2b+d =100503×2×503×8-441×8×56122≈16.234. 因为16.234>6.635,所以,在犯错误的概率不超过0.01的前 提下认为高二年级统计案例的测试成绩与高一年级数学教学 中增加统计思想的渗透有联系.
3.2
獨立
第 三
性檢 驗的 基本
章 思想
及其
初步
應用
1 理解教 材新知
2 突破常 考題型
3 跨越高 分障礙
4 應用落 實體驗
知識點一 知識點二
題型一 題型二
隨堂即時演練 課時達標檢測
3.2 独立性检验的基本思想及其初步应用
獨立性檢驗的有關概念 [提出問題] 某校高三模拟考试调查中,性格内向的 426 人中有 332 人考前紧张,性格外向的 594 人中有 213 人考前紧张. 问题 1:考前紧张与性格类别有关系吗? 提示:有.
4.在吸烟与患肺病是否相关的判断中,有下面的说法: ①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的 前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人 中必有99人患有肺病; ②从独立性检验可知在犯错误的概率不超过0.01的前提 下,认为吸烟与患肺病有关系时,若某人吸烟,则他有 99%的可能患有肺病; ③从独立性检验可知在犯错误的概率不超过0.05的前提 下,认为吸烟与患肺病有关系时,是指有5%的可能性使得 推断错误.其中说法正确的是________.
(2)根據所給的數據可以完成列聯表,如下表所示:
生產能力分組 [110,130) [130,150) 總計
工人類別
A類工人 B類工人
總計
20
5
25
30
45
75
50
50
100
(6分)
由列联表中的数据,得K2的观测值为
k=1002×5×207×5×455-0×5×50302= 12>10.828.(10分)
年及其家长,数据如下:
父母吸烟 父母不吸烟
总计
子女吸烟
237
83
320
子女不吸烟
678
522
1 200
总计
915
605
1 520
利用等高条形图判断父母吸烟对子女吸烟是否有影响?
解:等高条形图如下:
由图形观察可以看出父母吸烟者中子女吸烟的比例要比父 母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认 为“子女吸烟与父母吸烟有关系”.
立性检验的ห้องสมุดไป่ตู้法判断.
附:
P(K2≥k0)
0.10
0.05 0.025
k0
2.706 3.841 5.024
[解] 根据题目所给数据建立如下 2×2 列联表:
肯定
否定
总计
男生
22
88
110
女生
22
38
60
总计
44
126
170
根据 2×2 列联表中的数据得到:
k=1701×10×226×0×384-4×221×26882≈5.622>3.841.
解析:K2是检验吸烟与患肺病相关程度的量,是相关关系, 而不是确定关系,是反映有关和无关的概率,故说法①不正 确;说法②中对“确定容许推断犯错误概率的上界”理解错 误;说法③正确. 答案:③
5.为了解决高二年级统计案例入门难的问题,某校在高一年
级的数学教学中设有试验班,着重加强统计思想的渗透,
下面是高二年级统计案例的测验成绩统计表(单位:分)的
[类题通法] 进行独立性检验的前提是根据题中数据获得 2×2 列联 表,常用等高条形图展示列联表数据的频率特征,即将a+a b 与c+c d(或a+b b与c+d d)的值相比,由此能直观地反映出两个 分类变量间是否相互影响,但是此方法较粗劣.
[活学活用]
为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少
問題2:通過怎樣比較看出有?
提示:通過考前緊張的人數占性格類型的比例.
[導入新知]
1.分类变量 变量的不同“值”表示 個體所屬 的不同类别,像这样的 变量称为分类变量. 2.2×2 列联表 假设有两个分类变量 X 和 Y,它们的取值分别为{x1,x2} 和 {y1,y2} ,其样本频数列联表(也称为 2×2 列联表)为:
此處易犯錯誤有兩點: ①計算失誤;②將公 式中的數據搞錯.
因此,在犯错误的概率不超过0.001的前提下认为工
人的生产能力与工人的类别有关系.(12分)
[活学活用] (东北三校联考)某学生对其亲属30人的饮食进行了一次调 查,并用下图所示的茎叶图表示30人的饮食指数.(说明:图 中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70 的人,饮食以肉类为主)
所以在犯错误的概率不超过 0.05 的前提下,认为“性别与态
度有关系”.
[类题通法] 根据题意列出 2×2 列联表,计算 K2 的观测值,如果 K2 的观测值很大,说明两个分类变量有关系的可能性很大; 如果 K2 的观测值比较小,则认为没有充分的证据显示两个 分类变量有关系.这需要给出正确的计算,避免计算失误.
[导入新知] 独立性检验的思想:要确定“两个分类变量有关系”这一 结论成立的可信程度,首先 假設結論不成立 ,即假设结论“两 个分类变量没有关系”成立.在该假设下我们构造的随机变量 K2 应该很小,如果由观测数据计算得到的 K2 观测值 k 很大, 那么在一定程度上说明假设不合理,根据随机变量 K2 的含义, 可以通过可信度表评价该假设不合理的程度,即“两个分类变 量有关系”的可信程度.
列聯表和等高條形圖的應用
[例 1] 某学校对高三学生作了一项调查,发现:在平时 的模拟考试中,性格内向的学生 426 人中有 332 人在考前心 情紧张,性格外向的学生 594 人中有 213 人在考前心情紧 张.作出等高条形图,利用图形判断考前心情紧张与性格类 别是否有关系.
[解] 作列联表如下:
[活学活用] 在一次天气恶劣的飞机航程中,调查了男女乘客在飞机上晕机
的情况:男乘客晕机的有 24 人,不晕机的有 31 人;女乘客晕
机的有 8 人,不晕机的有 26 人.请你根据所给数据判定:在
天气恶劣的飞机航程中,男乘客是否比女乘客更容易晕机?
附:
P(K2≥k0)
0.10
0.05
k0
2.706
3.848
[化解疑難] 1.2×2 列联表的特征
2.在列联表中,如果两个分类变量没有关系,则应满足 ad-bc≈0.因此|ad-bc|越小,说明两个分类变量之间的关系越 弱;|ad-bc|越大,说明两个分类变量之间的关系越强.
獨立性檢驗的思想
吸煙與患肺癌“列聯表”中,事件A表示不吸煙,B表示不患肺 癌. 問題1:事件A,B發生的頻率可求嗎? 提示:可以. 問題2:通常情況下,為研究問題方便,常用什麼近似於概率? 提示:頻率. 問題3:事件A,B無關有怎樣的概率公式? 提示:P(AB)=P(A)P(B).
∴要从 A 类工人中抽取 25 名, 从 B 类工人中抽取 75 名,(2 分)
∴x=25-8-3-2=12,y=75 -6-27-18=24.(4 分)
[名师批注] 要确定 x,y 的值,应先 确定 A 类工人及 B 类工 人中应各抽取多少人, 此处易误认为 x=25, y=75,从而导致解题 错误.
x1 x2 总计
y1 a c a+c
y2 b d b+d
总计 a+b c+d a+b+c+d
3.K2 统计量
为了使不同样本容量的数据有统一的评判标准,我们构造 nad-bc2
一个随机变量 K2= a+bc+da+cb+d ,其中 n= a+b+c+d 为样本容量.
4.独立性检验 利用随机变量 K2 来确定是否能以给定把握认为“兩個分 類變數有關系 ”的方法,称为两个分类变量独立性检验.
性格内向 性格外向 总计
考前心情紧张
332
考前心情不紧张
94
总计
426
213
545
381
475
594
1 020
相应的等高条形图如图所示:
图中阴影部分表示考前心情紧张与考前心情不紧张中 性格内向的比例.从图中可以看出考前心情紧张的样本中性 格内向占的比例比考前心情不紧张样本中性格内向占的比 例高,可以认为考前紧张与性格类型有关.
考查獨立性檢驗的原理
[例 2] 研究人员选取 170 名青年男女大学生为样本,
对他们进行一种心理测验.发现有 60 名女生对该心理测验
中的最后一个题目的反应是:作肯定的有 22 名,否定的有
38 名;男生 110 名在相同的项目上作肯定的有 22 名,否定
的有 88 名.问:性别与态度之间是否存在某种关系?用独
[化解疑难]
1.P(K2≥6.635)≈0.01 表明 H0 成立的概率很小,是小概率事 件,可以判断 H0 不成立,也就是“两个分类变量之间没有关系” 错误地判断为“两个分类变量之间有关系”的概率不超过 0.01,也 可以理解为“有 99%的把握认为两个分类变量之间有关系”.
2.利用独立性检验解决问题的基本步骤: (1)根据相关数据作列联表; (2)求 K2 的观测值; (3)与临界值作比较,得出结论.
相关文档
最新文档