独立性检验(上课)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(3)如果 k k0 ,就以(1 P(K 2 k0 )) 100%的把握认为“X
与Y有关系”;否则就说样本观测数据没有提供“X与Y有关系” 的充分证据。
在实际应用中,独立性检验临界值将给出:
P(K2 k0 )
k0
0.50 0.455
P(K2 k0 ) 0.05
k0
3.841
0.40 0.708
在H
成立的情况下能够出现这样的观测值的概率不超过0.01,
0
因此我们有99%的把握认为H
不成立,即有99%的把握认为“吸烟
0
与患肺癌有关系”。
探究学习
课堂讲练互动
独立性检验的定义
上面这种利用随机变量K2来确定在多大程度上 可以认为“两个分类变量有关系”的方法,称为两 个分类变量的独立性检验。
探究学习
探究学习
课堂讲练互动
【示例】 某小学对232名小学生调查中发现:180名男
生中有98名有多动症,另外82名没有多动症,52名
女生中有2名有多动症,另外50名没有多动症,用
独立性检验方法判断多动症与性别是否有关系?
解: 由题可列出如下列联表:
多动 无多动 总 k=23120×0×9183×2×501-802××58222



兴趣浓厚的
64
30
94
兴趣不浓厚 22

73
95
判断学生的总数计学成绩好坏86与对学习1数03学的兴18趣9 是否有关?
探究学习
课堂讲练互动
成绩优秀 成绩较差 总计
兴趣浓厚的
64
30
94
兴趣不浓厚的
22
73
95
总计
86
103
189
解 由公式得 K2 的观测值 k=189× 86×641×037×3-952×2×94302≈38.459.
0.25 1.323
0.15 2.072
0.10 0.05 0.025 0.010 0.005 0.001 2.706 3.841 5.024 6.635 7.879 10.828
K 2 6.635 K 2 2.706 K 2 2.706
1%把握认为A与B无关
99%把握认为A与B有关
10%把握认为A与B无关 90%把握认为A与B有关
探究学习
课堂讲练互动
回顾:
独立性检验的步骤:
1、写出列联表; 2、作出假设; 3、求出 K2 的值. 4、下结论(利用临界值的大小来判断假设是否成立).
探究学习
课堂讲练互动
题型 独立性的检验 【变式】 为研究学生的数学成绩与对学习数学的兴趣是否有关,
对某年级学生作调查得到如下数据:
成绩优 成绩较 总
没有充分的依据显示A与B有关,但也不能显示A与B无关
其中A:吸烟 ,B:患肺癌
探究学习
课堂讲练互动
思考
如果K
2

6.635,就断定H
不成立,这种判断出错的可能性有多大
0
?
答:判断出错的概率不超过0.01。
现在观测值k 9965(7775 49 42 2099)2 56.632太大了, 7817 2148987491
所以有 99.9%的把握认为多动症与性别有关系.
探究学习
课堂讲练互动
[29.86 [29.90 [29.94 [29.98 [30.02





29.90) 29.94) 29.98) 30.02) 30.06)
06 ,
30 .
10 ,
30 .
10) 14)
频 数
29
71
85
159
76 62 18
探究学习
课堂讲练互动
(1)试分别估计两个分厂生产的零件的优质品率; (2)由以上统计数据填下面2×2列联表,并问是否有99%的 把握认为“两个分厂生产的零件的质量有差异”.
探究学习
课堂讲练互动
(2) 甲厂 乙厂 总计
优质品 360 320 680 非优质品 140 180 320
总计 500 500 1 000
k=1 0005×003×605×001×806-803×203×201402≈7.353>6.635, 所以有 99%的把握认为“两个分厂生产的零件的质量有差异”.
吸烟与肺癌列联表
不患肺癌
患肺癌
总计
不吸烟
7775
42
7817
吸烟
2099
49
2148
总计
9874
91
9965
在不吸烟者中患肺癌的比重是 0.54% 在吸烟者中患肺癌的比重是 2.28%
说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患 肺癌的可能性大。
探究学习
课堂讲练互动
探究学习
课堂讲练互动
上面我们通过分析数据和图形,得到的直观印象是吸烟和 患肺癌有关,那么事实是否真的如此呢?这需要用统计观点 来考察这个问题。
[30.0 [30.1
[29.86 [29.90 [29.94 [29.98 [30.02

6, 0,





组 29.90) 29.94) 29.98) 30.02) 30.06) 30. 30.
10) 14)


12
63
86
182
92 61 4
探究学习
课堂讲练互动
乙厂
[30. [30.
分 组
总计 a+b c+d a+b+c+d
若“吸烟与患肺癌没有关系”,则吸烟样本中患肺 癌的比例应该与不吸烟患肺癌的比例差不多,即:
b d 即ad bc
ab cd
因此|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强。
探究学习
课堂讲练互动
独立性检验
1.2独立性检验的基本思想 及其初步应用
探究学习
课堂讲练互动
两种变量:
定量变量:体重、身高、温度、考试成绩等等。
变量 分类变量:性别、是否吸烟、是否患肺癌、

宗教信仰、国籍等等。
在日常生活中,我们常常关心分类变量之间是否有关系:
例如,吸烟是否与患肺癌有关系? 性别是否对于喜欢数学课程有影响?
k 9965(7775 49 42 2099)2 56.632 (2) 7817 2148987491
那么这个值到底能告诉我们什么呢?
探究学习
课堂讲练互动
独立性检验临界值表: 例题中,K 2 56.632
P(K2 k0 ) 0.50
k0 0.455
0.40 0.708
解:列出2×2列联表: 有兴趣 无兴趣 总计
理 文 总计 138 73 211 98 52 150 236 125 361
探究学习
课堂讲练互动
解 列出2×2列联表
总 理文

有兴 138 73 211

代入公式得 K2 的观测值
无兴
k=36123×6×13182×5×522-117×3×159082≈1趣.871×
甲乙总 厂厂计 优质品 非优质 品 总计
附:
K2=a+bnc+add-ab+cc2b+d,
P(K2≥k0) 0.05 0.01
k0
3.841 6.635
探究学习
课堂讲练互动
解:(1)甲厂抽查的产品中有 360 件优质品,从而甲厂生产的零件 的优质品率估计为356000=72%; 乙厂抽查的产品中有 320 件优质品,从而乙厂生产的零件的优质 品率估计为352000=64%.
为了使不同样本容量的数据有统一的评判标准,基于上述分 析,我们构造一个随机变量:
K2
n(ad bc)2
,
(a b)(c d )(a c)(b d )
(1)
其中n a b c d为样本容量。
若 H0成立,即“吸烟与患肺癌没有关系”,则K2应很小。
根据表3-7中的数据,利用公式(1)计算得到K2的观测值为:
98 10-4.
52
150
∵1.871×10-4<2.706,∴可以认总为计学生23选6 报12文5、3理61科与对外语的
兴趣无关.
探究学习
课堂讲练互动
题型 独立性检验的基本思想 【例】 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:
mm)的值落在(29.94,30.06)的零件为优质品.从两个分厂生产 的零件中各抽出500件,量其内径尺寸,结果如下表: 甲厂:
现在想要知道能够以多大的把握认为“吸烟与患肺癌有关”, 为此先假设
H0:吸烟与患肺癌没有关系.
把表中的数字用字母代替,得到如下用字母表示的列联表
பைடு நூலகம்
不患肺癌
患肺癌
总计
不吸烟
a
b
a+b
吸烟
c
d
c+d
总计
a+c
b+d
a+b+c+d
探究学习
课堂讲练互动
不吸烟 吸烟 总计
不患肺癌 a c a+c
患肺癌 b d b+d
课堂讲练互动
归纳:
一般地,假设有两个分类变量X和Y,它们的值域 分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2x2列 联表)为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
探究学习
课堂讲练互动
具体作法是:
(1)根据实际问题需要的可信程度确定临界值
k

0
(2)计算得到随机变量 K 2的观测值;
探究学习
课堂讲练互动
研究两个变量的相关关系:
定量变量——回归分析(画散点图、相关系数r、
变量

相关指数R2、残差分析)
分类变量—— 独立性检验
本节研究的是两个分类变量的独立性检验问题。
探究学习
课堂讲练互动
探究
列联表
为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机 地调查了9965人,得到如下结果(单位:人)
探究学习
课堂讲练互动
独立性检验临界值表:
P(K2 k0 ) 0.05
k0
3.841
0.025 5.024
0.010 6.636
0.005 7.879
0.001 10.828
且P(K2≥7.879)≈0.005即我们得到的K2的观测值k≈8.106超过7.879, 这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成立 的可能性小于0.005,即在犯错误的概率不超过0.005的前提下认为 “喜欢体育还是喜欢文娱与性别有关”.
∵38.459>10.828,∴有 99.9%的把握说学生学习数学的兴趣与数
学成绩是有关的.
探究学习
课堂讲练互动
【例】 为了探究学生选报文、理科是否与对外语的兴趣有关, 某同学调查了361名高二在校学生,调查结果如下:理科 对外语有兴趣的有138人,无兴趣的有98人,文科对外语 有兴趣的有73人,无兴趣的有52人.试分析学生选报文、 理科与对外语的兴趣是否有关?
体育 文娱 总计 男生 21 23 44 女生 6 29 35 总计 27 52 79
探究学习
课堂讲练互动
[思路探索] 可用数据计算 K2,再确定其中的具体关系. 解 判断方法如下: 假设 H0“喜欢体育还是喜欢文娱与性别没有关系”,若 H0 成立, 则 K2 应该很小. ∵a=21,b=23,c=6,d=29,n=79, ∴k=a+bcn+add-ab+cc2b+d =21+237×9×6+212×9×29-212+3×66×223+29≈8.106.



≈42.117>10.828. 男
生 98
82 180 所以有 0.1%的把握认为多动症


2
与性别有关系.
50
52
探究学习
课堂讲练互动
解:由题目数据列出如下列联表:
多动症 无多动症 总计
男生 98
82 180
女生 2
50
52
总计 100 由表中数据可得到:
132 232
k=23120×0×9183×2×501-802××58222≈42.117>10.828.
0.025 5.024
0.25 1.323
0.010 6.636
0.15 2.072
0.005 7.879
0.10 2.706
0.001 10.828
探究学习
课堂讲练互动
题型一 有关“相关的检验” 【例1】 某校对学生课外活动进行调查,结果整理成下表:
试用你所学过的知识进行分析,能否在犯错误的概率不超过 0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?
相关文档
最新文档