《独立性检验的基本思想及其初步应用》
3.2独立性检验的基本思想及其初步应用
0
a
b
c
d
a+c b+d
不吸烟
总计 a+b c+d a+b+c+d
不吸烟 吸烟 总计
不患肺癌 a c
a+c
患肺癌 b d
b+d
总计 a+b c+d a+b+c+d
患肺癌 不患肺癌
吸烟
(2)在二维条形图中,两个比例的值相差越大,H1成立的可 能性就越大
到如下结果:
类变量的频数表
不患肺癌 患肺癌 总计 比例
不吸烟 7775
42
7817 0.54%
吸烟
2099
49
2148 2.28%
总计
9874
91
9965
问:吸烟是否对患肺癌有影响?
解 从图表的比例可以看出:吸烟与不吸烟 可能对患肺癌的可能存在差异,我们再通 过不同的图表来分析
三维柱形图
不吸烟 吸烟 总计
3.2独立性检验的基 本思想及其初步应用
两种变量:
定量变量:体重、身高、温度、考试成绩等等。
变量 分类变量:性别、是否吸烟、是否患肺癌、
宗教信仰、国籍等等。
研究两个变量的相关关系:
定量变量——回归分析(画散点图、相关系数r、
变量
相关指数R2、残差分析)
分类变量—— 独立性检验
分类变量:变量的不同”值”表示个体所属 的不同类别.
患肺癌 b d
b+d
总计 a+b c+d a+b+c+d
独立性检验的基本思想及其初步应用高中数学人教A版选修PPT课件
a ≈ a + b×a + c nn n
其中n = a + b + c + d为样本容量,即
(a+b+c+d)a (a+b)(a+c),
即ad bc
因此|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强。
18
独立性检验
为了使不同样本容量的数据有统一的评判标准,基于上述分
甲生产线 97 3
100
乙生产线 95 5
100
总计
192 8
200
10
100 90 80 70 60 50 40 30 20 10 0 合格
不合格
合格
不合格
甲生产线 乙生产线
甲生产线 乙生产线
0
100
200
300
11
1 . 2×2 列 联 表 是 传 统 的 调 查 研 究 中 最 常 用的方法之一,用于研究两个变量之间相 互独立还是存在某种关联性,它适用于分 析两个变量之间的关系.
k
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
(1)如果k 10.828,就有99.9%的把握认为" X与Y有关系"
(2)如果k 7.879,就有99.5%的把握认为" X与Y有关系"
(3)如果k 6.635,就有99%的把握认为" X与Y有关系"
不成立,即有99%的把握认为“吸烟
0
与患肺癌有关系”。
20
判断H 0是否成立的规则
如果 k 6.635 ,就判断 H0 不成立,即认为吸烟与
《独立性检验的基本思想及其初步应用》PPT课件
0.05 3.841
0.025 5.024
0.010 0.005 6.635 7.879
0.001 10.828
K2的观测值为k
如果 k k0,就以 (1 P(K 2 k0 )) 100%的把握
认为“X与Y有关系”;而这种判断有可能出错,出
错的概率不会超过 P(K 2 k0 )。
7
例如 :
1如果k 10.828,就有99.9%把握认为" X与Y有
❖ 试用你所学过的知识进行分析,能否在犯错 误的概率不超过0.005的前提下,认为“喜欢 体育还是文娱与性别有关系”?
体育 文娱 总计
男生 21 23 44
女生 6 29 35
总计 27 52 79
16
[思路探索] 可用数据计算 K2,再确定其中的具体关系. 解 判断方法如下: 假设 H0“喜欢体育还是喜欢文娱与性别没有关系”,若 H0 成立, 则 K2 应该很小. ∵a=21,b=23,c=6,d=29,n=79, ∴k=a+bcn+add-ab+cc2b+d =21+237×9×6+212×9×29-212+3×66×223+29≈8.106.
12
例4:为研究不同的给药方式(口服与注射)和药的效果(有效 与无效)是否有关,进行了相应的抽样调查,调查的结果列 在表中,根据所选择的193个病人的数据,能否作出药的效果 和给药方式有关的结论?
口服 注射 合计
有效 58 64 122
无效 40 31 71
合计 98 95 193
P(k≥k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
1.2 独立性检验的基本思想及其初步应用
2.下列是一个2×2列联表:
y1
x1
a
x2
2
总计
b
则该表中a,b的值分别为( C )
A.94,96
B.52,50
y2
总计
21
73
25
27
46
100
C.52,54
解析:a=73-21=52,b=a+2=52+2=54.
D.54,52
——能力提升——
14.(5分)假设两个分类变量X与Y,它们的取值分别为{x1,x2},
样方法在校园内调查了 120 位学生,得到如下 2×2 列联表:
男 女 总计
爱好
a
b
73
不爱好
c
25
总计
74
则 a-b-c 等于( D )
A.6
B.7
C.8
D.9
13.(13分)某校为了了解学生对紧急避险常识的了解情况,从高 一年级和高二年级各选取100名同学参加紧急避险常识知识竞赛.图 ①和图②分别是对高一年级和高二年级参加竞赛的学生成绩按 [40,50),[50,60),[60,70),[70,80]分组后得到的频率分布直方图.
高二年级学生竞赛的平均成绩为(45×15+55×35+65×35+ 75×15)÷100=60(分).
(2)补全2×2列联表如下:
成绩小于60分 成绩不小于60
总计
的人数
分的人数
高一年级
70
30
100
高二年级
50
50
100
总计
120
80
200
∴K2的观测值k=20100×0×501×007×0-12500××83002≈8.333>7.879,
1.2独立性检验的基本思想及其初步应用课件人教新课标
类型二 由K2进行独立性检验 例2 对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病 人进行3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下 表所示.
心脏搭桥手术 血管清障手术
总计
又发作过心脏病 39 29 68
未发作过心脏病 总计
157
196
167
196
324
392
试根据上述数据比较这两种手术对病人又发作过心脏病的影响有没有差别. 解 假设病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术没 有关系,由表中数据得a=39,b=157,c=29,d=167,a+b=196,c +d=196,a+c=68,b+d=324,n=392, 由公式得K2的观测值
解答
达标检测
1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下列
联表:
喜欢程度
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
nad-bc2 由 K2=a+bc+da+cb+d算得,
110×40×30-20×202 k= 60×50×60×50 ≈7.8,
12345
附表:
12345
解析 答案
5.“全国文明城市”称号是最有价值的城市品牌,某市为创建第五届“全 国文明城市”,开展了“创建文明城市人人有责”活动.为了了解哪些人 更关注“创城”活动,随机抽取了年龄在10~70岁之间的100人进行调 查,并按年龄绘制如下频数散布表.
年龄(岁) [10,20) [20,30) [30,40) [40,50) [50,60) [60,70]
独立性检验的基本思想及其初步应用教学设计-【通用,经典教学资料】
3.2.1 《独立性检验的基本思想及其初步应用》教学设计【教学目标】1.知识与技能:通过对典型案例的探究,了解独立性检验的基本思想,会对两个分类变量进行独立性检验,明确独立性检验的基本步骤,并能解决实际问题。
2.过程与方法:通过设置问题,引导学生自主发现、合作探究、归纳展示、质疑对抗,使学生成为课堂主体。
3.情感、态度与价值观:通过本节课学习,让学生体会统计方法在决策中的作用;合作探究的学习过程,使学生感受发现、探索的乐趣及成功展示的成就感,培养学生学习数学知识的积极态度。
【教学重点】了解独立性检验的基本思想及实施步骤。
【教学难点】独立性检验的基本思想;随机变量2K的含义。
【学情分析】本节课是在学习了统计、回归分析的基本思想及初步应用后,利用独立性检验进一步分析两个分类变量之间是否有关系,为以后学习统计理论奠定基础。
【教学方式】多媒体辅助,合作探究式教学。
【教学过程】一、情境引入,提出问题请看视频:[设计意图说明]好的课堂情景引入,能激发学生的求知欲,是新问题能够顺利解决的前提之一。
问题1、你认为吸烟与患肺癌有关系吗?怎样用数学知识说明呢?[设计意图说明]提出问题,引导学生自主探究,指明方向,步步深入。
二、阅读教材,探究新知1.分类变量对于性别变量,其取值为男和女两种:[设计意图说明]利用图像向学生展示变量的不同取值,更加形象的表示分类变量的概念。
这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量。
生活中有很多这样的分类变量如:是否吸烟宗教信仰国籍民族……2.列联表为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果:表3—7 吸烟与患肺癌列联表单位:人不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965究每个分类变量只取两个值,这样的列联表称为22 列联表)。
问题1、吸烟与患肺癌有关系吗?由以上列联表,我们估计①在不吸烟者中患肺癌的比例为________;②在吸烟者中患肺癌的比例为。
独立性检验的基本思想及其初步应用
§3.2独立性检验的基本思想及其初步应用学习目标 1.了解独立性检验的基本思想、方法及其简单应用.2.理解判断两个分类变量是否有关系的常用方法、独立性检验中K2的含义及其实施步骤(重、难点).知识点1两个分类变量之间关联关系的定性分析1.分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.这里的“变量”和“值”都应作为“广义”的变量和值进行理解,它们取的不一定是具体的数值.2.列联表列出的两个分类变量的频数表,称为列联表.假设两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为2×2列联表)为:y1y2总计x1 a b a+bx2 c d c+d总计a+c b+d a+b+c+d3.两个分类变量之间关联关系的定性分析的方法(1)频率分析法:通过对样本的每个分类变量的不同类别事件发生的频率大小进行比较来分析分类变量之间是否有关联关系.通常通过列联表列出两个分类变量的频数表来进行分析.(2)图形分析法:与表格相比,图形更能直观地反映出两个分类变量间是否互相影响,常用等高条形图展示列联表数据的频率特征.【预习评价】(1)下面是一个2×2列联表:y1y2总计x1 a 2173x282533总计 b 46则表中a,b处的值分别为()A.94,96B.52,50C.52,60D.54,52(2)根据如图所示的等高条形图可知吸烟与患肺病关系(填“有”或“没有”).知识点2独立性检验1.定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.2.K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.3.独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.(2)利用公式计算随机变量K2的观测值k.(3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.【预习评价】(1)在吸烟与患肺病这两个分类变量是否相关的判断中,下列说法中正确的是()①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在在犯错误的概率不超过0.01前提下,认为吸烟与患肺病有关系时,我们说若某人吸烟,则他有99%的可能患有肺病;③从统计量中得知在犯错误的概率不超过0.05的前提下认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.A.①B.①③C.③D.②(2)某班主任对全班50名学生进行了作业量的调查,数据如下表:认为作业量大认为作业量不大总计男生18927女生81523总计262450则推断“学生的性别与认为作业量大有关”这种推断犯错误的概率不超过()A.0.01B.0.005C.0.025D.0.001题型一利用等高条形图判断两个分类变量是否有关系【例1】为考察某种药物预防疾病的效果进行动物试验,得到如下列联表:患病未患病总计服用药104555未服用药203050总计3075105试用等高条形图分析服用药和患病之间是否有关系.规律方法(1)本题采用数形结合法通过条形图直观地看出差异,得出结论. (2)应用等高条形图判断两变量是否相关的方法在等高条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例aa+b,也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例cc+d.“两个比例的值相差越大,H1成立的可能性就越大.”【训练1】网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.利用图形判断学生经常上网与学习成绩有关吗?方向1 有关“相关的检验”【例2-1】某校对学生课外活动进行调查,结果整理成下表:用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?方向2有关“无关的检验”【例2-2】为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.分析学生选报文、理科与对外语的兴趣是否有关?规律方法(1)独立性检验的关注点在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0,因此|ad -bc|越小,关系越弱;|ad-bc|越大,关系越强.(2)独立性检验的具体做法①根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误的概率的上界α,然后查表确定临界值k0.②利用公式K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)计算随机变量K2的观测值k.③如果k>k0,推断“X与Y有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”.【训练2】打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的数据:根据独立性检验,能否在犯错误的概率不超过0.001的前提下认为每一晚都打鼾与患心脏病有关系?题型三独立性检验的综合应用【例3】某高校共有学生15 000人,其中男生10 500人,女生4 500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间(单位:时)的样本数据.(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图),其中样本数据的分组区间为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否认为“该校学生的每周平均体育运动时间与性别有关”.附:P(K2≥k0)0.1000.0500.0100.005k0 2.706 3.841 6.6357.879K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).规律方法(1)解答此类题目的关键在于正确利用K2=n(ad-bc)2计算k的值,再用它与临界值k0的大小作比(a+b)(c+d)(a+c)(b+d)较来判断假设检验是否成立,从而使问题得到解决.(2)此类题目规律性强,解题比较格式化,填表计算分析比较即可,要熟悉其计算流程,不难理解掌握.【训练3】某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分成绩优秀的人数如下表所示,能否在犯错误的概率不超过0.001的前提下认为数学成绩优秀与物理、化学、总分成绩优秀有关系?物理优秀化学优秀总分优秀数学优秀228225267数学非优秀14315699注:该年级在此次考试中数学成绩优秀的有360人,非优秀的有880人.课堂达标1.观察下列各图,其中两个分类变量x,y之间关系最强的是()2.某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下2×2列联表:偏爱蔬菜 偏爱肉类 总计50岁以下 4 8 12 50岁以上 16 2 18 总计201030则可以说其亲属的饮食习惯与年龄有关的把握为( ) A.90%B.95%C.99%D.99.9%3.为了判断高中学生的文理科选修是否与性别有关系,随机调查了50名学生,得到如下2×2列联表:理科 文科 男 13 10 女720已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到K 2的观测值k =50×(13×20-10×7)223×27×20×30≈4.844.可认为选修文理科与性别有关系的可能性不低于 . 4.根据下表计算:不看电视 看电视 男 37 85 女35143K 2的观测值k ≈ (保留3位小数).5.在109个人身上试验某种药物预防感冒的作用,得到如下列联表:感冒 未感冒 总计 服用药1146 57 未服用药 213152总计3277109则有多大把握认为该药有效?课堂小结1.列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有关联关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有关联关系.2.对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没有关系”成立,计算随机变量K2的值,如果K2值很大,说明假设不合理.K2越大,两个分类变量有关系的可能性越大.基础过关1.对两个分类变量A,B的下列说法中正确的个数为()①A与B无关,即A与B互不影响;②A与B关系越密切,则K2的值就越大;③K2的大小是判定A与B是否相关的唯一依据A.0B.1C.2D.32.高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人数后,得到如下列联表:优秀及格总计甲班113445乙班83745总计197190则随机变量K2的观测值约为()A.0.600B.0.828C.2.712D.6.0043.考察棉花种子经过处理跟生病之间的关系得到下表数据:种子处理种子未处理总计根据以上数据,可得出()A.种子是否经过处理跟是否生病有关B.种子是否经过处理跟是否生病无关C.种子是否经过处理决定是否生病D.以上都是错误的4.2013年6月11日,中国的“神舟十号”发射成功,由此许多人认为中国进入了航天强国之列,也有许多人持反对意见,为此进行了调查.在参加调查的3 648名男性公民与3 432名女性公民中,持反对意见的男性有1 843人、女性有1 672人,在运用这些数据说明中国“神十”发射成功是否与中国进入航天强国有关系时,用下列最具说服力.①回归直线方程;②平均数与方差;③独立性检验.5.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是(填序号).①没有充足的理由认为课外阅读量大与作文成绩优秀有关;②有0.5%的把握认为课外阅读量大与作文成绩优秀有关;③有99.9%的把握认为课外阅读量大与作文成绩优秀有关;④有99.5%的把握认为课外阅读量大与作文成绩优秀有关.6.在研究某种药物对“H1N1”病毒的治疗效果时,进行动物试验,得到以下数据,对150只动物服用药物,其中132只动物存活,18只动物死亡,对照组150只动物进行常规治疗,其中114只动物存活,36只动物死亡.(1)根据以上数据建立一个2×2列联表;(2)试问该种药物对治疗“H1N1”病毒是否有效?7.在一次恶劣天气的飞行航程中调查男女乘客在飞机上晕机的情况如下表所示,根据此资料是否能在犯错误的概率不超过0.05的前提下认为在恶劣天气飞行中男人比女人更容易晕机?能力提升8.利用独立性检验来考察两个分类变量X和Y是否有关系时,通过查阅下表来确定“X与Y有关系”的可信程度.如果K2≥5.024,那么就有把握认为“X与Y有关系”的百分比为()A.25%B.75%C.2.5%D.97.5%9.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1表2表3表4A.成绩B.视力C.智商D.阅读量10.下表是关于男婴与女婴出生时间调查的列联表:那么,A=,B=,C=,D=,E=.11.在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是(填序号).①若K2的观测值k=6.635,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;②由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;③由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.12.随着生活水平的提高,人们的休闲方式也发生了变化.某机构随机调查了n 个人,其中男性占调查人数的25.已知男性中有一半的人的休闲方式是运动,而女性中只有13的人的休闲方式是运动. (1)完成下列2×2列联表:(2)若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,那么本次被调查的人数至少有多少?(3)根据(2)的结论,本次被调查的人中,至少有多少人的休闲方式是运动? 13.(选做题)某学校为了解该校高三年级学生在市一练考试的数学成绩情况,随机从该校高三文科与理科各抽取50名学生的数学成绩,作出频率分布直方图如图,规定考试成绩在[120,150]内为优秀.(1)由以上频率分布直方图填写下列2×2列联表.若按是否优秀来判断,是否有99%的把握认为该校的文理科数学成绩有差异.文科理科总计优秀非优秀总计5050100(2)某高校派出2名教授对该校随机抽取的学生成绩中一练数学成绩在140分以上的学生进行自主招生面试,每位教授至少面试一人,每位学生只能被一位教授面试.若甲教授面试的学生人数为ξ,求ξ的分布列和均值.。
独立性检验的基本思想及其初步应用参考模板范本
反证法原理与独立性检验原理
反证法原理:
在一个已知假设 下,如果推出一 个矛盾,就证明 了这个假设不成 立。
独立性检验原理:
在一个已知假设下, 如果一个与该假设 矛盾的小概率事件 发生,就推断这个 假设不成立。
患肺癌 42 0.54% 49 2.28% 91
总计 7817 2148 9965
100%
90%
等
80%
高
70%
条
60%
形
50%
图
40%
30%
20%10%0%源自不吸烟吸烟患肺癌 不患肺癌
不吸烟
吸烟 总计
不患肺癌 a
c a+c
患肺癌 b
d b+d
总计 a+b
c+d a+b+c+d
问3:a、b、c、d应该满足怎样的关系?
高二数学 选修 2-3
第三章 统计案例
3.2
独立性检验的
基本思想及其初步应用
视频
问题1 心脏病、肺癌、脑血管病等都与吸烟有关, 吸烟已成为继高血压之后的第二号全球杀手。 这些疾病与吸烟有关的结论是怎样得出的呢?
案 例:某肿瘤研究所为了研究吸烟是否对患肺癌 有影响,进行了一次随机抽样调查,共调查了9965 个成年人,其中吸烟者2148人,不吸烟者7817人。 调查结果如下表所示:
解:列出吸烟与是否患肺癌的2x2列联表如下
不吸烟 吸烟 总计
不患病 7775 2099 9874
患病 42 49 91
总计 7817 2148 9965
数学课堂探究:独立性检验的基本思想及其初步应用
课堂探究探究一列联表与等高条形图利用数形结合的思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法之一.一般地,在等高条形图中,aa+b与错误!相差越大,两个分类变量有关系的可能性就越大.在作等高条形图时可以用列联表来寻找相关数据,作图要精确,且易于观察,以便对结论的判断不出现偏差.【典型例题1】研究人员选取170名青年男女大学生对他们进行一种心理测验.发现60名女生对该心理测验中的最后一个题目的反应是:作肯定的有18名,否定的有42名.110名男生在相同的题目上作肯定的有22名,否定的有88名.试判断性别与态度之间是否有关系.思路分析:通过阅读理解得出列联表,画出相应的条形图,得到变量的关联性.解:根据题目所给数据建立如下列联表:比较来看,女生中肯定的人数的比例要高于男生中肯定的人数的比例,因此可以在某种程度上认为性别与态度之间有关系.点评大致判断一下两个分类变量是否有关,可以借助等高条形图,这种判断可加深对独立性检验基本思想的理解.探究二独立性检验解决一般的独立性检验问题,首先由所给的2×2列联表确定a,b,c,d,n的值,然后代入随机变量的计算公式求出观测值k,将k 与临界值k0进行对比,确定有多大的把握认为两个分类变量有关系.【典型例题2】为了探究患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如下表所示:50思路分析:求出观测值k,对照临界值即可得出结论.解:由2×2列联表可知:a=43,b=162,c=13,d=121,a+b=205,c+d=134,a+c=56,b+d=283,n=a+b+c+d =339,代入公式得K2的观测值为k=错误!≈7。
469。
由于7.469>6.635,所以在犯错误的概率不超过1%的前提下认为50岁以上的人患慢性气管炎与吸烟有关系.规律小结解决一般的独立性检验问题的步骤:(1)通过列联表确定a,b,c,d,n的值,根据实际问题需要的可信程度确定临界值k0;(2)利用K 2=()()()2 ()()n ad bc a b c d a c b d ++++-求出K 2的观测值k ;(3)如果k ≥k 0,就推断“两个分类变量有关系",这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”.探究三 独立性检验的综合应用1.独立性检验类似于数学中的反证法,要确认“两个变量有关系”这一结论成立的可信度,首先假设结论不成立,在假设下,我们构造的统计量K 2应该很小.如果由观测数据计算得到的K 2值很大,则在一定程度上说明假设不合理,再根据不合理的程度与临界值的相关关系作出判断.2.统计的基本思维模式是归纳,它的特征之一是通过部分数据的性质来推测全部数据的性质,因此,统计推断是可能犯错误的,即从数据上体现的只是统计关系,而不是因果关系.【典型例题3】为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件.试分别用列联表、独立性检验的方法分析监督员甲对产品质量好坏有无影响.能否在犯错误的概率不超过0。
32独立性检验的基本思想及其初步应用精品文档
由公式计算得 K2 的观测值 k=2 428000××18702×0×8010-00902×0×1 2400002≈205.22. ………10 分 因为 205.22>10.828,因此在犯错误的概率不超过 0.001 的前提下认为实施西部开发战略的公布对应届大学毕业生 的选择产生了影响. …………………………………………………………12 分
≈325.635.
因为 325.635>6.635,因此,在犯错误的概率不超过 0.01
的前提下认为官员在经济上是否清廉与他们寿命的长短之
间是有关系的.
工具
第三章 统计案例
工具
第三章 统计案例
(2019·湖南高考)通过随机询问110名性别不同的大学生是否 爱好某项运动,得到如下的列联表:
男 女 总计
肠道中有寄生 虫
肠道中没有寄生 虫
合计
每晚都磨牙
224
30
254
不磨牙
24
1 355
1 379
合计
248
1 385
1 633
工具
第三章 统计案例
解析: 根据题意计算得 K2=a+bcn+add-ab+cc2b+d
=1
633×224×1 355-30×242 254×1 379×248×1 385
成绩不小于90分 70 75 145
合计 100 100 200
据此资料是否认为男生比女生成绩差.
工具
第三章 统计案例
工具
第三章 统计案例
[解题过程] 根据列联表中数据,由公式计算得 K2=20505××3104×5×751-002×5×107002≈0.627 ∵0.627<2.706,所以据目前的数据不能认为男生比女 生成绩差,即没理由说男生比女生成绩差.
独立性检验的基本思想及其初步应用 课件
1.分类变量和列联表 (1)分类变量 变量的不同“值”表示个体所属的 不同类别 ,像这样的 变量称为分类变量. (2)列联表 ①定义:两个分类变量的 频数表 称为列联表.
②2×2 列联表
一般地,假设两个分类变量 X 和 Y,它们的取值分别为 {x1,x2} 和{y1,y2},其样本频数列联表(也称为 2×2 列联表)
4.在独立性检验中,设 K2 的观测值为 k,当 k> 3.841 时, 有 95%的把握说事件 A 与 B 有关;当 k> 6.635 时;有 99%的 把握说事件 A 与 B 有关;当 k≥10.828 时,有 99.9%的把握认 为 A 与 B 有关;当 k≤ 3.841 时,认为 事件 A 与 B 是无关的.
[解析] 按照独立性检验的基本步骤,假设票价上浮后游 客人数与所处地区没有关系.
因为 K2 的观测值 k= 76454×24194×073×39260×652-73288×424×90173312≈30.35>6.635. 所以在犯错误的概率不超过 0.01 的前提下认为票价上浮 后游客人数与所处地区有关系.
独立性检验的应用
在调查的 480 名男人中有 38 名患有色盲,520 名 女人中有 6 名患有色盲,通过图形判断色盲与性别是否有关.利 用独立性检验判断,是否能够以 99.9%的把握认为“色盲与性别 有关系”.你所得到的结论在什么范围内有效?
[分析] 依据独立性检验的步骤,应先作出 2×2 列联表, 计算 K2 的观测值 k,查表作出推断并确定这种推断犯错误的概 率
等高条形图的应用
从发生交通事故的司机中抽取 2000 名司机作随 机样本,根据他们血液中是否含有酒精以及他们是否对事故负有 责任将数据整理如下:
独立性检验的基本思想及初步应用教案
独立性检验的基本思想及初步应用一、教学目标1. 让学生理解独立性检验的基本思想,掌握独立性检验的步骤和应用。
2. 培养学生运用独立性检验解决实际问题的能力,提高学生的数据分析素养。
3. 引导学生运用数学软件或计算器进行独立性检验,培养学生的操作能力。
二、教学内容1. 独立性检验的基本思想(1)理解独立性检验的定义和作用。
(2)掌握独立性检验的基本步骤:提出假设、构造检验统计量、确定显著性水平、计算临界值、做出结论。
2. 独立性检验的初步应用(1)学会运用独立性检验解决实际问题,如判断两个分类变量是否独立。
(2)学会运用数学软件或计算器进行独立性检验,提高数据分析能力。
三、教学重点与难点1. 教学重点:(1)独立性检验的基本思想及步骤。
(2)独立性检验在实际问题中的应用。
(3)运用数学软件或计算器进行独立性检验。
2. 教学难点:(1)独立性检验步骤中构造检验统计量的方法。
(2)如何正确选择显著性水平。
四、教学方法与手段1. 教学方法:(1)讲授法:讲解独立性检验的基本思想和步骤。
(2)案例教学法:分析实际问题,引导学生运用独立性检验。
(3)实践操作法:让学生运用数学软件或计算器进行独立性检验。
2. 教学手段:(1)多媒体课件:展示独立性检验的基本思想和步骤。
(2)数学软件或计算器:让学生进行实际操作。
五、教学过程1. 导入新课:通过一个实际问题引入独立性检验的概念,激发学生的兴趣。
2. 讲解独立性检验的基本思想:讲解独立性检验的定义、作用和基本步骤,让学生理解独立性检验的基本思想。
3. 案例分析:分析一个实际问题,引导学生运用独立性检验,体会独立性检验在解决实际问题中的应用。
4. 实践操作:让学生运用数学软件或计算器进行独立性检验,培养学生的操作能力。
5. 总结与反思:总结本节课的主要内容,让学生巩固所学知识,并思考如何更好地运用独立性检验解决实际问题。
六、教学拓展1. 引导学生探讨独立性检验在实际应用中的局限性,如样本量对检验结果的影响。
独立性检验的基本思想及初步应用【公开课教学PPT课件】
喜欢(A1)
154 234 494
不喜欢(A2)
340 193 427
总计
533 388 921
问题六:在喜欢该节目和性别的例子中,请根据卡方
的值,并结合临界值表,说说你得到了什么结论
和启发?
2 52.441
P( 2 k) 0.50 0.40 0.5 0.15 0.10 0.05 0.025 0.010 0.005 0.001
喜欢参加体育锻炼 不喜欢参加体育锻炼
男
197
48
女
135
120
试问:高中生是否喜欢参加体育锻炼和性别之间有关系吗?
P( 2 k) 0.50 0.40 0.5 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 0.445 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
2 10.828 的概率只有千分之一,这是一个小概率事件, 几乎不可能发生.
如果根据某次统计数据出现了 2 10.828 —— 一个几 乎不可能发生的小概率事件发生了,说明A与B相互独立 这一假设成立的可能性非常小——只有0.1%,即就是说 我们有1-0.1%=99.9%的把握判定A与B有关联.当然我们做 出A与B有关联这样的判断也会出错,但出错的概率不超 过0.1% .我们把这种检验方法称为假设检验法。
总计
我们假设喜欢该节目与性别是独立的,即性别不影响是否喜 欢该节目.男根生据(B直1)观经验1,54我们把男生34中0 喜欢该节5目33的人所占
百分比,与女生女(生B2中) 喜欢该23节4 目的人所1占93百分比作比38较8 .也就意
味着,无论喜欢与否,喜欢的人所占百分比应是基本一样的.
独立性检验的基本思想及其初步应用》
独立性检验的基本思想及其初步应用》生更加直观地理解两个分类变量之间的关系。
问题2:根据三维柱形图和二维条形图,你能否看出吸烟者和不吸烟者患肺癌的比例有何不同?二、独立性检验的基本思想1、独立性检验的基本思想:独立性检验是用来检验两个分类变量是否有关系的一种统计方法。
如果两个分类变量是独立的,那么它们之间是没有关系的;如果两个分类变量不独立,则它们之间是有关系的。
2、独立性检验的步骤:1)列出列联表;2)计算期望频数;3)计算卡方值;4)查表得出显著性水平;5)判断两个分类变量是否有关系。
三、K2检验的计算公式1、K2检验的计算公式:K2=∑(Oi-Ei)²/Ei其中,Oi为观察频数,Ei为期望频数。
2、K2检验的含义:K2检验的值越大,观察频数与期望频数的差距越大,两个分类变量之间的关系就越显著。
四、独立性检验的应用举例1、应用举例:1)医学研究:调查吸烟是否对患肺癌有影响;2)社会调查:调查男女是否对某一品牌的喜好程度有影响;3)市场调查:调查年龄与消费金额是否有关系。
2、独立性检验的应用:通过独立性检验,可以判断两个分类变量是否有关系,从而为我们提供科学的依据,进行合理的决策。
教学反思:本节课通过生动的例子和图表,引入了独立性检验的基本概念和思想。
通过对K2检验公式的介绍,让学生了解了如何计算卡方值。
同时,通过应用举例,让学生了解了独立性检验的实际应用。
在教学过程中,教师注重启发学生的思维,让学生在合作探究中主动掌握知识,达到了预期的教学目标。
练1、在某医院,665名男性病人中,214人秃顶,而在772名非心脏病男性病人中,175人秃顶。
能否以99%的置信度认为“秃顶与患心脏病”有关系?思考1、为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别。
是否需要志愿者需要。
不需要男性。
30.170女性。
373.271)估计该地区老年人中需要志愿者提供帮助的比例;2)能否以99%的置信度认为该地区的老年人是否需要志愿者提供帮助与性别有关系?思考2、某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2列联表,根据列联表的数据,能否以95%的置信度认为该学校15至16周岁的男生的身高和体重之间有关系?课后作业:课本第18页第1题和第2题。
《独立性检验的基本思想及其初步应用》教学设计
《独立性检验》教学设计一、教学目标1、知识与技能:通过典型案例的探究,了解独立性检验的基本思想,会对两个分类变量进行独立性检验,明确独立性检验的基本步骤,并能利用独立性检验的基本思想来解决实际问题.2、过程与方法:通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题。
通过列联表、等高条形图,使学生直观感觉到吸烟和患肺癌可能有关系.这一直觉来自于观测数据,即样本.问题是这种来自于样本的印象能够在多大程度上代表总体?这节课就是为了解决这个问题,让学生亲身体验直观感受的基础上,提高学生的数据分析能力.3、情感态度价值观:通过本节课的学习,加强数学与现实生活的联系。
以科学的态度评价两个分类变量有关系的可能性。
培养学生运用所学知识,解决实际问题的能力。
对问题的自主探究,提高学生独立思考问题的能力;让学生对统计方法有更深刻的认识,体会统计方法应用的广泛性,进一步体会科学的严谨性。
教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性。
二、教学重点理解独立性检验的基本思想及实施步骤.三、教学难点1.了解独立性检验的基本思想;2.了解随机变量2χ的含义,2χ的观测值很大,就认为两个分类变量是有关系的。
四、教学方法以“问题串”的形式,层层设疑,诱思探究。
用“讲授法”,循序渐进,引导学生,步步为营,螺蜁上升探究本节课的知识内容.五、教学过程设计案例:某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人。
问题1、我们在研究“吸烟与呼吸道疾病的关系”时,需要关注数据分析:吸烟与不吸烟,患病的可能性的大小是否有差异?频率列联表:频率估计概率通过图形直观判断解决问题:直观方法吸烟的患病率37/220 ≈16.82%不吸烟的患病率21/295 ≈7.12%根据统计分析的思想,用频率估计概率可知,吸烟者与不吸烟者患病的可能性存在差异思考:1,差异大到什么程度才能做出“患病与吸烟有关”判断呢?2,能否用数量来刻画“有关”程度?一般化: 患病未患病总计吸烟 a b a b + 不吸烟 c d c d +总计a c +b d + a bcd +++问题的数学表述:“患呼吸道疾病与吸烟有关”这句话是什么意思? “某人吸烟”记为事件A,“某人患病”记为事件B 这句话的意思是:事件A 与事件B 有关。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
教学设计说明
黑龙江省牡丹江市第一高级中学张宁
1-人教A版
教材:普通高中课程标准实验教科书数学选修2
章节:2.1独立性检验的基本思想及其初步应用
一、授课内容的数学本质
在《数学3(必修)》概率统计内容的基础上,通过典型案例介绍独立性检验的基本思想、方法及其初步应用,使学生认识统计方法在决策中的作用。
章引言首先提出了现实中经常遇到的问题,比如肺癌是严重威胁人类生命的一种疾病,吸烟与患肺癌有关系吗?等等。
现实中类似的问题大量存在,如何得出准确的推断,这就需要科学的方法,独立性检验就是其中一种常用的统计方法。
教科书通过探究“吸烟是否与患肺癌有关系”引出了独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟人中患肺癌的比例比不吸烟人中患肺癌的比例要高,使学生直观感觉到吸烟和患肺癌可能有关系。
“吸烟与患肺癌有关”这一直觉来自于观测数据,即样本。
问题是这种来自于样本的印象能够在多大程度上代表总体?来自于样本的结论“吸烟与患肺癌有关”能够推广到总体吗?为了回答这个问题,就必须借助于统计理论来分析。
在统计学中,独立性检验就是检验两个分类变量是否有关系的一种统计方法。
二、教学目标分析
【知识与技能】
1、了解独立性检验的基本思想、方法及初步应用。
⨯列联表)、柱形图、条形图直观分析两个分类变量是否有关。
2、会从列联表(只要求22
K公式判断两个分类变量在某种可信程度上的相关性。
3、会用2
【过程与方法】
运用数形结合的方法,借助对典型案例的探究,来了解独立性检验的基本思想,总结独立性检验的基本步骤。
【情感、态度与价值观】
1、通过本节课的学习,让学生感受数学与现实生活的联系,体会独立性检验的基本思想在解决日常
生活问题中的作用。
2、培养学生运用所学知识,依据独立性检验的思想作出合理推断的实事求是的好习惯。
三、教学问题诊断
在独立性检验中,教科书通过典型案例“吸烟是否与患肺癌有关系”的研究,介绍了独立性检验的基本思想、方法和初步应用。
独立性检验的步骤是固定的,仿照教科书的例题,学生不难完成习题,但独立性检验的思想对学生来说是比较难理解的,教学中如何结合例子介绍独立性检验的思想,才能使得学生很好的理解是一个教学难点。
那么,在教学过程中,采用了与反证法做类比,帮助学生理解独立性检验的思想。
两者都是先假设结论不成立,然后根据是否能够推出“矛盾”来断定结论是否成立。
但二者“矛盾”的含义不同,反证法中的“矛盾”是指一种不符合逻辑事情的发生;而独立性检验中的“矛盾”是指一种不符合逻辑的小概率事件的发生,即在结论不成立的假设下,推出有利于结论成立的小概率事件发生。
我们知道,小概率事件在一次试验中通常是不会发生的,因此认为结论在很大的程度上是成立的。
这样做了
类比后,可以很好的帮助理解独立性检验的基本思想。
四、教法特点及预期效果分析
精心设计课堂环节,共同实现师生互动。
在设计本节课的时候,我是从以下几个方面入手的。
1、创设情境,导入新课
通过对典型案例“吸烟是否对患肺癌有影响?”的提出,联系生活,引起共鸣,激发学生的学习兴趣。
从生活的实例出发,让学生充分体会数学与实际生活的联系,从而使得本节知识的形成更自然、更生动。
先介绍分类变量、列联表的概念。
对于问题1的设计,是想让学生通过对列联表中数据的观察和计算,得出结论,吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者中患肺癌的可能性大。
将列联表中的数据输入到Excel 表格中,将数据呈现到图形上,用计算机演示三维柱形图和二维条形图,让生观察图形,总结可以得出什么样的结论?用多种统计图使学生直观感觉两个分类变量是否有关系,然后再进行检验。
提出问题:是否能够以一定的把握认为“吸烟与患肺癌有关系”呢? 设置问题,引发学生的思考,激发学生的求知欲望。
2、合作探究,收获新知
通过用字母表示的列联表:
表
在假设0:“吸烟与患肺癌没有关系”的基础上。
引导学生得出bc ad ≈。
因此,bc ad -越小,说明吸烟与患肺癌之间关系越弱;bc ad -越大,说明吸烟与患肺癌之间关系越强。
(上述结论由生思考后回答。
) 师:介绍统计学中有这样一个公式
构造一个随机变量 ()()()()()
2
2
n ad bc K a b c d a c b d -=++++ (1)
(其中n a b c d =+++为样本容量。
)
学生得出结论:若0H 成立,即“吸烟与患肺癌没有关系”,则2
K 应该很小。
根据表1中的数据,利用公式(1)计算得到2
K 的观测值为
632.5691
987421487817)209942497775(99652≈⨯⨯⨯⨯-⨯=k
这个值到底能告诉我们什么呢?
统计学家经过研究后发现,在0H 成立的情况下,
2( 6.635)0.01P K ≥≈ (2)
对于问题2的设计,目的是让学生理解,在0H 成立的情况下,635.62
≥K 的发生的概率非常小,
是一个小概率事件。
对于问题3的设计,学生讨论的很激烈,经过同学互相点评以及教师的适时引导,学生慢慢理解了
H出现了问题,因此认为结论在很大的程度上是成立的。
当小概率事件发生时,一般认为是假设的
将独立性检验和反证法作类比,加深学生对独立性检验思想的理解。
学生活动:分组进行讨论,而后让学生总结二者的区别和联系,培养学生学会用联系的观点看问题。
介绍临界值表,教学生学会运用临界值表。
总结独立性检验的基本步骤。
3、课堂练习,夯实基础
课上到这里,学生已掌握了独立性检验的基本步骤,练习就是进一步巩固所学知识,运用其来解决实际问题。
4、课堂小结,感悟提高
学生进行思考后,对本节课所学知识进行梳理,教师再进行补充概括。
让本节课所学的知识在学生的感悟中得以升华。
5、课后作业,学以致用
效果分析:本节课通过对典型案例的探究,学生理解了独立性检验的基本思想及其具体实施步骤。
让学生从中初步体会了数学与实际生活的联系,以及怎样运用所学知识去解决实际生活中的问题。
本节课通过对几个问题的设置,经过学生之间的讨论、互评,教师的引导帮助,使得本节课的难点得以突破。
学生通过总结也完善了自己的认知结构,从而对该部分得知识也有了更深的体会。
我在课堂上注重学生的主体参与,努力创设教师引导下的学生自主探究、合作交流的学习方式。
通过课堂练习,看到学生基本上能掌握用独立性检验思想解决实际问题,课前制定的教学目标基本实现。
通过反思,才能进步,我觉得课前预设与课堂生成相结合,才是符合新课程理念的对学生发展最为有利的教法。
非常感谢主办单位为我们年轻教师的成长提供了这样一个平台,我会在今后努力工作,使自己快速的成长起来,也希望各位专家,评委和同行们批评指正,谢谢!
黑龙江省牡丹江市第一高级中学张宁
2010.9.19。