最新人教版高中数学选修1-2《独立性检验的基本思想及其初步应用》教材梳理
人教版高中数学选修(1-2)-1.2《独立性检验的基本思想及其初步应用》教学课件3
|ad-bc|越大,说明两个分类变量 x、y 之间的关系越强.
研一研·问题探究、课堂更高效
§ 1.2
问题 3 等高条形图对分析两个分类变量是否有关系,有何 帮助? 答 通过画等高条形图,我们可以直观观察两个变量的比例 关系,判断两个变量是否有关系.
本 课 时 栏 目 开 关
研一研·问题探究、课堂更高效
不吸烟者中患病的比例相比有很大的差异,故“患呼吸道疾病
本 课
与吸烟可能有关”.
时 栏
(2)画出等高条形图如下:
目
开
关
通过上面的等高条形图可以直观看出,吸烟者中患病的比例与 不吸烟者中患病的比例相比有很大的差异,故“患呼吸道疾病 与吸烟可能有关”.
研一研·问题探究、课堂更高效
§ 1.2
小结 利用数形结合的思想,借助等高条形图来判断两个分类
开
关
填一填·知识要点、记下疑难点
§ 1.2
3. 等高条形图
(1)等高条形图与表格相比,更能直观地反映出两个分类变
本 课
量间是否 相互影响 ,常用等高条形图展示列联表数据的
时 栏
频率特征 .
目 开 关
(2)观察等高条形图发现a+a b和c+c d相差很大,就判断两个分
类变量之间 有关系 .
研一研·问题探究、课堂更高效
问题 1 举例说明什么是分类变量?
答 变量的不同“值”表示个体所属的不同类别的变量称为
本 课
分类变量,分类变量的取值一定是离散的,而且不同的取值
时 栏
仅表示个体所属的类别,如性别变量,只取男、女两个值,
目 商品的等级变量只取一级、二级、三级等等.
开
关
研一研·问题探究、课堂更高效
人教版选修1-21.2《独立性检验的基本思想及其初步应用》课件
为:
x
y
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
栏 目
总计 a+c b+d
a+b+c+d
链 接
在列联表中,如果两个分类变量没有关系,则应该满足ad -bc≈0.因此|ad-bc|越小,说明两个分量之间的关系越 弱;|ad-bc|越大,说明两个分类变量之间的关系越强.
不合理的程度,由实际计算出k>6.635,说明假设不合理 接
的程度约为99%,即两个分类变量有关系这一结论成立的
可信度为99%,不合理的程度可查下表得出:
表格链接
栏 目 链 接
题型一 图形的应用
例1打鼾不仅影响别人休息,而且可能与患某种疾病有关,
图中有两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色
区域的高度,如果两个高度相差比较明显(即a+a b和c+c d相差很大),就判 断两个分类变量之间有关系.
(2)独立性检验及其基本思想. ①独立性检验.
利用随机变量 K2 来确定在多大程度上可以认为“两个分类变量有
例2在调查的480名男士中有38名患有色盲,520名女士
中有6名患有色盲,能否在犯错误的概率不超过0.001的前
提下认为性别与患色盲有关系?
栏
目
分析:解答过程如下:
链 接
作出2×2列联表 ―→ 计算随机变量K2的值 ―→
对照临界值作出结论
解析:根据题目所给的数据作出如下的列联表:
冒记录作比较,提出假设H0:“这种血清不能起到预防感冒 的作用”.利用2×2列联表计算,得K2=3.918.经查对临界
最新人教版高中数学选修1-2《独立性检验的基本思想及其初步应用》温故知新
1.2 独立性检验的基本思想及其初步应用
温故知新
新知预习
1.独立性检验实际上就是检验两个分类变量是否相关,在多大程度上相关.常用的直观方法有 、 、 、 等.得到精确结果的做法是进行 .
2.在三维柱形图中,主对角线上两个柱形高度的乘积ad 与副对角线上的两个柱形高度的乘积bc 相差越 ,x 与Y 有关系的可能性越大.
可构造一个随机变量= (其中=+++为样本总量),使不同样本容量的数
据有统一的评判标准.
基础示例
1.与表格相比,能更直观地反映出相关数据的总体状况的是( )
A.列联表
B.三维柱形图
C.二维条形图
D.三维柱形图和二维条形图
解析:由柱形图及条形图的特点易知.
答案:D
2.在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形高度的乘积相差越大两个变量有关系的可能性就……( )
A.越大
B.越小
C.无法判断
D.以上都不对
答案:A
3.三维柱形图与独立性检验判断两个分类变量是否有关系,哪一个能更精确地判断可能程度: .
答案:独立性检验
4.对于左边2×2列联表,在二维条形图中,两个比例的值
b a a +与d
c c +相差越大,H :“x 与Y 有关系”的可能性 .
答案:越大。
人教课标版高中数学选修1-2《独立性检验的基本思想及其初步应用(第3课时)》教案-新版
1.1.2 独立性检验的基本思想及其初步应用第三课时一、教学目标 1.核心素养:通过学习独立性检验的基本思想及其初步应用,初步形成基本的数据分析能力, 培养数学运算能力. 2.学习目标(1)1.1.3.1 巩固复习利用等高条形图、列联表、独立性检验的基本思想判断分类变量的关系(3)1.1.3.2 总结归纳利用独立性检验判断两个分类变量相关关系的一般步骤. 3.学习重点总结归纳利用独立性检验判断两个分类变量相关关系的一般步骤. 4.学习难点对独立性检验基本思想的进一步理解 二、教学设计 (一)课前设计 1.预习任务 任务1阅读教材P10-P15,回顾本节主要知识点有哪些? 任务2利用独立性检验判断两个分类变量相关关系的一般步骤是什么?2.预习自测1.与表格相比,能更直观地反映出相关数据总体状况的是( ) A.列联表 B.散点图 C.残差图D.等高条形图解: D2.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A.若2K 的观测值为635.6 k ,我们有%99的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病.B.从独立性检验可知有%99的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有%99的可能患有肺病.C.若从统计量中求出有%95的把握认为吸烟与患肺病有关系,是指有%5的可能性使得推判出现错误.D.以上三种说法都不正确. 解: C (二)课堂设计 1.知识回顾(1)变量的不同“值”表示个体所属的不同类别,像这样的变量成为分类变量. (2)列出两个分类变量的频数表,称为列联表.(3)独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即0H :两个分类变量没有关系成立,在该假设下我们构造的随机变量2K 应该很小,如果由观测数据计算得到2K 的观测值k 很大,则在一定程度上说明假设不合理,即断言0H 不成立,即认为“两个分类变量有关系”;如果观测值k 很小,则说明在样本数据中没有发现足够证据拒绝0H . 2.问题探究问题探究一 我们主要从几个方面来研究两个分类变量之间有无关系?●活动一 回归旧知,巩固复习重点知识例1.为了调查某生产线上,某质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在现场时,990件产品中合格品982件,次品87件;甲不在现场时,510件产品中合格品493件,次品17件.试分别用列联表,等高条形图,独立性检验的方法对数据进行分析. 【知识点:分类变量,独立性检验,变量间的关系】 详解:(1)2×2列联表如下:由列联表看出|ac -bd |=|982×17-493×8|=12750,即可在某种程度上认为“甲在不在场与产品质量有关”.相应的等高条形图如图所示:●活动二对比学习,巩固重点(2)在解答独立性检验题目过程中.数据有时比较多,一定不要混淆,要分辨清楚,否则会影响解题的下一步,同时计算不能失误.问题探究二利用独立性检验判断两个分类变量是否有关系的一般步骤是什么?●活动一实际操作例2.为考察某种药物预防禽流感的效果,进行动物家禽试验,调查了100个样本,统计结果为:服用药的共有60个样本,服用药但患病的仍有20个样本,没有服用药且未患病的有20个样本. (1)根据所给样本数据完成下面2×2列联表;(2)请问能有多大把握认为药物有效?【知识点:分类变量,独立性检验,变量间的关系】详解:(1)(2)由列联表得:706.2778.260404060)20202040(10022>≈⨯⨯⨯⨯-⨯=K所以大概90%认为药物有效. ●活动二 深层思考,得出一般步骤通过上述解答过程,利用独立性检验判断两个分类变量是否有关系的一般步骤是什么? 1.独立性检验的基本步骤①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查临界值表确定临界值0k .②利用公式))()()(()(22d b c a d c b a bd ac n K ++++-=计算随机变量2K 的观测值0k .③如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”. 2.独立性检验的基本思想(1)利用2K 进行独立性检验,可以对推断的正确性的概率作出估计,样本容量n 越大,这个估计值越准确,如果抽取的样本容量很小,那么利用2K 进行独立性检验的结果就不具有可靠性. (2)独立性检验的思想就是在假设0H 成立的条件下,如果出现一个与0H 相矛盾的小概率事件,就推断0H 不成立,且该推断犯错误的概率不超过这个小概率. 3.课堂总结【知识梳理】1.独立性检验的基本步骤①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查临界值表确定临界值0k .②利用公式))()()(()(22d b c a d c b a bd ac n K ++++-=计算随机变量2K 的观测值0k .③如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”. 2.独立性检验的基本思想(1)利用2K 进行独立性检验,可以对推断的正确性的概率作出估计,样本容量n 越大,这个估计值越准确,如果抽取的样本容量很小,那么利用2K 进行独立性检验的结果就不具有可靠性. (2)独立性检验的思想就是在假设0H 成立的条件下,如果出现一个与0H 相矛盾的小概率事件,就推断0H 不成立,且该推断犯错误的概率不超过这个小概率.【重难点突破】(1)利用三维柱形图、二维条形图、等高条形图直观判断两个分类变量之间是否有关系. (2)利用2×2列联表以及随机变量2K 对两个变量进行独立性检验. 4.随堂检测1.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是( ) A.散点图 B.等高条形图 C.2×2列联表 D.以上均不对 【知识点:独立性检验】解:B2.性别与身高列联表如下:A.0.043B.0.367C.22D.26.87【知识点:独立性检验】解:C3.给出列联表如下:()A.0.4B.0.5C.0.75D.0.85【知识点:独立性检验】解:B4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:()A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关【知识点:独立性检验】解:D5.若由一个2×2列联表中的数据计算得K2=4.013,那么在犯错误的概率不超过0.05的前提下认为两个变量______(填“有”或“没有”)关系.【知识点:独立性检验】解:有(三)课后作业基础型自主突破1.在吸烟与患肺病是否有关的研究中,下列属于两个分类变量的是()A.吸烟,不吸烟B.患病,不患病C.是否吸烟、是否患病D.以上都不对【知识点:独立性检验】解:C“是否吸烟”是分类变量,它的两个不同取值;吸烟和不吸烟;“是否患病”是分类变量,它的两个不同取值:患病和不患病.可知A、B都是一个分类变量所取的两个不同值.故选C.【知识点:独立性检验】解:C 由题设知:a=45,b=10,c=30,d=15,=-255×45×75×25≈3.030由附表可知,有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,故选C. 3.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )① 若K 2的观测值满足K 2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误A.①B.① ③C.③D.②【知识点:独立性检验】解:C ①推断在100个吸烟的人中必有99人患有肺病,说法错误,排除A ,B ,③正确.排除D.4.在一个2×2列联表中,由其数据计算得K 2的观测值679.7 k ,则这两个变量间有关系的可能性为( ) A.99%B.99.5%C.99.9%D.无关系【知识点:独立性检验】解:A K 2的观测值6.635<k <7.879,所以有99%的把握认为两个变量有关系.5. 在600人身上实验某种新药预防感冒的作用,把一年中的记录与另外600个未用新药的人作比较,结果如下问该种新药起到预防感冒的作用的可能性为( ) A. 99%B. 90%C.99.9%D.小于90%【知识点:独立性检验】 解:D6.分析两个分类变量之间是否有关系的常用方法有________;独立性检验的基本思想类似于____.【知识点:独立性检验】解:.频率比较法、图形分析法(三维柱形图、二维条形图、等高条形图)、独立性检验;反证法能力型 师生共研7.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:则有多少的把握认为多看电视与人变冷漠有关系( )A.95%B.99%C. 5%D. 99.9%【知识点:独立性检验】解:B8. 两个分类变量X 和Y 可能的取值分别为{}21,x x 和{}21,y y ,其样本频数满足10=a ,21=b ,35=+d c .若“X 和Y 有关系”犯错误的概率不超过0.05,则c 的值可能等于( )A. 4B. 5C. 6D. 7【知识点:独立性检验】解:A9. 为了考察长头发与女性头晕是否有关联,随机抽取了301名女性,得到如下列联表.试根据表格中已有数据填空.空格中的数据应分别为①________;②________;③________;④________. 【知识点:独立性检验】解:86; 180; 229; 30110. 为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射14天内的结果如表所示:进行统计分析时的统计假设是_______. 【知识点:独立性检验】解:小白鼠的死亡与剂量无关 探究型 多维突破11.调查339名50岁以上有吸烟习惯与患慢性气管炎的人的情况,获数据如下试问:(1)有吸烟习惯与患慢性气管炎病是否有关? (2)用假设检验的思想给予说明. 【知识点:独立性检验】解:(1)根据列联表的数据,得到 6.6356.674))()()(()(22>=++++-=d b c a d c b a bd ac n K 所以有99%的把握认为“吸烟与患慢性气管炎病有关”.(2)假设“吸烟与患病之间没有关系”,由于事件A ={635.62≥K }的概率P(A)≈0.01,即A 为小概率事件,而小概率事件发生了,进而得假设错误,这种推断出错的可能性约有1%.10. 20国集团峰会于2016年月9日至4日在中国杭州进行,为了搞好接待工作,组委会招幕了16名男志愿者和14名女志愿者,调查发现,男、女志愿者中分别有10人和6人会德语,其余人不会德语.(1)根据以上数据完成以下2×2列联表:(2)根据列联表的独立性检验,能否在犯错误的概率不超过0.10的前提下认为性别与会德语有关?【知识点:独立性检验】解:(1)(2)假设:是否会德语与性别无关,由已知数据可求得:706≈k1575.2.1<因此,在犯错误的概率不超过0.10的前提下不能判断会德语与性别有关.自助餐1.为了评价某个电视栏目改革效果,在改革前后分别从居名点抽取了100居民进行调查,经过计算得2K的观测值99=k.根据这一数据分析,下列说法正确的是().0A.有99%的人认为该栏目优秀B.有99%的人认为该栏目是否优秀与改革无关C.有99%的把握认为该栏目是否优秀与改革有关系D.没有充分理由认为该栏目是否优秀与改革有关系【知识点:独立性检验】解:D2.硕士学位与博士学位的一个随机样本给出了关于所获取学位类别与学生性别的分类数据,如下表所示下列各项说法正确的是()A.在犯错误的概率不超过0.01的前提下认为性别与获取学位类别有关B.在犯错误的概率不超过0.01的前提下认为性别与获取学位类别无关C.性格决定获取学位的类别D.以上都是错误的【知识点:独立性检验】解:A3.经过对随机变量2K的研究,得到了若干临界值,当其观测值072k时,对于两个事件A与B,.2我们认为()A. 有95%的把握认为A与B有关系B. 有99%的把握认为A与B有关系C. 没有充分理由说明事件A与B有关系D. 确定事件A与B没有关系【知识点:独立性检验】解:C4. 以下关于独立性检验的说法中,错误的是()A. 独立性检验依据小概率原理B. 独立性检验得到的结论一定正确C. 样本不同,独立性检验的结论可能有差异D. 独立性检验不是判定两分类变量是否相关的唯一方法【知识点:独立性检验】解:B6.某班主任对全班50名学生进行了作业量多少的调查,数据如下表则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为( ) A. 99% B. 97.5%C. 90%D. 无充分依据【知识点:独立性检验】解:B7. 给出下列实际问题:①一种药物对某种病的治愈率;②两种药物治疗同一种病是否有区别;③吸烟者得肺病的概率;④吸烟人群是否与性别有关系;⑤网吧与青少年的犯罪是否有关系.其中用独立性检验可以解决的问题有_______. 【知识点:独立性检验】 解:②④⑤8.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:250(1320107) 4.84423272030k ⨯⨯-⨯=≈⨯⨯⨯因为2 3.841K ≥,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________. 【知识点:独立性检验】 解:0.059. 为加强素质教育,使学生各方面全面发展,某学校对学生文化课与体育课的成绩进行了调查统计,结果如下:在探究体育课成绩与文化课成绩是否有关时,根据以上数据可以得到2K 的观测值为________.(精确到0.001) 【知识点:独立性检验】 解:1.25510. 某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:由表中数据直观分析,收看新闻节目的观众是否与年龄有关;________(填“是”或“否”) 【知识点:独立性检验】 解:是11. 为了了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对30名六年级学生进行了问卷调查得到如下列联表:(平均每天喝500ml 以上为常喝,体重超过50kg 为肥胖)已知在30人中随机抽取一人,抽到肥胖的学生的概率为154. (1)请将上面的列联表补充完整(2)是否有99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由 参考数据:(参考公式:))()()(()(22d b c a d c b a bd ac n K ++++-=,其中d c b a n +++=)【知识点:独立性检验,古典概型】解:(1)设常喝碳酸饮料肥胖的学生有x 人,154302=+x ,6=x (2)由已知数据可求得: 879.7523.82>≈K ,因此有99.5%的把握认为肥胖与常喝碳酸饮料有关.12. 某大学高等数学老师这学期分别用B A ,两种不同的教学方式试验甲、乙两个大一新班(人数均为60人,入学数学平均分数和优秀率都相同;勤奋程度和自觉性都一样).现随机抽取甲、乙两班各20名的高等数学期末考试成绩,得到茎叶图:(1)依茎叶图判断哪个班的平均分高?(2)现从甲班高等数学成绩不得低于80分的同学中随机抽取两名同学,求成绩为86分的同学至少有一个被抽中的概率;(3)学校规定:成绩不低于85分的为优秀,请填写下面的2×2列联表,并判断“能否在犯错误的概率不超过0.025的前提下认为成绩优秀与教学方式有关”.下面临界值表仅供参考:(参考公式:))()()(()(22d b c a d c b a bd ac n K ++++-=,其中d c b a n +++=)【知识点:独立性检验,简单抽样,概率】解(1)甲班高等数学成绩集中于60-90分之间,而乙班数学成绩集中于80-100分之间,所以乙班的平均分高.(2)记成绩为86分的同学为A,B ,其他不低于80分的同学为C,D,E,F“从甲班高等数学成绩不得低于80分的同学中随机抽取两名同学”的一切可能结果组成的基本事件有:(A,B)、(A,C)、(A,D)、(A,E)、(A,F)、(B,C)、(B,D)、(B,E)、(B,F)、(C,D)、(C,E)、(C,F)、(D,E)、(D,F)、(E,F)一共15个.“抽到至少有一个86分的同学”所组成的基本事件有:(A,B)、(A,C)、(A,D)、(A,E)、(A,F)、(B,C)、(B,D)、(B,E)、(B,F)共9个,故93155P ==. (3)2240(3101017) 5.584 5.024********K ⨯⨯-⨯=≈>⨯⨯⨯,因此在犯错误的概率不超过0.025的前提下可以认为成绩优秀与教学方式有关. 数学视野在实际问题中,经常会面临需要推断的问题,比说研制出一种新药,需要推断此药是否有效;有人怀疑吸烟的人更易患肺癌,需要推断患肺癌是否与吸烟有关;等等.在对类似问题作出推断时,我们不能仅凭主观意愿得出结论,需要通过试验来手机数据,并依据独立性检验的原理作出合理的推断.。
高中数学选修1,2《独立性检验的基本思想及其初步应用》教案
高中数学选修1,2《独立性检验的基本思想及其初步应用》教案高中数学选修1-2《独立性检验的基本思想及其初步应用》教案教学要求:通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的实施步骤与必要性.教学重点:理解独立性检验的基本思想及实施步骤.教学难点:了解独立性检验的基本思想、了解随机变量的含义.教学过程:教学过程:一、复习准备:独立性检验的基本步骤、思想二、讲授新课:1. 教学例1:例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?① 第一步:教师引导学生作出列联表,并分析列联表,引导学生得出“秃顶与患心脏病有关”的结论;第二步:教师演示三维柱形图和二维条形图,进一步向学生解释所得到的统计结果;第三步:由学生计算出的值;第四步:解释结果的含义.② 通过第2个问题,向学生强调“样本只能代表相应总体”,这里的数据来自于医院的住院病人,因此题目中的结论能够很好地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出现错误,除非有其它的证据表明可以进行这种推广.2. 教学例2:例2 为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:喜欢数学课程不喜欢数学课程总计男3785122女35143178总计72228300由表中数据计算得到的观察值 . 在多大程度上可以认为高中生的性别与是否数学课程之间有关系?为什么?(学生自练,教师总结)强调:①使得成立的前提是假设“性别与是否喜欢数学课程之间没有关系”.如果这个前提不成立,上面的概率估计式就不一定正确;②结论有95%的把握认为“性别与喜欢数学课程之间有关系”的含义;③在熟练掌握了两个分类变量的独立性检验方法之后,可直接计算的值解决实际问题,而没有必要画相应的图形,但是图形的直观性也不可忽视.不健康健康总计不优秀41626667优秀37296333三、课时小结:独立性检验的方法、原理、步骤四、巩固练习:某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:请问有多大把握认为“高中生学习状况与生理健康有关”?五、课外作业课时练习六、板书设计。
最新人教版高中数学选修1-2《独立性检验的基本思想及其初步应用》课堂探究
课堂探究知识点一分类变量与列联表1.分类变量取不同的“值”表示个体所属不同类别的变量称为分类变量.这里的“变量”和“值”都应作为“广义”的变量和值进行理解.例如:对于性别变量,其取值为男和女两种.那么这里的“变量”指的是“性别”,同样这里的“值”指的是“男”和“女”,因此,这里所说的“变量”和“值”不一定取的是具体的数值.2.列联表一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值:类A和类B(如吸烟和不吸烟),Ⅱ也有两类取值:类1和类2(如患肺癌与不患肺癌),其频数如下表所示:这样列出的两个分类变量的频数表,称为列联表.在某地区随机抽取的一个样本中,包含110名女士和90名男士,女士约有9%是左利手,男士约有11%是左利手.根据条件画出列联表.思路分析:根据左利手的百分比分别计算出男女左利手的频数,注意取整数.解:女士中左利手人数为110×9%≈10,非左利手人数为100;男士中左利手人数为90×11%≈10,非左利手人数为80.列联表如下:1.分类变量是大量存在的,例如:吸烟变量有吸烟与不吸烟两种类别,而国籍变量则有多种类别.2.在画列联表时,不要忘记最右侧和最下面的总计.两个总计的交叉点为调查对象的总人数,既等于横向的总计,又等于纵向的总计.知识点二 独立性检验的方法1.等高条形图法等高条形图可直观地展示列联表数据的频率特征,从而可以粗略地反映出两个分类变量间是否相互影响.如图,若两个比例的值相差越大,则两分类变量有关系的可靠程度越大.2.K 2检验法(1)计算公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d 为样本容量.(2)基本思想:独立性检验的基本思想类似于反证法.要判断“两个分类变量有关系”,首先假设该结论不成立,即H 0:两个分类变量没有关系成立.在该假设下构造的随机变量K 2应该很小.如果由观测数据计算得到的K 2的观测值k 很大,则在一定程度上说明假设不合理.根据随机变量的含义,可以通过概率P (K 2≥k )的大小来评价该假设不合理的程度有多大,从而说明这“两个分类变量没有关系”这一结论成立的可信程度有多大.(3)反证法与独立性检验原理的比较:(4)利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验. (5)独立性检验的步骤:①根据实际问题的需要确定容许推断“两个分类变量X 与Y 有关系”犯错误概率的上界α,然后查下表确定临界值k 0.②利用公式K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d )(n =a +b +c +d 为样本容量),计算随机变量K 2的观测值k .③如果k ≥k 0,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”.在研究某种新药对小白兔的防治效果时,对139只小白兔不使用新药,存活数与死亡数分别为101只和38只;对149只小白兔使用新药后,存活数与死亡数分别为129只和20只.(1)列出列联表; (2)画出等高条形图;(3)能否在犯错误的概率不超过0.005的前提下,认为新药对小白兔的防治有效? 思路分析:本题其实就是推断小白兔存活和使用新药是否有关系.可以根据独立性检验原理,先提出假设,再求出K 2的观测值,并比较观测值与概率0.005对应的临界值的大小,最后作出统计推断.解:(1)根据题目所给数据得到列联表如下:(2)等高条形图如图所示.(3)假设H 0:小白兔存活与使用新药没有关系. 根据列联表,计算K 2的观测值为k =288(101×20-38×129)2139×149×230×58≈8.658>7.879.因为P(K2≥7.879)≈0.005,所以在犯错误的概率不超过0.005的前提下,认为小白兔的存活与新药的使用有关系.由于使用新药后小白兔的死亡率低于未使用新药的,因此这里的“有关系”相当于新药对小白兔的防治有效.因此,在犯错误的概率不超过0.005的前提下,认为新药对防治小白兔是有效的.用统计量K2进行独立性检验,要注意以下三点:(1)要求表中的数据都要大于5,因而在确定样本容量时要注意这一点;(2)K2计算公式中的ad与bc分别为表中主对角线(左上→右下)上的两数据之积和副对角线(左下→右上)上的两数据之积,不能混淆,其中n为样本容量;(3)K2的构造思路:当统计假设H0:P(AB)=P(A)·P(B)成立时,P(A B)=P(A)P(B),P(A B)=P(A)P(B),P(A B)=P(A)P(B)都成立,实际计算中是用事件的频率近似代替相应的概率,因而K2的结果也受样本特征的影响,具有随机性.。
人教版高中选修1—2数学1.2独立性检验的基本思想及其初步应用教案(9)
1.2独立性检验的基本思想及其初步应用本周题目:独立性检验的基本思想及其初步应用本周重点:(1)通过对实际问题的分析探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用.;了解独立性检验的常用方法:三维柱形图和二维条形图,及其K²(或R²)的大小关系.(2)通过典型案例的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用。
(3)理解独立性检验的基本思想及实施步骤,能运用自己所学的知识对具体案例进行检验.本周难点:(1)了解独立性检验的基本思想;(2)了解随机变量的含义,太大认为两个分类变量是有关系的;(3)能运用自己所学的知识对具体案例进行检验与说明.本周内容:一、基础知识梳理1.独立性检验利用随机变量来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验。
2.判断结论成立的可能性的步骤:(1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度。
(2)可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度。
二、例题选讲例1.为了探究患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如下表所示:试问:50岁以上的人患慢性气管炎与吸烟习惯有关吗?分析:最理想的解决办法是向所有50岁以上的人作调查,然后对所得到的数据进行统计处理,但这花费的代价太大,实际上是行不通的,339人相对于全体50岁以上的人,只是一个小部分,已学过总体和样本的关系,当用样本平均数,样本方差去估计总体相应的数字特征时,由于抽样的随机性,结果并不唯一。
现在情况类似,我们用部分对全体作推断,推断可能正确,也可能错误。
如果抽取的339个调查对象中很多人是吸烟但没患慢性气管炎,而虽不吸烟因身体体质差而患慢性气管炎,能够得出什么结论呢?我们有95%(或99%)的把握说事件与事件有关,是指推断犯错误的可能性为5%(或1%),这也常常说成是“以95%(或99%)的概率”是一样的。
人教版高中数学选修1-2 1.2独立性检验的基本思想及其初步应用(教案)(共2课时)
1.2独立性检验的基本思想及其初步应用(一)教学目标(一)知识与技能:通过本节知识的学习,了解独立性检验的基本思想和初步应用,能对两个分类变量是否有关做出明确的判断。
明确对两个分类变量的独立性检验的基本思想具体步骤,会对具体问题作出独立性检验。
(二)过程与方法:在本节知识的学习中,应使学生从具体问题中认识进行独立性检验的作用及必要性,树立学好本节知识的信心,在此基础上学习三维柱形图和二维柱形图,并认识它们的基本作用和存在的不足,从而为学习下面作好铺垫,进而介绍K的平方的计算公式和K的平方的观测值R的求法,以及它们的实际意义。
从中得出判断“X与Y有关系”的一般步骤及利用独立性检验来考察两个分类变量是否有关系,并能较准确地给出这种判断的可靠程度的具体做法和可信程度的大小。
最后介绍了独立性检验思想的综合运用(三)情感、态度与价值观:通过本节知识的学习,首先让学生了解对两个分类博变量进行独立性检验的必要性和作用,并引导学生注意比较与观测值之间的联系与区别,从而引导学生去探索新知识,培养学生全面的观点和辨证地分析问题,不为假想所迷惑,寻求问题的内在联系,培养学生学习数学、应用数学的良好的数学品质。
加强与现实生活相联系,从对实际问题的分析中学会利用图形分析、解决问题及用具体的数量来衡量两个变量之间的联系,学习用图形、数据来正确描述两个变量的关系。
明确数学在现实生活中的重要作用和实际价值。
教学中,应多给学生提供自主学习、独立探究、合作交流的机会。
养成严谨的学习态度及实事求是的分析问题、解决问题的科学世界观,并会用所学到的知识来解决实际问题。
教学重点:理解独立性检验的基本思想及实施步骤.教学难点:了解独立性检验的基本思想、了解随机变量2K的含义.教学方法:诱思探究教学法学习方法:自主探究、观察发现、合作交流、归纳总结。
教学过程:一、复习准备:回归分析的方法、步骤,刻画模型拟合效果的方法(相关指数、残差分析)、步骤.二、讲授新课:1. 教学与列联表相关的概念:①分类变量:变量的不同“值”表示个体所属的不同类别的变量称为分类变量. 分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级,等等. 分类变量的取值有时可用数字来表示,但这时的数字除了分类以外没有其他的含义. 如用“0”表示“男”,用“1”表示“女”.②列联表:分类变量的汇总统计表(频数个值,这样的列联表称为22. 如吸烟与患肺癌的列联表:2. 教学三维柱形图和二维条形图的概念:由列联表可以粗略估计出吸烟者和不吸烟者患肺癌的可能性存在差异.(教师在课堂上用EXCEL软件演示三维柱形图和二维条形图,引导学生观察这两类图形的特征,并分析由图形得出的结论)3. 独立性检验的基本思想:①独立性检验的必要性(为什么中能只凭列联表的数据和图形下结论?):列联表中的数据是样本数据,它只是总体的代表,具有随机性,故需要用列联表检验的方法确认所得结论在多大程度上适用于总体.②独立性检验的步骤(略)及原理(与反证法类似):第一步:提出假设检验问题H0:吸烟与患肺癌没有关系↔H1:吸烟与患肺癌有关系第二步:选择检验的指标22()K()()()()n ad bca b c d a c b d-=++++(它越小,原假设“H:吸烟与患肺癌没有关系”成立的可能性越大;它越大,备择假设“H1:吸烟与患肺癌有关系”成立的可能性越大.1.三维柱形图中柱的高度表示的是( )A .各分类变量的频数B .分类变量的百分比C .分类变量的样本数D .分类变量的具体值解析: 三维柱形图中柱的高度表示图中各个频数的相对大小.选A2. 统计推断,当______时,有95 %的把握说事件A 与B 有关;当______时,认为没有充分的证据显示事件A 与B 是有关的.解析:当841.3>k 时,就有95 %的把握说事件A 与B 有关,当076.2≤k 时认为没有充分的证据显示事件A 与B 是有关的.3.为了探究患慢性气管炎与吸烟有无关系,调查了却339名50岁以上的人,结果如下表所示,据此数据请问:50岁以上的人患慢性气管炎与吸烟习惯有关系吗?分析:有表中所给的数据来计算2K 的观测值k,再确定其中的具体关系. 解:设患慢性气管炎与吸烟无关.a=43,b=162,c=13,d=121,a+b=205,c+d=134, a+c=56,b+d=283,n=339所以2K 的观测值为469.7))()()(()(2==+++-=d b c a d c b a bc ad n k .因此635.6>k ,故有99%的把握认为患慢性气管炎与吸烟有关. 四,课后练习:1. 在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就( ) A.越大 B.越小 C.无法判断 D.以上都不对2.下列关于三维柱形图和二维条形图的叙述正确的是: ( ) A .从三维柱形图可以精确地看出两个分类变量是否有关系B .从二维条形图中可以看出两个变量频数的相对大小,从三维柱形图中无法看出相对频数的大小C .从三维柱形图和二维条形图可以粗略地看出两个分类变量是否有关系D .以上说法都不对3.对分类变量X 与Y 的随机变量2K 的观测值K ,说法正确的是() A . k 越大," X 与Y 有关系”可信程度越小; B . k 越小," X 与Y 有关系”可信程度越小; C . k 越接近于0," X 与Y 无关”程度越小 D . k 越大," X 与Y 无关”程度越大4. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( ) A.若K 2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;C.若从统计量中求出有95% 的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判出现错误;D.以上三种说法都不正确.5.若由一个2*2列联表中的数据计算得k 2=4.013,那么有 把握认为两个变量有关系6.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:250(1320107) 4.84423272030k ⨯⨯-⨯=≈⨯⨯⨯因为2 3.841K ≥,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为 ____;7.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人。
最新人教版高中数学选修1-2《独立性检验的基本思想及其初步应用》梳理探究
1.2 独立性检验的基本思想及其初步应用1.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.2.了解假设检验的基本思想、方法及其简单应用.1.分类变量和列联表(1)分类变量.变量的不同“值”表示个体所属的________,像这样的变量称为分类变量.(2)列联表.①定义:列出的两个分类变量的______,称为列联表.②2×2列联表.一般地,假设两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)2.等高条形图(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否________,常用等高条形图展示列联表数据的________.(2)观察等高条形图发现______和______相差很大,就判断两个分类变量之间有关系.【做一做1】观察下列各图,其中两个分类变量X,Y之间关系最强的是()【做一做2-1】对于分类变量X与Y的随机变量K的观测值k,下列说法正确的是()A.k越大,“X与Y有关系”的可信程度越小B.k越小,“X与Y有关系”的可信程度越小C.k越接近于0,“X与Y没有关系”的可信程度越小D.k越大,“X与Y没有关系”的可信程度越大【做一做2-2】在吸烟与患肺病是否相关的判断中,有下面的说法:①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是__________.答案:1.(1)不同类别(2)①频数表2.(1)相互影响频率特征(2)aa+bc c+d【做一做1】D在四幅图中,选项D的图中两个深色条的高相差最明显,说明两个分类变量之间关系最强,故选D.3.n(ad-bc)2(a+b)(c+d)(a+c)(b+d)a+b+c+d①临界值k0②观测值k③k≥k0犯错误的概率没有发现足够证据【做一做2-1】B k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大,即k越小,“X与Y有关系”的可信程度越小.故选B.【做一做2-2】③K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.1.怎样认识分类变量和定量变量?剖析:分类变量也称为属性变量或定性变量,它的不同值表示个体所属的不同类别.分类变量的不同取值仅表示个体所属的不同类别,如性别变量只取男、女两个值.有时也可以把分类变量的不同取值用数字来表示,但这时的数字除了分类以外没有其他的含义.如用“0”表示“男”,“1”表示“女”,性别变量就变成取值为0和1的随机变量,但是这些数字并没有其他的含义.定量变量的取值一定是实数,其取值的大小具有特定的含义,如身高、体重、考试成绩等.2.怎样理解独立性检验的思想?剖析:独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下我们构造的随机变量K 2应该很小,如果由观测数据计算得到的K 2的观测值很大,则在一定程度上说明假设不合理,根据随机变量K 2的含义,可以通过P(K 2≥6.635)≈0.01来评价假设不合理的程度,由实际计算出K 2≥6.635,说明假设不合理的程度约为99%,即两个分类变量有关系这一结论成立的可信程度为99%.K 2≥6.635是指两个分类变量有关系这一结论成立的可信度为99%,不是指两个分类变量有关系的概率为99%.题型一 列联表和等高条形图的应用【例题1】 某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系. 分析:作出2×2列联表→根据列联表数据作等高条形图→对比乘积的差距判断两个分类变量是否有关反思:利用数形结合的思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法之一.一般地,在等高条形图中,a a +b 与c c +d 相差越大,两个分类变量有关系的可能性就越大.在作等高条形图时可以用列联表来寻找相关数据,作图要精确,且易于观察,以便对结论的判断不出现偏差.题型二 独立性检验原理的应用【例题2】 打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的数据:根据列联表的独立性检验,能否在犯错误的概率不超过0.001的前提下认为每一晚都打鼾与患心脏病有关系?分析:由列联表中的数据代入K 2公式可得随机变量K 2的观测值k ,查表确定临界值k 0及推断“X 与Y 有关系”犯错误概率的上界α,从而使问题获解.反思:解决一般的独立性检验问题的步骤:(1)通过列联表确定a ,b ,c ,d ,n 的值,根据实际问题需要的可信程度确定临界值k 0;(2)利用K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )求出K 2的观测值k ;(3)如果k ≥k 0,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”.题型三 独立性检验的综合应用【例题3】 为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件.试分别用列联表、独立性检验的方法分析监督员甲对产品质量好坏有无影响.能否在犯错误的概率不超过0.001的前提下,认为质量监督员甲是否在生产现场与产品质量有关?分析:由题目所给数据列出列联表并画出相应的等高条形图,直观判断两个分类变量之间是否有关系,然后用独立性检验判断上述推断是否正确.反思:进行独立性检验的前提是根据题中数据获得2×2列联表,而常用等高条形图展示列联表数据的频率特征,即将a a +b 与c c +d (或b a +b 与dc +d )的值相比,由此能直观地反映出两个分类变量间是否相互影响,但是此方法较粗略.若要作出精确的判断,可以作独立性检验的有关计算.相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例大,可以认为考前紧张与性格类型有关.【例题2】 解:由题中2×2列联表知:a =30,b =224,c =24,d =1 355,a +b =254,c +d =1 379,a +c =54,b +d =1 579,n =1 633,代入公式得K 2的观测值k =1 633×(30×1 355-224×24)2254×1 379×54×1 579≈68.033.由于k ≈68.033>10.828,所以在犯错误的概率不超过0.001的前提下,认为每一晚都打鼾与患心脏病有关系.【例题3】 解:根据题目所给数据得如下2×2列联表:图中两个深色条的高分别表示甲在生产现场和甲不在生产现场样本中次品数的频率.从图中可以看出,甲不在生产现场样本中次品数的频率明显高于甲在生产现场样本中次品数的频率.因此可以认为质量监督员甲在不在生产现场与产品质量好坏有关系.(2)由列联表可得|ad -bc |=|982×17-493×8|=12 750,相差较大,可在某种程度上认为“质量监督员甲是否在生产现场与产品质量有关系”.(3)由2×2列联表中的数据,计算得到K 2的观测值为k =1 500×(982×17-493×8)2990×510×1 475×25≈13.097>10.828,因此在犯错误不超过0.001的前提下,认为质量监督员甲是否在生产现场与产品质量有关.1.独立性检验中,可以粗略地判断两个分类变量是否有关的是( ) A .散点图 B .等高条形图 C .假设检验的思想 D .以上都不对 2.在列联表中,两个比值__________相差越大,两个分类变量之间的关系越强( ) A.a a +b 与cc +dB.a c +d 与ca +bC.a a +b 与c b+c D.a b +d与ca +c 3.有2×2由上表可计算K 的观测值k ≈__________.4.(2012东北四校一模)哈尔滨冰雪大世界每年冬天都会吸引大批游客,现准备在景区内开设经营热饮等食品的店铺若干.根据以往对500名40岁以下(含40岁)人员和500名40岁以上人员的统计调查,有如下一系列数据:40岁以下(含40岁)人员购买热饮等食品的有260人,不购买热饮食品的有240人;40岁以上人员购买热饮等食品的有220人,不购买热饮等食品的有280人,请根据以上数据作出2×2列联表,并运用独立性检验思想,判断购买热饮等食品与年龄(按上述统计中的年龄分类方式)是否有关系?注:要求达到99.9%的把握才能认定为有关系.附:K2=2n(ad bc)(a b)(c d)(a c)(b d)-++++.答案:1.B等高条形图可以粗略地判断两个分类变量是否有关,但无法精确地给出结论的可靠程度.故选B.2.Aaa b+与cc d+相差越大,说明ad与bc相差越大,两个分类变量之间的关系越强.故选A.3.10.76k=2189(54633240)949586103⨯⨯-⨯⨯⨯⨯≈10.76.K2=21000(260280220240)500500480520⨯-⨯⨯⨯⨯≈6.410<10.828,所以没有99.9%的把握认定为有关系.。
人教版高中选修1—2数学1.2独立性检验的基本思想及其初步应用教案(3)
1.2 独立性检验的基本思想及其初步应用
教学目标:
1.了解独立性检验的基本思想,
2.注意公式 教学重点:了解其思想。
教学难点:公式的理解 教学过程:
1. 引入:吸烟有害健康吗?你怎么知道
2. 列联表:
3. 用图分析
用图分析很不清楚; 4. 独立性检验
反向思考:检验他们有关系很难,思考他们没关系会不会快点? 假设H0事件:吸烟与患肺癌没关系 所以
≈a c
,a +b c +d
即:ad bc ≈ 引进:随机变量2
2
n(ad -bc)
K =(a +b)(c +d)(a +c)(b +d)
注意:K 2越小,两者越没关系,事件H0发生的可能性越小
2
2
42209956.63278172148987491K ⨯-⨯=≈⨯⨯⨯9965(777549),
那事件H0发生的可能性有多大呢?查表得
2
P K≥≈
(10.828)0.001
所以两者没关系的可能性只有0.001,那么两者有关系的可能性有99.9%
以上过程就是独立性检验
请大家归纳出它的步骤。
做书上练习。
[总结]:
(1)假设结论不成立,即“两个分类变量没有关系”.
(2)在此假设下随机变量K2 应该很能小,如果由观测数据,计算得到K2的观测值k很大,则在一定程度上说明假设不合理.
(3)根据随机变量K2的含义,可以通过评价该假设不合理的程度,由实际计算出的,说明假设合理的程度为99.9%,即“两个分类变量有关系”这一结论成立的可信度为约为99.9%.。
高中数学1-2独立性检验的基本思想及其初步应用同步课件新人教A版选修1-2.ppt
与性别是有关的.
根据列联表中所给的数据,有 a=38,b=442,c=6,
d=514,a+b=480,c+d=520,a+c=44,b+d=956,n
=1000,得 K2 的观测值
k=(a+b)(cn+(add-)(ab+c)c2)(b+d)
=
1000×(38×514-442×6)2 480×520×44×956
第一种剂量 第二种剂量
合计
死亡 14 6 20
存活 11 19 30
合计 25 25 50
三、解答题
7.在500个人身上试验某种血清预防感冒的作用,把一年中的记录与另外500个未用血 清的人作比较,结果如下表所示.
试画出列表的条形图,并通过图形判断这种血清能否起到预防感冒的作用?并进行独立
性检验.
[答案] 0.005
[解析] k=8.654>7.879,就推断“X与Y有关”犯错误的 概率不超过0.005.
6.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射 照射小白鼠.在照射后14天内的结果如下表所示:
进行统计分析时的统计假设是__________________. [答案] 假设电离辐射的剂量与人体受损程度无关.
≈27.1.
由
于
k≈27.1>10.828,所以我们有 99.9%的把握认为色盲与性
别有关系.这个结论只对所调查的 480 名男人和 520 名
女人有效.
[点评] 本题应首先作出调查数据的列联表,再根据列联 表画出二维条形图或三维柱形图,并进行分析,最后利用 独立性检验作出判断.
1.利用图形来判断两个分类变量是否有关系,可以画出三 维柱形图,也可以画出二维条形图,仅从图形上只可以粗 略地判断两个分类变量是否有关系,可以结合所给的数值 来进行比较.作图应注意单位统一,图形准确,但它不能 给我们两个分类变量有关或无关的精确的可信程度,若要 作出精确的判断,可以作独立性检验的有关计算.
(独立性检验的基本思想及其初步应用)人教版高中数学选修1-2教学课件(第1.1.2课时)
16.373
6.635
3891048 66率不超过0.01的前提下认为秃顶与患心脏病有关系
第十页,共十二页。
小结
两分类变量的关系
1、直观判断
ad bc
在“犯错误概率不超过α”前 提下,“两个分类变量有关”
2、独立性检验
基本思想 基本步骤
第十一页,共十二页。
人教版高中数学选修1-2
接种疫苗2
99
1
合计
129
71
合计 100 100 200
问题:通过填写下表,你能判断是疫苗1还是疫苗2对预防甲流的效果更好吗?
数值
结论
在未接种疫苗1的样本中,患甲流比例 在接种疫苗1的样本中,患甲流比例
71% 70%
基本
不变
在未接种疫苗2的样本中,患甲流比例 在接种疫苗2的样本中,患甲流比例
70%
1%
相差
较大
第三页,共十二页。
新知探究
图形直观
100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0%
未接种疫苗1
患甲流 不患甲流
接种疫苗1
100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0%
未接种疫苗2
患甲流 不患甲流
接种疫苗2
第四页,共十二页。
第六页,共十二页。
新知探究
K
2
a
nad bc2 bc da cb
d
结论:
K 2越小,越独立,两个分类变量之间关系越弱;
K 2越大,越不独立,两个分类变量之间关系越强;
k 0.0240
k 103.963
第七页,共十二页。
最新人教版高中数学选修1-2《独立性检验的基本思想及其初步应用》示范教案(第3课时)
第三课时教学目标 知识与技能理解独立性检验的基本思想,会根据K 2的观测值的大小判断两个分类变量有关的可信度,培养学生的自主探究的学习能力,并能应用数学知识解决实际问题.过程与方法 通过主动探究、自主合作、相互交流,从具体实例中归纳出进行独立性检验的基本步骤,使学生充分体会知识的发现过程,并渗透统计的基本思想和方法.情感、态度与价值观使学生体会数学的理性与严谨,了解数学来源于实际,应用于实际的唯物主义思想,培养学生对新知识的科学态度,勇于探索和敢于创新的精神.重点难点教学重点:利用独立性检验的基本思想解决实际问题以及处理步骤; 教学难点:对独立性检验思想的理解.教学过程引入新课提出问题:在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶.(1)利用图形判断秃顶与患心脏病是否有关系;(2)能否在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系? 学生活动:小组合作完成.相应的等高条形图如图所示:比较来说,秃顶的病人中患心脏病的比例大一些,可以在某种程度上认为“秃顶与患心脏病有关”.根据列联表中的数据,得到k =1 437×(214×597-175×451)2389×1 048×665×772≈16.373>6.635,因此,在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系.设计目的:以实际问题创建情境,引起学生的好奇,激发学习和探究知识的兴趣,从而也引起学生的无意注意,在不知不觉中进入教师设计的教学情境中,为本节课的学习做有利的准备.探究新知提出问题:上述解法中,用到了等高条形图和独立性检验两种方法来判断“秃顶与患心脏病是否有关系”,试比较两种方法的关系和各自的特点.学生活动:学生先自由发言,大胆描述.学情预测:独立性检验能精确判断可靠程度,而等高条形图的优点是直观,但只可以粗略判断两个分类变量是否有关系,一般在通过图表判断后还需要用独立性检验来确认,这主要是因为列联表中的数据来源于样本数据,它们反映出来的这种相关性的特征能够在多大程度上代表总体,则需要用独立性检验来确认.提出问题:试总结独立性检验的基本步骤. 学生活动:思考总结,然后回答.活动结果:①根据数据画出列联表;②计算随机变量K 2的观测值;③与已知数据对照下结论.设计目的:比较判断分类变量相关性方法的优缺点,并在解决问题的基础上将独立性检验的具体步骤模式化.理解新知提出问题:你所得的结论在什么范围内有效? 学生活动:学生先自由发言,教师逐步引导学生.学情预测:开始学生的回答可能不全面、不准确,但在其他学生的不断补充、纠正下,会趋于完善.活动结果:“样本只能代表相应总体”,这里的数据来自于医院的住院病人,因此题目中的结论能够很好地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出现错误,除非有其他的证据表明可以进行这种推广.设计意图:让学生充分体会用样本估计总体的思想. 提出问题:两个分类变量X 和Y 的2×2列联表如下若令W =⎪⎪⎪⎪a a +b -cc +d ,试结合前面的学习,分析W 的大小与“X 与Y 有关系”的联系.学生活动:分组讨论,通过协作交流来解决问题,教师进行适当的引导.学情预测:W 越大,越有利于结论“X 与Y 有关系”,它越小,越有利于结论“X 与Y 没有关系”.提出问题:类似于通过K 2的构造判断规则,我们也可以用W 构造一个判断“X 与Y 有关系”的规则,即当W 的观测值w>w 0时,就判断“X 与Y 有关系”;否则,判断“X 与Y 没有关系”.那么,在“X 与Y 没有关系”的前提下P(W≥w 0)=0.01,且P(K 2≥k 0)=0.01,可以通过k 0来确定w 0吗?学生活动:分组讨论,通过协作交流来解决问题,教师进行适当的引导.学情预测:由计算公式可得K 2=W 2×n(a +b)(c +d)(a +c)(b +d),其中n =a +b +c +d.因此,K 2≥k 0等价于W≥k 0×(a +c)(b +d)n(a +b)(c +d),即可取w 0=k 0×(a +c)(b +d)n(a +b)(c +d). 设计目的:通过一组精心设计的问题链来引导和激发学生的参与意识、创新意识,培养探究问题的能力,提升思维的层次.在解决问题的过程中,激发学生的研究兴趣,培养学生的科学理性精神,体会交流、合作和竞争等现代意识.运用新知1为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300由表中数据计算得到K的观察值k≈4.513.在多大程度上可以认为高中生的性别与数学课程之间是否有关系?分析:根据K2的观察值k≈4.513,对照数据确定多大程度上可以认为高中生的性别与数学课程之间是否有关系.解:提下认为“高中生的性别与数学课程之间有关系”.点评:在熟练掌握了两个分类变量的独立性检验方法之后,可直接计算K2的观测值解决实际问题,而没有必要画相应的图形,但是图形的直观性也不可忽视.【变练演编】2某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表.活动设计:学生先独立探索,允许互相交流成果.然后全班交流.学情预测:等高条形图、独立性检验等.设计意图:设置本开放性问题,意在增加问题的多样性、有趣性、探索性,不仅会加深学生对数学的理解、掌握,而且会潜移默化地学会编题、解题.课堂小结1.知识收获:独立性检验的思想方法及一般步骤;2.方法收获:独立性检验的思想方法;3.思维收获:数学来源于生活.设计意图:让学生自己小结,这是一个多维整合的过程,是一个高层次的自我认识过程.补充练习【基础练习】1试问能否在犯错误的概率不超过0.01的前提下认为新措施对防治猪白痢有效?2.在一次恶劣气候的飞行航程中,调查男女乘客在机上晕机的情况如下表所示,据此资料,在犯错误的概率不超过0.1的前提下,你是否认为在恶劣气候飞行中男性比女性更容易晕机?答案:1.提示:K 2的观测值k≈7.317>6.635,故在犯错误的概率不超过0.01的前提下认为新措施对防治猪白痢有效.2.提示:K 2的观测值k≈2.149<2.706,而P(K 2>2.706)≈0.10,故在犯错误的概率不超过0.1的前提下,我们不能认为在恶劣气候飞行中男性比女性更容易晕机.【拓展练习】3.考察黄烟经过培养液处理与否跟发生青花病的关系,调查了457株黄烟,得到下表解:根据公式得K 2的观测值k =457×(25×142-80×210)235×222×105×352≈41.61,由于41.61>10.828,故在犯错误的概率不超过0.001的前提下,说明黄烟经过培养液处理与否跟发生青花病是有关系的.设计说明 本设计主要采用“诱思探究教学法”,其核心是“诱导思维,探索研究”,其教学思想是“教师为主导,学生为主体,训练为主线,思维为主攻”的“四为主”原则.教师不是抛售现成的结论,而是充分暴露学生的思维,展示“发现”的过程,突出“师生互动”的教学,这种设计充分体现了教师的主导作用.学生在一系列的思考、探究中逐步完成了本节的学习任务,充分实现了学生的主体性地位,在整个教学过程中,始终着眼于培养学生的思维能力,这种设计符合现代教学观和学习观的精神,体现了素质教育的要求:教与学有机结合而对立统一.良好的教学设想,必须通过教学实践来体现,教师必须善于驾驭教法,指导学法,完成教学目标,从而使学生愉快地、顺利地、认真地、科学地接受知识.备课资料独立性检验在实际生活中有广泛的应用,解决该类问题的关键是准确的运算. 例1为了研究色盲与性别的关系,调查了1 000人,调查结果如下表所示:根据上述数据,试问在犯错概率不超过0.001的前提下,色盲与性别是否是相互独立的?假设色盲与性别是相互独立的,即色盲与性别无关,依据公式得K2的观测值k=1 000×(442×6-38×514)2≈27.139.956×44×480×520由于27.139>10.828,∴在犯错概率不超过0.001的前提下,可认为色盲与性别有关,从而拒绝原假设,故在犯错概率不超过0.01的前提下,可以认为色盲与性别不是相互独立的.(设计者:杨雪峰田宗臣)。
最新人教版高中数学选修1-2《独立性检验的基本思想及其初步应用》知识导引
1.2独立性检验的基本思想及其初步应用问题探究为了测试某药物的预防效果,进行动物试验,发现在测试的50只未服药的动物中有20只患病,60只服药的动物中有10只患病,试问,该药物是否有效?思路分析:此问题显然不能用线性回归分析的知识解决,本节将学习另一种相关性检验的知识.学完本节之后,我们就能顺利地解决这个问题了.自学导引1.变量取不同的“值”表示,像这样的变量称为分类变量.答案:个体所属的不同类别2.两个分类变量的频数表,称为.答案:列联表3.若要推断论述H:“X与Y有关系”,可按如下步骤进行:(1);(2).答案:(1)通过三维柱形图和二维条形图,粗略地判断两个分类变量是否有关系(2)用假设检验的基本思想判断两个分类变量是否有关疑难剖析1.能够根据列联表作出三维柱形图【例1】根据下表,作出三维柱形图.y1y2总计x1200 100 300x2400 600 1 000 总计600 700 1 300思路分析:作三维柱形图要注意选择恰当的视角,以使每个柱体都能被看到.解:2.能够根据列联表作出二维条形图【例2】根据下表,作出二维条形图.y1y2总计x1200 100 300x2400 600 1 000 总计600 700 1 300思路分析:选用表示y1的取值,用表示y2的取值.3.能够根据列联表作出等高条形图【例3】根据下面的列联表,作出等高条形图.y1y2总计x1200 100 300x2400 600 1 000 总计600 700 1 300思路分析:选用表示y1的取值,用表示y2的取值.4.能够利用独立性检验判断两个变量是否有关系【例4】根据下面的列联表,判断x1与y1是否有关系?你所得的结论在什么范围内有效?y1y2总计x1200 100 300x2400 600 1 000 总计600 700 1 300思路分析:先代入公式K 2=))()()(()(2d b c a d c b a bc ad n ++++-,然后查表得出结论.解:先假设x 1与y 1没有关系,将表中数据代入K 2=))()()(()(2d b c a d c b a bc ad n ++++-=)600100)(400200)(600400)(100200()100400600200(13002++++⨯-⨯ =70060010003008000013002⨯⨯⨯⨯≈66.03>6.635. 所以有99%的把握认为“x 1与y 1有关”. 拓展迁移【拓展点】 为了测试某药物的预防效果,进行动物试验,发现在测试的50只未服药的动物中有20只患病,60只服药的动物中有10只患病.分别利用图形和独立性检验的方法判断药物是否有效?你得到的结论在什么范围内有效? 解:根据题目所给数据得到如下列联表:不患病 患 病 总 计 服 药 50 10 60 未服药 30 20 50 总 计8030110作出相应的二维条形图,其中表示不患病,表示患病,从图中可以看出,未服药中患病的比例高于服药中患病的比例,因此,这种药物有效.又∵K 2=))()()(()(2d b c a d c b a bc ad n ++++-30805060)30102050(1102⨯⨯⨯⨯-⨯=≈7.486>6.635,∴有99%的把握认为该药有效.。
最新人教版高中数学选修2-3《独立性检验的基本思想及其初步应用》教材梳理
庖丁巧解牛知识·巧学一、两个分类变量之间关系的定性分析 1.分类变量取不同的“值”表示个体所属不同类别的分量称为分类变量.这里的“变量”和值都应作为“广义”的变量和值进行理解.例如:对于性别变量,其取值为男和女两种.那么这里的变量指的是性别,同样这里的“值”指的是“男”和“女”,因此,这里所说的“变量”和值不一定取的是具体的数值.要点提示 注意此处空半格分类变量是大量存在的,例如:吸烟变量有吸烟与不吸烟两种类别,而国籍变量则有多种类别. 2.定性分析的方法 (1)频率分析通过对样本的每个分类变量的不同类别的事件发生的频率大小比较来分析分类变量之间是否有关联关系.通常通过列联表列出两个分类变量的占少数表来进行分析. (2)图形分析①三维柱形图.它可以清晰的看出各个频数的相对大小;②二维条形图.如本节引例中,可画叠在一起的二维条形图.浅色条高表示不患肺癌的人数,深色条高表示患肺癌的人数; ③频率分布条形图:为了更清晰的表示引例的特征,我们可用等高条形图表示两种情况下患肺癌的比例.方法归纳 注意此处空半格三维柱形图和二维条形图能更直观地反映出相关数据的总体状况.作三维柱形图时要注意选择恰当的视角,以使每个柱体都能被看到. 二、独立假设状态又分两种情况:吸烟,不吸烟以及患肺癌、未患肺癌.表中排成两列的数据是调查得来的结果,希望根据这4个数据来检验上述两种状态是否有关.这一检验就称为2×2列联表的独立性检验.2.独立性检验:利用随机变量K 2=))()()(()(2d b c a d c b a bc ad n ++++-(其中n=a+b+c+d为样本容量)来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.要点提示 注意此处空半格上述表达式就是统计中重要的K 2统计量,用它的大小可以决定是否拒绝原来的统计假设H 1,如果算出的K 2值较大,就拒绝H 1,也就是拒绝事件“X 与Y 无关”,从而就认为它们是有关的了.深化升华 注意此处空半格独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立.在该假设下构造的随机变量K 2应该很小.如果由观测数据计算得到的K 2的观测值k很大,则在一定程度上说明假设不合理.根据随机变量K 2的含义,可以通过概率P(K 2≥k)的大小来评价该假设不合理的程度有多大,从而说明这“两个分类变量没有关系”这一结论成立的可信程度有多大.三、判断结论成立的可能性的方法1.通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.(1)在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相关越大,H 1成立的可能性就越大.(2)在二维条形图中,可以估计满足条件X=x 1的个体中具有Y=y 1的个体所占的比例ba a+,也可以估计满足条件X=x 2的个体中具有Y=y 2的个体所占的比例dc c+.两个比例的值相差越大,H 1成立的可能性就越大.2.利用独立性检验来考查两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是根据观测数据计算检验随机变量K 2的值k ,其值越大,说明H 1成立的可能性就越大.当得到的观测数据a、b、c、d都不小于5时,可以通过随机变量k 2来确定结论的可信程度.要点提示 注意此处空半格在计算得检验随机变量K 2的值时,要注意临界值6.635,3.841和2.706.如果k 2>6.635,就有99%把握认为“X 与Y 有关系”.如果k 2>3.841,就有95%把握认为“X 与Y 有关系”.如果k 2>2.706,就有90%把握认为“X 与Y 有关系”.而如果k 2≤2.706,就认为没有充分的证据显示“X 与Y 有关系”.误区警示 注意此处空半格使用K 2统计量作2×2列联表的独立性检验时,要求表中的4个数据都要大于5,所以在选取样本容量时一定要注意这一点. 问题·探究问题1某聋哑研究机构对聋哑关系进行抽样调查,在耳聋的657人中有416人哑,而另外不聋的680人中有249人哑.你能运用这组数据得出相应结论吗?思路:认真分析后,我们就是要在聋与哑有无关系上作出结论.于是可以运用独立性检验进行判断.一种方法可以根据题目所给数据得到2×2列联表,计算K 2的值,与临界值做比较;另一种方法可以用三维柱形图粗略估计得出结论.当然,我们也可以采用对照两组人群中哑的比例进行粗略估计,但精确度要相对低一些.根据列联表中数据得到:K 2=680657672665)241249431416(13372⨯⨯⨯⨯-⨯≈95.29>10.828,所以我们有99.9%的把握说聋与哑有关.方法二:我们可以把题目中的数据做出相应的三维柱形图(图),容易比较发现,底面副对角线两个柱体高度的乘积大些,可以在某种程度上认为聋与哑有关. 问题2如何进行独立性检验?试举一例说明之.思路:(1)作统计假设:假设H 0“事件A 与B 独立”;(2)根据公式K 2=))()()(()(2d b c a d c b a bc ad n ++++-,求出K 2;(3)作出统计判断:若K 2>6.635,则有99%的把握说事件A 与B 有关,若K 2>3.841,则有95%的把握说事件A 与B 有关.若K 2≤2.706,则认为没有充分的证据显示事件A 与B 有关.注意在此过程中要使表中的4个数据大于5.如“五一”黄金周前某地的一旅游景点票价上浮,黄金周过后,统计本地与外地来的游客人数,问票价上浮后游客人数与所处地区是否有关系?探究:按照独立性检验的基本步骤,假设票价上浮后游客人数与所处地区没有关系.因为k 2=4907273833964249)1331284220651407(76452⨯⨯⨯⨯-⨯⨯≈30.35>6.635.所以假设不成立,我们有99%的把握认为票价上浮后游客人数与所处地区有关系. 典题·热题例1为了研究人的性别与患色盲与否是否有关,某研究所进行了随机调查.发现在调查的480名男性中有39名患有色盲,520名女性中有6名患有色盲,试检验人的性别与患色盲与否有关?思路分析:由题意列出2×2列联表,由公式计算出K 2,与临界值做比较,得出事件成立的可信程度.解:由题意所得数据列2×2列联表得:由公式得K 2=52048095545)441651439(10002⨯⨯⨯⨯-⨯⨯≈28.23.因为28.23>10.828,所以有99.9%的把握认为患色盲与否与人的性别有关,男性患色盲的概率要比女性大很多.方法归纳 注意此处空半格独立性检验问题的基本步骤为:(1)找相关数据,作列联表;(2)求统计量K 2;(3)判断可能性,注意与临界值做比较,得出事件有关的确信度.例2某县对在职的71名高中数学教师就支持新的数学教材还是支持旧的数学教材做了调查,结果如下表所示:根据此资料,你是否认为教龄的长短与支持新的数学教材有关?思路分析:根据独立性检验思想,由公式计算出K 2,然后与两临界值比较得出结论.解:由公式得K 2=49223437)10252412(71))()()(()(22⨯⨯⨯⨯-⨯=++++-d b c a d c b a bc ad n ≈0.08. 由K 2<2.706,我们没有充分的证据说明教龄的长短与支持新的数学教材有关.深化升华 注意此处空半格独立性检验能帮助我们对日常生活中的实际问题作出合理的推断和预测.因此要在学习中,应通过案例分析,理解和掌握独立性检验的方法,体会其基本思想在解决实际问题中的应用,以提高我们分析和处理问题的能力.例3在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.利用独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论是在什么范围内有效? 思路分析:由题意列出2×2列联表,利用公式求得K 2后与临界值比较,得出结论后要注意这组数据是来自于住院的病人,而不是随机对全体人群采样.由公式得K 2=7726651048389)451175597214(14372⨯⨯⨯⨯-⨯⨯≈10.828.所以有99.9%的把握认为“秃顶与患心脏病有关”.误区警示 注意此处空半格在应用公式时,切忌误用公式为K 2=))()()(()(2d b c a d c b a bc ad n ++++-.这会使结果相差甚远.例4某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分也为优秀的人数如下表所示,则数学成绩优秀与物理、化学、总分也优秀哪个关系注:该年级此次考试中数学成绩优秀的有360人,非优秀的有880人. 思路分析:分别列出两个量间的2×2列联表,将数据代入公式求得K 2,对照K 2与临界值及三个的大小关系得出结论.代入公式可得K =270.114 3.(3)列出数学与总分优秀的2×2列联表如下:由上面分析可知,数学成绩优秀与物理、化学、总分优秀都有关系.由计算K2的值都大于10.828,由此说明都有99.9%的把握认为数学优秀与物理、化学、总分优秀都有关系,但与总分优秀关系最大,物理次之.深化升华注意此处空半格本例中,我们利用2×2列联表的独立假设分析了数学与物理、化学、总分优秀是否有关系.由此发现,学好数学对总分及学好物理关联很大,因此我们要努力学好数学.其次,本例还告诉我们如何利用所学习的独立性假设的思想方法来分析多个分类变量之间关系的方法.。
(新课程)高中数学《1.2-独立性检验的基本思想及其初步应用》课件-新人教A版选修1-2省优质课
②2×2列联表 一般地,假设两个分类变量X和Y,它们旳取值分别为 {x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为
y1 y2
观察. 值k
③假如
,就推断“X与Y有关系”,这种推
环节 断
k≥k0不超出α,不然就觉得在犯错误旳概率不超出α旳前
提下犯不错能推误断旳“概X率与Y有关系”,或者在样本数据中
支持结论“X与Y有关系”
没有发觉足够证据
3.独立性检验临界值表
P(K2 ≥k0)
0.50
0.40
0.25
0.15
0.10
0.05
【变式3】 下表是某地域旳一种传染病与饮用水旳调查表:
得病 不得病 总计
洁净水
52 466 518
不洁净水 94 218 312
总计 146 684 830
(1)这种传染病是否与饮用水旳卫生程度有关, 请阐明理由; (2)若饮用洁净水得病5人,不得病50人,饮用不洁净水得病9 人,不得病22人.按此样本数据分析这种疾病是否与饮用水 有关,并比较两种样本在反应总体时旳差别.
【变式1】 为研究学生旳数学成绩与对学习数学旳爱好是否有关, 对某年级学生作调查得到如下数据:
爱好浓厚旳 爱好不浓厚旳
总计
成绩优异 成绩较差 总计
64
30
94
22
73
95
86
103 189
判断学生旳数学成绩好坏与对学习数学旳爱好是否有关?
解 由公式得 K2 的观测值 k=1898×6×641×037×3-952×2×94302≈38.459. ∵38.459>10.828,∴有 99.9%的把握说学生学习数学的兴趣与数 学成绩是有关的.
人教新课标版数学高二人教A选修1-2素材 独立性检验的基本思想及其初步应用基础梳理与自测
独立性检验的基本思想及其初步应用基础梳理与自测
基础梳理
1.分类变量的定义.
如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
2.2×2列联表.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
y1y2总计
x1 a b a+b
x2 c d c+d
总
a+c b+d a+b+c+d
计
3.
,基础自测
1.下列变量中不属于分类变量的是(B)
A.性别B.吸烟
C.宗教信仰D.国籍
解析:“吸烟”不是分类变量,“是否吸烟”才是分类变量.故选B.
2.下面是一个2×2列联表
y1y2合计
x1 a 21 73
x2 2 25 27
合计 b 46 100
则表中a、b
A.94、96 B.52、50
C.52、54 D.54、52
解析:由a+21=73,得a=52,由b+46=100,得b=54.
3.某高校“统计初步”课程的教师随机调查了选修该课程的一些学生情况,具体数据如下表:
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到K2=50×(13×20-10×7)2 23×27×20×30
≈4.844>3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为____________.解析:P(K2>3.841)=0.05,判断出错的可能性为5%.
答案:5%。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
庖丁巧解牛知识·巧学 1.独立性检验利用随机变量来确定在多大程度上可认为“两个分类变量有关系”的方法,称为两个分类变量的独立性检验.独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论成立的可信度,首先假设结论不成立,即假设“两个分类变量没有关系”成立,在该假设下构造的随机变量应该很小.如果由观测数据计算得到的观测值很大,则在一定程度上说明假设不合理. 一般地,假设有两个分类变量,列出两类分类变量的频数表称为列联表,又称为2×2列联表. 知识拓展列联表中总体数据的情况也可以用三维柱形图和二维条形图直观地来反映.通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.如上表所示,该表就称为2×2列联表,意思是要考虑两个事件:人的性别与是否晕船;每个事件又分两种情况:男人,女人以及晕船与不晕船.表中排成两行两列的数据是调查得来的结果,希望根据这4个数据来检验上述两个事件是否有关.这一检验问题就称为2×2列联表的独立性检验.方法点拨 在看表时要明确合计指的是哪些数据的和:列的合计是所在列所有数据的和;行的合计是所在行所有数据的和;它们的交叉处是所有研究对象的和(样本总量),既等于所在列的和又等于行的和. 3.K 2统计量K 2=))()()(()(2d b c a d c b a bc ad n ++++-(其中n=a+b+c+d 为样本总量).随机变量K 2的值越大,说明两个事件“A 与B 有关系”成立的可能性越大.具体如下: K 2>10.828,就有99.9%的把握认为“A 与B 有关系”; K 2>7.879,就有99.5%的把握认为“A 与B 有关系”; K 2>6.635,就有99%的把握认为“A 与B 有关系”; K 2>5.024,就有97.5%的把握认为“A 与B 有关系”; K 2>3.841,就有95%的把握认为“A 与B 有关系”; K 2>2.706,就有90%的把握认为“A 与B 有关系”; K 2≤2.706,就认为没有充分的证据显示“A 与B 有关系”. 知识拓展K 2也常表示为K 2=2121221122211)(++++-n n n n n n n n n .(其中n 11代表第一行第一列的数据;n 1+代表第一行数据的合计,n +1代表第一列数据的合计) 4.两个临界值:3.841和6.635经过对K 2统计量分布的研究,已经得到了两个临界值:3.841与6.635.当根据具体的数据算出的K 2>3.841时,有95%的把握说事件A 与B 有关;当K 2>6.635时,有99%的把握说事件A 与B 有关.当K 2≤3.841时,认为事件A 与B 是无关的. 方法归纳独立性检验的步骤:(1)计算卡方K 2=2121221122211)(++++-n n n n n n n n n ;(2)比较K 2与两个临界值:3.841和6.635的大小,并得出结论. 误区警示 使用K 2统计量作2×2列联表的独立性检验时,要求表中的4个数据都要大于5.为此,在选取样本的容量时一定要注意这一点. 问题·探究问题1 若已知两个分类变量值域内的数据,如何判断它们之间是否有关系? 导思:可以从直观上用三维柱形图和二维条形图以及独立性检验两种办法来判断.探究:一般地,假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2}时,其样品频数列联表为:1.通过三维柱形图和二维条形图,可以粗略判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.(1)在三维柱形图中,主对角线上两个柱形高度的乘积ad 与副对角线上的两个柱形高度的乘积bc 相差越大,A 成立的可能性越大.(2)在二维条形图中,可以估计满足条件X=x 1的个体中具有Y=y 1的个体所占的比例为b a a +,也可以估计满足条件X=x 2的个体中具有Y=y 2的个体所占比例为dc c +,两个比例相差越大,A 成立的可能性越大.2.可以利用独立性检验来考察两个变量是否有关系,并且能较精确地给出这种判断的可靠程度.问题2 独立性检验的含义是什么?K 2是如何得出的?导思:我们可以先假设事件A 和B 独立,然后用相互独立事件的概率方法来研究. 探究:我们以吸烟(A)和患慢性气管炎(B)为例来研究.如下表:(1)首先,当吸烟(A)和患慢性气管炎(B)无关时,即事件A 和B 独立,这时应该有P(AB)=P(A)P(B)成立.我们用字母H 0表示上式,即H 0:P(AB)=P(A)P(B),并称之为统计假设,当H 0成立时,下面的三个式子也都成立:P(A B)=P(A )P(B),P(A B )=P(A)P(B ),P(A B )=P(A )P(B ).根据概率的统计定义,上面提到的众多事件的概率都可用相应的频率来估计,例如,P(AB)的估计为n n 11,P(A)的估计为n n +1,P(B)的估计为nn 1+. 于是n n 11与n n +1·n n 1+应该很接近,n n 12与nn +1·n n 2+应该很接近. 或者说(n n 11-n n +1·n n 1+)2、(n n 12-n n +1·n n 2+)2、(n n 21-n n +2·n n 1+)2和(nn 22-n n 2+·n n2+)2应该比较小,从而nn n n n n n n n n n n n n n n n n n n n n n n n n n n n n n n n n n n n n n n 2222222122122121221121121111)()()()(++++++++++++++++∙∙-+∙∙-+∙∙-+∙∙-也应该是比较小.(2)上面的表达式就是统计中非常有用的K 2统计量,它可以化简为K 2=2121221122211)(++++-n n n n n n n n n .用它的大小可以决定是否拒绝原来的统计假设H 0.如果算出的K 2值较大,就拒绝H 0,也就是拒绝“事件A 和B 无关”,从而就认为它们是有关的了. 典题·热题例1调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表.试问能以多大把握认为婴儿的性别与出生时间有关.是否成立.解:由公式K 2=57323455)3182624(89)(22121221122211⨯⨯⨯⨯-⨯⨯=-++++n n n n n n n n n ≈3.688 92<3.841.故婴儿的性别与出生时间是相互独立的(也可以说没有充分的证据显示婴儿的性别与出生时间有关).深化升华 计算出的统计量K 2的值要与两个临界值3.841与6.635比较,从而得到答案.要特别注意最后结论的不同说法.例2为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表:请问有多大的把握认为药物有效?思路解析:首先判定表格中的数据是否都大于5,这一点显然成立,然后由公式直接求解,最后再与两个临界值比较得出结论.解:K 2=75305055)45203010(105)(22121221121211⨯⨯⨯⨯-⨯⨯=-++++n n n n n n n n n ≈6.109>3.841.所以有95%的把握说药物有效.误区警示 根据具体的数据算出的K 2>3.841时,有95%的把握说事件A 与B 有关.但不是说一定有关,有5%的犯错误的可能.例3在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.请用独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效? 思路解析:首先应根据题意列出2×2列联表,结合独立性检验的方法来作出相应的结论. 解:根据题目所给数据得到如下列联表:根据列联表中的数据,得到K 2=7726651048389)451175597214(14372⨯⨯⨯⨯-⨯⨯≈16.373>6.635.所以有99%的把握认为“秃顶与患心脏病有关”.因为这组数据来自住院的病人,因此所得到的结论适合于住院的群体.例4为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:性别与喜欢数学课列联表思路解析:结合独立性检验的本质来解释比较合适.解:可以有约95%以上的把握认为“性别与喜欢数学课之间有关系”.作出这样判断的依据是独立性检验的基本思想,具体过程如下:分别用a 、b 、c 、d 表示样本中的喜欢数学课的男生人数、不喜欢数学课的男生人数、喜欢数学课的女生人数、不喜欢数学课的女生人数.如果性别与是否喜欢数学课有关系,则男生中喜欢数学课的比例ba a+与女生中喜欢数学课的比例d c c +应该相差很多,即|b a a +-d c c +|=|))((d c b a bcad ++-|应很大.将上式等号右边乘以常数因子))(())()((d b c a d c b a d c b a +++++++,然后平方得K 2=))()()(()(2d b c a d c b a bc ad n ++++-(其中n=a+b+c+d 为样本总量).因此K 2越大,“性别与喜欢数学课之间有关系”成立的可能性越大.另一方面,假设“性别与喜欢数学课之间没有关系”,由于事件A={K 2≥3.841}的概率为P(K 2≥3.841)≈0.05,因此事件A 是一个小概率事件,而由样本数据计算得K 2≈4.513,这表明小概率事件A 发生.根据假设检验的基本原理,我们应该断定“性别与喜欢数学课之间有关系”成立,并且这种判断出错的可能性约为5%.所以约有95%的把握认为“性别与喜欢数学课之间有关系”. 例5“五一”黄金周前某地的一旅游景点票价上浮,黄金周过后,统计本地与外地来的游客人数,与去年同期相比,结果如下:思路解析:用K 2来检验相关性,可以得到比较准确的结果. 解:假设票价上浮与游客所处地区没有关系,因为K 2=4907273833964249)1331284220651470(76452⨯⨯⨯⨯-⨯⨯≈30.35>6.635.所以假设不成立,即有99%的把握认为票价上浮与游客所处地区有关. 方法归纳 在日常生活中,我们经常会面临一些需要推断的问题,在对这些问题作出推断时,不能仅凭主观臆断作出结论,需要通过试验来收集数据,并依据独立性检验的基本思想作出合理推断.。