2019年高中数学湘教版选修2-3讲义+精练:第8章8.4列联表独立性分析案例含答案
高中数学新湘教版精品教案《湖南教育出版社高中数学选修2-3 8.4 列联表独立性分析案例》
《列联表独立性分析案例》教学设计授课教师:阮金锋指导教师:缪向光阮龙杰送选单位:福建省福安市第一中学【教材分析】这节课是湘教版2021课标版高中数学《选修2—3》第八章第4节的内容,是概率与统计的重要内容.在此之前,学生已经学习了随机事件发生的概率、概率的运算、事件的独立性、正态分布等内容.本节课在对前面学过有关知识的基础上,通过分析“吸烟与患肺癌是否有关”这一统计案例,明确独立性检验的基本步骤,理解独立性检验的基本思想.独立性检验的基本思想是建立在假设检验思想(小概率事件在一次试验中几乎不可能发生)基础之上,是一种重要的假设检验方法.独立性检验的基本思想的理解,有利于提升统计素养,有利于提升抽象概括、数学建模、数据分析等数学核心素养.【教学目标】1.知识与技能通过典型案例的探究,理解独立性检验的基本思想,会对两个分类变量进行独立性检验,明确独立性检验的基本步骤,理解独立性检验与反证法的联系与区别,并能解决实际问题.2.过程与方法通过数据统计、分析和计算过程,从具体实例中学会用样本来估计总体的统计思想.通过主动探究、自主学习,从具体实例中抽象、概括、总结出独立性检验的基本原理和基本步骤,同时充分体会知识的发现过程.3.情感、态度与价值观通过本节课的学习,初步提高从生活中发现数学问题、解决数学问题的能力,提升抽象概括、数学建模、数据分析等数学素养.通过学生分析问题、解决问题的学习过程,激发学习兴趣,培养学生勇于探索的科学精神.【学情分析】学生之前已学了概率统计的相关内容,有了一定的统计分析能力,对本节课的学习奠定了一定的基础.但学生缺乏假设检验的有关知识背景,导致对独立性检验的基本思想的学习与理解存在困难,学生很难理解独立性X是从怎么检验的说理方式.为什么要假设?为什么判断会出错?既然出错了怎么又可以下结论?统计量卡方2X分布概率临界值表怎么理解?独立性检验思想与反证法的联系与区别如何?这些问题成构造出来的?卡方2为学生学习本节课的障碍,如果没有根本性解决,学生只能依葫画瓢,只能死记硬背,机械套用卡方公式.【教学重点】通过生活实例体会独立性检验的基本思想,掌握独立性检验的一般步骤.【教学难点】X的由来与结构特征1.统计量卡方2X分布概率临界值表的本质理解2.卡方23.独立性检验的基本思想的理解4.独立性检验思想与反证法的联系与区别5.小概率事件原理的理解【教学方式】多媒体辅助,几何画板辅助,探究式教学(以问题串指引)【教学策略】以“吸烟与患肺癌是否相关”案例的解决为主线,问题串指引探究教学,类比反证法思想,体会独立性检验的实际运用。
数学同步优化指导(湘教选修23)练习:8.4列联表独立性分析案例活页作业19Word含解析
活页作业(十九)列联表独立性分析案例農础巩固、选择题1 . 对于因素X 与Y 的随机变量X 的值,下列说法正确的是 ( ) A. X 越大,“X 与Y 有关系的可信程度越小B. X 越小,“X 与Y 有关系的可信程度越小C. X 越接近于0,“ X 与Y 没有关系”的可信程度越小D. X 越大,“X 与Y 没有关系”的可信程度越大解析:X 越大, “ X 与Y 没有关系”的可信程度越小,则 “X 与Y 有关系”的可信程度越大,即X 越小,“X 与Y 有关系”的可信程度越小.答案:B 2.两个分类变量 X 和Y ,值域分别为{X i , X 2}和{Y i , 丫2},其样本频数分别是 a = 10, b = 21, c + d = 35•若X 与Y 有关系的可信程度为 90%,则c 等于()A . 4B . 5C . 6••• c = 5时,X 与Y 有关系的可信程度为 90%,而其余的值c = 4, c = 6, c = 7皆不满足. 答案:B3.关于两个分类变量 A , B的下列说法中,正确的个数为 ()① A 与B 相关性越大,则 X 的值就越大; ② A 与B 无关,即A 与B 互不影响;③ X 的大小是判定A 与B 是否相关的唯一依据.C . 3D . 0解析:①正确,X 的值的大小是用来检验 A 与B 的相关性的,解析:当c = 5时,15X 51 X 31 X 353.023 6 > 2.706.X 的值越大,A 与B 的相关性越大•②正确,答案:BA 与B 无关即A 与B 相互独立.③不正确.4•为了探究学生的学习成绩是否与学习时间长短有关,在调查的 500名学习时间较长 的学生中有39名学习成绩比较好,500名学习时间较短的学生中有 6名学习成绩比较好,那么你认为学生的学习成绩与学习时间长短有关的把握为( )B . 95%C . 99%解析:计算出X 与两个临界值比较,D .都不正确1 000 X 39 X 494 — 6 X46145 X 955 X 500 X 500 25.340 3 > 6.635.66X 10X 30— 5X 21所以有99%的把握说学生的学习成绩与学习时间长短有关.故选答案:C 二、填空题25. _____________________ 独立性检验中,两个分类变量“ X 和Y 有关系”的可信程度是 97.5% ,则随机变量x 的取值范围是 .解析:当X >5.024时,有97.5%的把握判断 X 与Y 有关系;当 ;>6.635时,有99%的 把握判断X 与Y 有关系.••• 5.024<6.635.答案:(5.024,6.635]6. ____________ 有两个分类变量 X 与Y ,有一组观测的2 X 2列联表如下,其中,a,15-a 均为大于 5的整数,贝U a = 时,有90%以上的把握认为“ X 与Y 之间有关系”.解析:要使有90%以上的X 与Y 之间有关系,贝U —X 2.706,2 2即 X=西回30土切二(20-a I15 -a L =貨(伽-6°)〉2 706 20X 45X 15X 50 60X 90 ''解得 a > 7.19 或 a v 2.04.又因为 a >5,且 15- a >5, a € Z ,所以当a 取8或9时,有90%以上的把握认为 “X 与Y 之间有关系”. 答案:8或9 三、解答题7. 考察小麦种子经过灭菌与否跟发生黑穗病的关系.经试验观察,得到数据如下表所 示:试根据上述数据判断种子灭菌与发生黑穗病是否有关.22460 X 26 X 200 - 184 X 50.一.解:x=疋 4.804.210X 250X 76 X 384由于4.804 > 3.841,所以有95%的把握认为种子灭菌与发生黑穗病是有关系的. &有甲、乙两个班级进行数学考试,按照大于或等于 85分为优秀,85分以下为非优秀统计成绩后,得到如下的列联表.已知在全部105人中随机抽取1人为优秀的概率为-. ⑴请完成上面的列联表. (2)根据列联表的数据,若按95%的可靠性要求,能否认为“成绩优秀与否和班级有关n (ad — be fa +bc +d a +e b + d系”? 参考公式: 附表: 或10号的概率.解:⑴ (3)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的 10名学生从2进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号•试求抽到 到116(2)根据列联表中的数据,得到2105X (10X 30— 20X 45 )_ 55X 50X 30X 75 〜 6.109> 3.841 因此有95%的把握认为“成绩优秀与否和班级有关系 ⑶设“抽到6或10号”为事件A ,先后两次抛掷一枚均匀的骰子,出现的点数为 (x .y). 所有的基本事件有(1,1), (1,2), (1,3),…,(6,6),共36个. 事件 A 包含的基本事件有:(1,5), (2,4), (3,3), (4,2), (5,1), (4,6), (5,5), (6,4), 个」P(A )=36=2 払触提升、选择题 1 .硕士学位与博士学位的一个随机样本给出了关于所获取学位类别与学生性别的分类 数据如表所示:根据以上数据,则()A •性别与获取学位类别有关B •性别与获取学位类别无关C.性别决定获取学位的类别D•以上都是错误的解析:由列联表可得x= 340彳16“ 8- 143X 272疋7.34 > 6.635,所以有305 X 35X 189X 151 认为性别与获取学位的类别有关.答案:A2•某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系, 52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是表199%的把握随机抽查( )A •成绩C.智商 D .阅读量2 2的疋中斗 2 52X(6X 22 - 14X 10 252 X 8解析:因为X==16X 36 X 32X 20 16X 36X 32X 202 22_ 52X(4 X 20—16X 12)_ 52X 11216X 36 X 32X 20 -"16X 36X 32X20,2 52X(8 X 24 —12X 8$52 X 962X16X 36X 32X 2016X 36 X 32X20,252X 14X 30 —6X 2 252X 408216X 36X 32X 20 16X 36 X 32X 20则有X> X> X> X,所以阅读量与性别关联的可能性最大.答案:D二、填空题3. 在吸烟与患肺病是否相关的判断中,有下列的说法:①若统计量X>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是______________ (填序号).解析:统计量X是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①错误;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.答案:③4. 某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:(填“是”或“否”).解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于 40岁的42名观众中有27名观众收看新闻节目,即 —=一匚=刍,两者相差较大,所以,经直a +b 58c +d 42 观分析,收看新闻节目的观众与年龄是有关的.答案:是 三、解答题5.现对某市工薪阶层关于“楼市限购政策”的态度进行调查,随机抽查了 50人,他们月收入(单位:百元)的频数分布及对“楼市限购政策”的赞成人数如下表:(1)根据以上统计数据填写下面 22列联表,并回答是否有99%的把握认为当月收入以5 500元为分界点时,该市的工薪阶层对“楼市限购政策”的态度有差异;(2 “楼市限购政策”的概率.解:(1)由题意得2 X 2列联表:异,根据列联表中的数据,得到2_ 50X (3X 11— 7X 29:10X 40X 32X 18所以没有99%的把握认为当月收入以 5 500元为分界点时,该市的工薪阶层对 “楼市限 购政策”的态度有差异.(2)已知在收入[55,65)中共有5人,2人赞成,3人不赞成•设至少有一个不赞成 “楼市限购政策”为事件A ,则P (A )= 1 —密=羌.故所求概率为T 9..C 5 10 106.272 V 6.635,6•为了研究“教学方式”对教学质量的影响,某高中数学老师分别用两种不同的教学方式对入学数学平均分数和优秀率都相同的甲、乙两个高一新班进行教学(勤奋程度和自觉性都一样)•以下茎叶图为甲、乙两班(每班均为20人)学生的数学期末考试成绩.(1) 87分的同学至少有一名被抽中的概率.(2)学校规定:成绩不低于75分的为优秀•请填写下面的2 X 2列联表,并判断有多大把握认为"成绩优秀与教学方式有关”2 参考公式:x=nad二也—I(a + b ]c + d j[a + c[b + d )丿解:⑴记成绩为87分的同学为A , B ,其他不低于80分的同学为C , D , E. “从甲班 数学成绩不低于 80分的同学中随机抽取两名同学”的一切可能结果组成的基本事件有(A ,B), (A , C), (A , D), (A , E), (B , C), (B , D), (B , E) , (C , D) , (C , E) , (D , E),共 10个.“至少有一名87分的同学被抽中”所组成的基本事件有(A , B) , (A , C) , (A , D) , (A , E) , (B , C) , (B , D) , (B , E),共 7 个,所以 P =洽.& 归6 X 6 — 14X 14 = 6.4 > 5.024,20 X 20 X 20 X 20因此,我们有97.5%的把握认为成绩优秀与教学方式有关.F 面临界表仅供参。
2019年数学新同步湘教版选修2-3讲义+精练:第8章 8.2.3 事件的独立性 Word版含解析
8.2.3事件的独立性[读教材·填要点]1.事件A,B独立用Ω1表示第一个试验的全集,用Ω2表示第二个试验的全集,如果这两个试验是独立的,就称全集Ω1和Ω2独立.当事件的全集Ω1和Ω2独立,对于A⊆Ω1和B⊆Ω2,有P(A∩B)=P(A)P(B).2.事件A1,A2,A3,…,A n相互独立对于j=1,2,…,n,用Ωj表示第j个试验的全集,如果这n个试验是相互独立的,就称这些试验的全集Ω1,Ω2,…,Ωn是相互独立的.如果试验的全集Ω1,Ω2,…,Ωn是相互独立的,则对A1⊆Ω1,A2⊆Ω2,…,A n⊆Ωn,有P(A1∩A2∩…∩A n)=P(A1)P(A2)…P(A n).[小问题·大思维]1.两个事件相互独立与互斥有什么区别?提示:两个事件相互独立是指一个事件的发生与否对另一个事件发生的概率没有影响.两个事件互斥是指两个事件不可能同时发生,而相互独立的两个事件是可以同时发生的,相互独立事件和互斥事件之间没有联系.2.公式P(A∩B)=P(A)P(B)使用的前提条件是什么?提示:P(A∩B)=P(A)P(B)使用的前提条件是事件A与事件B相互独立,同样的,只有当A1,A2,…,A n相互独立时,这几个事件同时发生的概率才等于每个事件发生的概率之积,即P(A1∩A2∩A n)=P(A1)P(A2)…P(A n).[例1](1)甲组3名男生,2名女生;乙组2名男生,3名女生,现从甲、乙两组中各选1名同学参加演讲比赛,“从甲组中选出1名男生”与“从乙组中选出1名女生”.(2)容器内盛有5个白乒乓球和3个黄乒乓球,“从8个球中任意取出1个,取出的是白球”与“从剩下的7个球中任意取出1个,取出的还是白球”.[解](1)“从甲组中选出1名男生”这一事件是否发生,对“从乙组中选出1名女生”这一事件是否发生没有影响,所以它们是相互独立事件.(2)“从8个球中任意取出1个,取出的是白球”的概率为58,若这一事件发生了,则“从剩下的7个球中任意取出1个,取出的仍是白球”的概率为47;若前一事件没有发生,则后一事件发生的概率为57,可见,前一事件是否发生,对后一事件发生的概率有影响,所以二者不是相互独立事件.两个事件是否相互独立的判断(1)直接法:由事件本身的性质直接判定两个事件发生是否相互影响.(2)定义法:如果事件A ,B 同时发生的概率等于事件A 发生的概率与事件B 发生的概率的积,则事件A ,B 为相互独立事件.(3)条件概率法:当P (A )>0时,可用P (B |A )=P (B )判断.1.从一副扑克牌(52张)中任抽一张,设A =“抽得老K ”,B =“抽得红牌”,判断事件A 与B 是否相互独立?是否互斥?是否对立?为什么?解:由于事件A 为“抽得老K ”,事件B 为“抽得红牌”,故抽得红牌中有可能抽到红桃K 或方块K ,即有可能抽到老K ,故事件A ,B 有可能同时发生,显然它们不是互斥事件,更不是对立事件,以下考虑他们是否互为独立事件:抽到老K 的概率为P (A )=452=113,抽到红牌的概率P (B )=2652=12,故P (A )P (B )=113×12=126,事件A ∩B即为“既抽得老K 又抽得红牌”,亦即“抽得红老K 或方块老K ”,故P (A ∩B )=252=126,从而有P (A )·P (B )=P (A ∩B ),因此A 与B 互为独立事件.[例2] 求:(1)第1次取出的2个球都是白球,第2次取出的2个球都是红球的概率; (2)第1次取出的2个球1个是白球、1个是红球,第2次取出的2个球都是白球的概率.[解] 记:“第1次取出的2个球都是白球”的事件为A ,“第2次取出的2个球都是红球”的事件为B ,“第1次取出的2个球1个是白球、1个是红球”的事件为C ,很明显,由于每次取出后再放回,A、B、C都是相互独立事件.(1)P(A∩B)=P(A)P(B)=C23C25·C22C25=310·110=3100.故第1次取出的2个球都是白球,第2次取出的2个球都是红球的概率是3100.(2)P(C∩A)=P(C)P(A)=C13·C12C25·C23C25=610·310=950.故第1次取出的2个球1个是白球、1个是红球,第2次取出的2个球都是白球的概率是9 50.2.某同学参加科普知识竞赛,需回答三个问题.竞赛规则规定:答对第一、二、三个问题分别得100分、100分、200分,答错得零分.假设这名同学答对第一、二、三个问题的概率分别为0.8,0.7,0.6,且各题答对与否相互之间没有影响.(1)求这名同学得300分的概率;(2)求这名同学至少得300分的概率.解:记“这名同学答对第i个问题”为事件A i(i=1,2,3),则P(A1)=0.8,P(A2)=0.7,P(A3)=0.6.(1)这名同学得300分的概率P1=P(A1A2A3)+P(A1A2A3)=P(A1)P(A2)P(A3)+P(A1)P(A2)P(A3)=0.8×0.3×0.6+0.2×0.7×0.6=0.228.(2)这名同学至少得300分的概率P2=P1+P(A1A2A3)=0.228+0.8×0.7×0.6=0.564.[例3]100米跑(互不影响)的成绩在13 s内(称为合格)的概率分别为25,34,13,若对这三名短跑运动员的100 m 跑的成绩进行一次检测,则(1)三人都合格的概率;(2)三人都不合格的概率;(3)出现几人合格的概率最大.[解] 记“甲、乙、丙三人100米跑成绩合格”分别为事件A ,B ,C ,显然事件A ,B ,C 相互独立,则P (A )=25,P (B )=34,P (C )=13.设恰有k 人合格的概率为P k (k =0,1,2,3)(1)三人都合格的概率:P 3=P (A ∩B ∩C )=P (A )P (B )P (C )=25×34×13=110.(2)三人都不合格的概率:P 0=P (A -∩B -∩C -)=P (A -)P (B -)P (C -)=35×14×23=110.(3)恰有两人合格的概率:P 2=P (A ∩B ∩C -)+P (A ∩B -∩C )+P (A -∩B ∩C ) =25×34×23+25×14×13+35×34×13=2360. 恰有一人合格的概率:P 1=1-P 0-P 2-P 3=1-110-2360-110=2560=512.综合(1)(2)(3)可知P 1最大.所以出现恰有1人合格的概率最大.解决此类问题的关键是弄清相互独立的事件,还要注意互斥事件的拆分,以及对立事件概率的求法的运用,即三个公式的联用:P (A ∪B )=P (A )+P (B )(A ,B 互斥),P (A )=1-P (A ),P (A ∩B )=P (A )P (B )(A ,B 相互独立).3.在某项比赛的选拔赛中,种子选手M 与B 1,B 2,B 3三位非种子选手分别进行一场对抗赛,按以往多次比赛的统计,M 获胜的概率分别为34,23,12,且各场比赛互不影响.(1)若M 至少获胜两场的概率大于710,则M 入选比赛,否则不予入选,问M 是否会入选比赛?(2)求M 获胜两场的概率.解:记M 与B 1,B 2,B 3进行对抗赛获胜的事件分别为A ,B ,C ,M 至少获胜两场的事件为D ,则P (A )=34,P (B )=23,P (C )=12,事件A ,B ,C 相互独立,用X 表示“M 获胜的场次”.(1)则P (D )=P (ABC )+P (ABC )+P (ABC )+P (ABC )=34×23×12+14×23×12+34×13×12+34×23×12=1724,因为1724>710,所以M 会入选比赛. (2)P (X =2)=P (D )-P (ABC )=1724-34×23×12=1124.路就能正常工作.假定在某段时间内每个开关能够闭合的概率都是0.7,计算在这段时间内线路正常工作的概率.[尝试] [巧思] 根据题意,这段时间内线路正常工作,就是指3个开关中至少有1个能够闭合,这可以包括恰有其中某1个开关闭合、恰有其中某2个开关闭合、恰有3个开关都闭合等几种互斥的情况,逐一求其概率较为麻烦,为此,我们转而先求3个开关都不能闭合的概率,从而求得其对立事件——3个开关中至少有1个能够闭合的概率.[妙解] 如图所示,分别记这段时间内开关J A ,J B ,J C 能够闭合为事件A ,B ,C .由题意,这段时间内3个开关是否能够闭合相互之间没有影响,根据相互独立事件的概率乘法公式,这段时间内3个开关都不闭合的概率是P (A -∩B -∩C -)=P (A -)P (B -)P (C -) =[1-P (A )][1-P (B )][1-P (C )] =(1-0.7)(1-0.7)(1-0.7)=0.027.于是这段时间内至少有1个开关能够闭合,从而使线路能正常工作的概率是1-P (A-∩B -∩C -)=1-0.027=0.973.答:在这段时间内线路正常工作的概率是0.973.1.坛子中放有3个白球和2个黑球,从中进行不放回地摸球,用A 1表示第一次摸得白球,A 2表示第二次摸得白球,则A 1和A 2是( )A .互斥的事件B .相互独立的事件C .对立的事件D .不相互独立的事件解析:选D 由互斥事件、对立事件、相互独立事件的定义可知,A 1与A 2不互斥也不对立,同时A 1与A 2也不相互独立.2.打靶时,甲每打10次可中靶8次,乙每打10次可中靶7次,若两人同时射击,则他们同时中靶的概率是( )A.1425B.1225C.34D.35解析:选A 由题意知P 甲=810=45,P 乙=710,所以P =P 甲·P 乙=1425. 3.两个实习生每人加工一个零件,加工为一等品的概率分别为23和34,两个零件是否加工为一等品相互独立,则这两个零件中恰有一个一等品的概率为( )A.12B.512C.14D.16解析:选B 设事件A :甲实习生加工的零件为一等品;事件B :乙实习生加工的零件为一等品,则P (A )=23,P (B )=34,所以这两个零件中恰有一个一等品的概率为:P (A ∩B )+P (A ∩B )=P (A )P (B )+P (A )P (B )=23×⎝⎛⎭⎫1-34+⎝⎛⎭⎫1-23×34=512. 4.有一个数学难题,在半小时内,甲能解决的概率是12,乙能解决的概率是13,2人试图独立地在半小时内解决它,则2人都未解决的概率为________,问题得到解决的概率为________. 解析:甲、乙两人都未能解决为⎝⎛⎭⎫1-12⎝⎛⎭⎫1-13=12×23=13, 问题得到解决就是至少有1人能解决问题. ∴P =1-13=23.答案:13 235.在如图所示的电路图中,开关a ,b ,c 闭合与断开的概率都是12,且是相互独立的,则灯亮的概率是________.解析:设“开关a ,b ,c 闭合”分别为事件A ,B ,C ,则灯亮这一事件为ABC ∪AB C ∪A B C ,且A ,B ,C 相互独立,ABC ,AB C ,A B C 互斥,所以 P =P (ABC )+P (AB C )+P (A B C )=P (A )P (B )P (C )+P (A )P (B )P (C )+P (A )P (B )P (C ) =12×12×12+12×12×⎝⎛⎭⎫1-12+12×⎝⎛⎭⎫1-12×12=38. 答案:386.天气预报,在元旦假期甲地的降雨概率为0.2,乙地的降雨概率是0.3,假定在这段时间内两地是否降雨相互之间没有影响,计算在这段时间内:(1)甲、乙两地都降雨的概率; (2)甲、乙两地都不降雨的概率; (3)其中至少一个地方降雨的概率.解:(1)甲、乙两地都降雨的概率为P 1=0.2×0.3=0.06. (2)甲、乙两地都不降雨的概率为 P 2=(1-0.2)×(1-0.3)=0.8×0.7=0.56. (3)至少一个地方降雨的概率为 P 3=1-P 2=1-0.56=0.44.一、选择题1.一枚硬币连掷三次,至少出现一次正面向上的概率是( ) A.18 B.14 C.12D.78解析:选D 一枚硬币连掷三次,每次结果互不影响,相互独立.至少出现一次正面朝上的对立事件为三次全为正面朝下,概率为1-12·12·12=78.2.荷花池中,有一只青蛙在成品字形的三片荷叶上跳来跳去(每次跳跃时,均从一叶跳到另一叶),而且逆时针方向跳的概率是顺时针方向跳的概率的两倍,如图所示,假设现在青蛙在A 叶上,则跳三次之后停在A 叶上的概率是( )A.13B.29C.49D.827解析:选A 青蛙跳三次要回到A 只有两条途径: 第一条:按A →B →C →A , P 1=23×23×23=827;第二条,按A →C →B →A , P 2=13×13×13=127,所以跳三次之后停在A 叶上的概率为 P =P 1+P 2=827+127=13. 3.国庆节放假,甲去北京旅游的概率为13,乙、丙去北京旅游的概率分别为14,15.假定三人的行动相互之间没有影响,那么这段时间内至少有1人去北京旅游的概率为( )A.5960 B.35 C.12D.160解析:选B 因甲、乙、丙去北京旅游的概率分别为13,14,15.因此,他们不去北京旅游的概率分别为23,34,45,所以,至少有1人去北京旅游的概率为P =1-23×34×45=35.4.从甲袋内摸出1个红球的概率是13,从乙袋内摸出1个红球的概率是12,从两袋内各摸出1个球,则23等于( )A .2个球不都是红球的概率B .2个球都是红球的概率C .至少有1个红球的概率D .2个球中恰好有1个红球的概率解析:选C 至少有1个红球的概率是 13×⎝⎛⎭⎫1-12+12×⎝⎛⎭⎫1-13+12×13=23. 二、填空题5.甲袋中有8个白球,4个红球;乙袋中有6个白球,6个红球,从每袋中任取一个球,则取得同色球的概率为________.解析:设从甲袋中任取一个球,事件A :“取得白球”,则此时事件A :“取得红球”,从乙袋中任取一个球,事件B :“取得白球”,则此时事件B :“取得红球”.∵事件A 与B 相互独立,∴事件A 与B 相互独立. ∴从每袋中任取一个球,取得同色球的概率为 P (A ∩B +A ∩B )=P (A ∩B )+P (A ∩B ) =P (A )P (B )+P (A )P (B ) =23×12+13×12=12. 答案:126.红队队员甲、乙、丙与蓝队队员A ,B ,C 进行围棋比赛,甲对A ,乙对B ,丙对C 各一盘.已知甲胜A 、乙胜B 、丙胜C 的概率分别为0.6,0.5,0.5,假设各盘比赛结果相互独立.则红队至少两名队员获胜的概率为________.解析:记甲对A 、乙对B 、丙对C 各一盘中甲胜A 、乙胜B 、丙胜C 分别为事件D ,E ,F ,则甲不胜A 、乙不胜B 、丙不胜C 分别为事件D ,E ,F ,根据各盘比赛结果相互独立可得红队至少两名队员获胜的概率为:P =P (DEF )+P (DEF )+P (DEF )+P (DEF )=P (D )P (E )P (F )+P (D )P (E )P (F )+P (D )P (E )·P (F )+P (D )P (E )P (F )=0.6×0.5×(1-0.5)+0.6×(1-0.5)×0.5+(1-0.6)×0.5×0.5+0.6×0.5×0.5=0.55.答案:0.557.某次知识竞赛规则如下:在主办方预设的5个问题中,选手若能连续正确回答出两个问题,即停止答题,晋级下一轮.假设某选手正确回答每个问题的概率都是0.8,且每个问题的回答结果相互独立,则该选手恰好回答了4个问题就晋级下一轮的概率等于________.解析:此选手恰好回答4个问题就晋级下一轮, 说明此选手第2个问题回答错误,第3、第4个问题均回答正确, 第1个问题答对答错都可以. 因为每个问题的回答结果相互独立, 故所求的概率为1×0.2×0.82=0.128. 答案:0.1288.甲罐中有5个红球,2个白球和3个黑球,乙罐中有4个红球,3个白球和3个黑球.先从甲罐中随机取出一球放入乙罐,分别以A 1,A 2和A 3表示由甲罐取出的球是红球,白球和黑球的事件;再从乙罐中随机取出一球,以B 表示由乙罐取出的球是红球的事件.则下列结论中正确的是________(写出所有正确结论的编号).①P (B )=25;②P (B |A 1)=511;③事件B 与事件A 1相互独立; ④A 1,A 2,A 3是两两互斥的事件;⑤P (B )的值不能确定,因为它与A 1,A 2,A 3中究竟哪一个发生有关.解析:对①,P (B )=C 15C 110×C 15C 111+C 15C 110×C 14C 111=922;②,P (B |A 1)=C 15C 111=511;③,由P (A 1)=12,P (B )=922,P (A 1·B )=522知P (A 1·B )≠P (A 1)·P (B ).④,故事件B 与事件A 不是相互独立事件;从甲罐中只取一球,若取出红球就不可能是其他颜色的球,故两两互斥;⑤由①可算得.答案:②④ 三、解答题9.为拉动经济增长,某市决定新建一批重点工程,分为基础设施工程、民生工程和产业建设工程三类.这三类工程所含项目的个数分别占总数的12,13,16.现有3名工人独立地从中任选一个项目参与建设.求:(1)他们选择的项目所属类别互不相同的概率; (2)至少有1名工人选择的项目属于民生工程的概率.解:记第i 名工人选择的项目属于基础设施工程、民生工程和产业建设工程分别为事件A i ,B i ,C i ,i =1,2,3.由题意知A 1,A 2,A 3相互独立,B 1,B 2,B 3相互独立,C 1,C 2,C 3相互独立,A i ,B j ,C k (i ,j ,k =1,2,3,且i ,j ,k 互不相同)相互独立,且P (A i )=12,P (B i )=13,P (C i )=16. (1)他们选择的项目所属类别互不相同的概率P =A 33P (A 1∩B 2∩C 3)=6P (A 1)P (B 2)P (C 3)=6×12×13×16=16. (2)至少有1名工人选择的项目属于民生工程的概率P =1-P (B 1∩ B 2 ∩ B 3)=1-P (B 1)P (B 2)P (B 3)=1-⎝⎛⎭⎫1-133=1927. 10.甲、乙两人各进行一次射击,如果两人击中目标的概率都是0.8,计算:(1)两人都击中目标的概率;(2)其中恰有一人击中目标的概率;(3)至少有一人击中目标的概率.解:记“甲射击一次,击中目标”为事件A ,“乙射击一次,击中目标”为事件B .“两人都击中目标”是事件A ∩B ;“恰有1人击中目标”是A ∩B ∪A -∩B ;“至少有1人击中目标”是A ∩B ∪A ∩B -∪A -∩B .(1)显然,“两人各射击一次,都击中目标”就是事件A ∩B ,又由于事件A 与B 相互独立,∴P (A ∩B )=P (A )P (B )=0.8×0.8=0.64.(2)“两人各射击一次,恰好有一次击中目标”包括两种情况:一种是甲击中乙未击中(即A ∩B -),另一种是甲未击中乙击中(即A -∩B ),根据题意,这两种情况在各射击一次时不可能同时发生,即事件A ∩B -与A -∩B 是互斥的,所以所求概率为P =P (A ∩B -)+P (A -∩B )=P (A )P (B -)+P (A -)P (B )=0.8×(1-0.8)+(1-0.8)×0.8=0.16+0.16=0.32.(3)“两人各射击一次,至少有一人击中目标”的概率为P =P (A ∩B )+[P (A ∩B -)+P (A -∩B )]=0.64+0.32=0.96.。
8.4列联表独立性检验
患心脏病 214 451 665
患其他病 597
不患心脏病 175 597 772
总计 389 1048 1437
患其他病
秃头 不秃头
患心脏病
相应的三维柱形图如图所 示, 比较来说 ,底面副对 角线上两个 柱体高度的乘 积要大一些 ,因此可以在 某种程度上认为“秃顶与 患心脏病有关”。
课题:选修2-3 8.4独立性检验
解:设H0:感冒与是否使用该血清没有关系。
1000258 284 242 216 2 K 7.075 474 526 500 500 因当H0成立时,K2≥6.635的概率约为0.01,故有99%的把握认 为该血清能起到预防感冒的作用。
2
课题:选修2-3 8.4独立性检验
第四步:查对临界值表,作出判断。
P(k≥k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
课题:选修2-3 8.4独立性检验
思考
如果K 2 6.635,就断定H0不成立,这种判断出错的可能性有多大 ?
答:判断出错的概率为0.01。
9965(7775 49 42 2099)2 现在观测值k 56.632太大了, 7817 2148 9874 91 在H 0成立的情况下能够出现这样的观测值的概率不超过0.01, 因此我们有99%的把握认为H 0不成立,即有99%的把握认为“吸烟 与患肺癌有关系”。
再冷的石头,坐上三年也会暖 !
独立性检验
2 n ( ad bc ) 随机变量-----卡方统计量 K 2 , (a b)(c d )(a c)(b d )
2019年高中数学第8章统计与概率8.5一元线性回归案例讲义含解析湘教版选修2_3
8.5一元线性回归案例[读教材·填要点]1.相关系数(1)定义:样本容量是n 的成对观测数据,用(x 1,y 1),(x 2,y 2),…,(x n ,y n )表示,用{}xi 表示数据x 1,x 2,…,x n ,用{}yi 表示数据y 1,y 2,…,y n ,用x 与y 分别表示{}xi 和{}yi 的均值,用s x 表示{}xi 的标准差,用s y 表示{}yi 的标准差,再引入:s xy =x1y1+x2y2+…+xnynn-x y .当s x s y ≠0时,称r xy=∑i =1n-x-y∑i =1n-x∑i =1n-y=∑i =1nxiyi -n xy⎝ ⎛⎭⎪⎪⎫∑i =1n x2i -n x 2⎝ ⎛⎭⎪⎪⎫∑i =1ny2i -n y 2=sxy sxsy 为{}xi 和{}yi 的相关系数.;正相关{}yi 和{}xi 时,我们称>0xy r 当① ;负相关{}yi 和{}xi 时,我们称<0xy r 当② 不相关.{}yi 和{}xi 时,我们称0=xy r 当③(2)性质:中取值;1,1]-[总在区间xy r ①,这时数增加也倾向于y ,增加x 的线性相关程度越强,且y ,x 时,1越接近于xy r 当②附近.一条上升的直线分散在)n y ,n x (,…,)2y ,2x (,)1y ,1x (据③当r xy 越接近于-1时,x ,y 的线性相关程度越强,且x 增加,y 倾向于减少,这时数附近.一条下降的直线分散在)n y ,n x (,…,)2y ,2x (,)1y ,1x (据④当r xy 越接近于0时,x ,y 的线性相关程度越弱.2.一元线性回归(1)回归直线方程:l :y ^=bx +a ,其中b =sxy s2x,a =y -b x .(2)一元线性回归模型:若样本量n 的成对观测数据,),n ,…,1,2=i (i e +a +i bx =i y 满足关系:i x 和i y 中)n y ,n x (,…,)2y ,2x (,)1y ,1x (,则称该模型为一元线性回归模型.随机误差表示n e ,…,2e ,1e 其中[小问题·大思维]1.|r xy |越接近1,及越接近于0,表示两个变量x 与y 之间线性相关程度如何?提示:|r xy |越接近1,表明两个变量的线性相关程度越强,它们的散点图越接近于一条直线,这时用线性回归模型拟合这组数据的效果就越好;|r xy |越接近0,表明两个变量的线性相关程度越弱,通常|r xy |>0.8时,认为有很强的相关关系. 2.在一元线性回归模型中,变量y 由变量x 唯一确定吗?提示:不唯一.y 值由x 和随机误差e 共同确定,即自变量x 只能解释部分y 的变化.3.随机误差e 产生的主要原因有哪些? 提示:随机误差e 产生的主要原因有:(1)所用的确定性函数不恰当引起的误差;(2)忽略了某些因素的影响;(3)存在观测误差.4.回归分析中,利用线性回归方程求出的函数值一定是真实值吗?为什么?提示:不一定是真实值.利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食,是否喜欢运动等.[例1] 某班5(1)画出散点图;(2)求物理成绩y 对数学成绩x 的线性回归方程;(3)一名学生的数学成绩是96,试预测他的物理成绩.[解] (1)散点图如图.(2)x =15×(88+76+73+66+63)=73.2,y =15×(78+65+71+64+61)=67.8.∑i =15x i y i =88×78+76×65+73×71+66×64+63×61=25 054.∑i =15x2i =882+762+732+662+632=27 174.所以b =∑i =15xiyi -5xy∑i =15x2i -5x 2=25 054-5×73.2×67.827 174-5×73.22≈0.625.a =y --b x -≈67.8-0.625×73.2=22.05.所以y 对x 的回归直线方程是y =22.05+0.625x .(3)x =96,则y =0.625×96+22.05≈82,即可以预测他的物理成绩是82.1.回归直线方程中系数的两种求法(1)公式法:利用公式,求出回归系数b ,a .(2)待定系数法:利用回归直线过样本点中心(x -,y -)求系数.2.回归分析的两种策略(1)利用回归方程进行预测:把回归直线方程看作一次函数,求函数值.(2)利用回归直线判断正、负相关:决定正相关还是负相关的是回归系数b .1.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x2i =720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y =bx +a ;(2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y =bx +a 中,b =∑i =1nxiyi -n x - y-∑i =1nx2i -n x -2,a =y --b x -,其中x -,y -为样本平均值.解:(1)由题意知n =10,x =1n ∑i =1n x i =8010=8,y -=1n ∑i =1n y i =2010=2.又∑i =1nx2i -n x -2=720-10×82=80, ∑i =1n x i y i -n x-y -=184-10×8×2=24,由此可得b =∑i =1nxiyi -n x - y-∑i =1nx2i -n x -2=2480=0.3,a =y --b x -=2-0.3×8=-0.4,故所求回归方程为y =0.3x -0.4.(2)由于变量y 的值随x 的值增加而增加(b =0.3>0),故x 与y 之间是正相关.(3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7(千元).[例2][解] x -=17×(21+23+25+27+29+32+35)≈27.4,y -=17×(7+11+21+24+66+115+325)≈81.3,∑i =17x2i =212+232+252+272+292+322+352=5 414,∑i =17x i y i =21×7+23×11+25×21+27×24+29×66+32×115+35×325=18 542,∑i =17y2i =72+112+212+242+662+1152+3252=124 393,∴r =∑i =17xiyi -7x -y-∑i =17x2i -7x -∑i =17y2i -7y -=18 542-7×27.4×81.3414--≈0.837 5.由于r ≈0.837 5与1比较接近,∴x 与y 具有线性相关关系.回归分析是定义在具有相关关系的两个变量的基础上的,对于相关关系不明确的两个变量,可先作散点图,由图粗略的分析它们是否具有相关关系,在此基础上,求其回归方程,并作回归分析.2.某厂的生产原料耗费x (单位:百万元)与销售额y (单位:百万元)之间有如下的对应关系:解:画出(x ,y )的散点图,如图所示,由图可知x ,y 呈现线性相关关系.x -=5,y -=47.5,∑i =14x2i =120,∑i =14y2i =9 900,∑i =14x i y i =1 080,r =∑i =14xiyi -4x - y-∑i =14x2i -4x -∑i =14y2i -4y -=1 080-4×5×47.5--≈0.982 7.故x 与y 之间存在线性相关关系.[例3](2)求y 与x 之间的回归方程. [解] (1)散点图如图所示:(2)由散点图看出样本点分布在一条指数函数y =c 1e 图像的周围,于是令z =ln y ,则=e0.69x +1.112.非线性回归问题一般不给出经验公式,这时,应先画出已知数据的散点图,把它与所学过的各种函数图像作比较,挑选一种跟这些散点图拟合得最好的函数,采用适当的变量置换,把问题化为线性回归分析问题,使问题得以解决.3.在一次抽样调查中测得样本的5个样本点,数值如下表:x 之间的回归方程.解:由数值表可作散点图如下根据散点图可知y 与x 近似地呈反比例函数关系,设y =k x ,令t =1x ,则y =kt ,原数据变为由散点图可以看出y 与t 呈近似的线性相关关系.列表如下所以t =1.55,y -=7.2.所以b =∑i =15tiyi -5t - y-∑i =15t2i -5t -2=4.134 4.a =y -bt=0.8.所以y =0.8+4.134 4t .所以y 对x 的回归方程是y =0.8+4.134 4x.1.下列说法中正确的是( )A .y =2x 2+1中的x ,y 是具有相关关系的两个变量B .正四面体的体积与其棱长具有相关关系C .电脑的销售量与电脑的价格之间是一种确定性的关系D .传染病医院感染甲型H1N1流感的医务人员数与医院收治的甲型流感人数是具有相关关系的两个变量解析:选D 感染的医务人员不仅受医院收治的病人数的影响,还受防护措施等其它因素的影响.2.设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( )A .x 和y 的相关系数为直线l 的斜率B .x 和y 的相关系数在0到1之间C .当n 为偶数时,分布在l 两侧的样本点的个数一定相同D .直线l 过点(x -,y -)解析:选D 回归直线过样本中心点(x -,y -).3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:( )A.y ^=x -1B.y ^=x +1C.y ^=88+12x D.y ^=176解析:选C 设y 对x 的线性回归方程为y ^=bx +a ,因为b =sxy s2x =12,a =176-12×176=88,所以y 对x 的线性回归方程为y ^=12x +88.4.在关于两个变量的回归分析中,作散点图的目的是________________________.答案:观察两个变量之间是否存在线性相关关系5.某服装厂的产品产量x (万件)与单位成本y (元/件)之间的回归直线方程是y =52.15-19.5x ,当产量每增加一万件时,单位成本下降________元.解析:由回归系数的意义得下降19.5元.答案:19.56.在一段时间内,分5次测得某种商品的价格x (万元)和需求量y (t)之间的一组数据为:已知∑i =1x i y i =62,∑i =15x2i =16.6.(1)画出散点图;(2)求出y 对x 的回归方程;(3)如价格定为1.9万元,预测需求量大约是多少?(精确到0.01 t).解:(1)散点图如下图所示:(2)因为x =15×9=1.8,y =15×37=7.4,∑i =15x i y i =62,∑i =15x2i =16.6,s xy =∑i =15xiyi5-x y =12.4-13.32=-0.92.所以b =sxy s2x =-0.920.08=-11.5,a =y -b x =7.4+11.5×1.8=28.1,故y 对x 的回归方程为y ^=28.1-11.5x .(3)y ^=28.1-11.5×1.9=6.25(t).一、选择题1.下表是x 与y 之间的一组数据,则y 关于x 的线性回归方程必过( )A.点(2,2)C .点(1,2)D .点(1.5,4)解析:选D x =0+1+2+34=64=1.5,y =1+3+5+74=4,∴线性回归方程必过点(1.5,4).2.已知变量x 和y 满足关系y ^=-0.1x +1,变量y 与z 正相关.下列结论中正确的是( )A .x 与y 正相关,x 与z 负相关B .x 与y 正相关,x 与z 正相关C .x 与y 负相关,x 与z 负相关D .x 与y 负相关,x 与z 正相关解析:选C 因为y =-0.1x +1的斜率小于0,故x 与y 负相关.因为y 与z 正相关,可设z =b ^y +a ^,b ^>0,则z =b ^y +a ^=-0.1b ^x +b ^+a ^,故x 与z 负相关.3.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel 软件计算得y ^=0.577x -0.448(x 为人的年龄,y 为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是( )A .年龄为37岁的人体内脂肪含量都为20.90%B .年龄为37岁的人体内脂肪含量为21.01%C .年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%D .年龄为37岁的大部分的人体内脂肪含量为31.5%解析:选C 当x =37时,y =0.577×37-0.448=20.901≈20.90,由此估计:年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%.4.某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程y =bx +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元解析:选B 样本中心点是(3.5,42),则a =y --b x -=42-9.4×3.5=9.1,所以回归直线方程是y =9.4x +9.1,把x =6代入得y =65.5.二、 填空题5.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:以x +1代x ,得y =0.254(x +1)+0.321,与y =0.254x +0.321相减可得,年饮食支出平均增加0.254万元.答案:0.2546.下表是某厂1~4月份用水量(单位:百吨)的一组数据,由某散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程是y ^=-0.7x +a ,则a =________.解析:x =2.5,y =3.5,b =-0.7,∴a =3.5+0.7×2.5=5.25.答案:5.257.已知回归直线的斜率的估计值为 1.23.样本点的中心为(4,5),则回归直线方程是________________.解析:由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),可得y -5=1.23(x -4),即y ^=1.23x +0.08.答案:y ^=1.23x +0.088.在研究硝酸钠的可溶性程度时,观察它在不同温度的水中的溶解度,得观测结果如下:.解析:根据s xy =∑ni =1xiyi n -x y ,及b =sxys2x,得b =0.880 9. 答案:0.880 9三、解答题9.在关于人体的脂肪含量(百分比)和年龄关系研究中,研究人员获得了如下一组数据:(2)求y 与x 之间的回归方程;(3)预测39岁的人脂肪含量.(保留四位有效数字)解:(1)画出散点图(2)由散点图可以看出y 与x 之间有较强的线性相关关系,可算得x =111∑i =111x i ≈44.545 5,y =111∑i =111y i ≈25.336 4,∑i =111x i y i =13 205,∑i =111x2i =23 224,∴b =sxys2x≈0.565 7,a =y -b x ≈0.137 0.∴y 与x 之间的线性回归方程为y ^=0.565 7x +0.137 0.(3)当x =39时,y =0.565 7×39+0.137 0≈22.20,∴39岁的人的脂肪含量约为22.20%.10.(2016·全国卷Ⅲ)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明;(2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17-y =0.55,7≈2.646.参考公式:相关系数r=∑i =1n-t-y∑i =1n-t∑i =1n-y,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为b ^=∑i =1n-t -y∑i =1n-t,a ^=y -b ^t .解:(1)由折线图中数据和附注中参考数据得t =4,∑i =17(t i -t )2=28,∑i =17-y =0.55,∑i =17(t i -t)(y i -y )=∑i =17t i y i -t ∑i =17y i =40.17-4×9.32=2.89,r ≈2.892×2.646×0.55≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得b ^=∑i =17-t-y∑i =17-t=2.8928≈0.103,a ^=y -b ^t ≈1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y ^=0.92+0.10t .将2018年对应的t =9代入回归方程得y ^=0.92+0.10×9=1.82.所以预测2018年我国生活垃圾无害化处理量将约为1.82亿吨.。
湘教版高中数学选修2-2《列联表独立性分析案例》教案3
列联表独立性分析案例(3)一、教学目标(一)知识目标通过对典型案例(如“色弱与性别是否有关”“中学生物理考试成绩和吃早点是否相关”)的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用。
(二)能力目标让学生经历数据处理的过程,会用所学知识对具体案例进行检验,提高探索解决问题的能力。
(三)情感目标从实例中发现问题,提高学习兴趣,激发学习积极性和主动性,不断自我完善,养成不断探求知识完善自我的良好态度。
二、教学重点进一步理解独立性检验的实施步骤三、教学难点对临界值的理解作出判断四、教学过程(一)引入课题独立性检验的步骤。
1.若要推断的论述为H1:“X与Y有关系”。
可按如下步骤判断H1成立的可能性。
A通过三维柱形图和二维条形图,粗略判断两个分类变量是否有关系。
B可以利用独立性检验来考察两个分类变量是否有关系。
并能精确判断可靠程度。
2.由观测数据算2 ,其值越大,说明“X与Y有关系”成立的可能性越大。
3.由临界值表确定可靠程度。
(二)案例讲解有300人按性别和是否色弱分类如表问色弱与性别是否有关?分析:设从表格中提供的统计数据,可以计算得到如下数值:男性所占百分比:132120.48300+=;女性所占百分比:15150.52300+= 在这300人的样本中,男性色弱患者的百分比:120.04300≈;女性色弱的百分比:50.017300≈ 直观上看,300人中男性色弱的比例高于女性(0.040.017>)。
色弱应该与性别有关。
下面进一步运用独立性的概念进行检验。
从300人中随机选取一人,设1A 表示男性,2A 表示女性,1B 表示色觉正常,2B 表示色弱。
则:1()0.48P A =,2()0.52P A =,2125()0.06300P B +=≈ P (此人为男性且色弱)=12()0.04P A B = 而12()()0.480.060.028P A P B =⨯= 显然1212()()()P A B P A P B ≠P (此人为女性且色弱)=22()0.017P A B =,22()()0.520.060.031P A P B =⨯= 显然2222()()()P A B P A P B ≠因此,1A 与2B 、2A 与2B 都不是独立的。
湘教版高中数学选修2-3:列联表独立性分析案例
假设检验原理:
在一个已知假设 下,如果一个与 该假设矛盾的小 概率事件发生, 就推断这个假设 不成立。
例1.在500人身上试验某种血清预防感冒作
用,把他们一年中的感冒记录与另外500名 未用血清的人的感冒记录作比较,结果如 表所示。问:该种血清能否起到预防感冒 的作用?
(1)提出假设H0 :Ⅰ和Ⅱ没有关系; (2)根据2× 2列表与公式计算 2的值;
(3)查对临界值,作出判断。
由于抽样的随机性,由样本得到的推断有 可能正确,也有可能错误。利用 进行2 独立性检验,可以对推断的正确性的概率 作出估计,样本量n越大,估计越准确。
反证法原理与假设检验原理
反证法原理:
列联表独立性分析案例
某医疗机构为了了解呼吸道疾病与吸烟是否 有关,进行了一次抽样调查,共调查了515个 成年人,其中吸烟者220人,不吸烟者295人, 调查结果是:吸烟的220 人中37人患呼吸道 疾病, 183人不患呼吸道疾病;不吸烟的295 人中21人患呼吸道疾病, 274人不患呼吸道 疾病。
其中n a b c d
作为检验在多大程度上可以认为“两个变量 有关系”的标准 。
独立性检验
吸烟与呼吸道疾病列联表
患病 不患病 总计
吸烟
37
183
220
不吸烟 21
274
295
总计
58
457
515
通过公式计算
2 51537 274 183 212 11.8634
3)如果P(x2>6.635)= 0.01表示有99%的适把用握观认为测”数X与据Y”a有、关系;
4)如果P(x2>5.024)= 0.025表示有97.b5、%的c、把d握不认小为于”X5与Y”有关系;
2019年高中数学第8章统计与概率8.4列联表独立性分析案例讲义(含解析)湘教版
8.4列联表独立性分析案例[读教材·填要点]1.列联表一般地,对于两个因素X和Y,X的两个水平取值:A和A(如吸烟和不吸烟),Y也有两个水平取值:B和B(如患肺癌和不患肺癌),我们得到下表中的抽样数据,这个表格称为2×2列联表.2.χ2公式χ2=n ad-bc2a +b c+d a+c b+d.3.独立性检验的概念用随机变量χ2研究两变量是否有关的方法称为独立性检验.4.独立性检验的步骤要判断“X与Y有关系”,可按下面的步骤进行:(1)提出假设H0:X与Y无关;(2)根据2×2列联表及χ2公式,计算χ2的值;(3)查对临界值,作出判断.其中临界值如表所示:表示在H0成立的情况下,事件“χ2≥x0”发生的概率.5.变量独立性判断的依据(1)如果χ2>10.828时,就有99.9%的把握认为“X与Y有关系”;(2)如果χ2>6.635时,就有99%的把握认为“X与Y有关系”;(3)如果χ2>2.706时,就有90%的把握认为“X与Y有关系”;(4)如果χ2≤2.706时,就认为没有充分的证据显示“X与Y有关系”,但也不能作出结论“H0成立”,即X与Y没有关系.[小问题·大思维]1.利用χ2进行独立性分析,估计值的准确度与样本容量有关吗?提示:利用χ2进行独立性分析,可以对推断的正确性的概率作出估计,样本容量n越大,这个估计值越准确.如果抽取的样本容量很小,那么利用χ2进行独立性检验的结果就不具有可靠性.2.在χ2运算后,得到χ2的值为29.78,在判断因素相关时,P(χ2≥6.64)≈0.01和P(χ2≥7.88)≈0.005,哪种说法是正确的?提示:两种说法均正确.P(χ2≥6.64)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两因素相关;而P(χ2≥7.88)≈0.005的含义是在犯错误的概率不超过0.005的前提下认为两因素相关.[例1]数据:[解] 由列联表中的数据,得χ2的值为χ2=-2254×1 379×54×1 579≈68.033>6.635.因此,有99%的把握认为每一晚打鼾与患心脏病有关系.解决一般的独立性分析问题,首先由所给2×2列联表确定a,b,c,d,a+b+c+d 的值,然后代入随机变量的计算公式求出观测值χ2,将χ2与临界值x0进行对比,确定有多大的把握认为两个分类变量有关系.1.某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,经过调查得到如下列联表:系?解:由列联表中的数据,得 χ2=-294×95×86×103≈10.759>6.635,∴有99%的把握认为工作态度与支持企业改革之间有关系.[例2] (1)(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.[解] (1)假设H 0:传染病与饮用水无关.把表中数据代入公式,得χ2=-2146×684×518×312≈54.21,因为当H 0成立时,χ2≥10.828的概率约为0.001,所以我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关.(2)依题意得2×2列联表:此时,χ2=-214×72×55×31≈5.785.由于5.785>2.706,所以我们有90%的把握认为该种疾病与饮用不干净水有关.两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有90%的把握肯定.独立性分析的步骤:要推断“X与Y是否有关”可按下面的步骤进行:①提出统计假设H0:X与Y无关;②根据2×2列联表与χ2计算公式计算出χ2的值;③根据两个临界值,作出判断.2.为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.是否有90%的把握认为“学生选报文、理科与对外语的兴趣有关”?解:根据题目所给的数据得到如下列联表:χ2=-2211×150×236×125≈1.871×10-4.因为1.871×10-4<2.706,所以没有90%的把握认为“学生选报文、理科与对外语的兴趣有关”.[例3] 为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2) 表1:注射药物A后皮肤疱疹面积的频数分布表表2:注射药物B 后皮肤疱疹面积的频数分布表完成下面2×2列联表,并回答是否有99%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.表3:[解]χ2=-2100×100×105×95≈24.56>6.635.因此,有99%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.在绘制列联表时,应对问题中的不同数据分成不同的类别,然后列表.要注意列联表中各行、各列中数据的意义及书写格式.3.已知某班n 名同学的数学测试成绩(单位:分,满分100分)的频率分布直方图如图所示,其中a ,b ,c 成等差数列,且成绩在[90,100]内的有6人.(1)求n 的值;(2)规定60分以下为不及格,若不及格的人中女生有4人,而及格的人中,男生比女生少4人,借助独立性检验分析是否有90%的把握认为“本次测试的及格情况与性别有关”?附:χ2=a +bc +d a +cb +d解:(1)依题意得⎩⎪⎨⎪⎧+0.025+c +2b +a =1,2b =a +c ,解得b =0.01.因为成绩在[90,100]内的有6人, 所以n =60.01×10=60.(2)由于2b =a +c ,而b =0.01,可得a +c =0.02,则不及格的人数为0.02×10×60=12,及格的人数为60-12=48,设及格的人中,女生有x 人,则男生有x -4人, 于是x +x -4=48,解得x =26,故及格的人中,女生有26人,男生有22人. 于是本次测试的及格情况与性别的2×2列联表如下:结合列联表计算可得χ2=30×30×48×12=1.667<2.706,故没有90%的把握认为“本次测试的及格情况与性别有关”.性别与患色盲是否有关?你所得到的结论在什么范围内有效?[解] 由题意作2×2列联表如下:法一:由列联表中数据可知,在调查的男人中,患色盲的比例是38480≈7.917%,女人中患色盲的比例为6520≈1.154%,由于两者差距较大,因而我们可以认为性别与患色盲是有关系的.法二:由列联表中所给的数据可知,a=38,b=442,c=6,d=514,a+b=480,c+d=520,a+c=44,b+d=956,n=1 000,代入公式得χ2=-2480×520×44×956≈27.1.由于χ2≈27.1>6.635,所以我们有99%的把握即在犯错误不超过0.01的前提下认为性别与患色盲有关系.这个结论只对所调查的480名男人和520名女人有效.1.下面是2×2列联表:则表中a,b的值分别为A.94,96 B.52,50C.52,54 D.54,52解析:选C ∵a+21=73,∴a=52.又∵a+2=b,∴b=54.2.下列关于χ2的说法中正确的是( )A.χ2在任何相互独立问题中都可以用于检验是否相关B.χ2的值越大,两个事件的相关性越大C.χ2是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这一类问题D.χ2=n ad-bca +b c+d a+c b+d答案:C3.对于因素X与Y的随机变量χ2的值,下列说法正确的是( )A.χ2越大,“X与Y有关系”的可信程度越小B.χ2越小,“X与Y有关系”的可信程度越小C.χ2越接近于0,“X与Y没有关系”的可信程度越小D.χ2越大,“X与Y没有关系”的可信程度越大解析:选B χ2越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大.即χ2越小,“X与Y有关系”的可信程度越小.4.若由一个2×2列联表中的数据计算得χ2的观测值为4.013,那么在犯错误的概率不超过________的前提下,认为两个变量之间有关系.解析:因为4.013>3.841,所以在犯错误的概率不超过0.05的前提下,认为两个变量之间有关系.答案:0.055.某矿石粉厂当生产一种矿石粉时,在数天内即有部分工人患职业性皮肤炎,在生产季节开始,随机抽取75名车间工人穿上新防护服,其余仍穿原用的防护服,生产进行一个月后,检查两组工人的皮肤炎患病人数如下:解析:χ2=-275×28×15×88≈13.826>6.635.故有99%的把握说,新防护服比旧防护服对预防工人职业性皮炎有效.答案:99%6.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:已知在全部50人中随机抽取1人抽到爱打篮球的学生的概率为35.(1)请将上面的列联表补充完整;(2)是否有99%的把握认为喜爱打篮球与性别有关;请说明理由. 附参考公式:χ2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d .解:(1)列联表补充如下:(2)∵χ2=-230×20×25×25≈8.333>6.635,∴有99%的把握认为喜爱打篮球与性别有关.一、选择题1.有两个因素X 与Y 的一组数据,由其列联表计算得χ2≈4.523,则认为X 与Y 有关系是错误的可信度为( )A .95%B .90%C .5%D .10%解析:选C ∵χ2≥3.841.∴X 与Y 有关系的概率为95%,∴X 与Y 有关系错误的可信度为5%.2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:计算得,χ2=-260×50×60×50≈7.8.附表:A.在犯错误的概率不超过0.1% 的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1% 的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”解析:选C 根据独立性分析的思想方法,正确选项为C.3.某高校“统计初步”课程的老师随机调查了选该课的一些学生情况,具体数据如下表:为了分析主修统计中的数据,得到χ2=-223×27×20×30≈4.84,所以断定主修统计专业与性别有关系,这种判断出错的可能性为( )A.0.025 B.0.05C.0.975 D.0.95解析:选B ∵χ2≈4.84>3.841,所以我们有95%的把握认为主修统计专业与性别无关,即判断出错的可能性为0.05.4.已知P(x2≥2.706)=0.10,两个因素X和Y,取值分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若在犯错误的概率不超过0.1的前提下,认为X与Y有关系,则c等于( )A.5 B.6C.7 D.8解析:选A 经分析,c=5.二、填空题5.班级与成绩2×2列联表:表中数据m,n,p,解析:m=10+7=17,n=35+38=73,p=7+38=45,q=m+n=90.答案:17,73,45,906.在吸烟与患肺病是否相关的判断中,有下面的说法:①若χ2>6.64,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性分析可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性分析可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.解析:χ2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说明③正确.答案:③7.统计推断,当________时,在犯错误的概率不超过0.05的前提下认为事件A与B 有关;当________时,认为没有充分的证据显示事件A与B是有关的.解析:当k>3.841时,就有在犯错误的概率不超过0.05的前提下认为事件A与B有关,当k<2.706时认为没有充分的证据显示事件A与B是有关的.答案:k>3.841 k<2.7068.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:由表中数据直观分析,收看新闻节目的观众是否与年龄有关:________(填“是”或“否”).解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即ba +b =1858,dc +d =2742,两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄是有关的.答案:是 三、解答题9.某市对该市一重点中学2018年高考上线情况进行统计,随机抽查得到表格:解:对于上述四个科目,分别构造四个随机变量 χ21,χ22,χ23,χ24. 由表中数据可以得到: 语文:χ21=-2201×43×204×40=7.294>6.64,数学:χ22=-2201×43×201×43=30.008>6.64,英语:χ23=-2201×43×200×44=24.155>6.64,综合科目: χ24=-2201×43×201×43=17.264>6.64.所以有99%的把握认为语文、数学、英语、综合科目上线与总分上线有关系,数学上线与总分上线关系最大.10.一次对人们休闲方式的调查中共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2列联表;(2)能否在犯错误的概率不超过0.05的前提下认为性别与休闲方式有关系? 解:(1)2×2列联表如下:(2)χ2=-270×54×64×60≈6.201.因为6.201>3.841,所以有理由认为假设休闲方式与性别无关是不合理的,即在犯错误的概率不超过0.05的前提下认为休闲方式与性别有关.。
2019年数学新同步湘教版选修2-3讲义+精练:第8章 8.2.5 几个常用的分布 Word版含解析
8.2.5几个常用的分布[读教材·填要点]1.两点分布B(1,p)如果X只取值0或1,概率分布是P(X=1)=p,P(X=0)=1-p,p∈(0,1),就称X服从两点分布,记作X~B(1,p).2.二项分布B(n,p)设某试验成功的概率为p,p∈(0,1),将该试验独立重复n次,用X表示试验成功的次数,则X有概率分布:P(X=k)=C k n p k q n-k,k=0,1,2,…,n,其中q=1-p,这时,我们称X服从二项分布,记作X~B(n,p).3.超几何分布一般地,在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则事件{X=k}发生的概率为P(X=k)=C k M C n-kN-MC n N,k=0,1,2,…,m,其中m=min{M,n},且n≤N,M≤N,n,M,N∈N*.称分布列X 01…mP C0M C n-0N-MC n NC1M C n-1N-MC n N…C m M C n-mN-MC n N服从超几何分布,记作X~H(N,M,n).[小问题·大思维]1.在n次独立重复试验中,各次试验的结果相互有影响吗?提示:在n次独立重复试验中,各次试验的结果相互间无影响.因为每次试验是在相同条件下独立进行的.2.二项分布与两点分布的关系是什么?提示:二项分布是指n次独立重复试验中某事件恰好发生k次的概率分布列,需要在相同条件下做n次试验,两点分布指的是一次试验的两个结果的概率分布.两者的含义不同,将两点分布的试验进行n次,恰好发生k次的概率分布就成了二项分布.两点分布[例1] 已知一批200件的待出厂产品中,有1件不合格品,现从中任意抽取2件进行检查,若用随机变量X 表示抽取的2件产品中的次品数,求X 的分布列.[解] 由题意知,X 服从两点分布,P (X =0)=C 2199C 2200=99100,所以P (X =1)=1-99100=1100.所以随机变量X 的分布列为X 0 1 P991001100两点分布的4个特点(1)两点分布中只有两个对应结果,且两结果是对立的; (2)两点分布中的两结果一个对应1,另一个对应0;(3)由互斥事件的概率求法可知,已知P (X =0)(或P (X =1)),便可求出P (X =1)(或P (X =0));(4)在有多个结果的随机试验中,如果我们只关心一个随机事件是否发生,就可以利用两点分布来研究它.1.袋内有5个白球,6个红球,从中摸出两球,记X =⎩⎪⎨⎪⎧0,两球全红,1,两球非全红,求X 的概率分布.解:显然X 服从两点分布, P (X =0)=C 26C 211=311.∴P (X =1)=1-311=811,∴X 的概率分布为:X 0 1 P311811二项分布[例2] 局中获胜的概率为23,且各局胜负相互独立.已知比赛中,乙赢了第一局比赛.(1)求甲获胜的概率;(用分数作答)(2)设比赛总的局数为X ,求X 的概率分布. [解] (1)甲获胜的概率P =⎝⎛⎭⎫233+C 13·13·⎝⎛⎭⎫233=1627. (2)由题意知,X =3,4,5 P (X =3)=⎝⎛⎭⎫132=19,P (X =4)=⎝⎛⎭⎫233+C 12·23·⎝⎛⎭⎫132=49, P (X =5)=C 23⎝⎛⎭⎫232⎝⎛⎭⎫132+C 13·13·⎝⎛⎭⎫233=49. ∴X 的概率分布为:X 3 4 5 P194949二项分布中“X =k ”表示在n 次独立重复试验中事件恰好发生k 次,其特点是:①一次试验中只有两种可能结果;②事件在每次观察中出现的概率相等;③随机变量X 只取有限个实数.2.某一中学生心理咨询中心服务电话接通率为34.某班3名同学商定明天分别就同一问题询问该服务中心,且每人只拨打一次,求他们中成功咨询的人数X 的分布列.解:由题意可知:X ~B ⎝⎛⎭⎫3,34, 所以P (X =k )=C k 3⎝⎛⎭⎫34k ·⎝⎛⎭⎫143-k , k =0,1,2,3.即P (X =0)=C 03×⎝⎛⎭⎫340×⎝⎛⎭⎫143=164; P (X =1)=C 13×34×⎝⎛⎭⎫142=964; P (X =2)=C 23×⎝⎛⎭⎫342×14=2764; P (X =3)=C 33×⎝⎛⎭⎫343=2764.分布列为X 0 1 2 3 P16496427642764超几何分布[例3] 名同学中,3名同学来自数学学院,其余7名同学来自物理、化学等其他互不相同的七个学院.现从这10名同学中随机选取3名同学,到希望小学进行支教活动(每位同学被选到的可能性相同).(1)求选出的3名同学是来自互不相同学院的概率;(2)设X 为选出的3名同学中女同学的人数,求随机变量X 的分布列.[解] 设“选出的3名同学是来自互不相同的学院”为事件A ,则P (A )=C 13·C 27+C 03·C 37C 310=4960. 所以选出的3名同学是来自互不相同的学院的概率为4960.(2)依据条件,随机变量X 服从超几何分布,其中N =10,M =4,n =3,且随机变量X 的可能值为0,1,2,3.P (X =k )=C k 4·C 3-k6C 310(k =0,1,2,3).所以随机变量X 的分布列是X 0 1 2 3 P1612310130求解超几何分布问题的注意事项(1)在产品抽样检验中,如果采用的是不放回抽样,则抽到的次品数服从超几何分布.(2)在超几何分布公式中P (X =k )=C k M C n -kN -MC n N,k =0,1,2,…,m ,其中m =min{M ,n }.这里N 是产品总数,M 是产品中次品数,n 是抽样的样品数.(3)如果随机变量X 服从超几何分布,只要代入公式即可求得相应概率,关键是明确随机变量X 的所有取值.(4)当超几何分布用表格表示较繁杂时,可用解析式法表示.3.袋中有4个红球,3个黑球,从袋中随机取球,设取到一个红球得2分,取到一个黑球得0分,从袋中任取4个球.(1)求得分X 的分布列. (2)求得分不小于6分的概率. 解:(1)从袋中随机摸4个球的情况为:1红3黑,2红2黑,3红1黑,4红共四种情况,分别得分为2分,4分,6分,8分,故X 的可能取值为2,4,6,8.P (X =2)=C 14C 33C 47=435;P (X =4)=C 24C 23C 47=1835;P (X =6)=C 34C 13C 47=1235;P (X =8)=C 44C 03C 47=135.所以X 的分布列为X 2 4 6 8 P43518351235135(2)由(1)中分布列得P (X ≥6)=P (X =6)+P (X =8)=1335.解题高手妙解题有10台都为7.5千瓦的机床,如果每台机床的使用情况是相互独立的,且每台机床平均每小时开动12 min ,问全部机床用电超过48千瓦的可能性有多大?(保留两位有效数字)[尝试] [巧思] 由于每台机床正常工作的概率为1260=0.2,而且每台机床都只有“工作”与“不工作”两种情况,故某一时刻正常工作的机床台数服从二项分布.[妙解] 设X 为某一时刻正常工作的机床的台数,则X ~B (10,0.2),P (X =k )=C k 10·0.2k ·0.810-k (k =0,1,2,…,10),根据题意,48千瓦可供6台机床同时工作,用电超过48千瓦,即意味着有7台或7台以上的机床在工作,这一事件的概率为:P (X ≥7)=P (X =7)+P (X =8)+P (X =9)+P (X =10)=C 710×0.27×0.83+C 810×0.28×0.82+C 910×0.29×0.81+C 1010×0.210×0.80≈0.000 86.1.下列问题中的随机变量不服从两点分布的是( ) A .抛掷一枚骰子,所得点数为随机变量X B .某射手射击一次,击中目标的次数为随机变量XC .从装有5个红球,3个白球的袋中取1个球,令随机变量X =⎩⎪⎨⎪⎧1,取出白球,0,取出红球D .某医生做一次手术,手术成功的次数为随机变量X解析:选A A 中随机变量X 的取值有6个,不服从两点分布,故选A. 2.设随机变量X ~B ⎝⎛⎭⎫6,12,则P (X =3)的值为( ) A.516 B.316 C.58D.716解析:选A P (X =3)=C 36×⎝⎛⎭⎫123×⎝⎛⎭⎫123=516. 3.在15个村庄中,有7个村庄交通不太方便,现从中任意选10个村庄,用X 表示10个村庄中交通不太方便的村庄数,下列概率中等于C 47C 68C 1015的是( )A .P (X =2)B .P (X ≤2)C .P (X =4)D .P (X ≤4)解析:选C A ,P (X =2)=C 27C 88C 1015;B ,P (X ≤2)=P (X =2)≠C 47C 68C 1015;C ,P (X =4)=C 47C 68C 1015;D ,P (X ≤4)=P (X =2)+P (X =3)+P (X =4)>C 47C 68C 1015.4.某射手射击1次,击中目标的概率是0.9,他连续射击4次,且各次射击是否击中目标相互之间没有影响,有下列结论:①他第3次击中目标的概率是0.9; ②他恰好击中目标3次的概率是0.93×0.1; ③他至少击中目标1次的概率是1-0.14.其中正确的序号是__________________(写出所有正确结论的序号).解析:①正确;恰好击中目标3次的概率为C 34×0.93×0.1,故②错;由于“至少击中目标1次”的对立事件为“一次都未击中目标”,故③正确.答案:①③5.在4次独立重复试验中,随机事件A 恰好发生1次的概率不大于其恰好发生两次的概率,则事件A 在一次试验中发生的概率p 的取值范围是________.解析:由题知C 14p (1-p )3≤C 24p 2(1-p )2,即4(1-p )≤6p .∴p ≥0.4.又0<p <1,∴0.4≤p <1. 答案:[0.4,1)6.学校组织一次夏令营活动,有8名同学参加,其中5名男同学,3名女同学,为了活动的需要,要从这8名同学中随机抽取3名同学去执行一项特殊任务,记其中有X 名男同学被抽到.求:(1)X 的分布列;(2)去执行任务的同学中有男有女的概率.解:(1)X 服从超几何分布,其中,N =8,M =5,n =3,X 可取0,1,2,3. P (X =0)=C 33C 38=156,P (X =1)=C 15C 23C 38=1556, P (X =2)=C 25C 13C 38=1528,P (X =3)=C 35C 38=528,所以X 的分布列为X 0 1 2 3 P15615561528528(2)去执行任务的同学中有男有女的概率为P (X =1)+P (X =2)=1556+1528=4556.一、选择题1.设某项试验的成功率是失败率的2倍,用随机变量X 描述一次试验的成功次数,则P (X =0)等于( )A .0 B.13 C.12D.23解析:选B 设P (X =1)=p ,则P (X =0)=1-p .依题意知,p =2(1-p ),解得p =23.故P (X =0)=1-p =13.2.从4双不同的鞋中任取4只,设ξ表示取出的鞋中成双的对数,则P (ξ≤1)=( ) A.2735 B.45 C.67D.3235解析:选D 由已知,可得ξ的所有可能取值为0,1,2,P (ξ≤1)=P (ξ=0)+P (ξ=1)=C 12C 12C 12C 12C 48+C 14C 23C 12C 12C 48=3235,故选D. 3.若在甲袋内装有8个白球,4个红球,在乙袋内装有6个白球,6个红球,今从两袋里任意取出1个球,设取出的白球个数为X ,则下列概率中等于C 18C 16+C 14C 16C 112C 112的是( ) A .P (X =0) B .P (X ≤2) C .P (X =1)D .P (X =2)解析:选C X 服从超几何分布,当X =1时,即从甲袋中取出白球乙袋中取出红球和甲袋中取出红球,乙中取出白球即为C 18C 16+C 14C 16C 112C 112. 4.位于坐标原点的一个质点P 按下述规则移动:质点每次移动一个单位,移动的方向为向上或向右,并且向上、向右移动的概率都是12.则质点P 移动5次后位于点(2,3)的概率为( )A.⎝⎛⎭⎫125B .C 25⎝⎛⎭⎫125 C .C 35⎝⎛⎭⎫123 D .C 25C 35⎝⎛⎭⎫125 解析:选B 质点每次只能向上或向右移动,且概率均为12,所以移动5次可看成做了5次独立重复试验.质点P 移动5次后位于点(2,3)(即质点在移动过程中向右移动2次,向上移动3次)的概率为C 25⎝⎛⎭⎫122⎝⎛⎭⎫123=C 25⎝⎛⎭⎫125. 二、填空题5.下列说法正确的是________.①某同学投篮命中率为0.6,他10次投篮中命中的次数X 是一个随机变量,且X ~B (10,0.6);②某福彩的中奖概率为p ,某人一次买了8张,中奖张数X 是一个随机变量,且X ~B (8,p );③从装有5红5白的袋中,有放回的摸球,直到摸出白球为止,则摸球次数X 是随机变量,且X ~B ⎝⎛⎭⎫n ,12. 解析:①、②显然满足独立重复试验的条件,而③虽然是有放回的摸球,但随机变量X 的定义是直到摸出白球为止,也就是说前面摸出的一定是红球,最后一次是白球,不符合二项分布的定义.答案:①②6.设X ~B (2,p ),若P (X ≥1)=59,则p =________.解析:∵X ~B (2,p ),∴P (X =k )=C k 2p k (1-p )2-k ,k =0,1,2.∴P (X ≥1)=1-P (X <1)=1-P (X =0)=1-C 02p 0(1-p )2=1-(1-p )2.∴1-(1-p )2=59.结合0≤p ≤1,解之得p =13.答案:137.从装有3个红球、2个白球的袋中随机取2个球,设其中有X 个红球,则随机变量X 的概率分布为________.解析:由题意知X 服从超几何分布,代入超几何分布概率公式有P (X =k )=C k 3·C 2-k2C 25(k=0,1,2).答案:8________.解析:P (正面次数大于反面次数)=P (4正2反)+P (5正1反)+P (6正) =C 46⎝⎛⎭⎫124·⎝⎛⎭⎫122+C 56⎝⎛⎭⎫125·⎝⎛⎭⎫121+C 66⎝⎛⎭⎫126=1132.答案:1132三、解答题9.已知某种从太空飞船中带回的植物种子每粒成功发芽的概率都为13,某植物研究所分两个小组分别独立开展该种子的发芽试验,每次试验种一粒种子.假定某次试验种子发芽,则称该次试验是成功的;如果种子没有发芽,则称该次试验是失败的.(1)第一小组做了3次试验,求至少两次试验成功的概率;(2)第二小组进行试验,到成功了4次为止,求在第4次成功之前共有3次失败,且恰有两次连续失败的概率.解:(1)第一小组做了3次试验,至少两次试验成功的概率为C 23×⎝⎛⎭⎫132×⎝⎛⎭⎫1-13+C 33×⎝⎛⎭⎫133=727. (2)第二小组在第4次成功前,共进行了6次试验,其中3次成功、3次失败,且恰有两次连续失败,其各种可能情况的种数为A 24=12.因此所求的概率为12×⎝⎛⎭⎫133×⎝⎛⎭⎫233×13=32729. 10.为了掌握高二年级学生参加《普通高中信息技术学业水平测试》的备考情况,学校信息技术老师准备对报名参加考试的所有学生进行一次模拟测试,模拟测试时学生需要在10道备选试题中随机抽取5道试题作答,答对5道题时测试成绩为A 等(即优秀),答对4道题时测试成绩为B 等(即良好),答对3道题时测试成绩为C 等(即及格),答对3道题以下(不包括答对3道题)时测试成绩为D 等(即不及格),成绩为D 等的同学必须参加辅导并补考.如果考生张小明只会答这10道备选试题中的6道题,设张小明同学从10道备选试题中随机抽取5道作答时,不会答的题数为随机变量X ,求:(1)随机变量X 的分布列;(2)求张小明同学需要参加补考的概率.解:(1)在10道备选试题中随机抽取5道试题作答时,其中不会答的题数可能是0,1,2,3,4道,即随机变量X 的所有取值是0,1,2,3,4,其中N =10,M =4,n =5,根据超几何分布概率公式,得P (X =0)=C 04C 56C 510=142,P (X =1)=C 14C 46C 510=521,P (X =2)=C 24C 36C 510=1021, P (X =3)=C 34C 26C 510=521,P (X =4)=C 44C 16C 510=142.∴随机变量X的分布列为:(2)需要参加补考,说明张小明同学从10道备选试题中随机抽取5道试题作答时,有3道试题或者4道试题答不出来,所以张小明同学在这次测试中需要参加补考的概率是P(X≥3)=P(X=3)+P(X=4)=521+142=1142.。
2019年数学新同步湘教版选修2-3讲义+精练:第8章 8.4 列联表独立性分析案例 Word版含解析
8.4列联表独立性分析案例[读教材·填要点]1.列联表一般地,对于两个因素X和Y,X的两个水平取值:A和A(如吸烟和不吸烟),Y也有两个水平取值:B和B(如患肺癌和不患肺癌),我们得到下表中的抽样数据,这个表格称为2×2列联表.2.χ2的求法公式χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).3.独立性检验的概念用随机变量χ2研究两变量是否有关的方法称为独立性检验.4.独立性检验的步骤要判断“X与Y有关系”,可按下面的步骤进行:(1)提出假设H0:X与Y无关;(2)根据2×2列联表及χ2公式,计算χ2的值;(3)查对临界值,作出判断.其中临界值如表所示:表示在H0成立的情况下,事件“χ2≥x0”发生的概率.5.变量独立性判断的依据(1)如果χ2>10.828时,就有99.9%的把握认为“X与Y有关系”;(2)如果χ2>6.635时,就有99%的把握认为“X 与Y 有关系”; (3)如果χ2>2.706时,就有90%的把握认为“X 与Y 有关系”;(4)如果χ2≤2.706时,就认为没有充分的证据显示“X 与Y 有关系”,但也不能作出结论“H 0成立”,即X 与Y 没有关系.[小问题·大思维]1.利用χ2进行独立性分析,估计值的准确度与样本容量有关吗?提示:利用χ2进行独立性分析,可以对推断的正确性的概率作出估计,样本容量n 越大,这个估计值越准确.如果抽取的样本容量很小,那么利用χ2进行独立性检验的结果就不具有可靠性.2.在χ2运算后,得到χ2的值为29.78,在判断因素相关时,P (χ2≥6.64)≈0.01和P (χ2≥7.88)≈0.005,哪种说法是正确的?提示:两种说法均正确.P (χ2≥6.64)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两因素相关;而P (χ2≥7.88)≈0.005的含义是在犯错误的概率不超过0.005的前提下认为两因素相关.[例1] 数据:[解] 由列联表中的数据,得χ2的值为χ2=1 633×(30×1 355-224×24)2254×1 379×54×1 579≈68.033>6.635.因此,有99%的把握认为每一晚打鼾与患心脏病有关系.解决一般的独立性分析问题,首先由所给2×2列联表确定a ,b ,c ,d ,a +b +c +d 的值,然后代入随机变量的计算公式求出观测值χ2,将χ2与临界值x 0进行对比,确定有多大的把握认为两个分类变量有关系.1.某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,经过调查得到如下列联表:系?解:由列联表中的数据,得χ2=189×(54×63-40×32)294×95×86×103≈10.759>6.635,∴有99%的把握认为工作态度与支持企业改革之间有关系.[例2] (1)(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.[解] (1)假设H 0:传染病与饮用水无关.把表中数据代入公式,得χ2=830×(52×218-466×94)2146×684×518×312≈54.21,因为当H 0成立时,χ2≥10.828的概率约为0.001,所以我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关. (2)依题意得2×2列联表:此时,χ2=86×(5×22-50×9)214×72×55×31≈5.785.由于5.785>2.706,所以我们有90%的把握认为该种疾病与饮用不干净水有关. 两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有90%的把握肯定.独立性分析的步骤:要推断“X 与Y 是否有关”可按下面的步骤进行: ①提出统计假设H 0:X 与Y 无关;②根据2×2列联表与χ2计算公式计算出χ2的值; ③根据两个临界值,作出判断.2.为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.是否有90%的把握认为“学生选报文、理科与对外语的兴趣有关”?解:根据题目所给的数据得到如下列联表:χ2=361×(138×52-73×98)2211×150×236×125≈1.871×10-4.因为1.871×10-4<2.706,所以没有90%的把握认为“学生选报文、理科与对外语的兴趣有关”.[例3] 为了比较注射A ,B 两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A ,另一组注射药物B .下表1和表2分别是注射药物A 和药物B 后的试验结果.(疱疹面积单位:mm 2)表1:注射药物A 后皮肤疱疹面积的频数分布表表2:注射药物B 后皮肤疱疹面积的频数分布表完成下面2×2列联表,并回答是否有99%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.表3:[解]χ2=200×(70×65-35×30)2100×100×105×95≈24.56>6.635.因此,有99%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.在绘制列联表时,应对问题中的不同数据分成不同的类别,然后列表.要注意列联表中各行、各列中数据的意义及书写格式.3.已知某班n 名同学的数学测试成绩(单位:分,满分100分)的频率分布直方图如图所示,其中a ,b ,c 成等差数列,且成绩在[90,100]内的有6人.(1)求n 的值;(2)规定60分以下为不及格,若不及格的人中女生有4人,而及格的人中,男生比女生少4人,借助独立性检验分析是否有90%的把握认为“本次测试的及格情况与性别有关”?附:χ2=n (ad -bc )(a +b )(c +d )(a +c )(b +d )解:(1)依题意得⎩⎪⎨⎪⎧10(0.035+0.025+c +2b +a )=1,2b =a +c ,解得b =0.01. 因为成绩在[90,100]内的有6人, 所以n =60.01×10=60.(2)由于2b =a +c ,而b =0.01,可得a +c =0.02,则不及格的人数为0.02×10×60=12,及格的人数为60-12=48,设及格的人中,女生有x 人,则男生有x -4人, 于是x +x -4=48,解得x =26,故及格的人中,女生有26人,男生有22人. 于是本次测试的及格情况与性别的2×2列联表如下:结合列联表计算可得χ2=60×(22×4-8×26)30×30×48×12=1.667<2.706,故没有90%的把握认为“本次测试的及格情况与性别有关”.性别与患色盲是否有关?你所得到的结论在什么范围内有效?[解] 由题意作2×2列联表如下:法一:由列联表中数据可知,在调查的男人中,患色盲的比例是38480≈7.917%,女人中患色盲的比例为6520≈1.154%,由于两者差距较大,因而我们可以认为性别与患色盲是有关系的.法二:由列联表中所给的数据可知, a =38,b =442,c =6,d =514,a +b =480,c +d =520,a +c =44,b +d =956,n =1 000, 代入公式得χ2=1 000×(38×514-6×442)2480×520×44×956≈27.1.由于χ2≈27.1>6.635,所以我们有99%的把握即在犯错误不超过0.01的前提下认为性别与患色盲有关系. 这个结论只对所调查的480名男人和520名女人有效.1.下面是2×2列联表:则表中a ,b 的值分别为A .94,96 B .52,50 C .52,54D .54,52 解析:选C ∵a +21=73,∴a =52. 又∵a +2=b ,∴b =54.2.下列关于χ2的说法中正确的是( )A .χ2在任何相互独立问题中都可以用于检验是否相关B .χ2的值越大,两个事件的相关性越大C .χ2是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这一类问题D.χ2=n(ad-bc)(a+b)(c+d)(a+c)(b+d)答案:C3.对于因素X与Y的随机变量χ2的值,下列说法正确的是()A.χ2越大,“X与Y有关系”的可信程度越小B.χ2越小,“X与Y有关系”的可信程度越小C.χ2越接近于0,“X与Y没有关系”的可信程度越小D.χ2越大,“X与Y没有关系”的可信程度越大解析:选Bχ2越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大.即χ2越小,“X与Y有关系”的可信程度越小.4.若由一个2×2列联表中的数据计算得χ2的观测值为4.013,那么在犯错误的概率不超过________的前提下,认为两个变量之间有关系.解析:因为4.013>3.841,所以在犯错误的概率不超过0.05的前提下,认为两个变量之间有关系.答案:0.055.某矿石粉厂当生产一种矿石粉时,在数天内即有部分工人患职业性皮肤炎,在生产季节开始,随机抽取75名车间工人穿上新防护服,其余仍穿原用的防护服,生产进行一个月后,检查两组工人的皮肤炎患病人数如下:解析:χ2=103×(5×18-70×10)275×28×15×88≈13.826>6.635.故有99%的把握说,新防护服比旧防护服对预防工人职业性皮炎有效.答案:99%6.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:已知在全部50人中随机抽取1人抽到爱打篮球的学生的概率为35.(1)请将上面的列联表补充完整;(2)是否有99%的把握认为喜爱打篮球与性别有关;请说明理由. 附参考公式:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .解:(1)列联表补充如下:(2)∵χ2=50×(20×15-10×5)230×20×25×25≈8.333>6.635,∴有99%的把握认为喜爱打篮球与性别有关.一、选择题1.有两个因素X 与Y 的一组数据,由其列联表计算得χ2≈4.523,则认为X 与Y 有关系是错误的可信度为( )A .95%B .90%C .5%D .10%解析:选C ∵χ2≥3.841.∴X 与Y 有关系的概率为95%,∴X 与Y 有关系错误的可信度为5%.2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:计算得,χ2=110×(40×30-20×20)260×50×60×50≈7.8.附表:A .在犯错误的概率不超过0.1% 的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1% 的前提下,认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关” 解析:选C 根据独立性分析的思想方法,正确选项为C.3.某高校“统计初步”课程的老师随机调查了选该课的一些学生情况,具体数据如下表:为了分析主修统中的数据,得到χ2=50(13×20-10×7)223×27×20×30≈4.84,所以断定主修统计专业与性别有关系,这种判断出错的可能性为( )A .0.025B .0.05C .0.975D .0.95解析:选B ∵χ2≈4.84>3.841,所以我们有95%的把握认为主修统计专业与性别无关,即判断出错的可能性为0.05.4.已知P (x 2≥2.706)=0.10,两个因素X 和Y ,取值分别为{x 1,x 2}和{y 1,y 2},其样本频数分别是a =10,b =21,c +d =35.若在犯错误的概率不超过0.1的前提下,认为X 与Y 有关系,则c 等于( )A .5B .6C .7D .8解析:选A 经分析,c =5. 二、填空题5.班级与成绩2×2列联表:表中数据m,n,p,解析:m=10+7=17,n=35+38=73,p=7+38=45,q=m+n=90.答案:17,73,45,906.在吸烟与患肺病是否相关的判断中,有下面的说法:①若χ2>6.64,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性分析可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性分析可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.解析:χ2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说明③正确.答案:③7.统计推断,当________时,在犯错误的概率不超过0.05的前提下认为事件A与B 有关;当________时,认为没有充分的证据显示事件A与B是有关的.解析:当k>3.841时,就有在犯错误的概率不超过0.05的前提下认为事件A与B有关,当k<2.706时认为没有充分的证据显示事件A与B是有关的.答案:k>3.841k<2.7068.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:由表中数据直观分析,收看新闻节目的观众是否与年龄有关:________(填“是”或“否”).解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即b a +b =1858,d c +d =2742,两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄是有关的.答案:是 三、解答题9.某市对该市一重点中学2018年高考上线情况进行统计,随机抽查得到表格:解:对于上述四个科目,分别构造四个随机变量χ21,χ22,χ23,χ24.由表中数据可以得到:语文:χ21=244×(174×13-27×30)2201×43×204×40=7.294>6.64,数学:χ22=244×(178×20-23×23)2201×43×201×43=30.008>6.64,英语:χ23=244×(176×19-25×24)2201×43×200×44=24.155>6.64,综合科目:χ24=244×(175×17-26×26)2201×43×201×43=17.264>6.64.所以有99%的把握认为语文、数学、英语、综合科目上线与总分上线有关系,数学上线与总分上线关系最大.10.一次对人们休闲方式的调查中共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2列联表;(2)能否在犯错误的概率不超过0.05的前提下认为性别与休闲方式有关系? 解:(1)2×2列联表如下:(2)χ2=124×(43×33-27×21)270×54×64×60≈6.201.因为6.201>3.841,所以有理由认为假设休闲方式与性别无关是不合理的,即在犯错误的概率不超过0.05的前提下认为休闲方式与性别有关.。
【优化方案】精品课件数学选修2-3(配湘教)第8章8.4
列联表独立性分析案例
8.4 列 联 表 独 立 性 分 析 案 例
学习目标
课前自主学案
课堂互动讲练
知能优化训练
学习目标
1.了解独立性检验 (只要求2×2列联表)的基本思 想、方法及其简单应用. 2.了解假设检验的基本思想、方法及其简单应 用.
课前自主学案
温故夯基
1.如果某测量值 X 服从正态分布,测量次数越 越近 . 多测量的平均值离真值 μ 就______ 1 x2 偶 函 2.标准正态密度曲线 Φ(x)= e- 是____ 2 2π 数.(奇偶性) 1 3.在标准正态分布中 P(x<a)+P(x<-a)=___.
越弱;|n11n22-n12n21|越大,关系越强.
在国家未实施西部开发战略前,一新闻单位在应
届大学毕业生中随机抽取 1000人进行问卷调查,
只有80人志愿加入国家西部建设,而国家公布实 施西部开发战略后,随机抽取1200名应届大学毕 业生进行问卷调查,有 400 人志愿加入国家西部 建设.
问:实施西部开发战略的公布是否对应届大学毕
【误区警示】
本题易出现结论写反“在犯错误
的概率不超过0.01的前提下认为没有影响”.
“无关”的独立性分析
某省2011年高中招生不再文理分科,为了探究学生 对此的赞同情况是否与性别有关.某机构调查了 361名高二在校学生,结果如下:男生赞同的有138 人,不赞同的有98人,女生赞同的有73人,不赞同 的有52人,试分析对这项政策的赞同是否与性别有 关? 【思路点拨】 先列出2×2列联表,再计算χ2的值, 运用独立性分析得出结论.
业生的选择产生了影响?
【思路点拨】 → 判断关系
【解】
列2×2列联表 → 计算χ2的观测值
湘教版数学选修2-3第8章8.4知能演练轻松闯关.docx
1.下面是一个2×2列联表:y1y2总计x1 a 2173x282533总计 b 46则表中a、b处的值分别为()A.94、96B.52、50C.52、60 D.54、52解析:选C.∵a+21=73,∴a=52,∴b=a+8=52+8=60.2.(2012·巫山检测)在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是()A.男人、女人中患色盲的频率分别为0.038和0.006B.男、女患色盲的概率分别为19240、3 260C.男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D.调查人数太少,不能说明色盲与性别有关解析:选 C.男人患色盲的比例为38480,女人中患色盲的比例为6520,其差值为|38480-6520|≈0.0676,差值较大,故能说明患色盲与性别是有关的.3.(2012·梁平调研)以下关于独立性分析的说法中,错误的是( ) A .独立性分析依赖小概率原理 B .独立性分析得到的结论一定正确C .样本不同,独立性分析的结论可能有差异D .独立性分析不是判定两事物是否相关的唯一方法解析:选B.独立性分析,只是在一定的可信度下进行判断,不一定正确. 4.如果χ2的值为6.64,可以认为“X 与Y 无关”的可信度是________. 解析:查表可知可信度为1%. 答案:1%一、选择题1.给出下列实际问题①一种药物对某种病的治愈率;②两种药物治疗同一种病是否有区别;③吸烟者得肺病的概率;④吸烟人群是否与性别有关系;⑤网吧与青少年犯罪是否有关系. 其中用独立性分析可以解决的问题有( ) A .①②③ B .②④⑤ C .②③④⑤ D .①②③④⑤ 答案:B2.在吸烟与患肺病这两个分类变量的独立性分析的计算中,下列说法正确的是( )A .若χ2的值为6.635,则我们能在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B .从独立性分析的计算中求出能在犯错误的概率不超过0.01的前提下认为吸烟与患肺病的关系时,我们认为如果某人吸烟,那么他有99%的可能患有肺病C .若从统计量中求出能在犯错误的概率不超过0.05的前提下认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D .以上三种说法都不正确 答案:C3.某市政府在调查市民收入增减与旅游愿望的关系时,采用独立性分析法抽查了3000人,计算发现χ2=6.635,根据这一数据可知,市政府断言市民收入增减与旅游愿望有关系,这一断言错误的概率不超过( ) A .0.1 B .0.01 C .0.025 D .0.005 答案:B4.(2012·云阳调研)某调查机构调查教师工作压力大小的情况,部分数据如表:喜欢教师职业不喜欢教师职业总计 认为工作压力大 50 37 87 认为工作压力不大12 1 13 总计6238100则推断“工作压力大与不喜欢教师职业有关系”,这种推断错误的概率不超过( ) A .0.01 B .0.05 C .0.10 D .0.005 解析:选B.χ2=100×(50×1-37×12)287×13×62×38≈5.83>3.841.5.考察棉花种子经过处理跟生病之间的关系得到下表数据:种子处理 种子未处理总计 得病 32 101 133 不得病 61 213 274 总计93314407根据以上数据,可得出( )A .种子是否经过处理跟是否生病有关B .种子是否经过处理跟是否生病无关C .种子是否经过处理决定是否生病D .以上都是错误的解析:选B.由χ2=407×(32×213-61×101)293×314×133×274≈0.164<6.64,即没有把握认为是否经过处理跟是否生病有关.6.利用独立性分析来考察两个分类变量X 和Y 是否有关系时,通过查阅下表来确定“X 与Y 有关系”的可信程度.P (χ2≥x 0)0.50 0.40 0.25 0.15 0.10 x 00.4550.7081.3232.0722.706P (χ2≥x 0)0.05 0.025 0.010 0.005 0.001 x 03.8415.0246.6357.87910.828如果χ2≥5.024,那么就有把握认为“X 与Y 有关系”的百分比为( ) A .25% B .75% C .2.5% D .97.5%解析:选D.x 0=5.024对应的0.025是“X 与Y 有关系”不合理的程度,因此两个分类变量有关系的可信程度约为97.5%. 二、填空题 7.(2012·大足调研)下列是关于出生男婴与女婴调查的列联表:晚上 白天 总计 男婴 45 A B 女婴 E 35 C 总计98D180那么A =________,B =________,C =________,D =________,E =________. 解析:由题意知,⎩⎪⎨⎪⎧45+A =B E +35=C E +45=98A +35=D 98+D =180,解得⎩⎪⎨⎪⎧A =47B =92C =88D =82E =53.答案:47 92 88 82 538.根据下表,计算χ2≈________.(保留两位小数)又发病 未发病 作移植手术 39 157 未作移植手术29167解析:χ2=(39+29+157+167)(39×167-29×157)2(39+157)×(29+167)×(39+29)×(157+167)≈1.78. 答案:1.789.有2×2列联表:B B - 总计 A 54 40 94 A 32 63 95 总计86103189由上表可计算χ2≈________.(小数点后保留三位有效数字) 解析:χ2=189(32×40-54×63)286×103×94×95≈10.759.答案:10.759 三、解答题10.某聋哑研究机构,对聋与哑是否有关系进行抽样调查,在耳聋的657人中有416人哑,而在另外不聋的680人中有249人哑,你能运用这组数据,得出相应结论吗?请运用独立性分析进行判断.解:能,根据题目所给数据得到如下列联表:哑 不哑 总计 聋 416 241 657 不聋 249 431 680 总计6656721337假设“聋与哑无关”,根据列联表中数据得χ2=1337×(416×431-241×249)2657×680×665×672≈95.291>6.64.所以拒绝假设,因此在犯错误的概率不超过0.01的前提下认为聋与哑有关系. 11.(2012·巫山质检)为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生活规律的共200人. (1)根据以上数据列出2×2列联表;(2)在犯错误的概率不超过0.01的前提下认为40岁以上的人患病与否和生活规律有关系吗?为什么?解:(1)由已知可列2×2列联表:患胃病 未患胃病 总计 生活规律 20 200 220 生活不规律 60 260 320 总计80460540(2)根据列联表中的数据,由计算公式得χ2值为χ2=540×(20×260-200×60)2220×320×80×460≈9.638.∵9.638>6.635, 因此,在犯错误的概率不超过0.01的前提下认为40岁以上的人患胃病与否和生活规律有关. 12.(创新题)为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:喜爱打篮球不喜爱打篮球合计 男生 a b =5 女生 c =10 d 合计50已知在全部50人中随机抽取1人抽到爱打篮球的学生的概率为35.(1)请将上面的列联表补充完整;(2)是否有99.5%的把握认为喜爱打篮球与性别有关;请说明理由. 附参考公式:χ2=n (n 11·n 22-n 12·n 21)2n 1+n 2+n +1n +2.P (χ2≥k )0.15 0.10 0.05 0.025 0.010 0.005 0.001 k2.0722.7063.8415.0246.6357.87910.828解:(1)列联表补充如下:喜爱打篮球不喜爱打篮球合计 男生 20 5 25 女生 10 15 25 合计302050(2)∵χ2=50×(20×15-10×5)230×20×25×25≈8.333>7.879,∴有99.5%的把握认为喜爱打篮球与性别有关.。
湘教版数学选修2-3第8章8.2.4知能演练轻松闯关.docx
1.10件产品中有3件次品,从中任取2件,可作为随机变量的是( ) A .取到产品的件数 B .取到正品的概率 C .取到次品的件数 D .取到次品的概率解析:选C.对于A 中取到产品的件数是一个常量不是变量,B 、D 也是一个定值,而C 中取到次品的件数可能是0,1,2.是随机变量. 2.(2012·巫山调研)抛掷2枚骰子,所得点数之和记为ξ,那么“ξ=4”表示的随机试验的结果是( )A .2枚都是4点B .1枚是1点,另1枚是3点C .2枚都是2点D .1枚是1点,另1枚是3点,或者2枚都是2点解析:选D.抛掷2枚骰子,其中1枚是x 点,另1枚是y 点,其中x ,y ∈1,2,…,6.而ξ=x +y ,ξ=4⇔⎩⎪⎨⎪⎧x =1,y =3,或⎩⎪⎨⎪⎧x =2,y =2. 3.(2012·江北质检)设离散型随机变量X 的分布列如下:X 1 2 3 4 p161316p则p 的值为( )A.12B.16C.13D.14解析:选C.p =1-16-13-16=13.4.掷一枚骰子,出现点数X 是一随机变量,则P (X >4)的值为________. 解析:P (X >4)=P (X =5)+P (X =6)=16+16=13.答案:13一、选择题 1.(2012·江北调研)下列变量中,不是随机变量的是( ) A .一射击手射击一次命中的环数 B .标准状态下,水沸腾时的温度 C .抛掷两枚骰子,所得点数之和D .某电话总机在时间区间(0,T )内收到的呼叫次数 解析:选B.B 中水沸腾时的温度是一个确定值.2.某人进行射击,共有5发子弹,击中目标或子弹打完就停止射击,射击次数为ξ,则“ξ=5”表示的试验结果是( ) A .第5次击中目标 B .第5次未击中目标 C .前4次均未击中目标 D .第4次击中目标解析:选C.ξ=5表示射击5次,即前4次均未击中,否则不可能射击第5次,但第5次是否击中目标,就不一定,因为他只有5发子弹. 3.下列各表中可作为随机变量X 的分布列的是( ) A.X -1 0 1 p0.50.30.4B.X 1 2 3 p0.50.8-0.3C.X 1 2 3 p0.20.30.4D.X -1 0 1 p0.40.6解析:选D.A 中0.5+0.3+0.4>1,B 中-0.3<0,C 中0.2+0.3+0.4<1. 4.设随机变量ξ的分布列为P (ξ=i )=a (13)i ,i =1,2,3,则a 的值为( )A .1 B.913 C.1113D.2713解析:选D.由P (ξ=1)+P (ξ=2)+P (ξ=3)=1,得(13+19+127)a =1,∴a =2713.5.(2012·梁平质检)设某项试验的成功率是失败率的2倍,用随机变量ξ去描述1次试验的成功次数,则P (ξ=0)等于( ) A .0 B.12 C.13D.23解析:选C.设ξ的分布列为ξ0 1 pp2p即“ξ=0”表示试验失败,“ξ=1”表示试验成功, 设失败率为p ,则成功率为2p , ∴由p +2p =1,得p =13.∴P (ξ=0)=13.6.抛掷一枚骰子,用X 表示掷出的点数则P (4<X ≤5)=( ) A.16 B.13 C .0D .1解析:选A.P (4<X ≤5)=P (X =5)=16.二、填空题7.设X 是一个离散型随机变量,其分布列为X 0 1 2 p0.50.40.1则P (X <2)=________.解析:P (X <2)=P (X =0)+P (X =1) =0.5+0.4=0.9. 答案:0.98.随机变量ξ的分布列为ξ0 1 2 3 4 5 p192157458451529则ξ为奇数的概率为________.解析:P (ξ=1)+P (ξ=3)+P (ξ=5)=215+845+29=815.答案:8159.(2012·大渡口调研)一袋中装有6个同样大小的黑球,编号为1,2,3,4,5,6.现从中随机取出2个球,以ξ表示取出的球的最大号码,则ξ=6表示的试验结果是________________________________________________________________________. 答案:(1,6),(2,6),(3,6),(4,6),(5,6)三、解答题10.已知随机变量ξ的分布列为ξ-2 -1 0 1 2 3 p112141311216112(1)求η1=12ξ的分布列;(2)求η2=ξ2的分布列. 解:(1)η1=12ξ的分布列为η1-1 -12 0 12 1 32 p11214 13 112 16 112(2)η2=ξ2的分布列为η20 1 4 9 p13131411211.袋中有大小,质地相同的1个白球和4个黑球,每次从中任取1个球,每次取出的黑球不再放回,直到取出白球为止,求取球次数X 的分布列. 解:X 的可能取值为1,2,3,4,5. 则第1次取到白球的概率为 P (X =1)=15,第2次取到白球的概率为 P (X =2)=45×14=15,第3次取到白球的概率为 P (X =3)=45×34×13=15,第4次取到白球的概率为 P (X =4)=45×34×23×12=15,第5次取到白球的概率为 P (X =5)=45×34×23×12×11=15,所以X 的分布列为X 1 2 3 4 5 p151515151512.(创新题)口袋中装有6个同样大小的黑球,编号为1,2,3,4,5,6,现从中随机取出3个球,用X 表示取出的球的最大号码,求X 的分布列. 解:随机变量X 的可能取值为3,4,5,6.从袋中随机地取3个球,包含的基本事件总数为C 36.事件“X =3”包含的基本事件总数为C 33(取出的3个球号码为1,2,3),事件“X =4”包含的基本事件总数为C 23(取出的3个球恰含有4号球和1,2,3号球中的2个),事件“X =5”包含的基本事件总数为C 24(取出的3个球恰含有5号球和1,2,3,4号球中的2个),事件“X =6”包含的基本事件总数为C 25(取出的3个球恰含有6号球和1,2,3,4,5中的2个).所以有P (X =3)=C 33C 36=120,P (X =4)=C 23C 36=320,P (X =5)=C 24C 36=310,P (X =6)=C 25C 36=12.因此随机变量X 的分布列为X 3 4 5 6 p12032031012。
2019年高中数学湘教版选修2-3讲义+精练:第8章8.2.2条件概率含解析
8.2.2 条件概率[读教材·填要点]1.条件概率设A ,B 是事件,且P (A )>0,以后总是用P (B |A )表示在已知A 发生的条件下B 发生的条件概率,简称条件概率. 2.条件概率的计算公式如果P (A )>0,则P (B |A )3.条件概率的性质 ①P (B |A )∈[0,1]②如果B 与C 为两个互斥事件,则P (B ∪C |A )=P (B |A )+P (C |A ).[小问题·大思维]1.P (B |A )=P (A ∩B )吗?提示:事件(B |A )是指在事件A 发生的条件下,事件B 发生,而事件A ∩B 是指事件A 与事件B 同时发生,故P (B |A )≠P (A ∩B ).2.P (B |A )和P (A |B )相同吗?提示:P (B |A )是指在事件A 发生的条件下,事件B 发生的概率,而P (A |B )是指在事件B 发生的条件下,事件A 发生的概率,因此P (B |A )和P (A |B )不同.[例1] 在5道题中有3 (1)第1次抽到理科题的概率;(2)第1次和第2次都抽到理科题的概率;(3)在第1次抽到理科题的条件下,第2次抽到理科题的概率.[解] 设第1次抽到理科题为事件A ,第2次抽到理科题为事件B ,则第1次和第2次都抽到理科题为事件A ∩B . (1)从5道题中不放回地依次抽取2道题的基本事件总数为A 25=20.事件A 所含基本事件的总数为A 13×A 14=12.故P (A )=1220=35.(2)因为事件A ∩B 含A 23=6个基本事件. 所以P (A ∩B )=620=310. (3)法一:由(1)、(2)可得,在第1次抽到理科题的条件下,第2次抽到理科题的概率为P(B|A)=P(A∩B)P(A)=31035=12.法二:因为事件A∩B含6个基本事件,事件A含12个基本事件,所以P(B|A)=612=12.条件概率的计算方法有两种:(1)利用定义计算,先分别计算概率P(A∩B)和P(A),然后代入公式P(B|A)=P(A∩B)P(A).(2)利用缩小样本空间计算(局限在古典概型内),即将原来的样本空间Ω缩小为已知的事件A,原来的事件B缩小为AB,利用古典概型计算概率:P(B|A)=n(A∩B)n(A).1.抛掷红、蓝两颗骰子,设事件A为“蓝色骰子的点数为3或6”,事件B为“两颗骰子的点数之和大于8”.(1)求P(A),P(B),P(A∩B);(2)当已知蓝色骰子的点数为3或6时,问两颗骰子的点数之和大于8的概率为多少?解:(1)设x为掷红骰子得的点数,y为掷蓝骰子得的点数,则所有可能的事件为(x,y),建立一一对应的关系,由题意作图如图.显然:P(A)=1236=13,P(B)=1036=518,P(A∩B)=536.(2)法一:P(B|A)=n(A∩B)n(A)=512.法二:P(B|A)=P(A∩B)P(A)=53613=512.[例2]在一个袋子中装有10个白球,从中依次摸2个球,求在第一个球是红球的条件下,第二个球是黄球或黑球的概率.[解]法一:设“摸出第一个球为红球”为事件A,“摸出第二个球为黄球”为事件B,“摸出第二个球为黑球”为事件C,则P(A)=110,P(AB)=1×210×9=145,P (AC )=1×310×9=130. ∴P (B |A )=P (AB )P (A )=145110=1045=29,P (C |A )=P (AC )P (A )=130110=13.∴P (B ∪C |A )=P (B |A )+P (C |A )=29+13=59.∴所求的条件概率为59.法二:∵n (A )=1×C 19=9,n (B ∪C |A )=C 12+C 13=5,∴P (B ∪C |A )=59.∴所求的条件概率为59.利用公式P (B ∪C |A )=P (B |A )+P (C |A )可使条件概率的计算较为简单,但应注意这个性质的使用前提是“B 与C 互斥”.2.在某次考试中,要从20道题中随机地抽出6道题,若考生至少能答对其中的4道题即可通过;若至少能答对其中5道题就获得优秀,已知某考生能答对其中10道题,并且知道他在这次考试中已经通过,求他获得优秀成绩的概率.解:设事件A 为“该考生6道题全答对”,事件B 为“该考生答对了其中5道题,另一道答错”,事件C 为“该考生答对了其中4道题,而另2道题答错”,事件D 为“该考生在这次考试中通过”,事件E 为“该考生考试中获得优秀”,则A 、B 、C 两两互斥,且D =A ∪B ∪C ,E =A ∪B ,由古典概型的概率公式及加法公式可知P (D )=P (A ∪B ∪C )=P (A )+P (B )+P (C )=C 610C 620+C 510C 110C 620+C 410C 210C 620=12 180C 620, P (A ∩D )=P (A ),P (B ∩D )=P (B ), P (E |D )=P (A ∪B |D )=P (A |D )+P (B |D ) P (A )P (D )+P (B )P (D )=210C 62012 180C 620+2 520C 62012 180C 620=1358. 故所求的概率为1358.盒子里装有16个球,其中6个是玻璃球,10个是木质球,玻璃球中有2个是红球,4个是蓝球;木质球中有3个是红球,7个是蓝球.现从中任取一个(假设每个球被取到是等可能的)是蓝球,问该球是玻璃球的概率是多少?[尝试][巧思] 本题数据较多,关系有点复杂,可采用列表方法理顺关系,这样不仅过程简单,同时还能快捷地找出计算条件概率时所需的相关事件的概率.[妙解] 设事件A :“任取一个球,是玻璃球”;事件B :“任取一球,是蓝球”.由题中数据可列表如下:由表知,P (B )=1116,P (A ∩B )=416, 故所求事件的概率为P (A |B )=P (A ∩B )P (B )=4161116=411.1.若P (A )=34,P (B |A )=12,则P (A ∩B )等于( )A.23 B.38 C.13D.58解析:选B 利用条件概率的乘法公式求解. P (A ∩B )=P (A )·P (B |A )=34×12=38.2.用“0”“1”“2”组成的三位数码组中,若用A 表示“第二位数字为0”的事件,用B 表示“第一位数字为0”的事件,则P (A |B )=( )A.12B.13C.14D.18解析:选B ∵P (B )=3×33×3×3=13,P (AB )=33×3×3=19,∴P (A |B )=P (AB )P (B )=13,故选B.3.从1,2,3,4,5中任取2个不同的数,事件A :“取到的2个数之和为偶数”,事件B :“取到的2个数均为偶数”,则P (B |A )等于( )A.18B.14C.25D.12解析:选BP (A )=C 23+C 22C 25=25,P (AB )=C 22C 25=110,由条件概率的计算公式得P (B |A )=P (AB )P (A )=11025=14.4.若P (A )=310,P (B )=410,P (A ∩B )=110,则P (A |B )=________,P (B |A )=________. 解析:P (A |B )=P (A ∩B )P (B )=14, P (B |A )=P (A ∩B )P (A )=13.答案:14 135.如图,EFGH 是以O 为圆心,半径为1的圆的内接正方形.将一颗豆子随机地扔到该圆内,用A 表示事件“豆子落在正方形EFGH 内”,B 表示事件“豆子落在扇形OHE (阴影部分)内”,则(1)P (A )=______;(2)P (B |A )=______.解析:圆的面积是π,正方形的面积是2,扇形的面积是π4,根据几何概型的概率计算公式得P (A )=2π,根据条件概率的公式得P (B |A )=P (A ∩B )P (A )=12π2π=14.答案:(1)2π (2)146.某校高三(1)班有学生40人,其中共青团员15人.全班平均分成4个小组,其中第一组有共青团员4人.从该班任选一人作学生代表.(1)求选到的是第一组的学生的概率;(2)已知选到的是共青团员,求他是第一组学生的概率. 解:设事件A 表示“选到第一组学生”, 事件B 表示“选到共青团员”. (1)由题意,P (A )=1040=14.(2)法一:要求的是在事件B 发生的条件下,事件A 发生的条件概率P (A |B ).不难理解,在事件B 发生的条件下(即以所选到的学生是共青团员为前提),有15种不同的选择,其中属于第一组的有4种选择.因此,P (A |B )=415.法二:P (B )=1540=38,P (AB )=440=110,∴P (A |B )=P (AB )P (B )=415.一、选择题1.设P (A |B )=P (B |A )=12,P (A )=13,则P (B )等于( )A.12 B.13 C.14D.16解析:选B P (A ∩B )=P (A )P (B |A )=13×12=16,由P (A |B )=P (A ∩B )P (B ),得P (B )=P (A ∩B )P (A |B )=16×2=13.2.4张奖券中只有一张能中奖,现分别由4名同学无放回地抽取,若已知第一名同学没有抽到中奖券,则最后一名同学抽到中奖券的概率是( )A.14 B.13 C.12D .1解析:选B 设第一名同学没有抽到中奖券为事件A ,最后一名同学抽到中奖券为事件B , 则P (B |A )=P (A ∩B )P (A )=13.3.某地区空气质量监测资料表明,一天的空气质量为优良的概率是0.75,连续两天为优良的概率是0.6,已知某天的空气质量为优良,则随后一天的空气质量为优良的概率是( )A .0.8B .0.75C .0.6D .0.45解析:选A 根据条件概率公式P (B |A )=P (AB )P (A ),可得所求概率为0.60.75=0.8.4.从混有5张假钞的20张百元钞票中任意抽出2张,将其中1张放到验钞机上检验发现是假钞,则第2张也是假钞的概率为( )A.119 B.1738 C.419D.217解析:选D 设事件A 表示“抽到2张都是假钞”,事件B 为“2张中至少有一张假钞”,所以为P (A |B ).而P (AB )=C 25C 220=119,P (B )=C 25+C 15C 115C 220=1738. ∴P (A |B )=P (AB )P (B )=217.二、填空题5.有一批种子的发芽率为0.9,出芽后的幼苗成活率为0.8,在这批种子中,随机抽取1粒,则这粒种子能长成幼苗的概率为________.解析:记“种子发芽”为事件A ,“种子长成幼苗”为事件AB (发芽,又成活),出芽后的幼苗成活率为P (B |A )=0.8,又P (A )=0.9.故P (AB )=P (B |A )·P (A )=0.72.答案:0.726.6位同学参加百米短跑比赛,赛场共有6条跑道,已知甲同学排在第一跑道,则乙同学排在第二跑道的概率是________.解析:甲排在第一跑道,其他同学共有A 55种排法,乙排在第二跑道共有A 44种排法,所以所求概率为A 44A 55=15.答案:157.100件产品中有5件次品,不放回地抽取两次,每次抽1件,已知第一次抽出的是次品,则第2次抽出正品的概率为________.解析:设“第一次抽到次品”为事件A ,“第二次抽到正品”为事件B ,则P (A )=5100=120,P (AB )=C 15C 195A 2100=19396,所以P (B |A )=P (AB )P (A )=9599.答案:95998.抛掷一枚骰子,观察出现的点数,记A ={出现的点数为奇数}={1,3,5},B ={出现的点数不超过3}={1,2,3}.若已知出现的点数不超过3,则出现的点数是奇数的概率为________.解析:由题意知n (B )=3,n (A ∩B )=2,故在出现的点数不超过3的条件下,出现的点数是奇数的概率为 P (A |B )=n (A ∩B )n (B )=23.答案:23三、解答题9.一个盒子中有6只好晶体管,4只坏晶体管,任取两次,每次取一只,每一次取后不放回.若已知第一只是好的,求第二只也是好的概率.解:令A ={第1只是好的},B ={第2只是好的},法一:n (A )=C 16C 19,n (AB )=C 16C 15, 故P (B |A )=n (AB )n (A )=C 16C 15C 16C 19=59.法二:因事件A已发生(已知),故我们只研究事件B发生便可,在A发生的条件下,盒中仅剩9只晶体管,其中5只好的,所以P(B|A)=C15C19=59.10.一袋中装有6个黑球,4个白球.如果不放回地依次取出2个球.求:(1)第1次取到黑球的概率;(2)第1次和第2次都取到黑球的概率;(3)在第1次取到黑球的条件下,第2次又取到黑球的概率.解:设第1次取到黑球为事件A,第2次取到黑球为事件B,则第1次和第2次都取到黑球为事件A∩B.(1)从袋中不放回地依次取出2个球的事件数为n(Ω)=A210=90.根据分步乘法计数原理,n(A)=A16×A19=54.于是P(A)=n(A)n(Ω)=5490=35.(2)因为n(A∩B)=A26=30.所以P(A∩B)=n(A∩B)n(Ω)=3090=13.(3)法一:由(1)(2)可得,在第1次取到黑球的条件下,第2次取到黑球的概率为P(B|A)=P(A∩B)P(A)=1335=59.法二:因为n(A∩B)=30,n(A)=54,所以P(B|A)=n(A∩B)n(A)=3054=59.。
【精选】2019年数学新同步湘教版选修2-3讲义+精练:第8章 8.2.4 离散型随机变量及其分布(含解析)
8.2.4离散型随机变量及其分布[读教材·填要点]1.随机变量(1)定义:在一个对应关系下,随着试验结果变化而变化的变量称为随机变量.(2)表示:随机变量常用字母X,Y,ξ,η等表示.2.离散型随机变量所有取值可以一一列出的随机变量,称为离散型随机变量.3.随机变量X的概率分布如果随机变量X的取值是x1,x2,…,x n,则{X=x i}是事件,用p i=P(X=i)表示事件{X=x i}的概率,则p i=P(X=x i),i=1,2,…,n是离散型随机变量X的概率分布.当X的概率分布{p i}规律性不明显时,可用下面的表格表示X的分布.4.随机变量X①p i≥0,i=1,2,…,n;②p1+p2+…+p n=1.[小问题·大思维]1.任何随机试验的所有结果都可以用数字表示吗?提示:可以.实际上我们可以建立一个随机试验的所有结果同实数间的对应关系,根据问题的需要选择相应数字.2.是不是所有试验的离散型随机变量?并举例说明.提示:不是.如在东北森林中任取一棵树木的高度.[例1](1)湖南矮寨大桥桥面一侧每隔30米有一路灯,将所有路灯进行编号,其中某一路灯的编号X;(2)在一次数学竞赛中,设一、二、三等奖,小明同学参加竞赛获得的奖次X;(3)丁俊晖在2017年世锦赛中每局所得的分数.[解](1)桥面上的路灯是可数的,编号X可以一一列出,是离散型随机变量.(2)小明获奖等次X可以一一列出,是离散型随机变量.(3)每局所得的分数X可以一一列举出来,是离散型随机变量.判断一个随机变量是否是离散型随机变量的关键是判断随机变量的所有取值是否可以一一列出,具体方法如下:(1)明确随机试验的所有可能结果;(2)将随机试验的结果数量化;(3)确定试验结果所对应的实数是否可按一定次序一一列出,如能一一列出,则该随机变量是离散型随机变量,否则不是.1.写出下列随机变量可能的取值,并说明随机变量所取的值表示的随机试验的结果.(1)在含有10件次品的100件产品中,任意抽取4件,可能含有的次品的件数X是随机变量;(2)一袋中装有5个白球和5个黑球,从中任取3个,其中所含白球的个数ξ是一个随机变量.解:(1)随机变量X可能的取值为:0,1,2,3,4.{X=0},表示抽出0件次品;{X=1},表示抽出1件次品;{X=2},表示抽出2件次品;{X=3},表示抽出3件次品;{X=4},表示抽出的全是次品.(2)随机变量ξ可能的取值为:0,1,2,3.{ξ=0},表示取出0个白球,3个黑球;{ξ=1},表示取出1个白球,2个黑球;{ξ=2},表示取出2个白球,1个黑球;{ξ=3},表示取出3个白球,0个黑球.[例2] 个球,设X 表示取出3个球中的最大号码,求X 的概率分布.[解] 根据题意,随机变量X 的所有可能取值为3,4,5,6.X =3,即取出的3个球中最大号码为3,其他2个球的号码为1,2.所以,P (X =3)=C 22C 36=120; X =4,即取出的3个球中最大号码为4,其他2个球只能在号码为1,2,3的3个球中取. 所以,P (X =4)=C 23C 36=320;X =5,即取出的3个球中最大号码为5,其他2个球只能在号码为1,2,3,4的4个球中取.所以,P (X =5)=C 24C 36=310;X =6,即取出的3个球中最大号码为6,其他2个球只能在号码为1,2,3,4,5的5个球中取.所以,P =(X =6)=C 25C 36=12.所以,随机变量X 的概率分布为:求随机变量的概率分布的关键是搞清离散型随机变量X 取每一个值时对应的随机事件,然后利用排列组合的知识求出X 取每个值时的概率,最后列出表格即可.2.袋中有4个黑球,3个白球,2个红球,从中任取1个球,每取到一个黑球得0分,每取到一个白球得1分,每取到一个红球则得2分,用X 表示所得分数,求X 的概率分布列.解:由题意知X 的可能取值为0,1,2,则P (X =0)=C 14C 19=49,P (X =1)=C 13C 19=13,P (X =2)=C 12C 19=29.故X 的概率分布列为:[例3] 设随机变量X 的分布列为P (X =k )=k10,k =1,2,3,4.求: (1)P (X =1或X =2); (2)P ⎝⎛⎭⎫12<X <72. [解] ∵P (X =k )=k10,k =1,2,3,4, (1)P (X =1或X =2)=P (X =1)+P (X =2) =110+210=310. (2)P ⎝⎛⎭⎫12<X <72 =P (X =1或X =2或X =3) =1-P (X =4)=1-410=610=35.利用离散型随机变量概率分布的性质可以求随机变量在某个范围内取值的概率,此时只需根据随机变量的取值范围确定随机变量可取哪几个值,再利用分布表即可得到它的概率,注意分布表中随机变量取不同值时所表示的随机事件彼此互斥,因此利用概率的加法公式即可求出其概率.3.某离散型随机变量的概率分布列如下:(1)求常数a ,k ; (2)求概率P (X ≤5).解:(1)因为随机变量X 的取值及其概率的值都是按等差数列变化的,因此只要确定项数n 就可以求出常数a .所以n =23-(-4)(-1)-(-4)+1=273+1=10,a =1+(10-1)(3-1)=19.即k +3k +5k +…+19k =1,求得k =0.01. (2)由加法公式,可以得到P (X ≤5)=P (X =-4)+P (X =-1)+P (X =2)+P (X =5)=k +3k +5k +7k =16k =0.16.在医学生物学试验中,经常以果蝇作为试验对象,一个关有6只果蝇的笼子里,不慎混入了两只苍蝇(此时笼内共有8只蝇子:6只果蝇和2只苍蝇),只好把笼子打开一个小孔,让蝇子一只一只地往外飞,直到两只苍蝇都飞出,再关闭小孔.若以X 表示笼内还剩下的果蝇的只数,求X 的概率分布.[尝试] [巧思] 若以A k 表示事件“剩下k 只果蝇”(k =0,1,…,6),则当A k 发生时,第(8-k )只飞出的蝇子是苍蝇,且在前(7-k )只飞出的蝇子中恰有1只是苍蝇,因此P (A k )=C 17-k C 28=7-k28. [妙解] 设A k 表示事件“剩下k 只果蝇”(k =0,1,2,…,6),则P (A k )=C 17-kC 28=7-k 28.∴P (X =0)=P (A 0)=728;P (X =1)=P (A 1)=628; P (X =2)=P (A 2)=528;P (X =3)=P (A 3)=428; P (X =4)=P (A 4)=328; P (X =5)=P (A 5)=228;P (X =6)=P (A 6)=128. 即X 的概率分布列为1.一个袋中装有除颜色外完全相同的2个黑球和6个红球,从中任取两个,可以作为随机变量的是( )A .取到的球的个数B .取到红球的个数C .至少取到一个红球D .至少取到一个红球或一个黑球解析:选B A 中叙述的结果是确定的,不是随机变量,B 中叙述的结果可能是0,1,2,所以是随机变量.C 和D 叙述的结果也是确定的,而且不能包含所有可能出现的结果,故不是随机变量.2.袋中有大小相同的5个钢球,分别标有1,2,3,4,5五个号码.在有放回地抽取条件下依次取出2个球,设两个球号码之和为随机变量X ,则X 所有可能值的个数是( )A .25B .10C .9D .5解析:选C 第一次可取1,2,3,4,5中的任意一个,由于是有放回抽取,第二次也可取1,2,3,4,5中的任何一个,两次的号码和可能为2,3,4,5,6,7,8,9,10.3.已知随机变量ξ的分布列为P (ξ=k )=a (11-2k ),k =1,2,3,4,5,其中a 为常数,则P ⎝⎛⎭⎫52<ξ<235=( ) A.35 B.1325 C.45D.825解析:选D 由a (9+7+5+3+1)=1,可得a =125,所以P ⎝⎛⎭⎫52<ξ<235=P (ξ=3)+P (ξ=4)=525+325=825,故选D.4.甲进行3次射击,甲击中目标的概率为12,记甲击中目标的次数为X ,则X 的可能取值为________.解析:甲可能在3次射击中,一次也未中,也可能中1次,2次,3次. 答案:0,1,2,35.随机变量X 的概率分布列如图所示:(1)x =________(2)P (X >3)=________; (3)P (1<X ≤4)=________.解析:(1)由X 概率分布的性质得0.2+x +0.35+0.1+0.15+0.2=1,解得x =0; (2)P (X >3)=P (X =4)+P (X =5)+P (X =6) =0.1+0.15+0.2=0.45;(3)P (1<X ≤4)=P (X =2)+P (X =3)+P (X =4) =0+0.35+0.1=0.45. 答案:(1)0 (2)0.45 (3)0.456.某商店试销某种商品20天,获得如下数据:试销结束后(3件,当天营业结束后检查存货,若发现存货少于2件,则当天进货补充至3件,否则不进货,将频率视为概率.(1)求当天商店不进货的概率;(2)记X为第二天开始营业时该商品的件数,求X的分布列.解:(1)设“当天商店不进货”为事件A,“当天商品的销售量为0件”为事件B,“当天商品的销售量为1件”为事件C,则P(A)=P(B)+P(C)=120+520=310.(2)由题意,知X的可能取值为2,3.P(X=2)=P(C)=520=1 4,P(X=3)=1-P(X=2)=1-14=34.故X的分布列为一、选择题1.有下列四个命题:①某立交桥一天经过的车辆X;②某人射击2次,击中目标的环数之和记为X;③测量一批电阻,阻值在950 Ω~1 200 Ω之间;④一个在数轴上随机运动的质点,它在数轴上的位置记为X.其中是离散型随机变量的是()A.①②B.①③C.①④D.①②④解析:选A①②中变量X所有可能取值是可以一一列出,是离散型随机变量,而③④中的结果不能一一列出,故不是离散型随机变量.2.袋中装有10个红球,5个黑球,每次随机抽取一个球,若取得黑球,则另换一个红球放回袋中,直到取到红球为止,若抽取的次数为X,则表示“放回5个球”的事件为() A.X=4 B.X=5C.X=6 D.X≤4解析:选C第一次取到黑球,则放回1个球,第二次取到黑球,则共放回2个球…,共放了五回,第六次取到了红球,试验终止,故X=6.3.设随机变量X等可能取值1,2,3,…,n,若P(X<4)=0.3,则n的值为()A.3 B.4C.10 D.不确定解析:选C X的概率分布表为:P(X<4)=P(X=1)+P(X=2)+P(X=3)=3n=0.3=310.∴n=10.4.从含有2名女生的10名大学毕业生中任选3人进行调研,记女生入选的人数为X,则X的概率分布列为()A.C.解析:选A X的所有可能取值为0,1,2,“X=0”表示入选3人全是男生,则P(X=0)=C38C310=715,“X=1”表示入选3人中恰有1名女生,则P(X=1)=C12C28C310=715,“X =2”表示入选3人中有2名女生,则P (X =2)=C 22C 18C 310=115.因此X 的概率分布列为:二、填空题5.在8件产品中,有3 件次品,5 件正品,从中任取一件,取到次品就停止,抽取次数为X ,则“X =3”表示的试验结果是________.解析:X =3表示前2次均是正品,第3次是次品. 答案:共抽取3次,前2次均是正品,第3次是次品6.在考试中,需回答三个问题,考试规则规定:每题回答正确得100分,回答不正确得-100分,则这名同学回答这三个问题的总得分X 的所有可能取值是__________.解析:可能回答全对,两对一错,两错一对,全错四种结果,相应得分为300分,100分,-100分,-300分.答案:300,100,-100,-3007.已知随机变量X 只能取三个值x 1,x 2,x 3,其概率依次成等差数列,则公差d 的取值范围为________.解析:设X 的概率分布为:⎩⎪⎨⎪⎧a -d +a +a +d =1,0≤a -d ≤1,0≤a +d ≤1.解得-13≤d ≤13.答案:⎣⎡⎦⎤-13,13 8.设随机变量X 的概率分布为P (X =k )=ak (k =1,2,…,n ),则常数a =________. 解析:由分布列的性质可得, a (1+2+…+n )=1, 所以a =2n (n +1).答案:2n (n +1)三、解答题9.写出下列随机变量可能取的值,并说明随机变量所取的值表示的随机试验的结果. (1)一个袋中装有2个白球和5个黑球,从中任取3个,其中所含白球的个数X ; (2)一袋中装有5只同样大小的球,编号为1,2,3,4,5.现从该袋内随机取出3只球,被取出的球的最大号码数X .解:(1)X 可取0,1,2.X =i ,表示取出的3个球中有i 个白球,3-i 个黑球,其中i =0,1,2. (2)X 可取3,4,5.X =3,表示取出的3个球的编号为1,2,3;X =4,表示取出的3个球的编号为1,2,4或1,3,4或2,3,4;X =5,表示取出的3个球的编号为1,2,5或1,3,5或1,4,5或2,3,5或2,4,5或3,4,5. 10.某超市为了解顾客的购物量及结算时间等信息,安排一名员工随机收集了在该超市购物的100位顾客的相关数据,如下表所示:已知这100位顾客中一次购物量超过8件的顾客占55%. (1)求x ,y 的值;(2)将频率视为概率,求顾客一次购物的结算时间X 的分布列. 解:(1)由已知得25+y +10=55,x +30=45,所以x =15,y =20.该超市所有顾客一次购物的结算时间组成一个总体,所收集的100位顾客一次购物的结算时间可视为总体的一个容量为100的简单随机样本,将频率视为概率得P (X =1)=15100=320,P (X =1.5)=30100=310,P (X =2)=25100=14,P (X =2.5)=20100=15,P (X =3)=10100=110.X 的分布列为。
2019年高中数学湘教版选修2-3讲义+精练:第8章8.2.7离散型随机变量的方差含解析
8.2.7 离散型随机变量的方差[读教材·填要点]1.离散型随机变量X 的方差与标准差(1)当离散型随机变量X 有概率分布,p j =P (X =x j ),j =0,1,…,n 和数学期望μ=E (X )时,就称D (X )=(x 1-μ)2p 1+(x 2-μ)2p 2+…+(x n -μ)2p n 为X 的方差,称D (X )为X 的标准差.(2)X 的方差描述了随机变量X 向它的数学期望集中的程度,方差越小,X 向数学期望μ集中的越好.(3)如果X 是从某个总体中通过随机抽样得到的个体,X 的方差D (X )就是总体方差σ2,X 的数学期望E (X )就是总体均值μ.2.几个常见方差的计算公式(1)若Y =aX +b ,a ,b 为常数,即D (aX +b )=a 2D (X ); (2)当X 服从二点分布(1,p )时,D (X )=p (1-p ); (3)当X 服从二项分布B (n ,p )时,D (X )=np (1-p ); (4)当X 服从超几何分布H (N ,M ,n )时,D (X )=nM N ⎝⎛⎭⎫1-M N N -nN -1.[小问题·大思维]1.离散型随机变量的方差与样本的方差都是变量吗?提示:样本的方差随样本的不同而变化,是一个随机变量,而离散型随机变量的方差是通过大量试验得出的,刻画了随机变量X 与其均值E (X )的平均偏离程度,因此它是一个常数而非变量.2.D (X )的取值范围是什么?若b 为常数,则D (b )为何值? 提示:①因为D (X )=∑i =1n(x i -E (X ))2p i ,其中(x i -E (X ))2≥0,p i ≥0, 所以D (X )的取值范围为[0,+∞).②因为b 为常数,所以x 1=x 2=…=x n =E (X )=b , 故D (b )=0.3.D (X )与X 的单位之间有什么关系? 提示:D (X )的单位是X 的单位的平方.求离散型随机变量的方差[例1] (1)X1234则D (X )等于( )A.2912B.121144C.179144D.1712(2)一出租车司机从某饭店到火车站途中有6个交通岗, 假设他在各交通岗遇到红灯这一事件是相互独立的, 并且概率是13.①求这位司机遇到红灯数X 的期望与方差;②若遇上红灯, 则需等待30秒, 求司机总共等待时间Y 的期望与方差.[解析] (1)选C 由题意知,E (X )=1×14+2×13+3×16+4×14=2912,故D (X )=⎝⎛⎭⎫1-29122×14+⎝⎛⎭⎫2-29122×13+⎝⎛⎭⎫3-29122×16+⎝⎛⎭⎫4-29122×14=179144.(2)解:①易知司机遇上红灯次数X 服从二项分布, 且X ~B ⎝⎛⎭⎫6, 13, ∴E (X )=6×13=2,D (X )=6×13×⎝⎛⎭⎫1-13=43. ②由已知Y =30X ,∴E (Y )=30E (X )=60,D (Y )=900D (X )=1 200.由离散型随机变量的概率分布求其方差时,应首先计算数学期望,然后代入方差公式求解即可.但需要注意,如果能利用性质运算,先考虑性质运算,可避免繁琐的运算,提高解题效率.1.某运动员投篮命中率p =0.8,则该运动员在一次投篮中命中次数X 的方差为________. 解析:依题意知X 服从两点分布, 所以D (X )=0.8×(1-0.8)=0.16. 答案:0.162.一个口袋中装有大小相同的2个白球和4个黑球.采取不放回抽样方式,从中摸出两个球,求摸得白球的个数的期望和方差.解:设摸得白球的个数为X , 依题意得P (X =0)=C 24C 26=25,P (X =1)=C 12C 14C 26=815,P (X =2)=C 22C 26=115.所以E (X )=0×25+1×815+2×115=23,D (X )=⎝⎛⎭⎫0-232×25+⎝⎛⎭⎫1-232×815+⎝⎛⎭⎫2-232×115=1645⎝ ⎛⎭⎪⎫或D (X )=2×26×⎝⎛⎭⎫1-26×6-26-1=1645.离散型随机变量方差的性质[例2] (1)( ) A .6,2.4 B .2,2.4 C .2,5.6D .6,5.6(2)已知X 是离散型随机变量,P (X =1)=23,P (X =a )=13,E (X )=43,则D (2X -1)=( )A.13 B .-19C.43D.89[解析] (1)∵X ~B (10,0.6),∴E (X )=10×0.6=6,D (X )=10×0.6×(1-0.6)=2.4, ∴E (η)=8-E (X )=2,D (η)=(-1)2D (X )=2.4. (2)由题意,知1×23+a ×13=43,解得a =2,∴D (X )=⎝⎛⎭⎫1-432×23+⎝⎛⎭⎫2-432×13=29, ∴D (2X -1)=22 D (X )=4×29=89.[答案] (1)B (2)D求随机变量函数Y =aX +b 方差的方法求随机变量函数Y =aX +b 的方差,一种是先求Y 的分布列,再求其均值,最后求方差;另一种是应用公式D (aX +b )=a 2D (X )求解.3.已知η的分布列为η 0 10 20 50 60 P1325115215115(1)求η(2)设Y =2η-E (η),求D (Y ).解:(1)∵E (η)=0×13+10×25+20×115+50×215+60×115=16,∴D (η)=(0-16)2×13+(10-16)2×25+(20-16)2×115+(50-16)2×215+(60-16)2×115=384,D (η)=8 6.(2)∵Y=2η-E(η),∴D(Y)=D(2η-E(η))=22D(η)=4×384=1 536.方差的实际应用[例3]X、Y,X和Y的概率分布如下表:X 01 2P 610110310Y 01 2P 510310210试对这两名工人的技术水平进行比较.[解]工人甲生产出次品数X的期望和方差分别为:E(X)=0×610+1×110+2×310=0.7,D(X)=(0-0.7)2×610+(1-0.7)2×110+(2-0.7)2×310=0.81;工人乙生产出次品数Y的期望和方差分别为:E(Y)=0×510+1×310+2×210=0.7,D(Y)=(0-0.7)2×510+(1-0.7)2×310+(2-0.7)2×210=0.61.由E(X)=E(Y)知,两人生产出次品的平均数相同,技术水平相当,但D(X)>D(Y),可见乙的技术比较稳定.离散型随机变量的期望反映了随机变量取值的平均水平,而方差反映了随机变量取值的稳定与波动、集中与离散的程度.因此在实际决策问题中,需先运算均值,看一下谁的平均水平高,然后再计算方差,分析一下谁的水平发挥相对稳定,当然不同的模型要求不同,应视情况而定.4.甲、乙两个野生动物保护区有相同的自然环境,且野生动物的种类和数量也大致相等,而两个保护区内每个季度发现违反保护条例的事件次数的分布列分别为:甲保护区:X 012 3P 0.30.30.20.2乙保护区:解:甲保护区违规次数X 的数学期望和方差为 E (X )=0×0.3+1×0.3+2×0.2+3×0.2=1.3,D (X )=(0-1.3)2×0.3+(1-1.3)2×0.3+(2-1.3)2×0.2+(3-1.3)2×0.2=1.21. 乙保护区的违规次数Y 的数学期望和方差为:E (Y )=0×0.1+1×0.5+2×0.4=1.3,D (Y )=(0-1.3)2×0.1+(1-1.3)2×0.5+(2-1.3)2×0.4=0.41.因为E (X )=E (Y ),D (X )>D (Y ),所以两个保护区内每个季度发生的违规事件的平均次数相同,但甲保护区的违规事件次数相对分散和波动,乙保护区内的违规事件次数更加集中和稳定.解题高手妙解题第一种方案:李师傅的儿子认为:根据股市收益大的特点,应该将10万元全部用来买股票.据分析预测:投资股市一年可能获利40%,也可能亏损20%(只有这两种可能),且获利的概率为12.第二种方案:李师傅认为:现在股市风险大,基金风险较小,应将10万元全部用来买基金.据分析预测:投资基金一年后可能获利20%,可能损失10%,也可能不赔不赚,且这三种情况发生的概率分别为35,15,15.第三种方案:李师傅的妻子认为:投资股市、基金均有风险,应该将10万元全部存入银行一年,现在存款年利率为4%,存款利息税率为5%.针对以上三种投资方案,请你为李师傅家选择一种合理的理财方案,并说明理由. [尝试][巧思] 合理的理财方案应满足两个条件:①获利高;②稳妥性强.因此可从数学期望和方差两个方面考虑.优先选择期望值较大的方案,若期望值相同应考虑选择方差较小的方案.[妙解] 若按方案一执行,设收益为X 万元,则其概率分布为X 4 -2 P1212E (X )=4×12+(-2)×12=1万元.若按方案二执行,设收益为Y 万元,则其概率分布为:Y2-1∴E (Y )=2×35+0×15+(-1)×15=1万元.若按方案三执行,收益y =10×4%×(1-5%)=0.38万元. 又E (X )=E (Y )>y .D (X )=(4-1)2×12+(-2-1)2×12=9,D (Y )=(2-1)2×35+(0-1)2×15+(-1-1)2×15=85.由上知D (X )>D (Y ).这说明虽然方案一、方案二收益相等,但方案二更稳定.所以建议李师傅家选择方案二投资较为合理.1.下列说法中,正确的是( )A .随机变量的期望E (X )反映了X 取值的概率平均值B .随机变量的方差D (X )反映了X 取值的平均水平C .随机变量的期望E (X )反映了X 取值的平均水平D .随机变量的方差D (X )反映了X 取值的概率平均值解析:选C 离散型随机变量X 的期望反映了随机变量取值的平均水平,随机变量的方差反映了随机变量取值偏离于均值的平均程度.2.已知X ~B (n ,p ),E (X )=8,D (X )=1.6,则n 与p 的值分别是( ) A .n =100,p =0.08 B .n =20,p =0.4 C .n =10,p =0.2D .n =10,p =0.8解析:选D 由于X ~B (n ,p ),E (X )=8,D (X )=1.6. 所以np =8,np (1-p )=1.6,解之得n =10,p =0.8.3.已知离散型随机变量X 的概率分布为:P (X =k )=13,k =1,2,3,则D (3X +5)等于( )A .3B .6C .9D .4解析:选B ∵E (X )=(1+2+3)×13=2,D (X )=[(1-2)2+(2-2)2+(3-2)2]×13=23,∴D (3X +5)=9D (X )=6.4.同时抛掷两枚均匀的硬币10次,若两枚硬币同时出现反面的次数为X ,则D (X )=________. 解析:因为两枚硬币同时出现反面的概率为12×12=14,故X ~B ⎝⎛⎭⎫10,14,因此D (X )=10×14×⎝⎛⎭⎫1-14=158.答案:1585.已知离散型随机变量X 的概率分布如下表所示,则X 的方差为________.X 1 3 5 P0.40.1x解析:由条件知,x =0.5.E (X )=1×0.4+3×0.1+5×0.5=3.2,∴D (X )=(1-3.2)2×0.4+(3-3.2)2×0.1+(5-3.2)2×0.5=3.56. 答案:3.566.设X 是随机变量,P (X =a )=23,P (X =b )=13,且a <b .又E (X )=43,D (X )=29,求a +b 的值.解:由题意知,⎩⎨⎧23a +13b =43,23×⎝⎛⎭⎫a -432+13×⎝⎛⎭⎫b -432=29,解得⎩⎪⎨⎪⎧a =1,b =2或⎩⎨⎧a =53,b =23.又a <b ,所以a =1,b =2,a +b =3.一、选择题1.有甲、乙两种水稻,测得每种水稻各10株的分蘖数据,计算出样本方差分别为D (X 甲)=11,D (X 乙)=3.4.由此可以估计( )A .甲种水稻比乙种水稻分蘖整齐B .乙种水稻比甲种水稻分蘖整齐C .甲、乙两种水稻分蘖整齐程度相同D .甲、乙两种水稻分蘖整齐不能比较 解析:选B ∵D (X 甲)>D (X 乙) ∴乙种水稻比甲种水稻整齐.2.随机变量X 的概率分布为P (X =k )=p k q 1-k (k =0,1,p +q =1),则E (X )与D (X )依次为( )A .0和1B .p 和p 2C .p 和1-pD .p 和p (1-p )解析:选D 根据题意,E (X )=0×q +1×p =p ,D (X )=(0-p )2q +(1-p )2p =p (1-p ),或可以判断随机变量X 满足两点分布,所以E (X )与D (X )依次为p 和p (1-p ).3.已知X 服从二项分布B (n ,p ),且E (3X +2)=9.2,D (3X +2)=12.96,则二项分布的参数n ,p 的值为( )A .n =4,p =0.6B .n =6,p =0.4C .n =8,p =0.3D .n =24,p =0.1解析:选B 由E (3X +2)=3E (X )+2,D (3X +2)=9D (X ),当X ~B (n ,p )时,E (X )=np ,D (X )=np (1-p )可知⎩⎪⎨⎪⎧ 3np +2=9.2,9np (1-p )=12.96,∴⎩⎪⎨⎪⎧n =6,p =0.4.4.设随机变量ξ的分布列为P (ξ=k )=C k n ⎝⎛⎭⎫23k ·⎝⎛⎭⎫13n -k ,k =0,1,2,…,n ,且E (ξ)=24,则D (ξ)的值为( )A .8B .12 C.29D .16解析:选A 由题意可知ξ~B ⎝⎛⎭⎫n ,23,∴23n =E (ξ)=24,∴n =36,∴D (ξ)=n ×23×⎝⎛⎭⎫1-23=29×36=8.二、填空题5.随机变量X 的概率分布为:X -1 0 1 Pabc其中a ,b ,c 成等差数列,若E (X )=13,则D (X )的值是________.解析:E (X )=-1×a +0×b +1×c =c -a =13,又a +b +c =1,且2b =a +c , ∴a =16,b =13,c =12.∴D (X )=⎝⎛⎭⎫-1-132×16+⎝⎛⎭⎫0-132×13+⎝⎛⎭⎫1-132×12=59. 答案:596.一次数学测验由25道选择题构成,每个选择题有4个选项,其中有且仅有一个选项是正确的,每个答案选择正确得4分,不作出选择或选错不得分,满分100分,某学生选对任一题的概率为0.6,则此学生在这一次测验中的成绩的均值与方差分别为________.解析:设该学生在这次数学测验中选对答案的题目的个数为X ,所得的分数(成绩)为Y ,则Y =4X .由题知X ~B (25,0.6),所以E (X )=25×0.6=15,D (X )=25×0.6×0.4=6,E (Y )=E (4X )=4E (X )=60,D (Y )=D (4X )=42×D (X )=16×6=96,所以该学生在这次测验中的成绩的均值与方差分别是60与96.答案:60,967.若X 是离散型随机变量,P (X =x 1)=23,P (X =x 2)=13,且x 1<x 2,又知E (X )=49,D (X )=2,则x 1+x 2=________.解析:由题意可得:E (X )=23x 1+13x 2,D (X )=⎝⎛⎭⎫x 1-492×23+⎝⎛⎭⎫x 2-492×13, ∴⎩⎨⎧23x 1+13x 2=49,⎝⎛⎭⎫x 1-492×23+⎝⎛⎭⎫x 2-492×13=2.解得x 1+x 2=179.答案:1798.随机变量X 的概率分布如下表,若E (X )=0,D (X )=1,则a =________,b =________.X -1 0 1 2 pabc112解析:由题意⎩⎪⎨⎪⎧a +b +c +112=1,-a +c +16=0,a ×1+c ×1+4×112=1.解得a =512,b =c =14. 答案:512 14三、解答题9.编号1,2,3的三位学生随意入座编号为1,2,3的三个座位,每位学生坐一个座位,设与座位编号相同的学生的个数是X .(1)求随机变量X 的概率分布; (2)求随机变量X 的数学期望和方差. 解:(1)P (X =0)=2A 33=13;P (X =1)=C 13A 33=12;P (X =3)=1A 33=16.∴概率分布为:X 0 1 3 P131216(2)E (X )=1×12+3×16=1.D(X)=(1-0)2×13+(1-1)2×12+(3-1)2×16=1.10.甲、乙两名射手各打了10发子弹,其中甲击中环数与次数如表:环数5678910次数11112 4环数78910概率0.20.3p 0.1(1)(2)比较甲、乙射击水平的优劣.解:(1)p=0.4.设甲、乙击中的环数分别为X1、X2,则P(X1=8)=110=0.1,P(X1=9)=210=0.2,P(X1=10)=410=0.4,P(X2=8)=0.3,P(X2=9)=0.4,P(X2=10)=0.1,所以甲、乙各打一枪击中18环的概率为:P=0.1×0.1+0.3×0.4+0.2×0.4=0.21.(2)甲的期望为E(X1)=5×0.1+6×0.1+7×0.1+8×0.1+9×0.2+10×0.4=8.4,乙的期望为E(X2)=7×0.2+8×0.3+9×0.4+10×0.1=8.4.甲的方差为D(X1)=(5-8.4)2×0.1+(6-8.4)2×0.1+(7-8.4)2×0.1+(8-8.4)2×0.1+(9-8.4)2×0.2+(10-8.4)2×0.4=3.04,乙的方差为D(X2)=(7-8.4)2×0.2+(8-8.4)2×0.3+(9-8.4)2×0.4+(10-8.4)2×0.1=0.84.所以D(X1)>D(X2),乙比甲技术稳定.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8.4列联表独立性分析案例[读教材·填要点]1.列联表一般地,对于两个因素X和Y,X的两个水平取值:A和A(如吸烟和不吸烟),Y也有两个水平取值:B和B(如患肺癌和不患肺癌),我们得到下表中的抽样数据,这个表格称为2×2列联表.YXB B合计A a b a+bA c d c+d合计a+c b+d a+b+c+d2.χ2的求法公式χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).3.独立性检验的概念用随机变量χ2研究两变量是否有关的方法称为独立性检验.4.独立性检验的步骤要判断“X与Y有关系”,可按下面的步骤进行:(1)提出假设H0:X与Y无关;(2)根据2×2列联表及χ2公式,计算χ2的值;(3)查对临界值,作出判断.其中临界值如表所示:P(χ2≥x0)0.500.400.250.150.100.050.0250.0100.0050.001x00.4550.708 1.323 2.072 2.706 3.841 5.024 6.6357.87910.82 8表示在H0成立的情况下,事件“χ2≥x0”发生的概率.5.变量独立性判断的依据(1)如果χ2>10.828时,就有99.9%的把握认为“X与Y有关系”;(2)如果χ2>6.635时,就有99%的把握认为“X与Y有关系”;(3)如果χ2>2.706时,就有90%的把握认为“X与Y有关系”;(4)如果χ2≤2.706时,就认为没有充分的证据显示“X 与Y 有关系”,但也不能作出结论“H 0成立”,即X 与Y 没有关系.[小问题·大思维]1.利用χ2进行独立性分析,估计值的准确度与样本容量有关吗?提示:利用χ2进行独立性分析,可以对推断的正确性的概率作出估计,样本容量n 越大,这个估计值越准确.如果抽取的样本容量很小,那么利用χ2进行独立性检验的结果就不具有可靠性.2.在χ2运算后,得到χ2的值为29.78,在判断因素相关时,P (χ2≥6.64)≈0.01和P (χ2≥7.88)≈0.005,哪种说法是正确的?提示:两种说法均正确.P (χ2≥6.64)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两因素相关;而P (χ2≥7.88)≈0.005的含义是在犯错误的概率不超过0.005的前提下认为两因素相关.独立性分析的原理[例1]患心脏病 未患心脏病总计 每一晚都打鼾 30 224 254 不打鼾 24 1 355 1 379 总计541 5791 633[解] 由列联表中的数据,得χ2的值为χ2=1 633×(30×1 355-224×24)2254×1 379×54×1 579≈68.033>6.635.因此,有99%的把握认为每一晚打鼾与患心脏病有关系.解决一般的独立性分析问题,首先由所给2×2列联表确定a ,b ,c ,d ,a +b +c +d 的值,然后代入随机变量的计算公式求出观测值χ2,将χ2与临界值x 0进行对比,确定有多大的把握认为两个分类变量有关系.1.某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,经过调查得到如下列联表:积极支持企业改革 不太支持 企业改革 总计 工作积极 54 40 94 工作一般 32 63 95 总计86103189解:由列联表中的数据,得 χ2=189×(54×63-40×32)294×95×86×103≈10.759>6.635,∴有99%的把握认为工作态度与支持企业改革之间有关系.独立性分析的应用[例2] 得病 不得病 合计 干净水 52 466 518 不干净水 94 218 312 合计146684830(1)(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.[解] (1)假设H 0:传染病与饮用水无关.把表中数据代入公式,得χ2=830×(52×218-466×94)2146×684×518×312≈54.21,因为当H 0成立时,χ2≥10.828的概率约为0.001,所以我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关. (2)依题意得2×2列联表:得病 不得病 合计 干净水 5 50 55 不干净水 9 22 31 合计147286此时,χ2=86×(5×22-50×9)214×72×55×31≈5.785.由于5.785>2.706,所以我们有90%的把握认为该种疾病与饮用不干净水有关.两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有90%的把握肯定.独立性分析的步骤:要推断“X 与Y 是否有关”可按下面的步骤进行: ①提出统计假设H 0:X 与Y 无关;②根据2×2列联表与χ2计算公式计算出χ2的值; ③根据两个临界值,作出判断.2.为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.是否有90%的把握认为“学生选报文、理科与对外语的兴趣有关”?解:根据题目所给的数据得到如下列联表:理科 文科 总计 有兴趣 138 73 211 无兴趣 98 52 150 总计236125361χ2=361×(138×52-73×98)2211×150×236×125≈1.871×10-4.因为1.871×10-4<2.706,所以没有90%的把握认为“学生选报文、理科与对外语的兴趣有关”.独立性分析的综合应用[例3] 为了比较注射A ,B 两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A ,另一组注射药物B .下表1和表2分别是注射药物A 和药物B 后的试验结果.(疱疹面积单位:mm 2)表1:注射药物A 后皮肤疱疹面积的频数分布表疱疹面积 [60,65) [65,70) [70,75) [75,80) 频数30402010表2:注射药物B 后皮肤疱疹面积的频数分布表 疱疹面积 [60,65)[65,70) [70,75) [75,80)[80,85) 频数 1025203015完成下面2×2列联表,并回答是否有99%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.表3:疱疹面积小于70 mm 2疱疹面积不 小于70 mm 2合计 注射药物A a = b = 注射药物B c = d = 合计[解]疱疹面积 小于70 mm 2疱疹面积不小于70 mm 2 合计注射药物A a =70 b =30 100 注射药物B c =35 d =65 100 合计10595200 χ2=200×(70×65-35×30)2100×100×105×95≈24.56>6.635.因此,有99%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.在绘制列联表时,应对问题中的不同数据分成不同的类别,然后列表.要注意列联表中各行、各列中数据的意义及书写格式.3.已知某班n 名同学的数学测试成绩(单位:分,满分100分)的频率分布直方图如图所示,其中a ,b ,c 成等差数列,且成绩在[90,100]内的有6人.(1)求n 的值;(2)规定60分以下为不及格,若不及格的人中女生有4人,而及格的人中,男生比女生少4人,借助独立性检验分析是否有90%的把握认为“本次测试的及格情况与性别有关”?附:P (χ2≥k 0)0.10 0.05 0.010 0.005 k 02.7063.8416.6357.879χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )解:(1)依题意得⎩⎪⎨⎪⎧10(0.035+0.025+c +2b +a )=1,2b =a +c ,解得b =0.01. 因为成绩在[90,100]内的有6人, 所以n =60.01×10=60.(2)由于2b =a +c ,而b =0.01,可得a +c =0.02,则不及格的人数为0.02×10×60=12,及格的人数为60-12=48,设及格的人中,女生有x 人,则男生有x -4人, 于是x +x -4=48,解得x =26,故及格的人中,女生有26人,男生有22人. 于是本次测试的及格情况与性别的2×2列联表如下:及格 不及格 总计 男 22 8 30 女 26 4 30 总计481260结合列联表计算可得χ2=60×(22×4-8×26)230×30×48×12=1.667<2.706,故没有90%的把握认为“本次测试的及格情况与性别有关”.解题高手多解题患色盲是否有关?你所得到的结论在什么范围内有效?[解] 由题意作2×2列联表如下:色盲 非色盲 总计 男 38 442 480 女 6 514 520 总计449561 000法一:由列联表中数据可知,在调查的男人中,患色盲的比例是38480≈7.917%,女人中患色盲的比例为6520≈1.154%,由于两者差距较大,因而我们可以认为性别与患色盲是有关系的.法二:由列联表中所给的数据可知, a =38,b =442,c =6,d =514,a +b =480,c +d =520,a +c =44,b +d =956,n =1 000, 代入公式得 χ2=1 000×(38×514-6×442)2480×520×44×956≈27.1.由于χ2≈27.1>6.635,所以我们有99%的把握即在犯错误不超过0.01的前提下认为性别与患色盲有关系. 这个结论只对所调查的480名男人和520名女人有效.1.下面是2×2列联表:y 1 y 2 总计 x 1 a 21 73 x 2 2 25 27 总计b46则表中a ,b 的值分别为( A .94,96 B .52,50 C .52,54D .54,52解析:选C ∵a +21=73,∴a =52. 又∵a +2=b ,∴b =54.2.下列关于χ2的说法中正确的是( )A .χ2在任何相互独立问题中都可以用于检验是否相关B .χ2的值越大,两个事件的相关性越大C .χ2是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这一类问题D .χ2=n (ad -bc )(a +b )(c +d )(a +c )(b +d )答案:C3.对于因素X 与Y 的随机变量χ2的值,下列说法正确的是( ) A .χ2越大,“X 与Y 有关系”的可信程度越小 B .χ2越小,“X 与Y 有关系”的可信程度越小 C .χ2越接近于0,“X 与Y 没有关系”的可信程度越小 D .χ2越大,“X 与Y 没有关系”的可信程度越大解析:选B χ2越大,“X 与Y 没有关系”的可信程度越小,则“X 与Y 有关系”的可信程度越大.即χ2越小,“X 与Y 有关系”的可信程度越小.4.若由一个2×2列联表中的数据计算得χ2的观测值为4.013,那么在犯错误的概率不超过________的前提下,认为两个变量之间有关系.解析:因为4.013>3.841,所以在犯错误的概率不超过0.05的前提下,认为两个变量之间有关系.答案:0.055.某矿石粉厂当生产一种矿石粉时,在数天内即有部分工人患职业性皮肤炎,在生产季节开始,随机抽取75名车间工人穿上新防护服,其余仍穿原用的防护服,生产进行一个月后,检查两组工人的皮肤炎患病人数如下:阳性例数阴性例数 合计 新 5 70 75 旧 10 18 28 合计1588103解析:χ2=103×(5×18-70×10)275×28×15×88≈13.826>6.635.故有99%的把握说,新防护服比旧防护服对预防工人职业性皮炎有效. 答案:99%6.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:喜爱打篮球不喜爱打篮球合计 男生 a b =5 女生 c =10 d 合计50已知在全部50人中随机抽取1人抽到爱打篮球的学生的概率为35.(1)请将上面的列联表补充完整;(2)是否有99%的把握认为喜爱打篮球与性别有关;请说明理由. 附参考公式:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .P (χ2≥x 0)0.15 0.10 0.05 0.025 0.010 0.005 0.001 x 02.0722.7063.8415.0246.6357.87910.828解:(1)列联表补充如下:喜爱打篮球不喜爱打篮球合计 男生 20 5 25 女生 10 15 25 合计302050(2)∵χ2=50×(20×15-10×5)230×20×25×25≈8.333>6.635,∴有99%的把握认为喜爱打篮球与性别有关.一、选择题1.有两个因素X 与Y 的一组数据,由其列联表计算得χ2≈4.523,则认为X 与Y 有关系是错误的可信度为( )A .95%B .90%C .5%D .10%解析:选C ∵χ2≥3.841.∴X 与Y 有关系的概率为95%,∴X 与Y 有关系错误的可信度为5%.2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050110计算得, χ2=110×(40×30-20×20)260×50×60×50≈7.8.附表:P (χ2≥x 0)0.050 0.010 0.001 x 03.8416.63510.828A .在犯错误的概率不超过0.1% 的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1% 的前提下,认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关” 解析:选C 根据独立性分析的思想方法,正确选项为C.3.某高校“统计初步”课程的老师随机调查了选该课的一些学生情况,具体数据如下表:非统计专业统计专业 男 13 10 女720为了分析主修统计专业是否与性别有关,根据表中的数据,得到χ2=50(13×20-10×7)223×27×20×30≈4.84,所以断定主修统计专业与性别有关系,这种判断出错的可能性为( )A .0.025B .0.05C .0.975D .0.95解析:选B ∵χ2≈4.84>3.841,所以我们有95%的把握认为主修统计专业与性别无关,即判断出错的可能性为0.05.4.已知P (x 2≥2.706)=0.10,两个因素X 和Y ,取值分别为{x 1,x 2}和{y 1,y 2},其样本频数分别是a =10,b =21,c +d =35.若在犯错误的概率不超过0.1的前提下,认为X 与Y 有关系,则c 等于( )A .5B .6C .7D .8解析:选A 经分析,c =5. 二、填空题5.班级与成绩2×2列联表:优秀不优秀总计甲班103545乙班738p总计m n q表中数据m,n,p,q解析:m=10+7=17,n=35+38=73,p=7+38=45,q=m+n=90.答案:17,73,45,906.在吸烟与患肺病是否相关的判断中,有下面的说法:①若χ2>6.64,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性分析可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性分析可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.解析:χ2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说明③正确.答案:③7.统计推断,当________时,在犯错误的概率不超过0.05的前提下认为事件A与B有关;当________时,认为没有充分的证据显示事件A与B是有关的.解析:当k>3.841时,就有在犯错误的概率不超过0.05的前提下认为事件A与B有关,当k <2.706时认为没有充分的证据显示事件A与B是有关的.答案:k>3.841k<2.7068.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:文艺节目新闻节目总计20至40岁1858大于40岁 15 27 42 总计5545100由表中数据直观分析,收看新闻节目的观众是否与年龄有关:________(填“是”或“否”). 解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即b a +b =1858,d c +d =2742,两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄是有关的.答案:是 三、解答题9.某市对该市一重点中学2018年高考上线情况进行统计,随机抽查得到表格:语文 数学 英语 综合科目 上线不上线上线不上线上线不上线上线不上线总分上线201人 17427178231762517526总分不上线43人 30 13 23 20 24 19 26 17 总计20440201432004420143解:对于上述四个科目,分别构造四个随机变量χ21,χ22,χ23,χ24.由表中数据可以得到:语文:χ21=244×(174×13-27×30)2201×43×204×40=7.294>6.64, 数学:χ22=244×(178×20-23×23)2201×43×201×43=30.008>6.64,英语:χ23=244×(176×19-25×24)2201×43×200×44=24.155>6.64, 综合科目:χ24=244×(175×17-26×26)2201×43×201×43=17.264>6.64. 所以有99%的把握认为语文、数学、英语、综合科目上线与总分上线有关系,数学上线与总分上线关系最大.10.一次对人们休闲方式的调查中共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2列联表;(2)能否在犯错误的概率不超过0.05的前提下认为性别与休闲方式有关系? 解:(1)2×2列联表如下:休闲方式 性别看电视 运动 总计女 43 27 70 男 21 33 54 总计6460124(2)假设休闲方式与性别无关,由公式得 χ2=124×(43×33-27×21)270×54×64×60≈6.201.因为6.201>3.841,所以有理由认为假设休闲方式与性别无关是不合理的,即在犯错误的概率不超过0.05的前提下认为休闲方式与性别有关.。