高中数学 第三章 统计案例 2 独立性检验素材 北师大版选修2-3

合集下载

高中数学第三章统计案例2独立性检验教学案北师大版选修

高中数学第三章统计案例2独立性检验教学案北师大版选修

2 独立性检验[对应学生用书P40]1.2×2列联表设A ,B 为两个变量,每个变量都可以取两个值,变量A :A 1,A 2=A -1;变量B :B 1,B 2=B -1,用下表表示抽样数据B A B 1 B 2 总计A 1 a b a +b A 2c d c +d 总计a +cb +dn =a +b +c +d并将此表称为2×2列联表. 2.χ2的计算公式χ2=n ad -bc 2a +bc +d a +cb +d.3.独立性判断的方法(1)当χ2≤2.706时,没有充分的证据判定变量A ,B 有关联,可以认为变量A ,B 是没有关联的;(2)当χ2>2.706时,有90%的把握判定变量A ,B 有关联; (3)当χ2>3.841时,有95%的把握判定变量A ,B 有关联; (4)当χ2>6.635时,有99%的把握判定变量A ,B 有关联.(1)独立性检验是一种假设检验,在对总体的估计中,通过抽取样本,构造合适的统计量,对假设的正确性进行判断.(2)使用χ2统计量作2×2列联表的独立性检验时,一般要求表中的4个数据都大于5,数据越大,越能说明结果的普遍性.[对应学生用书P41]2×2列联表[例1]在调查的4806名患有色盲,试作出性别与色盲的列联表.[思路点拨]在2×2列联表中,共有两类变量,每一类变量都有两个不同的取值,然后出相应的数据,列表即可.[精解详析]根据题目所给的数据作出如下的列联表:色盲性别患色盲不患色盲男38442女6514[一点通]1.下面是一个2×2列联表:则表中a,b处的值分别为()y1y2总计x1 a 2153x282533总计 b 46A.32,40C.74,82 D.64,72解析:a=53-21=32,b=a+8=40.答案:A2.某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的426名学生中有332名在考前心情紧张,性格外向的594名学生中在考前心情紧张的有213人.试作出2×2列联表.解:列联表如下:性格情况考前心情是否紧张性格内向性格外向总计考前心情紧张 332 213 545 考前心情不紧张94 381 475 总计4265941 020独立性检验的应用[例2](8分)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男 女 需要 40 30 不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? [思路点拨]解答本题先分析列联表数,后计算χ2,再与临界值比较,判断两个变量是否相互独立.[精解详析](1)调查的500位老年人中有70位需要志愿者提供帮助,因此在该地区老年人中,需要帮助的老年人的比例的估计值为70500×100%=14%.(4分)(2)χ2=500×40×270-30×1602200×300×70×430≈9.967.(6分)因为9.967>6.635,所以有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关.(8分)[一点通]这类问题的解决方法为先确定a ,b ,c ,d ,n 的值并求出χ2的值,再与临界值相比较,作出判断,解题时注意正确运用公式,代入数据准确计算.3.在一个2×2列联表中,通过数据计算χ2=8.325,则这两个变量间有关系的可能性为________.答案:99%4.某高校《统计初步》课程的教师随机调查了选该课的学生的一些情况,具体数据如下表:非统计专业统计专业 男 13 10 女720则χ2≈________,有________的把握判定主修统计专业与性别有关. 解析:χ2=50×13×20-10×7220×30×23×27≈4.844>3.841,故有95%的把握认为主修统计专业与性别有关.答案:4.84495%5.(福建高考)某有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率.(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?P (χ2≥k )0.100 0.050 0.010 0.001 k2.7063.8416.63510.828附:χ2=a +bc +d a +cb +d解:(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名. 所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),25周岁以下组工人有40×0.05=2(人).从中随机抽取2名工人,记至少抽到一名25周岁以下组工人的事件为A ,故P (A )=1-C 23C 25=710,故所求概率为710. (2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:生产能手 非生产能手合计 25周岁以上组 15 45 60 25周岁以下组15 25 40 合计3070100所以得χ2=n ad -bc 2a +bc +d a +cb +d=100×15×25-15×45260×40×30×70=2514≈1.79.因为1.79<2.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.独立性检验的基本步骤: 1.列出2×2列联表. 2.求出χ2=n ad -bc 2a +ca +b b +dc +d.3.判断是否有关联,得出事件有关的可能性大小.[对应跟踪训练十七]1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到下表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050110由χ2=n ad -bc 2a +bc +d a +cb +d算得,χ2=110×40×30-20×20260×50×60×50≈7.8.附表:P (χ2≥k )0.050 0.010 0.001 k3.8416.63510.828参照附表,得到的正确结论是()A .有99.9%以上的把握认为“爱好该项运动与性别有关”B .有99.9%以上的把握认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动和性别有关”D .有99%以上的把握认为“爱好该项运动和性别无关” 解析:因为χ2=7.8>6.635,所以有99%以上的把握认为有关. 答案:C2.下面是2×2列联表:Y x y 1 y 2总计 x 1 a21 73 x 2225 27 总计b46100则表中a ,b A .94、96 B .52、50 C .52、54D .54、52解析:a =73-21=52,b =100-46=54,故选C. 答案:C3.高二第二学期期中考试,对甲、乙两个班级学生的数学考试成绩按照优秀和不优秀统计人数后,得到2×2列联表,则随机变量χ2的值为()班级与成绩统计表优秀 不优秀 总计 甲班 11 34 45 乙班 8 37 45 总计197190A .0.600B .0.828C .2.712D .6.004解析:随机变量χ2=90×11×37-34×8219×71×45×45≈0.600,故选A.答案:A4.(江西高考)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1成绩 性别 不及格 及格 总计 男 6 1420 女 1032 总计163652表2视力 性别好 差 总计 男 4 16 20 女 12 20 32 总计163652表3智商 性别偏高 正常 总计 男 8 12 20 女 8 24 32 总计16 3652阅读量 丰富不丰富总计性别男 14 6 20 女 2 30 32 总计163652A .成绩B .视力C .智商D .阅读量 解析:因为χ21=52×6×-14×10216×36×32×20=52×8216×36×32×20, χ22=52×4×20-16×12216×36×32×20=52×1116×36×32×20, χ23=52×8×24-12×8216×36×32×20=52×96216×36×32×20, χ24=52×14×30-6×2216×36×32×20=52×408216×36×32×20, 则有χ24>χ22>χ23>χ21,所以阅读量与性别关联的可能性最大. 答案:D5.在独立性检验中,统计量χ2有两个临界值:3.841和6.635.当χ2>3.841时,有95%的把握说明两个事件有关,当χ2>6.635时,有99%的把握说明两个事件有关,当χ2≤3.841时,认为两个事件无关.在一项打鼾与患心脏病关系的调查中,共调查了 2000人,经计算得χ2=20.87,根据这一数据分析,下列关于打鼾与患心脏病之间关系的说法,正确的是________.①有95%的把握认为两者有关; ②约有95%的打鼾者患心脏病; ③有99%的把握认为两者有关; ④约有99%的打鼾者患心脏病.解析:χ2=20.87>6.635,有99%的把握说明两个事件有关,但只是估计,不能肯定什么.答案:③6.为探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射后14天内的结果如下表所示:死亡 存活 总计 第一种剂量141125第二种剂量 6 19 25 总计203050在研究小白鼠的死亡与剂量是否有关时,根据以上数据求得χ2=________. 解析:χ2=5014×19-6×11220×30×25×25≈5.333.答案:5.3337.为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查,得到如下数据:成绩优秀 成绩较差 总计 兴趣浓厚的 6430 94 兴趣不浓厚的73 95 总计86103189判断学生的数学成绩好坏与对学习数学的兴趣是否有关? 解:由公式求得χ2=189×64×73-×30286×103×94×95≈38.459.∵38.459>6.635,∴有99%的把握认为数学成绩的好坏与对学习数学的兴趣有关.8.现对某市工薪阶层关于“楼市限购政策”的态度进行调查,随机抽查了50人,他们月收入(单位:百元)的频数分布及对“楼市限购政策”的赞成人数如下表: 月收入 [15,25) [25,35) [35,45) [45,55) [55,65) [65,75] 频数 5 10 15 10 5 5 赞成人数4812521以5 500元为分界点时,该市的工薪阶层对“楼市限购政策”的态度有差异;月收入不低于5500元 月收入低于5 500元 总计 赞成 不赞成 总计(2)成“楼市限购政策”的概率.解:(1)由题意得2×2列联表:月收入不低于5 500元 月收入低于5 500元总计 赞成 3 29 32 不赞成 7 11 18 总计104050假设月收入以5 500元为分界点时,该市的工薪阶层对“楼市限购政策”的态度没有差异,根据列联表中的数据,得到:χ2=50×3×11-7×29210×40×32×18≈6.272<6.635,所以没有99%的把握认为当月收入以 5 500元为分界点时,该市的工薪阶层对“楼市限购政策”的态度有差异.(2)已知在收入[55,65)中共有5人,2人赞成,3人不赞成,设至少有一个不赞成楼市限购政策为事件A ,则P (A )=1-C 22C 25=910.故所求概率为910.。

3.2独立性检验教案(北师大版选修2-3)

3.2独立性检验教案(北师大版选修2-3)

3.2独立性检验(共计3课时)授课类型:新授课一、教学内容与教学对象分析通过典型案例,学习下列一些常用的统计方法,并能初步应用这些方法解决一些实际问题。

①通过对典型案例(如“患肺癌与吸烟有关吗”等)的探究。

了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用。

②通过对典型案例(如“人的体重与身高的关系”等)的探究,了解回归的基本思想、方法及其初步应用。

二. 学习目标1、知识与技能通过本节知识的学习,了解独立性检验的基本思想和初步应用,能对两个分类变量是否有关做出明确的判断。

明确对两个分类变量的独立性检验的基本思想具体步骤,会对具体问题作出独立性检验。

2、过程与方法在本节知识的学习中,应使学生从具体问题中认识进行独立性检验的作用及必要性,树立学好本节知识的信心,在此基础上学习三维柱形图和二维柱形图,并认识它们的基本作用和存在的不足,从而为学习下面作好铺垫,进而介绍K的平方的计算公式和K的平方的观测值R的求法,以及它们的实际意义。

从中得出判断“X与Y有关系”的一般步骤及利用独立性检验来考察两个分类变量是否有关系,并能较准确地给出这种判断的可靠程度的具体做法和可信程度的大小。

最后介绍了独立性检验思想的综合运用。

3、情感、态度与价值观通过本节知识的学习,首先让学生了解对两个分类博变量进行独立性检验的必要性和作用,并引导学生注意比较与观测值之间的联系与区别,从而引导学生去探索新知识,培养学生全面的观点和辨证地分析问题,不为假想所迷惑,寻求问题的内在联系,培养学生学习数学、应用数学的良好的数学品质。

加强与现实生活相联系,从对实际问题的分析中学会利用图形分析、解决问题及用具体的数量来衡量两个变量之间的联系,学习用图形、数据来正确描述两个变量的关系。

明确数学在现实生活中的重要作用和实际价值。

教学中,应多给学生提供自主学习、独立探究、合作交流的机会。

养成严谨的学习态度及实事求是的分析问题、解决问题的科学世界观,并会用所学到的知识来解决实际问题。

高中数学 第三章 统计案例 2 独立性检验教学案 北师大

高中数学 第三章 统计案例 2 独立性检验教学案 北师大

§2 独立性检验[对应学生用书P40]1.2×2列联表设A ,B 为两个变量,每个变量都可以取两个值,变量A :A 1,A 2=A -1;变量B :B 1,B 2=B -1,用下表表示抽样数据并将此表称为2.χ2的计算公式 χ2=n ad -bc 2a +bc +d a +cb +d.3.独立性判断的方法(1)当χ2≤2.706时,没有充分的证据判定变量A ,B 有关联,可以认为变量A ,B 是没有关联的;(2)当χ2>2.706时,有90%的把握判定变量A ,B 有关联; (3)当χ2>3.841时,有95%的把握判定变量A ,B 有关联; (4)当χ2>6.635时,有99%的把握判定变量A ,B 有关联.(1)独立性检验是一种假设检验,在对总体的估计中,通过抽取样本,构造合适的统计量,对假设的正确性进行判断.(2)使用χ2统计量作2×2列联表的独立性检验时,一般要求表中的4个数据都大于5,数据越大,越能说明结果的普遍性.[对应学生用书P41][例1] 在调查的6名患有色盲,试作出性别与色盲的列联表.[思路点拨] 在2×2列联表中,共有两类变量,每一类变量都有两个不同的取值,然后出相应的数据,列表即可.[精解详析] 根据题目所给的数据作出如下的列联表:[一点通]1.下面是一个2×2列联表:则表中a ,b 处的值分别为( )A.32,40 C .74,82D .64,72解析:a =53-21=32,b =a +8=40. 答案:A2.某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的426名学生中有332名在考前心情紧张,性格外向的594名学生中在考前心情紧张的有213人.试作出2×2列联表.解:列联表如下:[例2] (8分)该地区调查了500位老年人,结果如下:(1)(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?[思路点拨] 解答本题先分析列联表数,后计算χ2,再与临界值比较,判断两个变量是否相互独立.[精解详析] (1)调查的500位老年人中有70位需要志愿者提供帮助,因此在该地区老年人中,需要帮助的老年人的比例的估计值为70500×100%=14%. 分)(2)χ2=-2200×300×70×430≈9.967.分)因为9.967>6.635,所以有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关.分)[一点通] 这类问题的解决方法为先确定a,b,c,d,n的值并求出χ2的值,再与临界值相比较,作出判断,解题时注意正确运用公式,代入数据准确计算.3.在一个2×2列联表中,通过数据计算χ2=8.325,则这两个变量间有关系的可能性为________.答案:99%4.某高校《统计初步》课程的教师随机调查了选该课的学生的一些情况,具体数据如下表:则χ2≈________,有 解析:χ2=-220×30×23×27≈4.844>3.841,故有95%的把握认为主修统计专业与性别有关.答案:4.844 95%5.(福建高考)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率.(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附:χ2=a +bc +d a +cb +d解:(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名. 所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),25周岁以下组工人有40×0.05=2(人).从中随机抽取2名工人,记至少抽到一名25周岁以下组工人的事件为A ,故P (A )=1-C 23C 25=710,故所求概率为710.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:所以得χ2=a +bc +d a +cb +d=260×40×30×70=2514≈1.79.因为1.79<2.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.独立性检验的基本步骤: 1.列出2×2列联表. 2.求出χ2=n ad -bc 2a +ca +b b +dc +d.3.判断是否有关联,得出事件有关的可能性大小.[对应课时跟踪训练十七1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到下表:由χ2=n ad -bc 2a +bc +d a +cb +d算得,χ2=-260×50×60×50≈7.8.附表:参照附表,得到的正确结论是( )A.有99.9%以上的把握认为“爱好该项运动与性别有关”B.有99.9%以上的把握认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动和性别有关”D.有99%以上的把握认为“爱好该项运动和性别无关”解析:因为χ2=7.8>6.635,所以有99%以上的把握认为有关.答案:C2.下面是2×2列联表:则表中a,bA.94、96 B.52、50C.52、54 D.54、52解析:a=73-21=52,b=100-46=54,故选C.答案:C3.高二第二学期期中考试,对甲、乙两个班级学生的数学考试成绩按照优秀和不优秀统计人数后,得到2×2列联表,则随机变量χ2的值为( )班级与成绩统计表A.0.600 B.0.828C.2.712 D.6.004解析:随机变量χ2=-219×71×45×45≈0.600,故选A.答案:A4.(江西高考)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1表2表3A.成绩B.视力C.智商D.阅读量解析:因为χ21=-216×36×32×20=52×8216×36×32×20,χ22=-216×36×32×20=52×112216×36×32×20,χ23=-216×36×32×20=52×96216×36×32×20,χ24=-216×36×32×20=52×408216×36×32×20,则有χ24>χ22>χ23>χ21,所以阅读量与性别关联的可能性最大.答案:D5.在独立性检验中,统计量χ2有两个临界值:3.841和6.635.当χ2>3.841时,有95%的把握说明两个事件有关,当χ2>6.635时,有99%的把握说明两个事件有关,当χ2≤3.841时,认为两个事件无关.在一项打鼾与患心脏病关系的调查中,共调查了2 000人,经计算得χ2=20.87,根据这一数据分析,下列关于打鼾与患心脏病之间关系的说法,正确的是________.①有95%的把握认为两者有关;②约有95%的打鼾者患心脏病;③有99%的把握认为两者有关;④约有99%的打鼾者患心脏病.解析:χ2=20.87>6.635,有99%的把握说明两个事件有关,但只是估计,不能肯定什么.答案:③6.为探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射后14天内的结果如下表所示:在研究小白鼠的死亡与剂量是否有关时,根据以上数据求得χ2=________. 解析:χ2=-220×30×25×25≈5.333.答案:5.3337.为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查,得到如下数据:判断学生的数学成绩好坏与对学习数学的兴趣是否有关? 解:由公式求得χ2=-286×103×94×95≈38.459.∵38.459>6.635,∴有99%的把握认为数学成绩的好坏与对学习数学的兴趣有关.8.现对某市工薪阶层关于“楼市限购政策”的态度进行调查,随机抽查了50人,他们月收入(单位:百元)的频数分布及对“楼市限购政策”的赞成人数如下表:5 500元为分界点时,该市的工薪阶层对“楼市限购政策”的态度有差异;(2)“楼市限购政策”的概率.解:(1)由题意得2×2列联表:假设月收入以5 500元为分界点时,该市的工薪阶层对“楼市限购政策”的态度没有差异,根据列联表中的数据,得到:χ2=-210×40×32×18≈6.272<6.635,所以没有99%的把握认为当月收入以5 500元为分界点时,该市的工薪阶层对“楼市限购政策”的态度有差异.(2)已知在收入[55,65)中共有5人,2人赞成,3人不赞成,设至少有一个不赞成楼市限购政策为事件A ,则P (A )=1-C 22C 25=910.故所求概率为910.。

高中数学选修2-3第三章 统计案例

高中数学选修2-3第三章 统计案例

3.1回归分析的基本思想及其初步应用(一)(新授课) 3.1回归分析的基本思想及其初步应用(二)(新授课) 3.1回归分析的基本思想及其初步应用(三)(新授课) 3.1 回归分析的基本思想及其初步应用(四)(新授课) 3.2 独立性检验的基本思想及其初步应用(一)(新授课)3.2 独立性检验的基本思想及其初步应用(二)(新授课)第三章统计案例单元练习题(习题课)一、课程目标在《数学3(必修)》概率统计内容的基础上,通过典型案例进一步介绍回归分析的基本思想、方法以及初步应用;通过典型案例介绍独立性检验的基本思想、方法以及初步应用,使学生认识统计方法在决策中的作用。

二、学习目标1、通过典型案例的探究,进一步了解回归分析的基本思想、方法及其应用。

2、通过典型案例的探究,了解独立性检验的基本思想、方法以及初步应用。

三、本章知识框图四、课时分配本章共2小结,教学约需2课时,具体安排如下3.1 回归分析的基本思想及其初步应用约4课时3.2 独立性检验的基本思想及其初步应用约2课时3.1 回归分析的基本思想及其初步应用(一)(新授课)一、教学目标: 知识与能力:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 过程与方法:通过本节的学习,让雪生通过实际问题去理解回归分析的必要性,明确回归分析的基本思想。

情感、态度与价值观:培养学生运用所学的知识,解决实际问题的能力。

二、教学重点与难点: 重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和残差分析.难点:解释残差变量的含义,了解偏差平方和分解的思想. 三、教学过程: (一)课前复习: 1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报.(二)讲授新课: 1. 举例应用:例1 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示: 编 号 1 2 3 4 5 6 7 8身高/cm 165 165 157 170 175 165 155 170体重/kg 48 57 50 54 64 61 43 59求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm 的女大学生的体重. (分析思路→教师演示→学生整理)第一步:作散点图 第二步:求回归方程 第三步:代值计算 (1)思考:身高为172cm 的女大学生的体重一定是60.316kg 吗? 不一定,但一般可以认为她的体重在60.316kg 左右. (2)解释线性回归模型与一次函数的不同事实上,观察上述散点图,我们可以发现女大学生的体重y 和身高x 之间的关系并不能用一次函数y bx a =+来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm 的3名女大学生的体重分别为48kg 、57kg 和61kg ,如果能用一次函数来描述体重与身高的关系,那么身高为165cm 的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e (即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型y bx a e =++,其中残差变量e 中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.10203040506070150155160165170175180身高/cm体重/k g2. 相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.(三)课时小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.四、课后反思:3.1 回归分析的基本思想及其初步应用(二)(新授课)一、教学目标: 知识与能力:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 过程与方法:从散点图中点的分布上发现直接求回归方程存在的不足,从中引导学生去发现解决问题的新思路,进行回归分析,进而介绍残差分析的方法。

高中数学 第三章 统计案例 3.2 独立性检验课件 北师大版选修2-3

高中数学 第三章 统计案例 3.2 独立性检验课件 北师大版选修2-3

χ2=1 63235×4×310×3719×35554-×21245×79242≈68.033.
∵68.033>6.635,∴有 99%的把握认为每一晚都打鼾与患心
脏病有关.
休息时间到啦
同学们,下课休息十分钟。现在是休息时间,你们休息一 看看远处,要保护好眼睛哦~站起来动一动,久坐对身体
规律方法 “每一晚都打鼾与患心脏病有关”指的是统计上 的关系,不要误以为是因果关系.具体到某一个每一晚都打鼾的 人,并不能说他一定患心脏病.其实从 2×2 列联表中也可以看 出,每一晚都打鼾的人群中,患心脏病的概率也只有23504,稍微 超过十分之一.至于他患不患心脏病,应该由医学检查来确定.
解:计算得 χ2=1 0004×742×585×262×845-002×425×002162≈7.075, ∵χ2=7.075>6.635, 所以我们有 99%的把握认为该种血清能起到预防感冒的作 用.
7.为了研究患慢性气管炎与吸烟量的关系,调查了 228 人, 其中每天的吸烟支数在 10 支以上的 20 支以下的调查者中,患者 人数有 98 人,非患者人数有 89 人,每天的吸烟支数在 20 支以 上的调查者中,患者人数有 25 人,非患者人数有 16 人.
60 分以 61~70 71~80 81~90 91~100





甲班(人数) 3
6
11
18
12
乙班(人数) 4
8
13
15
10
现规定平均成绩在 80 分以上(不含 80 分)的为优秀.
(1)试分别估计两个班级的优秀率;
(2)由以上统计数据填写下面 2×2 列联表,并问是否有 95%

2017-2018学年高中数学北师大版选修2-3课件:第三章 2 独立性检验

2017-2018学年高中数学北师大版选修2-3课件:第三章 2 独立性检验

k
2.706 3.841 6.635 10.828
附:χ2=a+bcn+add-ab+cc2b+d
解:(1)由已知得,样本中有 25 周岁以上组工人 60 名, 25 周岁以下组工人 40 名. 所以,样本中日平均生产件数不足 60 件的工人中,25 周岁以上组工人有 60×0.05=3(人),25 周岁以下组工人 有 40×0.05=2(人).
性别 男

是否需要志愿者
需要
40
30
不需要
160
270
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的 比例;
(2)能否有 99%的把握认为该地区的老年人是否需要志愿 者提供帮助与性别有关?
[思路点拨] 解答本题先分析列联表数,后计算 χ2,再与临界 值比较,判断两个变量是否相互独立.
[精解详析] (1)调查的 500 位老年人中有 70 位需要志愿 者提供帮助,因此在该地区老年人中,需要帮助的老年人的比
§2
第独 三立 章性
检 验
理解教材新知 把握热点考向 应用创新演练
考点一 考点二
§2
独立性检验
1.2×2 列联表
设 A,B 为两个变量,每个变量都可以取两个值,变量 A:
A1,A2=-A 1;变量 B:B1,B2=-B 1,用下表表示抽样数据
B A
A1
A2 总计
B1
a c a+c
B2
b d b+d
3.在一个 2×2 列联表中,通过数据计算 χ2=8.325,则这两 个变量间有关系的可能性为________. 答案:99%
4.某高校《统计初步》课程的教师随机调查了选该课的学生的
一些情况,具体数据如下表:

(常考题)北师大版高中数学高中数学选修2-3第三章《统计案例》检测(答案解析)(3)

(常考题)北师大版高中数学高中数学选修2-3第三章《统计案例》检测(答案解析)(3)

一、选择题1.给出下列说法:①回归直线ˆˆˆy bx a =+恒过样本点的中心(,)x y ,且至少过一个样本点;②两个变量相关性越强,则相关系数||r 就越接近1; ③将一组数据的每个数据都加一个相同的常数后,方差不变;④在回归直线方程ˆ20.5yx =-中,当解释变量x 增加一个单位时,预报变量ˆy 平均减少0.5个单位.其中说法正确的是( ) A .①②④B .②③④C .①③④D .②④2.已知x 与y 之间的几组数据如下表:参考公式:线性回归方程y bx a =+,其中()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-;相关系数()()niix x y y r --=∑上表数据中y 的平均值为2.5,若某同学对m 赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为11y b x a =+,22y b x a =+,33y b x a =+,对应的相关系数分别为1r ,2r ,3r ,下列结论中错误..的是( ) A .三条回归直线有共同交点 B .相关系数中,2r 最大 C .12b b >D .12a a >3.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( ) 表1表2表3表4A .成绩B .视力C .智商D .阅读量4.已知x 与y 之间的几组数据如下表: x 1 2 4 5 y 0 2 3 5假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2),求得的直线方程为y=b'x+a',则以下结论正确的是( ) A .b>b',a>a' B .b<b',a<a' C .b>b',a<a'D .b<b',a>a'5.下列判断错误的是A .若随机变量ξ服从正态分布()()21,,30.72N P σξ≤=,则()10.28P ξ≤-=;B .若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上,则相关系数1r =-;C .若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭, 则()1E ξ=; D .am bm >是a b >的充分不必要条件;6.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bcKa cb d a d b c-++++,其中n a b c d=+++.2()P K k≥0.100.050.010.005k 2.706 3.841 6.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们()A.没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D.有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”7.某种产品的广告费支出x与销售额y(单位:万元)之间有下表关系:x24568y3040605070y与x的线性回归方程为 6.5175ˆ.y x=+,当广告支出5万元时,随机误差的效应(残差)为()A.40 B.20C.30 D.108.对于相关指数R2,下列说法正确的是A.R2的取值越小,模型拟合效果越好B.R2的取值可以任意大,且R2取值越大,拟合效果越好C.R2的取值越接近于1,模型拟合效果越好D.以上答案都不对9.以下四个命题中:①在回归分析中,可用相关指数R2的值判断拟合的效果,R2越大,模型的拟合效果越好;②两个随机变量的线性相关性越强,相关系数的绝对值越接近1;③若数据x 1,x 2,x 3,…,x n 的方差为1,则2x 1,2x 2,2x 3,…,2x n 的方差为2;④对分类变量x 与y 的随机变量K 2的观测值k 来说,k 越小,判断“x 与y 有关系”的把握程度越大.其中真命题的个数为( ) A .1 B .2 C .3 D .410.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A .平均数与方差 B .回归分析 C .独立性检验 D .概率 11.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1,3b x y ===,则1a =.④如果两个变量x 与y 之间不存在着线性关系,那么根据它们的一组数据()(,1,2,,)i i x y i n =不能写出一个线性方程正确的个数是( )A .1B .2C .3D .412.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,统计数据如下表附:经计算2 4.514K ≈,现判断数学成绩与物理成绩有关系,则判断出错的概率不会超过A .0.5%B .1%C .2%D .5%二、填空题13.如图所示是世界20个地区受教育程度的人口百分比与人均收入的散点图,样本点基本集中在一个条型区域,因此两个变量呈线性相关关系.利用散点图中的数据建立的回归方程为ˆ 3.19388.193yx =+,若受教育的人口百分比相差10%,则其人均收入相差_________.14. 2.5PM 是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,下图是据某地某日早7点至晚8点甲、乙两个 2.5PM 监测点统计的数据(单位:毫克/每立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是_________.15.给出下列命题:①线性相关系数越大,两个变量的线性相关越强;反之,线性相关性越弱; ②由变量和的数据得到其回归直线方程:,则一定经过;③从越苏传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好; ⑤在回归直线方程中,当解释变量每增加一个单位时,预报变量增加0.1个单位,其中真命题的序号是___________. 16.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1;③某项测量结果服从正太态布,则; ④对于两个分类变量和的随机变量的观测值来说,越小,判断“与有关系”的把握程度越大.以上命题中其中真命题的个数为___________. 17.给出下列5种说法:①标准差越小,样本数据的波动也越小; ②回归分析研究的是两个相关事件的独立性;③在回归分析中,预报变量是由解释变量和随机误差共同确定的; ④相关指数是用来刻画回归效果的,的值越大,说明回归模型的拟合效果越好.⑤对分类变量X 与Y 的随机变量K 2的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握越小.其中说法正确的是________(请将正确说法的序号写在横线上).18.某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2的列联表,根据列联表的数据,可以有_______%的把握认为该学校15至16周岁的男生的身高和体重之间有关系.超重 不超重 合计 偏高 4 1 5 不偏高 3 12 15 合计71320独立性检验临界值表()20P K k ≥0.025 0.010 0.005 0.001 0k 5.0246.6357.87910.828独立性检验随机变量2K 值的计算公式:22()()()()()n ad bc K a b c d a c b d -=++++19.已知下列说法: ①分类变量A 与B 的随机变量越大,说明“A 与B 有关系”的可信度越大;②以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别是和;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为,若,,,则.其中说法正确的为_____________.(填序号)20.用线性回归模型求得甲、乙、丙3组不同的数据对应的2R 的值分别为0.81,0.98,0.63,其中__________(填甲、乙、丙中的一个)组数据的线性回归的效果最好.三、解答题21.根据教育部《中小学生艺术素质测评办法》,为提高学生审美素养,提升学生的综合素质,江苏省中考将增加艺术素质测评的评价制度,将初中学生的艺术素养列入学业水平测试范围.为初步了解学生家长对艺术素质测评的了解程度,某校随机抽取100名学生家长参与问卷测试,并将问卷得分绘制频数分布表如下: 得分 [)30,40 [)40,50 [)50,60 [)60,70 [)70,80 [)80,90 []90,100男性人数 49 12 13 11 6 3女性人数1 2 2 21 10 4 2了解”(得分低于60分)两类,完成22⨯列联表,并判断是否有99%的把握认为“学生家长对艺术素质评价的了解程度”与“性别”有关?(2)以这100名学生家长中“比较了解”的频率代替该校学生家长“比较了解”的概率.现在再随机抽取3名学生家长,设这3名家长中“比较了解”的人数为X ,求X 的概率分布列和数学期望.不太了解 比较了解 合计男性 女性 合计附:()()()()()2n ad bc a b c d a c b d χ-=++++,()n a b c d =+++.临界值表:()20P x χ≥0.15 0.100.050.025 0.010 0.005 0.001 0x2.0722.7063.8415.0246.6357.87910.82822.“微粒贷”是腾讯旗下2015年9月开发上市的微众银行网货产品.腾讯公司为了了解“微粒贷”上市以来在C 市的使用情况,统计了C 市2015年至2019年使用了“微粒货”贷款的累计人数,统计数据如表所示: 年份 2015 2016 2017 2018 2019 年份代号x 1 2 3 4 5 累计人数y (万人)2.93.33.64.44.8(1)已知变量x ,y 具有线性相关关系,求累计人数y (万人)关于年份代号x 的线性回归方程y bx a =+;并预测2020年使用“微粒贷“贷款的累计人数;(2)“微粒贷”用户拥有的贷款额度是根据用户的账户信用资质判定的,额度范围在500元至30万元不等,腾讯公司在统计使用人数的同时,对他们所拥有的贷款额度也作了相应的统计.我们把拥有货款额度在500元至5万元(不包括5万元)的人群称为“低额度贷款人群”,简称“A 类人群”;把拥有贷款额度在5万元及以上的人群称为“高额度贷款人群”,简称“B 类人群”.根据统计结果,随机抽取6人,其中A 类人群4人,B 类人群2人.现从这6人中任取3人,记随机变量ξ为A 类人群的人数,求ξ的分布列及其期望.参考公式:1122211()()()()nni iiii i nniii i x y nx y x x y y b xn x x x ====---==--∑∑∑∑, a y bx =-参考数据:5162i ii x y=≈∑23.在中国,不仅是购物,而且从共享单车到医院挂号再到公共缴费,日常生活中几乎全部领域都支持手机支付,出门不带现金的人数正在迅速增加.某机构随机抽取了一组市民,并统计他们各自出门随身携带现金(单位:元)的情况,制作出如图所示的茎叶图.规定:随身携带的现金在100元以下(不含100元)的为“手机支付族”,其他为“非手机支付族”.(1)根据茎叶图的数据,完成答题卡上的22⨯列联表;男生 女生 合计手机支付族 非手机支付族合计45(2)根据(1)中的列联表,判断是否有99%的把握认为“手机支付族”与“性别”有关. 附:()20P K k ≥0.050 0.010 0.001 0k 3.8416.63510.82822()()()()()()n ad bc K n a b c d a b c d a c b d -==+++++++24.某公司(人数众多)为鼓励员工利用网络进行营销,准备为员工办理手机流量套餐.为了解员工手机流量使用情况,按照男员工和女员工1:3的比例分层抽样,得到200名员工的月使用流量L (单位:M )的数据,其频率分布直方图如图所示.求a 的值,并估计这200名员工月使用流量的平均值x (同一组中的数据用中点值代表);(2)若将月使用流量在800M 以上(含800M )的员工称为“手机营销达人”,填写下面的22⨯列联表,能否有超过0095的把握认为“成为手机营销达人与员工的性别有关”;男员工 女员工 合计手机营销达人5(3)若这200名员工中有2名男员工每月使用流量在[]900,1000,从每月使用流量在[]900,1000的员工中随机抽取名3进行问卷调查,记女员工的人数为X,求X的分布列和数学期望.参考公式及数据:()()()()()22n ab bcKa b c d a c b d-=++++,其中n a b c d=+++.25.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A的研发费用x(百万元)和销量y(万盒)的统计数据如下:(1)根据上表中的数据,建立y关于x的线性回归方程y bx a=+(用分数表示);(2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211n ni i i ii in ni ii ix x y y x y nx ybx x x nx====---==--∑∑∑∑,a y bx=-.26.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】①中,根据回归直线方程的特征,可判定是不正确;②中,根据相关系数的意义,可判定是是正确的;③中,根据方差的计算公式,可判定是正确的;④中,根据回归系数的含义,可判定是正确的. 【详解】对于①中,回归直线ˆˆˆy bx a =+恒过样本点的中心(,)x y ,但不一定过一个样本点,所以不正确;对于②中,根据相关系数的意义,可得两个变量相关性越强,则相关系数||r 就越接近1,所以是正确的;对于③中,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,所以是正确的;对于④中,根据回归系数的含义,可得在回归直线方程ˆ20.5yx =-中,当解释变量x 增加一个单位时,预报变量ˆy平均减少0.5个单位,所以是正确的. 故选:B. 【点睛】本题主要考查了统计知识的相关概念及判定,其中解答中熟记回归直线方程的特征,回归系数的含义,相关系数的意义,以及方程的计算方法是解答的关键,属于基础题.2.D解析:D 【分析】由题意可得5m n +=,分别取m 与n 的值,由公式计算出1122123,,,,,,b a b a r r r 的值,逐一分析四个选项,即可得到答案. 【详解】由题意,1410m n +++=,即5m n +=. 若 1.5m =,则 3.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 1.5 2.53 2.5 3.5 2.54 2.54 2.5 5.5iii x x y y =--=--+--+--+--=∑ ,()()()4222221 1.50.50.5 1.55i i x x =-=-+-++=∑ , ()()()42222211.511 1.5 6.5i i y y =-=-+-++=∑.则1 5.51.15b ==,1 2.5 1.1 2.50.25a =-⨯=- ,1r =≈; 若2m =,则3n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.52 2.53 2.53 2.54 2.54 2.55iii x x y y =--=--+--+--+--=∑,()4215ii x x =-=∑,()()()42222211.50.50.5 1.55i i y y =-=-+-++=∑.2515b ==,2 2.51 2.50a =-⨯=,21r ==; 若 2.5m =,则 2.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 2.5 2.53 2.5 2.5 2.54 2.54 2.5 4.5iii x x y y =--=--+--+--+--=∑,()4215i i x x =-=∑,()()422211.5 1.5 4.5i i y y =-=-+=∑,3r ==由样本点的中心相同,故A 正确;由以上计算可得,相关系数中,2r 最大,12b b >,12a a <,故B ,C 正确,D 错误. 故选:D . 【点睛】本题考查线性回归方程与相关系数的求法,考查计算能力,是中档题.3.D解析:D 【分析】计算得到22322214χχχχ>>>,得到答案. 【详解】计算得到:222152(6221410)5281636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯; 222252(4201612)521121636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯ ; 222352(824128)52961636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯ ; 222452(143062)524081636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯;故22322214χχχχ>>>. 故选:D . 【点睛】本题考查了独立性检验,意在考查学生的计算能力和应用能力.4.D解析:D 【解析】 【分析】先根据()()1,0,2,2求得直线y b x a ='+'的方程.然后计算出回归直线方程y bx a =+,由此比较大小,得出正确的结论. 【详解】由于直线y b x a ='+'过()()1,0,2,2,将两点坐标代入直线方程得022b a b a +=⎧⎨+=''''⎩,解得2,2b a ''==-.124534x +++==,02352.54y +++==,1122334414122542x y x y x y x y +++=+++=.2222123414162546x x x x +++=+++=,故24243 2.54230121.24643463610b -⨯⨯-====-⨯-, 2.5 1.23 2.5 3.6 1.1a =-⨯=-=-.所以,a a b b >'<',故选D.【点睛】本小题主要考查利用直线上的两点坐标求直线方程的方法,考查回归直线方程的计算,属于中档题.5.D解析:D 【解析】分析:根据正态分布的对称性求出()1P ξ≤-的值,判断A 正确; 根据线性相关关系与相关系数的定义,判断B 正确; 根据二项分布的均值计算公式求出()E ξ的值,判断C 正确; 判断充分性和必要性是否成立,得出D 错误.详解:对于A ,随机变量ξ服从正态分布()21,N σ,∴曲线关于1ξ=对称,131310.720.28PP P ξξξ∴≤-=≥=-≤=-=()()(),A 正确;对于B ,若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上, 则x y ,成负相关,且相关关系最强,此时相关系数1r =-,B 正确;对于C ,若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭,则1515E(),ξ=⨯= C 正确;对于D ,am >bm 时,a >b 不一定成立,即充分性不成立,a b am bm >时,> 不一定成立,即必要性不成立,是既不充分也不必要条件,D 错误. 故选:D .点睛:本题考查了命题真假的判断问题,是综合题.6.B解析:B 【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K 的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人, 又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人, 又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530) 4.762 3.8412109075225K ⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”, 故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.7.D解析:D 【解析】∵y 与x 的线性回归方程为 6.5175ˆ.yx =+ 当5x =时,ˆ50y=. 当广告支出5万元时,由表格得:60y = 故随机误差的效应(残差)为605010.-= 故选D .8.C解析:C 【解析】两个变量y 与x 的回归模型中,它们的相关指数R 2越接近于1,这个模型的拟合效果越好.故选C .9.B解析:B【解析】由题意得,若数据x 1,x 2,x 3,…,x n 的方差为1,则2x 1,2x 2,2x 3,…,2x n 的方差为4,所以③不正确;对分类变量x 与y 的随机变量K 2的观测值k 来说,k 越小,判断“x 与y 有关系”的把握程度越小,所以④不正确.其中①、②是正确的,故选B.10.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 考点:独立性检验的意义.11.C解析:C 【解析】①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; ②∵kx y ce =,∴两边取对数,可得lny ln =(kx ce )kx lnc lnce lnc kx =+=+, 令z lny =,可得z lnc kx =+, ∵0.34z x =+, ∴40.3lnc k ==, ∴4c e =.即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y =a +bx 中,2,1,3b x y ===,则a =1,正确。

高中数学第三章统计案例3.2独立性检验课件北师大版选修23

高中数学第三章统计案例3.2独立性检验课件北师大版选修23
(yùn chuán)与性别无关.
答案:无
第二十六页,共26页。
第八页,共26页。


【 做一做2】 想要检验(jiǎnyàn)喜欢参加体育活动是不是与性
别有关,应该检验(jiǎnyàn)(
)
A.H0:男性喜欢参加体育活动
B.H0:女性不喜欢参加体育活动
C.H0:喜欢参加体育活动与性别有关
D.H0:喜欢参加体育活动与性别无关
答案D
第九页,共26页。


思考辨析
探究
(tànjiū)二
思维(sīwéi)辨

反思感悟 独立性检验的具体做法
(1)根据实际问题作出两个分类变量的2×2列联表.
2
(2)利用公式
(-)
2
χ=
计算随机变量 χ2 .
(+)(+)(+)(+)
(3)比较χ2与临界值的大小,推断有多大把握认为两个分类变量之间有
关系.
第十六页,共26页。
答案A
第十三页,共26页。
)
探究
(tànjiū)一
探究(tànjiū)

思维(sīwéi)辨

探究二
独立性检验的基本思想
【例2】 为了调查某生产线上质量监督员甲对产品质量的好坏
有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982
件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件.能
晕船情况
性别
男性
女性
合计
晕船
不晕船
合计
32
8
40
51
24
75
83

高中数学 第三章 统计案例 2 独立性检验知识导航 北师大版选修2-3(2021年最新整理)

高中数学 第三章 统计案例 2 独立性检验知识导航 北师大版选修2-3(2021年最新整理)

高中数学第三章统计案例2 独立性检验知识导航北师大版选修2-3 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第三章统计案例2 独立性检验知识导航北师大版选修2-3)的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。

本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第三章统计案例2 独立性检验知识导航北师大版选修2-3的全部内容。

§2 独立性检验自主整理1.设A ,B 为两个变量,每一个变量都可以取两个值, 变量A :A 1,A 2=A 1; 变量B :B 1,B 2=B 1.通过观察得到下表所示数据:其中,a 表示变量A 取A 1,且变量B 取B 1时的数据;b 表示变量A 取A 1,且变量B 取B 2时的数据;c 表示变量A 取A 2,且变量B 取B 1时的数据;d 表示变量A 取A 2,且变量B 取B 2时的数据.设n=a+b+c+d,用_______________估计P (A 1B 1), ______________估计P (A 1), __________估计P(B 1). 若有式子nca nb a n a +•+=, 则可以认为______________独立。

同理,若n d b n b a n b +•+=,则可以认为______________独立;若nca n d c n c +•+=,则可以认为______________独立;若ndb n dc nd +•+=,则可以认为______________独立.但是,在n c a n b a n a +•+=中,由于nca nb a n a ++,,表示的是______________,不同于概率,即使变量之间独立,式子两边也不一定恰好相等。

2019_2020学年高中数学第三章统计案例2独立性检验课件北师大版选修2_3

2019_2020学年高中数学第三章统计案例2独立性检验课件北师大版选修2_3

巴西医生马廷思收集的犯有各种贪污、受贿罪的官员与廉洁官员的寿命的调查资 料如下:500 名贪官中有 348 人的寿命小于平均寿命,152 人的寿命大于或等于平 均寿命;590 名廉洁官员中有 93 人的寿命小于平均寿命,497 人的寿命大于或等于 平均寿命.这里,平均寿命是指“当地人均寿命”.试分析官员在经济上是否清 廉与他们的寿命长短是否有关?
本题是利用公式求出 χ2 的值,再利用其与临界值的大小关系来判断独立性,解题 时应注意准确代入数据与计算,不可错用公式,要准确地进行比较与判断.
1.从发生汽车碰撞事故的司机中抽取 2 000 名.根据他们的血液中是否含有酒精
以及他们是否对事故负有责任.将数据整理如下:
有无责任 有
有无酒精
无 总计
P(χ2≥k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
[解析] (1)χ2=100×58×404×2×275-5×184×5152=224233030≈10.88>10.828, 所以有 99.9%的把握认为收看新闻节目的观众与年龄有关. (2)抽取的比例为455=19,所以大于 40 岁的观众应该抽取19×27=3(名). (3)在年龄 20 至 40 岁的 2 名观众和年龄大于 40 的 3 名观众中任取 2 名,恰有 1 名观众的年龄为 20 至 40 岁的概率为CC21C25 13=35.
患 A 疾病 不患 A 疾病 合计
服用该药品
5
100
105
不服用该药品 18
400

江西省九江市高中数学 第三章 统计案例 2 独立性检验教案 北师大版选修23

江西省九江市高中数学 第三章 统计案例 2 独立性检验教案 北师大版选修23

2 独立性检验一、教学目标:1、通过对典型案例的探究,了解独立性检验(只要求22⨯列联表)的基本思想、方法及初步应用;2、经历由实际问题建立数学模型的过程,体会其基本方法。

二、教学重点、难点:独立性检验的基本方法是重点.基本思想的领会及方法应用是难点。

三、教学方法:讨论交流,探析归纳四、教学过程(一)、问题情境5月31日是世界无烟日。

有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手。

这些疾病与吸烟有关的结论是怎样得出的呢?我们看一下问题:某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中有37人患呼吸道疾病(简称患病),183人未患呼吸道疾病(简称未患病);不吸烟的295人中有21人患病,274人未患病.问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关”?(二)、学生活动为了研究这个问题,(1)引导学生将上述数据用下表来表示:(2)估计吸烟者与不吸烟者患病的可能性差异:在吸烟的人中,有3716.82%220≈的人患病,在不吸烟的人中,有217.12%295≈的人患病.问题:由上述结论能否得出患病与吸烟有关?把握有多大?(三)、探析新课1.独立性检验:(1)假设H:患病与吸烟没有关系.若将表中“观测值”用字母表示,则得下表:(近似的判断方法:设n a b c d =+++,如果0H 成立,则在吸烟的人中患病的比例与不吸烟的人中患病的比例应差不多,由此可得a ca b c d≈++,即()()0a c d c a b ad bc +≈+⇒-≈,因此,||ad bc -越小,患病与吸烟之间的关系越弱,否则,关系越强.) 设n a b c d =+++,在假设0H 成立的条件下,可以通过求 “吸烟且患病”、“吸烟但未患病”、“不吸烟但患病”、“不吸烟且未患病”的概率(观测频率),将各种人群的估计人数用,,,,a b c d n 表示出来.如果实际观测值与假设求得的估计值相差不大,就可以认为所给数据(观测值)不能否定假设0H .否则,应认为假设0H 不能接受,即可作出与假设0H 相反的结论.(四)、课堂练习:课本P90页练习题 (五)、回顾小结:吸烟与肺癌列联表a恰好为事件AB发生的频数;a+b 和a+c恰好分别为事件A和B发生的频数.由于频率近似于概率,所以在H0成立的条件下应该有a a b a cn n n++≈⨯,其中n a b c d=+++为样本容量, (a+b+c+d)≈(a+b)(a+c) , 即ad≈bc.因此,|ad-bc|越小,说明吸烟与患肺癌之间关系越弱;|ad -bc|越大,说明吸烟与患肺癌之间关系越强。

高中数学第3章统计案例3.2独立性检验学业分层测评北师大版选修23

高中数学第3章统计案例3.2独立性检验学业分层测评北师大版选修23

高中数学第3章统计案例3.2独立性检验学业分层测评北师大版选修23(建议用时:45分钟)学业达标]一、选择题1.有两个分类变量X 与Y 的一组数据,由其列联表计算得χ2≈4.523,则认为“X 与Y 有关系”犯错误的概率为( )A .95%B .90%C .5%D .10%【解析】 χ2≈4.523>3.841.这表明认为“X 与Y 有关系”是错误的可能性约为0.05,即认为“X 与Y 有关系”犯错误的概率为5%.【答案】 C2.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女患色盲的频率分别为0.038,0.006B .男、女患色盲的概率分别为19240,3260C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关 【解析】 男人中患色盲的比例为38480,要比女人中患色盲的比例6520大,其差值为⎪⎪⎪⎪⎪⎪38480-6520≈0.067 6,差值较大.【答案】 C3.为了探究生的学习成绩是否与学习时间长短有关,在调查的500名学习时间较长的生中有39名学习成绩比较好,500名学习时间较短的生中有6名学习成绩比较好,那么你认为生的学习成绩与学习时间长短有关的把握为( )A .0B .95%C .99%D .都不正确【解析】 计算出χ2与两个临界值比较, χ2=1 000×39×494-6×461245×955×500×500≈25.340 3>6.635.所以有99%的把握说生的学习成绩与学习时间长短有关,故选C. 【答案】 C4.某卫生机构对366人进行健康体检,其中某项检测指标阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,有________的把握认为糖尿病患者与遗传有关系.( )【导学号:62690057】A .99.9%B .99.5%C .99%D .97.5%【解析】 可以先作出如下列联表(单位:人):糖尿病患者与遗传列联表糖尿病发病糖尿病不发病总计 阳性家族史 16 93 109 阴性家族史 17 240 257 总计33333366根据列联表中的数据,得到χ2=366×16×240-17×932109×257×33×333≈6.067>5.024.故我们有97.5%的把握认为糖尿病患者与遗传有关系. 【答案】 D5.假设有两个分类变量X 与Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其2×2列联表为:y 1 y 2 总计x 1 a b a +b x 2c d c +d 总计a +cb +da +b +c +d( )A .a =5,b =4,c =3,d =2B .a =5,b =3,c =4,d =2C .a =2,b =3,c =4,d =5D .a =2,b =3,c =5,d =4 【解析】 比较⎪⎪⎪⎪⎪⎪a a +b -c c +d .选项A 中,⎪⎪⎪⎪⎪⎪59-35=245;选项B 中,⎪⎪⎪⎪⎪⎪58-46=124;选项C 中,⎪⎪⎪⎪⎪⎪25-49=245;选项D 中,⎪⎪⎪⎪⎪⎪25-59=745.故选D.【答案】 D 二、填空题6.调查者通过随机询问72名男女生喜欢文科还是理科,得到如下列联表(单位:名) 性别与喜欢文科还是理科列联表喜欢文科喜欢理科 总计 男生 8 28 36 女生 20 16 36 总计284472生的性别和喜欢文科还是理科________关系.(填“有”或“没有”) 【解析】 通过计算χ2=72×16×8-28×20236×36×44×28≈8.42>7.879.故我们有99.5%的把握认为生的性别和喜欢文科还是理科有关系. 【答案】 有7.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:专业性别 非统计专业统计专业 男 13 10 女720为了判断主修统计专业是否与性别有关系,根据表中的数据,得到 χ2=50×13×20-10×7223×27×20×30≈4.844,因为χ2≥3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________.【解析】 ∵χ2>3.841,所以有95%的把握认为主修统计专业与性别有关,出错的可能性为5%.【答案】 5%8.在吸烟与患肺病是否相关的判断中,有下面的说法:①若统计量χ2>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.(填序号)【解析】 统计量χ2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①错误;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.【答案】 ③ 三、解答题9.在一次天气恶劣的飞行航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人.请你根据所给数据判定:在天气恶劣的飞行航程中,男乘客是否比女乘客更容易晕机?【解】 根据题意,列出2×2列联表如下:晕机 不晕机 总计 男乘客 24 31 55 女乘客 8 26 34 总计325789由公式可得χ2=89×24×26-31×8255×34×32×57≈3.689>2.706,故我们有90%的把握认为“在天气恶劣的飞行航程中,男乘客比女乘客更容易晕机”. 10.(2016·郑州模拟)有甲乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩后,得到如下的列联表.优秀 非优秀 总计 甲班 10乙班 30总计105已知在全部105人中随机抽取1人为优秀的概率为27.(1)请完成上面的列联表;(2)根据列联表的数据,若按95%的可靠性要求,能否认为“成绩与班级有关系”? (3)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的10名学生从2到11进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号.试求抽到6或10号的概率.参考公式:χ2=n ad -bc 2a +bc +d a +cb +dP (χ2≥x 0)0.10 0.05 0.025 0.010 x 02.7063.8415.0246.635【解】 (1)优秀 非优秀 总计 甲班 10 45 55 乙班 20 30 50 总计3075105(2)根据列联表中的数据,得到χ2=105×10×30-20×45255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”.(3)设“抽到6或10号”为事件A ,先后两次抛掷一枚均匀的骰子,出现的点数为(x ,y ).所有的基本事件有(1,1),(1,2),(1,3),…,(6,6),共36个.事件A 包含的基本事件有:(1,5),(2,4),(3,3),(4,2),(5,1),(4,6),(5,5),(6,4),共8个,∴P (A )=836=29.能力提升]1.硕士学位与博士学位的一个随机样本给出了关于所获取学位类别与学生性别的分类数据如表所示:性别 硕士 博士 总计 男 162 27 189 女 143 8 151 总计30535340根据以上数据,则( ) A .性别与获取学位类别有关 B .性别与获取学位类别无关 C .性别决定获取学位的类别 D .以上都是错误的【解析】 由列联表可得χ2=340162×8-143×272305×35×189×151≈7.34>6.635,所以有99%的把握认为性别与获取学位的类别有关.【答案】 A2.某班主任对全班50名学生进行了作业量的调查,数据如下表:认为作业量大认为作业量不大总计 男生 18 9 27 女生 8 15 23 总计262450若推断“学生的性别与认为作业量大有关”,则这种推断犯错误的概率不超过( ) A .0.01 B .0.025 C .0.10D .0.05【解析】 χ2=50×18×15-8×9226×24×27×23≈5.059>5.024,因为P (χ2>5.024)=0.025,所以这种推断犯错误的概率不超过0.025.【答案】 B3.某研究小组为了研究生的身体发育情况,在某随机抽出20名15至16周岁的男生将他们的身高和体重制成2×2列联表,根据列联表中的数据,可以在犯错误的概率不超过________的前提下认为该学校15至16周岁的男生的身高和体重之间有关系.超重 不超重 总计 偏高 4 1 5 不偏高 3 12 15 总计71320【解析】 根据公式χ2=n ad -bc 2a +bc +d a +cb +d得,χ2=20×4×12-1×325×15×7×13≈5.934,因为χ2>5.024,因此在犯错误的概率不超过0.025的前提下认为该学校15至16周岁的男生的身高和体重之间有关系.【答案】 0.0254.(2016·延安二检)为了研究“教学方式”对教学质量的影响,某高中数学老师分别用两种不同的教学方式对入学数学平均分数和优秀率都相同的甲、乙两个高一新班进行教学(勤奋程度和自觉性都一样).以下茎叶图3­2­1为甲、乙两班(每班均为20人)学生的数学期末考试成绩.图3­2­1(1)现从甲班数学成绩不低于80分的同学中随机抽取两名同学,求成绩为87分的同学至少有一名被抽中的概率;(2)学校规定:成绩不低于75分的为优秀.请填写下面的2×2列联表,并判断有多大把握认为“成绩优秀与教学方式有关”.甲班乙班总计优秀不优秀总计下面临界表有仅供参考:P(χ2≥x0)0.150.100.050.0250.0100.0050.001x0 2.072 2.706 3.841 5.024 6.6357.87910.828(参考公式:χ2=n ad-bc2a+b c+d a+c b+d)【解】(1)记成绩为87分的同学为A,B,其他不低于80分的同学为C,D,E,“从甲班数学成绩不低于80分的同学中随机抽取两名同学”的一切可能结果组成的基本事件有(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),(C,D),(C,E),(D,E),共10个.“至少有一个87分的同学被抽到”所组成的基本事件有(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),共7个,所以P=710.(2)甲班乙班总计优秀61420不优秀 14 6 20 总计20 2040χ2=40×6×6-14×14220×20×20×20=6.4>5.024,因此,我们有97.5%的把握认为成绩优秀与教学方式有关.。

最新北师大版高中数学高中数学选修2-3第三章《统计案例》检测(答案解析)(2)

最新北师大版高中数学高中数学选修2-3第三章《统计案例》检测(答案解析)(2)

一、选择题1.为了调查某校高二学生的身高是否与性别有关,随机调查该校64名高二学生,得到2×2列联表如表:附:K 2()()()()2()n ad bc a b c d a c b d -=++++由此得出的正确结论是( )A .在犯错误的概率不超过0.01的前提下,认为“身高与性别无关”B .在犯错误的概率不超过0.01的前提下,认为“身高与性别有关”C .有99.9%的把握认为“身高与性别无关”D .有99.9%的把握认为“身高与性别有关”2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( ) 表1表2表3表4 智商 性别 偏高正常总计阅读量 性别丰富不丰富总计男 8 12 20 男 14 6 20 女 8 24 32 女 2 30 32 总计163652总计163652A .成绩B .视力C .智商D .阅读量3.下列命题是假命题...的是( ) A .某企业有职工150人,其中高级职称15人,中级职称45人,一般职员90人,若用分层抽样的方法抽出一个容量为30的样本,则一般职员应抽出18人; B .用独立性检验(列联表法)来考察两个分类变量是否有关系时,算出的随机变量的值越大,说明“与有关系”成立的可能性越大;C .已知向量,,则是的必要条件; D .若,则点的轨迹为抛物线.4.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘” 能做到“光盘” 男 45 10 女3015则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()20P K k ≥0.100 0.050 0.010 0.001 0k 2.7063.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%5.为了检验设备M 与设备N 的生产效率,研究人员作出统计,得到如下表所示的结果,则( )设备M 设备N生产出的合格产品4843生产出的不合格产品27附:()2P K k>0.150.100.050.0250.0100.0050.001 k 2.072 2.706 3.841 5.024 6.6357.87910.828参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.A.有90%的把握认为生产的产品质量与设备的选择具有相关性B.没有90%的把握认为生产的产品质量与设备的选择具有相关性C.可以在犯错误的概率不超过0.01的前提下认为生产的产品质量与设备的选择具有相关性D.不能在犯错误的概率不超过0.1的前提下认为生产的产品质量与设备的选择具有相关性6.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e,众数为m0,平均数为x-,则()A.m e=m0=x-B.m0<x-<m eC.m e<m0<x-D.m0<m e<x-7.如图所示,茎叶图记录了甲、乙两组各4名学生完成某道数学题的得分情况,该题满分为12分.已知甲、乙两组学生的平均成绩相同,乙组某个数据的个位数字模糊,记为x.则下列命题正确的是( )A.甲组学生的成绩比乙组稳定B.乙组学生的成绩比甲组稳定C.两组学生的成绩有相同的稳定性D.无法判断甲、乙两组学生的成绩的稳定性8.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面的列联表:现判断数学成绩与物理成绩有关系,则犯错误的概率不超过 ( ) A .0.005B .0.01C .0.02D .0.059.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”,得到如下的列联表:由此表得到的正确结论是( )A .在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别无关”C .在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”D .在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别无关” 10.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A .平均数与方差 B .回归分析 C .独立性检验 D .概率11.若在区间[-5,5]内任取一个实数a ,则使直线x +y +a =0与圆(x -1)2+(y +2)2=2有公共点的概率为( )A .5B .25C .35D .1012.对两个变量x 和y 进行回归分析,得到一组样本数据: ()()1122,,,x y x y ,…(),n n x y ,则下列说法中不正确的是( )A .由样本数据得到的回归方程ˆˆˆy bx a =+必过样本中心(),x yB .残差平方和越小的模型,拟合的效果越好C .若变量y 和x 之间的相关系数为0.9362r =-,则变量y 和x 之间具有线性相关关系D .用相关指数2R 来刻画回归效果, 2R 越小,说明模型的拟合效果越好二、填空题13.如图所示是世界20个地区受教育程度的人口百分比与人均收入的散点图,样本点基本集中在一个条型区域,因此两个变量呈线性相关关系.利用散点图中的数据建立的回归方程为ˆ 3.19388.193yx =+,若受教育的人口百分比相差10%,则其人均收入相差_________.14.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③线性回归方程=x +必过(,);④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K 2=13.079,则其两个变量之间有关系的可能性是90%.其中错误的个数是________.15.以下结论正确..的序号有_________ (1)根据22⨯列联表中的数据计算得出2K ≥6.635, 而P (2K ≥6.635)≈0.01,则有99% 的把握认为两个分类变量有关系.(2)在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关.(3)在线性回归分析中,相关系数为r ,r 越接近于1,相关程度越大;r 越小,相关程度越小.(4)在回归直线0.585y x =-中,变量200x =时,变量y 的值一定是15.16.如果根据性别与是否爱好运动的列联表得到K 2≈3.852>3.841,则判断性别与是否爱好运动有关,那么这种判断犯错的可能性不超过________.17.为了解某班学生喜爱打篮球是否与性别有关,对该班50名 学生进行了问卷调查, 得到了如下22⨯ 列联表喜爱打篮球 不喜爱打篮球 合计男生20 525 女生 10 1525合计30 2050则至少有_____的把握认为喜爱打篮球与性别有关(请用百分数表示). 18.已知方程是根据女大学生的身高预报她的体重的回归方程,其中的单位是,的单位是,那么针对某个体的残差是______.19.已知的取值如表所示:若与呈线性相关,且回归方程为,则等于 .23454620.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.我国新型冠状病毒肺炎疫情期间,以网络购物和网上服务所代表的新兴消费展现出了强大的生命力,新兴消费将成为我国消费增长的新动能.某市为了了解本地居民在2020年2月至3月两个月网络购物消费情况,在网上随机对1000人做了问卷调查,得如表频数分布表:(1)作出这些数据的频率分布直方图,并估计本市居民此期间网络购物的消费平均值; (2)在调查问卷中有一项是填写本人年龄,为研究网购金额和网购人年龄的关系,以网购金额是否超过4000元为标准进行分层抽样,从上述1000人中抽取200人,得到如表列联表,请将表补充完整并根据列联表判断,在此期间是否有95%的把握认为网购金额与网购人年龄有关.参考公式和数据:()()()()()22n ad bc K a b c d a c b d -=++++.(其中n a b c d =+++为样本容量)22.某私营业主为确定下一年度投入某种产品的宣传费,需了解月宣传费x (单位:百元)对月销售量y (单位:t )和月利润z (单位:百元)的影响,对8个月的宣传费i x 和销售量i y (i =1,2,...,8)数据作了初步处理,得到如图的散点图及一些统计量的值.x y w()821i i x x =-∑()821ii w w =-∑()()81iii x x y y =--∑ ()()81iii w w yy =--∑(1)根据散点图判断出y =c +y 关于月宣传费x 的回归方程类型,求y 关于x 的回归方程;(表中i w =(2)已知这种产品的每月利润z 与x 、y 的关系为2z y x =-,根据(1)的结果,当月宣传费用x =16时,求月利润的预报值.参考公式:1122211()()()()n ni iiii i nni i i i x y nx y x x y y b x n x x x ====-⋅--==--∑∑∑∑, ˆˆa y bx=- 23.为了了解某校高中生的身体质量情况,某调查机构进行了一次高一学生体重和身高的抽样调查,从中抽取了8名学生(编号为18)的身高(cm)x 和体重(kg)y 数据.如下表,某调查机构分析发现学生的身高和体重之间有较强的线性相关关系,在编号为6的体检数据丢失之前,调查员甲已进行相关的数据分析并计算出该组数据的线性回归方程为ˆˆ0.5ya x =+,且根据回归方程预估一名身高为180cm 的学生体重为71kg ,计算得到的其他数据如下:81170,89920i ii x x y===∑.(1)求a 的值及表格中8名学生体重的平均值y ;(2)在数据处理时,调查员乙发现编号为8的学生体重数据有误,应为63kg ,身高数据无误.请你根据调查员乙更正的数据重新计算线性回归方程,并据此预估一名身高为180cm 的学生的体重.附:回归直线方程ˆˆˆy a bx=+的斜率和截距的最小二乘法估计分别为:1221ˆni ii nii x ynx y bxnx==-=-∑∑,ˆˆay bx =-. 24.“海水稻”就是耐盐碱水稻,是一种介于野生稻和栽培稻之间的普遍生长在海边滩涂地区,具有耐盐碱的水稻,它比其它普通的水稻均有更强的生存竞争能力,具有抗涝,抗病虫害,抗倒伏等特点,还具有预防和治疗多种疾病的功效,防癌效果尤为显著.海水稻的灌溉是将海水稀释后进行灌溉.某试验基地为了研究海水浓度x (‰)对亩产量y (吨)的影响,通过在试验田的种植实验,测得了某种海水稻的亩产量与海水浓度的数据如表.绘制散点图发现,可用线性回归模型拟合亩产量y 与海水浓度x 之间的相关关系,用最小二乘法计算得y 与x 之间的线性回归方程为.88ˆ0ˆy bx=+.(2)①完成上述残差表:②统计学中,常用相关指数2R 来刻画回归效果,2R 越大,模型拟合效果越好,并用它来说明预报变量与解释变量的相关性.你能否利用以上表格中的数据,利用统计学的相关知识,说明浇灌海水浓度对亩产量的贡献率?(计算中数据精确到0.01)(附:残差公式ˆˆi i i ey y =-,相关指数()()22121ˆ1ni i i nii y yR y y ==-=--∑∑)25.在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始现该疾病对应的相关症状时止的这一阶段称为潜伏期.一研究团队统计了某地区1000名患有某种传染病的患者的相关信息,得到如表:该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,以潜伏期是否超过6天为标准进行分层抽样,从上述1000名患者中抽取200人,得到如下列联表.(Ⅰ)请将列联表补充完整;(Ⅱ)根据列联表判断是否有95%的把握认为潜伏期与患者年龄有关?附:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.26.2020年5月22日晚,国际权威医学杂志《柳叶刀》在线发表了全球首个新冠疫苗临床试验结果,该试验结果来自我国的陈薇院士和朱凤才教授团队、由于非人灵长类动物解剖生理、组织器官功能和免疫应答反应等性状与人类非常接近,所以常选择恒河猴进行科研和临床实验.某生物制品研究所将某一型号疫苗用在恒河猴身上进行科研和临床实验,得到部分数据如下表.现从注射疫苗的恒河猴中任取1只,取到感染病毒的恒河猴的概率为2 5 .95%把握认为注射此种疫苗有效?(2)在感染病毒的恒河猴中,按未注射疫苗和注射疫苗的比例抽取5只进行病理分析,然后从这5只恒河猴中随机抽取3只对注射疫苗情况进行核实,求恰好抽到2只未注射疫苗的恒河猴的概率.附:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】根据22⨯列联表,计算2k ,与临界值表比较即可得出结论. 【详解】K 的观测值:K 2264(862426)34303232⨯⨯-⨯=≈⨯⨯⨯20.330;由于20.330>10.828,∴有99.9%的把握认为“身高与性别有关”,即在犯错误的概率不超过0.001的前提下,认为“身高与性别有关” 故选:D . 【点睛】本题主要考查了独立性检验的应用问题,K 2的计算,22⨯列联表,考查了运算能力,属于中档题.2.D解析:D 【分析】计算得到22322214χχχχ>>>,得到答案. 【详解】计算得到:222152(6221410)5281636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯; 222252(4201612)521121636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯ ; 222352(824128)52961636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯ ; 222452(143062)524081636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯;故22322214χχχχ>>>. 故选:D . 【点睛】本题考查了独立性检验,意在考查学生的计算能力和应用能力.3.D解析:D 【分析】根据分层抽样的概念易得,解出方程即可判断为真;用独立性检验(列联表法)的判定方法即可得出B 为真;根据充分条件和必要条件的定义以及向量的数量积的应用,进行判断即可得到C 为真;可将原式化为,表示动点到定点和到动直线距离相等的点的轨迹,但是定点在定直线上,故可判断D. 【详解】设一般职员应抽出人,根据分层抽样的概念易得,解得,即一般职员应抽出18人,故A 为真; 用独立性检验(列联表法)来考察两个分类变量是否有关系时,算出的随机变量的值越大,说明“与有关系”成立的可能性越大,可知B 为真;若,则,即不成立,若,则,即成立,故是的必要条件,即C 为真;方程即:,化简得,即表示动点到定点的距离和到直线的距离相等的点的集合,且在直线上,故其不满足抛物线的定义,即D 为假,故选D.【点睛】本题主要考查了分层抽样的概念,独立性检验在实际中的应用,充分条件、必要条件的判定,抛物线的定义等,属于中档题.4.A解析:A 【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)5.A解析:A【解析】将表中的数据代入公式,计算得22100(487243) 3.0535050919K ⨯⨯-⨯=≈⨯⨯⨯,∵3.053 2.706>,∴有90%的把握认为生产的产品质量与设备的选择具有相关性,故选A .6.D解析:D 【解析】由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.7.A解析:A 【解析】()x 甲=14×(9+9+11+11)=10,x 乙=14×(8+9+10+x +12)=10,解得x =1.又2s 甲=14×[(9-10)2+(9-10)2+(11-10)2+(11-10)2]=1,2s 乙=14×[(8-10)2+(9-10)2+(11-10)2+(12-10)2]=52,∴2s 甲<2s 乙,∴甲组学生的成绩比乙组稳定. 故答案为A.8.D解析:D 【解析】因为K 2的观测值k=2300(371433585)12217872228⨯-⨯⨯⨯⨯≈4.514>3.841, 所以在犯错误的概率不超过0.05的前提下认为数学成绩与物理成绩有关系. 选D.9.C解析:C 【解析】由2×2列联表得到a =45,b =10,c =30,d =15.则a +b =55,c +d =45,a +c =75,b +d =25,ad =675,bc =300,n =100.所以K 2的观测值k =2100675-30055457525⨯⨯⨯()≈3.030.因为2.706<3.030<3.841.选C. 点睛:根据卡方公式求K 2,再与参考数据比较,最后作出判断.10.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 考点:独立性检验的意义.11.B解析:B 【解析】∵直线0x y a ++=与圆()()22122x y -+=+有公共点,∴≤13a -≤≤,∴在区间[55]-,内任取一个实数a ,使直线0x y a ++=与圆()()22122x y -+=+有公共点的概率为312555+=+,故选B. 点睛:本题主要考查了几何概型的概率,以及直线与圆相交的性质,解题的关键弄清概率类型,同时考查了计算能力,属于基础题;利用圆心到直线的距离小于等于半径可得到直线与圆有公共点,可求出满足条件的a ,最后根据几何概型的概率公式可求出所求.12.D解析:D 【解析】逐一分析所给的各个选项:A. 由样本数据得到的回归方程ˆˆˆy bx a =+必过样本中心(),x yB. 残差平方和越小的模型,拟合的效果越好C. 若变量y 和x 之间的相关系数为0.9362r =-,则变量y 和x 之间具有线性相关关系D. 用相关指数2R 来刻画回归效果,2R 越大,说明模型的拟合效果越好,该说法错误. 本题选择D 选项.二、填空题13.93美元【分析】设所受教育百分比分别为且利用回归方程计算即可【详解】设所受教育百分比分别为且根据回归方程为收入相差大约为:即受教育的人口百分比相差则其人均收入相差约美元故答案为:3193美元【点睛】解析:93美元 【分析】设所受教育百分比分别为%,%a b ,且10a b -=,利用回归方程计算即可. 【详解】设所受教育百分比分别为%,%a b ,且10a b -=根据回归方程为 3.19388.193y x ∧=+, 收入相差大约为:()3.19388.193 3.19388.193 3.1931031.93a b ⨯+-⨯+=⨯=,即受教育的人口百分比相差10%,则其人均收入相差约31.93美元. 故答案为:31.93美元. 【点睛】本题考查了线性回归方程的应用问题,属于中档题.14.3【解析】【分析】逐一分析各个说法即可得到结论【详解】由方差的性质知:方差反映一组数据的波动大小将一组数据中的每个数据都加上或者减去同一个常数后方差恒不变①正确;一个回归方程=3-5x 变量x 增加一个解析:3 【解析】 【分析】逐一分析各个说法即可得到结论 【详解】由方差的性质知:方差反映一组数据的波动大小,将一组数据中的每个数据都加上或者减去同一个常数后,方差恒不变,①正确;一个回归方程ˆy=3-5x ,变量x 增加一个单位时,y 平均减少5个单位,②错误 线性回归方程必过样本中心点,③正确;曲线上的点与该点的坐标之间具有一一对应关系④错误.在一个2×2列联表中,由计算得K 2=13.079,则其两个变量之间有关系的可能性是99.90%,故⑤错误综上所述,其中错误的个数是3个 故答案为3 【点睛】本题主要考查了线性回归方程,考查了独立性检验,考查了方差的变化特点,考查了相关关系,是一道考查的知识点比较多的题目,综合性较强,注意分析,本题不需要计算,只要理解概念即可得到结论15.(1)(3)【解析】分析:根据独立性检验残差图相关系数回归分析的定义及性质逐一分析四个答案的真假即可详解:对于(1)根据2×2列联表中的数据计算得出≥6635而P (≥6635)≈001则有99的把握解析:(1)(3). 【解析】分析:根据独立性检验、残差图、相关系数、回归分析的定义及性质,逐一分析四个答案的真假即可.详解:对于(1),根据2×2列联表中的数据计算得出2K ≥6.635, 而P (2K ≥6.635)≈0.01,则有99%的把握认为两个分类变量有关系,故(1)正确.对于(2),根据残差图的意义可得,当带状区域的宽度较小时,说明选用的模型比价合适,而当带状区域的宽度较大时,说明选用的模型不合适,故(2)不正确.对于(3),在线性回归分析中,相关系数为r ,|r |越接近于1,则相关程度越大;|r |越接近于0,则相关程度越小.故(3)正确.对于(4),在回归直线y =0.5x −85中,当x =200时,y =15,但实际观测值可能不是15,故(4)不正确.综上可得(1)(3)正确.点睛:本题考查回归分析和独立性检验的基本知识,属于基础类题目,解题的关键是熟记相关的的概念和性质.16.【解析】∵P(K2≥3841)≈005∴判断性别与是否爱好运动有关出错的可能性不超过5点睛:根据卡方公式计算再与参考数据比较就可确定可能性 解析:5%【解析】∵P (K 2≥3.841)≈0.05.∴判断性别与是否爱好运动有关,出错的可能性不超过5%. 点睛:根据卡方公式计算2K ,再与参考数据比较,就可确定可能性.17.【解析】则至少有的把握认为喜爱打篮球与性别有关 解析:99.5%【解析】2250(30050)8.33325253020k -==⨯⨯⨯()200.0050.001p k k >≥>则至少有99.5%的把握认为喜爱打篮球与性别有关18.【解析】试题分析:由回归直线方程可知当时所以针对个体的残差是考点:线性回归方程 解析:0.29-【解析】试题分析:由回归直线方程可知当160x =时,53.29y =,所以针对个体的残差是5353.290.29-=-.考点:线性回归方程.19.5【解析】试题分析:考点:回归方程【方法点睛】求回归直线中的参数ba 需要先求得b 再求a 因为所以要根据列表中的数据求得公式中相关的量将这些数据代入公式中即可求得参数b 对于参数a 需要将b 代入回归直线求得解析:5【解析】试题分析:3125344646i i i x y ==⨯+⨯+⨯=∑, 32222123429i i x ==++=∑,3x =, 5y =, ∴ 31322130.53ˆi i i i i x y xyb x x==-==-∑∑. 考点:回归方程.【方法点睛】求回归直线中的参数b ,a ,需要先求得b ,再求a ,因为,所以要根据列表中的数据求得公式中相关的量,将这些数据代入公式中,即可求得参数b .对于参数a ,需要将b ,代入回归直线求得.20.①④【解析】对于①从匀速传递的产品生产流水线上质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测这样的抽样方法是系统抽样故①正确;对于②两个变量的线性相关程度越强则相关系数的绝对值越接近于1解析:①④ 【解析】对于①,从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样,故①正确;对于②,两个变量的线性相关程度越强,则相关系数的绝对值越接近于1,故②错误; 对于③,两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越小,故③错误;对于④,∵随机变量X ∼N (0,1),设P (|X |<1)=p ,则1(1)(1)2pP X P X ->=<-=, ∴11(1)1(1)122p pP X P X -+<=->=-=, ∴2(1)1P X p <-=,即(1)2(1)1P X P X <=<-,故④正确。

新北师大版高中数学高中数学选修2-3第三章《统计案例》检测(答案解析)

新北师大版高中数学高中数学选修2-3第三章《统计案例》检测(答案解析)

一、选择题1.某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修课程的55名学生,得到数据如下表:临界值参考:(参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)参照附表,得到的正确结论是( )A .在犯错误的概率不超过0.1%的前提下,认为“喜欢“应用统计”课程与性别有关”B .在犯错误的概率不超过0.1%的前提下,认为“喜欢“应用统计”课程与性别无关”C .有99.99%以上的把握认为“喜欢“应用统计”课程与性别有关”D .有99.99%以上的把握认为“喜欢“应用统计”课程与性别无关” 2.下列说法中错误的是( )A .先把高二年级的2000名学生编号:1到2000,再从编号为1到50的学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +,……的学生,这种抽样方法是系统抽样法.B .一组数据的方差为2s ,平均数为x ,将这组数据的每一个数都乘以2,所得的一组新数据的方差和平均数为24s ,2x .C .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1.D .若一组数据1,a ,3的平均数是2,则该组数据的方差是23. 3.利用独立性检验的方法调查大学生的性别与爱好某项运动是否有关,通过随机询问400名不同的大学生是否爱好某项运动,利用22⨯列联表,计算可得2K 的观测值7.556k ≈,附表:参照附表,得到的正确结论是A .有99%以上的把握认为“爱好该项运动与性别无关”B .有99%以上的把握认为“爱好该项运动与性别有关”C .在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别无关”4.某科研机构为了研究中年人秃发与患心脏病是否有关,随机调查了一些中年人的情况,具体数据如表,根据表中数据则可判定秃发与患心脏病有关,那么这种判定出错的可能性为( ) 患心脏病情况秃发情况 患心脏病无心脏病 秃发 20 300 不秃发5450A .0.1B .0.05C .0.01D .0.995.设导弹发射的事故率为0.01,若发射10次,其出事故的次数为ξ,则下列结论正确的是 ( ) A .0.1E ξ=B .•01D ξ=C .10()0.01?0.99k k P k ξ-==D .1010()0.99?0.01kkkP k C ξ-==6.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; ②设有一个回归方程35y x =-,变量x 增加一个单位时,y 平均增加5个单位; ③线性回归直线y bx a =+必过(),x y ; ④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K 2=13.079.则其两个变量间有关系的可能性是90%. 其中错误的个数是( ) A .1B .2C .3D .47.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由()()()()()22n ad bc k a b c d a c b d -=++++并参照附表,得到的正确结论是A .在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B .在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C .有99.9%的把握认为“爱好游泳运动与性别有关”D .有99.9%的把握认为“爱好游泳运动与性别无关” 8.下列说法中正确的是①相关系数r 用来衡量两个变量之间线性关系的强弱, r 越接近于1,相关性越弱; ②回归直线y bx a =+一定经过样本点的中心(),x y ; ③随机误差e 的方差()D e 的大小是用来衡量预报的精确度;④相关指数2R 用来刻画回归的效果, 2R 越小,说明模型的拟合效果越好.( ) A .①②B .③④C .①④D .②③9.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-10.下列命题中:①线性回归方程y bx a =+必过点(),x y ;②在回归方程35y x =-中,当变量增加一个单位时,y 平均增加5个单位; ③在回归分析中,相关指数2R 为0.80的模型比相关指数2R 为0.98的模型拟合的效果要好;④在回归直线0.58ˆyx =-中,变量2x =时,变量y 的值一定是-7. 其中假命题的个数是 ( ) A .1B .2C .3D .411.由某个22⨯列联表数据计算得随机变量2K 的观测值k 6.879=,则下列说法正确的是 ( )0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.7081.3232.0722.7063.8415.0246.6357.87910.828A .两个分类变量之间有很强的相关关系B .有99%的把握认为两个分类变量没有关系C .在犯错误的概率不超过1.0%的前提下认为这两个变量间有关系D .在犯错误的概率不超过0.5%的前提下认为这两个变量间有关系12.高二第二学期期中考试,按照甲、乙两个班级学生数学考试成绩优秀和不优秀统计人数后,得到2×2列联表,则随机变量2K 的观测值为A .0.600B .0.828C .2.712D .6.004二、填空题13.x ,y 的取值如下表: x-2-1.5-1-0.50.51y 0.26 0.35 0.51 0.71 1.1 1.41 2.05则x ,y 之间的关系可选用函数___进行拟合.14.设样本数据x 1,x 2,…,x 2 017的方差是4,若y i =x i -1(i =1,2,…,2 017),则y 1,y 2,…,y 2 017的方差为______.15.为了解适龄公务员对放开生育二胎政策的态度,某部门随机调查了200位30~40岁之间的公务员,得到的情况如下表:男公务员 女公务员生二胎8040不生二胎4040则________(填“有”或“没有”)99%以上的把握认为“生二胎与性别有关”.附:K2=.P(K2≥k0)0.100.050.0250.0100.0050.001k0 2.706 3.841 5.024 6.6357.87910.82816.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考查某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:附表:参照附表,在犯错误的概率不超过______(填百分比)的前提下,认为“小动物是否被感染与有没有服用疫苗有关”.17.已知下列说法:①分类变量A与B的随机变量越大,说明“A与B有关系”的可信度越大;②以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别是和;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为,若,,,则.其中说法正确的为_____________.(填序号)18.某班运动队由足球运动员18人、篮球运动员12人、乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n的样本,若分别采用系统抽样法和分层抽样法,则都不用剔除个体;当样本容量为n+1时,若采用系统抽样法,则需要剔除1个个体,那么样本容量n为________.19.给出下列四个结论:r ;(1)相关系数r的取值范围是1(2)用相关系数r来刻画回归效果,r的值越大,说明模型的拟合效果越差;(3)一个袋子里装有大小相同的5个白球和5个黑球,从中任取4个,则其中所含白球个数的期望是2;(4) 一个篮球运动员投篮一次得3分的概率为a ,得2分的概率为b ,不得分的概率为c ,且(),,0,1a b c ∈,已知他投篮一次得分的数学期望为2,则213a b+的最小值为163.其中正确结论的序号为______________.20.为了了解司机开车时礼让斑马线行人的情况,交警部门调查了100名机动车司机,得到以下统计数据:若以2χ为统计量进行独立性检验,则2χ的值是__________.(结果保留2位小数) 参考公式()1122122121212n n n n n n n n n χ++++-=三、解答题21.某共享单车经营企业欲向甲巿投放单车,为制定适宜的经营策略﹐该企业首先在已投放单车的乙市进行单车使用情况调查.调查过程分随机问卷﹑整理分析及开座谈会三个阶段.在随机问卷阶段,A ,B 两个调查小组分赴全市不同区域发放问卷并及时收回﹔在整理分析阶段,两个调查小组从所获取的有效问卷中,针对15岁至45岁的人群,按比例随机抽取了300份,进行了数据统计,具体情况如下表:参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:(1)先用分层抽样的方法从上述300人中按“年龄是否达到35岁”抽出一个容量为60人的样本,再用分层抽样的方法将“年龄达到35岁”的被抽个体数分配到“经常使用单车”和“偶尔使用单车”中去.①求这60人中“年龄达到35岁且偶尔使用单车”的人数﹔②为听取对发展共享单车的建议,调查组专门组织所抽取的"年龄达到35岁且偶尔使用单车的人员召开座谈会,会后共有3份礼品赠送给其中3人,每人1份(其余人员仅赠送骑行优惠券).已知参加座谈会的人员中有且只有4人来自A 组,求A 组这4人中得到礼品的人数X 的分布列和数学期望;(2)从统计数据可直观得出“是否经常使用共享单车与年龄有关”的结论.在用独立性检验的方法说明该结论成立时,为使犯错误的概率尽可能小,当年龄设定为25岁时,根据已有数据,完成下列2×2列联表(单位:人),并判断是否在犯错误的概率不超过1%的前提下有把握认为“经常使用共享单车与年龄有关”?经常使用单车 偶尔使用单车 合计未达到25岁 达到25岁 合计22.据我国一项专题调查显示,北京市高级职称知识分子中竟有高达75.3%的人处于亚健康状态,更令人担忧的是85%以上的企业管理者处于慢性疲劳状态或亚健康状态,这是由他们的特殊工作、生活环境和行为模式所决定的.亚健康是指非病非健康的一种临界状态,如果这种状态不能及时得到纠正,非常容易引起身心疾病.某高科技公司为了解亚健康与性别的关系,对本公司部分员工进行了不记名问卷调查.该公司处于正常工作状态的员工(包括管理人员)共有10000人.其中男性员工有6000人,女性员工有4000人,从10000中用分层抽样的方法随机抽取了500人的样本,以调查健康状况. (1)求男性员工、女性员工各抽取多少人?(2)通过不记名问卷调查方式,得到如下等高条形图:其中0.2a =、0.1b =,根据以上等高条形图,完成下列22⨯列联表;健康 亚健康 总计男员工附:22(),()()()()n ad bc K n a b c d a b a c c d b d -==+++++++.23.某企业的甲、乙两种产品在东部地区三个城市以及西部地区两个城市的销售量x ,y 的数据如下:(1)已知销售量x 和销售量y 大致满足线性相关关系,求出y 关于x 的线性回归方程y bx a =+;(2)根据上述数据计算是否有99%的把握认为东、西部的地区差异与甲、乙两种产品的销售量相关.参考公式:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-;()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.临界值表:24.为调研高中生的作文水平,在某市普通高中的某次联考中,参考的文科生与理科生人数之比为1∶4,且成绩分布在[]0,60的范围内,规定分数在50以上(含50)的作文获奖,按文理科用分层抽样的方法抽取400人的成绩作为样本,得到成绩的频率分布直方图如图所示,其中a,b,c构成以2为公比的等比数列.(1)求a,b,c的值;(2)填写下面22⨯列联表,能否在犯错误的概率不超过0.01的情况下认为“获奖”与“学生的文理科”有关?文科生理科生合计获奖6不获奖合计400.附:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.()2P K k≥0.150.100.050.0250.0100.0050.001k 2.072 2.706 3.841 5.024 6.6357.87910.82825.近年来,网络电商已经悄然进入了广大市民的日常生活,并慢慢改变了人们的消费方式.为了更好地服务民众,某电商在其官方APP中设置了用户评价反馈系统,以了解用户对商品状况和优惠活动的评价.现从评价系统中随机抽出200条较为详细的评价信息进行统计,商品状况和优惠活动评价的22⨯列联表如下:对优惠活动好评对优惠活动不满意合计对商品状况好评10020120(Ⅰ)能否在犯错误的概率不超过0.001的前提下认为优惠活动好评与商品状况好评之间有关系?(Ⅱ)为了回馈用户,公司通过APP 向用户派送每张面额为0元,1元,2元的三种优惠券.若某用户可从含有0元,1元,2元各两张的六张优惠券中随机领取两张(获得每张的可能性相等),求该用户获得的优惠券面额之和不小于2的概率. 参考数据:参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.26.新冠肺炎疫情防控时期,各级各类学校纷纷组织师生开展了“停课不停学”活动,为了解班级线上学习情况,某位班主任老师进行了有关调查研究.(1)从班级随机选出5名同学,对比研究了线上学习前后两次数学考试成绩,如下表: 参考公式:在线性回归方程y bx a =+,()()()()1122211n niii ii i nniii i x x y y x y nx yb x x xn x====---==--∑∑∑∑,a y bx =-(2)针对全班45名同学(25名女生,20名男生)的线上学习满意度调查中,女姓满意率为80%,男生满意率为75%,填写下面列联表,判断能否在犯错误概率不超过0.01的前提下,认为线上学习满意度与学生性别有关?参考公式和数据:()()()()()2n ad bc x a b c d a c b d -=++++,()20.0500.0100.0013.8416.63510.828P x k k ≥【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】计算212.010.828K ≈>,对比临界值表得到答案. 【详解】()222552020105()53912.010.828()()()()3025302545n ad bc K a b c d a c b d ⨯-⨯-===≈>++++⨯⨯⨯,故在犯错误的概率不超过0.1%的前提下,认为“喜欢“应用统计”课程与性别有关”. 故选:A. 【点睛】本题考查了独立性检验,意在考查学生的计算能力和应用能力.2.C解析:C 【分析】根据题意,对选项中的命题进行分析,判断真假性即可. 【详解】对于A ,根据抽样方法特征是数据多,抽样间隔相等,是系统抽样,所以A 正确; 对于B ,一组数据的方差为2s ,平均数为x ,将这组数据的每一个数都乘以2,所得的一组新数据的方差和平均数为24s ,2x ,所以B 正确;对于C ,两个随机变量的线性相关性越强,则相关系数||r 的值越接近于1,所以C 错误;对于D ,一组数据1、a 、3的平均数是2,所以2a =;所以该组数据的方差是222212[(12)(22)(32)]33s =⨯-+-+-=,所以D 正确.故选:C . 【点睛】本题主要考查抽样和统计,考查方差和平均数的计算,考查两个随机变量的相关性,意在考查学生对这些知识的理解掌握水平3.B解析:B 【分析】根据2K 的观测值7.556k ≈,对照表中数据,即可得到相应的结论. 【详解】根据2K 的观测值7.556k ≈,对照表中数据得出有0.01的几率说明这两个变量之间的关系是不可信的,即有10.0199%-=的把握说明两个变量之间有关系,故选B . 【点睛】本题主要考查独立性检验的应用,独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式计算2K 的观测值k ;(3)查表比较k 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误)4.C解析:C 【分析】首先列出22⨯联表,通过计算出2K 的值,然后作统计推断,得出正确的结论. 【详解】列出22⨯联表如下图所示:()277520450530015.96825750455320K ⨯⨯-⨯=≈⨯⨯⨯ 6.635>,故判断错误的概率不超过0.01,故选C .【点睛】本小题主要考查补全22⨯联表,考查2K 的计算以及独立性检验的概念,属于基础题. 独立性检验的步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22n ad bc K a b c d a c b d -=++++()()()()(),计算2K 的观测值;(3)比较2K 与临界值的大小关系作统计推断. 5.A解析:A 【解析】 【分析】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,实验的结果只有发生和不发生两种结果,故本题符合独立重复试验,由独立重复试验的期望公式得到结果. 【详解】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,故本题符合独立重复试验,即ξ~(10,0.01)B . ∴100.010.1E ξ=⨯= 故选A . 【点睛】解决离散型随机变量分布列和期望问题时,主要依据概率的有关概念和运算,同时还要注意题目中离散型随机变量服从什么分布,若服从特殊的分布则运算要简单的多.6.C解析:C 【解析】对于①,方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变,故正确;对于②,一个回归方程ˆ35yx =-,变量x 增加一个单位时,y 平均减小5个单位,故不正确;对于③,线性回归直线ˆˆˆy bx a =+必过样本中心点(),x y ,故正确;对于④,曲线上的点与该点的坐标之间具有一一对应关系,故不正确;对于⑤,有一个2×2列联表中,由计算得213.079K =,则其两个变量间有关系的可能性是99.9%,故不正确. 故选C.7.A解析:A 【解析】()22110403020207.8 6.63560506050k ⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为“爱好游泳运动与性别有关”,所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”8.D解析:D 【解析】①相关系数r 用来衡量两个变量之间线性关系的强弱,r 越接近于1,则相关性越强,所以错误;②回归直线y bx a =+一定经过样本点的中心(),x y ,正确; ③随机误差e 的方差()D e 的大小是用来衡量预报的精确度,正确;④相关指数2R 用来刻画回归的效果,2R 越小,说明模型的拟合效果越不好,所以错误. 所以正确的有②③.故选D .9.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A. 点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 10.C解析:C 【解析】对于①,线性回归方程 ˆˆˆybx a =+必过点)x y (,,满足回归直线的性质,所以①正确;对于②,在回归方程ˆ35y x =-中,当变量x 增加一个单位时,y 平均减少5个单位,不是增加5个单位;所以②不正确;对于③,在回归分析中,相关指数2R 为0.80的模型比相关指数2R 为0.98的模型拟合的效果要好,该判断恰好相反;所以③不正确;对于④,在回归直线0.58ˆy x =-中,变量2x =时,变量y 的值一定是-7.不是一定为7,而是可能是7,也可能在7附近,所以④不正确;故选C.11.C解析:C 【解析】由22⨯列联表数据计算得随机变量2K 的观测值是 6.879 6.635k =>,通过对照表中数据得,在犯错误的概率不超过1.0%的前提下,认为这两个变量间有关系,故选C.12.A解析:A 【解析】本题主要考查独立性检验.由题所给统计表可知a=11,b=34,a+b=45,c=8,d=37,c+d=45,a+c=19,b+d=71,n=90,所以,()()()()()220.600n ad bc k a b c d a c b d -=≈++++ .本题选择A 选项.二、填空题13.【分析】根据表格中的数据即可估测之间的关系可选用函数进行拟合得到答案【详解】根据表格中的数据可知当时;当时;当时;当时;当时可估测之间的关系可选用函数进行拟合【点睛】本题主要考查了函数的表示方法和指解析:2x y =【分析】根据表格中的数据,即可估测,x y 之间的关系可选用函数2x y =进行拟合,得到答案. 【详解】根据表格中的数据,可知当2x =-时,0.260.25y =→;当1x =-时,0.510.5y =→;当0x =时, 1.11y =→;当0.5x =时, 1.412y =→;当1x =时, 2.052y =→, 可估测,x y 之间的关系可选用函数2x y =进行拟合. 【点睛】本题主要考查了函数的表示方法和指数函数的性质的应用,其中熟记函数的表示方法和指数函数的性质,合理应用是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.14.4【解析】设样本数据的平均数为则yi =2xi -1的平均数为2-1则y1y2…y2017的方差为(2x1-1-2+1)2+(2x2-1-2+1)2+…+(2x2017-1-2+1)2=4×(x1-)2解析:4 【解析】设样本数据的平均数为,则y i =2x i -1的平均数为2-1,则y 1,y 2,…,y 2 017的方差为[(2x 1-1-2+1)2+(2x 2-1-2+1)2+…+(2x 2 017-1-2+1)2]=4× [(x 1-)2+(x 2-)2+…+(x 2 017-)2]=4×4=1615.没有【解析】由于K2=<6635故没有99以上的把握认为生二胎与性别有关解析:没有 【解析】由于K 2=2200(80404040)5012080120809⨯-⨯=⨯⨯⨯<6.635,故没有99%以上的把握认为“生二胎与性别有关”.16.%【解析】试题分析:所以在犯错误不超过%的前提下认为小动物是否被感染与有没有服用疫苗有关考点:1卡方统计量2统计;【易错点晴】本题主要考查的是统计中的卡方统计量属于容易题解题时一定要注意计算问题很多解析:% 【解析】 试题分析:,所以在犯错误不超过%的前提下,认为“小动物是否被感染与有没有服用疫苗有关” . 考点:1.卡方统计量,2.统计;【易错点晴】本题主要考查的是统计中的卡方统计量,属于容易题.解题时一定要注意计算问题,很多同学列式正确计算错误,从而不能正确得到结果.另外,学生容易把答案写为%,所以一定要注意本题中的问题是什么,否则很容易出现错误.17.①②③【解析】①正确因为k2越大说明A和B有关系的把握性就越大;②正确因为y=cekx那么lny=lncekx=kx+lnc即z=kx+lnc=03x+4解得k=03lnc=4解得:k=03c=e4解析:①②③【解析】①正确,因为越大,说明“和有关系”的把握性就越大;②正确,因为,那么,即,解得,解得:所以正确;③在回归直线上,所以,解得:,所以正确,那么正确的有①②③.【点睛】本题是以命题形式考查了回归方程和独立性检验的相关知识,样本中心点必在回归直线上,独立性检验中越大,说明犯错误的概率越小,即认为两个变量有关的把握性就越大.18.6【解析】n为18+12+6=36的正约数因为18:12:6=3:2:1所以n为6的倍数因此因为当样本容量为时若采用系统抽样法则需要剔除1个个体所以n+1为35的正约数因此解析:6【解析】n为18+12+6=36的正约数,因为18:12:6=3:2:1,所以n为6的倍数,因此6,12,18,24,30,36n=因为当样本容量为1n+时,若采用系统抽样法,则需要剔除1个个体,所以n+1为35的正约数,因此6n=19.(3)(4)【解析】分析:(1)相关系数的范围;(2)由相关指数r的含有知|r|的值越大说明模型的拟合效果越好;(3)离散型随机变量的期望;(4)根据期望公式得到3a+2b=2进而利用均值不等式求最解析:(3)(4)【解析】分析:(1)相关系数的范围;(2)由相关指数r的含有知,|r|的值越大,说明模型的拟合效果越好;(3)离散型随机变量的期望;(4)根据期望公式得到3a+2b=2,进而利用均值不等式求最值.详解:(1)相关系数r的取值范围是1r≤,故(1)错误;(2)用相关指数r来刻画回归效果,|r|的值越大,说明模型的拟合效果越好,故(2)错误;(3)含零个白球的概率为5210,含一个白球的概率为50210,含二个白球的概率为100210,含三个白球的概率为50210,含四个白球的概率为5210, 白球个数的期望为:550100505012342210210210210210⨯+⨯+⨯+⨯+⨯=,故(3)正确; (4)∵3a+2b+0•c=2,a ,b ,c ∈(0,1), ∴213a b +=(213a b +)•12(3a+2b )=12(6+4b a +a b +23)≥12(203+24b aa b⋅) =12(203+4)=163(当且仅当a=2b ,即a=12,b=14时取“=”),故(4)正确. 其中正确结论的序号为:(3)(4). 故答案为(3)(4).点睛:本题考查相关系数的有关概念,考查离散型随机变量的期望及概率统计与基本不等式的综合应用,属于中档题.20.【解析】分析:根据题意填写2×2列联表计算观测值对照临界值得出结论详解:填写2×2列联表如下:根据数表计算=≈825>7879所以有995的把握认为开车时使用手机与司机的性别有关;点睛:独立性检验的 解析:8.25【解析】分析:根据题意填写2×2列联表,计算观测值,对照临界值得出结论. 详解:填写2×2列联表,如下:根据数表,计算()()()()()22n ad bc a b c d a c b d -X =++++=()21004025201555456040⨯⨯-⨯⨯⨯⨯≈8.25>7.879,所以有99.5%的把握认为开车时使用手机与司机的性别有关;点睛:独立性检验的一般步骤:(I )根据样本数据制成22⨯列联表;(II )根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(III ) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)三、解答题21.(1)① 9人;②分布列答案见解析,数学期望:43;(2)列联表答案见解析,在犯错误的概率不超过1%的前提下没有把握认为“经常使用共享单车与年龄有关”. 【分析】(1)利用分层抽样,按比例计算这60人中“年龄达到35岁且偶尔使用单车”的人数﹔直接分析X 服从超几何分布,求概率,写出分布列,求出数学期望;(2)根据题意,25m =填写2×2列联表,套公式计算 3.063K ≈,对应参考值下结论. 【详解】解:(1)①从300人中抽取60人,其中“年龄达到35岁”的有1006020300⨯=人, 再将这20人用分层抽样法按"是否经常使用单车"进行名额划分,其中“年龄达到35岁且偶尔使用单车”的人数为45209100⨯=. ②A 组这4人中得到礼品的人数X 的可能取值为0,1,2,3,相应概率为:()35395042C P X C ===,()12453910121C C P X C ===, ()214539C C 52C 14P X ===,()3439C 13C 21P X ===.故其分布列为∴数学期望()0123422114213E X =⨯+⨯+⨯+⨯= (2)25m =时,按“年龄是否达到25岁”对数据进行整理,得到如下列联表()2300678711333300210049 3.06320010018012020010018012016K ⨯⨯-⨯⨯===≈⨯⨯⨯⨯⨯⨯ ∴3.063 6.635<所以在犯错误的概率不超过1%的前提下没有把握认为“经常使用共享单车与年龄有关”. 【点睛】(1) 求离散型随机变量的分布列时,要特别注意. 随机变量是否服从二项分布、超几何分布等特殊的分布;(2)独立性检验的题目直接根据题意完成完成2×2列联表,直接套公式求出K ,对照参数下结论,一般较易.22.(1)300人;200人;(2)列联表见解析,能有99%的把握认为亚健康与性别有关. 【分析】(1)由题意可得样本容量与总体的比例为120,用比例乘以男性员工和女性员工即可得出抽取人数;(2)根据等高条形图计算男性健康240人,亚健康60人,女性健康180人,亚健康20人,完成22⨯列联表,代入2K 公式计算即可. 【详解】解:(1)因为样本容量与总体的比例为50011000020=, 所以男性员工应抽取1600030020⨯=人,女性员工应抽取1400020020⨯=人;(2)由等高条形图可知:样本中男员工处于亚健康人数为:3000.260⨯=, 样本中女员工处于亚健康人数为:2000.120⨯=,完成22⨯列联表为根据列联表中的数据,得到2500(2402018060)8.929 6.63530020080420k ⨯⨯-⨯=≈>⨯⨯⨯.因此,能有99%的把握认为亚健康与性别有关. 【点睛】独立性检验三个步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22(),()()()()n ad bc K n a b c d a b a c c d b d -==+++++++,计算2K 的值; (3)查表比较2K 与临界值的大小关系,作统计判断.23.(1) 4.768y x =-;(2)列联表见解析,有99%的把握认为东、西部的地区差异与甲、乙两种产品的销售量相关. 【分析】(1)求出x 、y ,代入相应值求ˆb,再由公式ˆˆa y bx =-求出ˆa ,即可求得线性回归方。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

§2 独立性检验
自主整理
1.设A ,B 为两个变量,每一个变量都可以取两个值, 变量A :A 1,A 2=A 1; 变量B :B 1,B 2=B 1. 通过观察得到下表所示数据:
其中,a 表示变量A 取A 1,且变量B 取B 1时的数据;b 表示变量A 取A 1,且变量B 取B 2时的数据;c 表示变量A 取A 2,且变量B 取B 1时的数据;d 表示变量A 取A 2,且变量B 取B 2时的数据.
设n=a+b+c+d,用_______________估计P(A 1B 1), ______________估计P(A 1), __________估计P(B 1). 若有式子
n
c
a n
b a n a +•
+=, 则可以认为______________独立.
同理,若
n d b n b a n b +•+=,则可以认为______________独立;若n
c
a n d c n c +•
+=,则可以认为______________独立;若n
d b n d c n d +•+=,则可以认为______________独立. 但是,在
n c a n b a n a +•+=中,由于n
c
a n
b a n a ++,,表示的是______________,不同于概率,即使变量之间独立,式子两边也不一定恰好相等.但是当两边相差______________时,变量之间就不独立.
2.选取χ2作统计量,用它的大小来检验变量之间是否独立.
χ2=______________________________________________________________________
当数据量较大时,在统计中,用以下结果对变量的独立性进行判断.
(1)当χ2≤______________时,没有充分的证据判定变量A,B 有关联,可以认为变量A,B 是没有关联的;
(2)当χ2>______________时,有90%的把握判定变量A,B 有关联; (3)当χ2>______________时,有95%的把握判定变量A,B 有关联; (4)当χ2>______________时,有99%的把握判定变量A,B 有关联. 高手笔记
1.独立性检验的基本思想
先假设两个分类变量X 与Y 无关系,即X 与Y 相互独立,计算χ2的观测值k,把k 与临界值进行比较,可以判断X 与Y 有关系的程度及无关系.在该假设下,构造的随机变量χ2应该很小,如果实际计算出的χ2的观测值很大,则在一定程度上说明假设不合理,根据χ2的含义可以利用统计估算出概率P(χ2≥6.635)≈0.01,即有1%的把握认为X 与Y 无关,也就是说有99%的把握认为X 与Y 有关联. 2.独立性检验的一般步骤
(1)假设两个分类变量X 与Y 无关联;
(2)计算出χ2
=
;)
)()()(()(2
d b c a d c b a bc ad n ++++- (3)把χ2的值与临界值比较确定X 与Y 有关联的程度或无关联. 名师解惑
从教科书中,我们得到“有99%以上的把握认为吸烟与患肺癌是有关的”这一结论,有的同学认为这一结论应该这样理解:即100个抽烟的人中,有99个患有肺癌.请问这样理解是否正确? 剖析:不正确.
首先要区别“事件发生的概率”与“独立性检验中X 与Y 有关联的概率”. (1)事件发生的概率.例如袋中有100个球,其中99个白球,1个黑球,随机取一个球,则取到白球的概率为99%.
(2)两个变量X 与Y 有关系的概率.例如教科书中吸烟与患肺癌之间有关系的概率
为99%,并非指吸烟者中有99%的人患肺癌,而是指我们有99%的把握认为“吸烟与患肺癌有关系”,(而在吸烟者中,只有2.82%的人患肺癌)我们得到的结论是:吸烟者与不吸烟者患肺癌的可能性存在差异,这里所说的“吸烟与患肺癌有关系”是指统计上的关系,而非因果关系,至于吸烟者患不患肺癌,应该由医学检查来确定,而非统计学上的事了. 讲练互动
【例1】在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,利用独立性检验的方法判断秃顶与患心脏病是否有关系. 分析:计算χ2的值,然后与临界值进行比较. 解:根据题目所给的数据得到如下列联表:
故χ2
=772
6651048389)451175597214(14372
⨯⨯⨯⨯-⨯⨯≈16.373>6.635,
所以有99%的把握认为“秃顶与患心脏病有关”.
黑色陷阱:因为这组数据来自住院的病人,因此所得到的结论只适合住院的病人群体,不要脱离这个前提而将结论推广到一般人群.. 变式训练
1.为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:
由表中的数据,你认为在多大程度上可以认为高中生的性别与是否喜欢数学课程之间有关系?为什么?
解:χ2
=178
12222872)853514337(3002
⨯⨯⨯⨯-⨯⨯≈4.513>3.841,
在假设“性别与是否喜欢数学课程之间没有关系”的前提下,χ2应该很小,并且P (χ2>3.841)≈0.05,
而我们所得到的χ2的观察值4.513超过3.841,这就意味着“性别与是否喜欢数学课程之间有关系”这一结论是错误的可能性约为0.05,即有95%的把握认为“性别与是否喜欢数学课程之间有关系”.
【例2】某地震观测站对地下水位的变化和发生地震的情况进行了n=1 700次观测,列联表如下:
问观测结果是否说明地下水位的变化与地震的发生有关系?
分析:判断两个分类变量是否相关,只须计算χ2的值然后与临界值比较即可. 解:列联表:
χ2
=700
10001520180)9028261898(17002
⨯⨯⨯⨯-⨯⨯≈1.59<2.706,
∴没有充分的证据显示地下水位的变化与地震的发生相关.
绿色通道:当χ2≤2.706时,一般认为没有充分证据显示“X 与Y 有关系”.. 变式训练
2.为了研究性格与血型的关系抽取80人测试,血型与性格汇总如下,试判断性格与血型是否相关.
解:由列联表中的数据得到
χ2
=46
344535)17162918(802
⨯⨯⨯⨯-⨯⨯≈2.030≤2.706.
所以认为没有充分的证据显示血型与性格有关系.
【例3】在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,判断喜不喜欢甜食与性别是否有关系.
分析:先由题目中的条件画出列联表,然后计算χ2. 解:作列联表如下:
χ2
=670
530591609)413492178117(12002⨯⨯⨯⨯-⨯≈312.272>6.635,
∴有99%的把握认为喜不喜欢甜食与性别有关系.
绿色通道:统计方法是可能犯错误的,好的统计方法就是要降低犯错误的概率.. 变式训练
3.为了探究患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如下表所示:
试问:50岁以上的人患慢性气管炎与吸烟习惯有关吗? 解:根据列联表中的数据,得到
χ2
=283
56134205)1316212143(3392
⨯⨯⨯⨯-⨯⨯=7.469.因为7.469>6.635,所以我们有99%的把
握说50岁以上的人患慢性气管炎与吸烟习惯有关.。

相关文档
最新文档