新课标A版高中数学选修2-3练习第三章 统计案例 3-1 Word版含答案
高中数学 第三章 统计案例练习 理 新人教A版选修2-3(2021年最新整理)
2016-2017学年高中数学第三章统计案例练习理新人教A版选修2-3 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2016-2017学年高中数学第三章统计案例练习理新人教A版选修2-3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2016-2017学年高中数学第三章统计案例练习理新人教A版选修2-3的全部内容。
第三章 统计案例微测试1 3.1回归分析的基本思想及其初步应用(测试时间:20分钟)一、选择题:在每小题给出的四个选项中,只有一项是符合题目要求的. 1.给出下列四个命题,其中正确的一个是A .在线性回归模型中,相关指数20.80R =,说明预报变量对解释变量的贡献率是80%B .相关系数0.852r =,接近1,表明两个变量的线性相关性很差C .相关指数2R 用来刻画回归效果,2R 越小,则残差平方和越大,模型的拟合效果越好D .相关指数2R 用来刻画回归效果,2R 越大,则残差平方和越小,模型的拟合效果越好 2.下表是x 和y 之间的一组数据,则y 关于x 的回归直线方程必过A .点(2,3)B .点(3,5)C .点(2.5,4)D .点(2.5,5)3.下表是某厂14~月份用水量(单位:百吨)的一组数据:由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0ˆ.7yx =-+ a ,则a 等于A .10.5B .5.15C .5.2D .5.254.四名同学根据各自的样本数据研究变量,x y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且ˆ 2.347 6.423yx =-; ②y 与x 负相关且ˆ 3.476 5.648y x =-+; ③y 与x 正相关且ˆ 5.4378.493yx =+; ④y 与x 正相关且ˆ 4.326 4.578y x =--。
人教A版高中数学选修2-3全册同步练习及单元检测含答案
⼈教A版⾼中数学选修2-3全册同步练习及单元检测含答案⼈教版⾼中数学选修2~3 全册章节同步检测试题⽬录第1章《计数原理》同步练习 1.1测试1第1章《计数原理》同步练习 1.1测试2第1章《计数原理》同步练习 1.1测试3第1章《计数原理》同步练习 1.2排列与组合第1章《计数原理》同步练习 1.3⼆项式定理第1章《计数原理》测试(1)第1章《计数原理》测试(2)第2章同步练习 2.1离散型随机变量及其分布列第2章同步练习 2.2⼆项分布及其应⽤第2章测试(1)第2章测试(2)第2章测试(3)第3章练习 3.1回归分析的基本思想及其初步应⽤第3章练习 3.2独⽴性检验的基本思想及其初步应⽤第3章《统计案例》测试(1)第3章《统计案例》测试(2)第3章《统计案例》测试(3)1. 1分类加法计数原理与分步乘法计数原理测试题⼀、选择题1.⼀件⼯作可以⽤2种⽅法完成,有3⼈会⽤第1种⽅法完成,另外5⼈会⽤第2种⽅法完成,从中选出1⼈来完成这件⼯作,不同选法的种数是()A.8 B.15C.16 D.30答案:A2.从甲地去⼄地有3班⽕车,从⼄地去丙地有2班轮船,则从甲地去丙地可选择的旅⾏⽅式有()A.5种B.6种C.7种D.8种答案:B3.如图所⽰为⼀电路图,从A 到B 共有()条不同的线路可通电()A.1 B.2 C.3 D.4答案:D4.由数字0,1,2,3,4可组成⽆重复数字的两位数的个数是()A.25 B.20 C.16 D.12答案:C5.李芳有4件不同颜⾊的衬⾐,3件不同花样的裙⼦,另有两套不同样式的连⾐裙.“五⼀”节需选择⼀套服装参加歌舞演出,则李芳有()种不同的选择⽅式()A.24 B.14 C.10 D.9答案:B 6.设A ,B 是两个⾮空集合,定义{}()A B a b a A b B *=∈∈,,|,若{}{}0121234P Q ==,,,,,,,则P *Q 中元素的个数是()A.4 B.7 C.12 D.16答案:C⼆、填空题7.商店⾥有15种上⾐,18种裤⼦,某⼈要买⼀件上⾐或⼀条裤⼦,共有种不同的选法;要买上⾐,裤⼦各⼀件,共有种不同的选法.答案:33,2708.⼗字路⼝来往的车辆,如果不允许回头,共有种⾏车路线.答案:129.已知{}{}0341278a b ∈∈,,,,,,,则⽅程22()()25x a y b -+-=表⽰不同的圆的个数是.答案:1210.多项式123124534()()()()a a a b b a a b b ++++++··展开后共有项.答案:1011.如图,从A →C ,有种不同⾛法.答案:612.将三封信投⼊4个邮箱,不同的投法有种.答案:34三、解答题 13.⼀个⼝袋内装有5个⼩球,另⼀个⼝袋内装有4个⼩球,所有这些⼩球的颜⾊互不相同.(1)从两个⼝袋内任取⼀个⼩球,有多少种不同的取法?(2)从两个⼝袋内各取⼀个⼩球,有多少种不同的取法?解:(1)549N =+=种;(2)5420N =?=种.14.某校学⽣会由⾼⼀年级5⼈,⾼⼆年级6⼈,⾼三年级4⼈组成.(1)选其中1⼈为学⽣会主席,有多少种不同的选法?(2)若每年级选1⼈为校学⽣会常委,有多少种不同的选法?(3)若要选出不同年级的两⼈参加市⾥组织的活动,有多少种不同的选法?解:(1)56415N =++=种;(2)564120N =??=种;(3)56644574N =?+?+?=种15.已知集合{}321012()M P a b =---,,,,,,,是平⾯上的点,a b M ∈,.(1)()P a b ,可表⽰平⾯上多少个不同的点?(2)()P a b ,可表⽰多少个坐标轴上的点?解:(1)完成这件事分为两个步骤:a 的取法有6种,b 的取法也有6种,∴P 点个数为N =6×6=36(个);(2)根据分类加法计数原理,分为三类:①x 轴上(不含原点)有5个点;②y 轴上(不含原点)有5个点;③既在x 轴,⼜在y 轴上的点,即原点也适合,∴共有N =5+5+1=11(个).1. 1分类加法计数原理与分步乘法计数原理测试题⼀、选择题 1.从集合{ 0,1,2,3,4,5,6}中任取两个互不相等的数a ,b 组成复数a bi +,其中虚数有() A .30个 B .42个 C .36个 D .35个答案:C2.把10个苹果分成三堆,要求每堆⾄少1个,⾄多5个,则不同的分法共有() A .4种 B .5种 C .6种 D .7种答案:A3.如图,⽤4种不同的颜⾊涂⼊图中的矩形A ,B ,C ,D 中,要求相邻的矩形涂⾊不同,则不同的涂法有() A .72种 B .48种 C .24种 D .12种答案:A4.教学⼤楼共有五层,每层均有两个楼梯,由⼀层到五层的⾛法有() A .10种 B .52种C.25种D.42种答案:D5.已知集合{}{}023A B x x ab a b A ===∈,,,,,|,则B 的⼦集的个数是()A.4 B.8 C.16 D.15答案:C6.三边长均为正整数,且最⼤边长为11的三⾓形的个数为()A.25 B.26 C.36 D.37答案:C⼆、填空题7.平⾯内有7个点,其中有5个点在⼀条直线上,此外⽆三点共线,经过这7个点可连成不同直线的条数是.答案:128.圆周上有2n 个等分点(1n >),以其中三个点为顶点的直⾓三⾓形的个数为.答案:2(1)n n -9.电⼦计算机的输⼊纸带每排有8个穿孔位置,每个穿孔位置可穿孔或不穿孔,则每排可产⽣种不同的信息.答案:25610.椭圆221x y m n+=的焦点在y 轴上,且{}{}123451234567m n ∈∈,,,,,,,,,,,,则这样的椭圆的个数为.答案:20 11.已知集合{}123A ,,ü,且A 中⾄少有⼀个奇数,则满⾜条件的集合A 分别是.答案:{}{}{}{}{}13122313,,,,,,,12.整数630的正约数(包括1和630)共有个.答案:24三、解答题 13.⽤0,1,2,3,4,5六个数字组成⽆重复数字的四位数,⽐3410⼤的四位数有多少个?解:本题可以从⾼位到低位进⾏分类.(1)千位数字⽐3⼤.(2)千位数字为3:①百位数字⽐4⼤;②百位数字为4: 1°⼗位数字⽐1⼤;2°⼗位数字为1→个位数字⽐0⼤.所以⽐3410⼤的四位数共有2×5×4×3+4×3+2×3+2=140(个).14.有红、黄、蓝三种颜⾊旗⼦各(3)n n >⾯,任取其中三⾯,升上旗杆组成纵列信号,可以有多少种不同的信号?若所升旗⼦中不允许有三⾯相同颜⾊的旗⼦,可以有多少种不同的信号?若所升旗⼦颜⾊各不相同,有多少种不同的信号?解: 1N =3×3×3=27种; 227324N =-=种; 33216N =??= 种.15.某出版社的7名⼯⼈中,有3⼈只会排版,2⼈只会印刷,还有2⼈既会排版⼜会印刷,现从7⼈中安排2⼈排版,2⼈印刷,有⼏种不同的安排⽅法.解:⾸先分类的标准要正确,可以选择“只会排版”、“只会印刷”、“既会排版⼜会印刷”中的⼀个作为分类的标准.下⾯选择“既会排版⼜会印刷”作为分类的标准,按照被选出的⼈数,可将问题分为三类:第⼀类:2⼈全不被选出,即从只会排版的3⼈中选2⼈,有3种选法;只会印刷的2⼈全被选出,有1种选法,由分步计数原理知共有3×1=3种选法.第⼆类:2⼈中被选出⼀⼈,有2种选法.若此⼈去排版,则再从会排版的3⼈中选1⼈,有3种选法,只会印刷的2⼈全被选出,有1种选法,由分步计数原理知共有2×3×1=6种选法;若此⼈去印刷,则再从会印刷的2⼈中选1⼈,有2种选法,从会排版的3⼈中选2⼈,有3种选法,由分步计数原理知共有2×3×2=12种选法;再由分类计数原理知共有6+12=18种选法.第三类:2⼈全被选出,同理共有16种选法.所以共有3+18+16=37种选法.1. 1 分类加法计数原理与分步乘法计数原理综合卷⼀.选择题:1.⼀个三层书架,分别放置语⽂书12本,数学书14本,英语书11本,从中取出⼀本,则不同的取法共有()(A ) 37种(B ) 1848种(C ) 3种(D ) 6种2.⼀个三层书架,分别放置语⽂书12本,数学书14本,英语书11本,从中取出语⽂、数学、英语各⼀本,则不同的取法共有()(A ) 37种(B ) 1848种(C ) 3种(D ) 6种3.某商业⼤厦有东南西3个⼤门,楼内东西两侧各有2个楼梯,从楼外到⼆楼的不同⾛法种数是()(A ) 5 (B )7 (C )10 (D )124.⽤1、2、3、4四个数字可以排成不含重复数字的四位数有()(A )265个(B )232个(C )128个(D )24个5.⽤1、2、3、4四个数字可排成必须含有重复数字的四位数有()(A )265个(B )232个(C )128个(D )24个6.3科⽼师都布置了作业,在同⼀时刻4名学⽣都做作业的可能情况有()(A )43种(B )34种(C )4×3×2种(D ) 1×2×3种7.把4张同样的参观券分给5个代表,每⼈最多分⼀张,参观券全部分完,则不同的分法共有()(A )120种(B )1024种(C )625种(D )5种8.已知集合M={l ,-2,3},N={-4,5,6,7},从两个集合中各取⼀个元素作为点的坐标,则这样的坐标在直⾓坐标系中可表⽰第⼀、⼆象限内不同的点的个数是()(A )18 (B )17 (C )16 (D )109.三边长均为整数,且最⼤边为11的三⾓形的个数为()(A )25 (B )36 (C )26 (D )3710.如图,某城市中,M 、N 两地有整齐的道路⽹,若规定只能向东或向北两个⽅向沿途中路线前进,则从M 到N 不同的⾛法共有()(A )25 (B )15 (C)13 (D )10 ⼆.填空题:11.某书店有不同年级的语⽂、数学、英语练习册各10本,买其中⼀种有种⽅法;买其中两种有种⽅法.12.⼤⼩不等的两个正⽅形玩具,分别在各⾯上标有数字1,2,3,4,5,6,则向上的⾯标着的两个数字之积不少于20的情形有种.13.从1,2,3,4,7,9中任取不相同的两个数,分别作为对数的底数和真数,可得到个不同的对数值.14.在连结正⼋边形的三个顶点组成的三⾓形中,与正⼋边形有公共边的有个.15.某班宣传⼩组要出⼀期向英雄学习的专刊,现有红、黄、⽩、绿、蓝五种颜⾊的粉笔供选⽤,要求在⿊板中A 、B 、C 、D 每⼀部分只写⼀种颜⾊,如图所⽰,相邻两块颜⾊不同,则不同颜⾊的书写⽅法共有种.三.解答题:16.现由某校⾼⼀年级四个班学⽣34⼈,其中⼀、⼆、三、四班分别为7⼈、8⼈、9⼈、10⼈,他们⾃愿组成数学课外⼩组.(1)选其中⼀⼈为负责⼈,有多少种不同的选法?(2)每班选⼀名组长,有多少种不同的选法?(3)推选⼆⼈做中⼼发⾔,这⼆⼈需来⾃不同的班级,有多少种不同的选法?17.4名同学分别报名参加⾜球队,蓝球队、乒乓球队,每⼈限报其中⼀个运动队,不同的报名⽅法有⼏种?[探究与提⾼]1.甲、⼄两个正整数的最⼤公约数为60,求甲、⼄两数的公约数共有多个?2.从{-3,-2,-1,0,l,2,3}中,任取3个不同的数作为抛物线⽅程y=ax2+bx+c(a≠0)的系数,如果抛物线过原点,且顶点在第⼀象限,这样的抛物线共有多少条?3.电视台在“欢乐今宵”节⽬中拿出两个信箱,其中存放着先后两次竞猜中成绩优秀的群众来信,甲信箱中有30封,⼄信箱中有20封.现由主持⼈抽奖确定幸运观众,若先确定⼀名幸运之星,再从两信箱中各确定⼀名幸运伙伴,有多少种不同的结果?综合卷1.A 2.B 3.D 4.D 5.B 6.B 7.D 8.B 9.B 10.B11.30;300 12.513.17 14.40 15.1801. 2排列与组合1、排列综合卷1.90×9l ×92×……×100=()(A )10100A (B )11100A (C )12100A (D )11101A 2.下列各式中与排列数mn A 相等的是()(A )!(1)!-+n n m (B )n(n -1)(n -2)……(n -m) (C )11m n nA n m --+ (D )111m n n A A --3.若 n ∈N 且 n<20,则(27-n )(28-n)……(34-n)等于()(A )827n A - (B )2734nn A -- (C )734n A - (D )834n A -4.若S=123100123100A A A A ++++,则S 的个位数字是()(A )0 (B )3 (C )5 (D )85.⽤1,2,3,4,5这五个数字组成没有重复数字的三位数,其中偶数共有()(A )24个(B )30个(C )40个(D )60个6.从0,l ,3,5,7,9中任取两个数做除法,可得到不同的商共有()(A )20个(B )19个(C )25个(D )30个7.甲、⼄、丙、丁四种不同的种⼦,在三块不同⼟地上试种,其中种⼦甲必须试种,那么不同的试种⽅法共有()(A )12种(B )18种(C )24种(D )96种8.某天上午要排语⽂、数学、体育、计算机四节课,其中体育不排在第⼀节,那么这天上午课程表的不同排法共有()(A )6种(B )9种(C )18种(D )24种9.有四位司机、四个售票员组成四个⼩组,每组有⼀位司机和⼀位售票员,则不同的分组⽅案共有()(A )88A 种(B )48A 种(C )44A ·44A 种(D )44A 种10.有4位学⽣和3位⽼师站在⼀排拍照,任何两位⽼师不站在⼀起的不同排法共有()(A )(4!)2种(B )4!·3!种(C )34A ·4!种(D )3 5A ·4!种11.把5件不同的商品在货架上排成⼀排,其中a ,b 两种必须排在⼀起,⽽c ,d 两种不能排在⼀起,则不同排法共有()(A )12种(B )20种(C )24种(D )48种⼆.填空题::12.6个⼈站⼀排,甲不在排头,共有种不同排法.13.6个⼈站⼀排,甲不在排头,⼄不在排尾,共有种不同排法.14.五男⼆⼥排成⼀排,若男⽣甲必须排在排头或排尾,⼆⼥必须排在⼀起,不同的排法共有种.15.将红、黄、蓝、⽩、⿊5种颜⾊的⼩球,分别放⼊红、黄、蓝、⽩、⿊5种颜⾊的⼝袋中,但红⼝袋不能装⼊红球,则有种不同的放法.16.(1)有5本不同的书,从中选3本送给3名同学,每⼈各⼀本,共有种不同的送法;(2)有5种不同的书,要买3本送给3名同学,每⼈各⼀本,共有种不同的送法.三、解答题:17.⼀场晚会有5个唱歌节⽬和3个舞蹈节⽬,要求排出⼀个节⽬单(1)前4个节⽬中要有舞蹈,有多少种排法?(2)3个舞蹈节⽬要排在⼀起,有多少种排法?(3)3个舞蹈节⽬彼此要隔开,有多少种排法?18.三个⼥⽣和五个男⽣排成⼀排.(1)如果⼥⽣必须全排在⼀起,有多少种不同的排法?(2)如果⼥⽣必须全分开,有多少种不同的排法?(3)如果两端都不能排⼥⽣,有多少种不同的排法?(4)如果两端不能都排⼥⽣,有多少种不同的排法?(5)如果三个⼥⽣站在前排,五个男⽣站在后排,有多少种不同的排法?综合卷1.B 2.D 3.D 4.C 5.A 6.B 7.B 8.C 9.D 10.D 11.C12.600 13.504 14.480 15.9616.(1) 60;(2) 12517.(1) 37440;(2) 4320;(3) 1440018.(1) 4320;(2) 14400;(3) 14400;(4) 36000;(5) 7202、组合综合卷⼀、选择题:1.下列等式不正确的是()(A )!!()!mn n C m n m =- (B )11mm n n m C C n m++=- (C )1111m m n n m C C n +++=+ (D )11m m n n C C ++= 2.下列等式不正确的是()(A )m n m n n C C -= (B )11m m mm m m C C C -++=(C )123455555552C C C C C ++++= (D )11 111m m m m n n n n C C C C --+--=++3.⽅程2551616x x x C C --=的解共有()(A )1个(B )2个(C )3个(D )4个4.若372345n n n C A ---=,则n 的值是()(A )11 (B )12 (C )13 (D )145.已知7781n n n C C C +-=,那么n 的值是()(A )12 (B )13 (C )14 (D )15 6.从5名男⽣中挑选3⼈,4名⼥⽣中挑选2⼈,组成⼀个⼩组,不同的挑选⽅法共有()(A )3254C C 种(B ) 3254C C 55A 种(C ) 3254A A 种(D ) 3254A A 55A 种7.从4个男⽣,3个⼥⽣中挑选4⼈参加智⼒竞赛,要求⾄少有⼀个⼥⽣参加的选法共有()(A )12种(B )34种(C )35种(D )340种8.平⾯上有7个点,除某三点在⼀直线上外,再⽆其它三点共线,若过其中两点作⼀直线,则可作成不同的直线()(A )18条(B )19条(C )20条(D )21条9.在9件产品中,有⼀级品4件,⼆级品3件,三级品2件,现抽取4个检查,⾄少有两件⼀级品的抽法共有()(A )60种(B )81种(C )100种(D )126种10.某电⼦元件电路有⼀个由三节电阻串联组成的回路,共有6个焊点,若其中某⼀焊点脱落,电路就不通.现今回路不通,焊点脱落情况的可能有()(A )5种(B )6种(C )63种(D )64种⼆.填空题:11.若11m m n n C xC --=,则x= .12.三名教师教六个班的课,每⼈教两个班,分配⽅案共有种。
高中数学 第三章 统计案例综合训练学案 新人教A版选修2-3-新人教A版高二选修2-3数学学案
第三章统计案例(综合训练1)一、学习要求1.通过典型案例的探究,了解统计学中对两个变量统计分析的思想方法和步骤;2.能综合运用概率、统计的知识解决有关问题。
二、问题探究■合作探究例1.【10新课标(文19)】为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男女需要40 30不需要160 270(1)估计该地区老年人中,需要志愿者提供帮助的老年人比例;(2)能否有的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.附:0.050 0.010 0.0013.841 6.635 10.828。
【解析】(1)样本中,该地区的老年人需要志愿者提供帮助的有:403070+=(人),∴估计该地区老年人中,需要志愿者提供帮助的老年人比例为:707 50050=。
(2)根据表中数据,得到:,∵,∴有的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关。
(3)根据(2)的结论可知,地区的老年人是否需要志愿者提供帮助与性别有关,所以可按性别进行分层抽样调查,从而能更好地估计该地区的老年人中需要志愿者提供帮助的老年人的比例。
■自主探究1.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查,得到了如下的列联表:喜爱打篮球不喜爱打篮球合计男生 5女生10合计50已知在全部50人中随机抽取1人,抽到喜爱打篮球的学生的概率为。
(Ⅰ)补充完整上面的列联表,并判断是否有的把握认为喜爱打篮球与性别有关?(Ⅱ)若采用分层抽样的方法从喜爱打篮球的学生中随机抽取3人,则男生和女生抽取的人数分别是多少?解:(Ⅰ)这50人中喜爱打篮球的人数为:(人)。
列联表补充如下:喜爱打篮球不喜爱打篮球合计男生20 5 25女生10 15 25合计30 20 50,∵,∴有的把握认为喜爱打篮球与性别有关。
数学教案 人教a版选修2_3 同步练习-第3章统计案例跟踪训练含解析
回归分析的基本思想及其初步应用[A 组 学业达标]1.下列两个变量之间的关系不是函数关系的是( ) A .角度和它的余弦值 B .正方形的边长和面积 C .正n 边形的边数和内角度数和 D .人的年龄和身高解析:函数关系就是一种变量之间的确定性的关系.A ,B ,C 三项中的两个变量之间都是函数关系,可以写出相应的函数表达式,分别为f(θ)=cos θ,g(a)=a 2,h(n)=nπ-2π.D 选项中的两个变量之间不是函数关系,对于年龄确定的人群,仍可以有不同的身高.故选D.答案:D2.设一个线性回归方程为y ^=2-1.5x ,则变量x 增加一个单位时( ) A.y ^平均增加1.5个单位 B.y ^平均增加2个单位 C.y ^平均减少1.5个单位 D.y ^平均减少2个单位解析:由线性回归方程y ^=2-1.5x 中x 的系数为-1.5,知C 项正确. 答案:C 3.有下列数据:x 1 2 3 y35.9912.01A .y =3×2x -1B .y =log 2xC .y =3xD .y =x 2解析:当x =1,2,3时,分别代入求y 值,离y 最近的值模拟效果最好,可知A 模拟效果最好. 答案:A4.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=-2.756x +7.325.②y 与x 负相关且y ^=3.476x +5.648 ③y 与x 正相关且y ^=-1.226x -6.578 ④y 与x 正相关且y ^=8.967x +8.163 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④D .①④解析:根据题意,依次分析4个结论:对于①,y 与x 负相关且y ^=-2.756x +7.325,此结论正确,线性回归方程符合负相关的特征; 对于②,y 与x 负相关且y ^=3.476x +5.648,此结论错误,由线性回归方程知,此两变量的关系是正相关;对于③,y 与x 正相关且y ^=-1.226x -6.578,此结论错误,由线性回归方程知,此两变量的关系是负相关;对于④,y 与x 正相关且y ^=8.967x +8.163,此结论正确,线性回归方程符合正相关的特征;故②③一定错误.答案:B5.对具有线性相关关系的变量x ,y ,测得一组数据如下表:x 2 4 5 6 8 y2040607080根据上表,利用最小二乘法得它们的回归直线方程为y ^=10.5x +a ^,据此模型来预测当x =20时,y 的估计值为________.解析:由已知得x -=5,y -=54,则(5,54)满足回归直线方程y ^=10.5x +a ^,解得a ^=1.5,因此y ^=10.5x +1.5,当x =20时y ^=10.5×20+1.5=211.5.答案:211.56.如图是x 和y 的一组样本数据的散点图,去掉一组数据________后,剩下的4组数据的相关指数最大.解析:去掉D(3,10)这一组数据后,其他4组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强,此时相关指数最大.答案:D(3,10)7.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y =ebx +a的周围,令z =ln y ,求得回归直线方程为z ^=0.25x -2.58,则该模型的回归方程为____________________.解析:由z =ln y ,z ^=0.25x -2.58, 得ln y ^=0.25x -2.58,∴y ^=e 0.25x -2.58. 故该模型的回归方程为y ^=e 0.25x -2.58. 答案:y ^=e 0.25x -2.588.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,求社区一户年收入为15万元的家庭的年支出.解析:由题意可得x -=15×(8.2+8.6+10.0+11.3+11.9)=10,y -=15×(6.2+7.5+8.0+8.5+9.8)=8,可得a ^=8-0.76×10=0.4. ∴回归直线方程为y ^=0.76x +0.4.把x =15代入可得y ^=0.76×15+0.4=11.8.故社区一户年收入为15万元的家庭的年支出为11.8万元.9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求线性回归方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解析:(1)x -=8+8.2+8.4+8.6+8.8+96=8.5,y -=16(90+84+83+80+75+68)=80,∵b ^=-20,a ^=y --b ^ x -, ∴a ^=80+20×8.5=250, ∴线性回归方程y ^=-20x +250;(2)设工厂获得的利润为L 元,则L =x(-20x +250)-4(-20x +250)=-20⎝⎛⎭⎪⎫x -3342+361.25,∴该产品的单价应定为8.25元,工厂获得的利润最大.[B 组 能力提升]10.对于给定的样本点所建立的模型A 和模型B ,它们的残差平方和分别是a 1,a 2,R 2的值分别为b 1,b 2,下列说法正确的是( )A .若a 1<a 2,则b 1<b 2,A 的拟合效果更好B .若a 1<a 2,则b 1<b 2,B 的拟合效果更好C .若a 1<a 2,则b 1>b 2,A 的拟合效果更好D .若a 1<a 2,则b 1>b 2,B 的拟合效果更好解析:由残差平方和以及R 2的定义式可得若a 1<a 2,则b 1>b 2,A 的拟合效果更好. 答案:C11.近10年来,某市社会商品零售总额与职工工资总额(单位:亿元)数据如下:A.y ^=2.799 1x -27.248 552 B.y ^=2.799 1x -23.548 452 C.y ^=2.699 2x -23.749 352 D.y ^=2.899 2x -23.749 452解析:x -=41.72,y -=93.23,代入验证可知B 选项正确. 答案:B12.已知方程y ^=0.85x -82.71是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,y ^的单位是kg ,那么针对某个体(160,53)的残差是________.解析:将x =160代入y ^=0.85x -82.71,得y ^=0.85×160-82.71=53.29, 所以残差e ^=y -y ^=53-53.29=-0.29.答案:-0.2913.已知一个线性回归方程为y ^=1.5x +45,x ∈{1,5,7,13,19},则y -=________. 解析:∵x -=1+5+7+13+195=9,且y ^=1.5x +45, ∴y -=1.5×9+45=58.5. 答案:58.514.假设关于某种设备的使用年限x(年)与所支出的维修费用y(万元)有如表统计资料:x 2 3 4 5 6 y2.23.85.56.57.0已知∑i =15x 2i=90,∑i =15x i y i =112.3.b ^=∑i =1nx i -x-y i -y-∑i =1nx i -x-2=∑i =1nx i y i -n x - y-∑i =1nx 2i -n x -2,a =y --b ^ x -. (1)求x -,y -.(2)x 与y 具有线性相关关系,求出线性回归方程. (3)估计使用年限为10年时,维修费用约是多少? 解析:(1)x -=4,y -=5.(2)b ^=∑i =15x i y i -5x - y-∑i =15x 2i -5x -2=1.23,a ^=y --b ^ x -=5-1.23×4=0.08.所以线性回归方程为y ^=1.23x +0.08.(3)当x =10时,y ^=1.23×10+0.08=12.38(万元), 即估计使用年限为10年时,维修费用约为12.38万元.15.菜农定期使用低害杀虫农药对蔬菜进行喷洒,以防止害虫的危害,但采集上市时蔬菜仍存有少量的残留农药,食用时需要用清水清洗干净,下表是用清水x(单位:千克)清洗该蔬菜1千克后,蔬菜上残留的农药y(单位:微克)的统计表:x1 2 3 4 5y 58 54 39 29 10(1)令w =x 2,利用给出的参考数据求出y 关于w 的回归方程y ^=b ^w +a ^.(a ^,b ^精确到0.1)参考数据:∑i =15w i =55,∑i =15(w i -w -)(y i -y -)=-751,∑i =15(w i -w -)2=374,其中w i =x 2i ,w -=15∑i =15w i .(2)对于某种残留在蔬菜上的农药,当它的残留量不高于20微克时对人体无害,为了放心食用该蔬菜,请估计至少需要用多少千克的清水清洗1千克蔬菜?(精确到0.1,参考数据5≈2.24)附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v ^=α^+β^u 的斜率和截距的最小二乘估计分别为β^=∑i =1nu i -u-v i -v-∑i =1nu i -u-2,α^=v --β^ u -.解析:(1)由题意得,w -=11,y -=38.b ^=∑i =15w i -w-y i -y-∑i =15w i -w-2=-751374≈-2.0,a ^=y --b ^w =60.0,所以y ^=-2.0w +60.0. (2)由(1)得,y ^=-2.0w +60.0, 所以y ^=-2.0x 2+60.0,当y ^≤20时,即-2.0x 2+60.0≤20,解得x≥25≈4.5,所以为了放心食用该蔬菜,估计需要用4.5千克的清水清洗1千克蔬菜.独立性检验的基本思想及其初步应用[A组学业达标]1.在某次飞行航程中遭遇恶劣气候,55名男乘客中有24名晕机,34名女乘客中有8名晕机,在检验这些乘客晕机是否与性别有关时,采用的数据分析方法应是( )A.频率分布直方图B.回归分析C.独立性检验D.用样本估计总体解析:根据题意,结合题目中的数据,列出2×2列联表,求出K2观测值,对照数表可得出概率结论,这种分析数据的方法是独立性检验.答案:C2.观察下列各图,其中两个分类变量x,y之间关系最强的是( )解析:观察等高条形图发现x1x1+y1和x2x2+y2相差越大,就判断两个分类变量之间关系越强.答案:D3.如表是一个2×2列联表:则表中a,b的值分别为( )y1y2总计x1 a 21 73x222 25 47总计 b 46 120A.94,72C.52,74 D.74,52解析:a=73-21=52,b=a+22=74,故选C.答案:C4.利用独立性检验来考虑两个分类变量X与Y是否有关系时,通过查阅下表来确定“X和Y有关系”的可信度.如果K2的观测值k>5.024,那么在犯错误的概率不超过________的前提下认为“X与Y有关系”()P(K2≥k 0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001k 0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.87910.828A.0.25 B .0.05 C .0.1D .0.025解析:因为K 2的观测值k >5.024,而在临界值表中对应于5.024的是0.025,所以可以在犯错误的概率不超过0.025的前提下认为“X 和Y 有关系”.答案:D5.分类变量X 和Y 的列表如下,则下列说法判断正确的是( )y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计a +cb +da +b +c +dA.ad -bc 越小,说明X 与Y 的关系越弱 B .ad -bc 越大,说明X 与Y 的关系越强 C .(ad -bc)2越大,说明X 与Y 的关系越强 D .(ad -bc)2越接近于0,说明X 与Y 的关系越强解析:列联表可以较为准确地判断两个变量之间的相关关系程度, 由K 2=a +b +c +dad -bc2a +b a +cb +dc +d,当(ad -bc)2越大,K 2越大,表明X 与Y 的关系越强.(ad -bc)2越接近0,说明两个分类变量X 和Y 无关的可能性越大. 即所给说法判断正确的是C. 答案:C6.某部门通过随机调查89名工作人员的休闲方式,了解读书和健身的人数,得到的数据如表:读书 健身 总计 女 24 31 55 男 8 26 34 总计325789在犯错误的概率不超过________的前提下认为性别与休闲方式有关系. 解析:由列联表中的数据,得K 2的观测值为k =89×24×26-31×8255×34×32×57≈3.689>2.706,因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系.答案:0.107.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射后14天的结果如下表所示:死亡 存活 总计 第一种剂量 14 11 25 第二种剂量 6 19 25 总计203050进行统计分析的统计假设是________,K 2=________,说明两种电离辐射剂量对小白鼠的致死作用________.(填“相同”或“不相同”)参考公式:K 2=n ad -bc2a +bc +d a +cb +d解析:统计假设是“小白鼠的死亡与使用的电离辐射剂量无关”,由列联表中数据得K 2=5.33>3.841,所以在犯错误的概率不超过0.05的前提下认为小白鼠的死亡与使用的电离辐射剂量有关.所以两种电离辐射剂量对小白鼠的致死作用不相同.答案:小白鼠的死亡与使用的电离辐射剂量无关 5.33 不相同 8.下表是关于男婴与女婴出生时间调查的列联表:晚上 白天 总计 男婴 45 A B 女婴 E 35 C 总计98D180那么,A =________,B =E =________. 解析:由列联表知识得⎩⎪⎨⎪⎧ 45+E =98,98+D =180,A +35=D ,E +35=C ,B +C =180,解得⎩⎪⎨⎪⎧A =47,B =92,C =88,D =82,E =53.答案:47 92 88 82 539.网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.利用图形判断学生经常上网与学习成绩有关吗?解析:根据题目所给的数据得到如下2×2列联表:经常上网 不经常上网总计 不及格80120200及格 120 680 800 总计2008001 000得出等高条形图如图所示:比较图中阴影部分的高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此可以认为经常上网与学习成绩有关.10.随着生活水平的提高,人们的休闲方式也发生了变化.某机构随机调查了n 个人,其中男性占调查人数的25.已知男性中有一半的人的休闲方式是运动,而女性中只有13的人的休闲方式是运动.(1)完成下列2×2列联表:运动 非运动总计 男性 女性 总计n(2)数至少有多少?(3)根据(2)的结论,本次被调查的人中,至少有多少人的休闲方式是运动? 解析:(1)补全2×2列联表如下:运动 非运动 总计 男性 15n 15n 25n 女性 15n 25n 35n 总计25n 35n n(2)则P(K 2≥k 0)=3.841. 由于K 2的观测值k =n ⎝ ⎛⎭⎪⎫n 5·2n 5-n 5·n 522n 5·3n 5·2n 5·3n 5=n 36,故n36≥3.841,即n≥138.276. 又由15n ∈Z ,故n≥140.故若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,那么本次被调查的至少有140人.(3)根据(2)的结论,本次被调查的人中,至少有25×140=56(人)的休闲方式是运动.[B 组 能力提升]11.某卫生机构对366人进行健康体检,其中某项检测指标阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,故在犯错误的概率不超过________的前提下认为糖尿病患者与遗传有关系.( )A .0.001B .0.005C .0.01D .0.025解析:可以先作出如下列联表(单位:人): 糖尿病患者与遗传列联表糖尿病发病糖尿病不发病总计 阳性家族史 16 93 109 阴性家族史17 240 257 总计33333366根据列联表中的数据,得到K 2的观测值为 k =366×16×240-17×932109×257×33×333≈6.067>5.024.故在犯错误的概率不超过0.025的前提下认为糖尿病患者与遗传有关系. 答案:D12.在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是________(填序号). ①若K 2的观测值k =6.635,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;②由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;③由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.解析:K 2的观测值是支持确定有多大把握认为“两个分类变量吃零食与性别有关系”的随机变量值,所以由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填③.答案:③13.根据下表计算:不看电视 看电视 男 37 85 女35143K 2的观测值k≈________(保留3位小数). 解析:k =300×37×143-85×352122×178×72×228≈4.514.答案:4.51414.某学校为了解该校高三年级学生在市一练考试的数学成绩情况,随机从该校高三文科与理科各抽取50名学生的数学成绩,作出频率分布直方图如图,规定考试成绩在[120,150]内为优秀.(1)由以上频率分布直方图填写下列2×2列联表.若按是否优秀来判断,是否有99%的把握认为该校的文理科数学成绩有差异.文科 理科 总计 优秀 非优秀 总计5050100(2)某高校派出2140分以上的学生进行自主招生面试,每位教授至少面试一人,每位学生只能被一位教授面试.若甲教授面试的学生人数为ξ,求ξ的分布列和均值.解析:(1)由频率分布直方图知,该校文科学生中数学成绩优秀的人数为(0.010+0.004+0.002)×10×50=8,故非优秀人数为50-8=42.该校理科学生中数学成绩优秀的人数为(0.020+0.014+0.006)×10×50=20,故非优秀人数为50-20=30.则2×2列联表如下:文科 理科 总计 优秀 8 20 28 非优秀 42 30 72 总计5050100∴K 2的观测值k =100×8×30-42×20250×50×28×72≈7.143>6.635,故有99%的把握认为该校文理科数学成绩有差异.(2)由(1)知,该校随机抽取的学生成绩中一练数学成绩在140分以上的学生为4人,ξ的可能取值为1,2,3.将4人分给两名教授每名教授至少1名学生的不同分法种数为⎝⎛⎭⎪⎫C 34+C 24C 22A 22A 22=14,则P(ξ=1)=C 1414=27,P(ξ=2)=C 2414=37,P(ξ=3)=C 3414=27.∴ξ的分布列为:ξ 1 2 3 P273727∴E(ξ)=1×27+2×37+3×27=2.15.某校为了了解学生对消防知识的了解情况,从高一年级和高二年级各选取100名同学进行消防知识竞赛.图(1)和图(2)分别是对高一年级和高二年级参加竞赛的学生成绩按[40,50),[50,60),[60,70),[70,80]分组,得到的频率分布直方图.(1)请计算高一年级和高二年级成绩小于60分的人数.(2)完成2×2列联表,并回答:在犯错误的概率不超过多少的前提下认为“学生所在的年级与消防常识的了解存在相关性”?成绩小于60分人数成绩不小于60分人数总计高一 高二 总计附:临界值表及参考公式: K 2=n ad -bc 2a +bc +d a +cb +d ,n =a +b +c +d. P(K 2≥k 0)0.15 0.100.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828解析:(1)高一年级成绩低于60分的人数为:(0.03+0.04)×10×100=70; 高二年级成绩低于60分的人数为: (0.035+0.015)×10×100=50. (2)2×2列联表如下:成绩小于60分人数成绩不小于60分人数总计 高一 70 30 100 高二 50 50 100 总计12080200由于K 2的观测值k =200×50×70-50×302100×100×120×80≈8.333>7.879,所以在犯错误的概率不超过0.005的前提下认为“学生所在的年级与消防知识的了解存在相关性”.。
人教版数学高二A版选修2-3单元检测第三章统计案例(附答案)
数学人教版A2-3第三章 统计案例单元检测(时间:45分钟,满分:100分)一、选择题(每小题6分,共48分)1( ).A .一次函数模型B .二次函数模型C .指数函数模型D .对数函数模型2.工人月工资y (元)随劳动生产率x (千元)变化的回归方程为ˆy=50+80x .下列判断错误的是( ).A .劳动生产率为1 000元时,工资约为130元B .劳动生产率提高1 000元时,工资提高130元C .劳动生产率提高1 000元时,工资提高80元D .当月工资约为210元时,劳动生产率为2 000元3.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为ˆy=0.66x +1.562.若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为( ).A .83%B .72%C .67%D .66%4.若两个变量的残差平方和是325,21()nii x y =-∑=923,则随机误差对预报变量的贡献率约为( ). A .64.8% B .60% C .35.2% D .40% 5.下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适; ②用相关指数可以刻画回归的效果,值越小说明模型的拟合效果越好; ③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型拟合效果越好.其中说法正确的是( ). A .①② B .②③ C .①③ D .①②③6.(创新题)独立检验中,假设H 0:变量X 与变量Y 没有关系,则在H 0成立的情况下,P (K 2≥6.635)=0.010表示的意义是( ). A .变量X 与变量Y 有关系的概率为1%B .变量X 与变量Y 没有关系的概率为99.9%C .变量X 与变量Y 没有关系的概率为99%D .变量X 与变量Y 有关系的概率为99%7( ).A.K2=9.564 B.K2=3.564 C.K2<2.706 D.K2>3.841 8.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是().A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关二、填空题(每小题6分,共18分)9.(创新题)已知回归直线ˆy=bx+a斜率的估计值是52,且样本点的中心为(4,5).则当x=-2时,ˆy的值为______.10.若一组观测值(x1,y1),(x2,y2),…,(x n,y n)之间满足y i=bx i+a+e i(i=1,2,…,n),若e i恒为0,则R2为________.11.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的试根据上述数据计算K2=______,比较这两种手术对病人又发作心脏病的影响有没有差别______.三、解答题(共34分)12.(10分)某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm和182 cm.因儿子的身高与父亲的身高有关,求该老师用线性回归分析的方法预测他孙子的身高为多少.13.(12分)为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2)表2:注射药物B后皮肤疱疹面积的频数分布表完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与14.(12分)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了(1)建立零件数为解释变量,加工时间为预报变量的回归模型,并计算残差;(2)你能残差分析这个模型能较好地刻画零件数和加工时间的关系吗?参考答案1答案:A解析:画出散点图可观察得点都在一条直线上,故A正确.2答案:B解析:当x=1(千元)时,ˆy=130元,A正确;当ˆy=210元时,x=2105080-=2千元,D正确;当x增加一个单位时,ˆy增加80,C正确.3答案:A解析:因为当ˆy=7.675时,x=7.675 1.5620.66-≈9.262,所以7.6759.262≈0.829≈83%.4答案:C解析:由题意可知随机误差对预报变量的贡献率约为325923=0.352.5答案:C解析:相关指数R2越大,说明模型拟合效果越好,故②错误.6答案:D解析:由题意知变量X与Y没有关系的概率为0.01,即认为变量X与Y有关系的概率为99%.7答案:D解析:由K2=2()()()()()n ad bca b c d a c b d-++++,得K2的观测值k=285(4012528)68174540⨯⨯⨯⨯⨯⨯-≈4.722>3.841.8答案:D解析:根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.9答案:-10解析:由已知b=52且4b+a=5,∴a=-5,5ˆ2y x=-5.∴x=-2时,y=-10.10答案:1解析:e i恒为0,说明随机误差总为0,于是y i=ˆy,故R2=1.11答案:1.78不能作出这两种手术对病人又发作心脏病的影响有差别的结论解析:提出假设H0:两种手术对病人又发作心脏病的影响没有差别.根据列联表中的数据,可以求得K2的观测值k=2392(3916729157)68324196196⨯⨯⨯⨯⨯⨯-≈1.78.当H 0成立时,K 2≈1.78,而K 2<2.072的概率为0.85.所以,不能否定假设H 0.也就是不能作出这两种手术对病人又发作心脏病的影响有差别的结论.12解:由题意父亲身高x cm 与儿子身高y cm 对应关系如下表:则1731701763x ++==173,1701761823y ++==176, 31()()iii x x y y =--∑=(173-173)×(170-176)+(170-173)×(176-176)+(176-173)×(182-176)=18,321()ii x x =-∑=(173-173)2+(170-173)2+(176-173)2=18.∴18ˆ18b==1. ∴ˆˆay bx =-=176-173=3. ∴线性回归直线方程ˆˆˆybx a =+=x +3. ∴可估计孙子身高为182+3=185(cm).由列联表中的数据,得K 2的观测值为k =2200(70653530)10010010595⨯⨯⨯⨯⨯⨯-≈24.561>10.828.因此,有99.9%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.14解:(1)根据表中数据作出散点图,如图所示.间对零件数的线性回归方程为ˆy=0.668x+54.93.(2)以零件数为横坐标,残差为纵坐标作出残差图如图所示.由图可知,残差点分布较均匀,即用上述回归模型拟合数据效果很好.但需注意,由残差图也可以看出,第4个样本点和第5个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误.。
(必考题)高中数学高中数学选修2-3第三章《统计案例》测试(有答案解析)(3)
一、选择题1.某商场为了了解不同厂家生产的散装面包的月销售量y (千克)与售价x (元/千克)之间的关系,随机统计了某几个月的月销售量与当月各散装面包的售价,相关数据如下表:由表中数据算出线性回归方程为 3.1ˆˆyx a =-+,则样本在()18180,处的残差为( ) A .0B .1.4C .2D .2.12.下列说法中错误的是( )A .先把高二年级的2000名学生编号:1到2000,再从编号为1到50的学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +,……的学生,这种抽样方法是系统抽样法.B .一组数据的方差为2s ,平均数为x ,将这组数据的每一个数都乘以2,所得的一组新数据的方差和平均数为24s ,2x .C .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1.D .若一组数据1,a ,3的平均数是2,则该组数据的方差是23. 3.某学校课题组为了研究学生的数学成绩和物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(百分制)如下表所示:若数学成绩90分(含90分)以上为优秀,物理成绩85(含85分)以上为优秀,则有多少把握认为学生的数学成绩与物理成绩有关系( ) A .95%B .97.5%C .99.5%D .99.9%4.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%5.已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:根据上表可得回归方程y bx a =+,计算得7b =,则当投入10万元广告费时,销售额的预报值为 A .75万元 B .85万元 C .99万元D .105万元6.某种产品的广告费支出x 与销售额y (单位:万元)之间有下表关系:y 与x 的线性回归方程为 6.5175ˆ.y x =+,当广告支出5万元时,随机误差的效应(残差)为( ) A .40 B .20 C .30D .107.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -8.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3 000人,计算发现k 2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是( ) P (K 2≥k ) … 0.250.150.100.025 0.010 0.005 …k…1.323 2.072 2.706 5.024 6.635 7.879 …A .90%B .95%C .97.5%D .99.5%9.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: 月平均气温()xC17 1382月销售量y (件)2433 40 55由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .5810.若在区间[-5,5]内任取一个实数a ,则使直线x +y +a =0与圆(x -1)2+(y +2)2=2有公共点的概率为( ) A .25B .25C .35D .321011.已知,x y 的取值如下表:( )x1, 234若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-12.对两个变量x 和y 进行回归分析,得到一组样本数据: ()()1122,,,x y x y ,…(),n n x y ,则下列说法中不正确的是( )A .由样本数据得到的回归方程ˆˆˆy bx a =+必过样本中心(),x yB .残差平方和越小的模型,拟合的效果越好C .若变量y 和x 之间的相关系数为0.9362r =-,则变量y 和x 之间具有线性相关关系D .用相关指数2R 来刻画回归效果, 2R 越小,说明模型的拟合效果越好二、填空题13.针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的13,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.若有95%的把握认为是否喜欢韩剧和性别有关,求男生至少有______人.14.x ,y 的取值如下表:则x ,y 之间的关系可选用函数___进行拟合.15.某高校《统计初步》课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:男生1310女生720为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量K 2的观测值为.因为k >3.841,所以确认“主修统计专业与性别有关系”,这种判断出现错误的可能性为________.16.某班主任对全班50名学生作了一次调查,所得数据如表:认为作业多认为作业不多总计喜欢玩电脑游戏18927不喜欢玩电脑游戏81523总计262450由表中数据计算得到K 2的观测值k≈5.059,于是________(填“能”或“不能”)在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关. 17.以下四个命题,其中正确的序号是____________________.①从匀速传递的产品生产流水线上,每20分钟从中抽取一件产品进行检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程0.212ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 平均增加0.2个单位;④分类变量X 与Y ,它们的随机变量2K 的观测值为k ,当k 越小,“X 与Y 有关系”的把握程度越大.18.以下4个命题中,正确命题的序号为_________.①“两个分类变量的独立性检验”是指利用随机变量2K 来确定是否能以给定的把握认为“两个分类变量有关系”的统计方法; ②将参数方程cos sin x y θθ=⎧⎨=⎩(θ是参数,[]0,θπ∈)化为普通方程,即为221x y +=;③极坐标系中,22,3A π⎛⎫⎪⎝⎭与()3,0B ④推理:“因为所有边长相等的凸多边形都是正多边形,而菱形是所有边长都相等的凸多边形,所以菱形是正多边形”,推理错误在于“大前提”错误.19.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下联表:参考公式: ()()()()()22n ad bc K a b c d a c b d -=++++参照附表,在犯错误的概率最多不超过__________(填百分比)的前提下,可认为“该种疫苗由预防埃博拉病毒感染的效果”. 20.已知x 、y 之间的一组数据如下:则线性回归方程ˆya bx =+所表示的直线必经过点________. 三、解答题21.共享单车进驻城市,绿色出行引领时尚.某市2017年对共享单车的使用情况进行了调查,数据显示,该市共享单车用户年龄分布如图1所示,一周内市民使用单车的频率分布扇形图如图2所示.若将共享单车用户按照年龄分为“年轻人”(20岁~39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用共享单车用户”,使用次数为5次或不足5次的称为“不常使用共享单车用户”.已知在“经常使用共享单车用户”中有56是“年轻人”.(1)现对该市市民进行“经常使用共享单车与年龄关系”的分析,采用随机抽样的方法,抽取了一个容量为200的样本.请你根据题目中的数据,补全下列2×2列联表:年轻人非年轻人 合计 经常使用共享单车用户 120 不常使用共享单车用户80 合计16040200根据列联表独立性检验,判断有多大把握认为经常使用共享单车与年龄有关? 参考数据:20()P K k ≥ 0.150 0.100 0.050 0.025 0.0100k2.072 2.7063.841 5.024 6.635其中,22()()()()()n ad bc K a b c d a c b d -=++++,n a b c d =+++.(2)以频率为概率,用分层抽样的方法在(1)的200户用户中抽取一个容量为5的样本,从中任选3户,记经常使用共享单车的用户数为随机变量X ,求X 的分布列和数学期望.22.十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康,经过不懈的努力奋斗拼搏,新农村建设取得了巨大进步,农民年收入也逐年增加.为了实现2020年脱贫的工作计划,该地扶贫办随机收集了以下50位农民的统计数据,以此研究脱贫攻坚的效果是否与农民的受教育的发展状况有关:(1)根据列联表运用独立性检验的思想方法分析:能否有99%的把握认为“脱贫攻坚的效果与农民的受教育的发展状况有关”,并说明理由;(2)现用分层抽样的方法在全部受过教育的农民中随机抽取5位农民作为代表,再从这5位农民代表中任选2位继续调查,求这2位农民代表中至少有1位脱贫攻坚效果明显的概率.参考附表:参考公式:()()()()()22n ad bcKa b a c b d c d+=++++,其中n a b c d=+++.23.根据教育部《中小学生艺术素质测评办法》,为提高学生审美素养,提升学生的综合素质,江苏省中考将增加艺术素质测评的评价制度,将初中学生的艺术素养列入学业水平测试范围.为初步了解学生家长对艺术素质测评的了解程度,某校随机抽取100名学生家长参与问卷测试,并将问卷得分绘制频数分布表如下:了解”(得分低于60分)两类,完成22⨯列联表,并判断是否有99%的把握认为“学生家长对艺术素质评价的了解程度”与“性别”有关?(2)以这100名学生家长中“比较了解”的频率代替该校学生家长“比较了解”的概率.现在再随机抽取3名学生家长,设这3名家长中“比较了解”的人数为X ,求X 的概率分布列和数学期望.不太了解 比较了解 合计男性 女性 合计附:()()()()()22n ad bc a b c d a c b d χ-=++++,()n a b c d =+++.临界值表:()20P x χ≥0.15 0.100.050.025 0.010 0.005 0.001 0x2.0722.7063.8415.0246.6357.87910.82824.某私营业主为确定下一年度投入某种产品的宣传费,需了解月宣传费x (单位:百元)对月销售量y (单位:t )和月利润z (单位:百元)的影响,对8个月的宣传费i x 和销售量i y (i =1,2,...,8)数据作了初步处理,得到如图的散点图及一些统计量的值.x y w()821i i x x =-∑()821ii w w =-∑()()81iii x x y y =--∑ ()()81iii w w yy =--∑5.4 563 2.2 63.88 3.7 645.188 151.7(1)根据散点图判断出y =c +y 关于月宣传费x 的回归方程类型,求y 关于x的回归方程;(表中i w =(2)已知这种产品的每月利润z 与x 、y 的关系为2z y x =-,根据(1)的结果,当月宣传费用x =16时,求月利润的预报值.参考公式:1122211()()()()n ni iiii i nniii i x y nx y x x y y b xn x x x ====-⋅--==--∑∑∑∑, ˆˆa y bx=- 25.某企业是否支持进军新的区域市场,在全体员工中进行了抽样调查,调查结果如下表所示:(1)根据表中数据,问是否有99%的把握认为“新员工和老员工是否支持进军新的区域市场有差异”;(2)已知在被调查的新员工中有6名来自市场部,其中2名支持进军新的区域市场,现在从这6人中随机抽取3人,设其中支持进军新的区域市场人数为随机变量X ,求X 的分布列和数学期望.附:()22()()()()n ac bd K a b a c b d c d -=++++26.2016年欧洲杯将于2016年6月10日到7月10日在法国举行.为了使得赛会有序进行,欧足联在全球范围内选聘了30名志愿者(其中男性16名,女性14名).调查发现,男性中有10人会英语,女性中有6人会英语.(1)根据以上数据完成以下2×2列联表:并回答能否在犯错的概率不超过0.10的前提下认为性别与会英语有关?参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++参考数据:(2)会英语的6名女性志愿者中曾有4人在法国工作过,若从会英语的6名女性志愿者中随机抽取2人做导游,则抽出的2人都在法国工作过的概率是多少?【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据表中的数据求出(),x y ,利用回归直线方程经过样本中心点(),x y 求出ˆa ,把18x = 代入回归直线方程求出ˆy,利用残差的定义ˆy y -即可求解. 【详解】由表格得(),x y 为()24,160 ,又回归直线方程 3.1ˆˆyx a =-+经过样本中心点(),x y , 所以160 3.124ˆa=-⨯+,解得ˆ234.4a =, 所以回归直线方程为 3.123.4ˆ4yx =-+, 把18x = 代入回归直线方程可得,ˆ178.6y=, 故样本在()18180, 处的残差为180178.6 1.4-=.故选:B 【点睛】本题考查回归直线方程经过样本中心点和利用回归直线方程求某点处的残差;考查运算求解能力;熟练掌握回归直线方程经过样本中心点和残差的定义是求解本题的关键;属于中档题.2.C解析:C 【分析】根据题意,对选项中的命题进行分析,判断真假性即可. 【详解】对于A ,根据抽样方法特征是数据多,抽样间隔相等,是系统抽样,所以A 正确; 对于B ,一组数据的方差为2s ,平均数为x ,将这组数据的每一个数都乘以2,所得的一组新数据的方差和平均数为24s ,2x ,所以B 正确;对于C ,两个随机变量的线性相关性越强,则相关系数||r 的值越接近于1,所以C 错误;对于D ,一组数据1、a 、3的平均数是2,所以2a =;所以该组数据的方差是222212[(12)(22)(32)]33s =⨯-+-+-=,所以D 正确.故选:C . 【点睛】本题主要考查抽样和统计,考查方差和平均数的计算,考查两个随机变量的相关性,意在考查学生对这些知识的理解掌握水平3.C解析:C 【解析】分析:根据题意,列出22⨯列联表,求出观测值2K ,根据观测值对应的数值得出结论. 详解:根据题意,列出22⨯列联表,如下;则220(51212)8.80177.879671413K ⨯⨯-⨯==>⨯⨯⨯,因为观测值对应的数值为0.005,所以有99.5%的把握认为学生的数学成绩与物理成绩之间有关系.故选C.点睛:本题考查了独立性检验的应用,属于基础题.考查利用数学知识研究实际问题的能力以及相应的运算能力.4.A解析:A 【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)5.B解析:B 【解析】分析:根据表中数据求得样本中心(,)x y ,代入回归方程ˆ7ˆyx a =+后求得ˆa ,然后再求当10x =的函数值即可. 详解:由题意得11(24568)5,(3040506070)5055x y =++++==++++=, ∴样本中心为(5,50).∵回归直线ˆ7ˆyx a =+过样本中心(5,50), ∴ˆ5075a=⨯+,解得ˆ15a =, ∴回归直线方程为ˆ715yx =+. 当10x =时,710158ˆ5y=⨯+=, 故当投入10万元广告费时,销售额的预报值为85万元. 故选B .点睛:本题考查回归直线过样本中心这一结论和平均数的计算,考查学生的运算能力,属容易题.6.D解析:D 【解析】∵y 与x 的线性回归方程为 6.5175ˆ.y x =+ 当5x =时,ˆ50y=. 当广告支出5万元时,由表格得:60y =故随机误差的效应(残差)为605010.-= 故选D .7.D解析:D 【解析】由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.8.C解析:C 【详解】∵2 6.023 5.024K =>∴可断言市民收入增减与旅游欲望有关的把握为97.5%. 故选C.点睛:本题主要考查独立性检验的实际应用.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22()()()()()n ad bc K a b c d a c b d -=++++,计算出2K 的值;(3)查表比较2K 与临界值的大小关系,作统计判断.9.A解析:A 【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.10.B解析:B 【解析】∵直线0x y a ++=与圆()()22122x y -+=+有公共点,∴≤13a -≤≤,∴在区间[55]-,内任取一个实数a ,使直线0x y a ++=与圆()()22122x y -+=+有公共点的概率为312555+=+,故选B. 点睛:本题主要考查了几何概型的概率,以及直线与圆相交的性质,解题的关键弄清概率类型,同时考查了计算能力,属于基础题;利用圆心到直线的距离小于等于半径可得到直线与圆有公共点,可求出满足条件的a ,最后根据几何概型的概率公式可求出所求.11.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A. 点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 12.D解析:D 【解析】逐一分析所给的各个选项:A. 由样本数据得到的回归方程ˆˆˆy bx a =+必过样本中心(),x yB. 残差平方和越小的模型,拟合的效果越好C. 若变量y 和x 之间的相关系数为0.9362r =-,则变量y 和x 之间具有线性相关关系D. 用相关指数2R 来刻画回归效果,2R 越大,说明模型的拟合效果越好,该说法错误. 本题选择D 选项.二、填空题13.【分析】设男生人数为依题意填写列联表计算观测值列出不等式求出的取值范围再根据题意求出男生的人数【详解】设男生人数为由题意可得列联表如下: 喜欢韩剧 不喜欢韩剧 总计 男生 女生 总 解析:18【分析】设男生人数为x ,依题意填写列联表,计算观测值,列出不等式求出x 的取值范围,再根据题意求出男生的人数. 【详解】设男生人数为x ,由题意可得列联表如下:则 3.841k >,即2452()3636969 3.84171711931818x x x x x x k x x x x ⋅-⋅==>⋅⋅⋅, 解得12.697x >.因为各部分人数均为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有18人. 故答案为:18. 【点睛】本题考查独立性检验的应用,解题关键是列出列联表,然后进行计算,属于常考题.14.【分析】根据表格中的数据即可估测之间的关系可选用函数进行拟合得到答案【详解】根据表格中的数据可知当时;当时;当时;当时;当时可估测之间的关系可选用函数进行拟合【点睛】本题主要考查了函数的表示方法和指 解析:2x y =【分析】根据表格中的数据,即可估测,x y 之间的关系可选用函数2x y =进行拟合,得到答案. 【详解】根据表格中的数据,可知当2x =-时,0.260.25y =→;当1x =-时,0.510.5y =→;当0x =时, 1.11y =→;当0.5x =时, 1.41y =1x =时, 2.052y =→, 可估测,x y 之间的关系可选用函数2x y =进行拟合. 【点睛】本题主要考查了函数的表示方法和指数函数的性质的应用,其中熟记函数的表示方法和指数函数的性质,合理应用是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.15.5【解析】因为随机变量K2的观测值k >3841所以在犯错误的概率不超过005的前提下认为主修统计专业与性别有关系故这种判断出现错误的可能性为5考点:独立性检验思想【解析】因为随机变量K2的观测值k>3.841,所以在犯错误的概率不超过0.05的前提下认为“主修统计专业与性别有关系”.故这种判断出现错误的可能性为5%.考点:独立性检验思想.16.不能【解析】查表知若要在犯错误的概率不超过001的前提下认为喜欢玩电脑游戏与认为作业多有关则临界值k0=6635本题中k≈5059<6635所以不能在犯错误的概率不超过001的前提下认为喜欢玩电脑游解析:不能【解析】查表知若要在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关,则临界值k0=6.635.本题中,k≈5.059<6.635,所以不能在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.考点:独立性检验.17.②③【分析】利用系统抽样的定义判断①利用独立性检验判断④;利用相关系数的性质判断②;由回归方程的性质判断③【详解】①为系统抽样①不正确;④分类变量与它们的随机变量的观测值为当越小与有关系的把握程度越解析:②③【分析】利用系统抽样的定义判断①利用独立性检验判断④;利用相关系数的性质判断②;由回归方程的性质判断③.【详解】①为系统抽样, ①不正确;④分类变量X与Y,它们的随机变量2K的观测值为k,当k 越小,“X与Y有关系”的把握程度越小,④不正确;根据相关系数的性质可知②正确;由回归方程的性质可知③正确.故答案为②③.【点睛】本题通过对多个命题真假的判断,综合考查系统抽样、相关系数、回归方程、独立性检验,属于中档题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.18.①③④【解析】①是独立性检验的应用①对②中由于所以显然是半个圆②错③中由极坐标中两点距离公式=③对④中所有边长相等的凸多边形都是正多边形为大前提是错误的因为只需要正多边形挤压变形使之仍为凸多边形即可解析:①③④①是独立性检验的应用,①对.②中由于[]0,θπ∈,所以01y ≤≤,显然是半个圆,②错.③中,由极坐标中两点距离公式2221212212cos()AB ρρρρθθ=+--=14912()19,2+-⨯-=AB ③对.④中“所有边长相等的凸多边形都是正多边形”为大前提,是错误的,因为只需要正多边形挤压变形,使之仍为凸多边形即可.④对.所以填①③④.19.【详解】由题意可得参照附表可得:在犯错误的概率不超过的前提下认为小动物是否被感染与有没有服用疫苗有关故答案为【方法点睛】本题主要考查独立性检验的应用属于中档题独立性检验的一般步骤:(1)根据样本数据 解析:5%【详解】 由题意可得,()2210010302040 4.762 3.84150503070K ⨯⨯-⨯=≈>⨯⨯⨯,参照附表,可得:在犯错误的概率不超过005的前提下,认为“小动物是否被感染与有没有服用疫苗有关”,故答案为005. 【方法点睛】本题主要考查独立性检验的应用,属于中档题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3)查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)20.(155)【解析】由题意可得:线性回归方程过样本中心点即线性回归方程所表示的直线必经过点(155)点睛:(1)正确理解计算的公式和准确的计算是求线性回归方程的关键(2)回归直线方程必过样本点中心解析:(1.5,5) 【解析】由题意可得:0123 1.54x +++==,826454y +++==, 线性回归方程过样本中心点,即线性回归方程ˆya bx =+所表示的直线必经过点(1.5,5) 点睛:(1)正确理解计算,b a 的公式和准确的计算是求线性回归方程的关键. (2)回归直线方程y bx a =+必过样本点中心(),x y .三、解答题21.(1)列联表答案见解析,有85%以上的把握认为经常使用共享单车与年龄有关;(2)分布列答案见解析,数学期望:95. 【分析】(1)由由图2计算出经常使用共享单车的用户数占百分比为60%,据此计算可得列联表;(2)计算容量为5的样本中,经常使用共享单车的用户数为3,可得X 的可能取值为1,2,3,再根据古典概型的概率公式计算概率,可得分布列和数学期望. 【详解】(1)由图2可知经常使用共享单车的用户数占30.1%19.2%10.7%60%++=,所以经常使用共享单车的人数为20060%120⨯=人,经常使用共享单车的年轻人人数为520060%1006⨯⨯=人,所以经常使用共享单车的非年轻人人数为12010020-=人, 补全的列联表如下:∴()22200100202060 2.083 2.0721604012080K ⨯-⨯=≈>⨯⨯⨯,故有85%以上的把握认为经常使用共享单车与年龄有关.(2)由题意知,容量为5的样本中,经常使用共享单车的用户数为560%3⨯=人,不经常使用共享单车的用户数为532-=人,所以X 的可能取值为1,2,3.则()2123353110C C P X C ===,()1223356210C C P X C ===,()0323351310C C P X C === ∴X 的分布列为: 数学期望()1189123101010105E X =⨯+⨯+⨯==. 【点睛】关键点点睛:正确识别条形图和饼图,并利用两个图形计算频数是解题关键,属于中档题. 22.(1)有99%的把握认为“脱贫攻坚效果与农民的受教育的发展状况有关”;(2)910【分析】(1)根据列联表计算2K ,与附表数据6.635比较即得结论;(2)先分层抽样确定5位农民代表中有3位农民效果明显,2位农民效果不明显,再用列举法,计算从5位代表中任选2位,至少有1位脱贫攻坚效果明显的概率即可. 【详解】解:(1)根据题中列联表得:()2250151910613506.65021292525203K ⨯⨯-⨯==≈⨯⨯⨯由于6.650 6.635>,故有99%的把握认为“脱贫攻坚的效果与农民的受教育的发展状况有关”; (2)受教育的农民中,效果明显与效果不明显的比例为15:103:2=,所以用分层抽样的方法抽取的5位农民代表中,3位效果明显,2位效果不明显.设这5位农民代表为,,,,A B C d e ,其中,,A B C 效果明显,,d e 效果不明显,从中任选2位调查,结果为:(),A B ,(),A C ,(),A d ,(),A e ,(),B C ,(),B d ,(),B e ,(),C d ,(),C e ,(),d e ,共10种情况,其中(),A B ,(),A C ,(),A d ,(),A e ,(),B C ,(),B d ,(),B e ,(),C d ,(),C e 满足至少有1位脱贫攻坚效果明显,共9种情况,所以从5位代表中任选2位,至少有1位脱贫攻坚效果明显的概率910P =. 【点睛】本题考查了独立性检验、分层抽样和古典概型的概率计算问题,属于中档题. 23.(1)列联表见解析,有把握;(2)分布列见解析,()2110E X =. 【分析】(1)根据题中已知条件完善22⨯列联表,并计算出2χ的观测值,结合临界值表可得出结论;(2)由题意可知7~3,10X B ⎛⎫⎪⎝⎭,利用二项分布可得出随机变量X 的分布列,并由此可计算出随机变量X 的数学期望. 【详解】(1)由题意得列联表如下:。
高中数学人教A版【精品习题】选修2-3 第三章 统计案例 3.1学业分层测评 Word含答案
学业分层测评(建议用时:45分钟)[学业达标]一、选择题1.为了研究变量x和y的线性相关性,甲、乙两人分别利用线性回归方法得到回归直线l1和l2,已知两人计算过程中x-,y-分别相同,则下列说法正确的是( )A.l1与l2一定平行B.l1与l2重合C.l1与l2相交于点(x-,y-)D.无法判断l1和l2是否相交【解析】回归直线一定过样本点的中心(x-,y-),故C正确.【答案】 C2.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如下表:甲乙丙丁R20.980.780.500.85A.甲B.乙C.丙D.丁【解析】相关指数R2越大,表示回归模型的拟合效果越好.- 1 -【答案】 A3.对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差)图,则下列模型拟合精度最高的是(【答案】 A4.对于指数曲线y=a e bx,令U=ln y,c=ln a,经过非线性化回归分析后,可转化的形式为( )A.U=c+bx B.U=b+cxC.y=c+bx D.y=b+cx【解析】由y=a e bx得ln y=ln(a e bx),∴ln y=ln a+ln e bx,∴ln y=ln a+bx,∴U=c+bx.故选A.【答案】 A5.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如表- 1 -- 1 -所示:父亲身高x (cm) 174 176 176 176 178 儿子身高y (cm)175 175 176 177 177则y 对x A.y ^=x -1 B.y ^=x +1 C.y ^=88+12x D.y ^=176【解析】 设y 对x 的线性回归方程为y ^=b ^x +a ^, 因为b ^=-2×-1+0×-1+0×0+0×1+2×1-22+22=12,a ^=176-12×176=88,所以y 对x 的线性回归方程为y ^=12x +88.【答案】 C 二、填空题6.甲、乙、丙、丁四位同学各自对A ,B 两变量的线性相关性进行分析,并用回归分析的方法分别求得相关指数R 2与残差平方和Q (a ^,b ^)如下表:甲 乙 丙 丁R 2 0.67 0.61 0.48 0.72 Q (a ^,b ^)106115124103则能体现A ,两个变量有更强的线性相关性的为________.【解析】 丁同学所求得的相关指数R 2最大,残差平方和Q (a ^,b ^)最小.此。
人教A版高中数学选修2-3第三章《统计案例》测试题(含答案解析)(2)
高中新课标选修(2-3)第三章统计案例综合测试题一、选择题1.下列属于相关现象的是( ) A.利息与利率 B.居民收入与储蓄存款 C.电视机产量与苹果产量 D.某种商品的销售额与销售价格 答案:B2.如果有95%的把握说事件A 和B 有关,那么具体算出的数据满足( ) A.2 3.841K > B.2 3.841K < C.2 6.635K > D.2 6.635K <答案:A3.如图所示,图中有5组数据,去掉组数据后(填字母代号),剩下的4组数据的线性相关性最大( ) A.E B.C C.D D.A答案:A4.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人, 得到如下结果(单位:人)9 根据表中数据,你认为吸烟与患肺癌有关的把握有( ) A.90% B.95%C.99%D.100%答案:C5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表:1你认为婴儿的性别与出生时间有关系的把握为( ) A.80% B.90%C.95%D.99%答案:B6.已知有线性相关关系的两个变量建立的回归直线方程为y a bx =+,方程中的回归系数b ( ) A.可以小于0 B.只能大于0 C.可以为0D.只能小于0答案:A7.每一吨铸铁成本c y (元)与铸件废品率x %建立的回归方程568c y x =+,下列说法正确的是( ) A.废品率每增加1%,成本每吨增加64元 B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8元 D.如果废品率增加1%,则每吨成本为56元 答案:C8.下列说法中正确的有:①若0r >,则x 增大时,y 也相应增大;②若0r <,则x 增大时,y 也相应增大;③若1r =,或1r =-,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上( ) A.①②B.②③C.①③D.①②③答案:C9.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:如果某天气温是2℃,则这天卖出的热饮杯数约为( ) A.100 B.143C.200D.243答案:B10.甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表:利用独立性检验估计,你认为推断“成绩与班级有关系”错误的概率介于()A.0.3~0.4 B.0.4~0.5 C.0.5~0.6 D.0.6~0.7答案:B二、填空题11.某矿山采煤的单位成本Y与采煤量x有关,其数据如下:则Y对x的回归系数.答案:0.1229-12.对于回归直线方程 4.75257y x=+,当28x=时,y的估计值为.答案:39013.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,则2K=.答案:16.37314.某工厂在2005年里每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组数据:0 2.55则月总成本y对月产量x的回归直线方程为.答案: 1.2150.975y x=+三、解答题15.某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽取了392名成年人进行调查,所得数据如下表所示:对于教育机构的研究项目,根据上述数据能得出什么结论.解:22392(3916715729)1.7819619668324K⨯⨯-⨯=≈⨯⨯⨯.因为1.78 2.706<,所以我们没有理由说人具有大学专科以上学历(包括大学专科)和对待教育改革态度有关.16.1907年一项关于16艘轮船的研究中,船的吨位区间位于192吨到3246吨,船员的人数从5人到32人,船员的人数关于船的吨位的回归分析得到如下结果:船员人数=9.1+0.006×吨位.(1)假定两艘轮船吨位相差1000吨,船员平均人数相差多少?(2)对于最小的船估计的船员数为多少?对于最大的船估计的船员数是多少?解:由题意知:(1)船员平均人数之差=0.006×吨位之差=0.006×1000=6,∴船员平均相差6人;(2)最小的船估计的船员数为:9.1+0.006×192=9.1+1.152=10.252≈10(人).最大的船估计的船员数为:9.1+0.006×3246=9.1+19.476=28.576≈28(人).17.假设一个人从出生到死亡,在每个生日都测量身高,并作出这些数据散点图,则这些点将不会落在一条直线上,但在一段时间内的增长数据有时可以用线性回归来分析.下表是一位母亲给儿子作的成长记录:11(1)作出这些数据的散点图;(2)求出这些数据的回归方程;(3)对于这个例子,你如何解释回归系数的含义?(4)用下一年的身高减去当年的身高,计算他每年身高的增长数,并计算他从3~16岁身高的年均增长数.(5)解释一下回归系数与每年平均增长的身高之间的联系.解:(1)数据的散点图如下:(2)用y表示身高,x表示年龄,则数据的回归方程为y=6.317x+71.984;(3)在该例中,回归系数6.317表示该人在一年中增加的高度; (4)每年身高的增长数略.3~16岁身高的年均增长数约为6.323cm ; (5)回归系数与每年平均增长的身高之间近似相等.18.某个服装店经营某种服装,在某周内获纯利y (元),与该周每天销售这种服装件数x 之间的一组数据关系见表:已知721280ii x ==∑,2145309ii y ==∑,13487i i i x y ==∑.(1)求x y ,; (2)画出散点图;(3)判断纯利y 与每天销售件数x 之间是否线性相关,如果线性相关,求出回归方程. 解:(1)345678967x ++++++==,6669738189909179.867y ++++++=≈;(2)略;(3)由散点图知,y 与x 有线性相关关系, 设回归直线方程:y bx a =+,5593487761337 4.7528073628b -⨯⨯===-⨯,79.866 4.7551.36a =-⨯=.∴回归直线方程 4.7551.36y x =+.。
人教A版高中数学选修2-3第三章《统计案例》测试题(含答案解析)(1)
分析这些数据,可得鸟的种类与海拔高度间的相关系数为
.
答案: 0.782
13.设对变量 x , Y 有如下观察数据:
x 151 152 153 154 156 157 158 160 161 162 163 164
Y 40 41 41 41. 5 42 42. 5 43 44 45 45 46 45.5
因为 0.08 2.706 ,所以我们没有理由说晕船与男女性别有关.
17.对某校小学生进行心理障碍测试得如下列联表: (其中焦虑、说谎、懒惰都是心理障碍)
焦虑
说谎
懒惰
总计
女生
5
10
15
30
男生
20
10
50
80
总计
25
20
65
110
试说明在这三种心理障碍中哪一种与性别关系最大?
解:对于上述三种心理障碍分别构造三个随机变量
)
A.有 95%的把握有关
B.有 99%的把握 有关
C.没有理由说它们有关
D.不确定
答案:A
3.已知回归 直线方程 y bx a ,其中 a 3 且样本点中心为 (1,2) ,则回归直线方程为(
)
A. y x 3
B. y 2x 3
C. y x 3
D. y x 3
答案:C
4.为了考察中学生的性别与是否喜欢数学课程之间的关系,在某校中学生中随机抽取了
D. x 变动一个单位时, y 的平均变动量
答案:D
7.对于回归分析,下列说法错误的是(
)
A.在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定
B.线性相关系数可以是正的,也可以是负的 C.回归分析中,如果 r 2 1 ,说明 x 与 y 之间完全相关 D.样本相关系数 r ( 1,1)
(典型题)高中数学高中数学选修2-3第三章《统计案例》测试(含答案解析)
一、选择题1.在一次对性别与是否说谎有关的调查中,得到如下数据,根据表中数据判断如下结论中正确的是()A.在此次调查中有95%的把握认为是否说谎与性别有关B.在此次调查中有99%的把握认为是否说谎与性别有关C.在此次调查中有99.5%的把握认为是否说谎与性别有关D.在此次调查中没有充分证据显示说谎与性别有关2.已知x与y之间的几组数据如下表:x1245y0235假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2),求得的直线方程为y=b'x+a',则以下结论正确的是()A.b>b',a>a' B.b<b',a<a'C.b>b',a<a' D.b<b',a>a'3.某科研机构为了研究中年人秃发与患心脏病是否有关,随机调查了一些中年人的情况,具体数据如表,根据表中数据则可判定秃发与患心脏病有关,那么这种判定出错的可能性为()患心脏病情况秃发情况患心脏病无心脏病秃发20300不秃发5450A.0.1 B.0.05 C.0.01 D.0.994.两个分类变量X 和Y ,值域分别为{x 1,x 2}和{y 1,y 2},其样本频数分别是a =10,b =21,c +d =35,若X 与Y 有关系的可信程度为90%,则c =( ) A .4 B .5 C .6D .75.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:2()P K k ≥ 0.0500.025 0.010 0.005 0.001 k3.8415.0246.6357.87910.828由以上数据,计算得到K 2的观测值k ≈9.643,根据临界值表,以下说法正确的是( ) A .没有充足的理由认为课外阅读量大与作文成绩优秀有关 B .有0.5%的把握认为课外阅读量大与作文成绩优秀有关 C .有99.9%的把握认为课外阅读量大与作文成绩优秀有关 D .有99.5%的把握认为课外阅读量大与作文成绩优秀有关6.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k =,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响7.对四对变量Y 和x 进行线性相关性检验,已知n 是观测值组数,r 是相关系数,且已知: ①n=7,r=0.953 3;②n=15,r=0.301 2;③n=17,r=0.499 1;④n=3,r=0.995 0,则变量Y 和x 具有线性相关关系的是( ) A .①和②B .①和③C.②和④D.③和④8.为了检验设备M与设备N的生产效率,研究人员作出统计,得到如下表所示的结果,则()附:参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.A.有90%的把握认为生产的产品质量与设备的选择具有相关性B.没有90%的把握认为生产的产品质量与设备的选择具有相关性C.可以在犯错误的概率不超过0.01的前提下认为生产的产品质量与设备的选择具有相关性D.不能在犯错误的概率不超过0.1的前提下认为生产的产品质量与设备的选择具有相关性9.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3 000人,计算发现k2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是()A.90% B.95% C.97.5% D.99.5%10.为了增强环保意识,某校从男生中随机抽取60人,从女生中随机抽取50人,参加环保知识测试,统计数据如下表所示:(参考数据:()211221221 21212n n n n nn n n nχ++++-=)则认为环保知识测试成绩是否优秀与性别有关的把握为 A .90%B .95%C .99%D .99.9%11.下列命题中:①线性回归方程y bx a =+必过点(),x y ;②在回归方程35y x =-中,当变量增加一个单位时,y 平均增加5个单位; ③在回归分析中,相关指数2R 为0.80的模型比相关指数2R 为0.98的模型拟合的效果要好;④在回归直线0.58ˆyx =-中,变量2x =时,变量y 的值一定是-7. 其中假命题的个数是 ( ) A .1B .2C .3D .412.下列说法:①将一组数据中的每个数据都乘以同一个非零常数a 后,标准差也变为原来的a 倍; ②设有一个回归方程35y x =-,变量x 增加1个单位时,y 平均减少5个单位; ③线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;④在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>,若ξ位于区域()0,1的概率为0.4,则ξ位于区域()1,+∞内的概率为0.6⑤利用统计量2χ来判断“两个事件,X Y 的关系”时,算出的2χ值越大,判断“X 与Y 有关”的把握就越大 其中正确的个数是 A .1B .2C .3D .4二、填空题13.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③线性回归方程=x +必过(,);④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K 2=13.079,则其两个变量之间有关系的可能性是90%.其中错误的个数是________.14.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:女 男 总计 喜爱 40 20 60 不喜爱 20 30 50 总计6050110试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”. 参考附表: P (K 2≥k 0) 0.050 0.010 0.001 k 03.8416.63510.828(参考公式:K 2=()()()()()2n ad bc a b c d a c b d -++++,其中n=a+b+c+d)15.为了解适龄公务员对放开生育二胎政策的态度,某部门随机调查了200位30~40岁之间的公务员,得到的情况如下表:男公务员 女公务员 生二胎 80 40 不生二胎4040则________(填“有”或“没有”)99%以上的把握认为“生二胎与性别有关”. 附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.82816.已知方程ˆ0.8582.71yx =-是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,ˆy的单位是kg ,那么针对某个体(160,53)的残差是______________. 17.某单位为了了解用电量度与气温之间的关系,随机统计了某天的用电量与当天气温.由表中数据得回归直线方程中,据此预测当气温为5℃时,用电量的度数约为____.18.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温.由表中数据得线性方程=+x 中=﹣2,据此预测当气温为5℃时,用电量的度数约为_____.19.以下四个命题,其中正确的序号是____________________.①从匀速传递的产品生产流水线上,每20分钟从中抽取一件产品进行检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程0.212ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 平均增加0.2个单位;④分类变量X 与Y ,它们的随机变量2K 的观测值为k ,当k 越小,“X 与Y 有关系”的把握程度越大.20.下列命题中,正确的命题有__________.①回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,且至少过一个样本点;②将一组数据的每个数据都加一个相同的常数后,方差不变;③用相关指数2R 来刻面回归效果;表示预报变量对解释变量变化的贡献率,越接近于1,说明模型的拟合效果越好;④若分类变量X 和Y 的随机变量2K 的观测值K 越大,则“X 与Y 相关”的可信程度越小;⑤.对于自变量x 和因变量y ,当x 取值一定时,y 的取值具有一定的随机性,x ,y 间的这种非确定关系叫做函数关系;⑥.残差图中残差点比较均匀的地落在水平的带状区域中,说明选用的模型比较合适; ⑦.两个模型中残差平方和越小的模型拟合的效果越好.三、解答题21.为了解使用手机是否对学生的学习有影响,某校随机抽取50名学生,对学习成绩和使用手机情况进行了调查,统计数据如表所示(不完整):使用手机 不使用手机 总计学习成绩优秀 5 20 学习成绩一般总计 30 50与使用手机有关;(2)现从上表不使用手机的学生中按学习成绩是否优秀分层抽样选出9人,再从这9人中随机抽取3人,记这3人中“学习成绩优秀”的人数为X ,试求X 的分布列与数学期望. 参考公式:()()()()()22n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.参考数据:()20P x χ≥0.0500.010 0.0010x3.841 6.635 10.82822.2019年4月,中国电信公布了2019年的终端洞察报告,其中,国产手机品牌表现抢眼,统治地位不容置疑.在2018年6~11月上市的新机中,用户最满意机型与用户推荐机型的项目中国产手机优势明显,华为及荣耀手机分别占据不同价位段的榜单第一,OPPO 、vivo 、小米、魅族均有机型占据榜单.在用户满意机型调研项目中,曾经位于神坛地位的苹果手机也仅仅只有iPhone XR 一款位列第三.(1)从上表中15个机型中任取3个,求这3个机型恰好有2个是“华为”或“荣耀”的概率; (2)测试数据源于消费者的反馈,从反馈信息中随机抽取500个“华为畅享9plus ”消费者,其中来自城市300个,来自农村200个,统计他们对“华为畅想9plus ”的满意情况如下:满意 不满意城市 270 30 农村17030(附:()()()()()22n ad bc a b c d a c b d χ-=++++,当2 3.841χ>时,有95%的把握说事件A 与B 有关;当26.635χ>时,有99%的把握说事件A 与B 有关;当23.841χ≤时,认为事件A 与B 是无关的)23.2020年寒假是特殊的寒假,因为疫情全体学生只能在家进行网上在线学习,为研究学生网上学习的情况,某校社团对男女各10名学生进行了网上在线学习的问卷调查,每名学生给出评分(满分100分),得到如图所示的茎叶图.(1)根据茎叶图判断男生组和女生组哪个组对网课的评价更高?并说明理由; (2)求该20名学生评分的中位数m ,并将评分超过m 和不超过m 的学生数填入下面的列联表中,并根据列联表,判断能否有90%的把握认为男生和女生的评分有差异?超过m不超过m总计男生 女生 总计附:22()()()()()n ad bc K a b c d a c b d -=++++. 20()P K k 0.10 0.05 0.025 0.010 0.005 0.001 0k 2.7063.8415.0246.6357.87910.82824.某中学在2020年元旦校运动会到来之前,在高三年级学生中招募了16名男性志愿者和14名女性志愿者,其中男性志愿者,女性志愿者中分别有10人和6人喜欢运动会,其他人员均不喜欢运动会.(1)根据题设完成下列22⨯列联表:喜欢运动会 不喜欢运动会 总计(2)在犯错误的概率不超过0.050的前提下能否有95%的把握认为喜欢运动会与性别有关?并说明理由.(3)如果喜欢运动会的女性志愿者中只有3人懂得医疗救护,现从喜欢运动会的女性志愿者中随机抽取2人负责医疗救护工作,求“抽取得2名志愿者都懂得医疗救护”的概率.注:()()()()()()22n ad bcK n a b c da b c d a c b d-==+++ ++++临界值表25.在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始现该疾病对应的相关症状时止的这一阶段称为潜伏期.一研究团队统计了某地区1000名患有某种传染病的患者的相关信息,得到如表:该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,以潜伏期是否超过6天为标准进行分层抽样,从上述1000名患者中抽取200人,得到如下列联表.(Ⅰ)请将列联表补充完整;(Ⅱ)根据列联表判断是否有95%的把握认为潜伏期与患者年龄有关?附:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.26.为了了解某班学生喜欢数学是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表,已知在全部50人中随机抽取1人抽到喜欢数学的学生的概率为3 5 .(1)能否在犯错误的概率不超过0.005的前提下认为喜欢数学与性别有关?说明你的理由;(2)现从女生中抽取2人进一步调查,设其中喜欢数学的女生人数为ξ,求ξ的分布列与期望.临界表供参考:(参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++)【参考答案】***试卷处理标记,请不要删除一、选择题1.D解析:D根据上表数据可求得20.027 1.323k ≈<,再结合课本上的概率附表可知在此次调查中没有充分证据显示说谎与性别有关,故选D2.D解析:D 【解析】 【分析】先根据()()1,0,2,2求得直线y b x a ='+'的方程.然后计算出回归直线方程y bx a =+,由此比较大小,得出正确的结论. 【详解】由于直线y b x a ='+'过()()1,0,2,2,将两点坐标代入直线方程得022b a b a +=⎧⎨+=''''⎩,解得2,2b a ''==-.124534x +++==,02352.54y +++==,1122334414122542x y x y x y x y +++=+++=.2222123414162546x x x x +++=+++=,故24243 2.54230121.24643463610b -⨯⨯-====-⨯-, 2.5 1.23 2.5 3.6 1.1a =-⨯=-=-.所以,a a b b >'<',故选D.【点睛】本小题主要考查利用直线上的两点坐标求直线方程的方法,考查回归直线方程的计算,属于中档题.3.C解析:C 【分析】首先列出22⨯联表,通过计算出2K 的值,然后作统计推断,得出正确的结论. 【详解】列出22⨯联表如下图所示:()277520450530015.96825750455320K ⨯⨯-⨯=≈⨯⨯⨯ 6.635>,故判断错误的概率不超过0.01,故选C .本小题主要考查补全22⨯联表,考查2K 的计算以及独立性检验的概念,属于基础题. 独立性检验的步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22n ad bc K a b c d a c b d -=++++()()()()(),计算2K 的观测值;(3)比较2K 与临界值的大小关系作统计推断. 4.B解析:B 【解析】 【分析】根据22⨯列联表,以及独立检验随机变量的临界值参考表,计算2K 对应的值,验证24,5,6,7,c K =是否恰好满足即可【详解】列22⨯列联表可知:()22661030521 3.024 2.70615513135K ⨯⨯-⨯=≈>⨯⨯⨯,所以5c =时,X 与Y 有关系的可信程度为90%,而其余的值4,6,7c c c ===皆不满足,故选B . 【点睛】独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)5.D解析:D 【解析】 【分析】由题意结合独立性检验的结论和临界值表给出结论即可. 【详解】根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关, 即有99.5%的把握认为课外阅读量大与作文成绩优秀有关. 本题选择D 选项. 【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.6.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.7.B解析:B 【解析】分析:先查相关系数检验的临界值表,再判断变量Y 和x 具有线性相关关系的选项. 详解: 查相关系数检验的临界值表 ①r 0.05=0.754,r >r 0.05; ②r 0.05=0.514,r <r 0.05; ③r 0.05=0.482,r >r 0.05; ④r 0.05=0.997,r 0.05>r.∴y 和x 具有线性相关关系的是①③.故答案为B.点睛:本题主要考查相关系数,意在考查学生对这些知识的掌握水平.8.A解析:A 【解析】将表中的数据代入公式,计算得22100(487243) 3.0535050919K ⨯⨯-⨯=≈⨯⨯⨯,∵3.053 2.706>,∴有90%的把握认为生产的产品质量与设备的选择具有相关性,故选A .9.C解析:C 【详解】∵2 6.023 5.024K =>∴可断言市民收入增减与旅游欲望有关的把握为97.5%. 故选C.点睛:本题主要考查独立性检验的实际应用.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22()()()()()n ad bc K a b c d a c b d -=++++,计算出2K 的值;(3)查表比较2K 与临界值的大小关系,作统计判断.10.C解析:C 【解析】 由题意得:()221104030202060505060χ⨯-⨯=≈⨯⨯⨯7.8>6.635,所以认为环保知识测试成绩是否优秀与性别有关的把握为99%. 本题选择C 选项.11.C解析:C 【解析】对于①,线性回归方程 ˆˆˆybx a =+必过点)x y (,,满足回归直线的性质,所以①正确;对于②,在回归方程ˆ35y x =-中,当变量x 增加一个单位时,y 平均减少5个单位,不是增加5个单位;所以②不正确;对于③,在回归分析中,相关指数2R 为0.80的模型比相关指数2R 为0.98的模型拟合的效果要好,该判断恰好相反;所以③不正确;对于④,在回归直线0.58ˆy x =-中,变量2x =时,变量y 的值一定是-7.不是一定为7,而是可能是7,也可能在7附近,所以④不正确;故选C.12.B解析:B 【解析】逐一考查所给的说法:①将一组数据中的每个数据都乘以同一个非零常数a 倍,原说法错误;②设有一个回归方程35y x =-,变量x 增加1个单位时,y 平均减少5个单位,原说法正确;③线性相关系数r 的绝对值越大,两个变量的线性相关性越强;反之,线性相关性越弱,原说法错误;④在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>,若ξ位于区域()0,1的概率为0.4,则ξ位于区域()1,+∞内的概率为0.5,原说法错误;⑤利用统计量2χ来判断“两个事件,X Y 的关系”时,算出的2χ值越大,判断“X 与Y 有关”的把握就越大,原说法正确. 本题选择B 选项.二、填空题13.3【解析】【分析】逐一分析各个说法即可得到结论【详解】由方差的性质知:方差反映一组数据的波动大小将一组数据中的每个数据都加上或者减去同一个常数后方差恒不变①正确;一个回归方程=3-5x 变量x 增加一个解析:3 【解析】 【分析】逐一分析各个说法即可得到结论 【详解】由方差的性质知:方差反映一组数据的波动大小,将一组数据中的每个数据都加上或者减去同一个常数后,方差恒不变,①正确;一个回归方程ˆy=3-5x ,变量x 增加一个单位时,y 平均减少5个单位,②错误 线性回归方程必过样本中心点,③正确;曲线上的点与该点的坐标之间具有一一对应关系④错误.在一个2×2列联表中,由计算得K 2=13.079,则其两个变量之间有关系的可能性是99.90%,故⑤错误综上所述,其中错误的个数是3个 故答案为3 【点睛】本题主要考查了线性回归方程,考查了独立性检验,考查了方差的变化特点,考查了相关关系,是一道考查的知识点比较多的题目,综合性较强,注意分析,本题不需要计算,只要理解概念即可得到结论14.99【解析】分析列联表中数据可得所以有的把握认为喜爱该节目与否和性别有关故答案为解析:99% 【解析】分析列联表中数据,可得()2110403020207.822 6.63560506050k ⨯⨯-⨯=≈>⨯⨯⨯,所以有099的把握认为“喜爱该节目与否和性别有关”,故答案为0099.15.没有【解析】由于K2=<6635故没有99以上的把握认为生二胎与性别有关解析:没有 【解析】由于K 2=2200(80404040)5012080120809⨯-⨯=⨯⨯⨯<6.635,故没有99%以上的把握认为“生二胎与性别有关”.16.【解析】将代入得所以残差 解析:0.29-【解析】将160x =代入0.85 2.1ˆ87yx =-,得0.8516082.71ˆ53.29y =⨯-=,所以残差5353.ˆ290ˆ.29ey y =-=-=-. 17.40【解析】试题分析:∵∴∴当时考点:线性回归方程解析:40 【解析】 试题分析:∵,,∴,∴当时,考点:线性回归方程18.40【解析】试题分析:根据所给的表格做出本组数据的样本中心点根据样本中心点在线性回归直线上利用待定系数法做出a 的值现在方程是一个确定的方程根据所给的x 的值代入线性回归方程预报要销售的件数解:由表格得解析:40 【解析】试题分析:根据所给的表格做出本组数据的样本中心点,根据样本中心点在线性回归直线上,利用待定系数法做出a 的值,现在方程是一个确定的方程,根据所给的x 的值,代入线性回归方程,预报要销售的件数.解:由表格得=(14+12+8+6)÷4=10,=(22+26+34+38)÷4=30 即样本中心点的坐标为:(10,40), 又∵样本中心点(10,40)在回归方程 上且b=﹣2∴30=10×(﹣2)+a , 解得:a=50, ∴当x=5时,y=﹣2×(5)+50=40. 故答案为40.考点:回归分析的初步应用.19.②③【分析】利用系统抽样的定义判断①利用独立性检验判断④;利用相关系数的性质判断②;由回归方程的性质判断③【详解】①为系统抽样①不正确;④分类变量与它们的随机变量的观测值为当越小与有关系的把握程度越解析:②③ 【分析】利用系统抽样的定义判断①利用独立性检验判断④;利用相关系数的性质判断②;由回归方程的性质判断③. 【详解】①为系统抽样, ①不正确;④分类变量X 与Y ,它们的随机变量2K 的观测值为k ,当k 越小,“X 与Y 有关系”的把握程度越小,④不正确;根据相关系数的性质可知②正确;由回归方程的性质可知③正确.故答案为②③. 【点睛】本题通过对多个命题真假的判断,综合考查系统抽样、相关系数、回归方程、独立性检验,属于中档题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.20.②⑥⑦【解析】①回归直线恒过样本点的中心可以不过任何一个样本点;②将一组数据中的每个数据都加上同一个常数后根据方差公式可知方差恒不变;③用相关指数来刻面回归效果;表示预报变量对解释变量变化的贡献率越解析:②⑥⑦ 【解析】①回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,可以不过任何一个样本点;②将一组数据中的每个数据都加上同一个常数后,根据方差公式可知方差恒不变; ③用相关指数2R 来刻面回归效果;表示预报变量对解释变量变化的贡献率,越接近于0,说明模型的拟合效果越好;④若分类变量X 和Y 的随机变量2K 的观测值K 越大,则“X 与Y 相关”的可信程度越大;⑤.对于自变量x 和因变量y ,当x 取值一定时,y 的取值具有一定的随机性,x ,y 间的这种非确定关系叫做相关关系;⑥.残差图中残差点比较均匀的地落在水平的带状区域中,说明选用的模型比较合适; ⑦.两个模型中残差平方和越小的模型拟合的效果越好. 故答案为:②⑥⑦三、解答题21.(1)没有99.9%的把握认为学生的学习成绩与使用手机有关;(2)分布列见解析,()2E X =.【分析】(1)根据表格中数据和题中信息可完善22⨯列联表,计算出2χ的观测值,结合临界值表可得出结论;(2)由题意可知,随机变量X 的可能取值有0、1、2、3,计算出随机变量X 在不同取值下的概率,可得出随机变量X 的分布列,进而可求得随机变量X 的数学期望值. 【详解】(1)22⨯列联表如下表所示:()22505102015258.33310.828203025253χ⨯⨯-⨯==≈<⨯⨯⨯,所以,没有99.9%的把握认为学生的学习成绩与使用手机有关;(2)9人中学习成绩优秀的人有209630⨯=人,学习成绩一般的有109330⨯=人, X 可能的取值有0、1、2、3,()3911084P X C ===,()1263393114C C P X C ===,()21633915228C C P X C ===,()363953?21C P X C ===.所以,随机变量X 的分布列为()1232142821E X =⨯+⨯+⨯=. 【点睛】思路点睛:求解随机变量分布列的基本步骤如下:(1)明确随机变量的可能取值,并确定随机变量服从何种概率分布; (2)求出每一个随机变量取值的概率;(3)列成表格,对于抽样问题,要特别注意放回与不放回的区别,一般地,不放回抽样由排列、组合数公式求随机变量在不同取值下的概率,放回抽样由分步乘法计数原理求随机变量在不同取值下的概率.22.(1)2791;(2)没有95%的把握认为消费者是否满意与城市用户还是农村用户有关,理由见解析.【分析】(1)由题意可知,15个机型中,“华为”或“荣耀”的机型个数为6,利用组合计数原理以及古典概型的概率公式可求得所求事件的概率;(2)根据列联表中的数据可求得2χ的观测值,利用题中的参考数据可得出结论.【详解】(1)由题意可知,15个机型中,“华为”或“荣耀”的机型个数为6,所以,从上表中15个机型中任取3个,这3个机型恰好有2个是“华为”或“荣耀”的概率为21 69 3 1515927 351391C C PC ⨯===⨯;(2)由列联表中的数据可得()2250027030170302.8413.84144060300200χ⨯⨯-⨯=≈<⨯⨯⨯,因此,没有95%的把握认为消费者是否满意与城市用户还是农村用户有关.【点睛】本题考查古典概型概率的计算,同时也考查了利用独立性检验解决实际问题,考查数据处理能力,属于中等题.23.(1)男生对网课的评价更高,理由见解析;(2)74.5m=,列联表答案见解析,没有90%的把握认为男生和女生的评分有差异.【分析】(1)根据茎叶图中数据,从评价分数不低于70分的男生比女生多,或男生、女生评分的中位数,或男生、女生评分的平均数比较即可;(2)求出20名学生评分的中位数m,填写列联表,计算2K,对照附表得出结论.【详解】(1)男生对问题的评价更高,理由如下:①由茎叶图知,评价分数不低于70分的男生比女生多2人(33.3%),因此男生对网课的评价更高;②由茎叶图知,男生评分的中位数是77,女生评分的中位数是72,因此男生对网课的评价更高;③由茎叶图知,男生评分的平均数为1(68697074777879838696)7810⨯+++++++++=,女生评分的平均数为1(55586364717375768186)70.2 10⨯+++++++++=,因此男生对网课的评价更高;(2)由茎叶图知,该20名学生评分的中位数是747574.52m+==,由此填写列联表如下;计算2220(6644)0.8 2.70610101010K⨯⨯-⨯==<⨯⨯⨯,所以没有90%的把握认为男生和女生的评分有差异.【点睛】本题考查了列联表与独立性检验问题,也考查了数据分析与应用能力,是中档题.24.(1)填表见解析;(2)没有;答案见解析;(3)1 5 .【分析】(1)根据题目中所给的数据即可得出列联表;(2)根据公式求2K,再与临界值比较即可做出判断;(3)用列举法列出满足题意得基本事件的总数,求出所求事件包含的基本事件的个数,根据古典概率公式计算即可.【详解】(1)(2)()()()()()230108661.158 3.8411066810668K⨯⨯-⨯=≈<++++所以在犯错误的概率不超过0.050的前提下没有95%的把握认为喜欢运动会与性别有关.(3)喜欢运动会的女性志愿者有6人,设分别为A,B,C,D,E,F,其中A,B,C懂得医疗救护,则从这6人中任取2人方法有AB,AC,AD,AE,AF,BC,BD,BE,BF,CD,CE,CF,DE,DF,EF,共15种,其中两人都懂得医疗救护的有AB,AC,BC,共3种,。
高中数学选修2-3(人教A版)第三章3.2统计案例知识点总结含同步练习及答案
高考不提分,赔付1万元,关注快乐学了解详情。
答案:②独立性检验就是选取一个假设 条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的"不合理"现象,则作出拒绝 的推断;③独立性检验一定能给出明确的结论.A .①②
B .①③
C .②③
D .①②③
A
H 0H 0答案:3. 在对分类变量 进行独立性检验时,算得 ,有以下四种判断:① 有 的把握认为 与 有关;②有 的把握认为 与 无关;
③在假设 与 无关的前提下有 的把握认为 与 有关;④在假设 与 有关的前提下有 的把握认为 与 无关.以上 个判断正确的是 A .①②
B .①③
C .②③
D .③④
B
X ,Y =7K 299%X Y 99%X Y :X H 0Y 99%X Y :X H 1Y 99%X Y 4()
答案:4. 某人研究中学生的性别与成绩、视力、智商、阅读量这 个变量之间的关系,随机抽查 名中学生,得到统计数据如表
至表
,则与性别有关联的可能性最大的变量是 .
A .成绩
B .视力
C .智商
D .阅读量
D
45214(
)。
高中数学人教A版选修2-3习题 第3章 统计案例3.1 Word版含答案
选修第三章一、选择题.已知变量与正相关,且由观测数据算得样本平均数=,=,则由该观测数据算得线性回归方程可能为( ).=+.=-.=-+.=-+[答案][解析]因为变量和正相关,所以回归直线的斜率为正,排除、;又将点()代入选项和的方程中检验排除,所以选..由变量与相对应的一组数据(,)、(,)、(,)、(,)、(,)得到的线性回归方程为=+,则=( )....[答案][解析]∵=(++++)=,=+,∴=×+=,故选..(·淄博高二检测)观测两个相关变量,得到如下数据:.=-.=.=+.=+[答案][解析]因为=,==,根据回归直线方程必经过样本中心点(,)可知,回归直线方程过点(),所以选..一位母亲记录了儿子~岁的身高,数据(略),由此建立的身高与年龄的回归模型为=+,用这个模型预测这个孩子岁时的身高,则正确的叙述是( ).身高一定是.身高在以上.身高在左右.身高在以下[答案][解析]将的值代入回归方程=+时,得到的值是年龄为时,身高的估计值,故选..(·天津高二检测)某咖啡厅为了了解热饮的销售量(个)与气温(℃)之间的关系,随机统计了某天的销售量与气温,并制作了对照表:( ) ....[答案][解析]∵=(++-)=,=(+++)=,∴=-×+,∴=,当=-时,=-×(-)+=..设某大学的女生体重(单位:)与身高(单位:)具有线性相关关系,根据一组样本数据(,)(=,…,),用最小二乘法建立的回归方程为=-,则下列结论中不正确...的是( ) .与具有正的线性相关关系.回归直线过样本点的中心(,).若该大学某女生身高增加,则其体重约增加.若该大学某女生身高为,则可断定其体重必为[答案][解析]本题考查线性回归方程.项中身高为时,体重“约为”,而不是“确定”,回归方程只能作出“估计”,而非确定“线性”关系.二、填空题.下列五个命题,正确命题的序号为①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.[答案]③④⑤[解析]变量的相关关系是变量之间的一种近似关系,并不是所有的变量都有相关关系,而有些变量之间是确定的函数关系.例如,②中圆的周长与该圆的半径就是一种确定的函数关系;另外,线性回归直线是描述这种关系的有效方法;如果两个变量对应的数据点与所求出的直线偏离较大,那么,这条回归直线的方程就是毫无意义的..在块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:).由散点图初步判定其具有线性相关关系,则由此得到的回归方程的斜率是。
高中数学选修2-3 第三章 统计案例(A卷)
高中数学选修2-3 第三章统计案例(A卷)试卷一、选择题(共19题;共100分)1.下列结论正确的是()①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①②B.①②③C.①②④D.①②③④【答案】C【考点】回归分析的基本思想及应用【解析】根据回归分析的基本思想,可进行判断。
2.在对两个变量x,y进行线性回归分析时,有下列步骤:①对所求出的回归直线方程作出解释;②收集数据(x i,y i),;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.如果根据可行性要求能够作出变量x,y具有线性相关的结论,则在下列操作顺序中正确的是()A.①②⑤③④B.③②④⑤①C.②④③①⑤D.②⑤④③①【答案】D【考点】回归分析的基本思想及应用【解析】对两个变量进行回归分析时,首先收集数据,根据所搜集的数据绘制散点图.观察散点图的形状,判断线性相关关系的强弱,求相关系数,写出线性回归方程,最后依据所求出的回归直线方程作出解释;故正确顺序是②⑤④③①,故选D.3.如图四个散点图中,适合用线性回归模型拟合其中两个变量的是( )A.①②B. ①③C.②③D.③④【答案】B【考点】回归分析的基本思想及应用【解析】图①是正的线性相关关系,图③是负的线性相关关系,②④散点图的点较分散.4.某学校开展研究性学习活动,某同学获得一组实验数据如下表:对于表中数据,现给出下列拟合曲线,其中拟合程度最好的是()A.B.C.D.【答案】D【考点】回归分析的基本思想及应用【解析】根据所给的五组数据,在平面直角坐标系中画出五个点,观察这几个点在变化趋势上是在第一象限单调递增,递增的速度比较快,排除B,C两个选项,把数据代入后可以发现D选项更加符合条件.5.如下图,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是()A.相关系数r变大B.残差平方和变大C.相关指数R2变大D.解释变量x与预报变量y的相关性变强【答案】B【考点】回归分析的基本思想及应用【解析】由散点图知,去掉D后,x与y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小.6.下面是一个2×2列联表:则表中a,b的值分别为()A.94,72B.52,50C.52,74D.74,52【答案】C【考点】回归分析的基本思想及应用【解析】∵a+21=73,∴a=52,又a+22=b,∴b=74.7.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由=算得,=附表:参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”【答案】C【考点】回归分析的基本思想及应用【解析】根据独立性检验的定义,由可知我们有99%以上的把握认为“爱好该项运动与性别有关”.8.在独立性检验中,统计量有两个临界值:3.841和6.635;当>3.841时,有95%的把握说明两个事件有关,当>6.635时,有99%的把握说明两个事件有关,当 3.841时,认为两个事件无关.在一项打鼾与患心脏病的调查中,共调查了2000人,经计算的=20.87,根据这一数据分析,认为打鼾与患心脏病之间( )A.有95%的把握认为两者有关B.约有95%的打鼾者患心脏病C.有99%的把握认为两者有关D.约有99%的打鼾者患心脏病【答案】C【考点】回归分析的基本思想及应用【解析】由可知,有99%的把握认为两者有关,故选C.9.下列说法中,错误的个数是()①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程,变量x增加一个单位时,y平均增加5个单位;③回归方程必过;④有一个2×2列联表中,由计算得K2=13.079,则有的把握确认这两个变量间有关系.A.0B.1C.2D.3【答案】B【考点】回归分析的基本思想及应用,独立性检验的基本思想及应用【解析】参考公式:一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x的系数具备直线斜率的功能,对于回归方程=3-5x,当x增加一个单位时,y平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程必过点,③正确;因为K2=13.079>6.635,故有99%的把握确认这两个变量间有关系,④正确.故选B.10.关于分类变量X与Y的随机变量的观测值k,下列说法正确的是()A.k的值越大,“X和Y有关系”可信程度越小B.k的值越小,“X和Y有关系”可信程度越小C.k的值越接近于0,“X和Y无关”程度越小D.k的值越大,“X和Y无关”程度越大【答案】B【考点】独立性检验的基本思想及应用【解析】k的值越大,X和Y有关系的可能性就越大,也就意味着X与Y无关系的可能性就越小.k的值越小,X和Y有关系的可能性就越小, 也就意味着X与Y无关系的可信程度就越大. 故选B.11.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.若K2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病.B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病.C.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.D.以上三种说法都不正确.【答案】C【考点】独立性检验的基本思想及应用【解析】根据独立性检验的思想可知从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.故选C.12.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机选取了60名高中生,通过问卷调查,得到以下数据:由以上数据,计算得出=9.643,根据临界值表,以下说法正确的是()参考数据,公式:A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.5%的把握认为课外阅读量大与作文成绩优秀有关D.有99.9%的把握认为课外阅读量大与作文成绩优秀有关【答案】C【考点】独立性检验的基本思想及应用【解析】因为9.643>7.879,所以有99.5%的把握认为课外阅读量大与作文成绩优秀有关.13.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()A.B.C.D.【答案】A【考点】回归分析的基本思想及应用【解析】由题图知(r1),( r3)为正相关,(r1)中的点大致集中在一条直线附近,( r3)较分散,所以r1>r3>0,又(r2),( r4)为负相关且(r2)较集中在直线附近,( r4)较分散,所以r2<r4<0. 综上得r2<r4<0<r3<r1.故选A.14.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如下表:哪位同学建立的回归模型拟合效果最好?()A.甲B.乙C.丙D.丁【答案】A【考点】回归分析的基本思想及应用【解析】相关指数R2越大,表示回归模型的拟合效果越好.故选A.15.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线的周围,令,求得回归直线方程为,则该模型的回归方程为()A.B.C.D.【答案】A【考点】回归分析的基本思想及应用【解析】因为,所以化成指数式,得y =e0.25x-2.58. 故选A.16.甲、乙、丙、丁4位同学各自对A,B两变量进行回归分析,分别得到散点图与残差平方和如下表:哪位同学的试验结果体现拟合A,B两变量关系的模型拟合精度高()A.甲B.乙C.丙D.丁【答案】D【考点】回归分析的基本思想及应用【解析】根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R2的表达式中为确定的数,则残差平方和越小,R2越大),由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些.故选D.17.下面的等高条形图可以说明的问题是()A.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响是绝对不同的.B.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响没有什么不同.C.此等高条形图看不出两种手术有什么不同的地方.D.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但没有100%的把握.【答案】D【考点】回归分析的基本思想及应用【解析】由等高条形图可知,“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但没有100%的把握.18.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是()A.列联表中c的值为30,b的值为35B.列联表中c的值为15,b的值为50C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”【答案】C【考点】独立性检验的基本思想及应用【解析】由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c=20,b=45,选项A,B错误.根据列联表中的数据,得到因此有95%的把握认为“成绩与班级有关系”,选项C正确.19.下面说法正确的是()A.统计方法的特点是统计推断准确,有效B.独立性检验的基本思想类似于数学上的反证法C.任何两个分类变量有关系的可信度都可以通过查表得到D.不能从等高条形图中看出两个分类变量是否相关【答案】B【考点】回归分析的基本思想及应用【解析】统计分析方法的三个主要特征:直观性,可重复性,科学性,故A错误;根据独立性检验的知识可知B正确;独立性检测是考查两个变量是否有关系的方法,则说明不是所有的两个分类变量有关系的可信度都可以通过查表得到,故C错误;在二维等高条形图中,与相差很大时,我们认为两个分类变量有关系,故D错误. 故选B.。
(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试题(包含答案解析)(3)
一、选择题1.设(1+x)n =a 0+a 1x+…+a n x n ,若a 1+a 2+…+a n =63,则展开式中系数最大的项是( ) A .15x 2B .20x 3C .21x 3D .35x 32.以下四个命题:①从匀速传递的产品生产流水线上,每30分钟从中抽取一件产品进行检测,这样的抽样是分层抽样;②某市进行了一次全市高中男生身高统计调查,数据显示某市30000高中男生的身高ξ(单位:cm )服从正态分布()2172,N σ,且(172180)0.4P ξ<≤=,那么该市身高高于180cm 的高中男生人数大约为3000;③随机交量X 服从二项分布(100,0.4)B ,若随机变量21Y X =+,则Y 的数学期望为()81E Y =,方差为()48D Y =;④分类变量X 与Y ,它们的随机变量2K 的观测值为k ,当k 越小,“X 与Y 有关系的把握程度越大其中正确的个数是( ) A .1B .2C .3D .43.下列说法错误..的是( ) A .10xy ≠是5x ≠或2y ≠的充分不必要条件B .若命题p :x R ∀∈,210x x ++≠,则p ⌝:x R ∃∈,210x x ++=C .已知随机变量()2~2,X N σ,且()40.84P X ≤=,则()00.16P X ≤=D .相关系数r 越接近1,表示线性相关程度越弱.4.某商场为了了解不同厂家生产的散装面包的月销售量y (千克)与售价x (元/千克)之间的关系,随机统计了某几个月的月销售量与当月各散装面包的售价,相关数据如下表:由表中数据算出线性回归方程为 3.1ˆˆyx a =-+,则样本在()18180,处的残差为( ) A .0B .1.4C .2D .2.15.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1表2表3表4A .成绩B .视力C .智商D .阅读量6.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==7.两个分类变量X 和Y ,值域分别为{x 1,x 2}和{y 1,y 2},其样本频数分别是a =10,b =21,c +d =35,若X 与Y 有关系的可信程度为90%,则c =( ) A .4B .5C .6D .78.对两个分类变量A ,B 的下列说法中正确的个数为( )①A 与B 无关,即A 与B 互不影响; ②A 与B 关系越密切,则K 2的值就越大;③K 2的大小是判定A 与B 是否相关的唯一依据 A .0 B .1 C .2 D .39.近年来,由于大学生不理智消费导致财务方面的新闻层出不穷,无力偿还校园贷,跳楼自杀也偶有发生,一时间人们对大学生的消费观充满了质疑.为进一步了解大学生的消费情况,对S 城某大学的10000名(其中男生6000名,女生4000名)在校本科生,按性别采用分层抽样的方式抽取了1000名学生进行了问卷调查,其中有一项是针对大学生每月的消费金额进行调查统计,通过整理得如图所示的频率分布直方图.已知在抽取的学生中,月消费金额超过2000元的女生有150人.根据上述数据和频率分布直方图,判断下列说法正确的是( )参考数据与参考公式:003 1.732,sin150.258,sin7.50.1305=≈≈.A .月消费金额超过2000元的女生人数少于男生人数B .所调查的同学中月消费金额不超过500元的共有4人C .样本数据的中位数约为1750元D .在犯错的概率不超过0.1%的情况下认为月消费金额在2000元以上的大学生与性别有关 10.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:心脏病 无心脏病 秃发 20 300 不秃发5450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.001 11.已知变量x ,y 的一组观测数据如表所示: x 3 4 5 6 7 y4.02.5-0.50.5-2.0据此得到的回归方程为y bx a =+,若a =7.9,则x 每增加1个单位,y 的预测值就( ) A .增加1.4个单位B .减少1.2个单位C .增加1.2个单位D .减少1.4个单位12.对两个变量x 和y 进行回归分析,得到一组样本数据: ()()1122,,,x y x y ,…(),n n x y ,则下列说法中不正确的是( )A .由样本数据得到的回归方程ˆˆˆy bx a =+必过样本中心(),x yB .残差平方和越小的模型,拟合的效果越好C .若变量y 和x 之间的相关系数为0.9362r =-,则变量y 和x 之间具有线性相关关系D .用相关指数2R 来刻画回归效果, 2R 越小,说明模型的拟合效果越好二、填空题13.利用独立性检验考察两个分类变量X 与Y 是否有关系时,若K2的观测值k=6.132,则有__________的把握认为“X 与Y 有关系”. P(K2≥k0) 0.05 0.025 0.010 0.005 k03.8415.0246.6357.87914.已知方程ˆ0.8582.71yx =-是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,ˆy的单位是kg ,那么针对某个体(160,53)的残差是______________. 15.给出下列5种说法:①标准差越小,样本数据的波动也越小; ②回归分析研究的是两个相关事件的独立性;③在回归分析中,预报变量是由解释变量和随机误差共同确定的; ④相关指数是用来刻画回归效果的,的值越大,说明回归模型的拟合效果越好.⑤对分类变量X 与Y 的随机变量K 2的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握越小.其中说法正确的是________(请将正确说法的序号写在横线上).16.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”.17.某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2列联表,根据列联表的数据,可以有_____%的把握认为该学校15至16周岁的男生的身高和体重之间有关系.(注:独立性检验临界值表参考第9题,K 2=2()()()()()n ad bc a b c d a c b d -++++.) 18.下列4个命题:①为了了解800名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔为40;②四边形ABCD 为长方形,2AB =,1BC =,O 为AB 中点,在长方形ABCD 内随机取一点P ,取得的P 点到O 的距离大于1的概率为12π-; ③把函数3sin 23y x π⎛⎫=+ ⎪⎝⎭的图象向右平移6π个单位,可得到3sin 2y x =的图象; ④已知回归直线的斜率的估计值为1.23,样本点的中心为()4,5,则回归直线方程为1.230.08y x =+.其中正确的命题有__________.(填上所有正确命题的编号)19.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”__________.(填有或没有)附:()()()()()22n ad bcKa b c d a c b d-=++++20.某学校为了制定治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查.根据从中随机抽取的50份调查问卷,得到了如下的列联表:则认为“是否同意限定区域停产与家长的性别有关”的把握约为__________.附:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.三、解答题21.为了解某班学生喜爱玩游戏是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:已知在全部50人中随机抽取1人抽到喜爱玩游戏的学生的概率为3 5 .(1)请将上面的列联表补充完整(不用写计算过程);(2)能否在犯错误的概率不超过0.005的前提下认为喜爱玩游戏与性别有关?说明你的理由;(3)以该班学生的情况来估计全校女生喜爱玩游戏的情况,用频率代替概率.现从全校女生中抽取3人进一步调查,设抽到喜爱玩游戏的女生人数为ξ,求ξ的期望.下面的临界值表供参考:(参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++)22.为了响应国家号召,某校组织部分学生参与了“垃圾分类,从我做起”的知识问卷作答,并将学生的作答结果分为“合格”与“不合格”两类与“问卷的结果”有关?(1)是否有90%以上的把握认为“性别”与“问卷的结果”有关?(2)在成绩合格的学生中,利用性别进行分层抽样,共选取9人进行座谈,再从这9人中随机抽取5人发送奖品,记拿到奖品的男生人数为X,求X的分布列及数学期望()E X.附:22()()()()()n ad bcKa b c d a c b d-=++++()2P K k≥0.1000.0500.0100.001k2.7033.8416.63510.82823.为了研究家用轿车在高速公路上的车速情况,交通部门对100名家用轿车驾驶员进行调查,得到其在高速公路上行驶时的平均车速情况为:在55名男性驾驶员中,平均车速超过100km/h的有40人;在45名女性驾驶员中,平均车速不超过100km/h的有25人.(1)完成下面的列联表,并判断是否有99.5%的把握认为平均车速超过100km/h的人与性别有关.平均车速超过100km/h人数平均车速不超过100km/h人数合计男性驾驶员人数女性驾驶员人数合计(2)以上述数据样本来估计总体,现从高速公路上行驶的大量家用轿车中随机抽取3辆,记这3辆车中驾驶员为男性且车速超过100km/h的车辆数为X,若每次抽取的结果是相互独立的,求X的分布列和数学期望.参考公式与数据:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++24.黑人乔治•弗洛伊德被残杀死亡事件,引发了全世界的抗议.近期某校高二年级A班班主任对该班进行了一次调查,发现全班50名同学中,对此事关注的占25,他们在本学期期末考试中的政治成绩(满分100分)如下面的频率分布直方图:(1)根据频率分布直方图,求对此事关注的学生政治成绩的中位数的估计值(精确到0.1);(2)若政治成绩不低于80分的为优秀,请以是否优秀为分类变量, ①补充下面的22⨯列联表:政治成绩优秀 政治成绩不优秀 合计对此事关注 对此事不关注 合计参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据: P(20K k ≥)0.15 0.10 0.05 0.025 0.010 0.005 0.001k 2.072 2.706 3.841 5.024 6.6357.87910.82825.支付宝和微信支付是目前市场占有率较高的支付方式,某第三方调研机构对使用这两种支付方式的人数作了对比,从全国随机抽取了100个地区作为研究样本,计算了各个地区样本的使用人数,其频率分布直方图如下,(1)记A表示事件“微信支付人数低于50千人”,估计A的概率;(2)填写下面2╳2列联表,并根据2╳2列联表判断是否有99%的把握认为支付人数与支付方式有关;支付人数<50千支付人数≥50千人总计人微信支付支付宝支付 总计附:2()P K k ≥0.050 0.010 0.001 k3.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++. 26.某单位组织开展“学习强国”的学习活动,活动第一周甲、乙两个部门员工的学习情况统计如下:学习活跃的员工人数 学习不活跃的员工人数甲 18 12 乙328(1)根据表中数据判断能否有95%的把握认为员工学习是否活跃与部门有关; (2)活动第二周,单位为检查学习情况,从乙部门随机抽取2人,发现这两人学习都不活跃,能否认为乙部门第二周学习的活跃率比第一周降低了?说明理由.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:2(0.1) 2.706P K ≥=,2(0.05) 3.841P K ≥=,2(0.01) 6.635P K ≥=.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【解析】 令x=1,则(1+1)n =++…+=64.∴n=6.故(1+x)6的展开式中系数最大的项为T 4=x 3=20x 3.2.A解析:A 【分析】根据抽样方式的特征,可判断①;根据正态分布的性质,可判断②;根据二项分布的期望与方差特点,可判断③;根据独立性检验的方法和步骤,可判断④. 【详解】解:①根据抽样是间隔相同,且样本间无明显差异,故①应是系统抽样,即①为假命题;②某市进行了一次全市高中男生身高统计调查,数据显示某市30000高中男生的身高ξ(单位:cm )服从正态分布()2172,N σ,且(172180)0.4P ξ<≤=,所以()1(180)1721800.12P P ξξ>=-<≤=,所以该市身高高于180cm 的高中男生人数大约为300000.13000⨯=人,故②为真命题;③随机交量X 服从二项分布(100,0.4)B ,则()1000.440E X =⨯=,()()1000.410.424D X =⨯⨯-=,若随机变量21Y X =+,则Y 的数学期望为()()2181E Y E X =+=,方差为()()2296D Y D X ==;故③为假命题;④对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越小,故④为假命题. 故选:A . 【点睛】本题以命题的真假判断为载体考查了抽样方法,正态分布,二项分布及独立性检验等知识点,属于中档题.3.D解析:D 【分析】A 选项,由“若10xy ≠,则5x ≠或2y ≠”的逆否命题判断充分性,由其否命题判断必要性;由全称命题的否定的概念判断选项B ;由正态分布的性质判断选项C ;由相关系数的概念判断选项D. 【详解】对于选项A,命题“若10xy ≠,则5x ≠或2y ≠”的逆否命题为“若5x =且2x =,则10xy =”,为真命题,而命题“若10xy =,则5x =且2x =”为假命题,所以10xy ≠是5x ≠或2y ≠的充分不必要条件,故A 正确;对于选项B,由全称命题的否定可得p ⌝:x R ∃∈,210x x ++=,故B 正确;对于选项C,由随机变量()2~2,X N σ,且()40.84P X ≤=,则()()()041410.840.16P X P X P X ≤=≥=-≤=-=,故C 正确;对于选项D,相关系数r 越接近1,表示线性相关程度越强,故D 错误, 故选:D 【点睛】本题考查充分不必要条件的判断,考查全称命题的否定,考查正态分布的概率,考查相关系数的概念,熟练掌握各知识点是解题关键.4.B解析:B 【分析】根据表中的数据求出(),x y ,利用回归直线方程经过样本中心点(),x y 求出ˆa ,把18x = 代入回归直线方程求出ˆy,利用残差的定义ˆy y -即可求解. 【详解】由表格得(),x y 为()24,160 ,又回归直线方程 3.1ˆˆyx a =-+经过样本中心点(),x y , 所以160 3.124ˆa=-⨯+,解得ˆ234.4a =, 所以回归直线方程为 3.123.4ˆ4yx =-+, 把18x = 代入回归直线方程可得,ˆ178.6y=, 故样本在()18180, 处的残差为180178.6 1.4-=. 故选:B 【点睛】本题考查回归直线方程经过样本中心点和利用回归直线方程求某点处的残差;考查运算求解能力;熟练掌握回归直线方程经过样本中心点和残差的定义是求解本题的关键;属于中档题.5.D解析:D 【分析】计算得到22322214χχχχ>>>,得到答案. 【详解】计算得到:222152(6221410)5281636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯; 222252(4201612)521121636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯ ; 222352(824128)52961636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯ ; 222452(143062)524081636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯;故22322214χχχχ>>>. 故选:D . 【点睛】本题考查了独立性检验,意在考查学生的计算能力和应用能力.6.D解析:D 【解析】 【分析】 根据公式()()()()()22n ad bc K a b c d a c b d -=++++,分别利用4个选项中所给数据求出2K 的值,比较所求值的大小即可得结果. 【详解】选项A :22160(535155)3204010502K ⨯⨯-⨯==⨯⨯⨯,选项B :22260(5251515)152040204016K ⨯⨯-⨯==⨯⨯⨯,选项C :22360(5201520)24204025357K ⨯⨯-⨯==⨯⨯⨯,选项D :22460(5101530)96204035257K ⨯⨯-⨯==⨯⨯⨯,可得222431K K K >>22K >,所以由选项D 中的数据得到的2K 值最大,说明X 与Y 有关系的可能性最大,故选D . 【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2 K 越大两个变量有关的可能性越大这一性质.7.B解析:B 【解析】 【分析】根据22⨯列联表,以及独立检验随机变量的临界值参考表,计算2K 对应的值,验证24,5,6,7,c K =是否恰好满足即可【详解】列22⨯列联表可知:()22661030521 3.024 2.70615513135K ⨯⨯-⨯=≈>⨯⨯⨯,所以5c =时,X 与Y 有关系的可信程度为90%,而其余的值4,6,7c c c ===皆不满足,故选B . 【点睛】独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)8.B解析:B 【解析】 【分析】根据独立性检验的思想,对题目中的命题进行分析、判断正误即可. 【详解】对于①,对事件A 与B 无关时,说明两事件的影响较小,不是两个互不影响,①错误; 对于②,事件A 与B 关系密切,说明事件A 与B 的相关性就越强,K 2就越大,②正确; 对于③,K 2的大小不是判定事件A 与B 是否相关的唯一根据,判定两事件是否相关除了公式外;还可以用三维柱形图和二维条形图等方法来判定,③错误; 故选:B . 【点睛】本题考查了独立性检验思想的应用问题,属于基础题.K 2值是用来判断两个变量相关的把握度的,不是用来判断两个变量是否相关的.9.D解析:D 【解析】分析:由题意首先求得a 的值,然后结合分层抽样的定义和独立性检验的结论逐一考查所给选项是否正确即可.详解:由直方图知,(0.004+0.013+0.014+a +0.027+0.039+0.08)×5=1,解得a =0.023, 故月消费金额超过2000元的大学生人数为(0.023+0.014+0.013)×5×1000=250人, 由分层抽样知,男生、女生抽样的人数分别为600人和400人, 由题知,月消费金额超过2000元的男生人数为100人,故A 选项错误; 月消费金额不超过500元的人数为0.004×5×1000=20人,故选项B 错误; 又由频率分布直方图知,当消费金额小于1750元时, 频率为(0.004+0.027+0.039)×5+0.08×5×12=0.55>0.5.选项C 错误; 由条件可以列出列联表:故K 2的观测值()()()()()50010.8289n ad bc k a b c d a c b d -==>++++, 所以在犯错的概率不超过0.1%的情况下可以判断月消费金额在2000元以上的大学生与性别有关. 本题选择D 选项.点睛:解决频率分布直方图的问题,关键在于找出图中数据之间的联系.这些数据中,比较明显的有组距、频率组距,间接的有频率、小长方形的面积,合理使用这些数据,再结合两个等量关系:小长方形面积=组距×频率组距=频率,小长方形面积之和等于1,即频率之和等于1,就可以解决直方图的有关问题.10.D解析:D 【解析】010.828,10.0010.99999.90k ≥∴-==,则有0099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)11.D解析:D 【解析】由表格得 5x =, 0.9y =,∵回归直线方程为7ˆ9ˆ.y bx=+,过样本中心, ∴57.90.9b +=,即75b =-,则方程为77.95ˆyx =-+,则x 每增加1个单位,y 的预测值就减少1.4个单位,故选D.12.D解析:D 【解析】逐一分析所给的各个选项:A. 由样本数据得到的回归方程ˆˆˆy bx a =+必过样本中心(),x yB. 残差平方和越小的模型,拟合的效果越好C. 若变量y 和x 之间的相关系数为0.9362r =-,则变量y 和x 之间具有线性相关关系D. 用相关指数2R 来刻画回归效果,2R 越大,说明模型的拟合效果越好,该说法错误. 本题选择D 选项.二、填空题13.5【解析】∵K2的观测值k=6132>5024且k=6132<6635对照临界值表得有1–0025=975的把握认为X 与Y 有关系故答案为975解析:5% 【解析】∵K 2的观测值k =6.132>5.024,且k =6.132<6.635,对照临界值表得,有1–0.025=97.5%的把握认为“X 与Y 有关系”.故答案为97.5%.14.【解析】将代入得所以残差 解析:0.29-【解析】将160x =代入0.85 2.1ˆ87yx =-,得0.8516082.71ˆ53.29y =⨯-=,所以残差5353.ˆ290ˆ.29ey y =-=-=-. 15.①③④⑤【解析】试题分析:由题;①标准差越小样本数据的波动也越小由方差定义正确;②回归分析研究的是两个相关事件的独立性;错误因为相关性;③④⑤回到定义都正确考点:统计中的特征量及回归分析与独立性检验解析:①③④⑤ 【解析】试题分析:由题;①标准差越小,样本数据的波动也越小,由方差定义,正确; ②回归分析研究的是两个相关事件的独立性;错误,因为相关性; ③,④,⑤回到定义都正确.考点:统计中的特征量及回归分析与独立性检验.16.%【解析】试题分析:根据表中数据计算得所以有%以上的把握认为喜欢足球与性别有关考点:1列联表;2独立性假设检验解析:99.5% 【解析】试题分析:根据表中数据计算得,2250(1520105)8.3337.87925252030k ⨯⨯-⨯=≈>⨯⨯⨯,所以有99.5%以上的把握认为“喜欢足球与性别有关”.考点:1.列联表;2.独立性假设检验.17.5【分析】根据列联表运用公式求出k 值根据计算出的临界值同临界值表进行比较得到假设不合理的程度【详解】设该学校15至16周岁的男生的身高和体重情况为:偏高超重的记为a 偏高不超重记为b 不偏高超重记为c 不解析:5 【分析】根据列联表运用公式2()()()()()n ad bc k a b c d a c b d -=++++求出k 值,根据计算出的临界值,同临界值表进行比较,得到假设不合理的程度. 【详解】设该学校15至16周岁的男生的身高和体重情况为:偏高超重的记为a,偏高不超重记为b,不偏高超重记为c,不偏高不超重记为D, 则41a b ==,,312c d ==, 所以22()20(41213) 5.934()()()()(41)(312)(43)(112)n ad bc k a b c d a c b d -⨯-⨯==≈++++++++因为5.934 5.024>所以可以有97.5%的把握认为该学校15至16周岁的男生的身高和体重之间有关系. 故答案为97.5. 【点睛】本题考查了独立性检验的应用,我们可以利用临界值的大小来决定是否拒绝原来的统计假设.18.③④【解析】①为了了解800名学生对学校某项教改试验的意见打算从中抽取一个容量为40的样本考虑用系统抽样则分段的间隔为800÷40=20故①错误;②已知如图所示:长方形面积为2以O 为圆心1为半径作圆解析:③④ 【解析】①为了了解800名学生对学校某项教改试验的意见, 打算从中抽取一个容量为40的样本,考虑用系统抽样, 则分段的间隔为800÷40=20,故①错误; ②已知如图所示:长方形面积为2,以O 为圆心,1为半径作圆, 在矩形内部的部分(半圆)面积为π2. 因此取到的点到O 的距离大于1的概率22P 124ππ-==-; 故②错误;③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 23sin263y x x ππ⎡⎤⎛⎫=-+= ⎪⎢⎥⎝⎭⎣⎦的图象, 故③正确,④∵回归直线为ˆybx a =+, 的斜率的值为1.23, ∴方程为 1.23ˆyx a =+, ∵直线过样本点的中心(4,5), ∴a=0.08,∴回归直线方程是为=1.23x+0.08; ∴故④正确. 故答案为:③④.19.有【解析】根据表中数据计算观测值对照临界值知有95的把握认为南方学生和北方学生在选用甜品的饮食习惯方面有差异解析:有 【解析】根据表中数据,计算观测值22100(60102010)1003.8417030802021K ⨯-⨯==>⨯⨯⨯,对照临界值知,有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”。
高二年级下学期新课标A版高中数学选修2-3 第三章统计案例
就判断两个分类变量之间有关系.
数学 选修2-3
第三章 统计案例
自主学习 新知突破
合作探究 课堂互动
绘制等高条形图时,列联表的行对应的是高度,两行的数 据不相等,但对应的条形图的高度是相同的;两列的数据对应 不同的颜色.
数学 选修2-3
第三章 统计案例
独立性检验
自主学习 新知突破
合作探究 课堂互动
第三章 统计案例
[思路点拨]
自主学习 新知突破
合作探究 课堂互动
数学 选修2-3
第三章 统计案例
自主学习 新知突破
合作探究 课堂互动
(1)相应的等高条形图如图:
数学 选修2-3
第三章 统计案例
自主学习 新知突破
合作探究 课堂互动
(2)图中两个深色条的高分别表示司机血液中有酒精和无酒 精样本中对事故负有责任的频率,从图中可以看出,司机血液 中有酒精样本中对事故负有责任的频率明显高于司机血液中无 酒精样本中对事故负有责任的频率.由此可以认为司机血液中 含有酒精与对事故负有责任有关系.
解析: 其等高条形图如图所示.
由图可以直观地看出喜欢体育还是喜欢文娱与性别在某种 程度上有关系.
数学 选修2-3
第三章 统计案例
自主学习 新知突破
合作探究 课堂互动
利用随机变量K2判断分类变量间的关系
用水的调查表:
干净水 不干净水
合计
下表是某地区的一种传染病与饮
得病 52 94 146
不得病 466 218 684
数学 选修2-3
第三章 统计案例
附:
自主学习 新知突破
合作探究 课堂互动
P(K2≥k0) 0.025 0.010 0.005
最新整理高中数学人教A版选修2-3章末测试:第三章统计案例A Word版含解析.doc
第三章测评A(基础过关卷)(时间:100分钟 满分:100分)一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列有关线性回归的说法不正确的是( )A .变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B .在平面直角坐标系中用描点的方法得到具有相关关系的两个变量的一组数据的图形叫做散点图C .线性回归直线得到具有代表意义的回归直线方程D .任何一组观测值都能得到具有代表意义的回归直线方程 2.下列关于等高条形图说法正确的是( ) A .等高条形图表示高度相对的条形图 B .等高条形图表示的是分类变量的频数 C .等高条形图表示的是分类变量的百分比 D .等高条形图表示的是分类变量的实际高度3.一位母亲记录了儿子3~9岁的身高,数据略,由此建立的身高与年龄的回归模型为y ^=7.19x +73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )A .身高一定是145.83 cmB .身高在145.83 cm 以上C .身高在145.83 cm 左右D .身高在145.83 cm 以下4.某考察团对全国10个城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为y ^=0.66x +1.562,若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为( )A .72%B .83%C .67%D .66%5.已知一个线性回归方程为y ^=1.5x +45,其中x 的取值依次为1,7,5,13,19,则y =( ) A .60 B .46.5 C .58.5 D .756.在两个学习基础相当的班级实行某种教学措施的实验,测试结果见下表,则实验效果与教学措施( )优、良、中差总计实验班48250对比班381250总计8614100A.有关B.无关C.关系不明确D.以上都不正确7.已知x,y之间的一组数据如下表所示,则y对x的回归直线必经过()x 023 4y 2468A.(0,1)B.(2,5)C.(1.5,0)D.(2.25,5)8.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表如下:y1y2总计x1 a b a+bx2 c d c+d总计a+c b+d a+b+c+d对于以下数据,对同一样本能说明X与Y有关的可能性最大的一组为()A.a=9,b=8,c=7,d=6B.a=9,b=7,c=6,d=8C.a=8,b=6,c=9,d=7D.a=6,b=7,c=8,d=99.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面列联表:现判断数学成绩与物理成绩有关系,则判断的出错率为( ) A .0.5% B .1% C .2% D .5%10.两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数分别是a =10,b =21,c +d =35.若X 与Y 有关系的可信程度不小于97.5%,则c 等于( )A .3B .4C .5D .6二、填空题(本大题共5小题,每小题5分,共25分.把答案填在题中横线上) 11.从某地区15 000位老人中随机抽取500人,其生活能否自理的情况如下表所示:男 女 能 178 278 不能2321则该地区生活不能自理的老人中男性比女性约多________人.12.某超市为了了解热茶销售量y (杯)与气温x (℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天的气温,并制作了对照表:气温/℃ 18 13 10 -1 杯数24343864由表中数据算得线性回归方程y ^=b ^x +a ^中的b ^≈-2,预测当气温为-5 ℃时,热茶销售量为________杯.(已知回归系数b ^=∑n i =1x i y i -n x y∑ni =1x 2i -n x2,a ^=y -b ^x )13.下列是关于出生男婴与女婴调查的列联表:晚上 白天 总计 男婴 45 A B 女婴 E 35 C 总计98D180那么A =________,B =________,C =________,D =________,E =________. 14.甲、乙、丙、丁四位同学各自对A ,B 两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:甲 乙 丙 丁 r 0.82 0.78 0.69 0.85 m106115124103则这四位同学中,________同学的试验结果体现A ,B 两个变量有更强的线性相关性. 15.下列说法正确的有________(填写你认为正确的序号).①线性回归方法就是利用样本点去寻找一条贴近这些样本点的直线的数学方法; ②利用样本的散点图可以直观判断两个变量的关系是否可用线性关系表示;③通过线性回归方程y ^=b ^+a ^x 及回归系数b ^,可以估计和预测变量的取值及变化规律. 三、解答题(本大题共4小题,共25分.解答应写出必要的文字说明,证明过程或演算步骤)16.(6分)在一次恶劣气候的飞行航程中调查男女乘客在飞机上晕机的情况,共调查了89位乘客,其中男乘客有24人晕机,31人不晕机;女乘客有8人晕机,26人不晕机.根据此材料你是否认为在恶劣气候飞行中男人比女人更容易晕机?17.(6分)有两个分类变量x 与y ,其一组观测值如下面的2×2列联表所示:y 1 y 2 x 1 a 20-a x 215-a30+a其中a,15-a 均为大于5的整数,则a 取何值时,在犯错误的概率不超过0.1的前提下认为x 与y 之间有关系?18.(6分)针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的12,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧人数占女生人数的23.若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人?19.(7分)在某次试验中,有两个试验数据x ,y 统计的结果如下面的表格1.x 1 2 3 4 5 y234 45表格1序号 x y x 2 xy 1 1 2 1 2 2 2 3 4 6 3 3 4 9 12 4 4 4 16 16 5 5 5 25 25 ∑表格2(1)在给出的坐标系中画出x ,y 的散点图. (2)补全表格2,然后根据表格2的内容和公式b ^=∑n i =1x i y i -n x y∑ni =1x 2i -n x2,a ^=y -b ^x .①求出y 对x 的回归直线方程y ^=b ^x +a ^中回归系数a ^,b ^;②估计当x =10时,y ^的值是多少?参考答案一、1.解析:任何一组观测值并不能都得到具有代表意义的回归直线方程. 答案:D2.解析:由等高条形图的特点及性质进行判断. 答案:C3.解析:回归模型只能进行预测,应选C. 答案:C4.解析:因为当y ^=7.675时,x =7.675-1.5620.66≈9.262,所以7.6759.262≈0.829≈83%.答案:B5.解析:x =1+7+5+13+195=9,因为回归直线方程过点(x ,y ),所以y =1.5×x+45=1.5×9+45=58.5.答案:C6.解析:随机变量K 2的观测值k =100×(48×12-38×2)250×50×86×14≈8.306>6.635,则认为“实验效果与教学措施有关”的概率为0.99.答案:A7.解析:由公式y =b ^x +a ^知回归直线必过点(x ,y ),由题意可求得x =14(0+2+3+4)=2.25,y =14(2+4+6+8)=5,所以y 对x 的回归直线必经过点(2.25,5).答案:D8.解析:对于同一样本|ad -bc |越小,K 2越小,说明X 与Y 之间的关系越弱,|ad -bc |越大,K 2越大,说明X 与Y 之间的关系越强.答案:B9.解析:代入公式得K 2的观测值k =300×(37×143-35×85)272×228×122×178≈4.514>3.841,查表可得,判断的出错率为5%.答案:D10.解析:列2×2列联表如下故K 2的观测值k =66×(10d -21c )231×35×(10+c )×(21+d )≥5.024.把选项A ,B ,C ,D 代入验证可知选A. 答案:A二、11.解析:由表中数据可知,男性不能自理的频率为23500,女性不能自理的频率为21500,故15 000×⎝⎛⎭⎫23500-21500=60(人).答案:6012.解析:根据表格中的数据可求得 x =14×(18+13+10-1)=10,y =14×(24+34+38+64)=40.∴a =y -b ^x =40-(-2)×10=60,∴y ^=-2x +60,∴当x =-5时,y ^=-2×(-5)+60=70. 答案:7013.解析:∵45+E =98,∴E =53;∵E +35=C ,∴C =88; ∵98+D =180,∴D =82;∵A +35=D ,∴A =47; ∵45+A =B ,∴B =92. 答案:47 92 88 82 5314.解析:由题中表可知,丁同学的相关系数最大且残差平方和最小,故丁同学的试验结果体现A ,B 两变量有更强的线性相关性.答案:丁15.解析:样本的散点图可以直观判断两个变量是否线性相关,只有线性相关才能用线性回归的方法找到回归直线,并预测变量的取值及变化规律,故正确的答案是①②③.答案:①②③三、16.解:由已知数据列出2×2列联表晕机 不晕机 总计 男人 24 31 55 女人 8 26 34 总计325789根据公式k =89×(24×26-31×8)255×34×32×57≈3.689.由于k >2.706,我们有90%的把握认为在本次飞机飞行中晕机与男女有关.尽管从这班飞行中男性晕机的比例为2455比女性晕机的比例834要高,但我们不能认为恶劣气候下飞行中男性比女性更容易晕机,因为这种独立性检验的结果犯错误的概率为10%,从而说明犯错误的可能性较大.17.解:查表可知,要使在犯错误的概率不超过0.1的前提下认为x 与y 之间有关系,则k ≥2.706,而k =65×[a ×(30+a )-(20-a )×(15-a )]220×45×15×50由k ≥2.706,得a ≥7.19或a ≤2.04. 又a >5且15-a >5,a ∈Z ,即a =8或9.故a 为8或9时,在犯错误的概率不超过0.1的前提下认为x 与y 之间有关系. 18.解:设男生人数为x ,依题意可得列联表如下:喜欢韩剧不喜欢韩剧总计 男生 x 6 5x 6 x 女生 x 3 x 6 x 2 总计x 2x32x 若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则k >3.841, K 2=3x 2×⎝⎛⎭⎫x 6×x 6-5x 6×x 32x ×x 2×x 2×x =38x >3.841,解得x >10.24,∵x 2,x 6为整数,∴若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,男生至少有12人.19.解:(1)x ,y 的散点图如图(2)表格如下序号 x y x 2 xy 1 1 2 1 2 2 2 3 4 6 3 3 4 9 12 4 4 4 16 16 5 5 5 25 25 ∑15185561计算得x =3,y =3.6,b ^=∑5i =1x i y i -5x y∑5i =1x 2i -5x 2=61-5×3×3.655-5×32=0.7,a ^=y -b ^ x =3.6-0.7×3=1.5,所以y ^=b ^x +a ^=0.7x +1.5,②当x =10时,y ^=0.7×10+1.5=8.5.。
高中数学人教A版选修2-3 第三章 统计案例 3.2学业分层测评 Word版含答案.doc
学业分层测评(建议用时:45分钟)[学业达标]一、选择题1.通过对K2的统计量的研究得到了若干个临界值,当K2≤2.706时,我们认为()A.在犯错误的概率不超过0.05的前提下认为X与Y有关系B.在犯错误的概率不超过0.01的前提下认为X与Y有关系C.没有充分理由认为X与Y有关系D.不能确定【解析】∵K2≤2.706,∴没有充分理由认为X与Y有关系.【答案】 C2.下列关于等高条形图的叙述正确的是()A.从等高条形图中可以精确地判断两个分类变量是否有关系B.从等高条形图中可以看出两个变量频数的相对大小C.从等高条形图中可以粗略地看出两个分类变量是否有关系D.以上说法都不对【解析】在等高条形图中仅能粗略判断两个分类变量的关系,故A错.在等高条形图中仅能够找出频率,无法找出频数,故B错.【答案】 C3.分类变量X和Y的列联表如下:y1y2总计x1 a b a+bx2 c d c+d总计a+c b+d a+b+c+dA.ad-bc越小,说明X与Y关系越弱B.ad-bc越大,说明X与Y关系越弱C.(ad-bc)2越大,说明X与Y关系越强D.(ad-bc)2越接近于0,说明X与Y关系越强【解析】对于同一样本,|ad-bc|越小,说明X与Y之间关系越弱;|ad-bc|越大,说明X与Y之间的关系越强.【答案】 C4.利用独立性检验对两个分类变量是否有关系进行研究时,若有99.5%的把握认为事件A和B有关系,则具体计算出的数据应该是()A.k≥6.635B.k<6.635C.k≥7.879 D.k<7.879【解析】有99.5%的把握认为事件A和B有关系,即犯错误的概率为0.5%,对应的k0的值为7.879,由独立性检验的思想可知应为k≥7.879.【答案】 C5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下表的列联表:由K2=n(ad(a+b)(c+d)(a+c)(b+d)算得,k=110×(40×30-20×20)260×50×60×50≈7.8.附表:A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”【解析】由k≈7.8及P(K2≥6.635)=0.010可知,在犯错误的概率不超过1%的前提下认为“爱好该项运动与性别有关”,也就是有99%以上的把握认为“爱好该项运动与性别有关”.【答案】 C二、填空题6.在对某小学的学生进行吃零食的调查中,得到如下表数据:【导学号:97270063】【解析】由公式可计算得k=102×(27×29-34×12)239×63×61×41≈2.334.【答案】 2.3347.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射14天内的结果如表所示:【解析】根据独立性检验的基本思想,可知类似于反证法,即要确认“两个分量有关系”这一结论成立的可信程度,首先假设该结论不成立.对于本题,进行统计分析时的统计假设应为“小白鼠的死亡与电离辐射的剂量无关”.【答案】小白鼠的死亡与电离辐射的剂量无关8.在吸烟与患肺病是否相关的判断中,有下面的说法:①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.(填序号)【解析】K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.【答案】③三、解答题9.用两种检验方法对某食品做沙门氏菌检验,结果如下表.阳性阴性总计荧光抗体法1605165常规培养法264874总计18653239附:P(K2≥k0)0.0100.0050.001k0 6.6357.87910.828(1)(2)能否在犯错误的概率不超过0.001的前提下认为采用荧光抗体法与检验结果呈阳性有关系?【解】(1)作出等高条形图如图所示,由图知采用荧光抗体法与检验结果呈阳性有关系.(2)通过计算可知K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)≈113.184 6.而查表可知,因为P(K2≥10.828)≈0.001,而113.184 6远大于10.828,所以在犯错误的概率不超过0.001的前提下认为采用荧光抗体法与检验结果呈阳性有关系.10.有人发现一个有趣的现象,中国人的邮箱里含有数字比较多,而外国人邮箱名称里含有数字比较少,为了研究国籍和邮箱名称里含有数字的关系,他收集了124个邮箱名称,其中中国人的64个,外国人的60个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.(1)根据以上数据建立2×2列联表;(2)他发现在这组数据中,外国人邮箱里含数字的也不少,他不能断定国籍和邮箱名称里含有数字是否有关,你能帮他判断一下吗?【解】(1)2×2的列联表:(2)假设“由表中数据得k=124×(43×33-27×21)270×54×64×60≈6.201.因为k>5.024,所以有理由认为假设“国籍和邮箱名称里与是否含有数字无关”是不合理的,即在犯错误的概率不超过0.025的前提下认为“国籍和邮箱名称里与是否含有数字有关”.[能力提升]1.对两个分类变量A,B,下列说法中正确的个数为()①A与B无关,即A与B互不影响;②A与B关系越密切,则K2的值就越大;③K2的大小是判定A与B是否相关的唯一依据.A.1B.2C.3D.0【解析】①正确,A与B无关即A与B相互独立;②不正确,K2的值的大小只是用来检验A与B是否相互独立;③不正确,也可借助等高条形图等.故选A.【答案】 A2.(2016·晋江市季延中学期中)某研究所为了检验某血清预防感冒的作用,把500名使用了该血清的志愿者与另外500名未使用该血清的志愿者一年中的感冒记录作比较,提出假设H:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列叙述中正确的是()A.有95%的把握认为“这种血清能起到预防感冒的作用”B.若有人未使用该血清,那么他一年中有95%的可能性得感冒C.这种血清预防感冒的有效率为95%D.这种血清预防感冒的有效率为5%【解析】K2≈3.918>3.841,因此有95%的把握认为“这种血清能起到预防感冒的作用”,故选A.【答案】 A3.为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:设H k≈________(小数点后保留一位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.【解析】由公式计算得K2的观测值k≈4.9.∵k>3.841,∴我们有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.【答案】 4.95%4.(2016·潍坊高二检测)为了研究玉米品种对产量的影响,某农科院对一块试验田种植的一批玉米共10 000株的生长情况进行研究,现采用分层抽样方法抽取50株作为样本,统计结果如下:(1)6株玉米,再从这6株玉米中随机选出2株,求这2株之中既有高茎玉米又有矮茎玉米的概率;(2)根据对玉米生长情况作出的统计,是否有95%的把握认为玉米的圆粒与玉米的高茎有关?【解】(1)依题意,取出的6株圆粒玉米中含高茎2株,记为a,b;矮茎4株,记为A,B,C,D,从中随机选取2株的情况有如下15种:aA,aB,aC,aD,bA,bB,bC,bD,ab,AB,AC,AD,BC,BD,CD.其中满足题意的共有aA,aB,aC,aD,bA,bB,bC,bD,共8种,则所求概率为P=8 15.(2)根据已知列联表,得k=50×(11×7-13×19)230×20×24×26≈3.860>3.841,即有95%的把握认为玉米的圆粒与玉米的高茎有关.。
(必考题)高中数学高中数学选修2-3第三章《统计案例》测试题(答案解析)(1)
一、选择题1.给出下列说法:①回归直线ˆˆˆy bx a =+恒过样本点的中心(,)x y ,且至少过一个样本点;②两个变量相关性越强,则相关系数||r 就越接近1; ③将一组数据的每个数据都加一个相同的常数后,方差不变;④在回归直线方程ˆ20.5yx =-中,当解释变量x 增加一个单位时,预报变量ˆy 平均减少0.5个单位.其中说法正确的是( ) A .①②④B .②③④C .①③④D .②④2.某商场为了了解不同厂家生产的散装面包的月销售量y (千克)与售价x (元/千克)之间的关系,随机统计了某几个月的月销售量与当月各散装面包的售价,相关数据如下表:由表中数据算出线性回归方程为 3.1ˆˆyx a =-+,则样本在()18180,处的残差为( ) A .0B .1.4C .2D .2.13.下列关于回归分析与独立性检验的说法正确的是() A .回归分析和独立性检验没有什么区别;B .回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系;C .独立性检验可以100%确定两个变量之间是否具有某种关系.D .回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验;4.为了解高中生对电视台某节目的态度,在某中学随机调查了110名学生,根据得到的联表算得2K 的观测值 5.278k ≈. 附表:参照附表,得到的正确结论是 ( )A .在犯错误的概率不超过1%的前提下,认为“喜欢该节目与性别有关”B .在犯错误的概率不超过1%的前提下,认为“喜欢该节目与性别无关”C .有97.5%以上的把握认为“喜欢该节目与性别有关”D .有97.5%以上的把握认为“喜欢该节目与性别无关”5.通过随机询问250名不同性别的高中生在购买食物时是否看营养说明书,得到如下列联表:从调查的结果分析,认为性别和读营养说明书的关系为( ) 附:()()()()()22n ad bc K a b c d a c b d -=++++ . A .95%以上认为无关 B .90%~95%认为有关 C .95%~99.9%认为有关 D .99.9%以上认为有关6.已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:根据上表可得回归方程y bx a =+,计算得7b =,则当投入10万元广告费时,销售额的预报值为 A .75万元 B .85万元 C .99万元D .105万元7.对于相关指数R2,下列说法正确的是 A .R2的取值越小,模型拟合效果越好B .R2的取值可以任意大,且R2取值越大,拟合效果越好C .R2的取值越接近于1,模型拟合效果越好D .以上答案都不对8.通过随机询问72名不同性别的大学生在购买食物时是否看营养说明,得到如下列联表:性别与读营养说明列联表请问性别和读营养说明之间在多大程度上有关系 ( )A .99%的可能性B .99.75%的可能性C .99.5%的可能性D .97.5%的可能性9.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”,得到如下的列联表:由此表得到的正确结论是()A .在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别无关” C .在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关” D .在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别无关” 10.若在区间[-5,5]内任取一个实数a ,则使直线x +y +a =0与圆(x -1)2+(y +2)2=2有公共点的概率为( ) A .5B .25C .35D .1011.为了增强环保意识,某校从男生中随机抽取60人,从女生中随机抽取50人,参加环保知识测试,统计数据如下表所示: (参考数据:()21122122121212n n n n n n n n n χ++++-=)则认为环保知识测试成绩是否优秀与性别有关的把握为 A .90% B .95% C .99% D .99.9%12.下列说法:①将一组数据中的每个数据都乘以同一个非零常数a 后,标准差也变为原来的a 倍; ②设有一个回归方程35y x =-,变量x 增加1个单位时,y 平均减少5个单位; ③线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;④在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>,若ξ位于区域()0,1的概率为0.4,则ξ位于区域()1,+∞内的概率为0.6⑤利用统计量2χ来判断“两个事件,X Y 的关系”时,算出的2χ值越大,判断“X 与Y 有关”的把握就越大 其中正确的个数是 A .1B .2C .3D .4二、填空题13.已知方程是根据女大学生的身高预报她的体重的回归方程,其中x的单位是cm ,的单位是kg ,那么针对某个体(160,53)的残差是________.14.如表是降耗技术改造后生产某产品过程中记录产量(吨)与相应的生产能耗(吨标准煤)的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆˆ0.70.3yx =+,那么表中m 的值为__________.x3 4 5 6y2.5m44.515.给出下列5种说法:①标准差越小,样本数据的波动也越小; ②回归分析研究的是两个相关事件的独立性;③在回归分析中,预报变量是由解释变量和随机误差共同确定的; ④相关指数是用来刻画回归效果的,的值越大,说明回归模型的拟合效果越好.⑤对分类变量X与Y的随机变量K2的观测值k来说,k越小,判断“X与Y有关系”的把握越小.其中说法正确的是________(请将正确说法的序号写在横线上).16.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下联表:参考公式:()()()()()22n ad bcKa b c d a c b d-=++++参照附表,在犯错误的概率最多不超过__________(填百分比)的前提下,可认为“该种疫苗由预防埃博拉病毒感染的效果”.17.4月16日摩拜单车进驻大连市旅顺口区,绿色出行引领时尚,旅顺口区进行了“经常使用共享单车与年龄关系”的调查,得下列22⨯列联表:则得到的2χ=__________.(小数点后保留一位)(附:()()()()()22χ-=++++n ad bca b c d a c b d)18.某班运动队由足球运动员18人、篮球运动员12人、乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n的样本,若分别采用系统抽样法和分层抽样法,则都不用剔除个体;当样本容量为n+1时,若采用系统抽样法,则需要剔除1个个体,那么样本容量n为________.19.2018年春季,世界各地相继出现流感疫情,这已经成为全球性的公共卫生问题.为了考察某种流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:感染 未感染 总计 注射 10 40 50 未注射 20 30 50 总计3070100参照附表,在犯错误的概率最多不超过____的前提下,可认为“注射疫苗”与“感染流感”有关系.(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++.) 20()P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k 2.7063.8415.0246.6357.87910.82820.下列说法:①线性回归方程y bx a =+必过(),x y ;②命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃<+<” ③相关系数r 越小,表明两个变量相关性越弱;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系;其中正确..的说法是__________.(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表:三、解答题21.某共享单车经营企业欲向甲巿投放单车,为制定适宜的经营策略﹐该企业首先在已投放单车的乙市进行单车使用情况调查.调查过程分随机问卷﹑整理分析及开座谈会三个阶段.在随机问卷阶段,A ,B 两个调查小组分赴全市不同区域发放问卷并及时收回﹔在整理分析阶段,两个调查小组从所获取的有效问卷中,针对15岁至45岁的人群,按比例随机抽取了300份,进行了数据统计,具体情况如下表: 组别 年龄A 组统计结果B 组统计结果 经常使用单车 偶尔使用单车 经常使用单车 偶尔使用单车 [)15,2527人13人40人20人参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.参考数据:样本,再用分层抽样的方法将“年龄达到35岁”的被抽个体数分配到“经常使用单车”和“偶尔使用单车”中去.①求这60人中“年龄达到35岁且偶尔使用单车”的人数﹔②为听取对发展共享单车的建议,调查组专门组织所抽取的"年龄达到35岁且偶尔使用单车的人员召开座谈会,会后共有3份礼品赠送给其中3人,每人1份(其余人员仅赠送骑行优惠券).已知参加座谈会的人员中有且只有4人来自A组,求A组这4人中得到礼品的人数X的分布列和数学期望;(2)从统计数据可直观得出“是否经常使用共享单车与年龄有关”的结论.在用独立性检验的方法说明该结论成立时,为使犯错误的概率尽可能小,当年龄设定为25岁时,根据已有数据,完成下列2×2列联表(单位:人),并判断是否在犯错误的概率不超过1%的前提下有把握认为“经常使用共享单车与年龄有关”?22.为了解使用手机是否对学生的学习有影响,某校随机抽取50名学生,对学习成绩和使用手机情况进行了调查,统计数据如表所示(不完整):与使用手机有关;(2)现从上表不使用手机的学生中按学习成绩是否优秀分层抽样选出9人,再从这9人中随机抽取3人,记这3人中“学习成绩优秀”的人数为X ,试求X 的分布列与数学期望. 参考公式:()()()()()22n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.参考数据:()20P x χ≥0.0500.010 0.0010x3.841 6.635 10.82823.目前,新冠病毒引发的肺炎疫情在全球肆虐,为了解新冠肺炎传播途径,采取有效防控措施,某医院组织专家统计了该地区500名患者新冠病毒潜伏期的相关信息,数据经过汇总整理得到如图所示的频率分布直方图(用频率作为概率).潜伏期不高于平均数的患者,称为“短潜伏者”,潜伏期高于平均数的患者,称为“长潜伏者”.(1)求这500名患者潜伏期的平均数(同一组中的数据用该组区间的中点值作代表),并计算出这500名患者中“长潜伏者”的人数;(2)为研究潜伏期与患者年龄的关系,从上述500名患者中抽取300人,得到如下列联表,根据列联表判断是否有97.5%的把握认为潜伏期长短与患者年龄有关:短潜伏者 长潜伏者 合计60岁及以上 90 70 160 60岁以下 60 80 140 合计 15015030020P K k ≥()0.15 0.10 0.05 0.025 0.010 0.005 0.001 0k2.0722.7063.8415.0246.6357.87910.82822()()()()()n ad bc K a b c d a c b d -=++++24.为调研高中生的作文水平,在某市普通高中的某次联考中,参考的文科生与理科生人数之比为1∶4,且成绩分布在[]0,60的范围内,规定分数在50以上(含50)的作文获奖,按文理科用分层抽样的方法抽取400人的成绩作为样本,得到成绩的频率分布直方图如图所示,其中a ,b ,c 构成以2为公比的等比数列.(1)求a ,b ,c 的值;(2)填写下面22⨯列联表,能否在犯错误的概率不超过0.01的情况下认为“获奖”与“学生的文理科”有关?文科生 理科生 合计 获奖6不获奖合计400.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()2P K k ≥ 0.150.100.050.025 0.010 0.005 0.001k 2.072 2.706 3.841 5.024 6.635 7.879 10.82825.某地为响应国家“脱贫攻坚战”的号召,帮助贫困户脱贫,安排贫困人员参与工厂生产.现用A ,B 两条生产线生产某产品.为了检测该产品的某项质量指标值(记为Z ),现随机抽取这两种这两条生产线的产品各100件,由检测结果得到如下频率分布直方图.(Ⅰ)分别估计A ,B 两条生产线的产品质量指标值的平均数(同一组数据中的数据用该组区间的中点值作代表),从平均数结果看,哪条生产线的质量指标值更好?(Ⅱ)计算A 生产线的产品质量指标值的众数和中位数(中位数计算结果精确到小数点后两位).(Ⅲ)该公司规定当92Z ≥时,产品为超优品.根据所检测的结果填写22⨯列联表,并判断是否有95%的把握认为“生产超优品是否与生产线有关”.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++()20P K k ≥0.050 0.010 0.005 0.001 0k 3.8416.6357.87910.82822⨯列联表A 生产线B 生产线 总计超优品 非超优品 总计26.根据国家统计局数据,1999年至2019年我国进出口贸易总额从3万亿元跃升至31.6万亿元,中国在国际市场上的贸易份额越来越大对外贸易在国民经济中的作用日益突出.将年份1999,2004,2009,2014,2019分别用1,2,3,4,5代替,并表示为t ,y 表示全国进出口贸易总额.(1)根据以上统计数据及图表,给出了下列两个方案,请解决方案1中的问题. 方案1:用y bt a =+作为全国进出口贸易总额y 关于t 的回归方程,根据以下参考数据,求出y 关于t 的回归方程,并求相关指数21R .方案2:用dt y ce =作为全国进出口贸易总额y 关于t 的回归方程,求得回归方程0.57212.3259x y e =,相关指数22R .(2)通过对比(1)中两个方案的相关指数,你认为哪个方案中的回归方程更合适,并利用此回归方程预测2020年全国进出口贸易总额. 参考数据:y()()51=--∑i i i t ty y()521i i y y=-∑17.14 74 555.7920.140.340.66 1.86 2.048.192++++=222220.140.34 1.86 2.04 2.1412.336++++=③8.1920.0147555.792≈④12.3360.0222555.792≈参考公式:线性回归方程中的斜率和截距的最小二乘法估计公式分别为:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-,相关指数()()221211nii i n ii yy R yy==-=--∑∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】①中,根据回归直线方程的特征,可判定是不正确;②中,根据相关系数的意义,可判定是是正确的;③中,根据方差的计算公式,可判定是正确的;④中,根据回归系数的含义,可判定是正确的. 【详解】对于①中,回归直线ˆˆˆy bx a =+恒过样本点的中心(,)x y ,但不一定过一个样本点,所以不正确;对于②中,根据相关系数的意义,可得两个变量相关性越强,则相关系数||r 就越接近1,所以是正确的;对于③中,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,所以是正确的;对于④中,根据回归系数的含义,可得在回归直线方程ˆ20.5yx =-中,当解释变量x 增加一个单位时,预报变量ˆy平均减少0.5个单位,所以是正确的. 故选:B. 【点睛】本题主要考查了统计知识的相关概念及判定,其中解答中熟记回归直线方程的特征,回归系数的含义,相关系数的意义,以及方程的计算方法是解答的关键,属于基础题.2.B解析:B 【分析】根据表中的数据求出(),x y ,利用回归直线方程经过样本中心点(),x y 求出ˆa ,把18x = 代入回归直线方程求出ˆy,利用残差的定义ˆy y -即可求解. 【详解】由表格得(),x y 为()24,160 ,又回归直线方程 3.1ˆˆyx a =-+经过样本中心点(),x y , 所以160 3.124ˆa=-⨯+,解得ˆ234.4a =, 所以回归直线方程为 3.123.4ˆ4yx =-+, 把18x = 代入回归直线方程可得,ˆ178.6y=, 故样本在()18180, 处的残差为180178.6 1.4-=. 故选:B 【点睛】本题考查回归直线方程经过样本中心点和利用回归直线方程求某点处的残差;考查运算求解能力;熟练掌握回归直线方程经过样本中心点和残差的定义是求解本题的关键;属于中档题.3.D解析:D 【分析】根据题意可知,利用回归分析和独立性检验的定义,排除错误选项,即可求解出答案. 【详解】回归分析是指将具有相关关系的两个变量之间的数量关系进行测定,通过建立数学表达式进行统计估计和预测的统计研究方法.独立性检验是对两个变量之间是否具有某种关系的分析,并且可以分析这两个变量在多大程度上具有这种关系,但不能100%肯定这种关系.根据以上定义,可知A 、B 、C 均错误,故答案选D . 【点睛】本题主要考查了回归分析与独立性检验的定义的区别.4.C解析:C 【分析】因为5.278 6.635<,根据附表中的数据,即可得到判断的结论,得到答案. 【详解】因为5.278 6.635<,所以不能在犯错误的概率不超过1%的前提下,认为“喜欢该节目与性别有关”;又5.278 5.024>,所以有97.5%以上的把握认为“喜欢该节目与性别有关”,故选C . 【点睛】本题主要考查独立性检验的应用,独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式计算2K 的观测值k ;(3)查表比较k 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误)5.D解析:D 【解析】分析:由列联表中的数据,利用公式()()()()()22n ad bc K a b c d a c b d -=++++求得2K ,与邻界值比较,即可得到结论. 详解:()222509070603021.6310.828120130150100K ⨯⨯-⨯=≈>⨯⨯⨯,∴有0099.9的把握认为性别和读营养说明书的有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)6.B解析:B【解析】分析:根据表中数据求得样本中心(,)x y ,代入回归方程ˆ7ˆyx a =+后求得ˆa ,然后再求当10x =的函数值即可. 详解:由题意得11(24568)5,(3040506070)5055x y =++++==++++=, ∴样本中心为(5,50).∵回归直线ˆ7ˆyx a =+过样本中心(5,50), ∴ˆ5075a=⨯+,解得ˆ15a =, ∴回归直线方程为ˆ715yx =+. 当10x =时,710158ˆ5y=⨯+=, 故当投入10万元广告费时,销售额的预报值为85万元. 故选B .点睛:本题考查回归直线过样本中心这一结论和平均数的计算,考查学生的运算能力,属容易题.7.C解析:C 【解析】两个变量y 与x 的回归模型中,它们的相关指数R 2越接近于1,这个模型的拟合效果越好.故选C .8.C解析:C 【详解】由题意可知16,28,20,8a b c d ====,44,28,36,36a b c d a c c d +=+=+=+=,72n a b c d =+++=,代入公式()()()()()22n ad bc K a b c d a c b d -=++++得()227216828208.4244283636K ⨯⨯-⨯=≈⨯⨯⨯,由于28.427.879K ≈>,我们就有0099.5的把握认为性别和读营养说明之间有关系,即性别和读营养说明之间有0099.5的可能是有关系的,故选C .9.C解析:C 【解析】由2×2列联表得到a =45,b =10,c =30,d =15.则a +b =55,c +d =45,a +c =75,b +d =25,ad =675,bc =300,n =100.所以K 2的观测值k =2100675-30055457525⨯⨯⨯()≈3.030.因为2.706<3.030<3.841.选C. 点睛:根据卡方公式求K 2,再与参考数据比较,最后作出判断.10.B解析:B 【解析】∵直线0x y a ++=与圆()()22122x y -+=+有公共点,∴≤13a -≤≤,∴在区间[55]-,内任取一个实数a ,使直线0x y a ++=与圆()()22122x y -+=+有公共点的概率为312555+=+,故选B. 点睛:本题主要考查了几何概型的概率,以及直线与圆相交的性质,解题的关键弄清概率类型,同时考查了计算能力,属于基础题;利用圆心到直线的距离小于等于半径可得到直线与圆有公共点,可求出满足条件的a ,最后根据几何概型的概率公式可求出所求.11.C解析:C 【解析】 由题意得:()221104030202060505060χ⨯-⨯=≈⨯⨯⨯7.8>6.635,所以认为环保知识测试成绩是否优秀与性别有关的把握为99%. 本题选择C 选项.12.B解析:B 【解析】逐一考查所给的说法:①将一组数据中的每个数据都乘以同一个非零常数a 倍,原说法错误;②设有一个回归方程35y x =-,变量x 增加1个单位时,y 平均减少5个单位,原说法正确;③线性相关系数r 的绝对值越大,两个变量的线性相关性越强;反之,线性相关性越弱,原说法错误;④在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>,若ξ位于区域()0,1的概率为0.4,则ξ位于区域()1,+∞内的概率为0.5,原说法错误;⑤利用统计量2χ来判断“两个事件,X Y 的关系”时,算出的2χ值越大,判断“X 与Y 有关”的把握就越大,原说法正确. 本题选择B 选项.二、填空题13.【解析】将x =160代入得所以残差考点:线性回归方程残差解析:【解析】将x=160代入,得,所以残差考点:线性回归方程,残差.14.8【解析】由题意得即数据的样本中心代入回归直线方程得考点:回归直线方程的应用解析:8【解析】由题意得,3456911,424mx y++++===,即数据的样本中心911(,)24m+,代入回归直线方程,得1190.70.3 2.842mm+=⨯+⇒=.考点:回归直线方程的应用.15.①③④⑤【解析】试题分析:由题;①标准差越小样本数据的波动也越小由方差定义正确;②回归分析研究的是两个相关事件的独立性;错误因为相关性;③④⑤回到定义都正确考点:统计中的特征量及回归分析与独立性检验解析:①③④⑤【解析】试题分析:由题;①标准差越小,样本数据的波动也越小,由方差定义,正确;②回归分析研究的是两个相关事件的独立性;错误,因为相关性;③,④,⑤回到定义都正确.考点:统计中的特征量及回归分析与独立性检验.16.【详解】由题意可得参照附表可得:在犯错误的概率不超过的前提下认为小动物是否被感染与有没有服用疫苗有关故答案为【方法点睛】本题主要考查独立性检验的应用属于中档题独立性检验的一般步骤:(1)根据样本数据解析:5%【详解】由题意可得,()22100103020404.762 3.84150503070K⨯⨯-⨯=≈>⨯⨯⨯,参照附表,可得:在犯错误的概率不超过005的前提下,认为“小动物是否被感染与有没有服用疫苗有关”,故答案为005.【方法点睛】本题主要考查独立性检验的应用,属于中档题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3)查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)17.【解析】将代入可得应填答案 解析:2.1【解析】将100,20,60,20a b c d ====代入()()()()()22n ad bc a b c d a c b d χ-=++++可得22200(20001200) 2.11604012080x -=≈⨯⨯⨯,应填答案2.1。
高二数学 人教A版选修2-3习题 第3章 统计案例3.2 Word版含答案
选修2-3 第三章 3.2一、选择题1.给出下列实际问题:①一种药物对某种病的治愈率;②两种药物治疗同一种病是否有区别;③吸烟者得肺病的概率;④吸烟是否与性别有关系;⑤网吧与青少年的犯罪是否有关系.其中用独立性检验可以解决的问题有( )A .①②③B .②④⑤C .②③④⑤D .①②③④⑤[答案] B[解析] 独立性检验是判断两个分类变量是否有关系的方法,而①③都是概率问题,不能用独立性检验.2.假设有两个分类变量X 与Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其2×2列联表为:y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计a +cb +da +b +c +d( ) A .a =5,b =4,c =3,d =2 B .a =5,b =3,c =4,d =2 C .a =2,b =3,c =4,d =5 D .a =2,b =3,c =5,d =4 [答案] D[解析] 比较|a a +b -cc +d |.选项A 中,|59-35|=245;选项B 中,|58-46|=124;选项C 中,|25-49|=245;选项D 中,|25-59|=745.故选D .3.某卫生机构对366人进行健康体检,其中某项检测指标阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,有______的把握认为糖尿病患者与遗传有关系.( )A .99.9%B .99.5%C .99%D .97.5%[答案] D[解析] 可以先作出如下列联表(单位:人):糖尿病患者与遗传列联表k =366×(16×240-17×93)2109×257×33×333≈6.067>5.024.故我们有97.5%的把握认为糖尿病患者与遗传有关系.4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d )算得,K 2=110×(40×30-20×20)260×50×60×50≈7.8.附表:A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” [答案] A[解析] 根据独立性检验的定义,由K 2≈7.8>6.635可知,有99%以上把握认为“爱好该项运动与性别有关”.5.某调查机构调查教师工作压力大小的情况,部分数据如表:( ) A .0.01 B .0.05 C .0.10 D .0.005[答案] B [解析]K 2=n (ad -bc )2(a +b )(a +c )(c +d )(d +b )=100(53×1-12×34)287×13×65×35≈4.9>3.841,因此,在犯错误的概率不超过0.05的前提下,认为工作压力大与不喜欢教师职业有关系. 6.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )①若K 2的观测值满足K 2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误A .①B .①③C .③D .②[答案] C[解析] ①推断在100个吸烟的人中必有99人患有肺病,说法错误,排除A 、B ,③正确.排除D ,选C . 二、填空题7.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:K 2=50×(13×20-10×7)223×27×20×30≈4.844,因为K 2≥3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________.[答案] 5%[解析] ∵k >3.841,所以有95%的把握认为主修统计专业与性别有关,出错的可能性为5%.8.吃零食是中学生中普遍存在的现象.吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表给出性别与吃零食的列联表男女总计喜欢吃零食51217不喜欢吃零食402868合计454085 试回答吃零食与性别有关系吗?(答有或没有)____________.[答案]有[解析]K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=85(140-480)217×68×45×40=98260002080800≈4.700>3.841.故约有95%的把握认为“吃零食与性别”有关.9.调查者通过随机询问72名男女中学生喜欢文科还是理科,得到如下列联表(单位:名):性别与喜欢文科还是理科列联表喜欢文科喜欢理科总计男生82836女生201636总计284472中学生的性别和喜欢文科还是理科________关系.(填“有”或“没有”)[答案]有[解析]通过计算K2的观测值k=72×(16×8-28×20)236×36×44×28≈8.42>7.879.故我们有99.5%的把握认为中学生的性别和喜欢文科还是理科有关系.三、解答题10.为调查某社区居民的业余生活状况,研究这一社区居民在2000-2200时间段的休闲方式与性别的关系,随机调查了该社区80人,得到下面的数据表:休闲方式性别看电视看书合计男105060女101020合计206080(1)性别有关系”?(2)将此样本的频率作为总体的概率估计值,随机调查3名在该社区的男性,设调查的3人在这一时间段以看书为休闲方式的人数为随机变量X.求X的数学期望和方差.附:P (K 2≥k 0)0.050 0.010 0.001 k 03.8416.63510.828K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).[解析] (1)根据样本提供的2×2列联表得 K 2=80×(10×10-10×50)260×20×20×60≈8.889>6.635;所以有99%的把握认为“在2000-2200时间段居民的休闲方式与性别有关”. (2)由题意得,X ~B (3,56),所以E (X )=3×56=52,D (X )=3×56×(1-56)=512.一、选择题 1.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一条直线的回归方程为y ^=3-5x ,变量x 增加一个单位时,y 平均增加5个单位; ③线性回归直线y ^=b ^x +a ^必过点(x -,y -);④在一个2×2列联表中,由计算得K 2=13.079,则有99%的把握确认这两个变量间有关系.其中错误的个数是( )A .0B .1C .2D .3本题可以参考独立性检验临界值表:P (K 2≥k 0)0.50 0.40 0.25 0.15 0.10 k 0 0.455 0.708 1.323 2.072 2.706 P (K 2≥k 0)0.05 0.025 0.010 0.005 0.001 k 03.8415.0246.6357.87910.828[答案] B[解析] 一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x 的系数具备直线斜率的功能,对于回归方程y ^=3-5x ,当x 增加一个单位时,y 平均减少5个单位,②错误;由线性回归方程的定义知,线性回归直线y ^=b ^x +a ^必过点(x -,y -),③正确;因为K 2=13.079>10.828,故有99%的把握确认这两个变量有关系,④正确,故选B .2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )A .成绩B .视力C .智商D .阅读量[答案] D [解析] A 中,K 2=52×(6×22-10×14)220×32×16×36=131440; B 中,K 2=52×(4×20-12×16)220×32×16×36=637360; C 中,K 2=52×(8×24-8×12)220×32×16×36=1310; D中,K 2=52×(14×30-2×6)220×32×16×36=3757160. 因此阅读量与性别相关的可能性最大,所以选D . 二、填空题3.某高校《统计初步》课程的教师随机调查了选该课程的学生的一些情况,具体数据如下:专业性别非统计专业统计专业 男 13 10 女720为了判断主据,得到K 2=50×(13×20-10×7)223×27×20×30≈4.844>3.841,所以断定主修统计专业与性别有关系,那么这种判断出错的可能性约是________.[答案] 5%[解析] ∵P (k 2≥3.841)≈0.05,故判断出错的可能性为5%.4.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射后14天内的结果如下表所示:死亡 存活 合计第一种剂量 14 11 25 第二种剂量 6 19 25 合计203050. [答案] 小白鼠的死亡与电离辐射的剂量无关[解析] 根据独立性检验的基本思想,可知类似于反证法,即要确认“两个分量有关系”这一结论成立的可信程度,首先假设该结论不成立.对于本题,进行统计分析时的统计假设应为“小白鼠的死亡与电离辐射的剂量无关”. 三、解答题5.某中学一名数学老师对全班50名学生某次考试成绩分男女生进行了统计,其中120分(含120分)以上为优秀,绘制了如下的两个频率分布直方图:(1)根据以上两个直方图完成下面的2×2列联表:成绩性别优秀 不优秀 合计 男生 女生 总计(2)根据(1). P (K 2≥k 0)0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828[解析] (1)成绩性别优秀 不优秀 合计 男生 13 10 23 女生 7 20 27 总计203050(2)由(1)K 2=50×(13×20-7×10)220×30×27×23≈4.844.∵K 2≈4.844>3.841,∴有95%的把握认为学生的数学成绩与性别之间有关系.(3)成绩在[130,140]的学生中男生有50×0.008×10=4人,女生有50×0.004×10=2人; 从6名学生中任取2人,共有C 26=15种选法; 若选取的都是男生,共有C 24=6种选法; 故所求事件的概率P =1-C 24C 26=35.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课后巩固
.下列变量是相关关系的是( )
.人的身高与视力
.圆心角的大小与其所对的圆弧长
.直线上某点的横坐标与纵坐标
.人的年龄与身高
答案
解析不是相关关系;、是函数关系;人的年龄与身高存在相关关系,因为身高不仅受年龄的影响,还受遗传、饮食、环境等因素的影响.
.对于线性相关系数,叙述正确的是( )
.∈(,+∞),越大,相关程度越大,反之,相关程度越小
.∈(-∞,+∞),越大,相关程度越大,反之,相关程度越小
.≤,且越接近于,相关程度越大;越接近于,相关程度越小
.以上说法都不对
答案
.由一组样本数据(,),(,),…,(,)得到的线性回归方程为=+,那么下面说法不正确的是( )
.直线=+必经过点(,)
.直线=+至少经过点(,),(,),…,(,)中的一个点
.直线=+的斜率为\(),\(=)\()-\())
.直线=+和各点(,),(,),…,(,)的残差平方和)(-)是该坐标平面上所有直线与这些点残差平方和中最小的
答案
.甲、乙、丙、丁四位同学各自对、两变量的线性相关性作试验,并用回归分析方法分别求得相关系数与残差平方和如下表:
.甲.乙
.丙.丁
答案
解析由表可知,丁同学的相关系数最大且残差平方和最小,故丁同学的试验结果体现、两变量更强的线性相关性.
.为了研究某种细菌随时间变化繁殖个数的变化情况,收集数据如下:
()
()求与之间的回归方程;
()计算残差,,并描述解释变量与预报变量之间的关系.
解析()散点图如图所示:
()由散点图看出样本点分布在一条指数曲线=的周围,于是令=,则
+.
()
-)=,
(-)=-≈ ,
=
≈-)≈ ,
即解释变量时间对预报变量系列细菌的个数解释了.。