高中数学统计练习题
(精选试题附答案)高中数学第九章统计经典大题例题
(名师选题)(精选试题附答案)高中数学第九章统计经典大题例题单选题1、某中学高一年级有400人,高二年级有320人,高三年级有280人,若每人被抽到的可能性都为0.2,用随机数表法在该中学抽取容量为n的样本,则n等于()A.80B.160C.200D.280答案:C分析:每个个体被抽的可能性等于样本容量除以总体数,由此列出关于n的方程并求解出结果.=0.2,解得n=200,由题意可知:n400+320+280故选:C.2、某校为了解学生的课外锻炼身体的情况,随机抽取了部分学生,对他们一周的课外锻炼时间进行了统计,统计数据如下表所示:则该校学生一周进行课外锻炼的时间的第40百分位数是()A.8.5B.8C.7D.9答案:A分析:根据百分位数的求法计算即可.抽取的学生人数为6+10+9+8+7=40.由40%×40=16,故第40百分位数为所有数据从小到大排序的第16项与第17项数据的平均数,=8.5.即8+92故选: A.3、下列调查方式较为合适的是()A.为了了解灯管的使用寿命,采用普查的方式B.为了了解我市中学生的视力状况,采用抽样调查的方式C.调查一万张面值为100元的人民币中有无假币,采用抽样调查的方式D.调查当今中学生喜欢什么体育活动,采用普查的方式答案:B分析:根据实际情况选择合适的调查方式即可判断.对A,为了了解灯管的使用寿命,应采用抽样调查的方式,故A错误;对B,为了了解我市中学生的视力状况,采用抽样调查的方式,故B正确;对C,调查一万张面值为100元的人民币中有无假币,采用抽样普查的方式,故C错误;对D,调查当今中学生喜欢什么体育活动,采用抽样普查的方式,故D错误.故选:B.4、2021年3月,树人中学组织三个年级的学生进行“庆祝中国共产党成立100周年”党史知识竞赛.经统计,得到前200名学生分布的饼状图(如图)和前200名中高一学生排名分布的频率条形图(如图),则下列命题错.误.的是()A.成绩前200名的200人中,高一人数比高二人数多30人B.成绩第1-100名的100人中,高一人数不超过一半C.成绩第1-50名的50人中,高三最多有32人D.成绩第51-100名的50人中,高二人数比高一的多答案:D分析:根据饼状图和条形图提供的数据判断.由饼状图,成绩前200名的200人中,高一人数比高二人数多200×(45%−30%)=30,A正确;=45<50,B 由条形图知高一学生在前200名中,前100和后100人数相等,因此高一人数为200×45%×12正确;成绩第1-50名的50人中,高一人数为200×45%×0.2=18,因此高三最多有32人,C正确;第51-100名的50人中,高二人数不确定,无法比较,D错误.故选:D.5、某射击运动员6次的训练成绩分别为:88,91,89,88,86,85,则这6次成绩的第70百分位数为()A.89B.89.5C.90D.90.5答案:A分析:先将数据按从小到大的顺序排列,计算6×70%=4.2不是整数,则所求的是从小到大排列的第5位数6次考试数学成绩从小到大为:85,86,88,88,89,91,6×70%=4.2,∴这名学生6次训练成绩的第70百分位数为89 .故选:A6、某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率直方图如图所示,估计棉花纤维的长度的样本数据的80百分位数是()A.29 mmB.29.5 mmC.30 mmD.30.5 mm答案:A分析:先求得棉花纤维的长度在30 mm以下的比例为85%,在25 mm以下的比例为85%-25%=60%,从而可得80百分位数一定位于[25,30)内,进而可求出答案棉花纤维的长度在30 mm以下的比例为(0.01+0.01+0.04+0.06+0.05)×5=0.85=85%,在25 mm以下的比例为85%-25%=60%,因此,80百分位数一定位于[25,30)内,=29,由25+5×0.80−0.600.85−0.60可以估计棉花纤维的长度的样本数据的80百分位数是29 mm.故选:A7、根据气象学上的标准,连续5天的日平均气温低于10℃即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①、②、③、④,依次计算得到结果如下:①平均数x̅<4;②平均数x̅<4且极差小于或等于3;③平均数x̅<4且标准差s≤4;④众数等于5且极差小于或等于4.则4组样本中一定符合入冬指标的共有()A .1组B .2组C .3组D .4组答案:B分析:举反例否定①;反证法证明②符合要求;举反例否定③;直接法证明④符合要求.①举反例:0,0,0,4,11,其平均数x̅=3<4.但不符合入冬指标;②假设有数据大于或等于10,由极差小于或等于3可知,则此组数据中的最小值为10−3=7,此时数据的平均数必然大于7,与x̅<4矛盾,故假设错误.则此组数据全部小于10. 符合入冬指标;③举反例:1,1,1,1,11,平均数x̅=3<4,且标准差s =4.但不符合入冬指标;④在众数等于5且极差小于等于4时,则最大数不超过9.符合入冬指标.故选:B .8、关于圆周率π,数学发展史上出现过许多很有创意的求法,如著名的浦丰实验和查理斯实验.受其启发,我们也可以通过设计下面的实验来估计π的值:先请全校m 名同学每人随机写下一个都小于1的正实数对(x,y );再统计两数能与1构成钝角三角形三边的数对(x,y )的个数a ;最后再根据统计数a 估计π的值,那么可以估计π的值约为( )A .4a mB .a+2mC .a+2m mD .4a+2m m答案:D解析:由试验结果知m 对0~1之间的均匀随机数x,y ,满足{0<x <10<y <1,面积为1,再计算构成钝角三角形三边的数对(x,y),满足条件的面积,由几何概型概率计算公式,得出所取的点在圆内的概率是圆的面积比正方形的面积,即可估计π的值.解:根据题意知,m 名同学取m 对都小于1的正实数对(x,y ),即{0<x <10<y <1, 对应区域为边长为1的正方形,其面积为1,若两个正实数x,y 能与1构成钝角三角形三边,则有{x 2+y 2<1x +y >10<x <10<y <1,其面积S =π4−12;则有a m =π4−12,解得π=4a+2m m故选:D .小提示:本题考查线性规划可行域问题及随机模拟法求圆周率的几何概型应用问题. 线性规划可行域是一个封闭的图形,可以直接解出可行域的面积;求解与面积有关的几何概型时,关键是弄清某事件对应的面积,必要时可根据题意构造两个变量,把变量看成点的坐标,找到试验全部结果构成的平面图形,以便求解.9、某校高一共有10个班,编号为01,02,…,10,现用抽签法从中抽取3个班进行调查,设高一(5)班被抽到的可能性为a ,高一(6)班被抽到的可能性为b ,则( )A .a =310,b =29B .a =110,b =19 C .a =310,b =310D .a =110,b =110答案:C分析:根据简单随机抽样的定义,分析即可得答案.由简单随机抽样的定义,知每个个体被抽到的可能性相等,故高一(5)班和高一(6)班被抽到的可能性均为310. 故选:C10、为调查参加考试的高二级1200名学生的成绩情况,从中抽查了100名学生的成绩,就这个问题来说,下列说法正确的是( )A .1200名学生是总体B .每个学生是个体C .样本容量是100D .抽取的100名学生是样本答案:C分析:根据总体、个体、样本容量、样本的定义,结合题意,即可判断和选择.根据题意,总体是1200名学生的成绩;个体是每个学生的成绩;样本容量是100,样本是抽取的100名学生的成绩;故正确的是C.故选:C.填空题11、某市A、B、C三个区共有高中学生20000人,其中A区高中学生7000人,现采用分层抽样的方法从这三个区所有高中学生中抽取一个容量为600人的样本进行学习兴趣调查,则A区应抽取__________________.答案:210分析:根据总体数和要抽取的样本数,得到每个个体被抽到的概率,利用这个概率乘以A区的人数,得到A区要抽取的人数.解:由题意知A区在样本中的比例为700020000∴A区应抽取的人数是700020000×600=210.所以答案是:210.12、某单位有员工900人,其中女员工有360人,为做某项调查,拟采用分层抽样的方法抽取容量为150的样本,则应抽取的男员工人数是_______________________.答案:90分析:按照分层抽样的定义,按照比例抽取即可由题意,设应抽取的男员工人数是x则900−360900=x150解得:x=90所以答案是:9013、已知一组数据:20,30,40,50,50,60,70,80,记这组数据的第60百分位数为a,众数为b,则a和b的大小关系是______________.(用“<”“>”或“=”连接)答案:a=b##b=a分析:由百分位数求法得50为第60百分位数,并确定数据的众数,即可比较它们的大小关系.因为8×60%=4.8,所以这组数据的第5个数:50为第60百分位数.观察易知这组数据的众数为50,所以a和b的大小关系是a=b.所以答案是:a=b14、某校从高一新生中随机抽取了一个容量为20的身高样本,数据从小到大排序如下(单位:cm):152 ,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170 ,171,x,174,175,若样本数据的第90百分位数是173,则x的值为________.答案:172分析:根据百分位数的意义求解.百分位数的意义就在于,我们可以了解的某一个样本在整个样本集合中所处的位置,=173,x=172本题第90百分位数是173,所以x+1742故答案为:172小提示:本题考查样本数据的第多少百分位数的概念.15、气象意义上从春季进入夏季的标志为连续5天的日平均温度均不低于22℃.现有甲、乙、丙三地连续5天的日平均温度的记录数据:(记录数据都是正整数)①甲地5个数据的中位数为24,众数为22;②乙地5个数据的中位数为27,总体均值为24;③丙地5个数据中有一个数据是32,总体均值为26,总体方差为10.8.则肯定进入夏季的地区有_____.答案:①③分析:根据数据的特点进行估计甲、乙、丙三地连续5天的日平均气温的记录数据,分析数据的可能性进行解答即可得出答案.①甲地:5个数据的中位数为24,众数为22,根据数据得出:甲地连续5天的日平均温度的记录数据可能为:22、22、24、25、26,其连续5天的日平均气温均不低于22;②乙地:5个数据的中位数为27,总体均值为24,当5个数据为19、20、27、27、27,可知其连续5天的日平均温度有低于22,故不确定;③丙地:5个数据中有一个数据是32,总体均值为26,若有低于22,假设取21,此时方差就超出了10.8,可知其连续5天的日平均温度均不低于22,如22、25、25、26、32,这组数据的平均值为26,方差为10.8,但是进一步扩大方差就会超过10.8,故③对.则肯定进入夏季的地区有甲、丙两地,故答案为①③.小提示:本题考查中位数、众数、平均数、方差的数据特征,简单的合情推理,解答此题应结合题意,根据平均数的计算方法进行解答、取特殊值即可.解答题16、为了了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量(单位:克),按照[27.5,32.5),[32.5,37.5),[37.5,42.5),[42.5,47.5),[47.5,52.5]分为5组,其频率分布直方图如图所示.(1)求图中a的值;(2)估计这种植物果实重量的平均数x̅(同一组中的数据用该组区间的中点值作代表);(3)已知这种植物果实重量不低于37.5克的即为优质果实,现对该种植物果实的某批10000个果实进行检测.据此估算这批果实中的优质果实的个数.答案:(1)a=0.050(2)40(3)7000分析:(1)由各组频率之和为1(面积之和为1)可求得;(2)频率分布直方图用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和估计平均数;(3)用样本频率估计总体概率进行求解.(1)由题意,有(0.020+0.040+0.075+a+0.015)×5=1,解得a=0.050;(2)这种植物果实重量的平均数约为:30×0.020×5+35×0.040×5+40×0.075×5+45×0.050×5+50×0.015×5=40,∴这种植物果实重量的平均数x̅的估计值约为40.(3)样本中,这种植物果实重量不低于37.5克,即优质果实的频率为0 .075×5+0.050×5+0.015×5=0.7,由此估计某批10000个果实中,重量不低于37.5克,即优质果实的概率为0.7,∴这批果实中的优质果实的个数约为10000×0.7=7000个.17、第24届北京冬季奥林匹克运动会于2022年2月4日至2月20日在北京和张家口联合举办.这是中国历史上第一次举办冬季奥运会,它掀起了中国人民参与冬季运动的大热潮.某市举办了中学生滑雪比赛,从中抽取40名学生的测试分数绘制成茎叶图和频率分布直方图如下,后来茎叶图受到了污损,可见部分信息如图.(1)求频率分布直方图中a的值,并根据直方图估计该市全体中学生的测试分数的平均数(同一组中的数据以这组数据所在区间中点的值作代表,结果保留一位小数);(2)现要对测试成绩在前26%的中学生颁发“滑雪达人”证书,并制定出能够获得证书的测试分数线,请你用样本来估计总体,给出这个分数线的估计值.答案:(1)a=0.02,平均数为74.5(2)82分析:(1)计算出测试分数位于[90,100]个数,可求得测试分数位于[80,90)的个数,由此可求得a的值,将每个矩形底边的中点值乘以对应矩形的面积,将所得结果全加可得样本的平均数;(2)设能够获得证书的测试分数线为x,分析可得80<x<90,根据已知条件可得出关于x的等式,求解即可. (1)解:由频率分布直方图可知,测试分数位于[90,100]的频率为10×0.01=0.1,则测试分数位于[90,100]个数为40×0.1=4,所以,测试分数位于[80,90)的个数为40−(4+10+14+4)=8,÷10=0.02.所以a=840估计平均数为55×0.1+65×0.25+75×0.35+85×0.2+95×0.1=74.5.(2)解:因为测试分数位于[90,100]的频率为0.1,测试分数位于[80,90)的频率为0.2,能够获得“滑雪达人”证书的中学生测试分数要在前26%,故设能够获得证书的测试分数线为x,则80<x<90,由(90−x)×0.02=0.26−0.1,可得x=82,所以分数线的估计值为82.18、某中学要从高一年级甲乙两个班级中选择一个班参加电视台组织的“环保知识竞赛”,该校对甲乙两班的参赛选手(每班7人)进行了一次环保知识测试,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生的平均分是85,乙班学生成绩的中位数是85.(1)求x,y的值;(2)根据茎叶图,求甲乙两班同学方差的大小,并从统计学角度分析,该校应选择甲班还是乙班参赛.答案:(1)x=9,y=5;(2)乙班成绩比较稳定,故应选乙班参加.分析:(1)利用茎叶图,根据甲班7名学生成绩的平均分是85,乙班7名学生成绩的中位数是85.先求出x,y,(2)求出乙班平均分,再求出甲班7名学生成绩方差和乙班名学生成绩的方差,由此能求出结果.解:(1)甲班的平均分为:17(75+78+80+80+x+85+92+96)=85;解得x=9,∵乙班7名学生成绩的中位数是85,∴y=5,(2)乙班平均分为:17(75+80+80+85+90+90+95)=85;甲班7名学生成绩方差S12=17(102+72+52+42+02+72+112)=3607,乙班名学生成绩的方差S22=17(102+52+52+02+52+52+102)=3007,∵两个班平均分相同,S22<S12,∴乙班成绩比较稳定,故应选乙班参加.小提示:本题考查茎叶图的应用,解题时要认真审题,属于基础题.19、2019年下半年以来,各地区陆续出台了“垃圾分类”的相关管理条例,实行“垃圾分类”能最大限度地减少垃圾处置量,实现垃圾资源利用,改善垃圾资源环境,某部门在某小区年龄处于[20,45]岁的人中随机地抽取x人,进行了“垃圾分类”相关知识掌握和实施情况的调查,并把达到“垃圾分类”标准的人称为“环保族”,得到如图示各年龄段人数的频率分布直方图和表中的统计数据.(1)求x、y、z的值;(2)根据频率分布直方图,估计这x人年龄的平均值(同一组数据用该区间的中点值代替,结果按四舍五入保留整数);(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,并在这9人中选取2人作为记录员,求选取的2名记录员中至少有一人年龄在[30,35]中的概率.答案:(1){x=200y=0.625z=6;(2)30.75;(3)1318.分析:(1)由频率分布直方图和频数分布表能求出x、y、z;(2)根据频率分布直方图,能估计这x人年龄的平均值;(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,[25,30)中选5人,分别记为A、B、C、D、E,[30,35]中选4人,分别记为a、b、c、d,在这9人中选取2人作为记录员,利用列举法列举出所有的基本事件,然后利用古典概型的概率公式可求得所求事件的概率.(1)由题意得:{x=450.750.06×5=200y=25200×0.04×5=0.625z=200×0.03×5×0.2=6;(2)根据频率分布直方图,估计这x人年龄的平均值为:x=22.5×0.3+27.5×0.2+32 .5×0.2+37.5×0.15+42.5×0.15=30.75;(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,从[25,30)中选:9×2525+20=5人,分别记为A、B、C、D、E,从[30,35]中选:9×2025+20=4人,分别记为a、b、c、d,在这9人中选取2人作为记录员,所有的基本事件有:(A,B)、(A,C)、(A,D)、(A,E)、(A,a)、(A,b)、(A,c)、(A,d)、(B,C)、(B,D)、(B,E)、(B,a)、(B,b)、(B,c)、(B,d)、(C,D)、(C,E)、(C,a)、(C,b)、(C,c)、(C,d)、(D,E)、(D,a)、(D,b)、(D,c)、(D,d)、(E,a)、(E,b)、(E,c)、(E,d)、(a,b)、(a,c)、(a,d)、(b,c)、(b,d)、(c,d),共36种,选取的2名记录员中至少有一人年龄在[30,35]包含的基本事件有:(A,a)、(A,b)、(A,c)、(A,d)、(B,a)、(B,b)、(B,c)、(B,d)、(C,a)、(C,b)、(C,c)、(C,d)、(D,a)、(D,b)、(D,c)、(D,d)、(E,a)、(E,b)、(E,c)、(E,d)、(a,b)、(a,c)、(a,d)、(b,c)、(b,d)、(c,d),共26种,因此,选取的2名记录员中至少有一人年龄在[30,35]中的概率P=2636=1318.小提示:本题考查频率、平均数、概率的求法,考查频数分布表、频率分布直方图、分层抽样、古典概型的性质等基础知识,考查数据分析能力、运算求解能力,是基础题.。
高中数学-统计-测试练习题
高中数学-统计-测试练习题1. 2018年央视大型文化节目《经典咏流传》的热播,在全民中掀起了诵读诗词的热潮,节目组为热心观众给以奖励,要从2018名观众中抽取50名幸运观众,先用简单随机抽样从2018人中剔除18人,剩下的2000人再按系统抽样的方法抽取50人,则在2018人中,每个人被抽到的可能性()A.均不相等B.不全相等C.都相等,且为251009D.都相等,且为1402. 下列属于相关现象的是()A.利息与利率B.居民收入与储蓄存款C.电视机产量与苹果产量D.某种商品的销售额与销售价格3. 将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个得分的平均分为91,现场做的7个得分的茎叶图(如图)后来有一个数据模糊,无法辨认,在图中用x表示,则x的值为()A.0B.4C.5D.74. 在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本,有以下三种抽样方法:①采用随机抽样法,将零件编号为00,01,…,99,抽签取出20个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组随机抽取1个;③采用分层抽样法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个.则下述判断中正确的是()A.不论采用何种抽样方法,这100个零件中每个被抽到的可能性均为15B.①、②两种抽样方法,这100个零件中每个被抽到的可能性均为15;③并非如此C.①、③两种抽样方法,这100个零件中每个被抽到的可能性均为15;②并非如此D.采用不同的抽样方法,这100个零件中每个被抽到的可能性是各不相同的5. 某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:∘C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(x i,y i)(i=1,2,⋯,20)得到下面的散点图:由此散点图,在10∘C至40∘C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.y=a+bxB.y=a+bx2C.y=a+be xD.y=a+b ln x6. 某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其平均数和方差分别为x和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的平均数和方差分别为()A.x¯,s2+1002B.x¯+100,s2+1002C.x¯,s2D.x¯+100,s27. 某校有高中生1470人,现采用系统抽样法抽取49人做问卷调查,将高一、高二、高三学生(高一、高二、高三分别有学生495人、493人、482人)按1,2,3, (1470)号,若第一组用简单随机抽样的方法抽取的号码为23,则所抽样本中高二学生的人数为( )A.15B.16C.17D.188. 某学校有教职员工150人,其中高级职称15人,中级职称45人,一般职员90人,现在用分层抽样抽取30人,则样本中各职称人数分别为()A.5,10,15B.3,9,18C.3,10,17D.5,9,169. 在下列各图中,每个图的两个变量具有相关关系的图是()A.(1)(2)B.(1)(3)C.(2)(4)D.(2)(3)10. 一组数据中的每一个数据都乘以2,再减去80,得到一组新数据,若求得的新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是()A.40.6,1.1B.48.8,4.2C.81.2,44.4D.78.8,75.611. 我国于2015年10月宣布实施普遍二孩政策,为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为140的调查样本,其中城镇户籍与农村户籍各70人;男性60人,女性80人,绘制的不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图如图所示,其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述正确的是( )A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别有关C.调查样本中倾向选择生育二胎的人群中,男性人数与女性人数相同D.倾向选择不生育二胎的人群中,农村户籍人数多于城镇户籍人数12. 给出下列命题,其中正确的命题有()A.若a∈R,则(a+1)i是纯虚数B.随机变量X∼N(3,22),若X=2η+3,则D(η)=1C.公共汽车上有10位乘客,沿途5个车站,乘客下车的可能方式有105种D.回归方程为ŷ=0.85x−85.71中,变量y与x具有正的线性相关关系E.P(A)=0.5,P(B)=0.3,P(AB)=0.2,则P(A|B)=0.413. “微信运动”是腾讯开发的一个记录跑步或行走情况(步数里程)的公众号用户通过该公众号可查看自己某时间段的运动情况.某人根据2018年1月至2018年11月期间每月跑步的里程(单位:十公里)的数据绘制了下面的折线图.根据该折线图,下列结论正确的是( )A.月跑步里程逐月增加B.月跑步里程最大值出现在10月C.月跑步里程的中位数为5月份对应的里程数D.1月至5月的月跑步里程相对于6月至11月,波动性更小,变化比较平稳14. 下列抽样方法是简单随机抽样的是()A.从50个零件中随机抽取5个做质量检验B.从50个零件中有放回地抽取5个做质量检验C.从整数集中随机抽取10个分析奇偶性D.运动员从8个跑道中随机选取一个跑道15. 对于表中x,y之间的一组数据:甲、乙两位同学给出的拟合直线方程分别为①y=13x+1和②y=12x+12.若通过分析得出②的拟合效果好,则下列分析理由正确的是()参考公式:R2=1−∑ni=1(y i−y i)2∑n i=1(y i−y¯)2.A.①的残差和大于②的残差和,所以②拟合效果更好B.①的残差平方和大于②的残差平方和,所以②拟合效果更好C.①的R2小于②的R2,所以②拟合效果更好D.残差图中直线②的残差点分布的水平带状区域比①的残差点分布的水平带状区域更窄,所以直线②拟合效果更好16. 某工厂生产甲、乙、丙三种不同型号的产品,产量分别为360、240、120,为检验产品的质量,现需从以上所有产品中抽取一个容量为60的样本进行检验,则下列说法正确的是()A.如果采用系统抽样的方法抽取,不需要先剔除个体B.如果采用分层抽样的方法抽取,需要先剔除个体C.如果采用系统抽样的方法抽取,抽取过程不需要运用简单随机抽样的方法D.如果采用分层抽样的方法抽取时,所有产品被抽中的概率相等17. 某公司生产三种型号的轿车,产量分别为1500辆,6000辆和2000辆.为检验该公司的产品质量,公司质监部门要抽取76辆进行检验,则下列说法正确的是( )A.应采用抽签法抽取B.应采用分层随机抽样抽取C.三种型号的轿车依次应抽取12辆,48辆,16辆D.这三种型号的轿车,每一辆被抽到的概率都是相等的18. 频率分布直方图中各小长方体的面积和为________.19. 从某500件产品中随机抽取50件进行质检,利用随机数表法抽取样本时,先将这500件产品按001,002,003,…,500进行编号.如果从随机数表第第7行第4列的数2开始,从左往右读数,则依次抽取的第4个个体的编号是________.(下面摘录了随机数表第6行至第8行各数)16 22 77 94 3949 54 43 54 8217 37 93 23 7887 35 20 96 4384 26 34 91 6484 42 17 53 3157 24 55 06 8877 04 74 47 6721 72 06 50 2583 42 16 33 7663 01 63 78 5916 95 55 67 1998 10 50 71 7512 86 73 58 0744 39 52 38 79.20. 2008年5月12日,四川汶川地区发生里氏8.0级特大地震.在随后的几天中,地震专家对汶川地区发生的余震进行了监测,记录的部分数据如下表:注:地震强度是指地震时释放的能量地震强度(x)和震级(y)的模拟函数关系可以选用y=a lg x+b(其中a,b为常数).利用散点图可知a的值等于________.(取lg2=0.3)21. 如图为两种商品2019年前三季度销售量的折线统计图,结合统计图,下列说法中正确的有________.①1∼6月,商品B的月销售量都超过商品A.②7月份商品A与商品B的销售量相等.③对于商品B,7∼8月的月销售量增长率与8∼9月的月销售量增长率相同.④2019年前三季度商品A的销量逐月增长.22. 将参加夏令营的100名学生编号为001,002,…,100.先采用系统抽样方法抽取一个容量为20的样本,若随机抽得的号码为003,那么从048号到081号被抽中的人数是________.23. 某工厂的某种型号的机器的使用年限x和所支出的维修费用y(万元)有下表的统计资料:根据该表可得回归方程ŷ=1.23x+â,据此模型估计,该型号机器使用年限为9年的维修费用大约为________万元.24. 世卫组织规定,PM2.5日均值在35微克/立方米以下空气质量为一级;在35微克/立方米∼75微克/立方米之间空气质量为二级;在75微克/立方米以上空气质量为超标.清远市环保局从市区2013年全年每天的PM2.5监测数据中随机抽取15天的数据作为样本,监测值如茎叶图所示(十位为茎,个位为叶),从这15天的数据中任取3天的数据,则恰有一天空气质量达到一级的概率为________(用分数作答).25. 随着智能手机的发展,微信越来越成为人们交流的一种方式,某机构对使用微信交流的态度进行调查,随机调查了50人,他们年龄的频数分布及对使用微信交流赞成人数如下表:分界点对使用微信交流的态度有差异;(Ⅱ)若对年龄在[55, 65)的被调查人中随机抽取两人进行追踪调查,求至少有1人赞成使用微信交流的概率.,其中n=a+b+c+d参考公式:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)参考数据:26. 设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i, y i)(i=1, 2,…,n),用最小二乘法建立的回归方程为y=0.85x−85.71,给定下列结论:①y与x具有正的线性相关关系;②回归直线过样本点的中心(x¯, y¯);③若该大学某女生身高增加1cm,则其体重约增加0.85kg;④若该大学某女生身高为170cm,则可断定其体重必为58.79kg.其中正确的结论是________.27. 为了解M离子在小鼠体内的残留程度,进行如下试验:给100只小鼠服M离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同,经过一段时间后检测出残留在小鼠体内离子的百分比.根据试验数据得到如图频率分布直方图,则图中a=________;估计M离子残留百分比的平均数为________.(同组中的每个数据用该组区间的中点值代替)28. 成年人收缩压的正常范围是(90,140)(单位:mmHg),未在此范围的献血志愿者不适合献血.某血站对志愿者的收缩压进行统计,随机抽取男志愿者100名、女志愿者100名,根据统计数据分别得到如下直方图:(1)根据直方图计算这200名志愿者中不适合献血的总人数;(2)估计男志愿者收缩压的中位数;(3)估计女志愿者收缩压的平均值(同一组中的数据用该组区间的中点值为代表).29. 甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:(1)用茎叶图表示这两组数据;(2)现要从中选派一人参加数学竞赛,从统计学的角度(在平均数、方差或标准差中选两个)考虑,你认为选派哪位学生参加合适?请说明理由.30. 某商场为了调查旅游鞋的销售情况,随机抽取了40位顾客的购鞋尺寸,将所得数据整理后,画出频率分布直方图如下,其中直方图从左到右前3个小矩形的面积之比为1:2:3,试估计(1)购鞋尺寸在39.5∼43.5内的顾客所占的百分比是多少?(2)样本数据的中位数是多少?(精确到0.01)31. 为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这一次竞赛,为了解本次竞赛成绩情况,从中抽取了部分学生的成绩进行统计,请你根据尚未完成并有局部污损的频率分布表和频率分布直方图,解答下列问题:(1)填充频率分布表的空格(将答案直接填在表格内);7分(2)补全频率分布直方图;11分(3)若成绩在60.5∼80.5分的学生为三等奖,问全校获得三等奖的学生约为多少人?32. 目前,我国老年人口比例不断上升,造成日趋严峻的人口老龄化问题.2019年10月12日,北京市老龄办、市老龄协会联合北京师范大学中国公益研究院发布《北京市老龄事业发展报告(2018)》,相关数据有如下图表.规定年龄在15岁至59岁为“劳动年龄”,具备劳动力,60岁及以上年龄为“老年人”,据统计,2018年底北京市每2.4名劳动力抚养1名老年人.(1)请根据上述图表计算北京市2018年户籍总人口数和北京市2018年的劳动力数;(保留两位小数)(2)从2014年起,北京市老龄人口与年份呈线性关系,比照2018年户籍老年人人口年龄构成,预计到2020年年底,北京市90以上老人达到多少人?(精确到1人)(附:对于一组数据(u 1,v 1),(u 2,v 2),⋯⋯,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘法估计分别为:β̂=∑u i n i=1v i −nu ¯⋅v¯∑u i 2n i=1−nu¯2,α̂=v ¯−β̂u ¯,2×27.62+1×11.02+1×8.98+2×24.78=124.8)参考答案与试题解析高中数学-统计-测试练习题一、选择题(本题共计 10 小题,每题 3 分,共计30分)1.【答案】C【考点】简单随机抽样【解析】此题暂无解析【解答】解:因为在系统抽样中,若所给的总体个数不能被样本容量整除,则要先剔除几个个体,再分组.在剔除过程中,每个个体被剔除的概率相等,所以每个个体被抽到包括两个过程,一是不被剔除,二是选中,这两个过程是相互独立的,所以每人入选的概率P=502018=251009.故选C.2.【答案】B【考点】变量间的相关关系【解析】根据所学函数关系和相关关系的概念逐一核对四个选项即可得到正确答案.【解答】如果当一个变量的取值一定时,另一个变量的取值带有一定的随机性,我们称这样的两个变量具有相关关系,也就是说两个变量之间即不存在函数关系,又不是完全没有关系,选项A中的两个变量具有函数关系;选项B中居民收入与储蓄存款具有相关关系,一般来说,居民收入越高对应的储蓄存款越多;选项C中的电视机产量与苹果产量吴任何关系;选项D中某种商品的销售额与销售价格具有函数关系.互选B.3.【答案】A【考点】茎叶图【解析】根据茎叶图提供的数据,去掉1个最高分和1个最低分后,利用公式求平均数可得x的值.【解答】解:选手的7个得分中去掉1个最高分96,去掉1个最低分86,剩余5个得分为88,93,90,94,(90+x);它们的平均分为88+93+90+94+(90+x)5=91,∴ x =0; 故选:A . 4. 【答案】 A【考点】 简单随机抽样 分层抽样方法 系统抽样方法【解析】样本代表性的好坏直接影响统计结论的准确性,所以抽样过程中,考虑的最主要原则是保证样本能够很好地代表总体.而随机抽样的出发点是使每个个体都有相同的机会被抽中,这是基于对样本数据代表性的考虑. 【解答】解:根据抽样的定义知道,三种抽样方法的特点就是保证了每个个体从总体中抽到的可能性都相同, 保证了总体中每个个体被抽到的概率相等的公平性. 故选A . 5.【答案】 D【考点】 散点图 【解析】将散点图近似判断为所学函数图象,根据近似函数图象选择合适的回归方程即可. 【解答】解:由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适宜作为发芽率y 和温度x 的回归方程类型的是 y =a +b ln x . 故选D . 6. 【答案】 D【考点】极差、方差与标准差 众数、中位数、平均数【解析】根据变量之间均值和方差的关系和定义,直接代入即可得到结论. 【解答】解:由题意知y i =x i +100,则y ¯=110(x 1+x 2+...+x 10+100×10)=110(x1+x2+⋯+x10)+100=x¯+100,方差:s2=110[(x1+100−x¯−100)2+(x2+100−x¯−100)2+⋯+(x10+100−x¯−100)2]=110[(x1−x¯)2+(x2−x¯)2+⋯+(x10−x¯)2]=s2.故选D.7.【答案】C【考点】系统抽样方法【解析】由题意,求得高二学生的编号为496−988,再得出分组的组距为147049=30,根据第一组用简单随机抽样的方法抽取的号码为23,得出抽取的号码满足30n−7,列出不等式,即可求解.【解答】解:由题意得高二学生的编号为496−988,分组的组距为147049=30,因为由第一组用简单随机抽样的方法抽取的号码为23,所以抽取的号码满足23+(n−1)×30=30n−7,n∈N+,令496≤30n−7≤988,解得50330≤n≤99530,n∈N+,所以n可取17个数.故选C.8.【答案】B【考点】分层抽样方法【解析】求出样本容量与总容量的比,然后用各层的人数乘以得到的比值即可得到各层应抽的人数.【解答】解:由30150=15,所以,高级职称人数为15×15=3(人);中级职称人数为45×15=9(人);一般职员人数为90×15=18(人).所以高级职称人数、中级职称人数及一般职员人数依次为3,9,18.故选B.9.【答案】D【考点】利用散点图识别两变量之间关系【解析】仔细观察图象,寻找散点图间的相互关系,主要观察这些散点是否围绕一条曲线附近排列着,由此能够得到正确答案.【解答】解:散点图(1)中,所有的散点都在曲线上,所以(1)具有函数关系;散点图(2)中,所有的散点都分布在一条直线的附近,所以(2)具有相关关系;散点图(3)中,所有的散点都分布在一条曲线的附近,所以(3)具有相关关系,散点图(4)中,所有的散点杂乱无章,没有分布在一条曲线的附近,所以(4)没有相关关系.故选D.10.【答案】A【考点】极差、方差与标准差【解析】设出原来的一组数据,使数据中的每一个数据都都乘以2,再都减去80,得到一组新数据求得新数据的平均数是1.2,方差是4.4,根据这些条件列出算式,合并同类项,做出原来数据的平均数,再利用方差的关系式求出方差结果.【解答】设原来的一组数据是x1,x2...x n,∵每一个数据乘以2,再都减去80得到新数据且求得新数据的平均数是1.2,方差是4.4,2x1−80+2x2−80+⋯2x n−80=1.2n∴2x1+2x2+⋯2x n=1.2+80=81.2nx1+x2+⋯x n=40.6n又∵数据都减去同一个数,没有改变数据的离散程度,∴2x1,2x2...2x n的方差为:4.4,×4.4=1.1.从而原来数据x1,x2...x n的方差为:122二、多选题(本题共计 7 小题,每题 3 分,共计21分)11.【答案】A,B,C【考点】收集数据的方法【解析】由比例图,可得是否倾向选择生育二胎与户籍、性别有关,倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,倾向选择生育二胎的人员中的男性人数与女性人数,即可得出结论.【解答】解:由不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图,知:城镇户籍倾向选择生育二胎的比例为40%,农村户籍倾向选择生育二胎的比例为80%,∴是否倾向选择生育二胎与户籍有关,故A正确;男性倾向选择生育二胎的比例为80%,女性倾向选择生育二胎的比例为60%,∴是否倾向选择生育二胎与性别有关,故B正确;男性倾向选择生育二胎的比例为80%,人数为60×80%=48人,女性倾向选择生育二胎的比例为60%,人数为80×60%=48人,∴倾向选择生育二胎的人群中,男性人数与女性人数相同,故C正确;倾向选择不生育二胎的人群中,农村户籍人数为70×(1−80%)=14人,城镇户籍人数为70×(1−40%)=42人,∴倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,故D错误.故选ABC.12.【答案】B,D【考点】条件概率与独立事件离散型随机变量的期望与方差分步乘法计数原理复数的基本概念两个变量的线性相关【解析】A选项根据纯虚数的概念利用特殊值a=−1即可判断错误. B选项根据离散型分布列期望与方差的性质可以进行判断. C选项考查简单计数问题. D选项考查两个变量的线性相关性. E 选项考查条件概率的计算方式.【解答】解:A,当a=−1,(a+1)i=(−1+1)i=0,故A错误;B,随机变量X∼N(3,22),则E(X)=3,D(X)=4,若X=2η+3,则D(X)=22×D(η)=4,解得D(η)=1,故B正确;C,由分步乘法计数原理可知,每位乘客下车方法有5种,所以乘客下车的可能方式有510中,故C错误;D,由回归方程的形式可知,0.85>0,变量y与x具有正的线性相关关系,变量x增加1个单位时,y平均增加0.85个单位,故D正确;E,由条件概率公式可得P(A|B)=P(AB)P(B)=23,故E错误.故选BD.13.【答案】B,C,D【考点】用样本的数字特征估计总体的数字特征【解析】此题暂无解析 【解答】解:由2018年1月至2018年11月期间每月跑步的里程的数据,绘制的折线图,知: 在A 中,月跑步里程2月、7月、8月和11月减少,故A 错误; 在B 中,月跑步里程高峰期大致在9、10月,故B 正确;在C 中,月跑步里程的中位数为5月份对应的里程数,故C 正确;在D 中,1月至5月的月跑步里程相对于6月至11月,波动性更小,变化比较平稳,故D 正确. 故选BCD . 14. 【答案】 A,D【考点】 简单随机抽样 【解析】根据简单随机抽样的定义和使用条件,逐项判定,即可求解. 【解答】解:对于A 中,从50个零件中随机抽取5个做质量检验,符合简单随机抽样的定义和条件,所以是简单的随机抽样;对于B 中,从50个零件中有放回地抽取5个做质量检验是又放回抽样,不符合简单随机抽样的使用条件,不是简单的随机抽样;对于C 中,从整数集中随机抽取10个分析奇偶性,其中整数集为无限集,不符合简单随机抽样的条件,不是简单的随机抽样;对于D 中,运动员从8个跑道中随机选取一个跑道,符合简单随机抽样的定义和条件,所以是简单随机抽样. 故选AD . 15.【答案】 B,C,D 【考点】求解线性回归方程 【解析】根据所给的两条直线的方程和五个坐标点,求出用y =13x +1作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和,用y =12x +12作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和,比较分析A ,B ,D 的正误,再求得①的R 2与②的R 2分析C 的正误. 【解答】解:用y =13x +1作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为: S 1=(1−43)2+(2−2)2+(3−3)2+(4−103)2+(5−113)2=73.用y =12x +12作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为: S 2=(1−1)2+(2−2)2+(3−72)2+(4−4)2+(5−92)2=12.∵S2<S1,∴ ①的残差和大于②的残差和,①的残差平方和大于②的残差平方和,则②的拟合效果更好,故A错误,B正确;残差图中直线②的残差点分布的水平带状区域比①的残差点分布的水平带状区域更窄,所以直线②拟合效果更好,故D正确;①的R2=1−7310=2330,②的R2=1−1210=1920,①的R2小于②的R2,②拟合效果更好,故C正确.故选BCD.16.【答案】A,D【考点】分层抽样方法系统抽样方法【解析】此题暂无解析【解答】解:(360+240+120)÷60=12,无论是运用系统抽样还是分层抽样,都不需要先剔除个体,A正确,B错误.系统抽样确定起始号时需要用到简单随机抽样,C错误.分层抽样时,所有个体被抽到的机会均等,D正确.故选AD.17.【答案】B,C,D【考点】分层抽样方法【解析】根据简单随机抽样的特点知应选分层抽样,按照抽样比即可得三种型号的轿车分别应抽取的数量.【解答】解:A.因为个体数目多,用抽取法制签难,搅拌不均匀,抽出的样本不具有好的代表性,故A错误;B,因为是三种型号的轿车,个体差异明显,所以选择分层抽样,故B正确;C,抽样比为761500+6000+2000=1125,三种型号的轿车依次应抽取1500×1125=12辆,6000×1125=48辆,2000×1125=16辆,故C正确;D,分层抽样中,每一个个体被抽到的可能性相同,故D正确.故选BCD.三、填空题(本题共计 10 小题,每题 3 分,共计30分)18.【答案】1【考点】频率分布直方图【解析】=根据频率分布直方图中纵横坐标的意义,易得长方形的面积为长乘宽,即组距×频率组距频率,而所有频率和为1可知频率分布直方图中各小长方体的面积和为1.【解答】解:在频率直方图中纵坐标表示频率,横坐标表示组距,组距,小长方形的长表示组距,则小长方形的高表示频率组距=频率;则长方形的面积为长乘宽,即组距×频率组距根据所有频率和为1可知频率分布直方图中各小长方体的面积和为1;故答案为:119.【答案】206【考点】简单随机抽样【解析】找到第7行第4列的数开始向右读,依次寻找号码小于500的即可得到结论.【解答】解:找到第7行第4列的数开始向右读,第一个符合条件的是217,第二个数553,不成立,第三个数157,第四个数245,这样依次读出结果,合适的数是217,157,245,217,206,其中217前面已经重复舍掉,故第四个数是206.故答案为:20620.【答案】23【考点】散点图【解析】由散点图可知函数的图象经过(1.6, 5)(3.2, 5.2),把点的坐标代入函数的解析式得到关于a,b的方程组,两个方程相减得到a的值.【解答】解:由散点图可知函数的图象经过(1.6, 5)(3.2, 5.2)把点的坐标代入函数的解析式得到5=a lg1.6+b①5.2=a lg3.2+b②用②-①得0.2=a lg2∴ a =0.2lg 2=23故答案为:23 21. 【答案】 ①②④【考点】频率分布折线图、密度曲线 【解析】 此题暂无解析 【解答】解:由图可知,①1∼6月,商品B 的月销售量曲线在商品A 之上,故①正确; ②7月份商品A 与商品B 的销售量都为13/万份,故②正确;③对于商品B ,7∼8月的月销售量增长率为负,8∼9月的月销售量增长率为0,故③错误;④2019年前三季度商品A 的销量折线呈上升趋势,故④正确. 故答案为:①②④. 22.【答案】 7【考点】 系统抽样方法 【解析】根据系统抽样的定义,即可得到结论. 【解答】解:∵ 样本容量为20,首个号码为003, ∴ 样本组距为100÷20=5∴ 对应的号码数为3+5(x −1)=5x −2, 由48≤5x −2≤81, 得10≤x ≤16.6,即x =10,11,12,13,14,15,16,共7个, 故答案为:7. 23.【答案】 11.15 【考点】求解线性回归方程 【解析】由表格可得平均值x ¯,y ¯,由回归直线过点(x ¯, y ¯)可得其方程,把x =9代入计算可得. 【解答】解:由表格可得x ¯=15(2+3+4+5+6)=4, y ¯=15(2.2+3.8+5.5+6.5+7.0)=5。
高中数学:统计与统计案例练习
高中数学:统计与统计案例练习一、选择题1.某校为了解学生平均每周的上网时间(单位:h),从高一年级1 000名学生中随机抽取100 名进行了调查,将所得数据整理后,画出频率分布直方图(如图),其中频率分布直方图从左到右前3个小矩形的面积之比为1 : 3 : 5,据此估计该校高一年级学生中平均每周上网时间少于4 h的学生人数为()领率组距A. 200 C. 400 0.0350.015B. 240D. 48010平均每周上网时间(h)解析:选C 设频率分布直方图中从左到右前3个小矩形的面积分别为A3K5P.由频率分布直方图可知,最后2个小矩形的面积之和为(0.015+0.035)X2 = 0.1.由于频率分布直方图中各个小矩形的面积之和为1,所以P+3P+5P=0.9,即尸=0.1.所以平均每周上网时间少于4h的学生所占比例为尸+3P=0.4,由此估计学生人数为0.4X1 000 =400.2. AQI(Air Quality Index,空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程度.AQI共分六级,一级优(0〜50),二级良(51〜100),三级轻度污染(101〜150),四级中度污染(151〜200),五级重度污染(201〜300),六级严重污染(大于300).如图是昆明市2021年4月份随机抽取的10天的AQI茎叶图,利用该样本估计昆明市2021年4月份空气质量优的天数为 ()A. 3B. 4C. 12D. 2142解析:选c 从茎叶图知,10天中有4天空气质量为优,所以空气质量为优的频率为 1 V.Z 22所以估计昆明市2021年4月份空气质量为优的天数为30X5=12,应选C.3.〔成都模拟〕某城市收集并整理了该市2021年1月份至10月份各月最低气温与最高气 温〔单位:C 〕的数据,绘制了下面的折线图.该城市各月的最低气温与最高气温具有较好的线性关系,那么根据折线图,以下结论错误 的是〔〕A.最低气温与最高气温为正相关B. 10月的最高气温不低于5月的最高气温C.月温差〔最高气温减最低气温〕的最大值出现在1月D.最低气温低于0C 的月份有4个解析:选D 在A 中,最低气温与最高气温为正相关,故A 正确;在B 中,10月的最高气温 不低于5月的最高气温,故B 正确;在C 中,月温差〔最高气温减最低气温〕的最大值出现在1月, 故C 正确:在D 中,最低气温低于0℃的月份有3个,故D 错误.应选D.4 .〔承德模拟〕为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取 了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体 中倾向选择生育二胎与倾向选择不生育二胎的人数比例图〔如下图〕,其中阴影局部表示倾向 选择生育二胎的对应比例,那么以下表达中错误的选项是〔〕A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别无关♦最高气温 ♦最低气温C.倾向选择生育二胎的人员中,男性人数与女性人数相同D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数解析:选C 由题图,可得是否倾向选择生育二胎与户籍有关、与性别无关;倾向选择不 生育二胎的人员中,农村户籍人数少于城镇户籍人数;倾向选择生育二胎的人员中,男性人数为 60X60% =36,女性人数为40X60%=24,不相同.应选C.5 .(石家庄模拟)某学校48两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过 茎叶图比拟两个班兴趣小组成绩的平均值及标准差.3 4 28 8 4 6 8 65152①A 班兴趣小组的平均成绩高于B 班兴趣小组的平均成绩; ②B 班兴趣小组的平均成绩高于A 班兴趣小组的平均成绩; ③A 班兴趣小组成绩的标准差大于B 班兴趣小组成绩的标准差;@B 班兴趣小组成绩的标准差大于A 班兴趣小组成绩的标准差. 其中正确结论的编号为()A.①④C. ®®其方差为白义[(53—78尸+(62—78/ +…+ (95—78)2]=121.6, 那么其标准差为'121.6%11.03;45+48+5H -------- F91B 班兴趣小组的平均成成为'」=66,其方差为表义[(45—66)2+(48 - 66)2 + ... + (91-66)2] =169.2, 那么其标准差为1169.2%13.01.应选A.6 .某商场对某一商品搞活动,该商品每一个的进价为3元,销售价为8元,每天售出的 第20个及之后的半价出售.该商场统计了近10天这种商品的销量,如下图,设M 个)为每天商 品的销量,M 元)为该商场每天箱售这种商品的利润.从日利润不少于96元的几天里任选2天, 那么选出的这2天日利润都是97元的概率为()4 5 5 1 6 2 7 38班8 3 6 4 5 3 4 02B.②③D.①③解析:选A A 班兴趣小组的平均成绩为 53+62+64+…+92+95--------------- ---------------- =785x, x=18, 19, y =<l95+(x-19)(4-3), x=20, 21, J5x, x=18, 19, 即 L176+x, x=20, 21.当日销量不少于20个时,日利泗不少于96元, 当日销量为20个时,日利润为96元, 当日销量为21个时,日利润为97元,日利泗为96元的有3天,记为日利泗为97元的有2天,记为人丛从中任选2天有 (.4),(〃石),(.力),(.1),3/),(48),3«),(c4),(.,8),(48),共 10 种情况.其中选出的这2天日利泗都是97元的有(A,8)1种情况. 故所求概率为关.应选B. 二、填空题7 .某小卖部销售某品牌饮料的零售价与销量间的关系统计如下:单价x/元 3.0 3.2 3.4 3.6 3.8 4.0 销量w 瓶504443403528x,y 的关系符合回归方程£=£+2其中分=-20.假设该品牌饮料的进价为2元,为使利润 最大,零售价应定为 元.解析:依题意得:x =3.5, y =40,A所以.=40—(- 20)X3.5=110,所以回归直线方程为f=-20x+110,利润 L = (A —2)(-20A + 110)= -201+ 150x-220,B 选• •1 - 9 1 - 5 A.C 解BioD.g由题意知频数(天)0 18 19 20 2 俏量〔个〕所以x=* = 3.75元时,利润最大.答案:3.758.某高校调查了200名学生每周的自习时间(单位:小时),制成了如下图的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是.解析:设所求的人数为〃,由频率分布直方图,自习时间不少于22.5小时的频率为(0.04+0.08 +0.16) X 2.5=0.7, n=0.7 X 200=140.答案:1409.为比拟甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:C) 制成如下图的茎叶图,甲地该月11时的平均气温比乙地该月11时的平均气温高1 ℃,那么甲地该月11时的平均气温的标准差为.甲9 8 2 62 m 03 I解析:甲地该月11时的气温数据(单位:℃)为28,29,30,30+〃?,32;乙地该月11时的气温数据(单位:℃)为26,28,29,31,31,那么乙地该月11时的平均气温为(26+28+29+31+31计5 = 29(℃),所以甲地该月11时的平均气温为30 ℃,故(28+29+30+30+m + 32)+5 = 30,解得〃?=1,那么甲地该月11时的平均气温的标准差为嗝义[(28 - 30产+(29 - 30)2+(30 - 30/+(31 - 30/+(32 - 30户]=\(2.答案:^2三、解做题10.某篮球运发动的投篮命中率为50%,他想提升自己的投篮水平,制定了一个夏季练习计划,为了了解练习效果,执行练习前他统计了10场比赛的得分,计算出得分的中位数为15,平均得分为15,得分的方差为463执行练习后也统计了10场比赛的得分,茎叶图如下图:0 8 91 2 4 4 5 6 82 1 3(1)请计算该篮球运发动执行练习后统计的10场比赛得分的中位数、平均得分与方差;⑵如果仅从执行练习前后统计的各10场比赛得分数据分析,你认为练习方案对该运发动的投篮水平的提升是否有帮助?为什么?解:(1)练习后得分的中位数为上芋=14.5;平均得分为8+9+12+14+14+15+16+18 + 21+23= 15:10方差为击义[(8—15)2 + (9 — 15>+(12 —15>+(14 — 15)2+(14 — 15> + (15 —15>+(16 — 15产+(18-15)2+(21-15)2+(23 —15)2]=20.6.(2)尽管中位数练习后比练习前稍小,但平均得分一样,练习前方差20.6小于练习前方差46.3, 说明练习后得分稳定性提升了(阐述观点合理即可),这是投篮水平提升的表现.故此练习方案对该篮球运发动的投篮水平的提升有帮助.11.(西安八校联考)在2021年俄罗斯世界杯期间,莫斯科的局部餐厅销售了来自中国的小龙虾,这些小龙虾均标有等级代码.为得到小龙虾等级代码数值x与销售单价y(单位:元)之间的关系,经统计得到如下数据:⑴销售单价),与等级代码数值x之间存在线性相关关系,求),关于x的线性回归方程(系数精确到0.1);(2)假设莫斯科某餐厅销售的中国小龙虾的等级代码数值为98,请估计该等级的中国小龙虾销售单价为多少元?参考公式:对于一组数据(xi1 ),3,光),…其回归直线f=源+2的斜率和截距的最小2Xyi一〃x y八 '। A — A——二乘估计分别为Z? = ----------------- a= y —b x .n _Xxr-n x 26 6参考数据:2>»=8 440, 2e = 25 564.—38+48 + 58 + 68 + 78 + 88解:(1)由题意,得x -■= 63,- 16.8+18.8+20.8 + 22.8 + 24+25.8 _y = 6 =21.5,yA_8 440 - 6X63X21.5〜h = ~~6Z—=25 564—6X63X63「026 A 2A — A 一a= y -bx =21.5-0.2X63 = 8.9.故所求线性回归方程为f=0.2x+8.9.⑵由(1)知,当%=98 时,>=0.2X98+8.9=28.5.・•・估计该等级的中国小龙虾销售单价为28.5元.12.(长沙模拟)某职称晋级评定机构对参加某次专业技术测试的100人的成绩进行了统计, 绘制的频率分布直方图如下图.规定80分以上者晋级成功,否那么晋级失败(总分值为100分).(1)求图中.的值;(2)估计该次测试的平均分不(同一组中的数据用该组的区间中点值代表);(3)根据条件完成下面2X2列联表,并判断能否有85%的把握认为“晋级成功〞与性别有关.P(K?2k)0.40 0.25 0.15 0.1()0.050.025k0.708 1.323 2.072 2.706 3.841 5.024解:(1)由频率分布直方图中各小长方形面积总和为1,得(2.+ 0.020+0.03.+0.040)义10=1,解得〃=0...5.⑵由频率分布直方图知洛小组的中点值依次是55,65,75,85,95, 对应的频率分别为0.05.30,0.40,0.20.05,那么估计该次测试的平均分为 x = 55X0.05 + 65X0.30 + 75X0.40 + 85X0.20 + 95X0.05 = 74(分). ⑶由频率分布直方图知,晋级成功的频率为0.20+0.05=0.25, 故晋级成功的人数为100X0.25 = 25,填写2X2列联表如下:晋级成功 晋级失败合计男 16 34 50 女 9 41 50 合计2575100100X(16X41 ——25X75X50X50^2,613>2.072,所以有85%的把握认为“晋级成功〞与性别有关.1 .为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单 位:小时)如下:248 256 232 243 188 268 278 266 289 312 274296 288 302 295 228 287 217 329 283K 2=n(acl-bc)2(1)完成下面的频率分布表,并作出频率分布直方图;(2)估计8万台电风扇中有多少台无故障连续使用时限不低于280小时;(3)用组中值(同一组中的数据在该组区间的中点值)估计样本的平均无故障连续使用时限.解:(1)频率分布表及频率分布直方图如下所示:0.0100 ——⑵由题意可得8乂(0.30+0.10+0.05) = 3.6,所以估计8万台电风扇中有3.6万台无故障连续使用时限不低于280小时.(3)由频率分布直方图可知x =190X0.05 + 210X0.05 + 230X0.10 + 250X0.15 + 270X0.20 + 290X0.30 + 310X0.10 + 330X0.05 = 269(小时),所以样本的平均无故障连续使用时限为269小时.2 .海水养殖场进行某水产品的新、旧网箱养殖方法的产量比照,收获时各随机抽取了 100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50kg 〞,估计A 的概率;⑵填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量V50 kg箱产量250 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比拟. 附:P (心2)0.050 0.010 0.001 k3.841 6.635 10.8280.01500.0125频率 仇距0.0075 0.0050 0.0025.厂工丁丁丁丁厂!无故障连续使用时用/小时新养殖法、n(ad-bc)1 _ .K-= . , , ,,其中〃=a+/?+c+d.(a+Z?)(c 十d)(a十c)(Z?+d)解:⑴旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)X5=0.62.因此,事件A的概率估计值为0.62.⑵根据箱产量的频率分布直方图得到联表:K2=---------- -------------------- 15 705100X100 X 96X104由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图说明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.3.为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:经计算得x =+£即=9.97,5=、*ZG L x )21 /=1 \ / 1O/=1/ 1 16 _ / 16 16 _=、/讳16 X 2比0.212, / L G-8.5)2^ 18.439,Z (x,- x )(L8.5)=—2.78,其中为为抽取的第i个零件的尺寸,i= 1,2, (16)(1)求⑶,i)(i= 12…,16)的相关系数二并答复是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(假设加V0.25,那么可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(刀-35,7 +3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(7 -35,7 +3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(H,v)(i = 12…4的相关系数£(X,-7)(57-7)r=I ______/ / ・、/(),008公丫0・09・、/ £ d )2、/ £ 8 - 5 )216 _Z (XL x )(/—8.5)尸1解:(1)由样本数据得8,i)(i= 1,2,…,16)的相关系数为r= --------- /--- 1/16 _ / 16、/ Z (即- X C-8.5)2 -2.78剔除第13个数据,剩下数据的样本方差为aX 〔1 591.134 —9.22?—15X 10.022〕=0.008,A Q 这条生产线当天生产的零件尺寸的标准差的估计值为廊而比0.09.4.〔昆明模拟〕〞工资条里显红利,个税新政入民心〞.随着2021年新年钟声的敲响,我国 自1980年以来,力度最大的一次个人所得税〔简称个税〕改革迎来了全面实施的阶段.某IT 从业 者为了解自己在个税新政下能享受多少税收红利,绘制了他在26〜35岁〔2021〜2021年〕之间各 年的月平均收入〕,〔单位:千元〕的散点图:20・・・・ 16- ・ , 12- ., 8 ■ •4°123456789 io"年龄代码工注:年龄代码1~10分别对应年的26〜35岁⑴由散点图知,可用回归模型y=h\n x+a 拟合〕,与x 的关系,试根据有关数据建立〕,关于x 的回归方程;〔2〕如果该IT 从业者在个税新政下的专项附加扣除为3 000元/月,试利用〔1〕的结果,将月平 均收入视为月收入,根据新旧个税政策,估计他36岁时每个月少缴纳的个人所得税.1010 10 _10_ _ 10附注:参考数据:= 55,2〕〉= 155.5,N 〔即一x 〕2 =82.5,2 — x〕〔F — y 〕 = 94.9,26= i=li=li=lJ =1io _ io _ _15.1,2 缶- 1〕2=4.84,£〔力一 t 〕〔yi- y 〕 =242其中"=ln 为;取 In 11 =24,In 36=361=1 /=1参考公式:回归方程.=筋+味中斜率和截距的最小二乘估计分别为公= n ______ _X 〔出一〃〕〔.- V 〕 曰 A - A — -------------------------- \a= v —b u .Z 〔3一 〃 〕2月平均收入y千元解:(1)令 f=lnx,那么 y=bf+a10__Z & -,)()L y)24.2, b ~ ~__Z _痴_5ze —)2r=l10Zu-_2__155.5-_2_=而=-^-=15.55, t =苗A — A —a= y —b t = 15.55 —5X 1.51=8,所以〕,关于/的回归方程为〕,=5/+8.1015.1 lo"=L51由于/=lnx,所以y关于x的回归方程为y=51nx+8.⑵由⑴得,该IT从业者36岁时月平均收入为y=51n 11+8 = 5X2.4+8 = 20〔千元〕.旧个税政策下每个月应缴纳的个人所得税为1 500X3%+3 000X10%+4 500X20%+〔20 000-3 500-9 000〕X25% = 3 120〔元〕.新个税政策下每个月应缴纳的个人所得税为3 000X3%+〔20 000-5 OOO-3OOO-3 000〕X 10%=990〔元〕.故根据新旧个税政策,该IT从业者36岁时每个月少缴纳的个人所得税为3 120-990=2 130(70).I— 0 180.212X716X18.439 ',由于lrlV0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)①由于7 =9.97,产0.212,由样本数据可以看出抽取的第13个零件的尺寸在(T—3s,7 + 3s)以外,因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均数为右义(16义9.97—9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.162X?=16X0.212I2+16X9.972^1 591.134,。
高考数学一轮复习《统计》练习题(含答案)
高考数学一轮复习《统计》练习题(含答案)一、单选题1.已知条件p :11x -<<,q :x >m ,若p 是q 的充分不必要条件,则实数m 的取值范围是( ) A .[)1,-+∞B .(),1-∞-C .()1,0-D .(],1-∞-2.下表为随机数表的一部分:08015 17727 45318 22374 21115 78253 77214 77402 43236 00210 45521 64237已知甲班有60位同学,编号为00~59号,规定:利用上面的随机数表,从第1行第4列的数开始,从左向右依次读取2个数,则抽到的第8位同学的编号是( ) A .11B .15C .25D .373.一组数据的方差为()20S S ≥,将该组数据都乘以2,所得到的一组新数据的标准差为( )A .22S B .SC .2SD .2S4.甲、乙两所学校的男女生比例如图所示,已知甲校学生总数为1500,乙校学生总数为1000,下列结论错误的是( )A .甲校女生比乙校女生多B .乙校男生比甲校男生少C .乙校女生比甲校男生少D .甲校女生比乙校男生少5.某校共有学生3000人,为了解学生的身高情况,用分层抽样的方法从三个年级中抽取容量为100的样本,其中高一抽取40人,高二抽取30人,则该校高三学生人数为( ) A .600B .800C .900D .12006.设某高中的男生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据()(12)i i x y i n =,,,,,用最小二乘法建立的回归方程为ˆ0.8580.71y x =-,则下列结论中不正确的是( ) A .y 与x 有正的线性相关关系B .回归直线过样本点的中心(),x yC .若该高中某男生身高增加1cm ,则其体重约增加0.85kgD .若该高中某男生身高为170cm ,则可断定其体重必为63.79kg 7.x 是12100,,,x x x 的平均值,5为4120,,,x x x 的平均值,10为4142100,,,x x x 的平均值,则x =( ) A .8B .9C .15D .1528.某学校有男生400人,女生600人.为调查该校全体学生每天睡眠时间,采用分层抽样的方法抽取样本,计算得男生每天睡眠时间均值为7.5小时,方差为1,女生每天睡眠时间为7小时,方差为0.5.若男、女样本量按比例分配,则可估计总体方差为( ). A .0.45B .0.62C .0.7D .0.769.某样本点)()(,1,2,,i i x y i n =⋅⋅⋅的经验回归方程为ˆ0.50.7yx =+,当8x =时,y 的实际值为4.5,则当8x =时,预测值与实际值的差值为( ). A .0.1B .0.2C .0.3D .0.410.若数据9,m ,6,n ,5的平均数为7,方差为2,则数据11,9,21m -,17,21n -的平均数和方差分别为( ) A .13,4B .14,4C .13,8D .14,811.2021年起,我市将试行“3+1+2”的普通高考新模式,即除语文、数学、外语3门必选科目外,考生再从物理、历史中选1门,从化学、生物、地理、政治中选2门作为选考科目.为了帮助学生合理选科,某中学将高一每个学生的六门科目综合成绩按比例均缩放成5分制,绘制成雷达图.甲同学的成绩雷达图如图所示,下面叙述一定不正确的是( )A .甲的化学成绩领先年级平均分最多.B .甲有2个科目的成绩低于年级平均分.C .甲的成绩最好的前两个科目是化学和地理.D .对甲而言,物理、化学、地理是比较理想的一种选科结果.12.冬末春初,乍暖还寒,人们容易感冒发热,若发生群体性发热,则会影响到人们的身体健康,干扰正常工作生产,某大型公司规定:若任意连续7天,每天不超过5人体温高于37.3℃,则称没有发生群体性发热,下列连续7天体温高于37.3℃人数的统计特征数中,能判定该公司没有发生群体性发热的为( )(1)中位数为3,众数为2 (2)均值小于1,中位数为1(3)均值为3,众数为4 (4)均值为2 A .(1)(3)B .(3)(4)C .(2)(3)D .(2)(4)二、填空题13.某校高一、高二、高三年级的学生人数之比为5:5:4,现按年级用分层抽样的方法抽取若干人,若抽取的高三年级的学生人数为20,则抽取的样本容量为______.14.已知具有线性相关的变量x 、y ,设其样本点为()(1,2,,,8)i i i A x y i =,回归直线方程为1ˆ2yx b =+,若128(6,2)OA OA OA +++=(O 为原点),则b =_______.15.已知一组数据按顺序排列为:12,16,20,n ,46,51,58,60.若这组数据的第30百分位数的两倍与这组数据的第50百分位数相等,则n 的值为___________.16.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:由表中的数据得线性回归方程为y bx a =+,其中20b =-,预测当产品价格定为9.5(元)时,销量约为__________件.三、解答题17.某区政府组织了以“不忘初心,牢记使命”为主题的教育活动,为统计全区党员干部一周参与主题教育活动的时间,从全区的党员干部中随机抽取n 名,获得了他们一周参与主题教育活动时间(单位:h )的频率分布直方图如图所示,已知参与主题教育活动时间在(]12,16内的人数为92.(1)求n 的值;(2)以每组数据所在区间的中点值作为本组的代表,估算这些党员干部参与主题教育活动时间的中位数(中位数精确到0.01).(3)如果计划对参与主题教育活动时间在(]16,24内的党员干部给予奖励,且在(]16,20,(]20,24内的分别评为二等奖和一等奖,那么按照分层抽样的方法从获得一、二等奖的党员干部中选取5人参加社区义务宣讲活动,再从这5人中随机抽取2人作为主宣讲人,求这2人均是二等奖的概率.18.由于疫情影响,今年我们学校开展线上教学,高一年级某班班主任为了了解学生上网学习时间,对本班40名学生某天上网学习时间进行了调查,将数据(取整数)整理后,绘制出如图所示频率分布直方图,已知从左到右各个小组的频率分别是0.15,0.25,0.35,0.20,0.05,则根据直方图所提供的信息:(1)这一天上网学习时间在100~119分钟之间的学生有多少人?(2)估计这40位同学的线上平均学习时间(同一组中的数据用该组区间的中点值为代表)以及中位数分别是多少?(精确到0.1)(3)如果只用这40名学生这一天上网学习时间作为样本去推断该校高一年级全体学生该天的上网学习时间,这样推断是否合理?为什么?19.省政府坚持以习近平新时代中国特色社会主义思想为指导,落实全国、全省教育大会部署,坚持社会主义办学方向,落实立德树人根本任务,发展素质教育,推进育人方式变革,引导全社会树立科学的教育质量观和人才培养观,切实减轻有损中小学生身心健康的过重学业负担,遵循教育教学规律,促进中小学生健康成长,培养德智体美劳全面发展的社会主义建设者和接班人.从某市抽取1000名一年级小学生进行调查,统计他们每周做作业的时长(单位:小时),根据结果绘制的频率分布直方图如下:(1)根据频率分布直方图,求所有被抽查小学生每周做作业的平均时长和中位数;(同一组中的数据用该组区间的中点值作代表)(2)①为了进一步了解,现采用分层抽样的方法从[8,10]和[10,12]组中抽取50名学生,则两组各抽取多少人?②再利用分层抽样从抽取的50人中选5人参加一个座谈会.现从参加座谈会的5名学生中随机抽取两人发言,求[8,10]小组中恰有2人发言的概率?20.为了调查某地区高中女生的日均消费情况,研究人员随机抽取了该地区5000名高中女生作出调查,所得数据统计如下图所示.(1)求a 的值以及这5000名高中女生的日均消费的平均数(同一组数据用该组区间的中间值代替);(2)在样本中,现按照分层抽样的方法从该地区消费在[)15,20与[)20,25的高中女生中随机抽取9人,若再从9人中随机抽取3人,记这3人中消费在[)15,20的人数为X ,求X 的分布列以及数学期望.21.道德与法律的联系:法律、道德都是行为规范,都是为规范人们的行为而规定的行动准则.1.法律需要道德的奠基和撑持;2.道德的实施需要法律的强制保障.某校进行了一次道德与法律的相关测试(满分:100分),并随机抽取了50个统计其分数,得到的结果如下表所示: 成绩/分 [)0,20[)20,40[)40,60[)60,80[)80,100人数/个 44102210(1)若同一组数据用该区间中点值作代表,试估计这次测试的平均分和中位数(所得结果四舍五入保留整数);(2)假设处于[)20,40的4个人的成绩分别为20,26,35,38,求表中成绩的10%分位数; (3)以频率估计概率,若在这个学校中,随机挑选3人,记3人的成绩在[)80,100间的数量为随机变量X ,求X 的分布列和数学期望()E X .22.某校从高三年级学生中随机抽取100名学生的某次数学考试成绩,将其成绩分成[)50,60,[)60,70,[)70,80,[)80,90,[]90,100的5组,制成如图所示的频率分布直方图.(1)求图中x 的值;(2)估计这组数据的平均数;(3)若成绩在[)50,60内的学生中男生占40%.现从成绩在[)50,60内的学生中随机抽取2人进行分析,求2人中恰有1名女生的概率.23.某校从高三学生中选取了50名学生参加数学质量检测,成绩(单位:分)分组及各组的频数如下:[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出频率分布表;(2)画出频率直方图及频率折线图.24.某农业科学研究所为检验某农作物种子的培育有效率,进行了如下试验:一是对该农作物的10000粒种子进行培育,发现有20粒种子未发芽;二是将未进行培育的该农作物的2500粒种子种植在5块试验田中,各试验田种植的种子数及未发芽数如下表:(1)求y 关于x 的回归直线方程; (2)在上述试验下,若以1nN-表示该农作物种子的培育有效率,其中n 为进行培育的10000粒种子的未发芽数,N 为依据上述回归方程估算的未进行培育的10000粒种子的未发芽数,请估计该农作物种子的培育有效率(结果保留3位有效数字).参考公式;在回归方程ˆˆˆy bx a =+中,1221ˆni ii nii x y nx ybxnx==-⋅=-∑∑,ˆˆa y bx=-参考答案1.D2.A3.D4.D5.C6.D7.A8.D9.B10.C11.A12.D 13.7014.18-##-0.12515.34 16.6017.(1)由已知可得,0.25(0.02500.04750.05000.0125)0.1150a =-+++=. 则0.1150492n ⨯⨯=,得922000.11504n ==⨯.(2)设中位数为x ,则0.050040.01254(16)0.11500.5x ⨯+⨯+-⨯=,得13.83x ≈.(3)按照分层抽样的方法从(16,20]内选取的人数为0.050540.05000.0125⨯=+,从(20,24]内选取的人数为0.0125510.05000.0125⨯=+.记二等奖的4人分别为a ,b ,c ,d ,一等奖的1人为A ,事件E 为“从这5人中抽取2人作为主宣讲人,且这2人均是二等奖”.从这5人中随机抽取2人的基本事件为(,)a b ,(,)a c ,(,)a d ,(,)a A ,(,)b c ,(,)b d ,(,)b A ,(,)c d ,(,)c A ,(,)d A ,共10种,其中2人均是二等奖的情况有(,)a b ,(,)a c ,(,)a d ,(,)b c ,(,)b d ,(,)c d ,共6种, 由古典概型的概率计算公式得()63105P E ==. 18.(1)因为频数=样本容量⨯频率,一天上网学习时间在100119分钟之间的学生所占频率为0.35,所以一天上网学习时间在100~119分钟之间的学生人数为400.3514⨯=(人) (2)40位同学的线上学习时间估计值为:0.1569.90.2589.90.35109.90.20129.90.05149.9104.9⨯+⨯+⨯+⨯+⨯=分钟在中位数左边和右边的小长方形的面积和是相等的,设在99.9~119.9靠近左侧长度为x ,则0.15+0.25+0.350.5x =解得0.27x ≈; 所以中位数估计值是99.9+0.27=100.17100.2≈(3)因为该样本的选取只在高一某班,不具有代表性,所以这样推断不合理. 19.(1)设抽查学生做作业的平均时长为x ,中位数为y ,0.0510.130.2550.370.1590.1110.0513 6.8x =⨯+⨯+⨯+⨯+⨯+⨯+⨯=, 0.050.10.250.15(6)0.5y y =+++⨯-=,解得203y =即抽查学生做作业的平均时长为6.8,中位数为203. (2)①[8,10]组的人数为10000.15150⨯=人,设抽取的人数为a ,[]10,12组的人数为10000.1100⨯=人, 设抽取的人数为b ,则50150100250a b ==,解得30a =,20b = 所以在[8,10]和[]10,12两组中分别抽取30人和20人,②再抽取5人,其中[8,10]和[]10,12两组中分别抽取3人和2人,将[8,10]组中被抽取的工作人员标记为1A ,2A ,3A ,将[]10,12中的标记为1B ,2B . 设事件C 表示从[8,10]小组中恰好抽取2人,则抽取的情况如下:{}12,A A ,{}13,A A ,{}11,A B ,{}12,A B ,{}23,A A ,{}21,A B ,{}22,A B ,{}31,A B ,{}32,A B ,{}12,B B 共10种情况;其中在[8,10]中恰好抽取2人有3种,则3()10P C =. 20.(1)由题意得,()20.040.080.0651a +++⨯=,解得0.01a =,故所求平均数为17.50.427.50.332.50.0537.50.0524.25⨯0.2+22.5⨯+⨯+⨯++=(元); (2)由题意得,消费在[)15,20,[)20,25的高中女生分别有3人和6人,故X 的可能取值为0,1,2,3,∴()6033395021C C P X C ===,()21633915128C C P X C ===,()1263393214C C P X C ===,()0363391384C C P X C ===, 故X 的分布列为:∴()515310123121281484E X =⨯+⨯+⨯+⨯=; 故答案为:1. 21.(1)估计这次测试的平均分为1043045010702290106250x ⨯+⨯+⨯+⨯+⨯==(分);设这次测试的中位数为0x ,显然()060,80x ∈,则060441022200.550x -+++⋅=,解得066x ≈(分). 即估计这次测试的中位数为66.(2)由于5010%5⨯=,所以表中成绩的10%分位数为2026232+=. (3)X 所有可能取值为0,1,2,3.由表中数据可知,任意挑选一人,成绩在[)80,100间的概率为101505=. 所以()346405125P X ⎛⎫=== ⎪⎝⎭,()21341481C 55125P X ⎛⎫=== ⎪⎝⎭, ()122341122C 55125P X ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭,()31135125P X ⎛⎫=== ⎪⎝⎭, 故X 的分布列为故X 的数学期望()6448121301231251251251255E X =⨯+⨯+⨯+⨯=. 22.(1)由频率分布直方图得()0.0050.0350.0300.010101x ++++⨯=,解得0.020x =, 所以图中x 的值是0.020.(2)由频率分布直方图得这组数据的平均数: (550.005650.020750.03585x =⨯+⨯+⨯+⨯)0.030950.0101077+⨯⨯=, 所以这组数据的平均数为77.(3)数学成绩在[)50,60内的人数为0. 005101005⨯⨯=(人),其中男生人数为540%2⨯=(人),则女生人数为3人,记2名男生分别为1A ,2A ,3名女生分别为1B ,2B ,3B ,从数学成绩在[)50,60内的5人中随机抽取2人进行分析的基本事件为:121112132122A A A B A B A B A B A B ,,,,,,23121323A B B B B B B B ,,,,共10个不同结果,它们等可能, 其中2人中恰有1名女生的基本事件为111213212223,,,,,A B A B A B A B A B A B ,共6种结果, 所以2人中恰有1名女生的概率为为63105=. 23.(1)解:频率分布表如下:(2) 频率直方图及频率折线图如图所示.24. (1)依题意,3004005006007005005x ++++==,2466755y ++++==, 513002400450066006700713700ii i x y ==⋅+⋅+⋅+⋅+⋅=∑, 52222221(34567)100001350000i i x==++++⋅=∑, 于是得512252113700550051200ˆ0.01213500005500100000i ii i i x y nx y b x nx==-⋅-⋅⋅====-⋅-∑∑,ˆˆ50.0125001ay bx =-=-⨯=-, 所以y 关于x 的回归直线方程为ˆ0.0121yx =-; (2)由(1)知,估计未进行培育的10000粒种子的未发芽数N 约为:ˆ0.012100001119y =⨯-=,而已培育的10000粒种子有20粒种子未发芽,即20n =, 所以该农作物种子的培育有效率为209910832119119-=≈。
(压轴题)高中数学必修三第一章《统计》测试(有答案解析)
一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆybx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.某校举行演讲比赛,9位评委给选手A 打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若统计员计算无误,则数字x 应该是( )A .5B .4C .3D .23.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s <>4.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x的回归方程类型的是( ) A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+5.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18556.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3,则直线OP (O 为原点)的斜率的取值范围是3333(,)(,)282-∞-. A .①②③B .①③④C .①②④D .②③④7.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )A .2,5B .5,5C .5,8D .8,88.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 父亲身高x (cm )174176176176178儿子身高y (cm )175175176177177则y 对x 的线性回归方程为A .y = x-1B .y = x+1C .y =88+12x D .y = 1769.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64B .96C .144D .16010.某校高一年级有学生1800人,高二年级有学生1500人,高三年级有1200人,为了调查学生的视力状况,采用分层抽样的方法抽取学生,若在抽取的样本中,高一年级的学生有60人,则该样本中高三年级的学生人数为( ) A .60B .50C .40D .3011.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变12.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为 A .12B .14C .16D .18二、填空题13.东汉·王充《论衡·宜汉篇》:“且孔子所谓一世,三十年也.”,清代·段玉裁《说文解字注》:“三十年为一世.按父子相继曰世”.“一世”又叫“一代”,到了唐朝,为了避李世民的讳,“一世”方改为“一代”,当代中国学者测算“一代”平均为25年.另据美国麦肯锡公司的研究报告显示,全球家庭企业的平均寿命其实只有24年,其中只有约30%的家族企业可以传到第二代,能够传到第三代的家族企业数量为总量的13%,只有5%的家族企业在第三代后还能够继续为股东创造价值.根据上述材料,可以推断美国学者认为“一代”应为__________年.14.下列说法正确的是__________(填序号)(1)已知相关变量(),x y 满足回归方程ˆ24yx =-,若变量x 增加一个单位,则y 平均增加4个单位(2)若,p q 为两个命题,则“p q ∨”为假命题是“p q ∧”为假命题的充分不必要条件(3)若命题0:p x R ∃∈,20010x x -+<,则:p x R ⌝∀∉,210x x -+≥(4)已知随机变量()22X N σ~,,若()0.32P X a <=,则()40.68P X a >-=15.中医药是反映中华民族对生命、健康和疾病的认识,具有悠久历史传统和独特理论及技术方法的医药学体系,是中华文明的瑰宝.某科研机构研究发现,某品种中成药的药物成份A 的含量x (单位:g )与药物功效y (单位:药物单位)之间具有关系:(20)y x x =-.检测这种药品一个批次的5个样本,得到成份A 的平均值为8g ,标准差为2g ,估计这批中成药的药物功效的平均值为__________药物单位.16.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..17.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.18.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.19.某高中有高一学生320人,高二学生400人,高三学生360人.现采用分层抽样调查学生的视力情况.已知从高一学生中抽取了8人,则三个年级一共抽取了__________人。
高中数学概率统计专题练习题及答案
高中数学概率统计专题练习题及答案一、选择题1. 掷一枚骰子,结果为奇数的概率是多少?A. 1/2B. 1/6C. 2/3D. 1/32. 从1至20这20个数字中随机选出一个数,选出的数是素数的概率是多少?A. 1/5B. 1/4C. 1/2D. 2/53. 一只盒子中有5张红牌和3张蓝牌,从中随机抽取2张牌,同时放回,再随机抽取2张牌,求两次抽取都是红牌的概率是多少?A. 1/16B. 3/8C. 1/4D. 1/8二、计算题1. 一次考试中,甲乙丙三位同学都有70%的概率通过考试。
求三位同学中至少有一位通过考试的概率。
答案:1 - (1 - 0.7)^3 = 0.9732. 从1至100这100个数字中随机选出一个数,选出的数是2的倍数且小于等于50的概率是多少?答案:50/100 = 0.53. 有A、B两个车站,A车站开往B车站的列车间隔是15分钟,B车站开往A车站的列车间隔是10分钟。
现在一个人随机到达A车站,请问他至少要等待几分钟才能搭乘到开往B车站的列车?答案:最小公倍数(15, 10) = 30分钟三、应用题1. 每个学生参加一次足球比赛的概率是0.4,问一个班级20个同学中至少有10个学生参加比赛的概率是多少?答案:利用二项分布公式,计算P(X≥10),其中n=20,p=0.4,k≥10。
答案约为0.599。
2. 一批产品有10%的次品率,现从中随机抽取20个产品,求其中恰好有3个次品的概率。
答案:利用二项分布公式,计算P(X=3),其中n=20,p=0.1,k=3。
答案约为0.201。
3. 一支篮球队最近10场比赛中获胜的概率是0.8,在下一场比赛中,求该队至少获胜8次的概率。
答案:利用二项分布公式,计算P(X≥8),其中n=10,p=0.8,k≥8。
答案约为0.967。
以上为高中数学概率统计专题练习题及答案。
希望对您的学习有所帮助!。
高中数学《统计》单元练习题人教版必修三
必修3《统计》单元练习题一、选择题(每小题5分,共10小题,共50分)1、要完成下列两项调查,①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户调查社会购买力的某项指标;②从某中学的15名艺术特长生中选出3人调查学习负担情况,宜采用的抽样方法依次为( )A .①用随机抽样法,②用系统抽样法B .①用分层抽样法,②用简单随机抽样法C .①用系统抽样法,②用分层抽样法D .①②都用分层抽样法2、100个个体分成10组,编号后分别为第1组:00,01,02,…,09;第2组:10,11,12,…,19;…;第10组:90,91,92,…,99.现在从第k 组中抽取其号码的个位数与()1k m +-的个位数相同的个体,其中m 是第1组随机抽取的号码的个位数,则当5m =时,从第7组中抽取的号码是( )A .71B .61C .75D .65 3、某校对高三年级的学生进行体检,现将高三男生的体重()kg 数据进行整理后分成5组,并绘制频率分布直方图(如图1所示).根据一般标准,高三男生体重超过65kg 属于偏胖,低于55kg 属于偏瘦.已知图中从左到右第一,第三,第四,第五小组的频率分别为0.25、0.20、0.10、0.05,第二小组的频数为400,则该校高三年级的男生总数和体重正常的概率分别为( )A .1000,0.60B .1000,0.50C .800,0.60D .800,0.50 4、对于一组数据ix (i =1,2,3,…,n ),如果将它们改变为ic x +(i =1,2,3,…,n ),其中0c ≠,则下列结论中正确的是( ) A .平均数与方差均不变 B .平均数不变,而方差变了C .平均数变了,而方差保持不变D .平均数与方差均发生了变化 5、下列说法中,正确的是( ) A .数据5,4,4,3,5,2的众数是4B .一组数据的标准差是这组数据的方差的平方C .数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半D .频率分布直方图中各小长方形的面积等于相应各组的频数 6、对于给定的两个变量的统计数据,下列说法正确的是( )A .都可以分析出两个变量的关系B .都可以用一条直线近似地表示两者的关系C .都可以作出散点图D .都可以用确定的表达式表示两者的关系 7、观察新生婴儿的体重,其频率分布直方图如图2所示,则新生婴儿体重(单位:g )在(]2700,3000的概率为( )A .0.001B .0.1C .0.2D .0.38、在一次数学测验中,某小组14名学生分别与全班的平均分85分的差是:2,3,3,5,12,12,8,2,1,4,10,2,5,5-----,那么这个小组的平均分是( )A .97.2分B .87.29分C .92.32分D .82.86分 A .0037.0 B .0020.2 C .0分 D .1分 10、下列说法正确的是( )A .根据样本估计总体,其误差与所选择的样本容量无关B .方差和标准差具有相同的单位C .从总体中可以抽取不同的几个样本D .如果容量相同的两个样本的方差满足2212s s <,那么推得总体也满足2212s s <是错的 二、填空题(每小题5分,共5小题,共25分)11、一个公司共有240名员工,下设一些部门,要采用分层抽样方法从全体员工中抽取一个容量为20的样本.已知某部门有60名员工,那么从这一部门抽取的员工人数是________. 12、常用的统计图表有:_________________________________________________________. 13、常用的抽样方法有:_________________________________________________________. 14、期中考试后,班长算出了全班40人的数学平均成绩为M ,如果把M 当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均值为N ,那么M :N 为______. 15、设几个实数1x ,2x ,…,n x 的算术平方数是x ,若a x ≠,设()()2212p x x x x =-+-+…()2n x x +-,()()2212q x a x a =-+-+…()2n x a +-,则一定有p __________q .三、解答题(共75分)16、(12分)某展览馆22天中每天进馆参观的人数如下:180 158 170 185 189 180 184 185 140 179 192 185 190 165 182 170 190 188 175 180 185 148计算参观人数的中位数、众数、平均数、标准差. 17、(12分)某校为了研究学生的数学成绩x 与物理成绩y 之间的关系,随机抽取了10名学生的成绩(),i i x y ,i =1,2,…,10,且计算出102158732ii x==∑,101758i i x ==∑,101774i i y ==∑,10159686i ii x y==∑.试求当90x =时,y 的线性回归估计值.18、(12分)假设关于某设备的使用年限x (年)和所支出的维修费用y (万元)有如下统计资料:(1)回归直线方程;(2)估计使用年限为10年时,维修费用约是多少?19、(12分)(1)将n 个数1x ,2x ,…,n x 分成两组,第1组数为1x ,2x ,…,k x ,第2组数为1k x +,2k x +,…,n x ,两组数据的均值与方差分别记为12,x x 与2212,s s .试用221212,,,x x s s 表示几个数据的均值x 与方差2s .(2)设i i y ax b =+(,a b 为常数,i =1,2,…,n )并记11n i i x x n ==∑,2211()n x i i s x x n ==-∑,11n i i y y n ==∑,2211()n y i i s y y n ==-∑.试证:222,y xy ax b s a s =+=.20、(13分)有同一型号的汽车100辆.为了解这种汽车每耗油1L所行路程的情况,现从中随机抽出10辆在同一条件下进行耗油1L所行程试验,得到如下样本数据(单位:km)(1)完成上面频率分布表;(2)根据上表,在图3给定坐标系中画出频率分布直方图,并根据样本估计总体数据落在[)12.95,13.95中的概率;(3)根据样本,对总体的平均值进行估计.(2)画出频率分布直方图和频率折线图;10.95,11.35范围内的可能性是百分之几?(3)据上述图表,估计数据落在[)(4)数据小于11.20的可能性是百分之几?。
高中数学统计试题及答案
高中数学统计试题及答案一、选择题(每题3分,共15分)1. 下列哪个选项是描述统计学中的“总体”概念?A. 某班级所有学生的身高B. 某次考试全班学生的成绩C. 某城市所有居民的年收入D. 某次抽样调查中的样本数据答案:C2. 某班级有50名学生,随机抽取5名学生进行身高测量,这个抽样方法属于:A. 简单随机抽样B. 分层抽样C. 系统抽样D. 整群抽样答案:A3. 某次考试的平均分是85分,标准差是10分,那么这次考试的成绩分布:A. 呈正态分布B. 呈均匀分布C. 呈指数分布D. 呈二项分布答案:A4. 以下哪个统计量是衡量数据集中趋势的指标?A. 方差B. 标准差C. 均值D. 极差答案:C5. 某工厂生产的产品合格率为90%,那么不合格率是:A. 10%B. 90%C. 50%D. 70%答案:A二、填空题(每题2分,共10分)6. 一组数据的平均数是50,中位数是45,众数是30,这组数据的分布情况是________。
答案:右偏7. 某班学生数学成绩的方差是25,这表明该班学生成绩的________。
答案:波动较大8. 某次调查中,样本容量为100,样本均值为80,样本方差为16,那么样本的标准差是________。
答案:49. 某次考试中,有30%的学生成绩在80分以上,70%的学生成绩在80分以下,这符合________分布。
答案:正态分布10. 某商品的销售额为10000元,销售量为200件,那么该商品的平均单价是________。
答案:50元三、简答题(每题7分,共14分)11. 什么是统计中的“样本”和“总体”?请简述它们的区别。
答案:样本是指从总体中随机抽取的一部分个体,用于代表总体进行研究。
总体是指研究对象的全部个体。
区别在于样本是总体的一部分,而总体包含了所有研究对象。
12. 请简述什么是正态分布,并说明其特点。
答案:正态分布是一种连续概率分布,其形状呈钟形曲线,也称为高斯分布。
高中数学【统计与统计案例】专题练习
高中数学【统计与统计案例】专题练习1.(多选)下列统计量中,能度量样本x 1,x 2,…,x n 的离散程度的是( ) A.样本x 1,x 2,…,x n 的标准差 B.样本x 1,x 2,…,x n 的中位数 C.样本x 1,x 2,…,x n 的极差 D.样本x 1,x 2,…,x n 的平均数 答案 AC解析 由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势;故选AC.2.某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下: 旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7 新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x -和y -,样本方差分别记为s 21和s 22. (1)求x -,y -,s 21,s 22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y --x -≥2s 21+s 2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).解 (1)x -=9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.710=10,y -=10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.510=10.3,s 21=0.22+0.32+0+0.22+0.12+0.22+0+0.12+0.22+0.3210=0.036,s 22=0.22+0.12+0.22+0.32+0.22+0+0.32+0.22+0.12+0.2210=0.04. (2)由(1)知,y --x -=0.3; 2s 21+s 2210=20.036+0.0410=20.007 6.又(y --x -)2=0.09>(20.007 6)2=0.030 4,则y --x ->2s 21+s 2210,所以新设备生产产品的该项指标的均值较旧设备有显著提高.3.某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑20i =1x i =60,∑20i =1y i =1 200,∑20i =1(x i -x -)2=80,∑20i =1(y i-y -)2=9 000,∑20i =1(x i -x -)(y i -y -)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r =∑ni =1 (x i -x -)(y i -y -)∑n i =1(x i -x -)2∑n i =1 (y i -y -)2,2≈1.414.解 (1)由已知得样本平均数y -=120∑20i =1y i =60,从而该地区这种野生动物数量的估计值为60×200=12 000.(2)样本(x i ,y i )(i =1,2,…,20)的相关系数r =∑20i =1 (x i -x -)(y i -y -)∑20i =1(x i -x -)2∑20i =1(y i -y -)2=80080×9 000=223≈0.94.(3)分层随机抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层随机抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关性.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.1.抽样方法抽样方法包括简单随机抽样、分层随机抽样,两种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围. 2.统计中的五个数据特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:在样本数据中,将数据按大小顺序排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数. (3)平均数:样本数据的算术平均数,即x -=1n (x 1+x 2+…+x n ).(4)第p 百分位数:将一组数据(共n 个)按从小到大排列,计算i =n ×p %,若i 不是整数,而大于i 的比邻整数为j ,则第p 百分位数为第j 项数据;若i 是整数,则第p 百分位数为第i 项与第(i +1)项数据的平均数.(5)方差与标准差.s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],s =1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2].3.频率分布直方图的两个结论 (1)小长方形的面积=组距×频率组距=频率. (2)各小长方形的面积之和等于1. 4.回归分析与独立性检验(1)回归直线y ^=b ^x +a ^经过样本点的中心(x -,y -),若x 取某一个值代入回归直线方程y ^=b ^x +a ^中,可求出y 的估计值. (2)独立性检验对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是:X Y 合计 y 1 y 2 x 1 a b a +b x 2 c d c +d 合计a +cb +dn则χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c +d 为样本容量).热点一 用样本估计总体考向1 数字特征与统计图表的应用【例1】 (1)空气质量指数分为六级,指数越大说明污染的情况越严重,对人体危害越大,其中指数范围[0,50],[51,100],[101,150],[151,200],[201,300]分别对应“优”“良”“轻度污染”“中度污染”“重度污染”五个等级.如图是某市连续14天的空气质量指数趋势图,下列说法不正确的是( )A.这14天中有4天空气质量为“良”B.这14天中空气质量指数的中位数是103C.从2日到5日空气质量越来越差D.连续三天中空气质量指数方差最小的是9日到11日(2)2020年我国突发新冠肺炎疫情,疫情期间中小学生“停课不停学”.已知某地区中小学生人数情况如甲图所示,各学段学生在疫情期间“家务劳动”的参与率如乙图所示.为了进一步了解该地区中小学生参与“家务劳动”的情况,现用分层随机抽样的方法抽取4%的学生进行调查,则抽取的样本容量、抽取的高中生中参与“家务劳动”的人数分别为()A.2 750,200B.2 750,110C.1 120,110D.1 120,200答案(1)B(2)C解析(1)在这14天中,1日、3日、12日、13日的空气质量为良,共4天,故A正确.14天中空气质量指数的中位数为86+1212=103.5,故B错误.从2日到5日,空气质量指数越来越高,故空气质量越来越差,C正确.观察题图可得,9日至11日空气质量指数偏差最小,因此方差最小,D正确.综上知,说法不正确的是B.(2)学生总数为15 500+5 000+7 500=28 000(人),由于抽取4%的学生进行调查,则抽取的样本容量为28 000×4%=1 120.故高中生应抽取的人数为5 000×4%=200,而抽取的高中生中参与“家务劳动”的比率为0.55,故抽取的高中生中参与“家务劳动”的人数为200×0.55=110.探究提高 1.解题的关键是理解统计图表的含义,从中提取数字信息,平均数、众数、中位数描述数据的集中趋势,方差与标准差描述数据的波动大小,标准差、方差越小,数据的离散程度越小,越稳定.2.进行分层随机抽样的相关计算时,常用到的两个关系:(1)样本容量n总体的个数N=该层抽取的个体数该层的个体数;(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.【训练1】(1)以下数据为参加数学竞赛决赛的15人的成绩:(单位:分)78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位数是()A.90B.90.5C.91D.91.5(2)(多选) 2020年上半年,中国养猪企业受猪价高位的利好影响,大多收获史上最佳半年报业绩,部分企业半年报营业收入同比增长超过1倍.某养猪场抓住机遇,加大了生猪养殖规模,为了检测生猪的养殖情况,该养猪场对2 000头生猪的体重(单位:kg)进行了统计,得到如图所示的频率分布直方图,则下列说法正确的是()A.这2 000头生猪体重的众数为160 kgB.这2 000头生猪中体重不低于200 kg的有80头C.这2 000头生猪体重的中位数落在区间[140,160)内D.这2 000头生猪体重的平均数为152.8 kg答案(1)B(2)BCD解析(1)把成绩按从小到大的顺序排列为:56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为15×80%=12,所以这15人成绩的第80百分位数是90+912=90.5.(2)由频率分布直方图可知,[140,160)这一组的数据对应的小长方形最高,所以这2 000头生猪的体重的众数为150 kg,A错误;这2 000头生猪中体重不低于200 kg的有0.002×20×2 000=80(头),B正确;因为生猪的体重在[80,140)内的频率为(0.001+0.004+0.01)×20=0.3,在[140,160)内的频率为0.016×20=0.32,且0.3+0.32=0.62>0.5,所以这2 000头生猪体重的中位数落在区间[140,160)内,C正确;这2 000头生猪体重的平均数为(0.001×90+0.004×110+0.01×130+0.016×150+0.012×170+0.005×190+0.002×210)×20=152.8(kg),D正确.考向2用样本的频率分布估计总体分布【例2】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.探究提高 1.平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们所反映的情况有着重要的实际意义.2.在例2中,抓住频率分布直方图各小长方形的面积之和为1,这是求解的关键;本题易混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.【训练2】(多选)为了更好地支持中小型企业的发展,某市决定对部分企业的税收进行适当的减免,现调查了当地100家中小型企业年收入(单位:万元)情况,并根据所得数据画出了如图所示的频率分布直方图,则下列结论正确的是()A.样本在区间[500,700]内的频数为18B.如果规定年收入在300万元以内的企业才能享受减免税收政策,估计有30%的当地中小型企业能享受到减免税收政策C.样本的中位数大于350万元D.可估计当地中小型企业年收入的平均数超过400万元(同一组中的数据用该组区间的中点值作代表)答案ABC解析依题意,(0.001+0.002+0.002 6×2+a+0.000 4)×100=1,所以a=0.001 4.对于A,样本在[500,700]内的频率为(0.001 4+0.000 4)×100=0.18,故频数为0.18×100=18,故A正确.对于B,年收入在300万元以内的频率为(0.001+0.002)×100=0.3,故B正确. 对于C,设样本的中位数为x,易知中位数位于[300,400]内,则0.3+(x-300)×0.002 6=0.5,解得x≈376.9,376.9>350,故C正确.因为样本的平均数为150×0.1+250×0.2+350×0.26+450×0.26+550×0.14+650×0.04=376<400,所以估计当地中小型企业年收入的平均数小于400万元,故D 错误. 热点二 回归分析【例3】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响,对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据进行了初步处理,得到如图所示散点图及一些统计量的值.x -y -w -∑8i =1(x i -x -)2∑8i =1(w i -w -)2∑8i =1(x i -x -)·(y i -y -) ∑8i =1(w i -w -)·(y i -y -) 46.65636.8289.8 1.61 469108.8表中w i =x i ,w -=18∑8i =1w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个更适宜作为年销售量y 关于年宣传费x 的回归方程?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程.(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为:β^=∑ni =1(u i -u -)(v i -v -)∑n i =1(u i -u -)2,α^=v --β^u -.解 (1)由散点图可以判断,y =c +d x 更适宜作为年销售量y 关于年宣传费x 的回归方程.(2)易知w =x ,则y ^=d ^w +c ^.由题意得d ^=∑8i =1(w i -w -)(y i -y -)∑8i =1(w i -w -)2=108.81.6=68,所以c ^=y --d ^w -=563-68×6.8=100.6.所以y 关于w 的线性回归方程为y ^=100.6+68w , 所以y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2)知,当x =49时,年销售量y 的预报值为y ^=100.6+6849=576.6,年利润z 的预报值为z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x )-x =-x +13.6x +20.12,所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大. 探究提高 1.求回归直线方程的关键及实际应用 (1)关键:正确理解b ^,a ^的计算公式并准确地计算.(2)实际应用:在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值. 2.相关系数(1)当r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关. (2)当|r |>0.75时,认为两个变量具有较强的线性相关关系.【训练3】 (多选)我国5G 技术研发试验在2016~2018年进行,分为5G 关键技术试验、5G 技术方案验证和5G 系统验证三个阶段.2020年初以来,5G 技术在我国已经进入高速发展的阶段,5G 手机的销量也逐渐上升.某手机商城统计了2021年5个月5G 手机的实际销量,如下表所示:若y 与x 线性相关,且求得线性回归方程为y ^=45x +5,则下列说法正确的是( ) A.a =142 B.y 与x 正相关C.y 与x 的相关系数为负数D.2021年7月该手机商城的5G 手机销量约为365部 答案 AB解析 x -=1+2+3+4+55=3,y -=50+96+a +185+2275=558+a 5,因为点(x -,y -)在回归直线上,所以558+a5=45×3+5,解得a =142,所以选项A 正确;从表格数据看,y 随x 的增大而增大,所以y 与x 正相关,所以选项B 正确;因为y 与x 正相关,所以y 与x 的相关系数为正数,所以选项C 错误;2021年7月对应的月份编号x =7,当x =7时,y ^=45×7+5=320,所以2021年7月该手机商城的5G 手机销量约为320部,所以选项D 错误.故选AB.热点三 独立性检验【例4】 为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO 2浓度(单位:μg/m 3),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO 2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:(3)根据(2)中的列联表,依据小概率值α=0.01的χ2独立性检验,能否认为该市一天空气中PM2.5浓度与SO 2浓度有关? 附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),解 (1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO 2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO 2浓度不超过150的概率的估计值为64100=0.64. (2)根据抽查数据,可得2×2列联表:(3)零假设为H 0:该市一天空气中PM2.5浓度与SO 2浓度无关.根据(2)的列联表得χ2=100×(64×10-16×10)280×20×74×26≈7.484>6.635=x 0.01.根据小概率值α=0.01的χ2独立性检验,我们推断H 0不成立,即认为该市一天空气中PM2.5浓度与SO 2浓度有关,此推断犯错误的概率不超过0.01. 探究提高 1.独立性检验的一般步骤 (1)根据样本数据列成2×2列联表; (2)根据公式χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),计算χ2的值;(3)查表比较χ2与临界值的大小关系,作统计判断.2.χ2的值越大,对应假设事件H 0成立(两类变量相互独立)的概率越小,H 0不成立的概率越大.【训练4】 甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)依据小概率值α=0.01的χ2独立性检验,能否认为甲机床的产品质量与乙机床的产品质量有差异?附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),α 0.050 0.010 0.001 x α3.8416.63510.828解 (1)根据2×2列联表知:甲机床生产的产品中一级品的频率为150200=75%, 乙机床生产的产品中一级品的频率为120200=60%.(2)零假设为H 0:甲机床的产品质量与乙机床的产品质量没有差异.由2×2列联表,得χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=400×(150×80-120×50)2270×130×200×200=40039≈10.256>6.635=x 0.01.根据小概率值α=0.01的χ2独立性检验,我们推断H 0不成立,即认为甲机床的产品质量与乙机床的产品质量有差异,此推断犯错误的概率不超过0.01.一、选择题1.设一组样本数据x 1,x 2,…,x n 的方差为0.01,则数据10x 1,10x 2,…,10x n 的方差为( ) A.0.01 B.0.1 C.1 D.10答案 C解析 10x 1,10x 2,…,10x n 的方差为102×0.01=1.2.为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为y ^=b ^x +a ^.已知∑10i =1x i =225,∑10i =1y i =1 600,b ^=4.该班某学生的脚长为24,据此估计其身高为( ) A.160 B.163 C.166 D.170答案 C解析 ∵x -=110∑10i =1x i =110×225=22.5,y -=110∑10i =1y i=160, ∴a ^=y --b ^x -=160-4×22.5=70, ∴回归直线方程为y ^=4x +70. 因此估计其身高y ^=4×24+70=166.3.从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )A.10B.18C.20D.36答案 B解析 因为直径落在区间[5.43,5.47)内的频率为0.02×(6.25+5.00)=0.225,所以零件的个数为0.225×80=18.4.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15 ℃,B 点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是()A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个答案 D解析由雷达图易知A,C正确;七月的平均最高气温超过20 ℃,平均最低气温约为12 ℃,一月的平均最高气温约为6 ℃,平均最低气温约为2 ℃,所以七月的平均温差比一月的平均温差大,B正确;由雷达图知平均最高气温超过20 ℃的月份有3个月,D错误.5.(多选) 5G时代已经到来,5G的发展将直接带动包括运营、制造、服务在内的通信行业整体的快速发展,进而对GDP增长产生直接贡献,并通过产业间的关联效应,间接带动国民经济各行业的发展,创造出更多的经济增加值.如图,某单位结合近年数据,对今后几年的5G经济产出作出预测.由上图提供的信息可知()A.运营商的经济产出逐年增加B.设备制造商的经济产出前期增长较快,后期放缓C.设备制造商在各年的总经济产出中一直处于领先地位D.信息服务商与运营商的经济产出的差距有逐步拉大的趋势 答案 ABD解析 对于A ,由图知,运营商的经济产出逐年增加,故A 正确;对于B ,由图知,设备制造商的经济产出在2020~2023年间增长较快,后几年增长逐渐趋于平缓,故B 正确;对于C ,由图可知,设备制造商在各年的总经济产出中在前期处于领先地位,而后期是信息服务商处于领先地位,故C 错误;对于D ,由图知,在2020~2025年间信息服务商与运营商的经济产出的差距不大,后几年中信息服务商的经济产出增长速度明显高于运营商的经济产出增长速度,两者间的差距有逐步拉大的趋势,故D 正确.综上所述,选ABD.6.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x -,方差为s 2,则( )A.x -=4,s 2<2B.x -=4,s 2>2 C.x ->4,s 2<2 D.x ->4,s 2>2答案 A解析 ∵某7个数的平均数为4,∴这7个数的和为4×7=28.∵加入一个新数据4,∴x -=28+48=4.又∵这7个数的方差为2,且加入一个新数据4,∴这8个数的方差s 2=7×2+(4-4)28=74<2,故选A.二、填空题 7.给出如下列联表非 30 50 80 合计5060110根据独立性检验,__________在犯错误的概率不超过0.01的前提下认为“高血压与患心脏病有关”(填“能”或“不能”). 答案 能解析 零假设为H 0:高血压与患心脏病无关. 由列联表中的数据可得 χ2=110×(20×50-10×30)230×80×50×60≈7.486>6.635=x 0.01,根据小概率值α=0.01的χ2独立性检验,我们推断H 0不成立,即认为高血压与患心脏病有关,此推断犯错误的概率不超过0.01,即能在犯错误的概率不超过0.01的前提下,认为高血压与患心脏病有关.8.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,测试成绩(单位:分)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x -,则m e ,m 0与x -的大小关系是________.答案 m 0<m e <x -解析 由图可知,30名学生的得分情况依次为得3分的有2人,得4分的有3人,得5分的有10人,得6分的有6人,得7分的有3人,得8分的有2人,得9分的有2人,得10分的有2人.中位数为第15、16个数(分别为5、6)的平均数,即m e =5.5.5出现的次数最多,故m 0=5,x -=2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97.于是得m 0<m e <x -.9.下面的折线图给出的是甲、乙两只股票在某年中每月的收盘价格,已知股票甲的极差是6.88元,标准差为2.04元;股票乙的极差为27.47元,标准差为9.63元,根据这两只股票在这一年中的波动程度,给出下列结论:①股票甲在这一年中波动相对较小,表现的更加稳定;②购买股票乙风险高但可能获得高回报;③股票甲的走势相对平稳,股票乙的收盘价格波动较大;④两只股票在全年都处于上升趋势.其中正确的结论是________(填序号).答案 ①②③解析 由题意可知,甲的标准差为2.04元,乙的标准差为9.63元,可知股票甲在这一年中波动相对较小,表现的更加稳定,故①正确;甲的极差是6.88元,乙的极差为27.47元,可知购买股票乙风险高但可能获得高回报,故②正确;通过折线图可知股票甲的走势相对平稳,股票乙的收盘价格波动较大,故③正确;通过折线图可得乙在6月到8月明显是下降趋势,故④错误. 三、解答题10.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:性别对该商场的服务 合计满意不满意(1)分别估计男、女顾客对该商场服务满意的概率;(2)依据小概率值α=0.05的χ2独立性检验,能否认为男、女顾客对该商场服务的评价有差异?附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解 (1)由调查数据,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6. (2)零假设为H 0:男、女顾客对该商场服务的评价没有差异. 由列联表中的数据,得 χ2=100×(40×20-30×10)250×50×70×30≈4.762>3.841=x 0.05.根据小概率值α=0.05的χ2独立性检验,我们推 断H 0不成立,即认为男、女顾客对商场服务的评价有差异,此推断犯错误的概率不大于0.05.11.某互联网公司为了确定下季度的前期广告投入计划,收集了近6个月广告投入量x (单位:万元)和收益y (单位:万元)的数据如表:他们分别用两种模型①y =bx +a ,②y =a e bx 进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值.x -y -∑6i =1x i y i∑6i =1x 2i7301 464.24 364(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由; (2)残差绝对值大于2的数据被认为是异常数据,需要剔除. (ⅰ)剔除异常数据后,求出(1)中所选模型的回归方程; (ⅱ)若广告投入量x =18,则该模型收益的预报值是多少?附:对于一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^=b ^x +a ^的斜率和截距的最小二乘估计分别为:b ^=∑n i =1(x i -x -)(y i -y -)∑n i =1(x i -x -)2=∑ni =1x i y i -nx -·y -∑n i =1x 2i -n ·x -2,a ^=y --b ^x -. 解 (1)由于模型①残差波动小,应该选择模型①. (2)(ⅰ)剔除异常数据,即3月份的数据, 剩下数据的平均数为x -=15×(7×6-6)=7.2,y -=15×(30×6-31.8)=29.64,∑5i =1x i y i -5x -·y -=206.4,∑5i =1x 2i -5·x -2=68.8. ∴b ^=206.468.8=3,a ^=y --b ^x -=29.64-3×7.2=8.04.∴所选模型的回归方程为y ^=3x +8.04. (ⅱ)若广告投入量x =18,则该模型收益的预报值是3×18+8.04=62.04(万元).12.(多选)2020年7月国家统计局发布了我国2020年上半年国内经济数据,图1为国内三大产业生产总值的比重,图2为第三产业中各行业生产总值的比重.以下关于我国2020年上半年经济数据的说法正确的是()A.在第三产业中,“批发和零售业”与“金融业”的生产总值之和同“其他服务业”的生产总值基本持平B.若“租赁和商务服务业”生产总值为15 000亿元,则“房地产业”生产总值为32 500亿元C.若“金融业”的生产总值为42 000亿元,则第三产业生产总值为262 500亿元D.若“金融业”的生产总值为42 000亿元,则第一产业生产总值为45 000亿元答案ABC解析对于选项A,在第三产业中,“批发和零售业”与“金融业”的生产总值之和占比为16%+16%=32%,“其他服务业”的生产总值占比为32%,所以“批发和零售业”与“金融业”的生产总值之和同“其他服务业”的生产总值基本持平,故选项A正确.对于选项B,若“租赁和商务服务业”生产总值为15 000亿元,在第三产业中,因为“租赁和商务服务业”生产总值占比为6%,所以第三产业生产总值为15 000=250 000(亿元),又“房地产业”生产总值占比为13%,所以“房地产6%业”生产总值为13%×250 000=32 500(亿元),故选项B正确.对于选项C ,在第三产业中,若“金融业”的生产总值为42 000亿元,因为“金融业”生产总值占比为16%,所以第三产业生产总值为42 00016%=262 500(亿元),故选项C 正确.对于选项D ,第三产业生产总值在三大产业中占比为57%,第一产业生产总值在三大产业中占比为6%,由C 选项知第三产业生产总值为262 500亿元,所以第一产业生产总值为262 50057%×6%≈27 632(亿元),所以选项D 错误.13.由于受到网络电商的冲击,某品牌的洗衣机在线下的销售受到影响,承受了一定的经济损失,现将A 地区200家实体店该品牌洗衣机的月经济损失统计如图所示,估算月经济损失的平均数为m ,中位数为n ,则m -n =________.答案 360解析 第一块小矩形的面积S 1=0.3,第二块小矩形的面积S 2=0.4,故n =2 000+0.5-0.30.000 2=3 000;又第四、五块小矩形的面积均为S =0.06,故a =12 000[1-(0.3+0.4+0.06×2)]=0.000 09,所以m =1 000×0.3+3 000×0.4+5 000×0.18+(7 000+9 000)×0.06=3 360,故m -n =360.14.某公司为了预测下月产品销售情况,找出了近7个月的产品销售量y (单位:万件)的统计表:月份代码t 1 2 3 4 5 6 7 销售量y (万件)y 1y 2y 3y 4y 5y 6y 7但其中数据污损不清,经查证∑7i =1y i =9.32,∑7i =1t i y i =40.17,∑7i =1(y i -y -)2=0.55.。
(压轴题)高中数学必修三第一章《统计》测试题(有答案解析)(1)
一、选择题1.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元2.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,83.已知变量x ,y 的关系可以用模型kx y ce =拟合,设ln z y =,其变换后得到一组数据下:x 16 17 18 19 z50344131由上表可得线性回归方程4z x a =-+,则( ) A .4-B .4e -C .109D .109e4.如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,苹果销量约占20%,三星销量约占30%).根据该图,以下结论中一定正确的是( )A .华为的全年销量最大B .苹果第二季度的销量大于第三季度的销量C .华为销量最大的是第四季度D .三星销量最小的是第四季度5.有一个容量为200的样本,样本数据分组为[50,70),[70,90),[90,110),[110,130),[130,150),其频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在区间[90,110)内的频数为( )A .48B .60C .64D .726.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是( )A .45B .47C .48D .637.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795B .0780C .0810D .08158.如图是两组各7名同学体重(单位:kg )数据的茎叶图,设1、2两组数据的平均数依次为1x 和2x ,标准差依次为12s s 、,那么( )(注:标准差222121[()()...()]n s x x x x x x n=-+-++-A .1212,x x s s >>B .1212,x x s s ><C .1212,x x s s <<D .1212,x x s s9.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )A .2,5B .5,5C .5,8D .8,810.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数( )A .40B .45C .48D .5011.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位 D .y 平均减少2个单位12.已知一组数据12,,,n x x x 的平均数3x =,则数据1232,32,,32n x x x +++的平均数为( ) A .3B .5C .9D .11二、填空题13.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高[)120130,,[)130140,,[]140,150三组内的学生中,用分层抽样的方法抽取18人参加一项活动,则从身高在[]140,150内的学生中抽取的人数应为________.14.随机抽取100名年龄在[10,20),[20,30),…,[50,60)年龄段的市民进行问卷调查,由此得到样本的频率分布直方图如图所示.从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人,则在[50,60)年龄段抽取的人数为______.15.某市有A 、B 、C 三所学校,各校有高三文科学生分别为650人,500人,350人,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B 校学生中抽取______人. 16.给出下列命题:①若函数()y f x =满足(1)(1)f x f x -=+,则函数()f x 的图象关于直线1x =对称; ②点(2,1)关于直线10x y -+=的对称点为(0,3);③通过回归方程y bx a =+可以估计和观测变量的取值和变化趋势;④正弦函数是奇函数,2()sin(1)f x x =+是正弦函数,所以2()sin(1)f x x =+是奇函数,上述推理错误的原因是大前提不正确. 其中真命题的序号是__________. 17.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,若变量x 增加一个单位时,则y 平均增加5个单位; ③线性回归方程^^^y b x a =+所在直线必过(),x y ; ④曲线上的点与该点的坐标之间具有相关关系;⑤在一个22⨯列联表中,由计算得213.079K =,则其两个变量之间有关系的可能性是0090.其中错误的是________.18.某学校高一年级男生人数占该年级学生人数的45%,在一次考试中,男、女生平均分数依次为72、74,则这次考试该年级学生的平均分数为__________.19.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组没有疗效的有6人,则第三组中有疗效的人数为__________.20.为弘扬我国优秀的传统文化,某小学六年级从甲、乙两个班各选出7名学生参加成语知识竞赛,他们取得的成绩的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则的值为__________.三、解答题21.某大学生利用寒假参加社会实践,对机械销售公司7月份至12月份销售某种机械配件的销售量及销售单价进行了调查,销售单价x 和销售量y 之间的一组数据如表所示:月份i 7 8 9 10 11 12 销售单价i x (元) 9 9.5 10 10.5 11 8.5 销售量i y (元)111086514y x (2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过2件,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?(3)预计在今后的销售中,销售量与销售单价仍然服从(1)中的关系,若该种机器配件的成本是2.5元/件,那么该配件的销售单价应定为多元才能获得最大利润?(注:利润=销售收入-成本). 参考数据:51392i ii x y==∑,521502.5i i x ==∑.参考公式:回归直线方程ˆˆˆybx a =+,其中1221ˆni ii nii x y nx yb xnx ==-=-∑∑,ˆˆay bx =-. 22.我国北方广大农村地区、一些城镇以及部分大中城市的周边区域,还在大量采用分散燃煤和散烧煤取暖,既影响了居民基本生活的改善,也加重了北方地区冬季的雾霾天气.推进北方地区冬季清洁取暖,是重大民生工程、民心工程,关系北方地区广大群众温暖过冬,关系雾霾天能不能减少,是能源生产和消费革命、农村生活方式革命的重要内容.2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改电用户大幅度增加,下面条形图反映了某省2018年1~7月份煤改气、煤改电的用户数量.(1)在给定坐标系中作出煤改气、煤改电用户数量y 随月份t 变化的散点图,并用散点图和相关系数说明y 与t 之间具有线性相关性;(2)建立y 关于t 的回归方程(系数精确到0.01),预测11月份该省煤改气、煤改电的用户数量.参考数据:7772111y9.24,t39.75,0.53,7 2.646i i ii i iiy=====⋅≈≈∑∑∑(y-y).参考公式:相关系数()()()()()()11112211,ni i n n nii i i i in ni i ii ii it t y yr t t y y t y t yt t y y======⋅--=⋅--=-⋅-⋅-∑∑∑∑∑∑.回归方程ˆy a bt=+中斜率和截距的最小二乘估计公式分别为:()()()121ˆˆˆ,ni iiniit t y yb a y btt t==⋅--==-⋅-∑∑.23.某城市100户居民的月平均用水量(单位:吨),以[0,2)[2,4)[4,6)[6,8)[8,10)[10,12)[12,14)分组的频率分布直方图如图.(1)求直方图中x的值;并估计出月平均用水量的众数.(2)求月平均用水量的中位数及平均数;(3)在月平均用水量为[6,8),[8,10),[10,12),[12,14)的四组用户中,用分层抽样的方法抽取22户居民,则应在[10,12)这一组的用户中抽取多少户?(4)在第(3)问抽取的样本中,从[10,12)[12,14)这两组中再随机抽取2户,深入调查,则所抽取的两户不是来自同一个组的概率是多少?24.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x(分钟)时刻的细菌个数为y个,统计结果如下:x12345y23445(Ⅰ)在给出的坐标系中画出x,y的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y关于x的回归直线方程ˆˆˆy bx a=+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni iiniix y nx yx naxb y bx====---∑∑)25.为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2017年种植的一批试验紫甘薯在温度升高时6组死亡的株数:温度(单位:C︒)212324272932死亡数y(单位:株)61120275777经计算:611266iix x===∑,611336iiy y===∑,()()61557i iix x y y=--=∑,()62184iix x=-=∑,()6213930iiy y=-=∑,()621ˆ236.64iiy y=-=∑,8.0653167e≈,其中ix,iy分别为试验数据中的温度和死亡株数,1,2,3,4,5,6i=.(1)若用线性回归模型,求y关于x的回归方程ˆˆˆy bx a=+(结果精确到0.1);(2)若用非线性回归模型求得y关于x的回归方程0.2303ˆ0.06xy e=,且相关指数为20.9522R =.(i )试与(1)中的回归模型相比,用2R 说明哪种模型的拟合效果更好; (ii )用拟合效果好的模型预测温度为35C ︒时该紫甘薯死亡株数(结果取整数). 附:对于一组数据()11,u v ,()22,u v ,,(),n n u v ,其回归直线ˆˆˆvu αβ=+的斜率和截距的最小二乘估计分别为:()()()121ˆnii i nii uu v v uu β==--=-∑∑,ˆˆav u β=-;相关指数为:()()22121ˆ1ni i i niii v vR v v ==-=--∑∑.26.某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x ,已知这10个分数的平均数90x =,标准差6s =,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:221nii xnx s n=-=∑(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.2.D解析:D 【分析】根据平均数的性质,方差的性质直接运算可得结果. 【详解】令23(1,2,,5)i i y x i =-=1234555x x x x x x ++++==,1234523232323232310375x x x x x y x -+-+-+-+-∴==-=-=,(也可()(23)2()32537E y E x E x =-=-=⨯-=) ()()()2y 232428D D x D x =-==⨯=故选:D 【点睛】本题主要考查方差及平均值的性质的简单应用,属于中档题.3.D解析:D由已知求得x 与z 的值,代入线性回归方程求得a ,再由kxy ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+,结合z lny =,得z lnc kx =+,则109lnc =,由此求得c 值.【详解】 解:1617181917.54x +++==,50344131394z +++==. 代入4z x a =-+,得39417.5a =-⨯+,则109a =.∴4109z x =-+,由kx y ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+, 令z lny =,则z lnc kx =+,109lnc ∴=,则109c e =. 故选:D . 【点睛】本题考查回归方程的求法,考查数学转化思想方法,考查计算能力,属于中档题.4.A解析:A 【分析】根据图象即可看出,华为在每个季度的销量都最大,从而得出华为的全年销量最大,从而得出A 正确;由于不知每个季度的销量多少,从而苹果、华为和三星在哪个季度的销量大或小是没法判断的,从而得出选项B ,C ,D 都错误. 【详解】根据图象可看出,华为在每个季度的销量都最大,所以华为的全年销量最大;每个季度的销量不知道,根据每个季度的百分比是不能比较苹果在第二季度和第三季度销量多少的,同样不能判断华为在哪个季度销量最大,三星在哪个季度销量最小;B ∴,C ,D 都错误,故选A .【点睛】本题主要考查对销量百分比堆积图的理解.5.B解析:B 【分析】由(0.00500.00750.01000.0125)201a ++++⨯=,求出a ,计算出数据落在区间[90,110)内的频率,即可求解.【详解】由(0.00500.00750.01000.0125)201a ++++⨯=, 解得0.015a =,所以数据落在区间[90,110)内的频率为0.015200.3⨯=, 所以数据落在区间[90,110)内的频数2000.360⨯=,【点睛】本题主要考查了频率分布直方图,频率、频数,属于中档题.6.A解析:A 【解析】 【分析】由茎叶图确定所给的所有数据,然后确定中位数即可. 【详解】各数据为:12 20 31 32 34 45 45 45 47 47 48 50 50 61 63, 最中间的数为:45,所以,中位数为45. 本题选择A 选项. 【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.7.A解析:A 【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为10002050= 所以抽取的第40个数为1520(401)795+⨯-=选A.点睛:本题考查系统抽样概念,考查基本求解能力.8.C解析:C 【分析】由茎叶图分别计算出两组数的平均数和标准差,然后比较大小 【详解】读取茎叶图得到两组数据分别为: (1)53565758617072,,,,,, (2)54565860617273,,,,,,()()11503678112022617x kg =+⨯++++++=,()()215046810112223627x kg =+⨯++++++=,1s ==,2s == 则1212,x x s s << 故选C 【点睛】本题给出茎叶图,需要求出数据的平均数和方差,着重考查了茎叶图的认识,样本特征数的计算等知识,属于基础题.9.C解析:C 【解析】试题分析:由题意得5x =,116.8(915101824)85y y =+++++⇒=,选C. 考点:茎叶图10.C解析:C 【分析】根据频数关系,求出前三段每段的频数,由直方图求出四五组的频率,进而求出前三组的频率和,从而可求该校报名学生的总人数. 【详解】从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,∴从左到右3个小组的频数分别为6,12,18,共有36人,第4,5小组的频率之和为()0.03750.012550.25+⨯=, 则前3小组的频率之和为10.250.75-=, 则该校报名学生的总人数为360.7548÷=,故选C. 【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标相乘后求和可得平均值;(4)直观图左右两边面积相等处横坐标表示中位数.11.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.12.D解析:D 【解析】分析:一组数据中的每一个数加或减一个数,它的平均数也加或减这个数;;依此规律求解即可.详解::∵一组数据12,,,n x x x 的平均数为3, ∴另一组数据1232,32,,32n x x x +++的平均数121211323232[32]33211n n x x x x x x n n n=++++⋯++=++⋯++=⨯+=()(), 故选D.点睛:本题考查了平均数,平均数是指在一组数据中所有数据之和再除以数据的个数.它是反映数据集中趋势的一项指标.二、填空题13.3【分析】先由频率之和等于1得出的值计算身高在的频率之比根据比例得出身高在内的学生中抽取的人数【详解】身高在的频率之比为所以从身高在内的学生中抽取的人数应为故答案为:【点睛】本题主要考查了根据频率分解析:3 【分析】先由频率之和等于1得出a 的值,计算身高在[)120,130,[)130,140,[]140,150的频率之比,根据比例得出身高在[]140,150内的学生中抽取的人数. 【详解】(0.0050.010.020.035)101a ++++⨯=0.03a ∴=身高在[)120,130,[)130,140,[]140,150的频率之比为0.03:0.02:0.013:2:1= 所以从身高在[]140,150内的学生中抽取的人数应为11836⨯= 故答案为:3 【点睛】本题主要考查了根据频率分布直方图求参数的值以及分层抽样计算各层总数,属于中档题.14.3【分析】根据频率分布直方图求得不小于40岁的人的频率及人数再利用分层抽样的方法即可求解得到答案【详解】根据频率分布直方图得样本中不小于40岁的人的频率是0015×10+0005×10=02所以不小解析:3 【分析】根据频率分布直方图,求得不小于40岁的人的频率及人数,再利用分层抽样的方法,即可求解,得到答案. 【详解】根据频率分布直方图,得样本中不小于40岁的人的频率是0.015×10+0.005×10=0.2, 所以不小于40岁的人的频数是100×0.2=20;从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人, 在[50,60)年龄段抽取的人数为0.0051010012320⨯⨯⨯=.【点睛】本题主要考查了频率分布直方图的应用,其中解答中熟记频率分布直方图的性质,以及频率分布直方图中概率的计算方法是解答的关键,着重考查了推理与运算能力,属于基础题.15.40【分析】设应从B 校抽取n 人利用分层抽样的性质列出方程组能求出结果【详解】设应从B 校抽取n 人某市有ABC 三所学校各校有高三文科学生分别为650人500人350人在三月进行全市联考后准备用分层抽样的解析:40 【分析】设应从B 校抽取n 人,利用分层抽样的性质列出方程组,能求出结果. 【详解】设应从B 校抽取n 人,某市有A 、B 、C 三所学校,各校有高三文科学生分别为650人,500人,350人, 在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,120n650500350500∴=++,解得n 40=.故答案为40. 【点睛】本题考查应从B 校学生中抽取人数的求法,考查分层抽样的性质等基础知识,考查运算求解能力,是基础题.16.②③【解析】分析:根据函数的周期性可判断①;根据垂直平分线的几何特征可判断②;根据回归直线的实际意义可判断③;根据演绎推理及正弦函数的定义可判断④详解:①若函数满足则函数是周期为2的周期函数但不一定解析:②③ 【解析】分析:根据函数的周期性,可判断① ;根据垂直平分线的几何特征,可判断②;根据回归直线的实际意义,可判断③;根据演绎推理及正弦函数的定义,可判断④.详解:①若函数()y f x =满足()()11f x f x -=+,则函数()f x 是周期为2的周期函数,但不一定具有对称性,①错误;②点()()2,1?0,3确定直线的斜率为1-,与直线 10x y -+=垂直,且中点()1,2在直线10x y -+=上,故点()()2,1?0,3关于直线10x y -+=的对称,②正确; ③通过回归方程ˆˆˆy bx a =+可以估计和观测变量的取值和变化趋势,③正确;④正弦函数是奇函数,()()2sin 1f x x =+是正弦函数,所以()()2sin 1f x x =+是奇函数,上述推理错误的原因是小前提不正确,④错误,故答案为②③.点睛:本题主要通过对多个命题真假的判断,主要综合考查函数的周期性、点关于直线对称、以及回归分析与“三段论”,属于难题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.17.②④⑤【解析】分析:根据方程性质回归方程性质及其含义卡方含义确定命题真假详解:由方差的性质知①正确;由线性回归方程的特点知③正确;回归方程若变量增加一个单位时则平均减少5个单位;曲线上的点与该点的坐解析:②④⑤ 【解析】分析:根据方程性质、回归方程性质及其含义、卡方含义确定命题真假. 详解:由方差的性质知①正确;由线性回归方程的特点知③正确;回归方程ˆ35yx =-中若变量x 增加一个单位时,则y 平均减少5个单位; 曲线上的点与该点的坐标之间不一定具有相关关系;在一个22⨯列联表中,由计算得213.079K =,只能确定两个变量之间有相关关系的可能性,所以②④⑤均错误.点睛:本题考查方程性质、回归方程性质及其含义、卡方含义,考查对基本概念理解与简单应用能力.18.1【解析】分析:根据平均数与对应概率乘积的和得总平均数计算结果详解:点睛:本题考查平均数考查基本求解能力解析:1 【解析】分析:根据平均数与对应概率乘积的和得总平均数,计算结果.详解:7245%74(145%)72.1⨯+⨯-=. 点睛:本题考查平均数,考查基本求解能力.19.12【解析】分析:由频率=以及直方图可得分布在区间第一组与第二组共有20人的频率即可求出第三组中有疗效的人数得到答案详解:由直方图可得分布在区间第一组和第二组共有20人分布唉区间第一组与第二组的频率解析:12 【解析】 分析:由频率=频数样本容量,以及直方图可得分布在区间第一组与第二组共有20人的频率,即可求出第三组中有疗效的人数得到答案.详解:由直方图可得分布在区间第一组和第二组共有20人,分布唉区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人第三组的频率为0.36,所以第三组的人数为18人,第三组中没有疗效的有6人,第三组由疗效的有12人.点睛:1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法,分布表在数量表示上比较准确,直方图比较直观.2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.20.35【解析】79+78+80+80+x+85+92+967=85解得x=5根据中位数为83可知y=3故yx=35 解析:【解析】,解得,根据中位数为,可知,故.三、解答题21.(1) 3.240ˆyx =-+;(2)可以认为所得的回归直线方程是理想的;(3)该产品的销售单价为7.5元/件时,获得的利润最大. 【分析】(1)计算x 、y ,求出回归系数,写出回归直线方程;(2)根据回归直线方程,计算对应的数值,判断回归直线方程是否理想; (3)求销售利润函数W ,根据二次函数的图象与性质求最大值即可. 【详解】 (1)因为1(99.51010.511)105x =++++=,1(1110865)85y =++++=,所以23925108ˆ 3.2502.5510b -⨯⨯==--⨯,则8( 3.2)00ˆ14a =--⨯=, ∴y 关于x 的回归直线方程为 3.240ˆyx =-+ (2)剩余数据为12月份,此时8.5x =,14y =,现进行检测,当8.5x =时,ˆ 3.28.54012.8y=-⨯+=,则ˆ||12.814 1.22y y -=-=<,所以可以认为所得的回归直线方程是理想的. (3)令销售利润为W ,则22( 2.5)( 3.240) 3.248100 3.2(7.5)80W x x x x x =--+=-+-=--+.∴当7.5x =时,W 取最大值.所以该产品的销售单价为7.5元/件时,获得的利润最大. 【点睛】函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系,如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .22.(1)散点图见解析,y 与t 的线性相关性相当高,理由见解析;(2)0.920.1011 2.02y =+⨯=,2.02万户.【分析】(1)根据表格中对应的t 与y 的关系,描绘散点图,并根据参考数据求r ,说明相关性;(2)根据参考数据求ˆb和ˆa ,求回归直线方程,并令11t =,求y 的预测值.【详解】(1)作出散点图如图所示:由条形图数据和参考数据得()()7722114,0.53iii i t t t y y ===⋅-=⋅-≈∑∑,()()77711139.7549.24 2.79ii i i i i i i tty y t y t y ===⋅--=-=-⨯=∑∑∑,2.790.990.532 2.646r ≈≈⨯⨯.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关性相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由9.24 1.327y ==及(1)得()()()717212.79ˆ0.1028iii i i t t y y b t t==⋅--==≈⋅-∑∑, ˆˆ 1.320.1040.92ay bt =-≈-⨯=,所以,y 关于t 的回归方程为:0.920.10y t =+. 将11t=代入回归方程得:0.920.1011 2.02y =+⨯=,所以预测11月份该省煤改气、煤改电的用户数量达到2.02万户. 【点睛】关键点点睛:本题考查回归直线方程,此类问题的关键是根据参考数据和公式相结合,求ˆb和ˆa ,一般计算量较大,需计算严谨,准确. 23.(1) x =0.075,7;(2) 6.4,5.36;(3) 2;(4)23. 【分析】(1)根据频率和为1,列方程求出x 的值;(2)根据频率分布直方图中,每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均值,由最高矩形的数据组中点为众数;中位数两边的频率相等,由此求出中位数;(3)求出抽取比例数,计算应抽取的户数; (4)利用列举法,由古典概型概率公式可得结果. 【详解】(1)根据频率和为1,得2×(0.02+0.095+0.11+0.125+x +0.05+0.025)=1, 解得x =0.075;由图可知,最高矩形的数据组为[6,8),所以众数为()16872+=; (2) [2,6)内的频率之和为 (0.02+0.095+0.11)×2=0.45;设中位数为y ,则0.45+(y −6)×0.125=0.5, 解得y =6.4,∴中位数为6.4;平均数为()210.0230.09550.1170.12590.075110.025 5.36⨯+⨯+⨯+⨯+⨯+⨯= (3)月平均用电量为[10,12)的用户在四组用户中所占的比例为0.0520.1250.0750.050.02511=+++,∴月平均用电量在[10,12)的用户中应抽取11×211=2(户). (4)月平均用电量在[12,14)的用户中应抽取11×111=1(户), 月平均用电量在[10,12)的用户设为A 、B , 月平均用电量在[12,14)的用户设为C ,从[10,12),[12,14)这两组中随机抽取2户共有 ,,AB AC BC ,3种情况, 其中,抽取的两户不是来自同一个组的有,,AC BC ,2种情况, 所以,抽取的两户不是来自同一个组的概率为23. 【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均值;(4)直方图左右两边面积相等处横坐标表示中位数.24.(Ⅰ)图象见解析,正相关;(Ⅱ)ˆ0.7 1.5yx =+,当15x =时细菌个数为12个. 【分析】(Ⅰ)根据数据描点即得散点图,看图即判断结果; (Ⅱ)利用公式代入数据计算即可. 【详解】解:(Ⅰ)图形如下,观察图像可知细菌个数和时间是正相关.(Ⅱ)由数据计算得,()11234535x =⨯++++=,()123445 3.65y =⨯++++=,1122334445561ni ii x y==⨯+⨯+⨯+⨯+⨯=∑,22222211234555n i i x ==++++=∑。
统计考试题目及答案高中
统计考试题目及答案高中统计学是高中数学课程中的一个重要分支,它涉及到数据的收集、处理、分析和解释。
以下是一套高中统计学的考试题目及答案,供学生复习和教师参考。
一、选择题(每题2分,共10分)1. 下列哪个选项是描述统计数据集中趋势的指标?A. 方差B. 标准差C. 平均数D. 众数答案:C2. 在一组数据中,哪个数值能反映数据的离散程度?A. 均值B. 中位数C. 极差D. 方差答案:D3. 以下哪个统计图适合展示时间序列数据的变化趋势?A. 条形图B. 饼图C. 散点图D. 折线图答案:D4. 样本容量是指什么?A. 样本中数据的个数B. 总体中数据的个数C. 样本中数据的平均值D. 样本中数据的最小值答案:A5. 以下哪个是统计推断的常用方法?A. 描述统计B. 假设检验C. 相关分析D. 回归分析答案:B二、填空题(每空1分,共10分)6. 一组数据的中位数是将数据从小到大排列后,位于______位置的数值。
答案:中间7. 标准差是衡量数据______程度的统计量。
答案:离散8. 统计图的类型包括条形图、饼图、散点图和______。
答案:折线图9. 样本均值的计算公式是将所有样本值______,然后除以样本容量。
答案:相加10. 假设检验中,如果P值小于显著性水平α,则我们______原假设。
答案:拒绝三、简答题(每题10分,共20分)11. 请简述什么是正态分布,并说明其特点。
答案:正态分布是一种连续概率分布,其形状呈对称的钟形曲线,具有均值、方差和标准差等参数。
其特点是数据集中在均值附近,两侧数据逐渐减少,且具有对称性。
12. 解释什么是相关系数,并说明其取值范围及其意义。
答案:相关系数是度量两个变量之间线性关系强度和方向的统计量。
其取值范围在-1到1之间,1表示完全正相关,-1表示完全负相关,0表示无相关。
四、计算题(每题15分,共30分)13. 给定一组数据:3, 5, 7, 9, 11, 13,请计算其均值、中位数、极差和标准差。
高中数学-《统计》测试题
《统计》测试题(满分150分,时间120分钟)一、选择题(每小题5分,共50分)1.某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是() A.抽签法B.随机数法C.系统抽样法D.分层抽样法2.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有()A.a>b>c B.b>c>a C.c>a>b D.c>b>a3.2014年某大学自主招生面试环节中,七位评委为一考生打出分数的茎叶图如图2-1,去掉一个最高分和一个最低分,所剩数据的平均数和方差分别为()图2-1A.84,4.84 B.84,1.6C.85,1.6 D.85,44.甲、乙、丙、丁四人参加射击项目选拔赛,四人平均成绩和方差如下:甲乙丙丁平均环数x8.6 8.9 8.9 8.2方差s2 3.5 3.5 2.1 5.6A.甲B.乙C.丙D.丁5.某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一600人、高二780人、高三n人中,抽取35人进行问卷调查,已知高二被抽取的人数为13人,则n =()A.660B.720 C.780D.8006.下表是某小卖部一周卖出热茶的杯数与当天气温的对比表:气温/℃1813104-1若热茶杯数y()A.y=x+6 B.y=x+42 C.y=-2x+60 D.y=-3x+787.x是x1,x2,…,x100的平均数,a是x1,x2,…,x40的平均数,b是x41,x42,…,x100的平均数,则下列各式正确的是()A.x=40a+60b100 B.x=60a+40b100 C.x=a+b D.x=a+b28.在抽查某产品的尺寸过程中,将其尺寸数据分成若干组,[a,b]是其中一组,抽查出的个体数在该组上的频率是m,该组上的直方图的高为h,则|a-b|=()A.h·m B.hm C.mh D.与m,h无关9.甲、乙、丙三名运动员在某次测试中各射击20次,三人测试成绩的频率分布条形图分别如图2-2,图2-3和图2-4,若s甲,s乙,s丙分别表示他们测试成绩的标准差,则() A.s甲<s乙<s丙B.s甲<s丙<s乙C.s乙<s甲<s丙D.s丙<s甲<s乙图2-2 图2-3图2-410.图2-5是某县参加2014年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为A1,A2,…,A m(如A2表示身高(单位:cm)在[150,155)内的学生人数).图2-6是统计图中身高在一定范围内学生人数的一个算法流程图.现要统计身高在160~180 cm(含160 cm,不含180 cm)的学生人数,那么在流程图中的判断框内应填写的条件是()图2-5图2-6A.i<9? B.i<8? C. i<7? D.i<6?二、填空题(每小题5分,共20分)11.下列四种说法中,①数据4,6,6,7,9,3的众数与中位数相等;②一组数据的标准差是这组数据的方差的平方;③数据3,5,7,9的标准差是数据6,10,14,18的标准差的一半;④频率分布直方图中各小长方形的面积等于相应各组的频数.其中正确的有__________(填序号).12.将参加数学竞赛的1000名学生编号如下:0001,0002, 003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样的方法把编号分成50个部分,如果第一部分编号为0001,0002,0003,…,0020,第一部分随机抽取一个号码为0015,那么抽取的第40个号码为________.13.超速行驶已成为马路上最大杀手之一,已知某中段属于限速路段,规定通过该路段的汽车时速不超过80 km/h,否则视为违规.某天,有1000辆汽车经过了该路段,经过雷达测速得到这些汽车运行时速的频率分布直方图如图2-7,则违规的汽车大约为________辆.图2-714.已知回归直线斜率估计值为1.23,样本点中心为(4,5),则回归方程是____________.三、解答题(共80分)15.(12分)某校500名学生中,O型血有200人,A型血有125人,B型血有125人,AB型血有50人,为了研究血型与色弱的关系,用分层抽样的方法抽取一个容量为20的样本,则各种血型的人分别抽多少?写出抽样过程.16.(12分)对甲、乙两名自行车赛手在相同条件下进行了8次测试,测得他们的最大速度(单位:m/s)的数据如下表:(1)(2)分别求出甲、乙两名自行车赛手最大速度(单位:m/s)的数据的平均数、中位数、标准差,并判断选谁参加比赛更合适(可用计算器).17.(14分)有一个容量为100的样本,数据的分组及各组的频数如下:[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5],8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)数据落在[18.5,27.5)范围内的可能性为百分之几?18.(14分)为了调查甲、乙两个交通站的车流量,随机选取了14天,统计每天上午8:00~12:00间各自的车流量(单位:百辆),得如图2-8所示的统计图,根据统计图:(1)甲、乙两个交通站的车流量的极差分别是多少?(2)甲交通站的车流量在[10,40]间的频率是多少?(3)甲、乙两个交通站哪个更繁忙?并说明理由.图2-819.(14分)为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如图2-9),已知图中从左到右的前三个小组的频率分别是0.1,0.3,0.4.第一小组的频数是5.(1)求第四小组的频率和参加这次测试的学生人数;(2)在这次测试中,学生跳绳次数的中位数落在第几小组内?(3)参加这次测试跳绳次数在100次以上为优秀,试估计该校此年级跳绳成绩的优秀率是多少?图2-920.(14分)某连锁经营公司所属5个零售店某月的销售额和利润额资料如下表:(1)(2)若销售额和利润额具有相关关系,用最小二乘法计算利润额y对销售额x的回归直线方程;(3)据(2)的结果估计当销售额为1亿元时的利润额.第二章自主检测 1.D 2.D3.C 解析:平均分为80+15(4×3+6+7)=85,s 2=15[3×(84-85)2+(86-85)2+(85-87)2]=1.6.4.C 5.B 6.C 7.A 8.C 9.D 10.B 11.①③12.0795 解析:抽取的第40个号码为0015+39×20=0795. 13.28014.y ^=1.23x +0.0815.解:用分层抽样方法抽样.∵20500=250,∴200×250=8,125×250=5,50×250=2. 故O 型血抽8人,A 型血抽5人,B 型血抽5人,AB 型血抽2人. 16.解:(1)茎叶图如图D31,中间数为数据的十位数.图D31从这个茎叶图上可以看出,甲、乙的得分情况都是分布均匀的,只是乙更好一些;乙的中位数是35,甲的中位数是33.因此乙发挥比较稳定,总体得分情况比甲好.(2)利用科学计算器,得x 甲=34,x 乙=35.75;s 甲≈7.55,s 乙≈5.70;甲的中位数是33,乙的中位数是35. 综合比较,选乙参加比赛更合适.17.解:(1)样本的频率分布表如下:分组 频数 频率 [12.5,15.5) 6 0.06 [15.5,18.5) 16 0.16 [18.5,21.5) 18 0.18 [21.5,24.5) 22 0.22 [24.5,27.5) 20 0.20 [27.5,30.5) 10 0.10 [30.5,33.5] 8 0.08 合计1001.00(2)图D32(3)0.18+0.22+0.20=0.60=60%.18.解:(1)甲交通站的车流量的极差为73-8=65; 乙交通站的车流量的极差为71-5=66. (2)甲交通站的车流量在[10,40]间的频率为414=27.(3)甲交通站的车流量集中在茎叶图的下方,而乙交通站的车流量集中在茎叶图的上方.从数据的分布情况来看,甲交通站更繁忙.19.解:(1)第四小组的频率=1-(0.1+0.3+0.4)=0.2, 因为第一小组的频数为5,其频率为0.1, 所以参加这次测试的学生人数为5÷0.1=50(人).(2)0.3×50=15,0.4×50=20,0.2×50=10,则第一、第二、第三、第四小组的频数分别为5,15,20,10.所以学生跳绳次数的中位数落在第三小组内. (3)跳绳成绩的优秀率为(0.4+0.2)×100%=60%. 20.解:(1)销售额和利润额的散点图如图D33.图D33(2)销售额和利润额具有相关关系,列表如下:x i 3 5 6 7 9 y i 2 3 3 4 5 x i y i615182845x =6,y =3.4,51i i i x y =∑=112,521i i x =∑=200所以b ^=112-5×6×3.4200-5×62=0.5,11 / 11 a ^=y -b ^x =3.4-6×0.5=0.4.从而得回归直线方程y ^=0.5x +0.4.(3)当x =10时,y ^=0.5×10+0.4=5.4(百万元).故当销售额为1亿元时,利润额估计为540万元.。
高中数学 统计 经典例题和巩固练习(及详解)
高中数学 统计总复习(例题、巩固练习、例题和巩固练习详解)【典型例题】类型一:随机抽样例1.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是( )A .分层抽样法,系统抽样法B .分层抽样法,简单随机抽样法C .系统抽样法,分层抽样法D .简单随机抽样法,分层抽样法举一反三:【变式1】甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个样本容量为90人的样本,应在这三校分别抽取学生( )A.30人,30人,30人B.30人,45人,15人C.20人,30人,10人D.30人,50人,10人【变式2】一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为l ,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 小组中抽取的号码个位数字与m+k 的个位数字相同.若m=6,则在第7组中抽取的号码是 .【变式3】某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加了其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的41,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定(Ⅰ)游泳组中,青年人、中年人、老年人分别所占的比例; (Ⅱ)游泳组中,青年人、中年人、老年人分别应抽取的人数.类型二:用样本估计总体例2.一次科技知识竞赛,两组学生成绩统计如下表:已经算得两个组的平均数都是80分,请根据你所学统计知识,进一步判断这两个组这次竞赛中的成绩谁优谁次,并说明理由。
(必考题)高中数学必修三第一章《统计》检测题(含答案解析)
一、选择题1.一组数据的平均数为m ,方差为n ,将这组数据的每个数都加上(0)a a >得到一组新数据,则下列说法正确的是( ) A .这组新数据的平均不变 B .这组新数据的平均数为am C .这组新数据的方差为2a nD .这组新数据的方差不变2.统计某校n 名学生的某次数学同步练习成绩,根据成绩分数依次分成六组:[)[)[)[)[)[]90,100,100,110,110,120,120,130,130,140,140,150,得到频率分布直方图如图所示,若不低于140分的人数为110.①0.031m =;②800n =;③100分以下的人数为60;④分数在区间[)120,140的人数占大半.则说法正确的是( )A .①②B .①③C .②③D .②④3.在一次53.5公里的自行车个人赛中,25名参赛选手的成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为125-号,再用系统抽样方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为()A .95B .96C .97D .984.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .5.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795B .0780C .0810D .08156.某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为( ) A .30B .25C .20D .157.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元8.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是 A .甲地:总体均值为3,中位数为4 B .乙地:总体均值为1,总体方差大于0 C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为39.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( ) A .10B .11C .12D .1310.已知x ,y 的取值如表: x 2 6 7 8y若x ,y 之间是线性相关,且线性回归直线方程为,则实数a 的值是A .B .C .D .11.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变12.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表: 时间周一 周二 周三 周四 周五 车流量x (万辆)100102108114116浓度y (微克)78 80 8488 90根据上表数据,用最小二乘法求出y 与x 的线性回归方程是( )参考公式:121()()()niii ni i x x y y b x x ==--=-∑∑,a y b x =-⋅;参考数据:108x =,84y =;A .0.6274ˆ.2yx =+ B .0.7264ˆ.2y x =+ C .0.7164ˆ.1y x =+ D .0.6264ˆ.2y x =+ 二、填空题13.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.14.福利彩票“双色球”中红色球由编号为01,02,…,33的33个个体组成,某彩民利用下面的随机数表(下表是随机数表的第一行和第二行)选取6个红色球,选取方法是从随机数表中第1行的第6列和第7列数字开始,由左到右依次选取两个数字,则选出来的第3个红色球的编号为______.49 54 43 54 82 17 37 93 23 28 87 35 20 56 43 84 26 34 91 64 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7615.已知一组数据为2,3,4,5,6,则这组数据的方差为______.16.变量X 与Y 相对应的5组数据和变量U 与V 相对应的5组数据统计如表: X 10 11.3 11.8 12.5 13 U 10 11.3 11.8 12.5 13 Y12345V54321用b 1表示变量Y 与X 之间的回归系数,b 2表示变量V 与U 之间的回归系数,则b 1与b 2的大小关系是___.17.抽样统计甲、乙两位同学5次数学成绩绘制成如下图所示的茎叶图,则成绩较稳定的那位同学成绩的方差为__________.18.为弘扬我国优秀的传统文化,某小学六年级从甲、乙两个班各选出7名学生参加成语知识竞赛,他们取得的成绩的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则的值为__________.19.为了了解某学校男生的身体发育情况,随机抽查了该校100名男生的体重情况,整理所得数据并画出样本的频率分布直方图.根据此图估计该校2000名男生中体重在7078()kg ~的人数为__________.20.为了解某地区某种农产品的年产量x (单位:吨)对价格y (单位:千元/吨)的影响,对近五年该农产品的年产量和价格统计如下表:x1 2 3 4 5 y 7.06.5m3.82.2已知x 和y 具有线性相关关系,且回归方程为 1.238.69y x =-+,那么表中m 的值为__________.三、解答题21.我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.现该企业为了了解年研发资金投入额x (单位:亿元)对年盈利额y (单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近10年年研发资金投入额i x 和年盈利额i y 的数据.通过对比分析,建立了两个函数模型:①2y x αβ=+,②x ty e λ+=,其中α,β,λ,t 均为常数,e 为自然对数的底数.令2i i u x >,()ln 1,2,,10ii v y i ==⋅⋅⋅,经计算得如下数据:xy()1021ii x x =-∑()1021ii yy =-∑uv2621565 26805.36()1021ii uu =-∑()()101iii u u y y =--∑()1021ii v v =-∑()()101iii x x v v =--∑11250130 2.612(2)(ⅰ)根据(1)的选择及表中数据,建立y关于x的回归方程;(系数精确到0.01)(ⅱ)若希望2021年盈利额y为250亿元,请预测2021年的研发资金投入额x为多少亿元?(结果精确到0.01)附:①相关系数12211()()()()ni iinni ii ix x y yrx x y y===--=--∑∑∑,回归直线ˆˆˆy a bx=+中:121()()ˆ()ni iiniix x y ybx x==--=-∑∑,ˆˆa y bx=-②参考数据:ln20.693≈,ln5 1.609≈.22.某企业投资两个新型项目,投资新型项目A的投资额m(单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m=-,投资新型项目B的投资额x(单位:十万元)与纯利润y(单位:万元)的散点图如图所示.(1)求y关于x的线性回归方程;(2)根据(1)中的回归方程,若A,B两个项目都投资60万元,试预测哪个项目的收益更好.附:回归直线y bx a=+的斜率和截距的最小二乘估计分别为1221ni iiniix y nx ybx nx==-=-∑∑,a y bx=-.23.某城市100户居民的月平均用水量(单位:吨),以[0,2)[2,4)[4,6)[6,8)[8,10)[10,12)[12,14)分组的频率分布直方图如图.(1)求直方图中x的值;并估计出月平均用水量的众数.(2)求月平均用水量的中位数及平均数;(3)在月平均用水量为[6,8),[8,10),[10,12),[12,14)的四组用户中,用分层抽样的方法抽取22户居民,则应在[10,12)这一组的用户中抽取多少户?(4)在第(3)问抽取的样本中,从[10,12)[12,14)这两组中再随机抽取2户,深入调查,则所抽取的两户不是来自同一个组的概率是多少?24.某市为了解疫情过后制造业企业的复工复产情况,随机调查了100家企业,得到这些企业4月份较3月份产值增长率x的频率分布表如下:-[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80) x的分组[0.20,0)企业数13403584(1)估计制造业企业中产值增长率不低于60%的企业比例及产值负增长的企业比例;(2)求制造业企业产值增长率的平均数与方差的估计值(同一组中的数据用该组区间的中点值为代表).25.为了解某小卖部冷饮销量与气温之间的关系,随机统计并制作了6天卖出的冷饮的数量与当天最高气温的对照表:x℃272930323335气温()数量y121520272836(1)画出散点图,并求出y 关于x 的线性回归方程;(2)根据天气预报,某天最高气温为36.6℃,请你根据这些数据预测这天小卖部卖出的冷饮数量.附:一组数据11(,)x y ,22(,)x y ,,(,)n n x y 的回归直线y a bx =+的斜率和截距的最小二乘估计为()()()121ˆniii ni i x x y y bx x ==--=-∑∑,ˆa y bx=- 26.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式。
(必考题)高中数学必修三第一章《统计》测试(包含答案解析)(1)
一、选择题1.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元2.2020年2月,受新冠肺炎的影响,医卫市场上出现了“一罩难求”的现象.在政府部门的牵头下,部分工厂转业生产口罩,下表为某小型工厂2-5月份生产的口罩数(单位:万) 月份x 2 3 4 5 口罩数y4.5432.5口罩数y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 的值为( ) A .6.1B .5.8C .5.95D .6.753.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.54.已知一组数据的茎叶图如图所示,则该组数据的平均数为( )A .85B .84C .83D .815. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日6.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系 价格(万元) 25 23.5 22 20.5 销售量(辆)30333639已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆybx =+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39 B .42C .45D .507.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和928.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64 B .96C .144D .1609.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .9110.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变11.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位12.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经统计,得到一个卖出的热饮杯数与当天气温的对比表: 温度℃ -5 0 4 7 12 15 19 23 27 31 36 热饮杯数15615013212813011610489937654根据上表数据确定的线性回归方程应该是( )A .ˆ 2.352147.767yx =-+ B .ˆ 2.352127.765yx =-+ C .ˆ 2.35275.501yx =+D .ˆ 2.35263.674yx =+ 二、填空题13.已知某产品连续4个月的广告费i x (千元)与销售额i y (万元)(1,2,3,4i =)满足4115ii x==∑,4112i i y ==∑,若广告费用x 和销售额y 之间具有线性相关关系,且回归直线方程为^y bx a =+,0.6b =,那么广告费用为5千元时,可预测的销售额为___万元. 14.某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~1000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为_________15.某次测试共有100名考生参加,测试成绩的频率分布直方图如下图所示,则成绩在80分以上的人数为__________.16.已知一组数据为2,3,4,5,6,则这组数据的方差为______.17.已知一组数据:5.7,5.8,6.1,6.4,6.5,则该数据的方差是__________. 18.变量X 与Y 相对应的5组数据和变量U 与V 相对应的5组数据统计如表:X 1011.3 11.8 12.5 13 U 10 11.3 11.8 12.5 13 Y12345V54321用b 1表示变量Y 与X 之间的回归系数,b 2表示变量V 与U 之间的回归系数,则b 1与b 2的大小关系是___.19.某中学调查了400名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[]17.5,30,样本数据分组为[)17.5,20,[)20,22.5,[)22.5,25,[)25,27.5,[]27.5,30.根据直方图,这400名学生中每周的自习时间不少于22.5小时的人数是__________人.20.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b+的最小值为__________.三、解答题21.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9x (2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-22.随着人民生活水平的日益提高,某小区拥有私家车的数量与日俱增,物业公司统计了近六年小区私家车的数量,数据如下: 年份 2014 2015 20162017 2018 2019 编号x 1 2 3 4 5 6 数量y (辆)4196116190218275(1)若该小区私家车的数量y 与年份编号x 的关系可用线性回归模型来拟合,请求出y 关于x 的线性回归方程,并用相关指数2R 分析其拟合效果(2R 精确到0.01);(2)由于该小区没有配套停车位,车辆无序停放易造成交通拥堵,因此物业公司预在小区内划定一定数量的停车位,若要求在2022年小区停车位数量仍可满足需要,则至少需要规划多少个停车位. 参考数据:61936ii y==∑,614081i i i x y ==∑,62191ii x ==∑,()62137586i i y y=-=∑.附:回归方程中斜率和截距的最小二乘估计公式分别为:1221ni ii nii x y nx yb xnx==-⋅=-∑∑,a y bx =-,相关指数()()221211ni ii n ii y y R yy==-=--∑∑,残差e y y =-.23.2018年,依托用户碎片化时间的娱乐需求、分享需求以及视频态的信息负载力,短视频快速崛起;与此同时,移动阅读方兴未艾,从侧面反应了人们对精神富足的一种追求,在习惯了大众娱乐所带来的短暂愉悦后,部分用户依旧对有着传统文学底蕴的严肃阅读青睐有加.某读书APP 抽样调查了非一线城市M 和一线城市N 各100名用户的日使用时长(单位:分钟),绘制成频率分布直方图如下,其中日使用时长不低于60分钟的用户记为“活跃用户”.(1)请填写以下22⨯列联表,并判断是否有99.5%的把握认为用户活跃与否与所在城市有关?活跃用户 不活跃用户 合计城市M 城市N 合计(2)以频率估计概率,从城市M 中任选2名用户,从城市N 中任选1名用户,设这3名用户中活跃用户的人数为ξ,求ξ的分布列和数学期望.(3)该读书APP 还统计了2018年4个季度的用户使用时长y (单位:百万小时),发现y 与季度(x )线性相关,得到回归直线为ˆ4ˆyx a =+,已知这4个季度的用户平均使用时长为12.3百万小时,试以此回归方程估计2019年第一季度(5x =)该读书APP 用户使用时长约为多少百万小时. 附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥ 0.025 0.010 0.005 0.001 0k5.0246.6357.87910.82824.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x (分钟)时刻的细菌个数为y 个,统计结果如下:x 1 2 3 4 5 y23445(Ⅰ)在给出的坐标系中画出x ,y 的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y 关于x 的回归直线方程ˆˆˆybx a =+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni ii ni i x y nx yx n axby bx ====---∑∑) 25.某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x ,已知这10个分数的平均数90x =,标准差6s =,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:s =(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)26.某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120分问卷.对收回的100份有效问卷进行统计,得到如22⨯下列联表:(1)现按女生是否能做到科学用眼进行分层,从45份女生问卷中抽取了6份问卷,从这6份问卷中再随机抽取3份,并记其中能做到科学用眼的问卷的份数X ,试求随机变量X 的分布列和数学期望;(2)若在犯错误的概率不超过P 的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P 的值应为多少?请说明理由.附:独立性检验统计量22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b cd =+++.独立性检验临界值表:【参考答案】***试卷处理标记,请不要删除一、选择题 1.C【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.2.C解析:C 【分析】求得 3.5x y ==,得到样本中心点(3.5,3.5),再把样本中心点代入回归直线方程得解. 【详解】由表可得 3.5x y ==,带入线性回归方程中有 3.50.7 3.5 5.95=+⨯=a , 故选:C . 【点睛】本题考查利用线性相关关系求回归直线方程,属于基础题.3.A解析:A 【分析】计算得到 4.5x =,114t y +=,代入回归方程计算得到答案. 【详解】3456 4.54x +++==, 2.54 4.51144t t y ++++==,中心点(),x y 过ˆ0.70.35yx =+, 即114.50.70.354t +=⨯+,解得3t =. 故选:A . 【点睛】本题考查了回归方程的相关问题,意在考查学生的计算能力.4.A解析:A 【解析】利用茎叶图、平均数的性质直接求解. 【详解】由一组数据的茎叶图得: 该组数据的平均数为:1(7581858995)855++++=. 故选:A . 【点睛】本题考查平均数的求法,考查茎叶图、平均数的性质等基础知识,考查运算求解能力,是基础题.5.C解析:C 【分析】认真观察题中所给的折线图,对照选项逐一分析,求得结果. 【详解】这10天中第一天,第三天和第四天共3天空气质量为一级,所以A 正确; 从图可知从6日到9日 2.5PM 日均值逐渐降低,所以B 正确; 从图可知,这10天中 2.5PM 日均值最高的是12月6日,所以D 正确; 由图可知,这10天中 2.5PM 日均值的中位数是4145432+=,所以C 不正确; 故选C. 【点睛】该题考查的是有关利用题中所给的折线图,描述对应变量所满足的特征,在解题的过程中,需要逐一对选项进行分析,正确理解题意是解题的关键.6.B解析:B 【解析】分析:先求均值,确定ˆb,再求自变量为19对应函数值得结果. 详解:因为2523.52220.5330333639122,344442x y ++++++====,所以1348022,3224ˆb-==- 所以19(2)8042y =⨯-+=选B.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .7.A解析:A 【解析】8个班参加合唱比赛的得分从小到大排列分别是87,89,90,91,92,93,94,96,中位数是91,92,的平均数91.5,平均数是87+89+90+91+92+93+94+968=91.58.D解析:D 【解析】 【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数. 【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816, 因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D. 【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题9.A解析:A 【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可. 【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95, 所以中位数为90+91=90.52,故选A. 【点睛】本题主要考查了中位数,茎叶图,属于中档题.10.A解析:A 【分析】可以通过n P 与0P 之间的大小关系进行判断. 【详解】当10k -<<时,()011011nk k <+<<+<,,所以()001nn P P k P =+<,呈下降趋势. 【点睛】判断变化率可以通过比较初始值与变化之后的数值之间的大小来判断.11.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.12.A解析:A 【解析】分析:先观察表中数据的规律,确定回归系数b 的符号,再计算x 和y ,代入选项确定正确答案.详解:由表中数据规律发现:热饮杯数y 随当天气温x 升高而减少,则0b <,排除C 、D. 计算1169=(504712151923273136)1111x -++++++++++= 11228=(15615013212813011610489937654)111.641111y ++++++++++=≈ 将x 代入选项A ,得1692.352147.767111.6311ˆy=-⨯+= 将x 代入选项B ,得1692.352127.76591.6311ˆy=-⨯+= 所以选项A 正确. 故选A.点睛:本题考查线性回归方程的求法与应用,一次项系数b 符号的判断和回归直线过样本中心点(,)x y 是解题关键.二、填空题13.75【解析】【分析】计算然后将代入回归直线得从而得回归方程然后令x=5解得y 即为所求【详解】∵∴∵∴∴样本中心点为(3)又回归直线过(3)即3=06×+解得=所以回归直线方程为y =06x+令x =5时解析:75 【解析】 【分析】计算x ,y ,然后将x ,y 代入回归直线得a ,从而得回归方程,然后令x =5解得y 即为所求. 【详解】 ∵4115i i x ==∑,∴154x =, ∵4112i i y ==∑,∴1234y ==, ∴样本中心点为(154,3), 又回归直线0.6ˆyx a =+过(154,3),即3=0.6×154+a ,解得a =34, 所以回归直线方程为y =0.6x +34, 令x =5时,y =0.6×5+34=3.75万元 故答案为:3.75. 【点睛】本题考查线性回归方程的应用,以及利用线性回归方程进行预测,要注意回归直线必过样本中心点.14.18【解析】【分析】由题意知抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为即可解得【详解】因为抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为解得【点睛】本题主要考解析:18 【解析】 【分析】由题意知,抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,即可解得. 【详解】因为抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,解得18x =. 【点睛】本题主要考查了系统抽样,属于中档题.15.25【解析】分析:先求成绩在80分以上的概率再根据频数等于总数与对应概率乘积求结果详解:因为成绩在80分以下的概率为所以成绩在80分以上的概率为因此成绩在80分以上的人数为点睛:频率分布直方图中小长解析:25 【解析】分析:先求成绩在80分以上的概率,再根据频数等于总数与对应概率乘积求结果.详解:因为成绩在80分以下的概率为(0.0050.03+0.0410=0.75+⨯),所以成绩在80分以上的概率为10.750.25-=,因此成绩在80分以上的人数为0.25100=25.⨯点睛:频率分布直方图中小长方形面积等于对应区间的概率,所有小长方形面积之和为1; 频率分布直方图中组中值与对应区间概率乘积的和为平均数; 频率分布直方图中小长方形面积之比等于对应概率之比,也等于对应频数之比.16.2【解析】分析:根据方差的计算公式先算出数据的平均数然后代入公式计算即可得到结果详解:平均数为:即答案为2点睛:本题考查了方差的计算解题的关键是方差的计算公式的识记它反映了一组数据的波动大小方差越大解析:2 【解析】分析:根据方差的计算公式,先算出数据的平均数,然后代入公式计算即可得到结果. 详解:平均数为:2345645+++++=,()22222211[2434445464]4114255s =⨯-+-+-+-+-=⨯+++=()()()()().即答案为2.点睛:本题考查了方差的计算,解题的关键是方差的计算公式的识记.它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.17.1【解析】分析:先利用平均数公式求出平均数再利用方差公式即可得结果详解:的平均数为的方差为故答案为点睛:本题考查主要考查平均数公式与方差公式属于基础题样本数据的算术平均数公式;样本方差公式标准差解析:1 【解析】分析:先利用平均数公式求出平均数,再利用方差公式即可得结果. 详解:5.7,5.8,6.1,6.4,6.5的平均数为5.7+5.8+6.1+6.4+6.56.15=,5.7,5.8,6.1,6.4,6.5∴的方差为()()()()()222225.76.1+5.8 6.1+6.1 6.1+6.4 6.1+6.5 6.10.15-----=,故答案为0.1.点睛:本题考查主要考查平均数公式与方差公式,属于基础题. 样本数据的算术平均数公式12n 1(x +x +...+x )x n =;样本方差公式2222121[()()...()]n s x x x x x x n =-+-++-,标准差s =18.【解析】分析:根据回归系数几何意义得详解:因为Y 与X 之间正增长所以因为V 与U 之间负增长所以因此点睛:函数关系是一种确定的关系相关关系是一种非确定的关系事实上函数关系是两个非随机变量的关系而相关关系是解析:12b b >. 【解析】分析:根据回归系数几何意义得120b b >> 详解:因为Y 与X 之间正增长,所以10b > 因为V 与U 之间负增长,所以20b < 因此120b b >>,点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .b 的正负,决定正相关与负相关.19.280【解析】由频率分布直方图得这名大学生中每周的自习时间不少于小时的频率为这名大学生中每周的自习时间不少于小时的人数为故答案为解析:280 【解析】由频率分布直方图得这400名大学生中每周的自习时间不少于22.5小时的频率为()0.16+0.080.04 2.50.7,+⨯=∴这400名大学生中每周的自习时间不少于22.5小时的人数为4000.7280⨯=,故答案为280.20.2【解析】由茎叶图及10个班级的得分的平均数是90可得∴当且仅当即时取等号故答案为2解析:2 【解析】由茎叶图及10个班级的得分的平均数是90可得8a b += ∴1911919191()()(19)(10)(1023)28888b a b a a b a b a b a b a b +=⨯++=+++=++≥+⨯=,当且仅当9b aa b=,即36b a ==时,取等号 故答案为2三、解答题21.(1)0.5 2.3y x =+;(2)6800元. 【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程; (2)将9x =代入即可预测. 【详解】解:(1)由表可得:123456747++++++==x ,2.93.3 3.64.4 4.85.2 5.9 4.37y ++++++==,又77211134.4,140i ii i i x yx ====∑∑,71722217134.474 4.30.5140747i ii i i x y x yb x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元. 【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题. 22.(1)ˆ465yx =-;拟合效果较好;(2)至少需要规划409个停车位 【分析】(1)由已知数据求得ˆb与ˆa 的值,则线性回归方程可求,再求出残差平方和,代入相关指数公式求得2R ,根据与1的接近程度分析拟合效果;(2)在(1)中求得的线性回归方程中,取9x =求得y 值即可. 【详解】 解:(1)1(123456) 3.56x =+++++=,19361566y =⨯=.6162221640816 3.5156ˆ46916356i ii ii x yxy bxx ==--⨯⨯===-⨯-∑∑,ˆˆ15646 3.55ay bx =-=-⨯=-. y ∴关于x 的线性回归方程为ˆ465y x =-.1x =时,ˆ41y=,2x =时,ˆ87y =,3x =时,ˆ133y =, 4x =时,ˆ179y=,5x =时,ˆ225y =,6x =时,ˆ271y =. 621()556ii i yy =-=∑.6221621()556110.9737586()ii i ii yy R yy ==-=-=-≈-∑∑, 相关指数2R 近似为0.97,接近1,说明拟合效果较好; (2)在(1)中求得的线性回归方程中,取9x =, 可得ˆ4695409y=⨯-=. 故若要求在2022年小区停车位数量仍可满足需要,则至少需要规划409个停车位. 【点睛】本题考查线性回归方程与相关指数的求法,考查运算求解能力,属于中档题. 23.(1)见解析;(2)见解析;(3) 22.3百万小时 【分析】(1)根据频率分布直方图求数据填入对应表格,再根据卡方公式求2K ,最后对照数据作判断,(2)先确定随机变量取法,再判断从M 城市中任选的2名用户中活跃用户数服从二项分布,从N 城市中任选的1名用户中活跃用户数服从两点分布,进而求得对应概率,列表得分布列,最后根据数学期望公式得期望,(3)先求均值,解得ˆa,再估计5x =对应函数值. 【详解】(1)由已知可得以下22⨯列联表:计算()2220060208040200K 9.5247.8791001001406021⨯⨯-⨯==≈>⨯⨯⨯ , 所以有99.5%的把握认为用户是否活跃与所在城市有关. (2)由统计数据可知,城市M 中活跃用户占35,城市N 中活跃用户占45, 设从M 城市中任选的2名用户中活跃用户数为X ,则3~2,5X B ⎛⎫ ⎪⎝⎭设从N 城市中任选的1名用户中活跃用户数为Y ,则Y 服从两点分布,其中()415P Y ==. 故0,1,2,3ξ=,()()()20221400055125P P X P Y C ξ⎛⎫===⋅==⋅=⎪⎝⎭; ()()()()()2012224321*********555125P P X P Y P X P Y C C ξ⎛⎫===⋅=+=⋅==⋅+⋅⋅⋅=⎪⎝⎭;()()()()()2122223431572112055555125P P X P Y P X P Y C C ξ⎛⎫===⋅=+=⋅==⋅⋅+⋅⋅=⎪⎝⎭;()()()222343632155125P P X P Y C ξ⎛⎫===⋅==⋅= ⎪⎝⎭. 故所求ξ的分布列为()428573601232125125125125E ξ=⨯+⨯+⨯+⨯=. (3)由已知可得 2.5x =,又12.3y =,可得12.34ˆ2.5a=⨯+,所以ˆ 2.3a =,所以4 2.3ˆy x =+. 以5x =代入可得ˆ22.3y=(百万小时), 即2019年第一季度该读书APP 用户使用时长约为22.3百万小时. 【点睛】本题考查频率分布直方图、回归直线方程以及分布列和数学期望,考查基本分析求解能力,属中档题.24.(Ⅰ)图象见解析,正相关;(Ⅱ)ˆ0.7 1.5yx =+,当15x =时细菌个数为12个. 【分析】(Ⅰ)根据数据描点即得散点图,看图即判断结果; (Ⅱ)利用公式代入数据计算即可. 【详解】解:(Ⅰ)图形如下,观察图像可知细菌个数和时间是正相关.(Ⅱ)由数据计算得,()11234535x =⨯++++=,()123445 3.65y =⨯++++=,1122334445561ni ii x y==⨯+⨯+⨯+⨯+⨯=∑,22222211234555n i i x ==++++=∑122216153 3.67ˆ0.7555310ni ii ni i x y nx yxbx n ==-⨯⨯====-⨯--∑∑,ˆˆ 3.60.73 1.5a y bx =-=-⨯=, 所以ˆ0.7 1.5yx =+, 当0.7 1.512x +=时,解得15x =. 所以当15x =时细菌个数为12个. 【点睛】本题考查了散点图、线性回归方程及其应用,属于基础题.25.(1)中位数为71.4;平均数为71;(2)平均数为90;标准差为53)3700元.【分析】(1)利用频率分布直方图能求出中位数、平均分;(2)由题意,求出剩余8个分数的平均值,由10个分数的标准差,能求出剩余8个分数的标准差;(3)求出将3座教学楼完全包裹的球的最小直径、将一座教学楼完全包裹的球的最小直径和将1号教学楼与2号教学楼完全包裹的球的最小直径,由此能求出让各教学楼均被屏蔽仪信号完全覆盖的最小花费. 【详解】(1)因为0.050.150.250.450.5++=<0.050.150.250.350.80.5+++=> 所以中位数为x 满足7080x <<由80()0.350.10.10.510x -⨯++=,解得608071.47x =-≈ 设平均分为y ,则0.05450.15550.25650.35750.1850.19571y =⨯+⨯+⨯+⨯+⨯+⨯=(2)由题意,剩余8个分数的平均值为01010080908x x --==因为10个分数的标准差6s ==所以2222110...10(6)10(90)81360x x ++=⨯+⨯=所以剩余8个分数的标准差为0s ===(3)将3座教学楼完全包裹的球的最小直径为:210=<=因此若用一个覆盖半径为105米的屏蔽仪则总费用为4100元;70<= 因此若用3个覆盖半径为35米的屏蔽仪则总费用为4800元; 将1号教学楼与2号教学楼完全包裹的球的最小直径为:110=<=70>=因此若用1个覆盖半径为55米和1个覆盖半径为35米的屏蔽仪则总费用为3700元; 所以,让各教学楼均被屏蔽仪信号完全覆盖的最小花费为3700元. 【点睛】本题考查中位数、平均数、标准差、最小费用的求法,考查频率分布直方图的性质等基础知识,考查运算求解能力,是中档题.26.(1)分布列见解析,1;(2)0.10=P ,理由见解析. 【分析】(1)按照分层抽样计算“科学用眼”和“不科学用眼”的抽取人数,随机变量X 的取值可能为0,1,2,然后计算概率得出分布列及其数学期望; (2)按照公式计算2K 的值,然后由临界值表得出结果即可. 【详解】(1)“科学用眼”抽156245⨯=人,“不科学用眼”抽306445⨯=人,则随机变量X0=,1,2,∴343641(0)205====CP XC,122436123(1)205C CP XC====,21243641(2)205C CP XC====,分布列为:0120121555EX=⨯+⨯+⨯=;(2)22100(45153010)3.03075255545⨯-⨯=≈⨯⨯⨯K,由表可知2.706 3.030 3.840<<,∴0.10=P.【点睛】本题考查随机变量的分布列和数学期望,考查独立性检验,考查逻辑思维能力和计算能力,考查学生分析解决问题的能力,属于常考题.。
(精选试题附答案)高中数学第九章统计真题
(名师选题)(精选试题附答案)高中数学第九章统计真题单选题1、从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[66,70)、[70,74)、⋯、[94,98],并整理得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是()A.20B.40C.64D.80答案:D分析:利用频率分布直方图可计算出评分在区间[82,86)内的影视作品数量.由频率分布直方图可知,评分在区间[82,86)内的影视作品数量为400×0.05×4=80.故选:D.2、设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为()A.0.01B.0.1C.1D.10答案:C分析:根据新数据与原数据关系确定方差关系,即得结果.因为数据ax i+b,(i=1,2,⋯,n)的方差是数据x i,(i=1,2,⋯,n)的方差的a2倍,所以所求数据方差为102×0.01=1故选:C小提示:本题考查方差,考查基本分析求解能力,属基础题.3、为调查参加考试的高二级1200名学生的成绩情况,从中抽查了100名学生的成绩,就这个问题来说,下列说法正确的是()A.1200名学生是总体B.每个学生是个体C.样本容量是100D.抽取的100名学生是样本答案:C分析:根据总体、个体、样本容量、样本的定义,结合题意,即可判断和选择.根据题意,总体是1200名学生的成绩;个体是每个学生的成绩;样本容量是100,样本是抽取的100名学生的成绩;故正确的是C.故选:C.4、嫦娥五号的成功发射,实现了中国航天史上的五个“首次”,某中学为此举行了“讲好航天故事”演讲比赛.将报名的30位同学依次编号为01,02,…,30,利用下面的随机数表来决定他们的出场顺序,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,重复的跳过,则选出来的第7个个体的编号为()35 24 10 16 20 33 32 51 26 38 79 78 45 0438 23 16 86 38 42 38 97 01 50 87 75 66 81A.26B.01C.16D.04答案:B分析:由随机数表,按照规则选出.依次从数表中读出的有效编号为10,16,20,26,04,23,01,…故选出来的第7个个体的编号为01.故选:B.5、为了鼓励学生积极锻炼身体,强健体魄,某学校决定每学期对体育成绩在年级前100名的学生给予专项奖励.已知该校高三年级共有500名学生,如图是该年级学生本学期体育测试成绩的频率分布直方图.据此估计,能够获得该项奖励的高三学生的最低分数为()A.89B.88C.87D.86答案:B分析:根据题意确定出前100名的频率,进而判断出第100名的区间,然后根据频率求出答案.由题意,100500=0.2,[90,95)的频率为:0.02×5=0.1,[85,90)的频率为:0.05×5=0.25,则0.1<0.2<0.25,则第100名在[85,90)中,设分数为x,[x,90)的频率为:0.2−0.1=0.1,所以90−x5=0.2−0.10.25=0.10.25=25⇒x=88.故选:B.6、某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号,001,002, (699)700,从中抽取70个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第8个样本编号是()322118342978645407325242064438122343567735789056428442125331345786073625300732862345788907236896080432567808436789535577348994837522535578324577892345A.623B.368C.253D.072答案:B解析:从表中第5行第6列开始向右读取数据,每3个数为一个编号,不在编号范围内或重复的排除掉,第8个数据即为答案.从表中第5行第6列开始向右读取数据,依次得到253,313,457,860(舍),736(舍),253(舍),007,328,623,457(舍),889(舍),072,368由此可得出第8个样本编号是368故选:B7、要完成下列两项调查:(1)某社区有100户高收入家庭,210户中等收入家庭,90户低收入家庭,从中抽取100户调查有关消费购买力的某项指标;(2)从某中学高一年级的10名体育特长生中抽取3人调查学习情况;应采用的抽样方法分别是()A.(1)用简单随机抽样,(2)用分层随机抽样B.(1)(2)都用简单随机抽样C.(1)用分层随机抽样,(2)用简单随机抽样D.(1)(2)都用分层随机抽样答案:C分析:根据简单随机抽样、分层抽样的适用条件进行分析判断.因为有关消费购买力的某项指标受家庭收入的影响,而社区家庭收入差距明显,所以①用分层抽样;从10名体育特长生中抽取3人调查学习情况,个体之间差别不大,且总体和样本容量较小,所以②用简单随机抽样.故选:C8、甲、乙两名射击运动爱好者在相同条件下各射击10次,中靶环数情况如图所示.则甲、乙两人中靶环数的方差分别为()A.7,7B.7,1.2C.1.1,2.3D.1.2,5.4答案:D分析:求出平均数,利用方差公式即可求解. 实线的数字为:2,4,6,8,7,7,8,9,9,10,虚线的数字为:9,5,7,8,7,6,8,6,7,7,所以x乙=110(2+4+6+8+7+7+8+9+9+10)=7,x 甲=110(9+5+7+8+7+6+8+6+7+7)=7,S甲2=110[(9-7)2+(5-7)2+(7−7)2+(8−7)2+⋯+(7−7)2]=1.2S 乙2=110[(2-7)2+(4-7)2+(6−7)2+(8−7)2+⋯+(10−7)2]=5.4.故选:D9、每年的3月15日是“国际消费者权益日”,某地市场监管局在当天对某市场的20家肉制品店、100家粮食加工品店和15家乳制品店进行抽检,要用分层抽样的方法从中抽检27家,则粮食加工品店需要被抽检()A.20家B.10家C.15家D.25家答案:A分析:确定抽样比,即可得到结果.解:根据分层抽样原理知,粮食加工品店需要被抽检27×10020+100+15=20(家).故选:A.10、“二万五千里长征”是1934年10月到1936年10月中国工农红军进行的一次战略转移,是人类历史上的伟大奇迹,向世界展示了中国工农红军的坚强意志,在期间发生了许多可歌可泣的英雄故事.在中国共产党建党100周年之际,某中学组织了“长征英雄事迹我来讲”活动,已知该中学共有高中生2700名,用分层抽样的方法从该校高中学生中抽取一个容量为45的样本参加活动,其中高三年级抽取了14人,高二年级抽取了15人,则该校高一年级学生人数为()A.720B.960C.1020D.1680答案:B解析:根据分层抽样中样本容量比与总体容量比相等可得.由题意高一抽取的学生为45−14−15=16.设高一学生数为n,则n2700=1645,解得n=960.故选:B.填空题11、设某组数据均落在区间[10,60]内,共分为[10,20),[20,30),[30,40),[40,50),[50,60]五组,对应频率分别为p1,p2,p3,p4,p5.已知依据该组数据所绘制的频率分布直方图为轴对称图形,给出下列四个条件:①p1=0.1,p3=0.4;②p2=2p5;③p1+p4=p2+p5=0.3;④p1⩽2p2⩽4p3⩽2p4⩽p5.其中能确定该组数据频率分布的条件有__________.答案:①④分析:由已知对称性加下四个条件中的一个能求出p1,p2,p3,p4,p5,即符合题意.已知p 1=p 5,p 2=p 4,p 1+p 2+p 3+p 4+p 5=1, 若①p 1=0.1,p 3=0.4,则p 2=0.2,p 4=0.2,p 5=0.1; 若②p 2=2p 5,则p 3+6p 1=1,不能得出p 1,p 3;若③p 1+p 4=p 2+p 5=0.3,则可得p 3=0.4,但p 1,p 2,p 4,p 5的解不确定, 若p 1⩽2p 2⩽4p 3⩽2p 4⩽p 5.则p 1=2p 2=4p 3=2p 4=p 5,可得p 3=113,p 1=p 5=413,p 2=p 4=213,所以答案是:①④.小提示:本题考查频率分布直方图的性质,本题实质就是由频率分布直方图得出p 1=p 5,p 2=p 4,p 1+p 2+p 3+p 4+p 5=1,然后判断再加哪个条件能求得各频率即可,通过解方程组可得.12、中小学生的视力状况受到社会的关注.某市有关部门从全市6万名高一学生中随机抽取400名学生,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图所示,从左至右五个小组的频率之比为5:7:12:10:6,则抽取的这400名高一学生中视力在[3.95,4.25)范围内的学生有______人.答案:50分析:利用频率分布直方图的性质求解即可. 第五组的频率为0.5×(5.45−5.15)=0.15, 第一组所占的频率为0.15×56=0.125,则随机抽取400名学生视力在[3.95,4.25)范围内的学生约有400×0.125=50人. 所以答案是:50.13、抗击疫情期间,小志参与了社区志愿者工作.现在要对服务时长排名前20%的志愿者进行表彰.该社区的志愿者服务时长(单位:小时)如下:186 .0 102.0 22.0 64.0 36.0 68.0 106.0 126.0 110.0 210.0124 .0 226.0 154.0 230.0 58.0 162.0 70.0 162.0 166.0 16.0根据以上数据,该社区志愿者服务时长的第80百分位数是___________.(精确到0.1)答案:176.0分析:20×8000⁄=16,根据百分位数的计算方法可知,把服务时长从小到大排列,计算第16和第17个数的平均数作为第80百分位数.20×8000⁄=16,则把服务时长从小到大排列,选择第16个和第17个数的平均数作为社区志愿者服务时长的=176.0,第80百分位数,即166.0+186.02所以答案是:176.014、某市某次高中数学统测学生测试成绩频率分布直方图如图所示.现按测试成绩由高到低分成A,B,C,D四个等级,其中A等占25%,B等占40%,C等占30%,D等占5%的比例,规定达到C等级及以上才能通过考试,则要通过本次考试的学生分数至少为___________.答案:24分析:根据频率分布直方图可得答案.由图可知,分数在20分以下的比例为0.001×20=0.02,在40分以下的比例为(0.001+0 .0075)×20=0.17,=24,所以通过本次考试分数至少为24.因此5%分位数位于[20,40)内,由20+20×0.05−0.020.15所以答案是:24.15、为了解中学生课外阅读情况,现从某中学随机抽取200名学生,收集了他们一年内的课外阅读量(单位:本)等数据,以下是根据数据绘制的统计图表的一部分.下面有四个推断:①这200名学生阅读量的平均数可能是26本;②这200名学生阅读量的75%分位数在区间[30,40)内;③这200名学生的初中生阅读量的中位数一定在区间[20,30)内;④这200名学生中的初中生阅读量的25%分位数可能在区间[20,30)内.所有合理推断的序号是__________.答案:②③④分析:根据平均数的运算判断①,由百分位数的定义计算可判断②④,根据中位数的定义运算可判断③ .×[24.5×(7+31+25+30+4)+25 .5×(8+29+26+在①中,这200名学生阅读量的平均数为: x̅=120032+8)]=25.015,所以这200名学生阅读量的平均数不可能是26本,故①错误;在②中,200×75%=150,阅读量在[0,30)的人数有7+8+31+29+25+26=126人,在[30,40)的人数有62人,所以这200名学生阅读量的75%分位数在区间[30,40)内,故②正确;在③中,设在区间[0,10)内的初中生人数为x,则x∈[0,15],x∈N*,=58,当x=0时,初中生总人数为25+36+44+11=116人,1162此时区间[0,20)内有25人,区间[20,30)内有36人,所以中位数在[20,30)内,=65.5,当x=15时,初中生总人数为15+25+36+44+11=131人,1312区间[0,20)内有15+25=40人,区间[20,30)内有36人,所以中位数在[20,30)内,所以当区间[0,10)内人数取最小值和最大值时,中位数都在[20,30)内,所在这200名学生的初中生阅读量的中位数一定在区间[20,30)内,故③正确;在④中,设在区间[0,10)内的初中生人数为x,则x∈[0,15],x∈N*,当x=0时,初中生总人数为116人,116×25%=29,此时区间[0,20)有25人,区间[20,30)有36人,所以25%分位数在[20,30)内,当x=15时,初中生总人数为131人,131×25%=32.75,区间[0,20)有15+25=40人,所以25%分位数在[0,20)内,所以这200名学生中的初中生阅读量的25%分位数可能在区间[20,30)内,故④正确.所以答案是:②③④解答题16、某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分与中位数(结果保留2位小数);(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如表所示,求数学成绩在[60,70)之间的人数.答案:(1)0.005(2)平均分73;中位数71.67(3)20分析:(1)利用频率分布直方图中各小矩形面积之和等于1,即可得出答案.(2)根据频率分布直方图中平均数及中位数的意义即可得出平均分及中位数;(3)由这100名学生的语文成绩在[60,70)之间的人数与数学成绩相应分数段的人数之比,即可得到数学成绩在[60,70)之间的人数.(1)由频率分布直方图可得:10×(2a+0.02+0.03+0.04)=1,解得a=0.005(2)由频率分布直方图可得平均分为:(55×0.005+65×0.04+75×0.03+85×0.02+95×0.005)×10=73(分)∵[50,70)的频率为(0.005+0.04)×10=0.45,[70,80)的频率为0.03×10=0.3∵中位数为:70+0.5-0.450.3×10=2153≈71.67(3)数学成绩在[60,70)的人数为100×0.04×10×12=20(人)17、某机械厂三个车间共有工人1000名,各车间男、女工人数如下表:已知在全厂工人中随机抽取1名,抽到第二车间男工的可能性是0.13,其中第三车间的男女比例为3:2.(1)求x,y,z的值.(2)现用分层抽样的方法在全厂男工人中抽取55名工人进行技术比武,则在第三车间抽取多少名男工人?答案:(1)x=130,y=160,z=240;(2)24名.分析:(1)根据题意可得x1000=0.13,可求出x,再由第三车间的工人数是1000−350−250=400,以及男女比例即可求解.(2)根据分层抽样比即可求解.解:(1)由x1000=0.13,得x=130.因为第一车间的工人数是170+180=350,第二车间的工人数是120+130=250,所以第三车间的工人数是1000−350−250=400.所以y=400×25=160,z=400×35=240.(2)设应从第三车间抽取m名工人,共有男工人180+130+240=550,则由m240=55550,得m=24,所以应在第三车间抽取24名男工人.18、2019年下半年以来,各地区陆续出台了“垃圾分类”的相关管理条例,实行“垃圾分类”能最大限度地减少垃圾处置量,实现垃圾资源利用,改善垃圾资源环境,某部门在某小区年龄处于[20,45]岁的人中随机地抽取x人,进行了“垃圾分类”相关知识掌握和实施情况的调查,并把达到“垃圾分类”标准的人称为“环保族”,得到如图示各年龄段人数的频率分布直方图和表中的统计数据.(1)求x、y、z的值;(2)根据频率分布直方图,估计这x人年龄的平均值(同一组数据用该区间的中点值代替,结果按四舍五入保留整数);(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,并在这9人中选取2人作为记录员,求选取的2名记录员中至少有一人年龄在[30,35]中的概率.答案:(1){x=200y=0.625z=6;(2)30.75;(3)1318.分析:(1)由频率分布直方图和频数分布表能求出x、y、z;(2)根据频率分布直方图,能估计这x人年龄的平均值;(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,[25,30)中选5人,分别记为A、B、C、D、E,[30,35]中选4人,分别记为a、b、c、d,在这9人中选取2人作为记录员,利用列举法列举出所有的基本事件,然后利用古典概型的概率公式可求得所求事件的概率.(1)由题意得:{x=450.750.06×5=200y=25200×0.04×5=0.625z=200×0.03×5×0.2=6;(2)根据频率分布直方图,估计这x人年龄的平均值为:x=22.5×0.3+27.5×0.2+32 .5×0.2+37.5×0.15+42.5×0.15=30.75;(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,从[25,30)中选:9×2525+20=5人,分别记为A、B、C、D、E,从[30,35]中选:9×2025+20=4人,分别记为a、b、c、d,在这9人中选取2人作为记录员,所有的基本事件有:(A,B)、(A,C)、(A,D)、(A,E)、(A,a)、(A,b)、(A,c)、(A,d)、(B,C)、(B,D)、(B,E)、(B,a)、(B,b)、(B,c)、(B,d)、(C,D)、(C,E)、(C,a)、(C,b)、(C,c)、(C,d)、(D,E)、(D,a)、(D,b)、(D,c)、(D,d)、(E,a)、(E,b)、(E,c)、(E,d)、(a,b)、(a,c)、(a,d)、(b,c)、(b,d)、(c,d),共36种,选取的2名记录员中至少有一人年龄在[30,35]包含的基本事件有:(A,a)、(A,b)、(A,c)、(A,d)、(B,a)、(B,b)、(B,c)、(B,d)、(C,a)、(C,b)、(C,c)、(C,d)、(D,a)、(D,b)、(D,c)、(D,d)、(E,a)、(E,b)、(E,c)、(E,d)、(a,b)、(a,c)、(a,d)、(b,c)、(b,d)、(c,d),共26种,因此,选取的2名记录员中至少有一人年龄在[30,35]中的概率P=2636=1318.小提示:本题考查频率、平均数、概率的求法,考查频数分布表、频率分布直方图、分层抽样、古典概型的性质等基础知识,考查数据分析能力、运算求解能力,是基础题.19、2020年“双十一”购物节之后,某网站对购物超过1000元的20000名购物者进行年龄调查,得到如下统计表:(1)从这20000名购物者中随机抽取1人,求该购物者的年龄不低于50岁的概率;(2)从年龄在[50,70]的购物者中用分层抽样的方法抽取7人进一步做调查问卷,再从这7人中随机抽取2人中奖,求中奖的2人中年龄在[50,60),[60,70]内各有一人的概率.答案:(1)0.35;(2)47.解析:(1)根据参与调查的总人数确定a的值,进而求得购物者的年龄不低于50岁的概率;(2)年龄在[50,70]的购物者中用分层抽样的方法抽取7人,则年龄在[60,70]的应抽取4人,年龄在[50,60)的应抽取3人,利用古典概型,确定中奖的2人中年龄在[50,60),[60,70]内各有一人的概率.(1)因为参与调查的总人数为20000人,由表中数据可得5500+4500+3a+3000+4a=20000,解得a=1000,所以从这20000名购物者中随机抽取1人,该购物者的年龄不低于50岁的概率为P1=3000+4a20000=700020000=0.35.(2)由(1)知,这20000名购物者中,年龄在[50,60)的有3000人,年龄在[60,70]的有4000人,从年龄在[50,70]的购物者中用分层抽样的方法抽取7人,则年龄在[60,70]的应抽取4人,用A1,A2,A3,A4表示,年龄在[50,60)的应抽取3人,用B1,B2,B3表示.在这7人中随机取出2人中奖的所有可能情况有:A1A2,A1A3,A1A4,A1B1,A1B2,A1B3,A2A3,A2A4,A2B1,A2B2,A2B3,A3A4,A3B1,A3B2,A3B3,A4B1,A4B2,A4B3,B1B2,B1B3,B2B3,共21种情况,其中中奖的2人中在[50,60),[60,70]内各有一人有:A1B1,A1B2,A1B3,A2B1,A2B2,A2B3,A3B1,A3B2,A3B3,A4B1,A4B2,A4B3,共12种情况,所以所求的概率为P2=1221=47.小提示:有关古典概型的概率问题,关键是正确求出基本事件总数和所求事件包含的基本事件数.(1)基本事件总数较少时,用列举法把所有基本事件一一列出时,要做到不重复、不遗漏,可借助“树状图”列举.(2)注意区分排列与组合,以及计数原理的正确使用.。
高二数学统计试题答案及解析
高二数学统计试题答案及解析1.某考察团对全国10大城市进行职工人均工资水平(千元)与居民人均消费水平(千元)统计调查,与具有相关关系,回归方程为,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为()A.83%B.72%C.67%D.66%【答案】A【解析】将y=7.675代入回归方程,可计算得x≈9.26,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.26≈0.83,即约为83%.【考点】回归方程2.回归分析中,相关指数的值越大,说明残差平方和A.越小B.越大C.可能大也可能小D.以上都不对【答案】A【解析】相关系数越大,则相关性越强。
即数据的残差平方和越小。
【考点】线性相关关系的判断。
3.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是()A.12,24,15,9B.9,12,12,7C.8,15,12,5D.8,16,10,6【答案】D【解析】由题意,得抽样比为,所以高级职称抽取的人数为,中级职称抽取的人数为,初级职称抽取的人数为,其余人员抽取的人数为,所以各层中依次抽取的人数分别是8人,16人,10人,6人,故选D.【考点】分层抽样.【方法点睛】分层抽样满足“”,即“或”,据此在已知每层间的个体数量或数量比,样本容量,总体数量中的两个时,就可以求出第三个.4.从某校高三年级随机抽取一个班,对该班名学生的高校招生体检表中的视力情况进行统计,其频率分布直方图如图所示:若某高校专业对视力的要求在以上,则该班学生中能报A专业的人数为________【答案】20【解析】根据频率分布直方图,得视力在0.9以上的频率为(1.00+0.75+0.25)×0.2=0.4,∴该班学生中能报A专业的人数为50×0.4=20.【考点】频率分布直方图.5.设某大学的女生体重(单位:)与身高(单位:)具有线性相关关系,根据一组样本数据(),用最小二乘法建立的回归方程为,则下列结论中不正确的是()A.与具有正的线性相关关系B.回归直线过样本点的中心C.若该大学某女生身高增加,则其体重约增加D.若该大学某女生身高为,则可断定其体重必为【答案】D【解析】 A正确;回归直线过样本点中心,故B正确;某女生身高增加,则其体重约增加,故D正确;C中体重为预测值,故C错误。
高中数学统计练习题
高中数学统计练习题一、选择题1. 某班级有50名学生,随机抽取5名学生进行数学成绩调查,这种抽样方法属于:A. 简单随机抽样B. 分层抽样C. 系统抽样D. 分群抽样2. 下列哪个选项不是描述统计量?A. 平均数B. 中位数C. 众数D. 方差3. 一组数据的方差是20,如果每个数据都增加10,新的方差是:A. 20B. 30C. 40D. 50二、填空题4. 在一组数据中,如果所有数据都乘以一个常数k,则新的方差是原来的________倍。
5. 某班有30名学生,数学成绩的平均分为80分,标准差为10分。
假设成绩分布接近正态分布,那么成绩在70分到90分之间的学生大约有________人。
三、简答题6. 解释什么是标准差,并说明它在统计学中的作用。
7. 什么是正态分布?请简述其特点。
四、计算题8. 某工厂生产一批零件,测量了10个零件的直径,数据如下(单位:毫米):20.1, 20.2, 20.3, 20.1, 20.4, 20.2, 20.3, 20.2, 20.1, 20.5请计算这组数据的平均数、中位数、众数和标准差。
9. 某学校对100名学生进行了身高测量,得到平均身高为170厘米,标准差为8厘米。
如果将所有数据向上平移10厘米,新的平均身高和标准差是多少?五、应用题10. 某公司对员工的月收入进行调查,得到以下数据(单位:千元): 4, 5, 6, 7, 8, 9, 10, 11, 12, 13请计算这组数据的平均数、中位数、众数,并画出频率分布直方图。
11. 假设某地区有1000名学生参加高考,其中数学成绩的平均分为60分,标准差为15分。
如果一个学生的成绩是75分,请问这个成绩在所有学生中的百分位数是多少?六、论述题12. 论述统计学在现实生活中的应用,并给出至少两个具体的例子。
通过这些练习题,学生可以加深对高中数学统计部分的理解,包括抽样方法、统计量、正态分布等概念,并通过实际计算和应用题来提高解决实际问题的能力。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章统计一、选择题1.某校有40个班,每班有50人,每班选派3人参加“学代会”,在这个问题中样本容量是().A.40 B.50 C.120 D.1502.要从已编号(1-50)的50枚最新研制的某型号导弹中随机抽取5枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5枚导弹的编号可能是().A.5,10,15,20,25 B.3,13,23,33,43C.1,2,3,4,5 D.2,4,8,16,323.某单位有老年人27人,中年人54人,青年人81人,为了调查他们身体状况的某项指标,需从他们中抽取一个容量为36的样本,适合抽取样本的方法是().A.抽签法B.系统抽样C.随机数表法D.分层抽样4.为了解某年级女生的身高情况,从中抽出20名进行测量,结果如下:(单位:cm) 149159142160156163145 150148151156144148149 153143168168152155在列样本频率分布表的过程中,如果设组距为4 cm,那么组数为().A.4 B.5 C.6 D.75.右图是由容量为100的样本得到的频率分布直方图.其中前4组的频率成等比数列,后6组的频数成等差数列,设最大频率为a,在4.6到5.0之间的数据个数为b,则a,b的值分别为().A.0.27,78 B.0.27,83 C.2.7,784 D.2.7,836.在方差计算公式s 2=101[(x 1-20)2+(x 2-20)2+…+(x 10-20)2]中,数字10和20分别表示( ).A .数据的个数和方差B .平均数和数据的个数C .数据的个数和平均数D .数据组的方差和平均数7.某地2004年第一季度应聘和招聘人数排行榜前5个行业的情况列表如下:若用同一行业中应聘人数与招聘人数比值的大小来衡量该行业的就业情况,则根据表中的数据,就业形势一定是( ).A .计算机行业好于化工行业B .建筑行业好于物流行业C .机械行业最紧张D .营销行业比贸易行业紧张8.从鱼塘捕得同一时间放养的草鱼240尾,从中任选9尾,称得每尾鱼的质量分别是1.5,1.6,1.4,1.6,1.3,1.4,1.2,1.7,1. 8(单位:千克).依此估计这240尾鱼的总质量大约是( ).A .300克B .360千克C .36千克D .30千克9.为了考查两个变量x 和y 之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1,l 2,已知两人得的试验数据中,变量x 和y 的数据的平均值都分别相等,且值分别为s 与t ,那么下列说法正确的是( ).A .直线l 1和l 2一定有公共点(s ,t )B .直线l 1和l 2相交,但交点不一定是(s ,t )C .必有直线l 1∥l 2D .直线l 1和l 2必定重合10.工人工资(元)依相应产值(千元)变化的回归方程为yˆ=50+80x ,下列判断正确的是( ).A .产值为1 000元时,工资为130元B .产值提高1 000元时,工资提高80元C.产值提高1 000元时,工资提高130元D.当工资为250元时,产值为2 000元二、填空题:11.某工厂生产A,B,C三种不同型号的产品,产品数量之比依次为2∶3∶5.现用分层抽样方法抽出一个容量为n的样本,样本中A种型号的产品有16件,那么此样本的容量n=___________.12.若总体中含有1 650个个体,现在要采用系统抽样,从中抽取一个容量为35的样本,分段时应从总体中随机剔除________个个体,编号后应均分为_________段,每段有______个个体.13.管理人员从一池塘内捞出30条鱼,做上标记后放回池塘.10天后,又从池塘内捞出50条鱼,其中有标记的有2条.根据以上数据可以估计该池塘内共有_______条鱼.14.已知x,y之间的一组数据:y与x之间的线性回归方程yˆ=bx+a必过定点_________.15.假设学生在初一和初二数学成绩是线性相关的.若10个学生初一数学分数(x)和初二数学分数(y)如下:初一和初二数学分数间的回归方程为___________.16.一家保险公司调查其总公司营业部的加班程度,收集了10周中每周加班工作时间y(小时)与签发新保单数目x的数据如下表,则用最小二乘法估计求出的线性回归方程是___________.三、解答题:17.某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?18.某单位有118名员工,为了完成本月的生产任务,现要从中随机抽取16人加班.请用系统抽样法选出加班的人员.19.写出下列各题的抽样过程:(1)请从拥有500个分数的总体中用简单随机抽样方法抽取一个容量为30的样本.(2)某车间有189名职工,现在要按1∶21的比例选派质量检查员,采用系统抽样的方法进行.(3)一个电视台在因特网上就观众对某一节目喜爱的程度进行调查,被调查的总人数为12 000人,其中持各种态度的人数如下:很喜爱喜爱一般不喜爱2 435 4 5673 926 1 072打算从中抽取60人进行详细调查,如何抽取?20.有一种鱼的身体吸收水银,水银的含量超过1.00 ppm(即百万分之一)时就会对人体产生危害.在30条鱼的样本中发现的水银含量是:0.07 0.24 0.95 0.98 1.02 0.98 1.37 1.40 0.39 1.021.44 1.58 0.54 1.08 0.61 0.72 1.20 1.14 1.62 1.681.85 1.20 0.81 0.82 0.84 1.29 1.262.10 0.91 1.31(1)用前两位数作为茎,做出样本数据的茎叶图;(2)描述一下水银含量的分布特点;(3)从实际情况看,许多鱼的水银含量超标在于有些鱼在出售之前没有被检查过.那么,这种鱼的水银含量的平均水平都比1.00 ppm大吗?(4)求出上述样本数据的均值和标准差;(5)有多少条鱼的水银含量在均值减加两倍标准差的范围内?第二章统计参考答案一、选择题 1.C解析:样本容量等于40×3=120. 2.B解析:根据系统抽样的规则,1到10一段,11到20一段,如此类推,每段10个号码,那么每一段上都应该有号码.3.D解析:总体是由差异明显的几部分组成的. 4.D解析:由于组距为4 cm ,故可分组为142~146,146~150,150~154,154~158,158~162,162~166,166~170.5.A解析:由题意共有100个人.前4组频率成等比数列,由图知:第一组频率为0.01;第二组频率为0.03;所以a =0.27.前3组有100×(0.01+0.03+0.09)=13人,后6组共87人,6组人数成等差数列,所以首项为27,s 6=87,得d =-5,s 4=78,即b =78.6.C解析:对照公式s 2=∑=ni i x -x n121)(即可知道.7.B解析:从表中可以看出,计算机行业应聘人数与招聘人数都比较多,但录用率约占58%.化工行业招聘名额70 436虽少,但应聘它的人数少于应聘贸易行业的人数(65 280),录用率大于58%,故A 不正确.对于建筑行业,应聘人数少于招聘人数,显然好于物流行业.机械行业录用率约46%,但物流、贸易招聘人数未知,无法比较得出机械行业最紧张.营销行业招聘人数与应聘人数的比约为1∶1.5,但贸易行业招聘数不详,无法比较.8.B解析:从草鱼240尾,中任选9尾,这9尾鱼具有代表性,由此可由样本估计总体的情况.9尾鱼中每尾鱼的平均质量为x =91(1.5+1.6+1.4+1.6+1.3+1.4+1.2+1.7+1.8)=1.5(千克),240×1.5=360(千克). 9.A解析:线性回归直线方程为yˆ=a +bx ,而a =x b y -,即a =t -bs ,t =a +bs . ∴(s ,t )在回归直线上,即直线l 1和l 2必有公共点(s ,t ). 10.B解析:回归直线斜率为80,所以x 每增加1,yˆ增加80,即劳动生产率提高1千元时,工资提高80元.二、填空题: 11.答案:80. 解析:n =216×(2+3+5)=80. 12.答案:5;35;47. 解析:1 650除以35商 47余5, ∴ 剔除5个个体.分为35段,每段47个个体. 13.答案:750. 解析:30×250=750 (条). 14.答案:(1.167 5,2.392 5). 解析:必过四组数据的平均数, 即(1.167 5,2.392 5).15.答案:yˆ=1.218x -14.191. 解析:代入求a ,b 值的公式,解得 y ˆ=1.218x -14.191. 16.答案:y ˆ=0.118 1+0.003 585x . 解析:∑∑===-==10121018602971)(762101i ii ix x ,xx ,6534))((85.2101=--=∑=i iiy y x x ,y .三、解答题:17.[解析] 简单随机抽样一般采用两种方法:抽签法和随机数表法.解法1:(抽签法)将100件轴编号为1,2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这10个号签对应的轴的直径.解法2:(随机数表法)将100件轴编号为00,01,…,99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个随机数为68,34,30,13,70,55,74,77,40,44,这10个号即所要抽取的样本号.18.解析:(1)对这118名员工进行编号; (2)计算间隔k =16118=7.375, 由于k 不是一个整数,我们从总体中随机剔除6个样本,再来进行系统抽样.例如我们随机剔除了3,46,59,57,112,93这6名员工,然后再对剩余的112位员工进行编号,计算间隔k =7;(3)在1~7之间随机选取一个数字,例如选5,将5加上间隔7得到第2个个体编号12,再加7得到第3个个体编号19,依次进行下去,直到获取整个样本.19.解析:(1)①将总体的500个分数从001开始编号,一直到500号; ②从随机数表第1页第1行第2至第4列的347号开始使用该表; ③抄录入样号码如下:347 437 386 469 011 410 145 073 245 276 329 050 176 099 061 030 227 482 378 096 164 001 068 047 025 212 016 105 443 212 ④按以上编号从总体中将相应的分数提取出来组成样本,抽样完毕. (2)采取系统抽样.189÷21=9,所以将189人分成9组,每组21人,在每一组中随机抽取1人,这9人组成样本.(3)采取分层抽样.总人数为12 000人,12 000÷60=200, 2004352=12…35(人),2005674=22…167(人), 2009263=19…126(人),2000721=5…72(人). 所以从很喜爱的人中剔除35人,再抽取12人;从喜爱的人中剔除167人,再抽取22人;从一般喜爱的人中剔除126人,再抽取19人;从不喜爱的人中剔除72人,再抽取5人.20.解析:(1)茎叶图为:(2)汞含量分布偏向于大于1.00 ppm的方向,即多数鱼的汞含量分布在大于1.00 ppm的区域.(3)不一定.因为我们不知道各批鱼的汞含量分布是否都和这批鱼相同.即使各批鱼的汞含量分布相同,上面的数据只能为这个分布作出估计,不能保证平均汞含量大于1.00 ppm.(4)样本平均数x≈1.08,样本标准差s≈0.45.(5)有28条鱼的汞含量在平均数与两倍标准差的和(差)的范围内.。