最新统计案例高考试题(部分)-精选版
(精选试题附答案)高中数学第九章统计经典大题例题
(名师选题)(精选试题附答案)高中数学第九章统计经典大题例题单选题1、某中学高一年级有400人,高二年级有320人,高三年级有280人,若每人被抽到的可能性都为0.2,用随机数表法在该中学抽取容量为n的样本,则n等于()A.80B.160C.200D.280答案:C分析:每个个体被抽的可能性等于样本容量除以总体数,由此列出关于n的方程并求解出结果.=0.2,解得n=200,由题意可知:n400+320+280故选:C.2、某校为了解学生的课外锻炼身体的情况,随机抽取了部分学生,对他们一周的课外锻炼时间进行了统计,统计数据如下表所示:则该校学生一周进行课外锻炼的时间的第40百分位数是()A.8.5B.8C.7D.9答案:A分析:根据百分位数的求法计算即可.抽取的学生人数为6+10+9+8+7=40.由40%×40=16,故第40百分位数为所有数据从小到大排序的第16项与第17项数据的平均数,=8.5.即8+92故选: A.3、下列调查方式较为合适的是()A.为了了解灯管的使用寿命,采用普查的方式B.为了了解我市中学生的视力状况,采用抽样调查的方式C.调查一万张面值为100元的人民币中有无假币,采用抽样调查的方式D.调查当今中学生喜欢什么体育活动,采用普查的方式答案:B分析:根据实际情况选择合适的调查方式即可判断.对A,为了了解灯管的使用寿命,应采用抽样调查的方式,故A错误;对B,为了了解我市中学生的视力状况,采用抽样调查的方式,故B正确;对C,调查一万张面值为100元的人民币中有无假币,采用抽样普查的方式,故C错误;对D,调查当今中学生喜欢什么体育活动,采用抽样普查的方式,故D错误.故选:B.4、2021年3月,树人中学组织三个年级的学生进行“庆祝中国共产党成立100周年”党史知识竞赛.经统计,得到前200名学生分布的饼状图(如图)和前200名中高一学生排名分布的频率条形图(如图),则下列命题错.误.的是()A.成绩前200名的200人中,高一人数比高二人数多30人B.成绩第1-100名的100人中,高一人数不超过一半C.成绩第1-50名的50人中,高三最多有32人D.成绩第51-100名的50人中,高二人数比高一的多答案:D分析:根据饼状图和条形图提供的数据判断.由饼状图,成绩前200名的200人中,高一人数比高二人数多200×(45%−30%)=30,A正确;=45<50,B 由条形图知高一学生在前200名中,前100和后100人数相等,因此高一人数为200×45%×12正确;成绩第1-50名的50人中,高一人数为200×45%×0.2=18,因此高三最多有32人,C正确;第51-100名的50人中,高二人数不确定,无法比较,D错误.故选:D.5、某射击运动员6次的训练成绩分别为:88,91,89,88,86,85,则这6次成绩的第70百分位数为()A.89B.89.5C.90D.90.5答案:A分析:先将数据按从小到大的顺序排列,计算6×70%=4.2不是整数,则所求的是从小到大排列的第5位数6次考试数学成绩从小到大为:85,86,88,88,89,91,6×70%=4.2,∴这名学生6次训练成绩的第70百分位数为89 .故选:A6、某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率直方图如图所示,估计棉花纤维的长度的样本数据的80百分位数是()A.29 mmB.29.5 mmC.30 mmD.30.5 mm答案:A分析:先求得棉花纤维的长度在30 mm以下的比例为85%,在25 mm以下的比例为85%-25%=60%,从而可得80百分位数一定位于[25,30)内,进而可求出答案棉花纤维的长度在30 mm以下的比例为(0.01+0.01+0.04+0.06+0.05)×5=0.85=85%,在25 mm以下的比例为85%-25%=60%,因此,80百分位数一定位于[25,30)内,=29,由25+5×0.80−0.600.85−0.60可以估计棉花纤维的长度的样本数据的80百分位数是29 mm.故选:A7、根据气象学上的标准,连续5天的日平均气温低于10℃即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①、②、③、④,依次计算得到结果如下:①平均数x̅<4;②平均数x̅<4且极差小于或等于3;③平均数x̅<4且标准差s≤4;④众数等于5且极差小于或等于4.则4组样本中一定符合入冬指标的共有()A .1组B .2组C .3组D .4组答案:B分析:举反例否定①;反证法证明②符合要求;举反例否定③;直接法证明④符合要求.①举反例:0,0,0,4,11,其平均数x̅=3<4.但不符合入冬指标;②假设有数据大于或等于10,由极差小于或等于3可知,则此组数据中的最小值为10−3=7,此时数据的平均数必然大于7,与x̅<4矛盾,故假设错误.则此组数据全部小于10. 符合入冬指标;③举反例:1,1,1,1,11,平均数x̅=3<4,且标准差s =4.但不符合入冬指标;④在众数等于5且极差小于等于4时,则最大数不超过9.符合入冬指标.故选:B .8、关于圆周率π,数学发展史上出现过许多很有创意的求法,如著名的浦丰实验和查理斯实验.受其启发,我们也可以通过设计下面的实验来估计π的值:先请全校m 名同学每人随机写下一个都小于1的正实数对(x,y );再统计两数能与1构成钝角三角形三边的数对(x,y )的个数a ;最后再根据统计数a 估计π的值,那么可以估计π的值约为( )A .4a mB .a+2mC .a+2m mD .4a+2m m答案:D解析:由试验结果知m 对0~1之间的均匀随机数x,y ,满足{0<x <10<y <1,面积为1,再计算构成钝角三角形三边的数对(x,y),满足条件的面积,由几何概型概率计算公式,得出所取的点在圆内的概率是圆的面积比正方形的面积,即可估计π的值.解:根据题意知,m 名同学取m 对都小于1的正实数对(x,y ),即{0<x <10<y <1, 对应区域为边长为1的正方形,其面积为1,若两个正实数x,y 能与1构成钝角三角形三边,则有{x 2+y 2<1x +y >10<x <10<y <1,其面积S =π4−12;则有a m =π4−12,解得π=4a+2m m故选:D .小提示:本题考查线性规划可行域问题及随机模拟法求圆周率的几何概型应用问题. 线性规划可行域是一个封闭的图形,可以直接解出可行域的面积;求解与面积有关的几何概型时,关键是弄清某事件对应的面积,必要时可根据题意构造两个变量,把变量看成点的坐标,找到试验全部结果构成的平面图形,以便求解.9、某校高一共有10个班,编号为01,02,…,10,现用抽签法从中抽取3个班进行调查,设高一(5)班被抽到的可能性为a ,高一(6)班被抽到的可能性为b ,则( )A .a =310,b =29B .a =110,b =19 C .a =310,b =310D .a =110,b =110答案:C分析:根据简单随机抽样的定义,分析即可得答案.由简单随机抽样的定义,知每个个体被抽到的可能性相等,故高一(5)班和高一(6)班被抽到的可能性均为310. 故选:C10、为调查参加考试的高二级1200名学生的成绩情况,从中抽查了100名学生的成绩,就这个问题来说,下列说法正确的是( )A .1200名学生是总体B .每个学生是个体C .样本容量是100D .抽取的100名学生是样本答案:C分析:根据总体、个体、样本容量、样本的定义,结合题意,即可判断和选择.根据题意,总体是1200名学生的成绩;个体是每个学生的成绩;样本容量是100,样本是抽取的100名学生的成绩;故正确的是C.故选:C.填空题11、某市A、B、C三个区共有高中学生20000人,其中A区高中学生7000人,现采用分层抽样的方法从这三个区所有高中学生中抽取一个容量为600人的样本进行学习兴趣调查,则A区应抽取__________________.答案:210分析:根据总体数和要抽取的样本数,得到每个个体被抽到的概率,利用这个概率乘以A区的人数,得到A区要抽取的人数.解:由题意知A区在样本中的比例为700020000∴A区应抽取的人数是700020000×600=210.所以答案是:210.12、某单位有员工900人,其中女员工有360人,为做某项调查,拟采用分层抽样的方法抽取容量为150的样本,则应抽取的男员工人数是_______________________.答案:90分析:按照分层抽样的定义,按照比例抽取即可由题意,设应抽取的男员工人数是x则900−360900=x150解得:x=90所以答案是:9013、已知一组数据:20,30,40,50,50,60,70,80,记这组数据的第60百分位数为a,众数为b,则a和b的大小关系是______________.(用“<”“>”或“=”连接)答案:a=b##b=a分析:由百分位数求法得50为第60百分位数,并确定数据的众数,即可比较它们的大小关系.因为8×60%=4.8,所以这组数据的第5个数:50为第60百分位数.观察易知这组数据的众数为50,所以a和b的大小关系是a=b.所以答案是:a=b14、某校从高一新生中随机抽取了一个容量为20的身高样本,数据从小到大排序如下(单位:cm):152 ,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170 ,171,x,174,175,若样本数据的第90百分位数是173,则x的值为________.答案:172分析:根据百分位数的意义求解.百分位数的意义就在于,我们可以了解的某一个样本在整个样本集合中所处的位置,=173,x=172本题第90百分位数是173,所以x+1742故答案为:172小提示:本题考查样本数据的第多少百分位数的概念.15、气象意义上从春季进入夏季的标志为连续5天的日平均温度均不低于22℃.现有甲、乙、丙三地连续5天的日平均温度的记录数据:(记录数据都是正整数)①甲地5个数据的中位数为24,众数为22;②乙地5个数据的中位数为27,总体均值为24;③丙地5个数据中有一个数据是32,总体均值为26,总体方差为10.8.则肯定进入夏季的地区有_____.答案:①③分析:根据数据的特点进行估计甲、乙、丙三地连续5天的日平均气温的记录数据,分析数据的可能性进行解答即可得出答案.①甲地:5个数据的中位数为24,众数为22,根据数据得出:甲地连续5天的日平均温度的记录数据可能为:22、22、24、25、26,其连续5天的日平均气温均不低于22;②乙地:5个数据的中位数为27,总体均值为24,当5个数据为19、20、27、27、27,可知其连续5天的日平均温度有低于22,故不确定;③丙地:5个数据中有一个数据是32,总体均值为26,若有低于22,假设取21,此时方差就超出了10.8,可知其连续5天的日平均温度均不低于22,如22、25、25、26、32,这组数据的平均值为26,方差为10.8,但是进一步扩大方差就会超过10.8,故③对.则肯定进入夏季的地区有甲、丙两地,故答案为①③.小提示:本题考查中位数、众数、平均数、方差的数据特征,简单的合情推理,解答此题应结合题意,根据平均数的计算方法进行解答、取特殊值即可.解答题16、为了了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量(单位:克),按照[27.5,32.5),[32.5,37.5),[37.5,42.5),[42.5,47.5),[47.5,52.5]分为5组,其频率分布直方图如图所示.(1)求图中a的值;(2)估计这种植物果实重量的平均数x̅(同一组中的数据用该组区间的中点值作代表);(3)已知这种植物果实重量不低于37.5克的即为优质果实,现对该种植物果实的某批10000个果实进行检测.据此估算这批果实中的优质果实的个数.答案:(1)a=0.050(2)40(3)7000分析:(1)由各组频率之和为1(面积之和为1)可求得;(2)频率分布直方图用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和估计平均数;(3)用样本频率估计总体概率进行求解.(1)由题意,有(0.020+0.040+0.075+a+0.015)×5=1,解得a=0.050;(2)这种植物果实重量的平均数约为:30×0.020×5+35×0.040×5+40×0.075×5+45×0.050×5+50×0.015×5=40,∴这种植物果实重量的平均数x̅的估计值约为40.(3)样本中,这种植物果实重量不低于37.5克,即优质果实的频率为0 .075×5+0.050×5+0.015×5=0.7,由此估计某批10000个果实中,重量不低于37.5克,即优质果实的概率为0.7,∴这批果实中的优质果实的个数约为10000×0.7=7000个.17、第24届北京冬季奥林匹克运动会于2022年2月4日至2月20日在北京和张家口联合举办.这是中国历史上第一次举办冬季奥运会,它掀起了中国人民参与冬季运动的大热潮.某市举办了中学生滑雪比赛,从中抽取40名学生的测试分数绘制成茎叶图和频率分布直方图如下,后来茎叶图受到了污损,可见部分信息如图.(1)求频率分布直方图中a的值,并根据直方图估计该市全体中学生的测试分数的平均数(同一组中的数据以这组数据所在区间中点的值作代表,结果保留一位小数);(2)现要对测试成绩在前26%的中学生颁发“滑雪达人”证书,并制定出能够获得证书的测试分数线,请你用样本来估计总体,给出这个分数线的估计值.答案:(1)a=0.02,平均数为74.5(2)82分析:(1)计算出测试分数位于[90,100]个数,可求得测试分数位于[80,90)的个数,由此可求得a的值,将每个矩形底边的中点值乘以对应矩形的面积,将所得结果全加可得样本的平均数;(2)设能够获得证书的测试分数线为x,分析可得80<x<90,根据已知条件可得出关于x的等式,求解即可. (1)解:由频率分布直方图可知,测试分数位于[90,100]的频率为10×0.01=0.1,则测试分数位于[90,100]个数为40×0.1=4,所以,测试分数位于[80,90)的个数为40−(4+10+14+4)=8,÷10=0.02.所以a=840估计平均数为55×0.1+65×0.25+75×0.35+85×0.2+95×0.1=74.5.(2)解:因为测试分数位于[90,100]的频率为0.1,测试分数位于[80,90)的频率为0.2,能够获得“滑雪达人”证书的中学生测试分数要在前26%,故设能够获得证书的测试分数线为x,则80<x<90,由(90−x)×0.02=0.26−0.1,可得x=82,所以分数线的估计值为82.18、某中学要从高一年级甲乙两个班级中选择一个班参加电视台组织的“环保知识竞赛”,该校对甲乙两班的参赛选手(每班7人)进行了一次环保知识测试,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生的平均分是85,乙班学生成绩的中位数是85.(1)求x,y的值;(2)根据茎叶图,求甲乙两班同学方差的大小,并从统计学角度分析,该校应选择甲班还是乙班参赛.答案:(1)x=9,y=5;(2)乙班成绩比较稳定,故应选乙班参加.分析:(1)利用茎叶图,根据甲班7名学生成绩的平均分是85,乙班7名学生成绩的中位数是85.先求出x,y,(2)求出乙班平均分,再求出甲班7名学生成绩方差和乙班名学生成绩的方差,由此能求出结果.解:(1)甲班的平均分为:17(75+78+80+80+x+85+92+96)=85;解得x=9,∵乙班7名学生成绩的中位数是85,∴y=5,(2)乙班平均分为:17(75+80+80+85+90+90+95)=85;甲班7名学生成绩方差S12=17(102+72+52+42+02+72+112)=3607,乙班名学生成绩的方差S22=17(102+52+52+02+52+52+102)=3007,∵两个班平均分相同,S22<S12,∴乙班成绩比较稳定,故应选乙班参加.小提示:本题考查茎叶图的应用,解题时要认真审题,属于基础题.19、2019年下半年以来,各地区陆续出台了“垃圾分类”的相关管理条例,实行“垃圾分类”能最大限度地减少垃圾处置量,实现垃圾资源利用,改善垃圾资源环境,某部门在某小区年龄处于[20,45]岁的人中随机地抽取x人,进行了“垃圾分类”相关知识掌握和实施情况的调查,并把达到“垃圾分类”标准的人称为“环保族”,得到如图示各年龄段人数的频率分布直方图和表中的统计数据.(1)求x、y、z的值;(2)根据频率分布直方图,估计这x人年龄的平均值(同一组数据用该区间的中点值代替,结果按四舍五入保留整数);(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,并在这9人中选取2人作为记录员,求选取的2名记录员中至少有一人年龄在[30,35]中的概率.答案:(1){x=200y=0.625z=6;(2)30.75;(3)1318.分析:(1)由频率分布直方图和频数分布表能求出x、y、z;(2)根据频率分布直方图,能估计这x人年龄的平均值;(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,[25,30)中选5人,分别记为A、B、C、D、E,[30,35]中选4人,分别记为a、b、c、d,在这9人中选取2人作为记录员,利用列举法列举出所有的基本事件,然后利用古典概型的概率公式可求得所求事件的概率.(1)由题意得:{x=450.750.06×5=200y=25200×0.04×5=0.625z=200×0.03×5×0.2=6;(2)根据频率分布直方图,估计这x人年龄的平均值为:x=22.5×0.3+27.5×0.2+32 .5×0.2+37.5×0.15+42.5×0.15=30.75;(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,从[25,30)中选:9×2525+20=5人,分别记为A、B、C、D、E,从[30,35]中选:9×2025+20=4人,分别记为a、b、c、d,在这9人中选取2人作为记录员,所有的基本事件有:(A,B)、(A,C)、(A,D)、(A,E)、(A,a)、(A,b)、(A,c)、(A,d)、(B,C)、(B,D)、(B,E)、(B,a)、(B,b)、(B,c)、(B,d)、(C,D)、(C,E)、(C,a)、(C,b)、(C,c)、(C,d)、(D,E)、(D,a)、(D,b)、(D,c)、(D,d)、(E,a)、(E,b)、(E,c)、(E,d)、(a,b)、(a,c)、(a,d)、(b,c)、(b,d)、(c,d),共36种,选取的2名记录员中至少有一人年龄在[30,35]包含的基本事件有:(A,a)、(A,b)、(A,c)、(A,d)、(B,a)、(B,b)、(B,c)、(B,d)、(C,a)、(C,b)、(C,c)、(C,d)、(D,a)、(D,b)、(D,c)、(D,d)、(E,a)、(E,b)、(E,c)、(E,d)、(a,b)、(a,c)、(a,d)、(b,c)、(b,d)、(c,d),共26种,因此,选取的2名记录员中至少有一人年龄在[30,35]中的概率P=2636=1318.小提示:本题考查频率、平均数、概率的求法,考查频数分布表、频率分布直方图、分层抽样、古典概型的性质等基础知识,考查数据分析能力、运算求解能力,是基础题.。
高三数学统计案例试题答案及解析
高三数学统计案例试题答案及解析1.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是()D.阅读量【答案】D【解析】根据公式分别计算得:A., B. C. D. ,选项D的值最大,所以与性别有关联的可能性最大为D. 【考点】关联判断2. 对100只小白鼠进行某种激素试验,其中雄性小白鼠、雌性小白鼠对激素的敏感情况统计得到如下列联表由附表:则下列说法正确的是:( ) A .在犯错误的概率不超过的前提下认为“对激素敏感与性别有关”; B .在犯错误的概率不超过的前提下认为“对激素敏感与性别无关”; C .有以上的把握认为“对激素敏感与性别有关”; D .有以上的把握认为“对激素敏感与性别无关”; 【答案】C 【解析】因为,所以有以上的把握认为“对激素敏感与性别有关”.3. 设A 是由m×n 个实数组成的m 行n 列的数表,满足:每个数的绝对值不大于1,且所有数的和为零,记s(m ,n)为所有这样的数表构成的集合。
对于A ∈S(m,n),记r i (A)为A 的第ⅰ行各数之和(1≤ⅰ≤m ),C j (A)为A 的第j 列各数之和(1≤j≤n ):记K(A)为∣r 1(A)∣,∣R 2(A)∣,…,∣Rm(A)∣,∣C 1(A)∣,∣C 2(A)∣,…,∣Cn(A)∣中的最小值。
对如下数表A ,求K (A )的值;11-0.8(2)设数表A ∈S (2,3)形如求K (A )的最大值;(3)给定正整数t,对于所有的A∈S(2,2t+1),求K(A)的最大值。
【答案】(1)0.7 (2)1 (3)【考点定位】此题作为压轴题难度较大,考查学生分析问题解决问题的能力,考查学生严谨的逻辑思维能力【解析】(1)因为,所以不妨设.由题意得.又因为,所以,于是,,所以,当,且时,取得最大值1。
(3)对于给定的正整数t,任给数表如下,…任意改变A的行次序或列次序,或把A中的每一个数换成它的相反数,所得数表,并且,因此,不妨设,且。
(必考题)高中数学选修1-2第一章《统计案例》测试卷(答案解析)(3)
一、选择题1.某校高二(1)班甲、乙两同学进行投篮比赛,他们进球的概率分别是34和45,现甲、乙各投篮一次,恰有一人进球的概率是( ) A .120B .320C .15D .7202.某校学生会为研究该校学生的性别与语文、数学、英语成绩这3个变量之间的关系,随机抽查了100名学生,得到某次期末考试的成绩数据如表1至表3,根据表中数据可知该校学生语文、数学、英语这三门学科中( )表1表2表3 语文 性别不及格 及格 总计 数学 性别不及格 及格 总计 英语 性别不及格 及格 总男 14 36 50 男 10 40 50 男 25 25 女 16 34 50 女 20 30 50 女 5 45 总计3070100总计3070100总计30701A .语文成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小B .数学成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小C .英语成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小D .英语成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小 3.某人射击一次命中目标的概率为12,且每次射击相互独立,则此人射击 7次,有4次命中且恰有3次连续命中的概率为( ) A .3761()2CB .2741()2AC .2741()2CD .1741()2C4.在一次抗洪抢险中,准备用射击的方法引爆漂流的汽油桶.现有5发子弹,第一次命中只能使汽油流出,第二次命中才能引爆,每次射击相互独立,且命中概率都是34.则打光子弹的概率是( ) A .9256B .13256C .45512D .910245.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的女生人数是男生人数的,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数,若有的把握认为是否喜欢抖音和性别有关,则男生至少有( )参考公式:0.10 0.05 0.025 0.010 0.005 0.001 2.7063.8415.0246.6357.87910.828A .12人B .18人C .24人D .30人6.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有( ) 参考数据及公式如下:20()P K k ≥ 0.050 0.0100.0010k3.841 6.635 10.8282()=()()()()n ad bc K a b c d a c b d -++++A .12B .11C .10D .187.为了解某班学生喜爱打篮球是否与性别有关,对该班60名学生进行问卷调查,得到如下图所示的22⨯列联表,则至少有( )的把握认为喜爱打篮球与性别有关.喜爱打篮球 不喜爱打篮球 合计男生 25530 女生 151530合计40 20 60附参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.20()P K k ≥ 0.100.050.025 0.010 0.005 0.001 0k 2.706 3.8415.0246.6357.78910.828A .99.9%B .99.5%C .99%D .97.5%8.甲、乙两名同学参加2018年高考,根据高三年级一年来的各种大、中、小型数学模拟考试总结出来的数据显示,甲、乙两人能考140分以上的概率分别为12和45,甲、乙两人是否考140分以上相互独立,则预估这两个人在2018年高考中恰有一人数学考140 分以上的概率为( ) A .12B .23C .34D .139.2018年元旦期间,某高速公路收费站的三个高速收费口每天通过的小汽车数X (单位:辆)均服从正态分布()2600,Nσ,若()5007000.6P X <<=,假设三个收费口均能正常工作,则这个收费口每天至少有一个超过700辆的概率为( ) A .1125B .12125 C .61125 D .6412510.下列说法中正确的是( )A .设随机变量~(10,0.01)X N ,则1(10)2P X >= B .线性回归直线不一定过样本中心点(,)x yC .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1D .先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +,……的学生,这样的抽样方法是分层抽样11.为了解学生对街舞的喜欢是否与性别有关,在全校学生中进行抽样调查,根据数据,求得2K 的观测值0 4.804k ≈,则至少有( )的把握认为对街舞的喜欢与性别有关.参考数据:A .90%B .95%C .97.5%D .99%12.甲、乙两队进行篮球决赛,采取五场三胜制(当一队赢得三场胜利时,该队获胜,比赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队不超过4场即获胜的概率是( ) A .0.18B .0.21C .0.39D .0.42二、填空题13.有7个评委各自独立对A 、B 两位选手投票表决,两位选手旗鼓相当,每位评委公平投票且不得弃权.若7位评委依次揭晓票选结果,则A 选手在每位评委投票揭晓后票数始终保持领先的概率是______.14.有9粒种子分种在3个坑内,每坑放3粒,每粒种子发芽概率为0.5,若一个坑内至少有1粒种子发芽,则这个坑不需要补种;若一个坑内的种子都没有发芽,则这个坑需要补种,假定每个坑至多补种一次,需要补种的坑数为2的概率等于_______.15.已知如下四个命题:①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于0,表示回归效果越好;②在回归直线方程ˆ0.812yx =-中,当解释变量x 每增加一个单位时,预报变量ˆy平均增加0.8个单位;③两个变量相关性越强,则相关系数的绝对值就越接近于1;④对分类变量X 与Y ,对它们的随机变量2K 的观测值k 来说,k 越小,则“X 与Y 有关系”的把握程度越大.其中正确命题的序号是__________. 16.三个元件正常工作的概率分别为,,,将两个元件并联后再和串联接入电路,如图所示,则电路不发生故障的概率为_________.17.从包括甲乙两人的6名学生中选出3人作为代表,记事件A :甲被选为代表,事件B :乙没有被选为代表,则()P B A │等于_________.18.甲袋中装有2个白球,2个黑球,乙袋中装有2个白球,4个黑球,从甲、乙两袋中各取一球均为白球的概率为______________19.把一枚硬币任意抛掷三次,事件A =“至少出现一次反面”,事件B =“恰好出现一次正面”,则(/)P B A =__________.20.投到某出版社的稿件,先由两位初审专家进行评审,若能通过两位初审专家的评审,则直接予以录用,若两位初审专家都未予通过,则不予录用,若恰能通过一位初审专家的评审,则再由第三位专家进行复审,若能通过复审专家的评审,则予以录用,否则不予录用.设稿件能通过各初审专家评审的概率均为12,复审的稿件能通过评审的概率为14,各专家独立评审,则投到该出版社的1篇稿件被录用的概率为__________.三、解答题21.为落实中央“坚持五育并举,全面发展素质教育,强化体育锻炼”的指示精神,小明和小亮两名同学每天利用课余时间进行羽毛球比赛.规定每一局比赛中获胜方记2分,失败方记0分,没有平局,谁先获得10分就获胜,比赛结束.假设每局比赛小明获胜的概率都是23. (1)求比赛结束时恰好打了7局的概率;(2)若现在是小明6:2的比分领先,记X 表示结束比赛还需打的局数,求X 的分布列及期望.22.某航空公司规定:国内航班(不构成国际运输的国内航段)托运行李每件重量上限为50kg ,每件尺寸限制为40cm 60cm 100cm ⨯⨯,其中头等舱乘客免费行李额为40kg ,经济舱乘客免费行李额为20kg .某调研小组随机抽取了100位国内航班旅客进行调查,得到如表所示的数据:(1)请完成22⨯列联表,并判断是否在犯错概率不超过0.05的前提下,认为托运超额行李与乘客乘坐座位的等级有关?(2)调研小组为感谢参与调查的旅客,决定从托运行李超出免费行李额且不超出的旅客中(其中女性旅客4人)随机抽取4人,对其中的女性旅客赠送“100元超额行李补贴券”,记赠送的补贴券总金额为X 元,求X 的分布列与数学期望.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:23.某工厂A ,B 两条相互独立的生产线生产同款产品,在产量一样的情况下,通过日常监控得知,A ,B 生产线生产的产品为合格品的概率分别为p 和21(0.51)p p -.(1)从A ,B 生产线上各抽检一件产品,若使得产品至少有一件合格的概率不低于99.5%,求p 的最小值0p ;(2)假设不合格的产品均可进行返工修复为合格品,以(1)中确定的0p 作为p 的值. ①已知A ,B 生产线的不合格品返工后每件产品可分别挽回损失5元和3元,若从两条生产线上各随机抽检1000件产品,以挽回损失的平均数为判断依据,估计哪条生产线的挽回损失较多?②若最终的合格品(包括返工修复后的合格品)按照一、二、三等级分类后,每件可分别获利10元、8元、6元,现从A ,B 生产线的最终合格品中各随机抽取100件进行分级检测,结果统计如图所示,用样本的频率分布估计总体分布,记该工厂生产一件产品的利润为X ,求X 的分布列并估计该厂产量2000件时利润的期望值.24.某种疾病可分为Ⅰ、Ⅱ两种类型.为了解该疾病类型与性别的关系,在某地区随机抽取了患该疾病的病人进行调查,其中女性是男性的2倍,男性患Ⅰ型病的人数占男性病人的56,女性患Ⅰ型病的人数占女性病人的13. (1)若在犯错误的概率不超过0.005的前提下认为“所患疾病类型”与“性别”有关,求男性患者至少有多少人?(2)某药品研发公司欲安排甲乙两个研发团队来研发此疾病的治疗药物.两个团队各至多安排2个接种周期进行试验.甲团队研发的药物每次接种后产生抗体的概率为p ,每人每次接种花费()0m m >元,每个周期至多接种3次,第一个周期连续2次出现抗体则终止本接种周期进入第二个接种周期,否则需依次接种至第一周期结束,再进入第二周期;第二接种周期连续2次出现抗体则终止试验,否则需依次接种至至试验结束;乙团队研发的药物每次接种后产生抗体的概率为q ,每人每次花费()0n n >元,每个周期接种3次,每个周期必须完成3次接种,若一个周期内至少出现2次抗体,则该周期结束后终止试验,否则进入第二个接种周期.假设两个研发团队每次接种后产生抗体与否均相互独立.①若甲团队的试验平均花费大于乙团队的试验平均花费,求p 、q 、m 、n 满足的关系式;②若m n =,2p q =,从两个团队试验的平均花费考虑,该公司应选择哪个团队进行药品研发?附:()()()()()22n ad bc K a b c d a c b d -=++++,()20P K k ≥ 0.100.05 0.01 0.005 0.001 0k 2.7063.8416.6357.87910.82825.某大型运动会的组委会为了搞好接待工作,招募了30名男志愿者和20名女志愿者.调查发现,这些志愿者中有部分志愿者喜爱运动,另一部分志愿者不喜欢运动,并得到了如下等高条形图和22⨯列联表:喜爱运动 不喜爱运动 总计 男生 ab30 女生 cd20 总计50(1)求出列联表中a 、b 、c 、d 的值;(2)是否有99%的把握认为喜爱运动与性别有关?附:参考公式和数据:22()()()()()n ad bc K a b c d a c b d -=++++,(其中n a b c d =+++)20()P K k ≥ 0.5000.100 0.050 0.010 0.001 0k 0.4552.7063.8416.63510.82826.某花圃为提高某品种花苗质量,开展技术创新活动,分别用甲、乙两种方法培育该品种花苗.为比较两种培育方法的效果,选取了40棵花苗,随机分成两组,每组20棵.第一组花苗用甲方法培育,第二组用乙方法培育.培育完成后,对每棵花苗进行综合评分,绘制了如图所示的茎叶图:(1)分别求两种方法培育的花苗综合评分的中位数.你认为哪一种方法培育的花苗综合评分更高?并说明理由.(2)综合评分超过80的花苗称为优质花苗,填写下面的列联表,并判断是否有99.5%的把握认为优质花苗与培育方法有关?优质花苗 非优质花苗 合计甲培育法 乙培育法 合计附:()()()()()22n ad bc K a b c d a c b d -=++++. ()20P K k ≥ 0.0100.050 0.025 0.010 0.005 0.001 0k 2.7063.8415.0246.6357.87910.828【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】利用相互独立事件的概率乘法公式求得 甲投进而乙没有投进的概率,以及乙投进而甲没有投进的概率,相加即得所求. 【详解】甲投进而乙没有投进的概率为343(1)4520⨯-=,乙投进而甲没有投进的概率为341(1)455-⨯=,故甲、乙各投篮一次,恰有一人投进球的概率是 31720520+=,故选:D 【点睛】本题主要考查了相互独立事件的概率乘法公式的应用,体现了分类讨论的数学思想,属于中档题.2.C解析:C 【分析】根据题目所给的数据填写2×2列联表即可;计算K 的观测值K 2,对照题目中的表格,得出统计结论. 【详解】因为()()2210014341636100103020403070505030705050⨯⨯-⨯⨯⨯-⨯<⨯⨯⨯⨯⨯⨯()2100254552530705050⨯⨯-⨯<⨯⨯⨯,所以英语成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小. 故选C 【点睛】本题考查了独立性检验的应用问题,也考查了计算能力的应用问题,是基础题目. 3.B解析:B 【分析】由于射击一次命中目标的概率为12,所以关键先求出射击7次有4次命中且恰有3次连续命中的所有可能数,即根据独立事件概率公式得结果. 【详解】因为射击7次有4次命中且恰有3次连续命中有24A 种情况,所以所求概率为7241A 2⎛⎫⋅ ⎪⎝⎭.选B. 【点睛】本题考查排列组合以及独立事件概率公式,考查基本分析求解能力,属中档题.4.B解析:B 【分析】打光所有子弹,分中0次、中一次、中2次. 【详解】5次中0次:5 1 4⎛⎫ ⎪⎝⎭5次中一次:4 153144 C⎛⎫⨯⨯ ⎪⎝⎭5次中两次:前4次中一次,最后一次必中314331 444C⎛⎫⨯⨯⨯ ⎪⎝⎭则打光子弹的概率是514⎛⎫⎪⎝⎭+4153144C⎛⎫⨯⨯ ⎪⎝⎭+314331444C⎛⎫⨯⨯⨯ ⎪⎝⎭=13256,选B【点睛】本题需理解打光所有子弹的含义:可能引爆,也可能未引爆.5.B解析:B【解析】【分析】设男生人数为,女生人数为,完善列联表,计算解不等式得到答案.【详解】设男生人数为,女生人数为喜欢抖音不喜欢抖音总计男生女生总计男女人数为整数故答案选B【点睛】本题考查了独立性检验,意在考查学生的计算能力和应用能力.6.A解析:A【分析】设男生人数为x ,依题意可得列联表;根据表格中的数据,代入求观测值的公式,求出观测值同临界值进行比较,列不等式即可得出结论. 【详解】设男生人数为x ,依题意可得列联表如下:则2 3.841K >,由222235236183 3.841822x x x K x x x x x ⎛⎫- ⎪⎝⎭==>⋅⋅⋅,解得10.24x >, ,26x x为整数, ∴若在犯错误的概率不超过95%的前提下认为是否喜欢追星和性别有关,则男生至少有12人,故选A. 【点睛】本题主要考查独立性检验知识,考查学生的计算能力,考查学生分析解决问题的能力,属于中档题. 独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.7.C解析:C 【解析】分析:根据列联表中数据,利用公式求得27.333k ≈,对照临界值即可的结果. 详解:根据所给的列联表, 得到()226025151557.333 6.63540203030k ⨯-⨯=≈>⨯⨯⨯,∴至少有0099的把握认为喜爱打篮球与性别有关,故选C.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.8.A解析:A 【解析】分析:根据互斥事件概率加法公式以及独立事件概率乘积公式求概率.详解:因为这两个人在2018年高考中恰有一人数学考140 分以上的概率为甲考140 分以上乙未考到140 分以上事件概率与乙考140 分以上甲未考到140 分以上事件概率的和,而 甲考140 分以上乙未考到140 分以上事件概率为14(1)25⨯-,乙考140 分以上甲未考到140 分以上事件概率为14(1)25-⨯,因此,所求概率为14(1)25⨯-1451(1)25102+-⨯==, 选A.点睛:本题考查互斥事件概率加法公式以及独立事件概率乘积公式,考查基本求解能力.9.C解析:C 【解析】分析:根据正态曲线的对称性求解即可.详解:根据正态曲线的对称性,每个收费口超过700辆的概率()()()111700150070010.60.2225P X P X ⎡⎤≥=-<<=⨯-==⎣⎦, ∴这三个收费口每天至少有一个超过700辆的概率 3161115125P ⎛⎫=--=⎪⎝⎭,故选C. 点睛:本题主要考查正态分布的性质与实际应用,属于中档题.有关正态分布的应用题考查知识点较为清晰,只要掌握以下两点,问题就能迎刃而解:(1)仔细阅读,将实际问题与正态分布“挂起钩来”;(2)熟练掌握正态分布的性质,特别是状态曲线的对称性以及各个区间概率之间的关系.10.A解析:A 【解析】在A 中,设随机变量X 服从正态分布N (10,0.01),则由正态分布性质得1(10)2P X >=,故A 正确; 在B 中,线性回归直线一定过样本中心点(),x y ,故B 错误;在C 中,若两个随机变量的线性相关性越强,则相关系数r 的绝对值越接近于1,故C 错误;在D 中,先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为m+50,m+100,m+150…的学生,这样的抽样方法是系统抽样法,故D 错误. 故选:A11.B解析:B 【解析】因为4.804>3.841,所以有95%的把握认为对街舞的喜欢与性别有关.12.C解析:C 【分析】利用相互独立事件概率乘法公式和互斥事件概率加法公式直接求解. 【详解】解:甲、乙两队进行排球决赛,采取五场三胜制(当一队赢得三场胜利时,该队获胜,决赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立, 则甲队以3:1获胜的概率是:()()()10.60.610.50.50.610.60.50.510.60.60.50.50.21P =⨯⨯-⨯+⨯-⨯⨯+-⨯⨯⨯=.甲队以3:0获胜的概率是: 20.60.60.50.18P =⨯⨯=则甲队不超过4场即获胜的概率120.210.180.39P P P =+=+= 故选:C 【点睛】本题考查概率的求法,考查相互独立事件概率乘法公式和互斥事件概率加法公式等基础知识,考查运算求解能力,属于中档题.二、填空题13.【分析】将比分分为四种情况讨论计算概率【详解】由条件可知前两名投票的都投给选手并且投给每位选手的概率是若投票给两位选手的比分为则概率为若比分为则投给选手的方法有种所以概率为若比分为则投给选手的两票不 解析:532【分析】将比分分为7:0,6:1,5:2,4:3四种情况讨论计算概率. 【详解】由条件可知前两名投票的都投给选手A ,并且投给每位选手的概率是12P =. 若投票给A 、B 两位选手的比分为7:0,则概率为712⎛⎫ ⎪⎝⎭, 若比分为6:1,则投给选手B 的方法有155C =种,所以概率为7152⎛⎫⋅ ⎪⎝⎭若比分为5:2,则投给选手B 的两票不能在第三和第四的位置,有2519C -=种,所以概率为7192⎛⎫⋅ ⎪⎝⎭, 若比分为4:3,则投给A 的票不能是最后一位,且不能占5,6位,有2415C -=种,所以概率为7152⎛⎫⋅ ⎪⎝⎭, 所以概率()7151595232P ⎛⎫=+++⋅=⎪⎝⎭. 故答案为:532【点睛】本题考查独立事件同时发生的概率,重点考查分类的思想,属于中档题型.14.【分析】先计算出粒种子都没有发芽的概率即得出每个坑需要补种的概率然后利用独立重复试验的概率得出所求事件的概率【详解】由独立事件的概率乘法公式可知粒种子没有粒发芽的概率为所以一个坑需要补种的概率为由独 解析:21512【分析】先计算出3粒种子都没有发芽的概率,即得出每个坑需要补种的概率,然后利用独立重复试验的概率得出所求事件的概率. 【详解】由独立事件的概率乘法公式可知,3粒种子没有1粒发芽的概率为31128⎛⎫= ⎪⎝⎭, 所以,一个坑需要补种的概率为18, 由独立重复试验的概率公式可得,需要补种的坑数为2的概率为223172188512C ⎛⎫⋅⋅= ⎪⎝⎭, 故答案为21512. 【点睛】本题考查独立事件概率乘法公式的应用,同时也考查了独立重复试验恰有()k k N *∈次发生的概率,要弄清楚事件的基本类型,并结合相应的概率公式进行计算,考查分析问题和理解问题的能力,属于中等题.15.②③【分析】①根据相关指数的性质进行判断;②根据回归方程的性质进行判断;③根据相关系数的性质进行判断;④根据随机变量的观测值k 的关系进行判断【详解】①在线性回归模型中相关指数表示解释变量对于预报变量解析:②③ 【分析】①根据相关指数2R 的性质进行判断;②根据回归方程的性质进行判断;③根据相关系数的性质进行判断;④根据随机变量2K 的观测值k 的关系进行判断. 【详解】①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于1,表示回归效果越好,所以①错误;②在回归直线方程ˆy=0.8x−12中,当解释变量x 每增加一个单位时,预报变量ˆy 平均增加0.8个单位,正确;③两个变量相关性越强,则相关系数的绝对值就越接近于1,正确;④对分类变量X 与Y ,对它们的随机变量K2的观测值k 来说,k 越小,则“X 与Y 有关系”的把握程度越小,所以④错误; 故正确命题的序号是②③. 【点睛】该题考查的是有关统计的问题,涉及到的知识点有线性回归分析,两个变量之间相关关系强弱的判断,独立性检验,属于简单题目.16.【解析】分析:组成的并联电路可从反面计算即先计算发生故障的概率然后用对立事件概率得出不发生故障概率详解:由题意故答案为点睛:零件不发生故障的概率分别为则它们组成的电路中如果是串联电路则不发生故障的概 解析:【解析】分析:23,T T 组成的并联电路可从反面计算,即先计算发生故障的概率,然后用对立事件概率得出不发生故障概率. 详解:由题意11115(1)24432P =⨯-⨯=. 故答案为1532. 点睛:零件12,,,k a a a 不发生故障的概率分别为12,,,k p p p ,则它们组成的电路中,如果是串联电路,则不发生故障的概率易于计算,即为12k p p p ,如果组成的是并联电路,则发生故障的概率易于计算,即为12(1)(1)(1)k p p p ---.17.【解析】因为所以应填答案解析:35【解析】因为()()2254336613,210C C P A P AB C C ====,所以3(|)5P B A =。
高考数学统计与统计案例选择填空专题练习(含答案)
高考数学统计与统计案例选择填空专题练习一.选择题1.为了解某社区居民有无收看“奥运会开幕式”,某记者分别从某社区6070岁,4050岁,2030岁的三个年龄段中的160人,240人,x 人中,采用分层抽样的方法共抽查了30人进行调查, 若在6070岁这个年龄段中抽查了8人,那么x 为( ) A .90B .120C .180D .2002.滴滴公司为了调查消费者对滴滴打车出行的真实评价,采用系统抽样方法从2000人中抽取100人做问卷调查,为此将他们随机编号1,2,,2000,适当分组后在第一组采用简单随机抽样的方法抽到的号码为9,抽到的100人中,编号落入区间[]1,820的人做问卷A ,编号落入区间[]821,1520的人做问卷B ,其余的人做问卷C ,则抽到的人中,做问卷C 的人数为( ) A .23B .24C .25D .263.某校进行了一次创新作文大赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在[]40,90之间,其得分的频率分布直方图如图,则下列结论错误的是( )A .得分在[)40,60之间的共有40人B .从这100名参赛者中随机选取1人,其得分在[)60,80的概率为0.5C .这100名参赛者得分的中位数为65D .估计得分的众数为554.甲、乙两位射击运动员的5次比赛成绩(单位:环)如茎叶图所示,若两位运动员平均成绩相同,则成绩较稳定(方差较小)的那位运动员成绩的方差为( )A .5B .4C .3D .25.已知数据1x ,2x ,3x ,,100x 是某市100个普通职工2018年8月份的收入(均不超过0.8万元),设这100个数据的中位数为x ,平均数为y ,方差为z ,如果再加上某人2018年8月份的收入101x (约100万元),则相对于x ,y ,z ,这101个数据( ) A .平均数可能不变,中位数可能不变,方差可能不变 B .平均数变大,中位数可能不变,方差也不变 C .平均数变大,中位数一定变大,方差可能不变 D .平均数变大,中位数可能不变,方差变大6.对于下列表格中的五对数据,已求得的线性回归方程为0.8155x y -=,则实数m 的值为( )A .8B .8.2C .8.4D .8.57.研究变量x ,y 得到一组样本数据,进行回归分析,有以下结论 ①残差平方和越小的模型,拟合的效果越好;②用相关指数2R 来刻画回归效果,2R 越小说明拟合效果越好;③在回归直线方程0.2.8ˆ0yx =+中,当解释变量x 每增加1个单位时,预报变量ˆy 平均增加0.2个单位 ④若变量y 和x 之间的相关系数为0.9462r =-,则变量y 和x 之间的负相关很强,以上正确说法的个数是( ) A .1B .2C .3D .48.某科研机构为了研究中年人秃头是否与患有心脏病有关,随机调查了一些中年人的情况,具体数据如下表所示:根据表中数据得()2277520450530015.96825750320455K ⨯⨯-⨯=≈⨯⨯⨯,由210.828K ≥断定秃发与患有心脏病有关,那么这种判断出错的可能性为A .0.1B .0.05C .0.01D .0.0019.总体由编号为01,02,,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从下面的随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )A .08B .07C .02D .0110.某公司为了解用户对其产品的满意度,从甲、乙两地区分别随机调查了100个用户, 根据用户对产品的满意度评分,分别得到甲地区和乙地区用户满意度评分的频率分布直方图.若甲地区和乙地区用户满意度评分的中位数分别为1m ,2m ;平均数分别为1s ,2s ,则下面正确的是( ) A .12m m >,12s s > B .12m m >,12s s < C .12m m <,12s s <D .12m m <,12s s >11.已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:根据表中的全部数据,用最小二乘法得出y 与x 的线性回归方程为 6.517.5y x =+,则表中m 的值为( ) A .45B .50C .55D .6012.空气质量指数(简称:AQI )是定量描述空气质量状况的无量纲指数,空气质量按照AQI 大小分为六级:[)0,50为优,[)50,100为良,[)100,150为轻度污染,[)150,200为中度污染,[)200,250为重度污染,[)250,300为严重污染.下面记录了北京市22天的空气质量指数,根据图表,下列结论错误的是( )A.在北京这22天的空气质量中,按平均数来考察,最后4天的空气质量优于最前面4天的空气质量B.在北京这22天的空气质量中,有3天达到污染程度C.在北京这22天的空气质量中,12月29日空气质量最好D.在北京这22天的空气质量中,达到空气质量优的天数有6天二、填空题13.我国古代数学名著《九章算术》有一抽样问题:“今有北乡若干人,西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人,而北乡需遣一百零八人,问北乡人数几何?“其意思为:“今有某地北面若干人,西面有7488人,南面有6912人,这三面要征调300人,而北面共征调108人(用分层抽样的方法),则北面共有__________人.”14.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:参照附表,在犯错误的概率最多不超过______(填百分比)的前提下,可认为“该种疫苗有预防埃博拉病毒感染的效果”.参考公式:K215.已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:根据上表可得回归方程ˆˆˆb=,则当投入10万元广告费时,销售额的预报值为_______ =+,计算得ˆ7y bx a万元.16.已知一组数据分别是x,10,2,5,2,4,2,若这组数据的平均数、中位数、众数成等差数列,则数据x的所有可能值为__________.参考答案: 1.【答案】D【解析】由分层抽样得816030160240x=++,200x ∴=,故选D . 2.【答案】B【解析】若采用系统抽样方法从2000人中抽取100人做问卷调查,则需要分为100组,每组20人, 若第一组抽到的号码为9,则以后每组有抽取的号码分别为29,49,69,89,109,,所以抽到的号码构成以9为首项,20为公差的等差数列, 此等差数列的通项公式为()92012011n a n n =+-=-.由题意可知,落在区间[]1521,2000的有152120112000n ≤-≤,n ∈Z . 解得76.6100.5n ≤≤,n ∈Z ,所以77100n ≤≤,n ∈Z , 编号落入区间[]1521,2000的有24人,故选B . 3.【答案】C【解析】根据频率和为1,计算()0.0350.0300.0200.010101a ++++⨯=,解得0.005a =, 得分在[)40,60的频率是0.40,估计得分在[)40,60的有1000.4040⨯=人,A 正确; 得分在[)60,80的频率为0.5,用频率估计概率,知这100名男生中随机抽取一人,得分在[)60,80的概率为12,B 正确.根据频率分布直方图知,最高的小矩形对应的底边中点为5060552+=,∴估计众数为55,D 正确; 故选C . 4.【答案】D【解析】根据茎叶图中的数据知,甲、乙二人的平均成绩相同, 即()()118789909193888990919055x ⨯++++=⨯+++++,解得2x =, 所以平均数为90x =;根据茎叶图中的数据知甲的成绩波动性小,较为稳定(方差较小),所以甲成绩的方差为()()()()()22222218890899090909190929025s ⎡⎤=⨯-+-+-+-+-=⎣⎦.故选D . 5.【答案】D【解析】因为数据1x ,2x ,3x ,,100x 是某市100个普通职工2018年8月份的收入,而101x 大于1x ,2x ,3x ,,100x 很多,所以这101个数据中,平均数变大,但中位数可能不变,也可能变大,由于数据的集中程度受到101x 比较大的影响,变得更加离散,所以方差变大.故选D . 6.【答案】A 【解析】依题意得()11961972002032042005x =++++=,()117136755my m +=++++=, 回归直线必经过样本点的中心,于是有170.82001555m+=⨯-,由此解得8m =,故选A . 7.【答案】D【解析】由题意可知:研究变量x ,y 得到一组样本数据,进行回归分析时: ①残差平方和越小的模型,拟合的效果越好;②用相关指数2R 来刻画回归效果,2R 越小说明拟合效果越好;③在回归直线方程0.2.8ˆ0yx =+中,当解释变量x 每增加1个单位时,预报变量ˆy 平均增加0.2个单位 ④相关系数为正值,则两变量之间正相关,相关系数为负值,则两变量之间负相关,相关系数的绝对值越接近1,则变量之间的相关性越强.若变量y 和x 之间的相关系数为0.9462r =-,则变量y 和x 之间的负相关很强.综上可得,正确说法的个数是4,本题选择D 选项. 8.【答案】D【解析】由题意,210.828K ≥,根据附表可得判断秃发与患有心脏病有关出错的可能性为0.001,故选D . 9.【答案】D【解析】按随机数表读数,5个数分别是08,02,14,07,01,故选D . 10.【答案】C【解析】由频率分布直方图得:甲地区[)40,60的频率为()0.0150.020100.35+⨯=,[)60,70的频率为0.025100.25⨯=.∴甲地区用户满意度评分的中位数10.50.356010660.25m -=+⨯=,甲地区的平均数1450.01510550.02010650.02510750.02010850.01010950.0101067s =⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=;乙地区[)50,70的频率为()0.0050.020100.25+⨯=,[)70,80的频率为0.035100.35⨯=. ∴乙地区用户满意评分的中位数20.50.25701077.10.35m -=+⨯≈,乙地区的平均数2550.00510650.02010750.03510850.02510950.0151077.5s =⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=,∴12m m <,12s s <,故选C . 11.【答案】D 【解析】由表可知2456855x ++++==,3040507019055m my +++++==因为回归直线会经过平均数样本中心点,代入190 6.5517.55m+=⨯+, 解得60m =,所以选D . 12.【答案】C【解析】因为9759>,5148>,3629>,6845>, 所以在北京这22天的空气质量中,按平均数来考察,最后4天的空气质量优于最前面4天的空气质量,即选项A 正确; AQI 不低于100的数据有3个:143,225,145,所以在北京这22天的空气质量中,有3天达到污染程度,即选项B 正确;因为12月29日的AQI 为225,为重度污染,该天的空气质量最差,即选项C 错误; AQI 在[)0,50的数据有6个:36,47,49,48,29,45,即达到空气质量优的天数有6天,即选项D 正确.故选C .13.【答案】8100【解析】因为共抽调300人,北面抽调了108人,所以西面和南面共14400人中抽出了192人, 所以抽样比为19214400,所以北面共有144001088100192⨯=人,故填8100.14.【答案】5%【解析】参照附表,可得:在犯错误的概率不超过5%的前提下,认为“小动物是否被感染与有没有服用疫苗有关”. 故答案为5%. 15.【答案】85【解析】由上表可知:2456855x ++++==,3040506070505y ++++==.得样本中心为()5,50代入回归方程ˆˆˆybx a =+,得507515ˆa =-⨯=. 所以回归方程为ˆ715yx =+,将10x =代入可得ˆ85y =. 故答案为85.16.【答案】11-或3或17【解析】由题得这组数据的平均数为10252422577x x +++++++=,众数是2, 若2x ≤,则中位数为2,此时11x =-, 若24x <<,则中位数为x ,此时25227xx +=+,3x =, 若4x ≥,则中位数为4,252427x+⨯=+,17x =, 所有可能值为11-,3,17. 故填11-或3或17.。
高三数学统计案例试题答案及解析
高三数学统计案例试题答案及解析1.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是()D.阅读量【答案】D【解析】根据公式分别计算得:A., B. C. D. ,选项D的值最大,所以与性别有关联的可能性最大为D.【考点】关联判断2.某种产品的广告费支出z与销售额y(单位:万元)之间有如下对应数据:若广告费支出z与销售额y回归直线方程为多一6.5z+n(n∈R).(1)试预测当广告费支出为12万元时,销售额是多少?(2)在已有的五组数据中任意抽取两组,求至少有一组数据其预测值与实际值之差的绝对值不超过5的概率.【答案】(1);(2).【解析】(1)回归方程必过样本中心点,,将样本中心点代入回归方程,求出,即得回归方程,当广告费支出万元时,代入求得就是销售额;(2)将实际值与观测值对应列出,列举法一一列出任取两组的所有基本事件,至少有一组数据其预测值与实际值之差的绝对值不超过的对立事件为,两组都超过,找到两组都超过的基本事件的个数,.(1)因为点(5,50)在回归直线上,代入回归直线方程求得,所求回归直线方程为: 3分当广告支出为12时,销售额. 5分(2)实际值和预测值对应表为在已有的五组数据中任意抽取两组的基本事件:(30,40),(30,60),(30,50),(30,70),(40,60),(40,50),(40,70),(60,50),(60,70),(50,70)共10个, 10分两组数据其预测值与实际值之差的绝对值都超过5的有(60,50),所以至少有一组数据其预测值与实际值之差的绝对值不超过5的概率为. 12分【考点】1.回归方程;2.古典概型的概率问题.3.一台机器由于使用时间较长,但还可以使用,它按不同的转速生产出来的某机器零件有一些会有缺点,每小时生产有缺点零件的多少随机器运转的速度而变化,下表是抽样试验结果:在的范围是()A.10转/s以下B.15转/s以下C.20转/s以下D.25转/s以下【答案】B【解析】则a=-b=-0.857 5.∴回归直线方程为=0.728 6x-0.857 5.要使y≤10,则0.728 6x-0.857 5≤10,∴x≤14.901 9.因此,机器的转速应该控制在15转/s以下.故选B.4.登山族为了了解某山高y(km)与气温x(°C)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:气温x(°C)181310-1由表中数据,得到线性回归方程,由此请估计出山高为72(km)处气温的度数为()A.-10B.-8C.-6D.-6【答案】C【解析】由题意可得=10,=40.5,所以=+2=40.5+2×10=60.5,所以,当=72时,,解得x≈-6,故选C.【考点】回归分析5.在某次高三考试成绩中,随机抽取了9位同学的数学成绩进行统计。
高中数学【统计与统计案例】专题练习
高中数学【统计与统计案例】专题练习1.(多选)下列统计量中,能度量样本x 1,x 2,…,x n 的离散程度的是( ) A.样本x 1,x 2,…,x n 的标准差 B.样本x 1,x 2,…,x n 的中位数 C.样本x 1,x 2,…,x n 的极差 D.样本x 1,x 2,…,x n 的平均数 答案 AC解析 由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势;故选AC.2.某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下: 旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7 新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x -和y -,样本方差分别记为s 21和s 22. (1)求x -,y -,s 21,s 22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y --x -≥2s 21+s 2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).解 (1)x -=9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.710=10,y -=10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.510=10.3,s 21=0.22+0.32+0+0.22+0.12+0.22+0+0.12+0.22+0.3210=0.036,s 22=0.22+0.12+0.22+0.32+0.22+0+0.32+0.22+0.12+0.2210=0.04. (2)由(1)知,y --x -=0.3; 2s 21+s 2210=20.036+0.0410=20.007 6.又(y --x -)2=0.09>(20.007 6)2=0.030 4,则y --x ->2s 21+s 2210,所以新设备生产产品的该项指标的均值较旧设备有显著提高.3.某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑20i =1x i =60,∑20i =1y i =1 200,∑20i =1(x i -x -)2=80,∑20i =1(y i-y -)2=9 000,∑20i =1(x i -x -)(y i -y -)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r =∑ni =1 (x i -x -)(y i -y -)∑n i =1(x i -x -)2∑n i =1 (y i -y -)2,2≈1.414.解 (1)由已知得样本平均数y -=120∑20i =1y i =60,从而该地区这种野生动物数量的估计值为60×200=12 000.(2)样本(x i ,y i )(i =1,2,…,20)的相关系数r =∑20i =1 (x i -x -)(y i -y -)∑20i =1(x i -x -)2∑20i =1(y i -y -)2=80080×9 000=223≈0.94.(3)分层随机抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层随机抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关性.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.1.抽样方法抽样方法包括简单随机抽样、分层随机抽样,两种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围. 2.统计中的五个数据特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:在样本数据中,将数据按大小顺序排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数. (3)平均数:样本数据的算术平均数,即x -=1n (x 1+x 2+…+x n ).(4)第p 百分位数:将一组数据(共n 个)按从小到大排列,计算i =n ×p %,若i 不是整数,而大于i 的比邻整数为j ,则第p 百分位数为第j 项数据;若i 是整数,则第p 百分位数为第i 项与第(i +1)项数据的平均数.(5)方差与标准差.s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],s =1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2].3.频率分布直方图的两个结论 (1)小长方形的面积=组距×频率组距=频率. (2)各小长方形的面积之和等于1. 4.回归分析与独立性检验(1)回归直线y ^=b ^x +a ^经过样本点的中心(x -,y -),若x 取某一个值代入回归直线方程y ^=b ^x +a ^中,可求出y 的估计值. (2)独立性检验对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是:X Y 合计 y 1 y 2 x 1 a b a +b x 2 c d c +d 合计a +cb +dn则χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c +d 为样本容量).热点一 用样本估计总体考向1 数字特征与统计图表的应用【例1】 (1)空气质量指数分为六级,指数越大说明污染的情况越严重,对人体危害越大,其中指数范围[0,50],[51,100],[101,150],[151,200],[201,300]分别对应“优”“良”“轻度污染”“中度污染”“重度污染”五个等级.如图是某市连续14天的空气质量指数趋势图,下列说法不正确的是( )A.这14天中有4天空气质量为“良”B.这14天中空气质量指数的中位数是103C.从2日到5日空气质量越来越差D.连续三天中空气质量指数方差最小的是9日到11日(2)2020年我国突发新冠肺炎疫情,疫情期间中小学生“停课不停学”.已知某地区中小学生人数情况如甲图所示,各学段学生在疫情期间“家务劳动”的参与率如乙图所示.为了进一步了解该地区中小学生参与“家务劳动”的情况,现用分层随机抽样的方法抽取4%的学生进行调查,则抽取的样本容量、抽取的高中生中参与“家务劳动”的人数分别为()A.2 750,200B.2 750,110C.1 120,110D.1 120,200答案(1)B(2)C解析(1)在这14天中,1日、3日、12日、13日的空气质量为良,共4天,故A正确.14天中空气质量指数的中位数为86+1212=103.5,故B错误.从2日到5日,空气质量指数越来越高,故空气质量越来越差,C正确.观察题图可得,9日至11日空气质量指数偏差最小,因此方差最小,D正确.综上知,说法不正确的是B.(2)学生总数为15 500+5 000+7 500=28 000(人),由于抽取4%的学生进行调查,则抽取的样本容量为28 000×4%=1 120.故高中生应抽取的人数为5 000×4%=200,而抽取的高中生中参与“家务劳动”的比率为0.55,故抽取的高中生中参与“家务劳动”的人数为200×0.55=110.探究提高 1.解题的关键是理解统计图表的含义,从中提取数字信息,平均数、众数、中位数描述数据的集中趋势,方差与标准差描述数据的波动大小,标准差、方差越小,数据的离散程度越小,越稳定.2.进行分层随机抽样的相关计算时,常用到的两个关系:(1)样本容量n总体的个数N=该层抽取的个体数该层的个体数;(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.【训练1】(1)以下数据为参加数学竞赛决赛的15人的成绩:(单位:分)78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位数是()A.90B.90.5C.91D.91.5(2)(多选) 2020年上半年,中国养猪企业受猪价高位的利好影响,大多收获史上最佳半年报业绩,部分企业半年报营业收入同比增长超过1倍.某养猪场抓住机遇,加大了生猪养殖规模,为了检测生猪的养殖情况,该养猪场对2 000头生猪的体重(单位:kg)进行了统计,得到如图所示的频率分布直方图,则下列说法正确的是()A.这2 000头生猪体重的众数为160 kgB.这2 000头生猪中体重不低于200 kg的有80头C.这2 000头生猪体重的中位数落在区间[140,160)内D.这2 000头生猪体重的平均数为152.8 kg答案(1)B(2)BCD解析(1)把成绩按从小到大的顺序排列为:56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为15×80%=12,所以这15人成绩的第80百分位数是90+912=90.5.(2)由频率分布直方图可知,[140,160)这一组的数据对应的小长方形最高,所以这2 000头生猪的体重的众数为150 kg,A错误;这2 000头生猪中体重不低于200 kg的有0.002×20×2 000=80(头),B正确;因为生猪的体重在[80,140)内的频率为(0.001+0.004+0.01)×20=0.3,在[140,160)内的频率为0.016×20=0.32,且0.3+0.32=0.62>0.5,所以这2 000头生猪体重的中位数落在区间[140,160)内,C正确;这2 000头生猪体重的平均数为(0.001×90+0.004×110+0.01×130+0.016×150+0.012×170+0.005×190+0.002×210)×20=152.8(kg),D正确.考向2用样本的频率分布估计总体分布【例2】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.探究提高 1.平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们所反映的情况有着重要的实际意义.2.在例2中,抓住频率分布直方图各小长方形的面积之和为1,这是求解的关键;本题易混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.【训练2】(多选)为了更好地支持中小型企业的发展,某市决定对部分企业的税收进行适当的减免,现调查了当地100家中小型企业年收入(单位:万元)情况,并根据所得数据画出了如图所示的频率分布直方图,则下列结论正确的是()A.样本在区间[500,700]内的频数为18B.如果规定年收入在300万元以内的企业才能享受减免税收政策,估计有30%的当地中小型企业能享受到减免税收政策C.样本的中位数大于350万元D.可估计当地中小型企业年收入的平均数超过400万元(同一组中的数据用该组区间的中点值作代表)答案ABC解析依题意,(0.001+0.002+0.002 6×2+a+0.000 4)×100=1,所以a=0.001 4.对于A,样本在[500,700]内的频率为(0.001 4+0.000 4)×100=0.18,故频数为0.18×100=18,故A正确.对于B,年收入在300万元以内的频率为(0.001+0.002)×100=0.3,故B正确. 对于C,设样本的中位数为x,易知中位数位于[300,400]内,则0.3+(x-300)×0.002 6=0.5,解得x≈376.9,376.9>350,故C正确.因为样本的平均数为150×0.1+250×0.2+350×0.26+450×0.26+550×0.14+650×0.04=376<400,所以估计当地中小型企业年收入的平均数小于400万元,故D 错误. 热点二 回归分析【例3】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响,对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据进行了初步处理,得到如图所示散点图及一些统计量的值.x -y -w -∑8i =1(x i -x -)2∑8i =1(w i -w -)2∑8i =1(x i -x -)·(y i -y -) ∑8i =1(w i -w -)·(y i -y -) 46.65636.8289.8 1.61 469108.8表中w i =x i ,w -=18∑8i =1w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个更适宜作为年销售量y 关于年宣传费x 的回归方程?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程.(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为:β^=∑ni =1(u i -u -)(v i -v -)∑n i =1(u i -u -)2,α^=v --β^u -.解 (1)由散点图可以判断,y =c +d x 更适宜作为年销售量y 关于年宣传费x 的回归方程.(2)易知w =x ,则y ^=d ^w +c ^.由题意得d ^=∑8i =1(w i -w -)(y i -y -)∑8i =1(w i -w -)2=108.81.6=68,所以c ^=y --d ^w -=563-68×6.8=100.6.所以y 关于w 的线性回归方程为y ^=100.6+68w , 所以y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2)知,当x =49时,年销售量y 的预报值为y ^=100.6+6849=576.6,年利润z 的预报值为z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x )-x =-x +13.6x +20.12,所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大. 探究提高 1.求回归直线方程的关键及实际应用 (1)关键:正确理解b ^,a ^的计算公式并准确地计算.(2)实际应用:在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值. 2.相关系数(1)当r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关. (2)当|r |>0.75时,认为两个变量具有较强的线性相关关系.【训练3】 (多选)我国5G 技术研发试验在2016~2018年进行,分为5G 关键技术试验、5G 技术方案验证和5G 系统验证三个阶段.2020年初以来,5G 技术在我国已经进入高速发展的阶段,5G 手机的销量也逐渐上升.某手机商城统计了2021年5个月5G 手机的实际销量,如下表所示:若y 与x 线性相关,且求得线性回归方程为y ^=45x +5,则下列说法正确的是( ) A.a =142 B.y 与x 正相关C.y 与x 的相关系数为负数D.2021年7月该手机商城的5G 手机销量约为365部 答案 AB解析 x -=1+2+3+4+55=3,y -=50+96+a +185+2275=558+a 5,因为点(x -,y -)在回归直线上,所以558+a5=45×3+5,解得a =142,所以选项A 正确;从表格数据看,y 随x 的增大而增大,所以y 与x 正相关,所以选项B 正确;因为y 与x 正相关,所以y 与x 的相关系数为正数,所以选项C 错误;2021年7月对应的月份编号x =7,当x =7时,y ^=45×7+5=320,所以2021年7月该手机商城的5G 手机销量约为320部,所以选项D 错误.故选AB.热点三 独立性检验【例4】 为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO 2浓度(单位:μg/m 3),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO 2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:(3)根据(2)中的列联表,依据小概率值α=0.01的χ2独立性检验,能否认为该市一天空气中PM2.5浓度与SO 2浓度有关? 附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),解 (1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO 2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO 2浓度不超过150的概率的估计值为64100=0.64. (2)根据抽查数据,可得2×2列联表:(3)零假设为H 0:该市一天空气中PM2.5浓度与SO 2浓度无关.根据(2)的列联表得χ2=100×(64×10-16×10)280×20×74×26≈7.484>6.635=x 0.01.根据小概率值α=0.01的χ2独立性检验,我们推断H 0不成立,即认为该市一天空气中PM2.5浓度与SO 2浓度有关,此推断犯错误的概率不超过0.01. 探究提高 1.独立性检验的一般步骤 (1)根据样本数据列成2×2列联表; (2)根据公式χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),计算χ2的值;(3)查表比较χ2与临界值的大小关系,作统计判断.2.χ2的值越大,对应假设事件H 0成立(两类变量相互独立)的概率越小,H 0不成立的概率越大.【训练4】 甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)依据小概率值α=0.01的χ2独立性检验,能否认为甲机床的产品质量与乙机床的产品质量有差异?附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),α 0.050 0.010 0.001 x α3.8416.63510.828解 (1)根据2×2列联表知:甲机床生产的产品中一级品的频率为150200=75%, 乙机床生产的产品中一级品的频率为120200=60%.(2)零假设为H 0:甲机床的产品质量与乙机床的产品质量没有差异.由2×2列联表,得χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=400×(150×80-120×50)2270×130×200×200=40039≈10.256>6.635=x 0.01.根据小概率值α=0.01的χ2独立性检验,我们推断H 0不成立,即认为甲机床的产品质量与乙机床的产品质量有差异,此推断犯错误的概率不超过0.01.一、选择题1.设一组样本数据x 1,x 2,…,x n 的方差为0.01,则数据10x 1,10x 2,…,10x n 的方差为( ) A.0.01 B.0.1 C.1 D.10答案 C解析 10x 1,10x 2,…,10x n 的方差为102×0.01=1.2.为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为y ^=b ^x +a ^.已知∑10i =1x i =225,∑10i =1y i =1 600,b ^=4.该班某学生的脚长为24,据此估计其身高为( ) A.160 B.163 C.166 D.170答案 C解析 ∵x -=110∑10i =1x i =110×225=22.5,y -=110∑10i =1y i=160, ∴a ^=y --b ^x -=160-4×22.5=70, ∴回归直线方程为y ^=4x +70. 因此估计其身高y ^=4×24+70=166.3.从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )A.10B.18C.20D.36答案 B解析 因为直径落在区间[5.43,5.47)内的频率为0.02×(6.25+5.00)=0.225,所以零件的个数为0.225×80=18.4.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15 ℃,B 点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是()A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个答案 D解析由雷达图易知A,C正确;七月的平均最高气温超过20 ℃,平均最低气温约为12 ℃,一月的平均最高气温约为6 ℃,平均最低气温约为2 ℃,所以七月的平均温差比一月的平均温差大,B正确;由雷达图知平均最高气温超过20 ℃的月份有3个月,D错误.5.(多选) 5G时代已经到来,5G的发展将直接带动包括运营、制造、服务在内的通信行业整体的快速发展,进而对GDP增长产生直接贡献,并通过产业间的关联效应,间接带动国民经济各行业的发展,创造出更多的经济增加值.如图,某单位结合近年数据,对今后几年的5G经济产出作出预测.由上图提供的信息可知()A.运营商的经济产出逐年增加B.设备制造商的经济产出前期增长较快,后期放缓C.设备制造商在各年的总经济产出中一直处于领先地位D.信息服务商与运营商的经济产出的差距有逐步拉大的趋势 答案 ABD解析 对于A ,由图知,运营商的经济产出逐年增加,故A 正确;对于B ,由图知,设备制造商的经济产出在2020~2023年间增长较快,后几年增长逐渐趋于平缓,故B 正确;对于C ,由图可知,设备制造商在各年的总经济产出中在前期处于领先地位,而后期是信息服务商处于领先地位,故C 错误;对于D ,由图知,在2020~2025年间信息服务商与运营商的经济产出的差距不大,后几年中信息服务商的经济产出增长速度明显高于运营商的经济产出增长速度,两者间的差距有逐步拉大的趋势,故D 正确.综上所述,选ABD.6.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x -,方差为s 2,则( )A.x -=4,s 2<2B.x -=4,s 2>2 C.x ->4,s 2<2 D.x ->4,s 2>2答案 A解析 ∵某7个数的平均数为4,∴这7个数的和为4×7=28.∵加入一个新数据4,∴x -=28+48=4.又∵这7个数的方差为2,且加入一个新数据4,∴这8个数的方差s 2=7×2+(4-4)28=74<2,故选A.二、填空题 7.给出如下列联表非 30 50 80 合计5060110根据独立性检验,__________在犯错误的概率不超过0.01的前提下认为“高血压与患心脏病有关”(填“能”或“不能”). 答案 能解析 零假设为H 0:高血压与患心脏病无关. 由列联表中的数据可得 χ2=110×(20×50-10×30)230×80×50×60≈7.486>6.635=x 0.01,根据小概率值α=0.01的χ2独立性检验,我们推断H 0不成立,即认为高血压与患心脏病有关,此推断犯错误的概率不超过0.01,即能在犯错误的概率不超过0.01的前提下,认为高血压与患心脏病有关.8.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,测试成绩(单位:分)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x -,则m e ,m 0与x -的大小关系是________.答案 m 0<m e <x -解析 由图可知,30名学生的得分情况依次为得3分的有2人,得4分的有3人,得5分的有10人,得6分的有6人,得7分的有3人,得8分的有2人,得9分的有2人,得10分的有2人.中位数为第15、16个数(分别为5、6)的平均数,即m e =5.5.5出现的次数最多,故m 0=5,x -=2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97.于是得m 0<m e <x -.9.下面的折线图给出的是甲、乙两只股票在某年中每月的收盘价格,已知股票甲的极差是6.88元,标准差为2.04元;股票乙的极差为27.47元,标准差为9.63元,根据这两只股票在这一年中的波动程度,给出下列结论:①股票甲在这一年中波动相对较小,表现的更加稳定;②购买股票乙风险高但可能获得高回报;③股票甲的走势相对平稳,股票乙的收盘价格波动较大;④两只股票在全年都处于上升趋势.其中正确的结论是________(填序号).答案 ①②③解析 由题意可知,甲的标准差为2.04元,乙的标准差为9.63元,可知股票甲在这一年中波动相对较小,表现的更加稳定,故①正确;甲的极差是6.88元,乙的极差为27.47元,可知购买股票乙风险高但可能获得高回报,故②正确;通过折线图可知股票甲的走势相对平稳,股票乙的收盘价格波动较大,故③正确;通过折线图可得乙在6月到8月明显是下降趋势,故④错误. 三、解答题10.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:性别对该商场的服务 合计满意不满意(1)分别估计男、女顾客对该商场服务满意的概率;(2)依据小概率值α=0.05的χ2独立性检验,能否认为男、女顾客对该商场服务的评价有差异?附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解 (1)由调查数据,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6. (2)零假设为H 0:男、女顾客对该商场服务的评价没有差异. 由列联表中的数据,得 χ2=100×(40×20-30×10)250×50×70×30≈4.762>3.841=x 0.05.根据小概率值α=0.05的χ2独立性检验,我们推 断H 0不成立,即认为男、女顾客对商场服务的评价有差异,此推断犯错误的概率不大于0.05.11.某互联网公司为了确定下季度的前期广告投入计划,收集了近6个月广告投入量x (单位:万元)和收益y (单位:万元)的数据如表:他们分别用两种模型①y =bx +a ,②y =a e bx 进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值.x -y -∑6i =1x i y i∑6i =1x 2i7301 464.24 364(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由; (2)残差绝对值大于2的数据被认为是异常数据,需要剔除. (ⅰ)剔除异常数据后,求出(1)中所选模型的回归方程; (ⅱ)若广告投入量x =18,则该模型收益的预报值是多少?附:对于一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^=b ^x +a ^的斜率和截距的最小二乘估计分别为:b ^=∑n i =1(x i -x -)(y i -y -)∑n i =1(x i -x -)2=∑ni =1x i y i -nx -·y -∑n i =1x 2i -n ·x -2,a ^=y --b ^x -. 解 (1)由于模型①残差波动小,应该选择模型①. (2)(ⅰ)剔除异常数据,即3月份的数据, 剩下数据的平均数为x -=15×(7×6-6)=7.2,y -=15×(30×6-31.8)=29.64,∑5i =1x i y i -5x -·y -=206.4,∑5i =1x 2i -5·x -2=68.8. ∴b ^=206.468.8=3,a ^=y --b ^x -=29.64-3×7.2=8.04.∴所选模型的回归方程为y ^=3x +8.04. (ⅱ)若广告投入量x =18,则该模型收益的预报值是3×18+8.04=62.04(万元).12.(多选)2020年7月国家统计局发布了我国2020年上半年国内经济数据,图1为国内三大产业生产总值的比重,图2为第三产业中各行业生产总值的比重.以下关于我国2020年上半年经济数据的说法正确的是()A.在第三产业中,“批发和零售业”与“金融业”的生产总值之和同“其他服务业”的生产总值基本持平B.若“租赁和商务服务业”生产总值为15 000亿元,则“房地产业”生产总值为32 500亿元C.若“金融业”的生产总值为42 000亿元,则第三产业生产总值为262 500亿元D.若“金融业”的生产总值为42 000亿元,则第一产业生产总值为45 000亿元答案ABC解析对于选项A,在第三产业中,“批发和零售业”与“金融业”的生产总值之和占比为16%+16%=32%,“其他服务业”的生产总值占比为32%,所以“批发和零售业”与“金融业”的生产总值之和同“其他服务业”的生产总值基本持平,故选项A正确.对于选项B,若“租赁和商务服务业”生产总值为15 000亿元,在第三产业中,因为“租赁和商务服务业”生产总值占比为6%,所以第三产业生产总值为15 000=250 000(亿元),又“房地产业”生产总值占比为13%,所以“房地产6%业”生产总值为13%×250 000=32 500(亿元),故选项B正确.对于选项C ,在第三产业中,若“金融业”的生产总值为42 000亿元,因为“金融业”生产总值占比为16%,所以第三产业生产总值为42 00016%=262 500(亿元),故选项C 正确.对于选项D ,第三产业生产总值在三大产业中占比为57%,第一产业生产总值在三大产业中占比为6%,由C 选项知第三产业生产总值为262 500亿元,所以第一产业生产总值为262 50057%×6%≈27 632(亿元),所以选项D 错误.13.由于受到网络电商的冲击,某品牌的洗衣机在线下的销售受到影响,承受了一定的经济损失,现将A 地区200家实体店该品牌洗衣机的月经济损失统计如图所示,估算月经济损失的平均数为m ,中位数为n ,则m -n =________.答案 360解析 第一块小矩形的面积S 1=0.3,第二块小矩形的面积S 2=0.4,故n =2 000+0.5-0.30.000 2=3 000;又第四、五块小矩形的面积均为S =0.06,故a =12 000[1-(0.3+0.4+0.06×2)]=0.000 09,所以m =1 000×0.3+3 000×0.4+5 000×0.18+(7 000+9 000)×0.06=3 360,故m -n =360.14.某公司为了预测下月产品销售情况,找出了近7个月的产品销售量y (单位:万件)的统计表:月份代码t 1 2 3 4 5 6 7 销售量y (万件)y 1y 2y 3y 4y 5y 6y 7但其中数据污损不清,经查证∑7i =1y i =9.32,∑7i =1t i y i =40.17,∑7i =1(y i -y -)2=0.55.。
高中统计案例试题及答案
高中统计案例试题及答案一、选择题1. 以下哪个选项是描述数据集中趋势的统计量?A. 方差B. 标准差C. 平均数D. 极差答案:C2. 一组数据的中位数是所有数据排序后位于中间位置的数值,如果数据个数为奇数,则中位数是:A. 第一个数据B. 最后一个数据C. 位于中间位置的数值D. 无法确定答案:C3. 以下哪个统计图适合展示时间序列数据的变化趋势?A. 条形图B. 饼图C. 折线图D. 散点图答案:C二、填空题4. 某班级有30名学生,他们的数学成绩分别为:70, 85, 90, 75, 95, 80, 85, 70, 80, 90, 85, 95, 75, 70, 80, 90, 85, 95, 75, 70, 80, 85, 90, 95, 75。
这组数据的平均数是____。
答案:825. 如果一组数据的方差是25,那么它的标准差是____。
答案:5三、简答题6. 描述统计学中的“样本”和“总体”的概念,并举例说明。
答案:在统计学中,“总体”指的是研究对象的全体,而“样本”是从总体中随机抽取的一部分个体。
例如,如果我们想要了解全国高中生的数学成绩水平,全国所有高中生的数学成绩就是总体,而如果我们随机抽取了1000名高中生的数学成绩进行研究,这1000名高中生的数学成绩就是我们的样本。
四、计算题7. 某工厂生产了一批零件,其长度的测量数据如下:20, 22, 21, 23, 20, 21, 22, 21, 22, 23。
请计算这组数据的平均数、中位数、方差和标准差。
答案:平均数 = (20+22+21+23+20+21+22+21+22+23) / 10 = 21.5中位数 = (21+22) / 2 = 21.5方差 = [(20-21.5)² + (22-21.5)² + ... + (23-21.5)²] / 10 = 1.65标准差= √1.65 ≈ 1.29结束语:通过上述试题及答案,我们可以看出,统计学是一门应用广泛的学科,它可以帮助我们更好地理解和分析数据。
(好题)高中数学选修1-2第一章《统计案例》测试(含答案解析)
一、选择题1.某人射击一次命中目标的概率为12,且每次射击相互独立,则此人射击 7次,有4次命中且恰有3次连续命中的概率为( ) A .3761()2CB .2741()2AC .2741()2CD .1741()2C2.某校从6名学生干部(其中女生4人,男生2人)中选3人参加学校的汇演活动,在女生甲被选中的情况下,男生乙也被选中的概率为( ) A .12B .25C .35D .453.某市通过随机询问100名不同年级的学生是否能做到“扶跌倒老人”,得到如下列联表:则下列结论正确的是( ) 附参照表:参考公式:22()()()()()n ad bc k a b c d a c b d -=++++,其中n a b c d =+++A .在犯错误的概率不超过90%的前提下,认为“学生能否做到‘扶跌倒老人’与年级高低有关”B .在犯错误的概率不超过1%的前提下,“学生能否做到‘扶跌倒老人’与年级高低无关”C .有90%以上的把握认为“学生能否做到‘扶跌倒老人’与年级高低有关”D .有90%以上的把握认为“学生能否做到‘扶跌倒老人’与年级高低无关”4.一个盒子里有7个红球,3个白球,从盒子里先取一个小球,然后不放回的再从盒子里取出一个小球,若已知第1个是红球的前提下,则第2个是白球的概率是( ) A .310B .13C .710D .235.某光学仪器厂生产的透镜,第一次落地打破的概率为0.3;第一次落地没有打破,第二次落地打破的概率为0.4;前两次落地均没打破,第三次落地打破的概率为0.9.则透镜落地3次以内(含3次)被打破的概率是( ).A .0.378B .0.3C .0.58D .0.9586.若对于变量x 的取值为3,4,5,6,7时,变量y 对应的值依次分别为4.0,2.5,-0.5,-1,-2;若对于变量u 的取值为1,2,3,4时,变量v 对应的值依次分别为2,3,4,6,则变量x 和y ,变量u 和v 的相关关系是( ) A .变量x 和y 是正相关,变量u 和v 是正相关 B .变量x 和y 是正相关,变量u 和v 是负相关 C .变量x 和y 是负相关,变量u 和v 是负相关 D .变量x 和y 是负相关,变量u 和v 是正相关 7.随机变量a 服从正态分布()21,N σ,且()010.3000P a <<=.已知0,1a a >≠,则函数1xy a a =+-图象不经过第二象限的概率为( ) A .0.3750 B .0.3000C .0.2500D .0.20008.抛掷红、黄两颗骰子,当红色骰子的点数为4或6时,两颗骰子的点数之积大于20的概率是( ) A .35B .14C .12D .139.对具有线性相关关系的变量x ,y 有一组观测数据(),i i x y (1,2,,8i =),其回归直线方程是1ˆ8ˆybx =+,且1238x x x x ++++=()123826y y y y ++++=,则实数ˆb的值是( ) A .116B .14C .13D .1210.通过随机询问72名不同性别的学生在购买食物时是否看营养说明,得到如下列联表:参考公式:22()()()()()n ad bc K a b c d a c b d -=++++则根据以上数据:A .能够以99.5%的把握认为性别与读营养说明之间无关系;B .能够以99.9%的把握认为性别与读营养说明之间无关系;C .能够以99.5%的把握认为性别与读营养说明之间有关系;D .能够以99.9%的把握认为性别与读营养说明之间有关系;11.将两枚质地均匀的骰子各掷一次,设事件A ={两个点数互不相同},B ={出现一个5点},则()/P B A =( ) A .13B .518C .16D .1412.抛掷一枚质地均匀的骰子两次,记事件{两次的点数均为奇数},{两次的点数之和小于},则( )A .B .C .D .二、填空题13.甲、乙两位同学进行篮球三分球投篮比赛,甲每次投中的概率为13,乙每次投中的概率为12,每人分别进行三次投篮.乙恰好比甲多投进2次的概率是______. 14.两个实习生加工一个零件,产品为一等品的概率分别为23和34,则这两个零件中恰有一个一等品的概率为__________.15.下列命题中,正确的命题有__________.①回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,且至少过一个样本点;②将一组数据的每个数据都加一个相同的常数后,方差不变;③用相关指数2R 来刻面回归效果;表示预报变量对解释变量变化的贡献率,越接近于1,说明模型的拟合效果越好;④若分类变量X 和Y 的随机变量2K 的观测值K 越大,则“X 与Y 相关”的可信程度越小;⑤.对于自变量x 和因变量y ,当x 取值一定时,y 的取值具有一定的随机性,x ,y 间的这种非确定关系叫做函数关系;⑥.残差图中残差点比较均匀的地落在水平的带状区域中,说明选用的模型比较合适; ⑦.两个模型中残差平方和越小的模型拟合的效果越好. 16.下列4个命题:①为了了解800名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔为40;②四边形ABCD 为长方形,2AB =,1BC =,O 为AB 中点,在长方形ABCD 内随机取一点P ,取得的P 点到O 的距离大于1的概率为12π-; ③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 2y x =的图象;④已知回归直线的斜率的估计值为1.23,样本点的中心为()4,5,则回归直线方程为1.230.08y x =+.其中正确的命题有__________.(填上所有正确命题的编号) 17.下列说法正确的个数有_________(1)已知变量x 和y 满足关系23y x =-+,则x 与y 正相关;(2)线性回归直线必过点(),x y ;(3)对于分类变量A 与B 的随机变量2k ,2k 越大说明“A 与B 有关系”的可信度越大 (4)在刻画回归模型的拟合效果时,残差平方和越小,相关指数2R 的值越大,说明拟合的效果越好.18.现有A B 、两队参加关于“十九大”知识问答竞赛,每队3人,每人回答一个问题,答对者为本队赢一分,答错得0分.A 队中每人答对的概率均为23,B 队中3人答对的概率分别为221,,332,且各答题人答题正确与否之间互无影响,若事件M 表示“A 队得2分”,事件N 表示“B 队得1分”,则()P MN =______.19.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”__________.(填有或没有)附:()()()()()22n ad bc K a b c d a c b d -=++++20.排球比赛实行“五局三胜制”.某次比赛中,中国女排和M 国女排相遇,统计以往数据可知,每局比赛中国女排获胜的概率为23,M 国女排获胜的概率为13,则中国女排在先输一局的情况下最终获胜的概率为________.三、解答题21.一个口袋中有4个红球和3个黑球.(1)从口袋中随机地连续取出三个球,取出后不放回,求: (i )三个球中有两个红球一个黑球的概率;(ii )第二次取出的是红球且第三次取出的也是红球的概率.(2)从口袋中随机地连续取出三个球,取出后放回,求至少有两个是红球且第三个是红球的概率22.为激活国内消费布场,挽回疫情造成的损失,国家出台一系列的促进国内消费的优惠政策,某机构从某一电商的线上交易大数据中来跟踪调查消费者的购买力,界定3至8月份购买商品在5000元以上人群属“购买力强人群”,购买商品在5000元以下人群属“购买力弱人群”.现从电商平台消费人群中随机选出200人,发现这200人中属购买力强的人数占80%,并将这200人按年龄分组,记第1组[)15,25,第2组[)25,35,第3组[)35,45,第4组[)45,55,第5组[)55,65,得到的频率分布直方图,如图所示.(1)求出频率分布直方图中的a 值和这200人的平均年龄;(2)从第2,3,5组中用分层抽样的方法抽取12人,并再从这12人中随机抽取3人进行电话回访,求这三人恰好属于不同组别的概率;(3)把年龄在第1,2,3组的居民称为青少年组,年龄在第4,5组的居民称为中老年组,若选出的200人中“购买力弱人群”的中老年人有20人,问是否有99%的把握认为是否“购买力强人群”与年龄有关? 附:()20P K K 0.150 0.100 0.050 0.025 0.010 0.005 0.001 0k2.0722.7063.8415.0246.6357.87910.828()()()()()2n ad bc K a b c d a c b d -=++++,n a b c d =+++ 23.在我国抗疫期间,素有“南抖音,北快手”之说的小视频除了给人们带来生活中的快乐外,更在于传递了一种正能量,为抗疫起到了积极的作用,但一个优秀的作品除了需要有很好的素材外,更要有制作上的技术要求,某同学学习利用“快影”软件将已拍摄的素材进行制作,每次制作分三个环节来进行,其中每个环节制作合格的概率分别为34,45,23,只有当每个环节制作都合格才认为一次成功制作,该小视频视为合格作品. (1)求该同学进行3次制作,恰有一次合格作品的概率;(2)若该同学制作10次,其中合格作品数为X ,求X 的数学期望与方差;(3)该同学掌握技术后制作的小视频被某广告公司看中,聘其为公司做广告宣传,决定试用一段时间,每天制作小视频(注:每天可提供素材制作个数至多40个),其中前7天制作合格作品数y 与时间t 如下表:(第t 天用数字t 表示)其中合格作品数(y )与时间(t )具有线性相关关系,求y 关于t 的线性回归方程(精确到0.01),并估算第14天能制作多少个合格作品(四舍五入取整)?(参考公式()()()1221121niii nnin i i ii ii x y nx y b n x x x xy x xy ====-=---=-∑∑∑∑,a y bx =-,参考数据:71163i ii t y==∑.)24.高三(1)班班主任李老师为了了解本班学生喜爱中国古典文学是否与性别有关,对全班50人进行了问卷调查,得到如下列联表:已知从全班50人中随机抽取1人,抽到喜欢中国古典文学的学生的概率为35. (1)请将上面的列联表补充完整;(2)是否有99.5%的把握认为喜欢中国古典文学与性别有关?请说明理由;(3)已知在喜欢中国古典文学的10位男生中,1A ,2A ,3A 还喜欢数学,1B ,2B 还喜欢绘画,1C ,2C 还喜欢体育.现从喜欢数学、绘画和体育的男生中各选出1名进行其他方面的调查,求1B 和1C 不全被选中的概率.参考公式及数据:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.2()P K k≥0.150.100.050.0250.0100.0050.001 k 2.072 2.706 3.841 5.024 6.6357.87910.82825.某小区停车场的收费标准为:每车每次停车时间不超过2小时免费,超过2小时的部分每小时收费1元(不足1小时的部分按1小时计算).现有甲乙两人独立来停车场停车(各停车一次),且两人停车时间均不超过5小时,设甲、乙两人停车时间(小时)与取车概率如表所示:停车时间取车概率停车人员(0,2](2,3](3,4](4,5]甲12x x x乙1613y0(1)求甲、乙两人所付车费相同的概率;(2)设甲、乙两人所付停车费之和为随机变量ξ,求ξ的分布列和数学期望()Eξ. 26.某大型运动会的组委会为了搞好接待工作,招募了30名男志愿者和20名女志愿者.调查发现,这些志愿者中有部分志愿者喜爱运动,另一部分志愿者不喜欢运动,并得到了如下等高条形图和22⨯列联表:喜爱运动不喜爱运动总计男生a b30女生c d20总计50(1)求出列联表中a 、b 、c 、d 的值;(2)是否有99%的把握认为喜爱运动与性别有关?附:参考公式和数据:22()()()()()n ad bc K a b c d a c b d -=++++,(其中n a b c d =+++)【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】由于射击一次命中目标的概率为12,所以关键先求出射击7次有4次命中且恰有3次连续命中的所有可能数,即根据独立事件概率公式得结果. 【详解】因为射击7次有4次命中且恰有3次连续命中有24A 种情况,所以所求概率为7241A 2⎛⎫⋅ ⎪⎝⎭.选B.【点睛】本题考查排列组合以及独立事件概率公式,考查基本分析求解能力,属中档题.2.B解析:B 【分析】先求出女生甲被选中的情况下的基本事件总数1215C C n =,再求出在女生甲被选中的情况下,男生乙也被选中包含的基本事件个数为2124C C m =,结合条件概率的计算方法,可得mP n=. 【详解】女生甲被选中的情况下,基本事件总数1215C C 10n ==,在女生甲被选中的情况下,男生乙也被选中包含的基本事件个数为2124C C 4m ==,则在女生甲被选中的情况下,男生乙也被选中的概率为42105m P n ===. 故选B. 【点睛】本题考查了条件概率的求法,考查了学生的计算求解能力,属于基础题.3.C解析:C 【解析】分析:根据列联表中数据,利用公式求得2 3.03K ≈,参照临界值表即可得到正确结论. 详解:由公式()()()()()22n d bc k a b c d a c b d -=++++可得2 3.03K ≈,参照临界值表,2.7063.030 3.841<<,∴0090以上的把握认为,“学生能否做到‘扶跌倒老人’与年级高低有关”,故选C.点睛:本题考查了独立性检验的应用,属于基础题. 独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.4.B解析:B 【解析】分析:设已知第一次取出的是红球为事件A ,第二次是白球为事件B ,先求出P AB ()的概率,然后利用条件概率公式进行计算即可.详解:设已知第一次取出的是红球为事件A ,第二次是白球为事件B .则由题意知,77371010930PA P AB ⨯===⨯(),(), 所以已知第一次取出的是白球,则第二次也取到白球的概率为7130|.7310PB A ()== . 故选B .点睛:本题主要考查条件概率的求法,熟练掌握条件概率的概率公式是关键. 5.D解析:D 【详解】分析:分别利用独立事件的概率公式求出恰在第一次、恰在第二次、恰在第三次落地打破的概率,然后由互斥事件的概率公式求解即可.详解:透镜落地3次,恰在第一次落地打破的概率为10.3P =, 恰在第二次落地打破的概率为20.70.40.28P =⨯=, 恰在第三次落地打破的概率为30.70.60.90.378P =⨯⨯=, ∴落地3次以内被打破的概率1230.958P P P P =++=.故选D .点睛:本题主要考查互斥事件、独立事件的概率公式,属于中档题. 解答这类综合性的概率问题一定要把事件的独立性、互斥性结合起来,要会对一个复杂的随机事件进行分析,也就是说能把一个复杂的事件分成若干个互斥事件的和,再把其中的每个事件拆成若干个相互独立的事件的积,这种把复杂事件转化为简单事件,综合事件转化为单一事件的思想方法在概率计算中特别重要.6.D解析:D 【解析】变量x 增加,变量y 减少,所以变量x 和y 是负相关;变量u 增加,变量v 增加,所以变量u 和v 是正相关,因此选D.7.C解析:C 【解析】1x y a a =+-图象不经过第二象限,11,2a a ∴-≤-∴≥,随机变量ξ服从正态分布()21,N σ,且()()()()1010.3000,120.3000,210.60000.20002P a P a P a <<=∴<<=∴>=-=,∴函数1x y a a =+-图象不经过第二象限的概率为0.20.250010.2=-,故选C. 8.D解析:D 【解析】抛掷红、黄两枚骰子,第一个数字代表红色骰子,第二个数字代表黄色骰子,当红色骰子的点数为4或6时有(4,1),(4,2),(4,3),(4,4),(4,5),(4,6),(6,1),(6,2),(6,3),(6,4),(6,5),(6,6)共12种, 两颗骰子的点数之积大于20的种数有(4,6),6,4),(6,5),(6,6)4种, 根据概率公式得,两颗骰子的点数之积大于20的概率41123P ==. 本题选择D 选项.点睛:有关古典概型的概率问题,关键是正确求出基本事件总数和所求事件包含的基本事件数.(1)基本事件总数较少时,用列举法把所有基本事件一一列出时,要做到不重复、不遗漏,可借助“树状图”列举.(2)注意区分排列与组合,以及计数原理的正确使用.9.C解析:C 【解析】 因为12386x x x x ++++=,12383y y y y ++++=所以33,48x y ==,所以样本中心点的坐标为33(,)48, 代入回归直线方程得848ˆ331b =⨯+,解得ˆ13b=,故选C. 10.C解析:C 【解析】2272(1682028)=8.427.87944283636K ⨯⨯-⨯≈⨯⨯⨯>∴性别和读营养说明之间有99.5%的可能性. 本题选择C 选项.11.A解析:A 【解析】由题意事件A={两个点数都不相同},包含的基本事件数是36−6=30, 事件B:出现一个5点,有10种,∴()101303|P B A ==, 本题选择A 选项.点睛:条件概率的计算方法:(1)利用定义,求P (A )和P (AB ),然后利用公式进行计算;(2)借助古典概型概率公式,先求事件A 包含的基本事件数n (A ),再求事件A 与事件B 的交事件中包含的基本事件数n (AB ),然后求概率值.12.D解析:D 【解析】 由题意得,两次的点数均为奇数且和小于的情况有,则,故选D.二、填空题13.;【分析】将事件拆分为乙投进3次甲投进1次和乙投进2次甲投进0次再根据二项分布的概率计算公式和独立事件的概率计算即可求得【详解】根据题意甲和乙投进的次数均满足二项分布且甲投进和乙投进相互独立;根据题解析:16; 【分析】将事件拆分为乙投进3次,甲投进1次和乙投进2次,甲投进0次,再根据二项分布的概率计算公式和独立事件的概率计算即可求得. 【详解】根据题意,甲和乙投进的次数均满足二项分布,且甲投进和乙投进相互独立; 根据题意:乙恰好比甲多投进2次,包括乙投进3次,甲投进1次和乙投进2次,甲投进0次.则乙投进3次,甲投进1次的概率为3213112123318C ⎛⎫⎛⎫⨯⨯⨯= ⎪ ⎪⎝⎭⎝⎭;乙投进2次,甲投进0次的概率为232311212239C ⎛⎫⎛⎫⎛⎫⨯⨯= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭.故乙恰好比甲多投进2次的概率为111 1896+=. 故答案为:16. 【点睛】本题考查二项分布的概率计算,属综合基础题.14.【分析】利用相互独立事件概率乘法公式直接求解【详解】解:两个实习生加工一个零件产品为一等品的概率分别为和这两个零件中恰有一个一等品的概率为:故答案为:【点睛】本题考查概率的求法考查相互独立事件概率乘 解析:512【分析】利用相互独立事件概率乘法公式直接求解. 【详解】解:两个实习生加工一个零件,产品为一等品的概率分别为23和34, ∴这两个零件中恰有一个一等品的概率为:2323511343412p ⎛⎫⎛⎫=⨯-+-⨯= ⎪ ⎪⎝⎭⎝⎭. 故答案为:512.【点睛】本题考查概率的求法,考查相互独立事件概率乘法公式等基础知识,考查运算求解能力,属于基础题.15.②⑥⑦【解析】①回归直线恒过样本点的中心可以不过任何一个样本点;②将一组数据中的每个数据都加上同一个常数后根据方差公式可知方差恒不变;③用相关指数来刻面回归效果;表示预报变量对解释变量变化的贡献率越解析:②⑥⑦ 【解析】①回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,可以不过任何一个样本点;②将一组数据中的每个数据都加上同一个常数后,根据方差公式可知方差恒不变; ③用相关指数2R 来刻面回归效果;表示预报变量对解释变量变化的贡献率,越接近于0,说明模型的拟合效果越好;④若分类变量X 和Y 的随机变量2K 的观测值K 越大,则“X 与Y 相关”的可信程度越大;⑤.对于自变量x 和因变量y ,当x 取值一定时,y 的取值具有一定的随机性,x ,y 间的这种非确定关系叫做相关关系;⑥.残差图中残差点比较均匀的地落在水平的带状区域中,说明选用的模型比较合适; ⑦.两个模型中残差平方和越小的模型拟合的效果越好. 故答案为:②⑥⑦16.③④【解析】①为了了解800名学生对学校某项教改试验的意见打算从中抽取一个容量为40的样本考虑用系统抽样则分段的间隔为800÷40=20故①错误;②已知如图所示:长方形面积为2以O 为圆心1为半径作圆解析:③④ 【解析】①为了了解800名学生对学校某项教改试验的意见, 打算从中抽取一个容量为40的样本,考虑用系统抽样, 则分段的间隔为800÷40=20,故①错误; ②已知如图所示:长方形面积为2,以O 为圆心,1为半径作圆, 在矩形内部的部分(半圆)面积为π2.因此取到的点到O 的距离大于1的概率22P 124ππ-==-; 故②错误; ③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 23sin263y x x ππ⎡⎤⎛⎫=-+= ⎪⎢⎥⎝⎭⎣⎦的图象, 故③正确,④∵回归直线为ˆybx a =+, 的斜率的值为1.23, ∴方程为 1.23ˆyx a =+, ∵直线过样本点的中心(4,5), ∴a=0.08,∴回归直线方程是为=1.23x+0.08; ∴故④正确. 故答案为:③④.17.3个【分析】直接利用线性回归直线的相关理论知识的应用求出结果【详解】(1)已知变量x 和y 满足关系y=-2x+3则x 与y 正相关;应该是:x 与y 负相关故错误(2)线性回归直线必过点线性回归直线必过中心点解析:3个 【分析】直接利用线性回归直线的相关理论知识的应用求出结果. 【详解】(1)已知变量x 和y 满足关系y=-2x+3,则x 与y 正相关;应该是:x 与y 负相关.故错误. (2)线性回归直线必过点(),x y ,线性回归直线必过中心点.故正确.(3)对于分类变量A 与B 的随机变量2k ,2k 越大说明“A 与B 有关系”的可信度越大. 根据课本上有原句,故正确.(4)在刻画回归模型的拟合效果时,残差平方和越小,相关指数R 2的值越大,说明拟合的效果越好.故正确,根据课本上有原句. 故填3个. 【点睛】本题主要考查了线性回归直线的应用,学生对知识的记忆能力,主要考查学生的运算能力和转换能力,属于中档题.18.【解析】队总得分为分为事件队总得分为分即队三人有一人答错其余两人答对其概率记队得分为事件事件即为队三人人答错其余一人答对则队得分队得一分即事件同时发生则故答案为 解析:1081【解析】“A 队总得分为2分”为事件M , A 队总得分为2分,即A 队三人有一人答错,其余两人答对,其概率()2232241339P M C ⎛⎫⎛⎫=⨯-=⎪ ⎪⎝⎭⎝⎭,记“B 队得1分”为事件N ,事件N 即为B 队三人2人答错,其余一人答对,则()221221221511133233233218P N ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫=-⨯⨯+⨯-⨯+⨯⨯-= ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭,A 队得2分B 队得一分,即事件,M N 同时发生,则()()()451091881P MN P M P N ==⨯=,故答案为1081.19.有【解析】根据表中数据计算观测值对照临界值知有95的把握认为南方学生和北方学生在选用甜品的饮食习惯方面有差异解析:有 【解析】根据表中数据,计算观测值22100(60102010)1003.8417030802021K ⨯-⨯==>⨯⨯⨯,对照临界值知,有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”。
高三复习数学63_统计案例(有答案)
6.3 统计案例一、选择题。
1. 对一个容量为N的总体抽取容量为π的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2<p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p32. 某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),⋯,[30,35),[35,40]时,所作的频率分布直方图是()A.B.C.D.3. 设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,⋯,n),用最小二乘法建立的回归方程为ŷ=0.85x−85.71,则下列结论中不正确的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x¯,y¯)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重比为58.79kg4. 已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.200,20B.100,20C.200,10D.100,105. 某公司10位员工的月工资(单位:千元)为x1,x2,⋯,x10,其均值和方差分别为x¯和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为()A.x¯,s2+1002B.x¯+100,s2+1002C.x¯,s2D.x¯+100,s26. 下图是根据部分城市某年6月份的平均气温(单位:∘C)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5∘C的城市个数为11,则样本中平均气温不低于25.5∘C的城市个数为()A.3B.6C.9D.12二、填空题。
高中数学第九章统计经典大题例题(带答案)
高中数学第九章统计经典大题例题单选题1、为保障食品安全,某监管部门对辖区内一家食品企业进行检查,现从其生产的某种产品中随机抽取100件作为样本,并以产品的一项关键质量指标值为检测依据,整理得到如下的样本频率分布直方图.若质量指标值在[25,35)内的产品为一等品,则该企业生产的产品为一等品的概率约为()A.0.38B.0.61C.0.122D.0.75答案:B×组距,即可得解.分析:利用频率=频率组距根据频率分布直方图可知,质量指标值在[25,35)内的概率P=(0.080+0.042)×5=0.122×5=0.61故选:B2、为了更好地支持“中小型企业”的发展,某市决定对部分企业的税收进行适当的减免,某机构调查了当地的中小型企业年收入情况,并根据所得数据画出了样本的频率分布直方图,下面三个结论:①样本数据落在区间[300,500)的频率为0.45;②如果规定年收入在500万元以内的企业才能享受减免税政策,估计有55%的当地中小型企业能享受到减免③样本的中位数为480万元.其中正确结论的个数为A.0B.1C.2D.3答案:D解析:根据直方图求出a=0.0025,求出[300,500)的频率,可判断①;求出[200,500)的频率,可判断②;根据中位数是从左到右频率为0.5的分界点,先确定在哪个区间,再求出占该区间的比例,求出中位数,判断③.由(0.001+0.0015+0,002+0.0005+2a)×100=1,a=0.0025,[300,500)的频率为(0.002+0.0025)×100=0.45,①正确;[200,500)的频率为(0.0015+0.002+0.0025)×100=0.55,②正确;[200,400)的频率为0.3,[200,500)的频率为0.55,,中位数在[400,500)且占该组的45×100=480,③正确.故中位数为400+0.5−0.30.25故选:D.小提示:本题考查补全直方图,由直方图求频率和平均数,属于基础题3、某地区对当地3000户家庭的当年所得年收入情况调查统计,年收入(单位:万元)的频率分布直方图如图所示,数据的分组依次为[2,4),[4,6),[6,8),[8,10],则年收入不超过6万元的家庭有( )A.900户B.600户C.300户D.150户分析:根据频率分布直方图求出[2,4)和[4,6)这两组的频率之和,用这个频率之和乘以样本总量3000即可的答案.由图可知,[2,4)和[4,6)这两组的频率之和为(0.05+0.1)×2=0.3,年收入不超过6万元的家庭有3000×0.3=900户.故选:A.4、新莽铜嘉量是由王莽国师刘歆等人设计制造的标准量器,它包括了龠(yuè)、合、升、斗、斛这五个容量单位.每一个量又有详细的分铭,记录了各器的径、深、底面积和容积.现根据铭文计算,当时制造容器时所用的圆周率分别为3.1547,3.1992,3.1498,3.2031,比《周髀算经》的“径一而周三”前进了一大步,则上面4个数据与祖冲之给出的约率(227≈3.1429)、密率(355113≈3.1416)这6个数据的中位数与极差分别为()A.3.1429,0.0615B.3.1523,0.0615C.3.1498,0.0484D.3.1547,0.0484答案:B分析:先对这6个数由小到大(或由大到小)排列,然后利用中位数和极差的定义求解即可所给6个数据由小到大排列依次为3.1416,3.1429,3.1498,3.1547,3.1992,3.2031,所以这6个数据的中位数为(3.1498+3.1547)÷2≈3.1523,极差为3.2031−3.1416=0.0615,故选:B.5、下表是某校校级联欢晚会比赛中12个班级的得分情况,则得分的30百分位数是()答案:D分析:根据百分位数的定义求解即可.12×30%=3.6,把12个班级的得分按照从小到大排序为7,7,8,9,9,10,10,10,11,13,13,14,可得30百分位数是第4个得分数,即9.故选:D6、某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图,90后从事互联网行业岗位分布条形图,则下列结论错误的是()注:90后指1990年及以后出生,80后指1980−1989年之间出生,80前指1979年及以前出生.A.互联网行业从业人员中从事技术和运营岗位的人数占总人数的三成以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.互联网行业中从事运营岗位的人数90后一定比80前多D.互联网行业中从事技术岗位的人数90后一定比80后多答案:D解析:根据整个互联网行业从业者年龄分布饼状图、90后从事互联网行业岗位分布条形图,对四个选项逐一分析,即可得出正确选项.对于选项A,因为互联网行业从业人员中,“90后”占比为56%,其中从事技术和运营岗位的人数占的比分别为39.6%和17%,则“90后”从事技术和运营岗位的人数占总人数的56%×(39.6%+17%)≈31.7%.“80前”和“80后”中必然也有从事技术和运营岗位的人,则总的占比一定超过三成,故选项A正确;对于选项B,因为互联网行业从业人员中,“90后”占比为56%,其中从事技术岗位的人数占的比为39.6%,则“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%.“80前”和“80后”中必然也有从事技术岗位的人,则总的占比一定超过20%,故选项B正确;对于选项C,“90后”从事运营岗位的人数占总人数的比为56%×17%≈9.5%,大于“80前”的总人数所占比3%,故选项C正确;选项D,“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%,“80后”的总人数所占比为41%,条件中未给出从事技术岗位的占比,故不能判断,所以选项D错误.故选:D.小提示:关键点点睛:本题考查利用扇形统计图和条形统计图解决实际问题,解本题的关键就是利用条形统计图中“90后”事互联网行业岗位的占比乘以“90后”所占总人数的占比,再对各选项逐一分析即可.7、总体由编号01,02,…,29,30的30个个体组成.利用下面的随机数表选取6个个体,选取方法是从如下随机数表的第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第6个个体的编号为()第1行78 16 62 32 08 02 62 42 62 52 53 69 97 28 01 98第2行32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81A.27B.26C.25D.19答案:D分析:根据随机数表法的步骤即可求得答案.由题意,取出的数有23,20,80(超出范围,故舍去),26,24,26(重复,故舍去),25,25(重复,故舍去),36(超出范围,故舍去),99(超出范围,故舍去),72(超出范围,故舍去),80(超出范围,故舍去),19.故选:D.8、某学校在校学生有2000人,为了增强学生的体质,学校举行了跑步和登山比赛,每人都参加且只参加其中一项比赛,高一、高二、高三年级参加跑步的人数分别为a,b,c,且a:b:c=2:5:3,全校参加登山的人数占总人数的1.为了了解学生对本次比赛的满意程度,按分层抽样的方法从中抽取一个容量为200的样本进4行调查,则应从高三年级参加跑步的学生中抽取()A.15人B.30人C.40人D.45人答案:D分析:由题知全校参加跑步的人数为2000×3=1500,再根据分层抽样的方法求解即可得答案.4=1500,解:由题意,可知全校参加跑步的人数为2000×34=450.所以a+b+c=1500.因为a:b:c=2:5:3,所以c=1500×32+5+3因为按分层抽样的方法从中抽取一个容量为200的样本,所以应从高三年级参加跑步的学生中抽取的人数为450×200=45.2000故选:D多选题9、最近几个月,新冠肺炎疫情又出现反复,各学校均加强了疫情防控要求,学生在进校时必须走测温通道,每天早中晚都要进行体温检测并将结果上报主管部门.某班级体温检测员对一周内甲乙两名同学的体温进行了统计,其结果如图所示,则下列结论正确的是()A.甲同学体温的极差为0.4℃B.乙同学体温的众数为36.4℃,中位数与平均数相等C.乙同学的体温比甲同学的体温稳定D.甲同学体温的第60百分位数为36.4℃答案:ABC分析:根据给定的折线图,逐一分析判断各个选项即可作答.观察折线图知,甲同学体温的极差为36.6−36.2=0.4℃,A正确;乙同学体温从小到大排成一列:36.3℃,36.3℃,36.4℃,36.4℃,36.4℃,36.5℃,36.5℃,(36.3×2+36.4×3+36.5×2)=46.4℃,B正乙同学体温的众数为36.4℃,中位数为36.4℃,平均数x=17确;乙同学的体温波动较甲同学的小,极差为0.2℃,也比甲同学的小,因此乙同学的体温比甲同学的体温稳定,C正确;将甲同学的体温从小到大排成一列:36.2℃,36.2℃,36.4℃,36.4℃,36.5℃,36.5℃,36.6℃,因7×60%=4.2,则甲同学体温的第60百分位数为36.5℃,D不正确.故选:ABC10、下表记录了某地区一年之内的月降水量是53mm和56mmC.该年份月降水量的25%分位数是52mmD.该年份月降水量的中位数是56mm答案:ACD分析:A. 利用极差的定义判断;B.利用众数的定义判断;C.利用百分位数的定义判断;D.利用中位数的定义判断.A. 该年份月降水量的极差是71-46=25mm,故正确;B.该年份月降水量的众数是56mm,故错误;C.该年份月降水量从小到大为46,48,51,53,53,56,56,56,56,58,64,66,71,12×25%=3,=52mm,故正确;所以年份月降水量的25%分位数是51+532D. 该年份月降水量从小到大为46,48,51,53,53,56,56,56,56,58,64,66,71,所以该年份月降水量的中位数是56+56=56mm,故正确;2故选:ACD11、某教育局对全区高一年级的学生身高进行抽样调查,随机抽取了200名学生,他们的身高都处在A,B,C,D,E五个层次内,根据抽样结果得到统计图表如下,则下列结论正确的是().A.男生人数为80人B.B层次男女生人数差值最大C.D层次男生人数多于女生人数D.E层次女生人数最少答案:ABD分析:根据条形图求出抽取女生人,得出抽取男生人,再对照图表判断选项中的命题是否正确即可.解:由条形图知,抽取女生学生有18+48+30+18+6=120(人),所以抽取男生有200−120=80(人),选项A正确;B层次的男生有80×(1−10%−15%−20%−25%)=24(人),A,B,C,D,E五个层次男生人数分别:8,24,20,16,12(人),与女生各层次差值分别为:10,24,10,2,6,选项B正确;D层次的男生有12(人),女生有18人,男生人数少于女生,选项C错误;E层次的女生人数最少,选项D正确.故选:ABD.12、某保险公司为客户定制了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险:戊,重大疾病保险,各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得出如下的统计图例:用该样本估计总体,以下四个选项正确的是()A.54周岁以上参保人数最少B.18~29周岁人群参保总费用最少C.丁险种更受参保人青睐D.30周岁以上的人群约占参保人群20%答案:AC分析:根据选项逐一对相应的统计图进行分析判断即可.解:对A:由扇形图可知,54周岁以上参保人数最少,故选项A正确;对B:由折线图可知,18~29周岁人群人均参保费用最少,但是由扇形图知参保人数并不是最少的,所以参保总费用不是最少,故选项B错误;对C:由柱状图可知,丁险种参保比例最高,故选项C正确;对D:由扇形图可知,30周岁以上的人群约占参保人群80%,故选项D错误.故选:AC.13、睡眠很重要,教育部《关于进一步加强中小学生睡眠管理工作的通知》中强调“小学生每天睡眠时间应达到10小时,初中生应达到9小时,高中生应达到8小时”.某机构调查了1万个学生时间利用信息得出下图,则以下判断正确的有()A .高三年级学生平均学习时间最长B .中小学生的平均睡眠时间都没有达到《通知》中的标准,其中高中生平均睡眠时间最接近标准C .大多数年龄段学生平均睡眠时间长于学习时间D .与高中生相比,大学生平均学习时间大幅下降,释放出的时间基本是在睡眠答案:BC分析:根据图象提供数据对选项进行分析,从而确定正确答案.根据图象可知,高三年级学生平均学习时间没有高二年级学生平均学习时间长,A 选项错误.根据图象可知,中小学生平均睡眠时间都没有达到《通知》中的标准,高中生平均睡眠时间最接近标准,B 选项正确.学习时间大于睡眠时间的有:初二、初三、高一、高二、高三,占比516.睡眠时间长于学习时间的占比1116,C 选项正确.从高三到大学一年级,学习时间减少9.65−5.71=3.94,睡眠时间增加8.52−7.9=0.62,所以D 选项错误. 故选:BC填空题14、已知一组样本数据5、2、3、6,则该组数据的第70百分位数为__________.答案:5分析:首先计算指数,再由百分位数的定义可得答案.解:这组样本数据5、2、3、6,从小到大排列为2、3、5、6,又4×70%=2.8,则该组数据的第70百分位数为第3个数5,所以答案是:5.15、若样本数据x1,x2,⋅⋅⋅,x8的标准差为1,则数据2x1−1,2x2−1,⋅⋅⋅,2x8−1的标准差为_______.答案:2解析:若一组数据x1,x2,x3,⋯,x n的方差为s2,则数据ax1+b,ax2+b,ax3+b,⋯,ax n+b的方差为a2s2.若样本数据x1,x2,⋅⋅⋅,x8的标准差为1,则其方差也为1,所以数据2x1−1,2x2−1,⋅⋅⋅,2x8−1的方差为4,标准差为2.所以答案是:2.16、某车间生产A,B,C三种不同型号的产品,产量之比分别为5:k:3,为检验产品的质量,现用分层抽样的方法抽取一个容量为120的样本进行检验,已知B种型号的产品共抽取了24件,则C种型号的产品抽取的件数为_________.答案:36分析:根据题意可得24120=k5+k+3,解方程求出k的值,再根据C种型号的产品所占的比例,求出C种型号的产品应抽取的数量.由题意,得24120=k5+k+3,所以k=2,所以C种型号的产品抽取的件数为120×35+2+3=36.所以答案是:36.解答题17、在①55%分位数,②众数这两个条件中任选一个,补充在下面问题中的横线上,并解答问题.维生素C又叫L-抗坏血酸,是一种水溶性维生素,是高等灵长类动物与其他少数生物的必需营养素.现从猕猴桃、柚子两种食物中测得每100克维生素C的含量(单位:mg)各10个数据如下,其中猕猴桃的一个数据x被污损.猕猴桃:104,119,106,102,132,107,113,134,116,x;柚子:121,113,109,122,114,116,132,121,131,117.已知x等于柚子的10个数据中的___________.(1)求x的值与猕猴桃的数据的中位数;(2)分别计算上述猕猴桃、柚子两种食物中测得每100克维生素C含量的平均数.答案:(1)121,中位数为114.5(2)115.4mg,119.6mg分析:(1)先将柚子从小到大排序,若选①,利用55%分位数的定义得到x=121,若选②,利用众数的定义进行也得到x=121,接着代入猕猴桃里面,从小到大排序算出中位数;(2)利用平均数的定义进行计算(1)柚子的10个数据按照从小到大的顺序排列为:109,113,114,116,117,121,121,122,131,132.选①,因为10×55%=5.5,所以柚子10个数据的55%分位数为第6个数,即121,所以x=121.猕猴桃的10个数据按照从小到大的顺序排列为:102,104,106,107,113,116,119,121,132,134,则(113+116)=114.5.中位数为12选②,因为柚子的10个数据的众数为121,所以x=121.猕猴桃的10个数据按照从小到大的顺序排列为:102,104,106,107,113,116,119,121,132,134,则(113+116)=114.5.中位数为12(2)×(102+104+106+107+113+116+119+121+由(1)得每100克猕猴桃维生素C含量的平均数为110132+134)=115.4mg×(109+113+114+116+117+121+121+122+131+每100克柚子维生素C含量的平均数为110132)=119.6mg18、从某校高一年级新生中随机抽取一个容量为20的身高样本,数据如下(单位:cm,数据间无大小顺序要求):152,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170,171,x,174,175.(1)若x为这组数据的一个众数,求x的取值集合;(2)若样本数据的第90百分位数是173,求x的值;(3)若x=174,试估计该校高一年级新生的平均身高.答案:(1){164,165,168,170}(2)172(3)166.5(cm)分析:(1)首先排列19个数据,根据众数的定义,即可确定x的取值集合;(2)首先确定第90百分位数是第18项和第19项数据的平均数,再讨论x的取值,根据百分位数,列式求值;(3)根据平均数公式,列式求值.(1)其余十九个数据152,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170,171,174,175中,数据出现的频数为3的数有165,170,出现频数为2的数据有164,168.因为x为这组数据的一个众数,所以x的取值集合为{164,165,168,170}.(2)因为20×90%=18,所以90百分位数是第18项和第19项数据的平均数,若x⩽171,则90百分位数为1(171+174)=17,矛盾.2(x+174)=173,所以x=172.若171<x<175,即12(174+175)=174.5,矛盾.若x⩾175,则90百分位数为12综上,x的值为172.(3)依题意可得152+155+158+164+164+165+165+165+166+167+168+168+169+170+170+170+171+174+174+175=3330所以平均数为3330÷20=166.5(cm),估计该校高一年级学生的平均身高.。
新高考数学复习专题-专题二十 统计与统计案例(原卷版)
专题二十 统计与统计案例一、单选题1.(2021·河南高二月考(文))有下列四个命题:( ) ①在回归分析中,残差的平方和越小,模型的拟合效果越好;②在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适; ③若数据1x ,2x ,…,n x 的平均数为1,则12x ,22x ,…2n x 的平均数为2; ④对分类变量x 与y 的随机变量2K 的观测值k 来说,k 越小,判断“x 与y 有关系”的把握越大.其中真命题的个数为( ) A .1B .2C .3D .42.(2021·全国高二课时练习)若由一个22⨯列联表中的数据计算得2 4.013K =,那么有( )把握认为两个变量有关系.20()P K k ≥ 0.150.10 0.05 0.025 0.010 0.005 0.0010k2.072 2.7063.841 5.024 6.635 7.879 10.828A .95%B .97.5%C .99%D .99.9%第II 卷(非选择题)请点击修改第II 卷的文字说明二、解答题3.(2021·广东汕头市·高三一模)为确保我国如期全面建成小康社会,实现第一个百年奋斗目标打下了坚实的基础.在产业扶贫政策的大力支持下,某玩具厂对原有的生产线进行技术升级,为了更好地对比升级前和升级后的效果,其中甲生产线继续使用旧的生产模式,乙生产线采用新的生产模式.质检部门随机抽检了甲、乙两条生产线的各100件玩具,在抽取的200件玩具中,根据检测结果将它们分为“A ”、“B ”、“C ”三个等级,,A B 等级都是合格品,C 等级是次品,统计结果如表所示:等级ABC频数 100 75 25(表二)合格品 次品 合计 甲 80 乙 5 合计在相关政策扶持下,确保每件合格品都有对口销售渠道,但从安全起见,所有的次品必须由厂家自行销毁.(1)请根据所提供的数据,完成上面的22⨯列联表(表二),并判断是否有99.5%的把握认为产品的合格率与技术升级有关?(2)每件玩具的生产成本为20元,,A B 等级产品的出厂单价分别为m 元、40元.若甲生产线抽检的玩具中有35件为A 等级,用样本的频率估计概率,若进行技术升级后,平均生产一件玩具比技术升级前多盈利12元,则A 等级产品的出产单价为多少元?附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥0.05 0.025 0.010 0.005 0.0010k3.841 5.024 6.635 7.879 10.8284.(2021·河南高二月考(文))某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,得出以下22⨯列联表:积极参加班级工作不太主动参加班级工作总计 学习积极性高 18725 学习积极性一般ab25 总计cd50如果随机抽查该班的一名学生,那么抽到积极参加班级工作的学生的概率是1225. (1)求a ,b ,c ,d 的值.(2)试运用独立性检验的思想方法分析:能否有99.9%的把握认为学生的学习积极性与对待班级工作的态度有关系?并说明理由.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:20()P K k ≥0.10 0.05 0.025 0.010 0.005 0.0010k2.7063.841 5.024 6.635 7.879 10.8285.(2021·内蒙古包头市·高三一模(文))某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面积以及相应的管理时间的关系如下表: 土地使用面积x (单位:亩) 1 2 3 4 5 管理时间y (单位:月)911142620并调查了某村300名村民参与管理的意愿,得到的部分数据如下表所示:愿意参与管理不愿意参与管理男性村民 140 60 女性村民40(1)求相关系数r 的大小(精确到0.01),并判断管理时间y 与土地使用面积x 的线性相关程度;(2)是否有99.9%的把握认为村民的性别与参与管理的意愿具有相关性?参考公式:()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑,()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.临界值表:()20P K k ≥0.100 0.050 0.025 0.010 0.0010k2.7063.841 5.024 6.635 10.82848522.02≈.6.(2021·聊城市·山东聊城一中高三一模)已知某班有50位学生,现对该班关于“举办辩论赛”的态度进行调查,,他们综合评价成绩的频数分布以及对“举办辩论赛”的赞成人数如下表:综合评价成绩(单位:分) [40,50)[50,60)[60,70)[70,80)[80,90)[90,100)频数 510151055赞成人数4812431(1)请根据以上统计数据填写下面2×2列联表,并回答:是否有95%的把握认为“综合评价成绩以80分位分界点”对“举办辩论赛”的态度有差异?综合评价成绩小于80分的人数综合评价成绩不小于80分的人数合计赞成 不赞成 合计(2)若采用分层抽样在综合评价成绩在[60,70),[70,80)的学生中随机抽取10人进行追踪调查,并选其中3人担任辩论赛主持人,求担任主持人的3人中至少有1人在[60,70)的概率.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:P()20Kk ≥0.10 0.050.010 0.005 k 02.7063.8416.6357.8797.(2021·全国高三月考(理))某购物网站统计了,A B 两款手机在2020年7月至11月的总销售量y (单位:百部),得到以下数据: 月份x 7 8 9 10 11 销售量y100120110120200(Ⅰ)已知销售量y 与月份x 满足线性相关关系,求出y 关于x 的线性回归方程,ˆˆˆybx a =+,并预测12月的手机销售量; (Ⅱ)网站数据分析人员发现:,A B 两款手机11月的销售量与顾客性别有关.请填写下面的22⨯列联表,并判断能否有超过99.5%的把握认为“,A B 两款手机11月的销售量与顾客性别有关”?男性顾客女性顾客合计A 款销售量90B 款销售量50合计90参考公式:()()()121niii ni i x x y y b x x ==--=-∑∑,ˆˆay bx =-, ()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.临界值表:()20P K k ≥ 0.010 0.005 0.0010k6.6357.879 10.8288.(2021·湖北高三月考)近年来,明代著名医药学家李时珍故乡黄冈市蕲春县大力发展大健康产业,蕲艾产业化种植已经成为该县脱贫攻坚的主要产业之一,已知蕲艾的株高y (单位:cm)与一定范围内的温度x (单位:℃)有关,现收集了蕲艾的13组观测数据,得到如下的散点图:现根据散点图利用y a x =+dy c x=+建立y 关于x 的回归方程,令s x =,1t x=得到如下数据: xyst10.15109.943.040.16113ni ii s y s y =-⋅∑ 13113i ii t yt y =-⋅∑1322113ik ss =-∑1322113ii tt =-∑1322113ii yy =-∑13.94 -2.1 11.67 0.21 21.22且(i s ,i y )与(i t ,i y )(i =1,2,3,…,13)的相关系数分别为1r ,2r ,且2r =﹣0.9953. (1)用相关系数说明哪种模型建立y 与x 的回归方程更合适; (2)根据(1)的结果及表中数据,建立y 关于x 的回归方程;(3)已知蕲艾的利润z 与x 、y 的关系为1202z y x =-,当x 为何值时,z 的预报值最大.参考数据和公式:0.21×21.22=4.4562,11.67×21.22=247.6374,247.637415.7365,对于一组数据(i u ,i v )(i =1,2,3,…,n ),其回归直线方程v u αβ=+的斜率和截距的最小二乘法估计分别为1221ni i i nii u vnu v unuβ==-⋅=-∑∑,v u αβ=-,相关系数222211ni i nniii i u vnu vr unu vnv==-⋅=-⋅-∑∑∑.9.(2021·辽宁高三期末(文))2019年4月,中国电信公布了2019年的终端洞察报告,其中,国产手机品牌表现抢眼,统治地位不容置疑.在2018年6—11月上市的新机中,用户最满意机型与用户推荐机型的项目中国产手机优势明显,华为及荣耀手机分别占据不同价位段的榜单第一,OPPO 、vivo 、小米、魅族均有机型占据榜单.在用户满意机型调研项目中,曾经位于神坛地位的苹果手机也仅仅只有iPhoneXR 一款位列第三.最满意度机型TOP3 中国电信大于3500 2500-3499 1500-2499 1000-1499 1000元以下 第一名华为P30 ProvivoiQoo荣耀9X Vivo Z5x华为畅享9e第二名三星S10+荣耀20Pro红米K20ProOPPO A9红米7第三名iPhone XRVivo X27化为 麦芒8华为畅享9plus中兴BladeA7 (1)从上表中“华为(不含荣耀)”和“iPhoneXR ”的5个机型中任取2个,求这两个机型都是华为的概率;(2)测试数据源于消费者的反馈,从反馈信息中随机抽取500个“华为畅享9plus ”消费者,其中来自城市300个,来自农村200个,统计他们对“华为畅想9plus ”的满意情况如下:满意不满意城市 270 30 农村17030根据上表数据,问是否有95%的把握认为消费者是否满意与城市用户还是农村用户有关?(附:()()()()()22n ad bc X a b c d a c b d -=++++;当2 3.841X >时,有95%的把握说事件A与B 有关;当2 6.635X >时,有99%的把握说事件A 与B 有关;当2 3.841X ≤时,认为事件A 与B 是无关的)10.(2021·全国高三其他模拟)在我国,大学生就业压力日益严峻,伴随着政府政策的引导与社会观念的转变,大学生的创业意识与就业方向也悄然发生转变.某大学生在国家提供的税收,担保贷款等多方面的政策扶持下选择加盟某专营店自主创业,该专营店统计了近五年来创收利润数i y (单位:万元)与时间i t (单位:年)的数据,列表如下:i t1 2 3 4 5i y2.4 2.7 4.1 6.4 7.9(1)依据表中给出的数据,是否可用线性回归模型拟合与t 的关系,请计算相关系数r 并加以说明(计算结果精确到0.01).(若0.75r>,则线性相关程度很高,可用线性回归模型拟合)(2)该专营店为吸引顾客,特推出两种促销方案. 方案一:每满500元可减50元;方案二:每满500元可抽奖一次,每次中奖的概率都为25,中奖就可以获得100元现金奖励,假设顾客每次抽奖的结果相互独立.(ⅰ)某位顾客购买了1050元的产品,该顾客选择参加两次抽奖,求该顾客换得100元现金奖励的概率(ⅱ)某位顾客购买了2000元的产品,作为专营店老板,是希望该顾客直接选择方案一返回200元现金,还是选择方案二参加四次抽奖?说明理由.附:相关系数公式:()()()()()()1122221111nnii i ii i nnnniiiii i i i tt y y t yntyr tt yy tt yy ======---=----∑∑∑∑∑∑,参考数据:56.957.547≈,5185.2i i i t y ==∑,()52110i i t t =-=∑,()52122.78i i y y =-∑11.(2021·全国高三其他模拟)人均可支配收入是反映一个地区居民收入水平和城市经济发展水平的重要指标,并且对人均消费水平有重大影响,下图是根据国家统计局发布的《2020年上半年居民收入和消费支出情况》绘制的,是我国31个省(区、市)2020年上半年人均可支配收入x (单位:元)与人均消费支出y (单位:元)的散点图.(1)由散点图可以看出,可以用线性回归模型ˆˆybx a =+拟合人均消费支出y 与人均可支配收入x 的关系,请用相关系数加以说明; (2)建立y 关于x 的线性回归方程(精确到0.01);(3)根据(2)的结论,规定半年人均盈余(人均可支配收入-人均消费支出)不低于4620元的省(区、市)达到阶段小康的标准,则估计达到阶段小康标准的省(区、市)的半年人均可支配收入至少为多少元? 参考数据:xy()3121=-∑ii xx()()311=--∑ii i xx y y()3121=-∑ii xx()3121=-∑ii yy15500 9632 1412000000 683900000 38000 18400参考公式:相关系数()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑回归方程ˆˆˆybx a =+中斜率和截距的最小二乘估计公式分别为()()()121ˆniii nii x x y y b x x ==--=-∑∑,ˆˆay bx =-. 12.(2021·甘肃兰州市·高三其他模拟(文))某校高二生物研究性学习小组的同学们为了研究当地某种昆虫的产卵数与温度的变化关系,他们收集了一只该种昆虫在温度C x ︒时相对应产卵数个数为y 的8组数据,为了对数据进行分析,他们绘制了如下散点图:(1)根据散点图,甲、乙两位同学分别用y bx a =+和z dx c =+(其中ln z y =)两种模型进行回归分析,试判断这两位同学得到的回归方程中,哪一个的相关指数2R 更接近1;(给出判断即可,不必说明理由)(2)根据(1)的结论选定上述两个模型中更适宜作为对昆虫产卵数与温度变化关系进行回归分析的模型,并利用下表中数据,计算该模型的回归方程: (方程表示为()y f x =的形式,数据计算结果保留两位小数) xyz81i ii x y =∑81i i i x z =∑821ii x=∑26 72 3.3 11871 757 5722(3)据测算,若只此种昆虫的产卵数超过4e ,则会发生虫害.研究性学习小组的同学通过查阅气象资料得知近期当地温度维持在25C ︒左右,试利用(2)中的回归方程预测近期当地是否会发生虫害.附:对于一组数据()()()1122,,,,,,n n u v u v u v ,其回归直线v u βα=+的斜率和截距的最小二乘估计分别为1221ˆˆˆ,nl i i ni i u v nuvv u unu βαβ==-==--∑∑. 13.(2021·全国高三月考(文))2020年11月24日我国使用长征五号运载火箭成功发射嫦娥五号月球探测器,12月17日嫦娥五号返回器携带月球样品在预定地区安全着陆,探月工程嫦娥五号任务取得圆满成功.某大学为此举行了与嫦娥系列探测工程有关的知识测试,测试满分为100分,该校某专业的100名大一学生参加了学校举行的测试,记录这100名学生的分数,将数据分成7组; [)[)[]30,40,40,50,,90,100⋯,并整理得到如下频率分布直方图:(1)估计这100名学生测试分数的中位数;(2)把分数不低于80分的称为优秀,已知这100名学生中男生有70人,其中测试优秀的男生有45人,填写下面列联表,并根据列联表判断是否有95%的把握认为测试优秀与性别有关: 男生 女生 优秀 不优秀附:20()P K k ≥0.050 0.010 0.0010k 3.841 6.635 10.828()()()()()22n ad bc K a b c d a c b d -=++++ (3)对于样本中分数在[)[]80,90,90,100的人数,学校准备按比例从这2组中抽取12人,在从这12人中随机抽取3人参与学校有关的宣传活动,记这3人分数不低于90分的学生数为,X 求X 的分布列.14.(2021·江西高三其他模拟(文))某疫苗进行安全性临床试验.该疫苗安全性的一个重要指标是:注射疫苗后人体血液中的高铁血红蛋白(MetHb )的含量(以下简称为“M 含量”)不超过1%,则为阴性,认为受试者出现血症.若一批受试者的M 含量平均数不超过0.65%,出现血症的被测试者的比例不超过5%,同时满足这两个条件则认为该疫苗在M 含量指标上是“安全的”;否则为“不安全”.现有男、女志愿者各200名接受了该疫苗注射.经数据整理,制得频率分布直方图如图.(注:在频率分布直方图中,同一组数据用该区间的中点值作代表.)(1)请说明该疫苗在M 含量指标上的安全性;(2)按照性别分层抽样,随机抽取50名志愿者进行M 含量的检测,其中女性志愿者被检测出阳性的恰好1人.请利用样本估计总体的思想,完成这400名志愿者的22⨯列联表,并判断是否有超过95%的把握认为,注射该疫苗后,高铁血红蛋白血症与性别有关?性别 阴性阳性男 女 合计阳性 阴性合计附:()()()()()22n ad bcKa b c d a c b d-=++++.()2P K k≥0.050 0.010 0.001 0k 3.841 6.635 10.82815.(2021·全国高三专题练习(文))在关研究表明,正确佩戴安全头盔,规范使用安全带能够将交通事故死亡风险大幅降低,对保护群众生命安全具有重要作用.2020年4月,“一盔一带”安全守护行动在全国各地开展.行动期间,公安交管部门将加强执法管理,依法查纠摩托车和电动自行车骑乘人员不佩戴安全头盔,汽车驾乘人员不使用安全带的行为,助推养成安全习惯.该行动开展一段时间后,某市针对电动自行车骑乘人员是否佩戴安全头盔问题进行调查,在随机调查的1000名骑行人员中,记录其年龄和是否佩戴头盔情况,得到如下的统计图表:(Ⅰ)估算该市电动自行车骑乘人员的平均年龄;(Ⅱ)根据所给的数据,完成下面的列联表:是否佩戴头盔年龄是否[)20,40[]40,70(Ⅲ)根据(Ⅱ)中的列联表,判断是否有99%把握认为遵守佩戴安全头盔与年龄有关?附:()()()()()22n ad bcKa b c d a c b d-=++++,()2P K k≥0.050 0.010 0.001k 3.841 6.635 10.82816.(2021·全国高三专题练习(文))针对偏远地区因交通不便、消息闭塞导致优质农产品藏在山中无人识的现象,各地区开始尝试将电商扶贫作为精准扶贫的重要措施.为了解电商扶贫的效果,某部门随机就100个贫困地区进行了调查,其当年的电商扶贫年度总投入(单位:万元)及当年人均可支配年收入(单位:元)的贫困地区数目的数据如下表:人均可支配年收入(元)电商扶贫年度总投入(万元)(5000,10000] (10000,15000] (15000,20000] (0,500] 5 3 2(500,1000] 3 21 6(1000,3000) 2 34 24(1)估计该年度内贫困地区人均可支配年收入过万的概率,并求本年度这100个贫困地区的人均可支配年收入的平均值的估计值(同一组数据用该组数据区间的中间值代表);(2)根据所给数据完成下面的列联表,并判断是否有99%的把握认为当地的人均可支配年收入是否过万与当地电商扶贫年度总投入是否超过千万有关.人均可支配年收入≤10000元人均可支配年收入>10000元电商扶贫年度总投入不超过1000万电商扶贫年度总投入超过1000万附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()2P K k ≥0.050 0.01 0.005 k3.8416.6357.87917.(2021·全国高三专题练习(文))为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米): 男:173 178 174 185 170 169 167 164 161 170 女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;(2)请根据测量结果得到20名学生身高的中位数h (单位:厘米),将男、女生身高不低于h 和低于h 的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异?(3)若男生身高低于165厘米为偏矮,不低于165厘米且低于175厘米为正常,不低于175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.0010k2.7063.8415.0246.6357.879 10.828参照公式:()()()()()22n ad bc k a b c d a c b d -=++++ 18.(2021·全国高三专题练习(文))某生物研究所研发了某种型号的新冠疫苗,为检验该种型号疫苗的效果,研究所将疫苗用在小白鼠身上进行科研实验,得到如下数据:未感染病毒感染病毒 总计未注射疫苗 a 60 m 注射疫苗 b30 n总计11090200从未注射疫苗的小白鼠中任取1只,取到“未感染病毒”的小白鼠的概率为5. (1)能否有99.9%的把握认为注射此疫苗有效?(2)在感染病毒的小白鼠中,按未注射疫苗和注射疫苗的比例抽取6只进行病理分析,然后从这6只小白鼠中随机抽取2只对注射疫苗的情况进行核实,求至少有1只为注射过疫苗的概率.附:()()()()()22n ad bc K a b c d a c b d -=++++. ()2P K k ≥0.05 0.025 0.010 0.005 0.001 k3.8415.0246.6357.87910.82819.(2021·全国高三专题练习(文))某研究部门为了研究气温变化与患流感人数多少之间的关系,在某地随机对50人进行了问卷调查得到如下列表:(附22()()()()()n ad bc K a b c d a c b d -=++++)高于22.5C ︒ 不高于22.5C ︒ 合计 患流感2025不患流感15合计50(1)对上述22⨯列联表进行填空,并判断是否有99%的把握认为患流感与温度有关,说明你的理由;(2)为了了解患流感与年龄的关系,已知某地患有流感的老年、中年、青年的人数分别为108人,72人,36人.按分层抽样的方法随机抽取6人进行问卷调查,再从6人中随机抽取2人进行调查结果对比,求这2人中至少一人是中年人的概率.()2>0.10 0.05 0.025 0.01 P K kk 2.701 3.841 5.024 6.63520.(2021·山东德州市·高三一模)2021年春晚首次采用“云”传播,“云”互动形式,实现隔空连线心意相通,全球华人心连心“云团圆”,共享新春氛围,“云课堂”亦是一种真正完全突破时空限制的全方位互动性学习模式.某市随机抽取200人对“云课堂”倡议的了解情况进行了问卷调查,记Y表示了解,N表示不了解,统计结果如下表所示:(表一)了解情况Y N人数140 60(表二)男女合计Y80N40合计(1)请根据所提供的数据,完成上面的22⨯列联表(表二),并判断是否有99%的把握认为对“云课堂”倡议的了解情况与性别有关系;(2)用样本估计总体,将频率视为概率,在男性市民和女性市民中各随机抽取4人,记“4名男性中恰有3人了解云课堂倡议”的概率为1P,“4名女性中恰有3人了解云课堂倡议”的概率为2P .试求出1P 与2P ,并比较1P 与2P 的大小. 附:临界值参考表的参考公式()20p K K ≥0.10 0.05 0.025 0.010 0.005 0.0010K 2.7063.841 5.024 6.635 7.879 10.828()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++) 21.(2021·吉林长春市·高三二模(理))随着互联网行业、传统行业和实体经济的融合不断加深,互联网对社会经济发展的推动效果日益显著,某大型超市计划在不同的线上销售平台开设网店,为确定开设网店的数量,该超市在对网络上相关店铺做了充分的调查后,得到下列信息,如图所示(其中x 表示开设网店数量,y 表示这x 个分店的年销售额总和),现已知55118850,2000i ii i i x yy ====∑∑,求解下列问题;(1)经判断,可利用线性回归模型拟合y 与x 的关系,求解y 关于x 的回归方程; (2)按照经验,超市每年在网上销售获得的总利润w (单位:万元)满足25140w y x =--,请根据(1)中的线性回归方程,估算该超市在网上开设多少分店时,才能使得总利润最大.参考公式;线性回归方程y bx a =+,其中515221,i ii ii x y nx ya y bxb xnx==-=-=-∑∑22.(2021·河南高三月考(文))2020年初,新冠病毒肆虐.疫情期间,停课不停教学,各学校以网课形式进行教学.教育局抽样对某所学校的高三1000名学生某一周每天学习时间以及考试进行了调查,得如下频数分布表 学习时间(分钟) [)7,7.5[)7.5,8[)8,8.5[)8.5,9[)9,9.5[]9.5,10人数160190200180150120从1000名学生中抽取50名学生,调查学习时间与成绩的关系,得如下二阶列联表学习时间9小时以上(含9小时)学习时间9小时以下合计总分600分以上(含600分) 7 3 10 总分600分以下 17 23 40 合计242650(1)求出第一星期这1000名学生学习时间的中位数;(2)为了解学生们的学习状况,一次考试结束,从全年级随机抽取50人根据学习时间的多少和成绩的是否优秀列成以下列联表计算说明:有没有90%的把握认为总分600分以上和学习时间超过9小时有关附公式及表如下:()()()()()22n ad bc K a b c d a c b d -=++++ ()20P K K ≥ 0.150.10 0.05 0.025 0.010 0.005 0.0010k2.0722.7063.841 5.024 6.635 7.879 10.82823.(2021·全国高三专题练习)垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,且具有污染性,所以需要无害化、减量化处理.某市为调查产生的垃圾数量,采用简单随机抽样的方法抽取20个县城进行了分析,得到样本数据()(),1,2,,20i i x y i =⋅⋅⋅,其中i x 和i y 分别表示第i 个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得20180i i x ==∑,2014000i i y ==∑,()202180i i x x=-=∑,()20218000ii y y =-=∑,()()201700i ii x xy y =--=∑.(1)请用相关系数说明该组数据中y 与x 之间的关系可用线性回归模型进行拟合; (2)求y 关于x 的线性回归方程,用所求回归方程预测该市10万人口的县城年垃圾产生总量约为多少吨?参考公式:相关系数()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑,对于一组具有线性相关关系的数据()(),1,2,3,,i i x y i n =⋅⋅⋅,其回归直线y bx a =+的斜率和截距的最小二乘估计分别为()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-.24.(2021·全国高三专题练习(文))随着冬季的到来,是否应该自觉佩戴口罩成为了人们热议的一个话题.为了调查佩戴口罩的态度与性别是否具有相关性,研究人员作出相应调查,并统计数据如表所示: 认为冬季佩戴口罩十分必要 认为冬季佩戴口罩没有必要 男性 300 200 女性150150(1)判断是否有99.9%的把握认为佩戴口罩的态度与性别有关?(2)若按照分层抽样的方法从男性中随机抽取5人,再从这5人中随机抽取2人,求恰有1人认为冬季佩戴口罩十分必要的概率.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:()20P K k0.100 0.050 0.010 0.001k 2.706 3.841 6.635 10.82825.(2021·全国高三专题练习)在新型冠状病毒疫情期间,某高中学校实施线上教学,为了解线上教学的效果,随机抽取了100名学生对线上教学效果进行评分(满分100分),记低于80的评分为“效果一般”,不低于80分为“效果较好”.(1)请补充完整22⨯列联表;通过计算判断,有没有99%的把握认为线上教学效果评分为“效果较好”与性别有关?效果一般效果较好合计男20女1555合计(2)用(1)中列联表的数据估计全校线上教学的效果,用频率估计概率.从该校学生中任意抽取3人,记所抽取的3人中线上教学“效果较好”的人数为X,求X的分布列和数学期望.附表及公式:()2P K k0.150.100.050.0250.010 0k 2.072 2.706 3.841 5.024 6.635其中()()()()()22n ad bcka b c d a c b d-=++++,n a b c d=+++.26.(2021·全国高三专题练习)近年来,我国的电子商务行业发展迅速,与此同时,相关管理部门建立了针对电商的商品和服务评价系统.现从评价系统中选出200次成功的交易,并对其评价进行统计,对商品的好评率为35,对服务的好评率为710;其中对商品和服务均为好评的有80次(1)是否可以在犯错误概率不超过0.1的前提下,认为商品好评与服务好评有关?(2)若将频率视为概率,某人在该购物平台上进行的4次购物中,设对商品和服务全好评的次数为随机变量X:求对商品和服务全好评的次数X的分布列及其期望.()20P K k 0.15 0.10 0.05 0.025 0.010 0.005 0.0010k2.072 2.7063.841 5.024 6.635 7.879 10.82822()()()()()n ad bc K a b c d a c b d -=++++(其中n a b c d =+++)27.(2021·全国高三专题练习)某校高一年级进行安全知识竞赛(满分为100分),所有学生的成绩都不低于75分,从中抽取100名学生的成绩进行分组调研,第一组[)75,80,第二组[)80,85,,第五组[]95,100(单位:分),得到如下的频率分布直方图.(1)若竞赛成绩不低于85分为优秀,低于85分为非优秀,且成绩优秀的男学生人数为35,成绩非优秀的女学生人数为25,请判断是否有95%的把握认为竞赛成绩的优秀情况与性别有关;(2)用分层抽样方法,在成绩不低于85的学生中抽取6人,再从这6人中随机选3人发言谈体会,设这3人中成绩在[)85,90的人数为ξ,求ξ的分布列与数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.临界值表:()20P K k ≥ 0.10 0.05 0.025 0.01 0.0050k2.7063.841 5.024 6.635 7.87928.(2021·全国高三专题练习)支付宝为人们的生活带来许多便利,为了了解支付宝在某市的使用情况,某公司随机抽取了100名支付宝用户进行调查,得到如下数据: 每周使用支付宝次数 1 2 3 4 5 6及以上 40岁及以下人数 3 3 4 8 7 30 40岁以上人数 4 5 6 6 4 20 合计7810141150(1)如果认为每周使用支付宝超过3次的用户“喜欢使用支付宝”,完成下面22⨯列联表,并判断能否在犯错误概率不超过0.05的前提下,认为是否“喜欢使用支付宝”与年龄有关?不喜欢使用支付宝 喜欢使用支付宝 合计 40岁及以下人数 40岁以上人数 合计(2)每周使用支付宝6次及以上的用户称为“支付宝达人”,视频率为概率,在该市所有“支付宝达人”中,随机抽取3名用户.①求抽取的3名用户中,既有40岁及以下“支付宝达人”又有40岁以上“支付宝达人”的概率;②为了鼓励40岁以上用户使用支付宝,对抽出的40岁以上“支付宝达人”每人奖励500元,记奖励总金额为X (单位:元),求X 的数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥ 0.15 0.10 0.05 0.025 0.010 0.005 0.0010k2.0722.7063.841 5.024 6.635 7.879 10.82829.(2021·全国高三专题练习)2019年4月,江苏省发布了高考综合改革实施方案,试行“312++”高考新模式.为调研新高考模式下,某校学生选择物理或历史与性别是否有。
高考数学统计与统计案例专题卷(附答案)
高考数学统计与统计案例专题卷(附答案)一、单选题1.新高考改革后,某校2000名学生参加物理学考,该校学生物理成绩的频率分布直方图如图所示,若规定分数达到90分以上为A级,则该校学生物理成绩达到A级的人数是()A. 600B. 300C. 60D. 302.国庆70周年庆典磅礴而又欢快的场景,仍历历在目.已知庆典中某省的游行花车需要用到某类花卉,而该类花卉有甲、乙两个品种,花车的设计团队对这两个品种进行了检测.现从两个品种中各抽测了10株的高度,得到如下茎叶图.下列描述正确的是()A. 甲品种的平均高度大于乙品种的平均高度,且甲品种比乙品种长的整齐B. 甲品种的平均高度大于乙品种的平均高度,但乙品种比甲品种长的整齐C. 乙品种的平均高度大于甲品种的平均高度,且乙品种比甲品种长的整齐D. 乙品种的平均高度大于甲品种的平均高度,但甲品种比乙品种长的整齐3.某次歌唱比赛中,7位评委为某选手打出的分数分别为83,91,91,94,94,95,96,去掉一个最高分和一个最低分后,所剩数据的平均数为()A. 94B. 93C. 92D. 914.为了解某市居民用水情况,通过抽样,获得了100位居民某年的月均用水量(单位:吨).将数据按照,…,分成9组,绘制了如图所示的频率分布直方图.政府要试行居民用水定额管理,制定一个用水量标准.使的居民用水量不超过,按平价收水费,超出的部分按议价收费,则以下比较适合做为标准的是()A. 2.5吨B. 3吨C. 3.5吨D. 4吨5.某校高三年级有男生220人,学籍编号为1,2,...,220;女生380人,学籍编号为221,222, (600)为了解学生学习的心理状态,按学籍编号采用系统抽样的方法从这600名学生中抽取10人进行问卷调查(第一组采用简单随机抽样,抽到的号码为10),再从这10名学生中随机抽取3人进行座谈,则这3人中既有男生又有女生的概率是()A. B. C. D.6.如图的折线图是某超市2018年一月份至五月份的营业额与成本数据,根据该折线图,下列说法正确的是()A. 该超市2018年的前五个月中三月份的利润最高B. 该超市2018年的前五个月的利润一直呈增长趋势C. 该超市2018年的前五个月的利润的中位数为0.8万元D. 该超市2018年前五个月的总利润为3.5万元7.为了从甲、乙两组学生中选一组参加“喜迎祖国七十华诞,共建全国文明城市”知识竞赛活动,班主任老师将这两组学生最近6次的测试成绩进行统计,得到如图所示的茎叶图.若甲、乙两组的平均成绩分别是,则下列说法正确的是()A. ,乙组比甲组成绩稳定,应选乙组参加竞赛B. ,甲组比乙组成绩稳定,应选甲组参加竞赛C. ,甲组比乙组成绩稳定,应选甲组参加竞赛D. ,乙组比甲组成绩稳定,应选乙组参加竞赛8.为了节能减排,发展低碳经济,我国政府从2001年起就通过相关政策推动新能源汽车产业发展.下面的图表反映了该产业发展的相关信息:根据上述图表信息,下列结论错误的是()A. 2017年3月份我国新能源汽车的产量不超过万辆B. 2017年我国新能源汽车总销量超过万辆C. 2018年8月份我国新能源汽车的销量高于产量D. 2019年1月份我国插电式混合动力汽车的销量低于万辆9.某学校运动会的立定跳远和秒跳绳两个单项比赛分成预赛和决赛两个阶段.下表为名学生的预赛成绩,其中有三个数据模糊.秒跳绳(单位:次)在这名学生中,进入立定跳远决赛的有人,同时进入立定跳远决赛和30秒跳绳决赛的有6人,则()A. 号学生进入秒跳绳决赛B. 号学生进入秒跳绳决赛C. 号学生进入秒跳绳决赛D. 号学生进入秒跳绳决赛10.2010-2018年之间,受益于基础设施建设对光纤产品的需求,以及个人计算机及智能手机的下一代规格升级,电动汽车及物联网等新机遇,连接器行业增长呈现加速状态.根据该折线图,下列结论正确的个数为()①每年市场规模量逐年增加;②增长最快的一年为2013~2014;③这8年的增长率约为40%;④2014年至2018年每年的市场规模相对于2010年至2014年每年的市场规模,数据方差更小,变化比较平稳A. 1B. 2C. 3D. 4二、填空题(共7题;共7分)11.己知随机变量与有相关关系,当时,的预报值为________.12.若数据的方差为,则________.13.某学校高一、高二、高三年级的学生人数成等差数列,现用分层抽样的方法从这三个年级中抽取90人,则应从高二年级抽取的学生人数为________.14.某班的全体学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为:、、、,若低于分的人数是,则成绩不低于分的学生人数是________.15.已知样本7,8,9,的平均数是9,且,则此样本的方差是________.16.某中学采用系统抽样方法,从该校高三年级全体800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800进行编号.已知从33~48这16个数中取的数是42,则在第1小组1~16中随机抽到的数是________.17.2020年年初,新冠肺炎疫情袭击全国.口罩成为重要的抗疫物资,为了确保口罩供应,某工厂口罩生产线高速运转,工人加班加点生产.设该工厂连续5天生产的口罩数依次为,,,,(单位:十万只),若这组数据,,,,的方差为1.44,且,,,,的平均数为4,则该工厂这5天平均每天生产口罩________十万只.三、解答题(共6题;共60分)18.每年的12月4日为我国“法制宣传日”.天津市某高中团委在2019年12月4日开展了以“学法、遵法、守法”为主题的学习活动.已知该学校高一、高二、高三的学生人数分别是480人、360人、360人.为检查该学校组织学生学习的效果,现采用分层抽样的方法从该校全体学生中选取10名学生进行问卷测试.具体要求:每位被选中的学生要从10个有关法律、法规的问题中随机抽出4个问题进行作答,所抽取的4个问题全部答对的学生将在全校给予表彰.(1)求各个年级应选取的学生人数;(2)若从被选取的10名学生中任选3人,求这3名学生分别来自三个年级的概率;(3)若被选取的10人中的某学生能答对10道题中的7道题,另外3道题回答不对,记表示该名学生答对问题的个数,求随机变量的分布列及数学期望.19.清华大学自主招生考试题中要求考生从A,B,C三道题中任选一题作答,考试结束后,统计数据显示共有600名学生参加测试,选择A,B,C三题答卷数如下表:(Ⅰ)负责招生的教授为了解参加测试的学生答卷情况,现用分层抽样的方法从600份答案中抽出若干份答卷,其中从选择A题作答的答卷中抽出了3份,则应分别从选择B,C题作答的答卷中各抽出多少份?(Ⅱ)测试后的统计数据显示,A题的答卷得优的有60份,若以频率作为概率,在(Ⅰ)问中被抽出的选择A题作答的答卷中,记其中得优的份数为,求的分布列及其数学期望.20.近年来,国资委.党委高度重视扶贫开发工作,坚决贯彻落实中央扶贫工作重大决策部署,在各个贫困县全力推进定点扶贫各项工作,取得了积极成效,某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面积以及相应的管理时间的关系如下表所示:土地使用面积(单位:亩) 1 2管理时间(单位:月)并调查了某村300名村民参与管理的意愿,得到的部分数据如下表所示:参考公式:其中.临界值表:0.100 0.050 0.025 0.010 0.001参考数据:(1)求出相关系数的大小,并判断管理时间与土地使用面积是否线性相关?(2)是否有99.9%的把握认为村民的性别与参与管理的意愿具有相关性?(3)若以该村的村民的性别与参与管理意愿的情况估计贫困县的情况,则从该贫困县中任取3人,记取到不愿意参与管理的男性村民的人数为,求的分布列及数学期望.21.出版商为了解某科普书一个季度的销售量y(单位:千本)和利润x(单位:元/本)之间的关系,对近年来几次调价之后的季销售量进行统计分析,得到如下的10组数据.根据上述数据画出如图所示的散点图:参考公式及参考数据:①对于一组数据(u1,v1),(u2,v2),…,(u n,v n),其回归直线的斜率和截距的公式分别为, .②参考数据:表中u i=Inx i,= .另:In4.06≈1.40.计算时,所有的小数都精确到0.01.(1)根据图中所示的散点图判断y=ax+b和y=clnx+d哪个更适宜作为销售量y关于利润x的回归方程类型?(给出判断即可,不需要说明理由);(2)根据(1)中的判断结果及参考数据,求出y关于x的回归方程;(3)根据回归方程分析:设该科普书一个季度的利润总额为:(单位:千元),当季销售量y为何值时,该书一个季度的利润总额预报值最大?(季利润总额=季销售量×每本书的利润)22.某险种的基本保费为(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:随机调查了该险种的200名续保人在一年内的出险情况,得到如下统计表:(I)记A为事件:“一续保人本年度的保费不高于基本保费”.求P(A)的估计值;(Ⅱ)记B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.求P(B)的估计值;(Ⅲ)求续保人本年度的平均保费估计值.23.为了研究55岁左右的中国人睡眠质量与心脑血管病是否有关联,某机构在适龄人群中随机抽取了100万个样本,调查了他们每周是否至少三个晚上出现了三种失眠症状,症状:入睡困难;症状:醒得太早;症状:不能深度入睡或做梦,得到的调查数据如下:数据1:出现症状人数为8.5万,出现症状人数为9.3万,出现症状人数为6.5万,其中含症状同时出现1.8万人,症状同时出现1万人,症状同时出现2万人,症状同时出现0.5万人;数据2:同时有失眠症状和患心脑血管病的人数为5万人,没有失眠症状且无心脑血管病的人数为73万人.(Ⅰ)依据上述数据试分析55岁左右的中国人患有失眠症的比例大约多少?(Ⅱ)根据以上数据完成如下列联表,并根据所填列联表判断能否有95%的把握说明失眠与心脑血管病存在“强关联”?参考数据如下:0.500.05参考公式:答案一、单选题1. B2. D3. B4. B5. D6. D7. D8. D9. B 10. C二、填空题11. 7 12. 13. 30 14. 15 15. 2 16. 10 17. 1.6三、解答题18. (1)解:由题意,知高一、高二、高三年级的人数之比为,由于采用分层抽样方法从中选取人,因此,高一年级应选取人,高二年级应选取人,高三年级应选取人.(2)解:由(1)知,被选取的名学生高一、高二、高三年级分别有人、人、人,所以,从这名学生任选名,且名学生分别来自三个年级的概率为.(3)解:由题意知,随机变量的所有可能取值为,且服从超几何分布,().所以,随机变量的分布列为所以,随机变量的数学期望为.19. 解:解:(Ⅰ)由题意可得:应分别从B,C题的答卷中抽出5份,2份.(Ⅱ)由题意可知,A题答案得优的概率为,显然被抽出的A题的答案中得优的份数x的可能取值为0,1,2,3,且.;;;随机变量x的分布列为:所以.20. (1)解:依题意:故则,故管理时间与土地使用面积线性相关.(2)解:依题意,完善表格如下:计算得的观测值为故有99.9%的把握认为村民的性别与参与管理的意愿具有相关性.(3)解:依题意,的可能取值为0,1,2,3,从该贫困县中随机抽取一名,则取到不愿意参与管理的男性村民的概率为,故故的分布列为则数学期望为(或由,得21. (1)解:y=cln x+d更适宜作为销售量y关于利润x的回归方程类型(2)解:令u=lnx,先建立y关于u的线性回归方程,由于,=6.63+10.20×1.75=24.48,所以x关于u的线性回归方程为=24.48-10.20u,即y关于x的回归方程为=24.48-10.20lnx.(3)解:由题意得z=xy=x(24.48-10.20lnx),z'=[x(24.48-10.20lnx)]'=14.28-10.20lnx,令z'=0 即14.28-10.20lnx=0,解得lnx=1.40,所以x≈4.06.当x∈(0,4.06)时,z'>0,所以z在(0,4.06)上单调递增,当x∈(4.06,+∞)时,z'<0,所以z在(4.06,+∞)上单调递减,所以当x=4.06时,即季销量y=10.20千本时,季利润总额预报值最大22. 解:(I)记A为事件:“一续保人本年度的保费不高于基本保费”.事件A的人数为:60+50=110,该险种的200名续保,P(A)的估计值为:;(Ⅱ)记B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.事件B的人数为:30+30=60,P(B)的估计值为:;(Ⅲ)续保人本年度的平均保费估计值为1.1925a.23. 解:(Ⅰ)设{出现症状的人}、{出现症状的人}、{出现症状的人}(表示有限集合元素个数)根据数据1可知,,,,所以得患失眠症总人数为20万人,比例大约为20%(Ⅱ)根据数据2可得:有95%的把握说明失眠与中风或心脏病存在“强关联”.第11 页共11 页。
统计有关经典例题解析、及高考题50道,带答案
【经典例题】【例1】(2008广东).为了调查某厂工人生产某种产品的能力,随机抽 查了20位工人某天生产该产品的数量.产品数量的分组区间为[)45,55,[)[)[)55,65,65,75,75,85,[)85,95由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在[)55,75的 人数是 . 【答案】13【解析】20(0.06510)13⨯⨯=,故答案为13.【例2】(2009山东)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的 产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( ).A. 90B.75C. 60D.45【答案】A【解析】产品净重小于100克的概率为(0.050+0.100)×2=0.300, 已知样本中产品净重小于100克的个数是36,设样本容量为n , 则300.036=n,所以120=n ,净重大于或等于98克并且小于104克的产品的概率为(0.100+0.150+0.125)×2=0.75,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.75=90.故选A.【例3】(2009上海)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”。
根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A. 甲地:总体均值为3,中位数为4B. 乙地:总体均值为1,总体方差大于0C. 丙地:中位数为2,众数为3D. 丁地:总体均值为2,总体方差为3 【答案】D【解析】根据信息可知,连续10天内,每天的新增疑似病例不能有超过7的数,选项A 中,中位数为4,可能存在大于7的数;同理,在选项C 中也有可能;选项B 中的总体方差大于0,叙述不明确,如果数目太大,也有可能存在大于7的数;选项D 中,根据方差公式,如果有大于7的数存在,那么方差不会为3,故答案选D.第8题图【例4】(2009湖北)下图是样本容量为200的频率分布直方图。
高中统计案例试题及答案
高中统计案例试题及答案一、单项选择题(每题2分,共10分)1. 在统计学中,以下哪个选项不是数据收集的方法?A. 观察法B. 实验法C. 调查法D. 访谈法答案:D2. 以下哪种图形最适合展示两个变量之间的关系?A. 条形图B. 折线图C. 饼图D. 散点图答案:D3. 以下哪个指标可以用来衡量数据的离散程度?A. 平均数B. 中位数C. 众数D. 方差答案:D4. 在统计学中,以下哪个概念是描述数据分布的中心位置?A. 极差B. 四分位数C. 标准差D. 均值答案:D5. 以下哪个统计图可以展示数据随时间的变化趋势?A. 柱状图B. 饼图C. 散点图D. 折线图答案:D二、多项选择题(每题3分,共15分)1. 下列哪些因素会影响样本的代表性?A. 样本大小B. 抽样方法C. 样本的随机性D. 样本的多样性答案:A、B、C、D2. 在进行数据整理时,以下哪些步骤是必要的?A. 数据清洗B. 数据分类C. 数据编码D. 数据汇总答案:A、B、C、D3. 以下哪些统计量可以用来描述一组数据的集中趋势?A. 平均数B. 中位数C. 众数D. 极差答案:A、B、C4. 在统计分析中,以下哪些方法可以用来预测未来趋势?A. 线性回归B. 时间序列分析C. 移动平均法D. 指数平滑法答案:A、B、C、D5. 以下哪些图形可以用来展示分类数据的分布?A. 条形图B. 折线图C. 饼图D. 直方图答案:A、C三、填空题(每题2分,共10分)1. 在统计学中,数据的收集、处理、分析和解释的过程称为______。
答案:统计过程2. 当数据按照大小顺序排列后,位于中间位置的数值被称为______。
答案:中位数3. 标准差是衡量数据______程度的统计量。
答案:离散4. 在进行假设检验时,如果原假设被拒绝,则我们认为存在______。
答案:统计显著性5. 相关系数是用来衡量两个变量之间______关系的指标。
答案:线性相关四、简答题(每题5分,共20分)1. 简述什么是抽样误差,并举例说明。
(好题)高中数学选修1-2第一章《统计案例》测试卷(包含答案解析)(2)
一、选择题1.下列说法:①对于独立性检验,2χ的值越大,说明两事件相关程度越大;②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则c ,k 的值分别是4e 和0.3;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程y a bx =+中,2b =,1x =,3y =,则1a =;④通过回归直线y bx a =+及回归系数b ,可以精确反映变量的取值和变化趋势,其中正确的个数是( ) A .1B .2C .3D .42.甲射击时命中目标的概率为0.75,乙射击时命中目标的概率为23,则甲乙两人各自射击同一目标一次,则该目标被击中的概率为( ) A .12B .1C .56D .11123.已知12P(B|A)=,P(A)=35,则()P AB 等于( ) A .56B .910 C .215D .1154.从装有形状大小相同的3个黑球和2个白球的盒子中依次不放回地任意抽取3次,若第二次抽得黑球,则第三次抽得白球的概率等于( ) A .15B .14C .13D .125.某商品的售价x (元)和销售量y (件)之间的一组数据如下表所示:由散点图可知,销售量y 与价格x 之间有较好的线性相关关系,且回归直线方程是3.ˆ2yx a =-+,则实数a =( ) A .30B .35C .38D .406.在一次独立性检验中,得出列表如下:合计 190 400a + 590a +且最后发现,两个分类变量A 和B 没有任何关系,则a 的可能值是( ) A .720 B .360C .180D .907.工人月工资(元)关于劳动生产率x(千元)的回归方程为,下列说法中正确的个数是( )①劳动生产率为1000元时,工资为730元; ②劳动生产率提高1000元,则工资提高80元; ③劳动生产率提高1000元,则工资提高730元; ④当月工资为810元时,劳动生产率约为2000元. A .1B .2C .3D .48.将两枚质地均匀的骰子各掷一次,设事件A ={两个点数互不相同},B ={出现一个5点},则()/P B A =( ) A .13B .518C .16D .149.甲乙丙三位同学独立的解决同一个问题,已知三位同学单独正确解决这个问题的概率分别为12,13,15,则有人能够解决这个问题的概率为( ) A .130 B .415C .1115D .131510.甲、乙两位同学各自独立地解答同一个问题,他们能够正确解答该问题的概率分别是23和12,在这个问题至少被一个人正确解答的条件下,甲、乙两位同学都能正确解答该问题的概率为( )A .27B .25C .15D .1911.为了研究经常使用手机是否对数学学习成绩有影响,某校高二数学研究性学习小组进行了调查,随机抽取高二年级50名学生的一次数学单元测试成绩,并制成下面的2×2列联表:及格 不及格 合计 很少使用手机 20 5 25 经常使用手机 10 15 25 合计302050则有( )的把握认为经常使用手机对数学学习成绩有影响.参考公式:()()()()()22=n ad bc K a b c d a c b d -++++,其中n a b c d =+++()2P K k ≥ 0.150.10 0.05 0.025 0.010 0.005 0.001 k 2.0722.7063.8415.0246.6357.87910.828A .97.5%B .99%C .99.5%D .99.9%12.甲、乙两人独立地破译一份密码,破译的概率分别为11,32,则密码被破译的概率为( ) A .16B .23C .56D .1二、填空题13.有甲、乙两台机床生产某种零件,甲获得正品乙不是正品的概率为14,乙获得正品甲不是正品的概率为16,且每台获得正品的概率均大于12,则甲乙同时生产这种零件,至少一台获得正品的概率是___________.14.三个元件正常工作的概率分别为,,,将两个元件并联后再和串联接入电路,如图所示,则电路不发生故障的概率为_________.15.下列4个命题:①为了了解800名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔为40;②四边形ABCD 为长方形,2AB =,1BC =,O 为AB 中点,在长方形ABCD 内随机取一点P ,取得的P 点到O 的距离大于1的概率为12π-; ③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 2y x =的图象; ④已知回归直线的斜率的估计值为1.23,样本点的中心为()4,5,则回归直线方程为1.230.08y x =+.其中正确的命题有__________.(填上所有正确命题的编号)16.设甲、乙两套方案在一次试验中通过的概率均为0.3,且两套方案在试验过程中相互之间没有影响,则两套方案在一次试验中至少有一套通过的概率为___________. 17.关于变量,x y 的一组样本数据11()a b ,,22()a b ,,……,(),n n a b (2n ≥,12,,,n a a a ⋅⋅⋅不全相等)的散点图中,若所有样本点(,)i i a b (1,2,,i n =⋅⋅⋅)恰好都在直线21y x =-+上,则根据这组样本数据推断的变量,x y 的相关系数为_____________.18.把一枚硬币任意抛掷三次,事件A =“至少出现一次反面”,事件B =“恰好出现一次正面”,则(/)P B A =__________.19.甲、乙两个小组各10名学生的英语口语测试成绩的茎叶图如图所示.现从这 20名学生中随机抽取一人,将“抽出的学生为甲小组学生”记为事件A ;“抽出的学生英语口语测试成绩不低于85分”记为事件B .则P (A|B )的值是_____.20.2020年新型冠状病毒疫情期间,大学生小白同学在家里根据某款运动软件安排的训练计划进行运动,每天训练一次,连续3天为一个运动周期,若小白每天不能参加训练的概率为14,假设小白每天的训练是相互独立的,若一个训练周期内出现2次不能参加训练,则停止该训练计划,则这个训练计划在第二个完整周期后结束的概率为______.三、解答题21.一网络公司为某贫困山区培养了100名“乡土直播员”,以帮助宣传该山区文化和销售该山区的农副产品,从而带领山区人民早日脱贫致富.该公司将这100名“乡土直播员”中每天直播时间不少于5小时的评为“网红乡土直播员”,其余的评为“乡土直播达人”.根据实际评选结果得到了下面22⨯列联表:网红乡土直播员 乡土直播达人 合计 男 10 40 50 女 20 30 50 合计3070100(2)在“网红乡土直播员”中按分层抽样的方法抽取6人,在这6人中选2人作为“乡土直播推广大使”.求这两人中恰有一男一女的概率.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥0.15 0.10 0.05 0.025 0.010 0.005 0.00122.近年来,随着互联网的发展,诸如“滴滴打车”“神州专车”等网约车服务在我国各城市迅猛发展,为人们出行提供了便利,但也给城市交通管理带来了一些困难.为掌握网约车在M省的发展情况,M省某调查机构从该省抽取了5个城市,分别收集和分析了网约车的A,B两项指标数,(1,2,3,4,5)i ix y i=,数据如下表所示:==2s==.(1)试求y与x间的相关系数r,并利用r说明y与x是否具有较强的线性相关关系(若0.75r>,则线性相关程度很高,可用线性回归模型拟合);(2)建立y关于x的回归方程,并预测当A指标数为7时,B指标数的估计值;(3)若城市的网约车A指标数x落在区间(3,3)x s x s-+之外,则认为该城市网约车数量过多,会对城市交通管理带来较大的影响,交通管理部门将介入进行治理,直至A指标数x回落到区间(3,3)x s x s-+之内.现已知2018年11月该城市网约车的A指标数为13,问:该城市的交通管理部门是否要介入进行治理?试说明理由.附:相关公式:()()ni ix x y yr--=∑,121()()()ni iiniix x y ybx x==--=-∑∑,a y bx=-.0.55≈0.95≈.23.随着网络的发展,人们可以在网络上购物、玩游戏、聊天、导航等,所以人们对上网流量的需求越来越大.某电信运营商推出一款新的“流量包”套餐.为了调查不同年龄的人是否愿意选择此款“流量包”套餐,随机抽取50个用户按年龄分组进行访谈,统计结果如下表.(1)若在第2、3、4组愿意选择此款“流量包”套餐的人中,用分层抽样的方法抽取15人,则各组应分别抽取多少人?(2)若从第5组的被调查者访谈人中随机选取2人进行追踪调查,求2人中至少有1人愿意选择此款“流量包”套餐的概率.(3)按以上统计数据填写下面2×2列联表,并判断以50岁为分界点,能否在犯错误不超过1%的前提下认为是否愿意选择此款“流量包”套餐与人的年龄有关;参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.24.目前,新冠病毒引发的肺炎疫情在全球肆虐,为了解新冠肺炎传播途径,采取有效防控措施,某医院组织专家统计了该地区500名患者新冠病毒潜伏期的相关信息,数据经过汇总整理得到如下图所示的频率分布直方图(用频率作为概率).潜伏期不高于平均数的患者,称为“短潜伏者”,潜伏期高于平均数的患者,称为“长潜伏者”.(1)求这500名患者潜伏期的平均数(同一组中的数据用该组区间的中点值作代表),并计算出这500名患者中“长潜伏者”的人数;(2)为研究潜伏期与患者年龄的关系,以潜伏期是否高于平均数为标准进行分层抽样,从上述500名患者中抽取300人,得到如下列联表,请将列联表补充完整,并根据列联表判断是否有97.5%的把握认为潜伏期长短与患者年龄有关:(3)研究发现,有5种药物对新冠病毒有一定的抑制作用,其中有2种特别有效,现在要通过逐一试验直到把这2种特别有效的药物找出来为止,每一次试验花费的费用是500元,设所需要的试验费用为X ,求X 的分布列与数学期望. 附表及公式:()20P K k ≥ 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0k2.0722.7063.8415.0246.6357.87910.82822()()()()()n ad bc K a b c d a c b d -=++++25.支付宝作为一款移动支付工具,在日常生活中起到了重要的作用.(1)通过现场调查12位市民得知,其中有10人使用支付宝.现从这12位市民中随机抽取3人,求至少抽到2位使用支付宝的市民的概率;(2)为了鼓励市民使用支付宝,支付宝推出了“奖励金”活动,每使用支付宝支付一次,分别有12,13,16的概率获得0.1,0.2,0.3元奖励金,每次支付获得的奖励金情况互不影响.若某位市民在一天内使用了2次支付宝,记X 为这一天他获得的奖励金数,求X 的概率分布和数学期望.26.新能源汽车已经走进我们的生活,逐渐为大家所青睐.现在有某品牌的新能源汽车在甲市进行预售,预售场面异常火爆,故该经销商采用竞价策略基本规则是:①竞价者都是网络报价,每个人并不知晓其他人的报价,也不知道参与竞价的总人数;②竞价采用“一月一期制”,当月竞价时间截止后,系统根据当期汽车配额,按照竞价人的出价从高到低分配名额.某人拟参加2020年6月份的汽车竞价,他为了预测最低成交价,根据网站的公告,统计了最近5个月参与竞价的人数(如下表) 月份2020.012020.022020.032020.042020.05(1)由收集数据的散点图发现,可用线性回归模型拟合竞价人数y (万人)与月份编号t 之间的相关关系.请用最小二乘法求y 关于t 的线性回归方程:ˆ bt y a =+,并预测2020年6月份(月份编号为6)参与竞价的人数;(2)某市场调研机构对200位拟参加2020年6月份汽车竞价人员的报价进行了一个抽样调查,得到如表所示的频数表:(i )求这200位竞价人员报价的平均值x 和样本方差s 2(同一区间的报价用该价格区间的中点值代替)(ii )假设所有参与竞价人员的报价X 可视为服从正态分布()2,,N μσ且μ与σ2可分别由(i )中所示的样本平均数x 及s 2估计.若2020年月6份计划提供的新能源车辆数为3174,根据市场调研,最低成交价高于样本平均数x ,请你预测(需说明理由)最低成交价. 参考公式及数据:①回归方程ˆˆˆy bx a =+,其中1221ˆˆˆ,ni ii nii x y nx ybay bx xnx ==-⋅==--∑∑ ②5521155, 2.6;ii i i i tx y ====≈∑∑③若随机变量X 服从正态分布()2,,N μσ则()()0.6826,220.9544,P X P X μσμσμσμσ-<<+=-<<+= ()330.9974P X μσμσ-<<+=.【参考答案】***试卷处理标记,请不要删除一、选择题1.C 解析:C 【分析】根据独立性检验、非线性回归方程以及回归直线方程相关知识进行判断. 【详解】对于命题①,根据独立性检验的性质知,两个分类变量2χ越大,说明两个分类变量相关程度越大,命题①正确;对于命题②,由kxy ce =,两边取自然对数,可得ln ln y c kx =+,令ln z y =,得ln z kx c =+,0.34z x =+,所以ln 40.3c k =⎧⎨=⎩,则40.3c e k ⎧=⎨=⎩,命题②正确;对于命题③,回归直线方程y a bx =+中,3211a y bx =-=-⨯=,命题③正确; 对于命题④,通过回归直线y bx a =+及回归系数b ,可估计和预测变量的取值和变化趋势,命题④错误.故选C. 【点睛】本题考查了回归直线方程、非线性回归方程变换以及独立性检验相关知识,考查推理能力,属于中等题.2.D解析:D 【分析】记事件:A 甲乙两人各自射击同一目标一次,该目标被击中,利用独立事件的概率乘法公式计算出事件A 的对立事件的概率,再利用对立事件的概率公式可得出事件A 的概率. 【详解】记事件:A 甲乙两人各自射击同一目标一次,该目标被击中, 则事件:A 甲乙两人各自射击同一目标一次,两人都未击中目标, 由独立事件的概率乘法公式得()321114312P A ⎛⎫⎛⎫=--= ⎪⎪⎝⎭⎝⎭, ()()111111212P A P A ∴=-=-=,故选D. 【点睛】本题考查独立事件的概率乘法公式,解题时要弄清楚各事件之间的关系,可以采用分类讨论,本题采用对立事件求解,可简化分类讨论,属于中等题.3.C解析:C 【解析】分析:根据条件概率的计算公式,即可求解答案.详解:由题意,根据条件概率的计算公式()()|()P AB P B A P A =, 则()()()122|3515P AB P B A P A =⋅=⨯=,故选C. 点睛:本题主要考查了条件概率的计算公式的应用,其中熟记条件概率的计算公式是解答的关键,着重考查了推理与运算能力.4.D解析:D 【解析】分析:这是一个条件概率,可用古典概型概率公式计算,即从5个球中取三个排列,总体事件是第二次是黑球,可在第二次是黑球的条件下抽排第一次和第三次球.详解:111223122412C C C P C A ==. 点睛:此题是一个条件概率,条件是第二次抽取的是黑球,不能误以为是求第二次抽到黑球,第三次抽到白球的概率,如果那样求得错误结论为1132353310C C A ⨯=. 5.D解析:D 【解析】由表中数据知,199.51010.511105x =⨯++++=(),1111086585y =⨯++++=(),代入回归直线方程 3.ˆ2yx a =-+中,求得实数 3.28 3.21040a y x =+=+⨯=,故选D. 6.B解析:B 【解析】∵两个分类变量A 和B 没有任何关系,∴()()()()2259010090400 2.70219040090500a a K a a +-⨯=<⨯++,代入验证可知360a =满足,故选B.7.C解析:C 【解析】对于①当劳动生产率为1000元时,工资为65080730y =+=元,故①正确;对于②劳动生产率提高1000元,则工资提高80元正确;故③错误;对于④当月工资为810元时,由81065080x =+得2x =,即劳动生产率约为2000元,故④正确;故选C.8.A解析:A 【解析】由题意事件A={两个点数都不相同},包含的基本事件数是36−6=30, 事件B:出现一个5点,有10种,∴()101303|P B A ==, 本题选择A 选项.点睛:条件概率的计算方法:(1)利用定义,求P (A )和P (AB ),然后利用公式进行计算;(2)借助古典概型概率公式,先求事件A 包含的基本事件数n (A ),再求事件A 与事件B 的交事件中包含的基本事件数n (AB ),然后求概率值.9.C解析:C 【分析】先利用相互独立事件的概率乘法公式求出“三人都未解答这个问题”的概率,利用对立事件的概率公式得到“有人能够解决这个问题”的概率即可. 【详解】三人都未解答这个问题的概率为 (112-)(113-)(115-)415=,故有人能够解决这个问题的概率为14111515-=, 故选:C . 【点睛】本题考查了相互独立事件的概率乘法公式、互斥事件和对立事件的概率公式,考查了正难则反的原则,属于中档题.10.B解析:B 【分析】先计算“这个问题至少被一个人正确解答”和“甲、乙两位同学都能正确解答该问题”概率,再利用条件概率公式计算即可. 【详解】由已知,不妨设A =“这个问题至少被一个人正确解答”,B =“甲、乙两位同学都能正确解答该问题”,因为甲、乙两位同学各自独立正确解答该问题的概率分别是23和12, 故215()111326P A ⎛⎫⎛⎫=---= ⎪⎪⎝⎭⎝⎭,121()233P B =⨯=,易知1()()3P AB P B ==.故()1()235()56P AB P BA P A ===∣. 故选:B. 【点睛】本题考查了条件概率的应用,属于中档题.11.C解析:C 【分析】根据2×2列联表,求出k 的观测值2K ,结合题中表格数据即可得出结论. 【详解】 由题意,可得:222()50(2015105)258.3337.879()()()()302025253n ad bc K a b c d a c b d -⨯⨯-⨯===≈>++++⨯⨯⨯,所以有99.5%的把握认为经常使用手机对数学学习成绩有影响. 故选C. 【点睛】本题考查了独立性检验的应用,考查了计算能力,属于基础题.12.B解析:B 【分析】密码被破译分三种情况:甲破译出密码乙未破译,乙破译出密码甲未破译,甲乙都破译出密码,根据相互独立事件的概率和公式可求解出答案. 【详解】设 “甲独立地破译一份密码” 为事件A , “乙独立地破译一份密码” 为事件B , 则()13P A =,()12P B =,()12133P A =-=,()11122P B =-=, 设 “密码被破译” 为事件C ,则()()()()P C P AB P AB P AB =++11211123232323=⨯+⨯+⨯=, 故选:B. 【点睛】本题以实际问题为背景考查相互独立事件的概念及其发生的概率的计算,考查分析问题和解决问题的能力,属于中档题.二、填空题13.【分析】设甲乙两台机床生产正品的概率分别为则根据题意列方程组解得甲乙同时生产这种零件至少一台获得正品为甲获得正品乙不是正品乙获得正品甲不是正品以及甲乙均获得正品根据概率加法公式求解即可【详解】设甲乙 解析:1112【分析】设甲乙两台机床生产正品的概率分别为p ,q ,则112p <≤,112q <≤,根据题意列方程组()()114116p q q p ⎧-=⎪⎪⎨⎪-=⎪⎩,解得3423p q ⎧=⎪⎪⎨⎪=⎪⎩,“甲乙同时生产这种零件,至少一台获得正品”为甲获得正品乙不是正品,乙获得正品甲不是正品,以及甲乙均获得正品,根据概率加法公式求解即可. 【详解】设甲乙两台机床生产正品的概率分别为p ,q ,则112p <≤,112q <≤. 甲获得正品乙不是正品的概率为14()114p q ∴-=① 又乙获得正品甲不是正品的概率为16()116q p ∴-=② ①②联立得()()114116p q q p ⎧-=⎪⎪⎨⎪-=⎪⎩,解得3423p q ⎧=⎪⎪⎨⎪=⎪⎩则甲乙均获得正品的概率为321432p q ⋅=⨯= 即甲乙同时生产这种零件,至少一台获得正品的概率是1111146212++= 故答案为:1112【点睛】本题考查概率的加法与乘法公式,属于中档题.14.【解析】分析:组成的并联电路可从反面计算即先计算发生故障的概率然后用对立事件概率得出不发生故障概率详解:由题意故答案为点睛:零件不发生故障的概率分别为则它们组成的电路中如果是串联电路则不发生故障的概解析:【解析】分析:23,T T 组成的并联电路可从反面计算,即先计算发生故障的概率,然后用对立事件概率得出不发生故障概率. 详解:由题意11115(1)24432P =⨯-⨯=. 故答案为1532. 点睛:零件12,,,k a a a 不发生故障的概率分别为12,,,k p p p ,则它们组成的电路中,如果是串联电路,则不发生故障的概率易于计算,即为12k p p p ,如果组成的是并联电路,则发生故障的概率易于计算,即为12(1)(1)(1)k p p p ---.15.③④【解析】①为了了解800名学生对学校某项教改试验的意见打算从中抽取一个容量为40的样本考虑用系统抽样则分段的间隔为800÷40=20故①错误;②已知如图所示:长方形面积为2以O 为圆心1为半径作圆解析:③④ 【解析】①为了了解800名学生对学校某项教改试验的意见, 打算从中抽取一个容量为40的样本,考虑用系统抽样, 则分段的间隔为800÷40=20,故①错误; ②已知如图所示:长方形面积为2,以O 为圆心,1为半径作圆, 在矩形内部的部分(半圆)面积为π2. 因此取到的点到O 的距离大于1的概率22P 124ππ-==-; 故②错误; ③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 23sin263y x x ππ⎡⎤⎛⎫=-+= ⎪⎢⎥⎝⎭⎣⎦的图象, 故③正确,④∵回归直线为ˆybx a =+, 的斜率的值为1.23, ∴方程为 1.23ˆyx a =+,∵直线过样本点的中心(4,5), ∴a=0.08,∴回归直线方程是为=1.23x+0.08; ∴故④正确. 故答案为:③④.16.51【解析】由于两套方案互不影响故至少有一套方案通过的概率是解析:51 【解析】由于两套方案互不影响,故至少有一套方案通过的概率是2120.3C 0.3(10.3)0.51+⋅⋅-=.17.-【解析】所有样本点都在直线上说明这两个变量间完全负相关故其相关系数为-1故填-1解析:-1 【解析】所有样本点都在直线上,说明这两个变量间完全负相关,故其相关系数为-1,故填-1.18.【解析】表示在已经发生事件的情况下事件发生的概率又事件恰有一次出现正面包含于事件至少一次出现反面所以所以解析:37【解析】(/)P B A 表示在已经发生事件A 的情况下,事件B 发生的概率,又事件B = “恰有一次出现正面”包含于事件A =“至少一次出现反面”,所以()()(/)()()P AB P B P B A P A P A ==,37(),()88P B P A ==,所以()3()7P B P A =. 19.【解析】试题分析:抽出的学生英语口语测试成绩不低于85分的有9种其中抽出的学生为甲小组学生的事件有5种所以概率为考点:条件概率 解析:【解析】试题分析:抽出的学生英语口语测试成绩不低于85分的有9种,其中抽出的学生为甲小组学生”的事件有5种,所以概率为59. 考点:条件概率.20.【分析】由题意求得一个周期内就停止训练的概率再结合相互独立事件的概率计算公式即可求解【详解】由题意小白每天不能参加训练的概率为若一个训练周期内出现2次不能参加训练可得一个周期内就停止训练的概率为这个 解析:811024【分析】由题意,求得一个周期内就停止训练的概率,再结合相互独立事件的概率计算公式,即可求解.【详解】由题意,小白每天不能参加训练的概率为14,若一个训练周期内出现2次不能参加训练,可得一个周期内就停止训练的概率为221135244432⎛⎫⎛⎫+⨯⨯=⎪ ⎪⎝⎭⎝⎭,这个训练计划持续两个周期的概率为2513811232441024⎛⎫⎛⎫-⨯⨯⨯=⎪ ⎪⎝⎭⎝⎭.故答案为:81 1024.【点睛】本题主要考查了相互独立事件的概率的计算,其中解答中正确理解题意,结合独立事件的概率计算公式求得一个周期内就停止训练的概率是解答的关键,着重考查分析问题和解答问题的能力.三、解答题21.(1)有95%的把握认为“网红乡土直播员”与性别有关系;(2)8 15.【分析】(1)由题中22⨯列联表中的数据代入()()()()()22n ad bcKa b c d a c b d-=++++然后与所给表值进行比较可得答案;(2)列出从这6人中随机抽取2人的所有可能情况,选中的2人中恰有一男一女的所有可能情况可得答案.【详解】(1)由题中22⨯列联表,可得()22100103020404.762 3.84150503070K⨯-⨯=≈>⨯⨯⨯.∴有95%的把握认为“网红乡土直播员”与性别有关系.(2)在“网红乡土直播员”中按分层抽样的方法抽取6人,男性人数为106230⨯=人,记为A,B;女性人数为206430⨯=人,记为a,b,c,d.则从这6人中随机抽取2人的所有可能情况有以下“A,B;A,a;A,b;A,c;A,d;B ,a ; B ,b ; B ,c ; B ,d ;a ,b ; a ,c ; a ,d ; b ,c ; b ,d ; c ,d ”共15种.其中,选中的2人中恰有一男一女的所有可能情况有以下“A ,a ; A ,b ; A ,c ; A ,d ; B ,a ; B ,b ; B ,c ; B ,d ”共8种. ∴选中的2人中恰有一男一女的概率815P =. 【点睛】古典概型的概率的计算方法,首先计算所有基本事件数,再计算事件A 包含的基本事件数,应用古典概率公式计算求解.22.(1)0.95r ≈,y 与x 具有较强的线性相关关系,可用线性回归模型拟合y 与x 的关系;(2)35102y x =+,当7x =时, 4.6y =;(3)要介入进行治理. 【分析】(1)由已知数据可得,x y ,利用公式,求得相关系数r ,即可作出判断,得到结论;(2)由(1),求得b 和ˆa,求得回归直线的方程,代入7x =,即可求得回归方程; (3)由(3,3)(1,11)x s x s -+=-,而1311>,即可得到结论. 【详解】(1)由已知数据可得2456855x ++++==,3444545y ++++==.所以相关系数5()x x y y r --=0.95==≈. 因为0.75r >,所以y 与x 具有较强的线性相关关系,可用线性回归模型拟合y 与x 的关系.(2)由(1)可知()51521()632ˆ010()i i i i i x x y y b x x ==--===-∑∑,354ˆ2ˆ510a y bx =-=-⨯=, 所以y 与x 之间线性回归方程为35102ˆy x =+. 当7x =时,3576102ˆ 4.y=⨯+=. (3)()()3,31,11x s x s -+=-,而1311>,故2018年11月该城市的网约车已对城市交通带来较大的影响,交通管理部门将介入进行治理. 【点睛】本题主要考查了回归直线方程的求解及应用问题,其中解答中,认真审题,正确理解题意,利用公式准确计算是解答此类问题的关键,着重考查了推理与运算能力,属于基础题.23.(1)各组分别为5人,6人,4人;(2)35;(3)在犯错误不超过1%的前提下认为是否愿意选择此款“流量包”套餐与人的年龄有关. 【解析】试题分析:(1)三组一共有30人,抽取15人,故两个人抽一人,由此得到抽取的人数分别为5,6,4人.(2)利用列举法列举出所有可能性有15种,其中符合题意的有9种,故概率为35.(3)根据题意填写好表格后,计算29.979 6.635K ≈>,故有在犯错误不超过1%的前提下认为是否愿意选择此款“流量包”套餐与人的年龄有关. 试题解:(1)因为1012815=5,15=615=4303030,⨯⨯⨯,所以第2、3、4组愿意选择此款“流量包”套餐的人中,用分层抽样的方法抽取15人,各组分别为5人,6人,4人.(2)设第5组中不愿意选择此款“流量包”套餐A,B,C,D,愿意选择此款“流量包”套餐人为a,b,则愿意从6人中选取2人有:,,,,,,,,,,,,,,,AB AC AD Aa Ab BC BD Ba Bb CD Ca Cb Da Db ab 共15个结果,其中至少有1人愿意选择此款“流量包”,,,,,,,,,Aa Ab Ba Bb Ca Cb Da Db ab 共9个结果,所以求2人中至少有1人愿意选择此款“流量包”套餐的概率93155P ==. (3)2×2列联表∴()()()()25010310279.979 6.63510271031010273K ⨯⨯-⨯=≈>++++∴在犯错误不超过1%的前提下认为是否愿意选择此款“流量包”套餐与人的年龄有关. 24.(1)平均数为6,“长潜伏者”的人数为250人(2)列联表见解析, 有97.5%的把握认为潜伏期长短与年龄有关 (3)分布列见解析,()1750E X = 【分析】(1)由频率分布直方图可计算出潜伏期的均值,再由频率分布直方图可得“长潜伏者”的频率,从而得人数;(2)由所给数据计算出2K 后可得结论;(3)由题意知所需要的试验费用X 所有可能的取值为1000,1500,2000,分别计算出概率得概率分布列,再由期望公式得期望.。
高考数学专题 统计与统计案例【学生试卷】
2020最新统计与统计案例A 卷一、选择题1.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()A.r2<r4<0<r3<r1B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3 2.在某次测量中得到的A样本数据如下:480,481,482,483,584,585,586,587,588,589.若B样本数据恰好是A样本数据都加10后所得数据,则A,B两样本的下列数字特征对应相同的有()A.众数B.平均数C.中位数D.标准差3.(2018·辽宁五校协作体模拟)为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验,根据四个实验室得到的列联表画出如下四个等高条形图,最能体现该药物对预防禽流感有显著效果的图形是()4.(2018·成都一模)空气质量指数AQI是检测空气质量的重要参数,其数值越大说明空气污染状况越严重,空气质量越差.某地环保部门统计了该地区12月1日至12月24日连续24天的空气质量指数AQI,根据得到的数据绘制出如图所示的折线图.则下列说法错误的是()A.该地区在12月2日空气质量最好B.该地区在12月24日空气质量最差C.该地区从12月7日到12月12日AQI持续增大D.该地区的空气质量指数AQI与这段日期成负相关5.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为42的样本,则分别应抽取老年人、中年人、青年人的人数是()A.7,11,18 B.6,12,18 C.6,13,17 D.7,14,216.通过随机询问110由K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)算得,K2=110×(40×30-20×20)260×50×60×50≈7.8.附表:A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”7.某市为了调查学生在学科教辅书方面的支出情况,特地在20000名高中生中抽样调查了500名学生在学科教辅书方面的支出情况,其频率分布直方图如图所示,据此估计,该市20000名高中生中,支出的钱数在[30,40]元的同学比支出的钱数在[10,20]元的同学多()A.2600人B.5200人C.260人D.520人8.^=7.19x+根据以上样本数据,她建立的身高y(cm)与年龄x(周岁)的线性回归方程为y73.96,给出下列结论:①y与x具有正的线性相关关系;②回归直线过样本点的中心(42,117.1);③儿子10岁时的身高是145.86 cm;④儿子年龄增加1周岁,身高约增加7.19 cm.其中,正确结论的个数是()A.1 B.2 C.3 D.49.某同学一个学期内各次数学测验成绩的茎叶图如图所示,则该组数据的中位数是____.10.总体由编号为01,02,…,19,20的个体组成,利用下面的随机数表选取7个个体,选取方法是从随机数表第1行的第3列和第4列数字开始由左到右依次选取两个数,则选出的第7个个体的编号为____.11.已知某学校有1680名学生,现在采用系统抽样的方法抽取84人,调查他们对学校食堂的满意程度,将1680人,按1,2,3,…,1680随机编号,则在抽取的84人中,编号落在[61,160]内的人数为____.12.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表)^=0.67x+a^,则a^的值为____.由最小二乘法求得回归方程y13.(2018·日照一模)共享单车是指由企业在校园、公交站点、商业区、公共服务区等场所提供的自行车单车共享服务,由于其依托“互联网+”,符合“低碳出行”的理念,已越来越多地引起了人们的关注.某部门为了对该城市共享单车加强监管,随机选取了50人就该城市共享单车的推行情况进行问卷调查,并将问卷中的这50人根据其满意度评分值(百分制)按照[50,60),[60,70),…,[90,100]分成5组,请根据下面尚未完成并有局部污损的频率分布表和频率分布直方图(如图所示)解决下列问题:频率分布表频率分布直方图(1)求出a,b,x的值;(2)若在满意度评分值为[80,100]的人中随机抽取2人进行座谈,设所抽取的2人中来自第5组的人数记为ξ,求ξ的分布列和数学期望.14.在一次数学测试中,数学老师对班上7名同学在20题(12分),21题(12分)的得分情况进行统计,得到的得分率如图所示,其中20题的得分率为图中虚线部分、21题的得分率为图中实线部分,记第20题、21题的平均得分分别为x1,x2,第20题、21题得分的标准差分别为s1,s2,则()A.x1>x2,s1>s2B.x1<x2,s1>s2C.x1>x2,s1<s2D.x1<x2,s1<s215.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入[1,450]的人做问卷A,编号落入[451,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为()A.8 B.10 C.12 D.1416.一个频率分布表(样本容量为30)不小心被损坏了一部分,只记得样本中数据在[20,60)上的频率为0.8,则估计样本在[40,50),[50,60)内的数据个数共为()A.19 B.17 C.16 D.1517.为了解学生在课外活动方面的支出情况,抽取了n个同学进行调查,结果显示这些学生的支出金额(单位:元)都在[10,50],其中支出金额在[30,50]的学生有117人,频率分布直方图如图所示,则n=()A.180 B.160 C.150 D.20018.已知x与y假设根据上表数据所得线性回归方程为y^=b^x+a^,若某同学根据上表中的前两组数据(1,0)和(2,2),求得的直线方程为y=b′x+a′,则以下结论正确的是()A.b^>b′,a^>a′B.b^>b′,a^<a′C.b^<b′,a^>a′D.b^<b′,a^<a′19.(2017·郑州预测)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的由表中数据,求得线性回归方程为y^=-4x+a.若在这些样本点中任取一点,则它在回归直线左下方的概率为()A.16B.13C.12D.2320.(2018·东北三省四市一联)“吸烟有害健康,吸烟会对身体造成伤害”,哈尔滨市于2012年5月31日规定室内场所禁止吸烟.美国癌症协会研究表明,开始吸烟年龄(X)分别为16岁,18岁,20岁和22岁,其得肺癌的相对危险度(Y)依次为15.10,12.81,9.72和3.21;每天吸烟数量(U)分别为10支、20支和30支者,其得肺癌的相对危险度(V)依次为7.5,9.5和16.6.用r1表示变量X与Y之间的线性相关系数,用r2表示变量U与V之间的线性相关系数,则下列说法正确的是()A.r1=r2B.r1>r2>0C.0<r1<r2D.r1<0<r221.为保障2017年元宵节期间的食品安全,某市食品监督局对超市中与元宵节相关的食品进行检查,如图所示是所抽查的某品牌元宵节食品中某元素含量的茎叶图,其中m,n∈{1,2,3,4,5,6,7,8,9},已知该组数据的平均数为25.4,则9m+1n的最小值为()A.4 B.5 C.6 D.1622.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某埃博拉病毒感染的效果”.参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)23.空气质量指数(Air Quality Index,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.一环保人士从当地某年的AQI 记录数据中,随机抽取10个,用茎叶图记录如图.根据该统计数据,估计此地该年AQI大于100的天数为____.(该年为365天)24.甲、乙两人要竞争一次大型体育竞技比赛射击项目的参赛资格,如图是在测试中甲、乙各射靶10次的条形图,则参加比赛的最佳人选为____.25.某企业从生产的某种产品中抽取5000件,测量这些产品的某项指标,测量结果得到如图的频率分布直方图.由频率分布直方图可以认为,这种产品的指标X 服从正态分布N (μ,σ2),其中μ可以看作是样本的平均数,σ2近似是样本方差,则P (127.8<X <152.2)≈____.(同一组中的数据用该组区间的中点值代表,且P (μ-σ<X <μ+σ)=0.6826,P (μ-2σ<X <μ+2σ)=0.9544,150≈12.2)26.(2018·三明模拟)近年来,随着我国汽车消费水平的提高,二手车流通行业得到迅猛发展.某汽车交易市场对2017年成交的二手车的交易前的使用时间(以下简称“使用时间”)进行统计,得到如图1所示的频率分布直方图.在图1对使用时间的分组中,将使用时间落入各组的频率视为概率.(1)若在该交易市场随机选取3辆2017年成交的二手车,求恰有2辆使用年限在(8,16]的概率;(2)根据该汽车交易市场往年的数据,得到图2所示的散点图,其中x (单位:年)表示二手车的使用时间,y (单位:万元)表示相应的二手车的平均交易价格.①由散点图判断,可采用y =e a +bx 作为该交易市场二手车平均交易价格y 关于其使用年限x的回归方程,相关数据如下表⎛⎪⎪⎫表中Y i =ln y i ,Y =110∑i =110Y i : 试选用表中数据,求出y②该汽车交易市场拟定两个收取佣金的方案供选择.甲:对每辆二手车统一收取成交价格的5%的佣金;乙:对使用8年以内(含8年)的二手车收取成交价格的4%的佣金,对使用时间8年以上(不含8年)的二手车收取成交价格的10%的佣金.假设采用何种收取佣金的方案不影响该交易市场的成交量,根据回归方程和图表1,并用各时间组的区间中点值代表该组的各个值.判断该汽车交易市场应选择哪个方案能获得更多佣金.附注:①对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑i =1nu i v i -n u -v -∑i =1n u 2i -n u -2,α^=v -β^u -;②参考数据:e 2.95≈19.1,e 1.75≈5.75,e 0.55≈1.73,e -0.65≈0.52,e -1.85≈0.16.27.在直角坐标系xOy 中,直线l :y =x ,圆C :⎩⎨⎧ x =-1+cos φ,y =-2+sin φ(φ为参数),以坐标原点为极点,x 轴的正半轴为极轴建立极坐标系.(1)求直线l 与圆C 的极坐标方程;(2)设直线l 与圆C 的交点为M ,N ,求△CMN 的面积.28.已知在平面直角坐标系xOy 中,曲线C 1的参数方程为⎩⎨⎧ x =2t +1,y =t -1(t 是参数).以坐标原点O 为极点,x 轴的正半轴为极轴,建立极坐标系,曲线C 2的极坐标方程为 ρ=4cos θ.(1)求曲线C 1的普通方程及曲线C 2的直角坐标方程并说明各曲线名称;(2)判断曲线C 1与曲线C 2的位置关系?若相交,求出弦长.29.在平面直角坐标系中,以坐标原点O 为极点,x 轴的正半轴为极轴,建立极坐标系.曲线C 1:ρ⎣⎢⎡⎦⎥⎤2sin ⎝ ⎛⎭⎪⎫2θ-3π4+sin2θ+cos2θ+1=2sin θ-2cos θ,曲线C 2:⎩⎨⎧ x =2+t ,y =1-2t(t 为参数).(1)求曲线C 1的直角坐标方程;(2)求曲线C 2上的点到曲线C 1的距离的最大值和最小值.30.在平面直角坐标系xOy 中,曲线C 的参数方程是⎩⎨⎧x =2cos θ,y =3sin θ(θ为参数),以射线Ox 为极轴建立极坐标系,直线l 的极坐标方程为ρcos θ-ρsin θ-3=0.(1)求曲线C 的普通方程,及直线l 的参数方程;(2)求直线l 与曲线C 相交所得的弦AB 的长.31.(2018·长安一中模拟)在平面直角坐标系xOy 中,曲线C 的参数方程为⎩⎨⎧ x =3+5cos α,y =4+5sin α(α为参数),A ,B 在曲线C 上,以坐标原点O 为极点,x 轴的正半轴为极轴的极坐标系中,A ,B 两点的极坐标为A ⎝ ⎛⎭⎪⎫ρ1,π6,B ⎝ ⎛⎭⎪⎫ρ2,π2. (1)求曲线C 的极坐标方程;(2)设曲线C 的中心为M ,求△MAB 的面积.32.(2018·安徽A10联盟模拟)在平面直角坐标系xOy 中,曲线C 1:⎩⎨⎧x =2cos α,y =2+2sin α(α为参数).以坐标原点为极点,x 轴非负半轴为极轴建立极坐标系,且两个坐标系取相同的长度单位.若M 为曲线C 1上异于极点的动点,点N 在射线OM 上,且满足|ON |·|OM |=20,记点N 的轨迹为C 2.(1)求曲线C 1,C 2的极坐标方程;(2)已知A ,B 两点的直角坐标分别为(0,3)和(2,5),直线AB 与曲线C 1交于R ,S 两点,求||AR |-|AS ||的值.33.在直角坐标系xOy 中,已知曲线C 的参数方程为⎩⎨⎧ x =33cos θ,y =sin θ(θ为参数).(1)以原点O 为极点,x 轴正半轴为极轴建立极坐标系,求曲线C 的极坐标方程;(2)设A ,B 为曲线C 上两动点,且OA ⊥OB ,求|AB |的取值范围.34.(2018·合肥三模)在平面直角坐标系xOy 中,直线l 的参数方程为⎩⎪⎨⎪⎧ x =-1+22t ,y =1+22t (t为参数),圆C 的方程为(x -2)2+(y -1)2=5.以原点O 为极点,x 轴正半轴为极轴建立极坐标系.(1)求直线l 及圆C 的极坐标方程;(2)若直线l 与圆C 交于A ,B 两点,求cos ∠AOB 的值.35.(2018·大连模拟)在平面直角坐标系xOy 中,曲线C 1的参数方程为⎩⎨⎧x =t cos α,y =t sin α⎝ ⎛⎭⎪⎫参数t ≠0,常数α∈⎝ ⎛⎭⎪⎫0,π2.以O 为极点,x 轴的正半轴为极轴建立极坐标系,曲线C 2的极坐标方程为ρ=4sin θ⎝ ⎛⎭⎪⎫θ∈⎝ ⎛⎭⎪⎫0,π2,曲线C 3的极坐标方程为ρcos θ+ρsin θ-6=0. (1)写出C 2在平面直角坐标系xOy 中的参数方程;(2)设C 1与C 2交于P 点,C 1与C 3交于Q 点,求|OP ||OQ |的最大值.36.(2018·衡水十模)已知直线l 的参数方程为⎩⎨⎧ x =t cos φ,y =-2+t sin φ(t 为参数,0≤φ<π),以坐标原点O 为极点,x 轴正半轴为极轴建立极坐标系,曲线C 的极坐标方程为ρ=1,l 与C 交于不同的两点P 1,P 2.(1)求φ的取值范围;(2)以φ为参数,求线段P 1P 2中点M 的轨迹的参数方程.37.(2018·信阳二模)已知直线l 的参数方程为⎩⎪⎨⎪⎧ x =-1+22t ,y =22t (其中t 为参数),曲线C :ρ2cos 2θ+3ρ2sin 2θ-3=0,以坐标原点为极点,x 轴正半轴为极轴,建立极坐标系,两种坐标系中取相同长度单位.(1)求直线l 的普通方程及曲线C 的直角坐标方程;(2)在曲线C 上是否存在一点P ,使点P 到直线l 的距离最大?若存在,求出距离的最大值及点P 的直角坐标;若不存在,请说明理由.38.(2018·潍坊一模)在平面直角坐标系xOy 中,直线l 的参数方程为⎩⎨⎧x =1+t cos α,y =t sin α(t 为参数,0≤α<π),在以坐标原点为极点,x 轴正半轴为极轴的极坐标系中,曲线C 的极坐标方程为ρ2=21+sin 2θ. (1)求曲线C 的直角坐标方程;(2)设点M 的坐标为(1,0),直线l 与曲线C 相交于A ,B 两点,求1|MA |+1|MB |的值.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《统计案例》历年高考真题(部分)
1. (2012年辽宁理,19,12分)电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,下图是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图。
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”。
(1”与性别有关?
非体育迷
体育迷 合计 男 女 10 55 合计
(2)将上述调查所得到的频率视为概率。
现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X 。
若每次抽取的结果是相互独立的,求X 的分布列,期望E (X )和方差D (X )。
附:)
)()()(()(2
2
d b c a d c b a bc ad n K ++++-=,
P (K 2≥k 0)
0.05 0.01 k
3.841
6.635
2. (2010年辽宁理,18,12分)为了比较注射A ,B 两种药物后产生的皮肤疱疹的面积,选200只家兔做实验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A ,另一组注射药物B 。
(1)甲、乙是200只家兔中的2只,求甲、乙分在不同组的概率; (2)下表1和表2分别是注射药物A 和B 后的试验结果。
(疱疹面积单位:mm 2)
表
1:注射药物A 后皮肤疱疹面积的频数分布表
疱疹面积 [60,65)
[65,70) [70,75) [75,80) 频数 30 40 20 10 疱疹面积 [60,65) [65,70) [70,75) [75,80) 频数
10
25
30
15
①
图1 注射药物A 后皮肤疱疹面积的频率分布直方图
图2 注射药物B 后皮肤疱疹面积的频率分布直方图
②完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”。
表3:
疱疹面积小于70mm 2 疱疹面积不小于70mm 2 合计 注射药物A a = b =
注射药物B
c =
d =
n =
附:)
)()()(()(2
2
d b c a d c b a bc ad n K ++++-=
P (K 2≥k ) 0.100 0.050 0.025 0.010 0.001 k
2.706
3.841
5.024
6.635
10.828
3. (2015年新课标全国卷I 理,19,12分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:;千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响。
对近8年的年宣传费x i 和年销售量y i (i =1, 2, ..., 8)数据做了初步处理,得到下图的散点图及一些统计量的值。
x
y
ω
∑=-8
1
2
)
(i i
x x
∑=-8
1
2
)
(i i
ωω
∑=--8
1
)
)((i i
i
y y
x x ∑=--8
1
)
)((i i i
y y ωω
46.6 563 6.8
289.8
1.6
1469
108.8
表中i i x =ω,∑==8
1
81i i ωω。
(1)根据散点图判断,bx a y +=与x d c y +=哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;
(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x 。
根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?
附:对于一组数据(u 1,v 1),(u 2,v 2),...,(u n ,v n ),其回归直线u v βα+=的斜率和截距的最小
二乘估计分别为∑∑==---=n
i i
n
i i i
u u
v v u u
1
2
1
)()
)((ˆβ
,u v βα
ˆˆ-=。