统计有关经典例题解析、及高考题50道,带答案
(精选试题附答案)高中数学第九章统计经典大题例题
(名师选题)(精选试题附答案)高中数学第九章统计经典大题例题单选题1、某中学高一年级有400人,高二年级有320人,高三年级有280人,若每人被抽到的可能性都为0.2,用随机数表法在该中学抽取容量为n的样本,则n等于()A.80B.160C.200D.280答案:C分析:每个个体被抽的可能性等于样本容量除以总体数,由此列出关于n的方程并求解出结果.=0.2,解得n=200,由题意可知:n400+320+280故选:C.2、某校为了解学生的课外锻炼身体的情况,随机抽取了部分学生,对他们一周的课外锻炼时间进行了统计,统计数据如下表所示:则该校学生一周进行课外锻炼的时间的第40百分位数是()A.8.5B.8C.7D.9答案:A分析:根据百分位数的求法计算即可.抽取的学生人数为6+10+9+8+7=40.由40%×40=16,故第40百分位数为所有数据从小到大排序的第16项与第17项数据的平均数,=8.5.即8+92故选: A.3、下列调查方式较为合适的是()A.为了了解灯管的使用寿命,采用普查的方式B.为了了解我市中学生的视力状况,采用抽样调查的方式C.调查一万张面值为100元的人民币中有无假币,采用抽样调查的方式D.调查当今中学生喜欢什么体育活动,采用普查的方式答案:B分析:根据实际情况选择合适的调查方式即可判断.对A,为了了解灯管的使用寿命,应采用抽样调查的方式,故A错误;对B,为了了解我市中学生的视力状况,采用抽样调查的方式,故B正确;对C,调查一万张面值为100元的人民币中有无假币,采用抽样普查的方式,故C错误;对D,调查当今中学生喜欢什么体育活动,采用抽样普查的方式,故D错误.故选:B.4、2021年3月,树人中学组织三个年级的学生进行“庆祝中国共产党成立100周年”党史知识竞赛.经统计,得到前200名学生分布的饼状图(如图)和前200名中高一学生排名分布的频率条形图(如图),则下列命题错.误.的是()A.成绩前200名的200人中,高一人数比高二人数多30人B.成绩第1-100名的100人中,高一人数不超过一半C.成绩第1-50名的50人中,高三最多有32人D.成绩第51-100名的50人中,高二人数比高一的多答案:D分析:根据饼状图和条形图提供的数据判断.由饼状图,成绩前200名的200人中,高一人数比高二人数多200×(45%−30%)=30,A正确;=45<50,B 由条形图知高一学生在前200名中,前100和后100人数相等,因此高一人数为200×45%×12正确;成绩第1-50名的50人中,高一人数为200×45%×0.2=18,因此高三最多有32人,C正确;第51-100名的50人中,高二人数不确定,无法比较,D错误.故选:D.5、某射击运动员6次的训练成绩分别为:88,91,89,88,86,85,则这6次成绩的第70百分位数为()A.89B.89.5C.90D.90.5答案:A分析:先将数据按从小到大的顺序排列,计算6×70%=4.2不是整数,则所求的是从小到大排列的第5位数6次考试数学成绩从小到大为:85,86,88,88,89,91,6×70%=4.2,∴这名学生6次训练成绩的第70百分位数为89 .故选:A6、某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率直方图如图所示,估计棉花纤维的长度的样本数据的80百分位数是()A.29 mmB.29.5 mmC.30 mmD.30.5 mm答案:A分析:先求得棉花纤维的长度在30 mm以下的比例为85%,在25 mm以下的比例为85%-25%=60%,从而可得80百分位数一定位于[25,30)内,进而可求出答案棉花纤维的长度在30 mm以下的比例为(0.01+0.01+0.04+0.06+0.05)×5=0.85=85%,在25 mm以下的比例为85%-25%=60%,因此,80百分位数一定位于[25,30)内,=29,由25+5×0.80−0.600.85−0.60可以估计棉花纤维的长度的样本数据的80百分位数是29 mm.故选:A7、根据气象学上的标准,连续5天的日平均气温低于10℃即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①、②、③、④,依次计算得到结果如下:①平均数x̅<4;②平均数x̅<4且极差小于或等于3;③平均数x̅<4且标准差s≤4;④众数等于5且极差小于或等于4.则4组样本中一定符合入冬指标的共有()A .1组B .2组C .3组D .4组答案:B分析:举反例否定①;反证法证明②符合要求;举反例否定③;直接法证明④符合要求.①举反例:0,0,0,4,11,其平均数x̅=3<4.但不符合入冬指标;②假设有数据大于或等于10,由极差小于或等于3可知,则此组数据中的最小值为10−3=7,此时数据的平均数必然大于7,与x̅<4矛盾,故假设错误.则此组数据全部小于10. 符合入冬指标;③举反例:1,1,1,1,11,平均数x̅=3<4,且标准差s =4.但不符合入冬指标;④在众数等于5且极差小于等于4时,则最大数不超过9.符合入冬指标.故选:B .8、关于圆周率π,数学发展史上出现过许多很有创意的求法,如著名的浦丰实验和查理斯实验.受其启发,我们也可以通过设计下面的实验来估计π的值:先请全校m 名同学每人随机写下一个都小于1的正实数对(x,y );再统计两数能与1构成钝角三角形三边的数对(x,y )的个数a ;最后再根据统计数a 估计π的值,那么可以估计π的值约为( )A .4a mB .a+2mC .a+2m mD .4a+2m m答案:D解析:由试验结果知m 对0~1之间的均匀随机数x,y ,满足{0<x <10<y <1,面积为1,再计算构成钝角三角形三边的数对(x,y),满足条件的面积,由几何概型概率计算公式,得出所取的点在圆内的概率是圆的面积比正方形的面积,即可估计π的值.解:根据题意知,m 名同学取m 对都小于1的正实数对(x,y ),即{0<x <10<y <1, 对应区域为边长为1的正方形,其面积为1,若两个正实数x,y 能与1构成钝角三角形三边,则有{x 2+y 2<1x +y >10<x <10<y <1,其面积S =π4−12;则有a m =π4−12,解得π=4a+2m m故选:D .小提示:本题考查线性规划可行域问题及随机模拟法求圆周率的几何概型应用问题. 线性规划可行域是一个封闭的图形,可以直接解出可行域的面积;求解与面积有关的几何概型时,关键是弄清某事件对应的面积,必要时可根据题意构造两个变量,把变量看成点的坐标,找到试验全部结果构成的平面图形,以便求解.9、某校高一共有10个班,编号为01,02,…,10,现用抽签法从中抽取3个班进行调查,设高一(5)班被抽到的可能性为a ,高一(6)班被抽到的可能性为b ,则( )A .a =310,b =29B .a =110,b =19 C .a =310,b =310D .a =110,b =110答案:C分析:根据简单随机抽样的定义,分析即可得答案.由简单随机抽样的定义,知每个个体被抽到的可能性相等,故高一(5)班和高一(6)班被抽到的可能性均为310. 故选:C10、为调查参加考试的高二级1200名学生的成绩情况,从中抽查了100名学生的成绩,就这个问题来说,下列说法正确的是( )A .1200名学生是总体B .每个学生是个体C .样本容量是100D .抽取的100名学生是样本答案:C分析:根据总体、个体、样本容量、样本的定义,结合题意,即可判断和选择.根据题意,总体是1200名学生的成绩;个体是每个学生的成绩;样本容量是100,样本是抽取的100名学生的成绩;故正确的是C.故选:C.填空题11、某市A、B、C三个区共有高中学生20000人,其中A区高中学生7000人,现采用分层抽样的方法从这三个区所有高中学生中抽取一个容量为600人的样本进行学习兴趣调查,则A区应抽取__________________.答案:210分析:根据总体数和要抽取的样本数,得到每个个体被抽到的概率,利用这个概率乘以A区的人数,得到A区要抽取的人数.解:由题意知A区在样本中的比例为700020000∴A区应抽取的人数是700020000×600=210.所以答案是:210.12、某单位有员工900人,其中女员工有360人,为做某项调查,拟采用分层抽样的方法抽取容量为150的样本,则应抽取的男员工人数是_______________________.答案:90分析:按照分层抽样的定义,按照比例抽取即可由题意,设应抽取的男员工人数是x则900−360900=x150解得:x=90所以答案是:9013、已知一组数据:20,30,40,50,50,60,70,80,记这组数据的第60百分位数为a,众数为b,则a和b的大小关系是______________.(用“<”“>”或“=”连接)答案:a=b##b=a分析:由百分位数求法得50为第60百分位数,并确定数据的众数,即可比较它们的大小关系.因为8×60%=4.8,所以这组数据的第5个数:50为第60百分位数.观察易知这组数据的众数为50,所以a和b的大小关系是a=b.所以答案是:a=b14、某校从高一新生中随机抽取了一个容量为20的身高样本,数据从小到大排序如下(单位:cm):152 ,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170 ,171,x,174,175,若样本数据的第90百分位数是173,则x的值为________.答案:172分析:根据百分位数的意义求解.百分位数的意义就在于,我们可以了解的某一个样本在整个样本集合中所处的位置,=173,x=172本题第90百分位数是173,所以x+1742故答案为:172小提示:本题考查样本数据的第多少百分位数的概念.15、气象意义上从春季进入夏季的标志为连续5天的日平均温度均不低于22℃.现有甲、乙、丙三地连续5天的日平均温度的记录数据:(记录数据都是正整数)①甲地5个数据的中位数为24,众数为22;②乙地5个数据的中位数为27,总体均值为24;③丙地5个数据中有一个数据是32,总体均值为26,总体方差为10.8.则肯定进入夏季的地区有_____.答案:①③分析:根据数据的特点进行估计甲、乙、丙三地连续5天的日平均气温的记录数据,分析数据的可能性进行解答即可得出答案.①甲地:5个数据的中位数为24,众数为22,根据数据得出:甲地连续5天的日平均温度的记录数据可能为:22、22、24、25、26,其连续5天的日平均气温均不低于22;②乙地:5个数据的中位数为27,总体均值为24,当5个数据为19、20、27、27、27,可知其连续5天的日平均温度有低于22,故不确定;③丙地:5个数据中有一个数据是32,总体均值为26,若有低于22,假设取21,此时方差就超出了10.8,可知其连续5天的日平均温度均不低于22,如22、25、25、26、32,这组数据的平均值为26,方差为10.8,但是进一步扩大方差就会超过10.8,故③对.则肯定进入夏季的地区有甲、丙两地,故答案为①③.小提示:本题考查中位数、众数、平均数、方差的数据特征,简单的合情推理,解答此题应结合题意,根据平均数的计算方法进行解答、取特殊值即可.解答题16、为了了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量(单位:克),按照[27.5,32.5),[32.5,37.5),[37.5,42.5),[42.5,47.5),[47.5,52.5]分为5组,其频率分布直方图如图所示.(1)求图中a的值;(2)估计这种植物果实重量的平均数x̅(同一组中的数据用该组区间的中点值作代表);(3)已知这种植物果实重量不低于37.5克的即为优质果实,现对该种植物果实的某批10000个果实进行检测.据此估算这批果实中的优质果实的个数.答案:(1)a=0.050(2)40(3)7000分析:(1)由各组频率之和为1(面积之和为1)可求得;(2)频率分布直方图用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和估计平均数;(3)用样本频率估计总体概率进行求解.(1)由题意,有(0.020+0.040+0.075+a+0.015)×5=1,解得a=0.050;(2)这种植物果实重量的平均数约为:30×0.020×5+35×0.040×5+40×0.075×5+45×0.050×5+50×0.015×5=40,∴这种植物果实重量的平均数x̅的估计值约为40.(3)样本中,这种植物果实重量不低于37.5克,即优质果实的频率为0 .075×5+0.050×5+0.015×5=0.7,由此估计某批10000个果实中,重量不低于37.5克,即优质果实的概率为0.7,∴这批果实中的优质果实的个数约为10000×0.7=7000个.17、第24届北京冬季奥林匹克运动会于2022年2月4日至2月20日在北京和张家口联合举办.这是中国历史上第一次举办冬季奥运会,它掀起了中国人民参与冬季运动的大热潮.某市举办了中学生滑雪比赛,从中抽取40名学生的测试分数绘制成茎叶图和频率分布直方图如下,后来茎叶图受到了污损,可见部分信息如图.(1)求频率分布直方图中a的值,并根据直方图估计该市全体中学生的测试分数的平均数(同一组中的数据以这组数据所在区间中点的值作代表,结果保留一位小数);(2)现要对测试成绩在前26%的中学生颁发“滑雪达人”证书,并制定出能够获得证书的测试分数线,请你用样本来估计总体,给出这个分数线的估计值.答案:(1)a=0.02,平均数为74.5(2)82分析:(1)计算出测试分数位于[90,100]个数,可求得测试分数位于[80,90)的个数,由此可求得a的值,将每个矩形底边的中点值乘以对应矩形的面积,将所得结果全加可得样本的平均数;(2)设能够获得证书的测试分数线为x,分析可得80<x<90,根据已知条件可得出关于x的等式,求解即可. (1)解:由频率分布直方图可知,测试分数位于[90,100]的频率为10×0.01=0.1,则测试分数位于[90,100]个数为40×0.1=4,所以,测试分数位于[80,90)的个数为40−(4+10+14+4)=8,÷10=0.02.所以a=840估计平均数为55×0.1+65×0.25+75×0.35+85×0.2+95×0.1=74.5.(2)解:因为测试分数位于[90,100]的频率为0.1,测试分数位于[80,90)的频率为0.2,能够获得“滑雪达人”证书的中学生测试分数要在前26%,故设能够获得证书的测试分数线为x,则80<x<90,由(90−x)×0.02=0.26−0.1,可得x=82,所以分数线的估计值为82.18、某中学要从高一年级甲乙两个班级中选择一个班参加电视台组织的“环保知识竞赛”,该校对甲乙两班的参赛选手(每班7人)进行了一次环保知识测试,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生的平均分是85,乙班学生成绩的中位数是85.(1)求x,y的值;(2)根据茎叶图,求甲乙两班同学方差的大小,并从统计学角度分析,该校应选择甲班还是乙班参赛.答案:(1)x=9,y=5;(2)乙班成绩比较稳定,故应选乙班参加.分析:(1)利用茎叶图,根据甲班7名学生成绩的平均分是85,乙班7名学生成绩的中位数是85.先求出x,y,(2)求出乙班平均分,再求出甲班7名学生成绩方差和乙班名学生成绩的方差,由此能求出结果.解:(1)甲班的平均分为:17(75+78+80+80+x+85+92+96)=85;解得x=9,∵乙班7名学生成绩的中位数是85,∴y=5,(2)乙班平均分为:17(75+80+80+85+90+90+95)=85;甲班7名学生成绩方差S12=17(102+72+52+42+02+72+112)=3607,乙班名学生成绩的方差S22=17(102+52+52+02+52+52+102)=3007,∵两个班平均分相同,S22<S12,∴乙班成绩比较稳定,故应选乙班参加.小提示:本题考查茎叶图的应用,解题时要认真审题,属于基础题.19、2019年下半年以来,各地区陆续出台了“垃圾分类”的相关管理条例,实行“垃圾分类”能最大限度地减少垃圾处置量,实现垃圾资源利用,改善垃圾资源环境,某部门在某小区年龄处于[20,45]岁的人中随机地抽取x人,进行了“垃圾分类”相关知识掌握和实施情况的调查,并把达到“垃圾分类”标准的人称为“环保族”,得到如图示各年龄段人数的频率分布直方图和表中的统计数据.(1)求x、y、z的值;(2)根据频率分布直方图,估计这x人年龄的平均值(同一组数据用该区间的中点值代替,结果按四舍五入保留整数);(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,并在这9人中选取2人作为记录员,求选取的2名记录员中至少有一人年龄在[30,35]中的概率.答案:(1){x=200y=0.625z=6;(2)30.75;(3)1318.分析:(1)由频率分布直方图和频数分布表能求出x、y、z;(2)根据频率分布直方图,能估计这x人年龄的平均值;(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,[25,30)中选5人,分别记为A、B、C、D、E,[30,35]中选4人,分别记为a、b、c、d,在这9人中选取2人作为记录员,利用列举法列举出所有的基本事件,然后利用古典概型的概率公式可求得所求事件的概率.(1)由题意得:{x=450.750.06×5=200y=25200×0.04×5=0.625z=200×0.03×5×0.2=6;(2)根据频率分布直方图,估计这x人年龄的平均值为:x=22.5×0.3+27.5×0.2+32 .5×0.2+37.5×0.15+42.5×0.15=30.75;(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,从[25,30)中选:9×2525+20=5人,分别记为A、B、C、D、E,从[30,35]中选:9×2025+20=4人,分别记为a、b、c、d,在这9人中选取2人作为记录员,所有的基本事件有:(A,B)、(A,C)、(A,D)、(A,E)、(A,a)、(A,b)、(A,c)、(A,d)、(B,C)、(B,D)、(B,E)、(B,a)、(B,b)、(B,c)、(B,d)、(C,D)、(C,E)、(C,a)、(C,b)、(C,c)、(C,d)、(D,E)、(D,a)、(D,b)、(D,c)、(D,d)、(E,a)、(E,b)、(E,c)、(E,d)、(a,b)、(a,c)、(a,d)、(b,c)、(b,d)、(c,d),共36种,选取的2名记录员中至少有一人年龄在[30,35]包含的基本事件有:(A,a)、(A,b)、(A,c)、(A,d)、(B,a)、(B,b)、(B,c)、(B,d)、(C,a)、(C,b)、(C,c)、(C,d)、(D,a)、(D,b)、(D,c)、(D,d)、(E,a)、(E,b)、(E,c)、(E,d)、(a,b)、(a,c)、(a,d)、(b,c)、(b,d)、(c,d),共26种,因此,选取的2名记录员中至少有一人年龄在[30,35]中的概率P=2636=1318.小提示:本题考查频率、平均数、概率的求法,考查频数分布表、频率分布直方图、分层抽样、古典概型的性质等基础知识,考查数据分析能力、运算求解能力,是基础题.。
统计案例练习题(附答案)
统计案例练习题(附答案)一、选择题 1.对具有线性相关关系的两个变量建立的线性回归方程y=a+bx中,回归系数b( ) A.可以小于0 B.只能大于0 C.可能等于0 D.只能小于0 【解析】b可能大于0,也可能小于0,但当b=0时,x,y不具有线性相关关系.【答案】 A 2.下列两个变量间的关系不是函数关系的是( ) A.正方体的棱长与体积 B.角的弧度数与它的正弦值 C.单产为常数时,土地面积与粮食总产量 D.日照时间与水稻亩产量【解析】∵A、B、C都可以得出一个函数关系式,而D不能写出确定的函数关系式,它只是一个不确定关系.【答案】 D 3.某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元) 4 2 3 5 销售额y(万元) 49 26 39 54 根据上表可得回归方程y=bx+a中的b为9.4,据此模型预报广告费用为6万元时销售额为( ) A.63.36万元 B.65.5万元C.67.7万元 D.72.0万元【解析】x=4+2+3+54=3.5, y=49+26+39+544=42,∴a=y-bx=42-9.4×3.5=9.1,∴回归方程为y=9.4x+9.1,∴当x=6时,y=9.4×6+9.1=65.5,故选B. 【答案】 B 4.由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到回归直线方程y=bx+a,那么下列说法中不正确的是( ) A.直线y=bx+a必经过点(x,y) B.直线y=bx+a至少经过点(x1,y1)(x2,y2),…,(xn,bn)中的一个点 C.直线y=bx+a的斜率为∑ni=1xiyi-nx•y∑ni=1x2i-nx2 D.直线y=bx+a的纵截距为y-bx 【解析】回归直线可以不经过任何一个点.其中A:由a=y-bx代入回归直线方程y=bx+y-ax,即y=b(x-x)+y过点(x,y).∴B错误.【答案】 B 5.已知两个变量x和y 之间具有线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性回归的方法求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均数都为s,对变量y 的观测数据的平均数都是t,则下列说法正确的是( ) A.l1与l2一定有公共点(s,t) B.l1与l2相交,但交点一定不是(s,t) C.l1与l2必定平行 D.l1与l2必定重合【解析】由于回归直线y=bx+a恒过(x,y)点,又两人对变量x的观测数据的平均值为s,对变量y的观测数据的平均值为t,所以l1和l2恒过点(s,t).【答案】 A 二、填空题 6.从某大学随机选取8名女大学生,其身高x(cm)和体重y(kg)的线性回归方程为y=0.849x-85.712,则身高172 cm的女大学生,由线性回归方程可以预测其体重约为________.【解析】将x=172代入线性回归方程y=0.849x-85.712,有y=0.849×172-85.712=60.316(kg).【答案】60.316 kg 7.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本的资料进行线性回归分析,结果如下:x=72,y=71,∑6i=1x2i=79,∑6i=1xiyi=1 481. b=1 481-6×72×7179--1.818 2, a=71-(-1.8182)×72≈77.36,则销量每增加1 000箱,单位成本下降________元.【解析】由上表可得,y=-1.818 2x+77.36,销量每增加1千箱,则单位成本下降1.818 2元.【答案】 1.818 2 8.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】由题意知[0.254(x+1)+0.321]-(0.254x+0.321)=0.254. 【答案】0.254 三、解答题 9.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:推销员编号 1 2 3 4 5 工作年限x/年 3 5 6 7 9 推销金额y/万元 2 3 3 4 5 (1)求年推销金额y关于工作年限x的线性回归方程; (2)若第6名推销员的工作年限为11年,试估计他的年推销金额.【解】(1)设所求的线性回归方程为y=bx+a,则b=i=--=-=1020=0.5, a=y-bx=0.4. 所以年推销金额y关于工作年限x的线性回归方程为y=0.5x+0.4. (2)当x=11时,y=0.5x+0.4=0.5×11+0.4 =5.9(万元).所以可以估计第6名推销员的年推销金额为5.9万元. 10.一种机器可以按各种不同速度运转,其生产物件中有一些含有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x表示转速(单位:转/秒),用y表示每小时生产的有缺点物件个数.现观测得到(x,y)的4组值为(8,5),(12,8),(14,9),(16,11). (1)假设y与x之间存在线性相关关系,求y与x之间的线性回归方程. (2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少转/秒?(精确到1) 【解】(1)设回归方程为y=a+bx,则x=8+12+14+164=12.5, y=5+8+9+114=8.25,∑4i=1x2i=660,∑4i =1xiyi=438, b=∑4i=1xiyi-4xy∑4i=1x2i-4x2=438-4×12.5×8.25660-4×12.52≈0.73, a=y-bx=8.25-0.73×12.5=-0.875,所以所求回归方程为y=-0.875+0.73x. (2)由y≤10,即-0.875+0.73x≤10,得x≤10.8750.73≈15,即机器速度不得超过15转/秒. 11.高二(3)班学生每周用于数学学习的时间x(单位:小时)与数学成绩y(单位:分)之间有如下数据:x 24 15 23 19 16 11 20 16 17 13 y 92 79 97 89 64 47 83 68 71 59 若某同学每周用于数学学习的时间为18小时,试预测该同学的数学成绩.【解】显然学习时间与学习成绩间具有相关关系,可以列出下表,并用科学计算器进行计算.i 1 2 3 4 5 6 7 8 9 10 xi 24 15 23 19 16 11 20 16 17 13 yi 9279 97 89 64 47 83 68 71 59 xiyi 2 208 1 185 2 231 1 691 1 024 517 1 660 1 088 1 207 767 ∑10i=1x2i=3 182,∑10i=1xiyi=13 578于是可得b=∑10i=1xiyi-10xy∑10i=1x2i-10x2=545.4154.4≈3.53, a=y-bx=74.9-3.53×17.4≈13.5. 因此可求得回归直线方程为y=3.53x+13.5. 当x=18时,y=3.53×18+13.5≈77. 故该同学预计可得77分左右.。
2021新高考数学专题24统计图表的应用附参考答案3
方法技巧专题24 统计图表的应用学生篇一、统计图表的应用知识框架二、统计图表的应用题型分析【一】频率分布直方图在频率分布直方图中:①各小矩形的面积表示相应各组的频率,各小矩形的高=;频率组距②各小矩形面积之和等于1;③中位数左右两侧的直方图面积相等,因此可以估计其近似值,为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;④众数是最高矩形中点的横坐标;⑤频率分布直方图中均值等于组中值与对应概率乘积的和.1.1.例题例题【例1】我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.【例2】(2019年高考全国Ⅲ卷文数)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).2.巩固提升综合练习【练习1】某工厂有工人1000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人),现用分层抽样方法(按A类、B类分二层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数).(Ⅰ)求甲、乙两工人都被抽到的概率,其中甲为A类工人,乙为B类工人;(Ⅱ)从A类工人中的抽查结果和从B类工人中的抽查结果分别如下表1和表2.表1:生产能力分组[100,110) [110,120) [120,130) [130,140) [140,150)人数 4 8 x 5 3 表2生产能力分组[110,120) [120,130) [130,140) [140,150)人数 6 y36 18(i)先确定x,y,再在答题纸上完成下列频率分布直方图.就生产能力而言,A类工人中个体间的差异程度与B类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)图1 A类工人生产能力的频率分布直方图图2 B类工人生产能力的频率分布直方图(ii)分别估计A类工人和B类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).【练习2】某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),┄,[80,90],并整理得到如下频率分布直方图:(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.【练习3】某校从高一年级学生中随机抽取40名学生,将他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,后得到如图的频率分布直方图.(1)求图中实数的值;a (2)若该校高一年级共有学生640人,试估计该校高一年级期中考试数学成绩不低于60分的人数;(3)若从数学成绩在与两个分数段内的学生中随机选取两名学生,求这两名学生的[)40,50[]90,100数学成绩之差的绝对值不大于10的概率.【练习4】某市民用水拟实行阶梯水价.每人用水量中不超过立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费.从该市随机调查了10000位居民,获得了他们某月的用水量w 数据,整理得到如下频率分布直方图:方方方(方方方)方方方方0.50.40.30.20.1 4.543.532.521.510.5O(Ⅰ)如果为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w w至少定为多少?(Ⅱ)假设同组中的每个数据用该组区间的右端点值代替.当=3时,估计该市居民该月的人均水w 费.【二】茎叶图的应用茎叶图1、当数据有两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.2、当数据有三位有效数字,前两位相对比较集中时,常以前两位为茎,第三位(个位)为叶(其余类推).3、通过茎叶图可观察出平均数、众数、中位数,数据分布的对称性等等,由于茎叶图保留了原始数1.例题【例1】如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为 ( )分别为A. 3,5B. 5,5C. 3,7D. 5,7【例2】某学校A、B两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过茎叶图比较两个班兴趣小组成绩的平均值及标准差.①A班兴趣小组的平均成绩高于B班兴趣小组的平均成绩;②B班兴趣小组的平均成绩高于A班兴趣小组的平均成绩;③A班兴趣小组成绩的标准差大于B班兴趣小组成绩的标准差;④B班兴趣小组成绩的标准差大于A班兴趣小组成绩的标准差.其中正确结论的编号为()A.①④B.②③ C.②④D.①③【例3】随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差;(3)现从乙班这10名同学中随机抽取两名身高不低于173cm的同学,求身高为176cm的同学被抽中的概率.2.巩固提升综合练习【练习1】某兄弟俩都推销某一小家电,现抽取他们其中8天的销售量(单位:台),得到的茎叶图如图所示,已知弟弟的销售量的平均数为34,哥哥的销售量的中位数比弟弟的销售量的众数大2,则x +y 的值为【练习2】从甲、乙两种树苗中各抽测了株树苗的高度,其茎叶图如图所示.根据茎叶图,下列描述正10确的是( ( ) ) A .甲种树苗的高度的中位数大于乙种树苗高度的中位数,且甲种树苗比乙种树苗长得整齐B .甲种树苗的高度的中位数大于乙种树苗高度的中位数,但乙种树苗比甲种树苗长得整齐C .乙种树苗的高度的中位数大于甲种树苗高度的中位数,且乙种树苗比甲种树苗长得整齐D .乙种树苗的高度的中位数大于甲种树苗高度的中位数,但甲种树苗比乙种树苗长得整齐【练习3】甲、乙两名同学在】甲、乙两名同学在 6 次数学考试中,所得成绩用茎叶图表示如下,若甲、乙两人这 6 次考试的平均成绩分别用 表示,则下列结论正确的是( ) ,x x 乙甲A . ,且甲成绩比乙成绩稳定x x >乙甲B .B . ,且乙成绩比甲成绩稳定x x >乙甲C . ,且甲成绩比乙成绩稳定x x <乙甲D .D .,且乙成绩比甲成绩稳定x x <乙甲【三】其它类型的统计图表频率分布折线图:连结频率分布直方图各个长方形上边的中点,就得到频率分布折线图.总体密度曲线:随着样本容量的增加,分组的组距不断缩小,相应的频率分布折线图就会越来越接近于一条光滑曲线,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.散点图:两个变量的关系可通过它们所对应的点在平面上表现出来,这些点对应的图形叫做散点图.【例1】某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( )A .月接待游客量逐月增加B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳【例2】已知随机变量,其正态分布密度曲线如图所示,若向长方形中随机投掷1()2,1X N ~OABC点,则该点恰好落在阴影部分的概率为( )附:若随机变量,则,()2,,Nξμσ~()0.6826Pμσξμσ-<≤+=. ()220.9544P μσξμσ-<≤+=A .0.1359 B .0.7282C .0.8641D .0.93205【例3】 图1是某县参加2007年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为A 1、图1 图2A 2、…、A m (如A 2表示身高(单位:cm)在[150,155)内的学生人数).图2是统计图1中身高在一定范围内学生人数的一个算法流程图.现要统计身高在160~180cm(含160cm ,不含180cm)的学生人数,那么在流程图中的判断框内应填写的条件是______. 2.巩固提升综合练习【练习1】是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即日均值在2.5PM 2.5PM 以下空气质量为一级,在空气量为二级,超过为超标.如图是某335/g m μ335~75/g m μ375/g m μ地12月1日至10日的(单位:)的日均值,则下列说法不正确的是( )2.5PM 3/g m μA .这天中有天空气质量为一级103B .从日到日日均值逐渐降低69 2.5PMC .这天中日均值的中位数是10 2.5PM 55D .这天中日均值最高的是月日10 2.5PM 126【练习2】 某学校为了了解本校学生的上学方式,在全校范围内随机抽查部分学生,了解到上学方式主要有:A 结伴步行,B 自行乘车,C 家人接送,D 其他方式,并将收集的数据整理绘制成如下两幅不完整的统计图.根据图中信息,可知本次抽查的学生中A 类人数是()A.30B.40 C.42 D.48【练习3】某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15℃,B 点表示四月的平均最低气温约为5℃.下面叙述不正确的是A .各月的平均最低气温都在0℃以上 B .七月的平均温差比一月的平均温差大C .三月和十一月的平均最高气温基本相同D.平均最高气温高于20℃的月份有5个三、课后自我检测1.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,并按编号顺序平均分为40组(1-5号,6-10号,…,196-200号).若第5组抽出的号码为22,则第8组抽出的号码应是______,若用分层抽样方法,则40岁以下年龄段应抽取______人.2.某位教师2017年的家庭总收入为80000元,各种用途占比统计如下面的折线图.2018年收入的各种用途占比统计如下面的条形图,已知2018年的就医费用比2017年增加了4750元,则该教师2018年的家庭总收入为()A.100000元 B.95000元 C.90000元 D.85000元3.(2018全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是( )A.新农村建设后,种植收入减少 B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半4.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56 B.60 C.120 D.1405.高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下,甲、乙、丙为该班三位学生.从这次考试成绩看,①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ;②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 .6.2019年春节期间,我国高速公路继续执行“节假日高速免费政策”.某路桥公司为掌握春节期间车辆出行的高峰情况,在某高速收费点处记录了大年初三上午9:20~10:40这一时间段内通过的车辆数,统计发现这一时间段内共有600辆车通过该收费点,它们通过该收费点的时刻的频率分布直方图如图所示,其中时间段9:20~9:40记作区间[20,40)[40,60)[60,80),9:40~10:00记作,10:00~10:20记作,10:20~10:40记作.比方:10点04分,记作时刻64. [80,100](1)估计这600辆车在9:20~10:40时间段内通过该收费点的时刻的平均值(同一组中的数据用该组区间的中点值代表);(2)为了对数据进行分析,现采用分层抽样的方法从这600辆车中抽取10辆,再从这10辆车中随机抽取4辆,记为9:20~10:00之间通过的车辆数,求的分布列与数学期望;X X (3)由大数据分析可知,车辆在春节期间每天通过该收费点的时刻服从正态分布,其中T 2(,)N μσμ可用这600辆车在9:20~10:40之间通过该收费点的时刻的平均值近似代替,可用样本的方差近似代2σ替(同一组中的数据用该组区间的中点值代表),已知大年初五全天共有1000辆车通过该收费点,估计在9:46~10:40之间通过的车辆数(结果保留到整数).参考数据:若,则2(,)T N a μ ,,()0.6826P T μσμσ-<≤+=()220.9544P T μσμσ-<≤+=. ()330.9974P T μσμσ-<≤+=7.(2018全国卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:)和使用了节水龙3m 头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数1 3 2 4 9 26 5 使用了节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)频数1 5 13 10 16 5 (1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 的概率;3m(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)8.我国已进入新时代中国特色社会主义时期,人民生活水平不断提高.某市随机统计了城区若干户市民十月人均生活支出比九月人均生活支出增加量(记为P 元)的情况,并根据统计数据制成如图频率分布直方图.(1)根据频率分布直方图估算P 的平均值;P (2)若该市城区有4户市民十月人均生活支出比九月人均生活支出分别增加了42元,元,5050元,元,5252元,元,6060元,从这4户中随机抽取2户,求这2户P 值的和超过100元的概率.9. 从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:甲品种:271 273 280 285 285 287 292 294 295 301 303 303 307308 310 314 319 323 325 325 328 331 334 337 352乙品种:284 292 295 304 306 307 312 313 315 315 316 318 318320 322 322 324 327 329 331 333 336 337 343 356由以上数据设计了如下茎叶图根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论:①_________________________________________________________________________ __________________________________________________________________________;②_________________________________________________________________________ __________________________________________________________________________.解析附后方法技巧专题24 统计图表的应用解析篇二、统计图表的应用题型分析【一】频率分布直方图 1.1.例题例题【例1】【解析】 (1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5] 组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a +0.5×a ,解得a =0.30.(2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)设中位数为x 吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x <2.5.由0.50×(x -2)=0.5-0.48,解得x =2.04.故可估计居民月均用水量的中位数为2.04吨.【例2】【解析】(1)由已知得,故.0.700.200.15a =++0.35a =.10.050.150.700.10b =---=(2)甲离子残留百分比的平均值的估计值为.20.1530.2040.3050.2060.1070.05 4.05⨯+⨯+⨯+⨯+⨯+⨯=乙离子残留百分比的平均值的估计值为.30.0540.1050.1560.3570.2080.15 6.00⨯+⨯+⨯+⨯+⨯+⨯=2.巩固提升综合练习【练习1】【解析】(Ⅰ)甲乙被抽到的概率都是101,而且事件“甲工人被抽到”与“乙工人被抽到”相互独立,所以甲、乙两工人都被抽到的概率⋅=⨯=1001101101p A 类工人中和B 类工人中分别抽查25名和75名.(Ⅱ)(i)由4+8+x +5+3=25,得x =5;6+y +36+18=75,得y =15.频率分布直方图如下图1 A 类工人生产能力的频率分布直方图图2 B 类工人生产能力的频率分布直方图从直方图可以判断:B 类工人中个体间的差异程度更小.,123145253135255125255115258105254)ii (=⨯+⨯+⨯⋅+⨯+⨯=Ax ,8.133145751813575361257515115756=⨯+⨯+⨯+⨯=B x 1.1318.1331007512310025=⨯+⨯=x .A 类工人生产能力的平均数,B 类工人生产能力的平均数以及全厂工人生产能力的平均数的估计值分别为123,133.8和131.1.【练习2】【解析】(1)由频率分布直方图知,分数在[[)70,80的频率为0.04100.4⨯=,分数在[)80,90的频率为0.02100.2⨯=,则分数小于70的频率为10.40.20.4--=,故从总体的400名学生中随机抽取一人,估计其分数小于70的概率为0.4.(2)由频率分布直方图知,样本中分数在区间[]50,90的人数为()0.010.020.040.021010090+++⨯⨯= (人),已知样本中分数小于40的学生有5人,所以样本中分数在区间[)40,50内的人数为1009055--= (人),设总体中分数在区间[)40,50内的人数为x ,则5100400x =,得20x =,所以总体中分数在区间[)40,50内的人数为20人.(3)由频率分布直方图知,分数不小于70的人数为()0.040.021010060+⨯⨯= (人),已知分数不小于70的男女生人数相等,故分数不小于70分的男生人数为30人,又因为样本中有一半男生的分数不小于70,故男生的频率为: 0.6,即女生的频率为: 0.4,即总体中男生和女生人数的比例约为:3:2.【练习3】【解析】(1)由于图中所有小矩形的面积之和等于1,所以. 10(0.0050.010.02⨯++0.0250.01)1a+++=解得.0.03a =(2)根据频率分布直方图,成绩不低于60分的频率为.110(0.0050.01)-⨯+0.85=由于该校高一年级共有学生640人,利用样本估计总体的思想,可估计该校高一年级数学成绩不低于60分的人数约为人.6400.85544⨯=(3)成绩在分数段内的人数为人,[)40,50400.052⨯=分别记为,.A B 成绩在分数段内的人数为人,分别记为,,,.[]90,100400.14⨯=C D E F 若从数学成绩在与两个分数段内的学生中随机选取两名学生,[)40,50[]90,100则所有的基本事件有:,,,,,,,,(),A B (),A C (),A D (),A E (),A F (),B C (),B D (),B E ,,,,,,共15种.(),B F (),C D (),C E (),C F (),D E (),D F (),E F如果两名学生的数学成绩都在分数段内或都在分数段内,那么这两名学生的数学成绩[)40,50[]90,100之差的绝对值一定不大于10.如果一个成绩在分数段内,另一个成绩在分数段内,那[)40,50[]90,100么这两名学生的数学成绩之差的绝对值一定大于10.记“这两名学生的数学成绩之差的绝对值不大于10”为事件,则事件包含的基本事件有:M M ,,,,,,共7种.(),A B (),C D (),C E (),C F (),D E (),D F (),E F 所以所求概率为. ()715P M =【练习4】【解析】(I )由用水量的频率分布直方图知,该市居民该月用水量在区间,,,,内的频[]0.5,1(]1,1.5(]1.5,2(]2,2.5(]2.5,3率依次为,,,,.0.10.150.20.250.15所以该月用水量不超过立方米的居民占%,用水量不超过立方米的居民占%.385245依题意,至少定为.w 3(II )由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:组号12345678分组[]2,4(]4,6(]6,8(]8,10(]10,12(]12,17(]17,22(]22,27频率0.10.150.20.250.150.050.050.05根据题意,该市居民该月的人均水费估计为:40.160.1580.2100.25120.15170.05220.05270.05⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯(元).10.5=【二】茎叶图的应用 1.例题【例1】【答案】A【解析】由已知中甲组数据的中位数为65,故乙数据的中位数为65,即y =5,可得乙数据的平均数为66,即甲数据的平均数为66,故 x =3,故选A.56+62+65+70+x +745=66,【例2【答案】 A【解析】A 班兴趣小组的平均成绩为=78,53+62+64+…+92+9515其方差为×[(53-78)2+(62-78)2+…+(95-78)2]=121.6, 则其标准差为≈11.03;115121.6B 班兴趣小组的平均成绩为=66,45+48+51+…+9115其方差为×[(45-66)2+(48-66)2+…+(91-66)2]=175.2, 则其标准差为≈13.24.故选A.115175.2【例3】【解析】(1)由茎叶图观察或计算可得乙班的平均身高较高;(2)甲班的平均身高为170(cm),样本方差为57.2;(3)从乙班随机抽取两名身高不低于173cm 的同学共有10种不同的取法:(173,176)(173,178)(173,179)(173,181)(176,178)(176,179)(176,181)(178,179)(178,181)(179,181),设A 表示随机事件“抽到身高为176cm 的同学”,则A 中的事件有4个,所求概率52)(=A P .2.巩固提升综合练习【练习1】 【答案】 13【解析】 根据茎叶图中的数据知,弟弟的销售量的众数是34,则哥哥的销售量的中位数是34+2=36,∴=36-30, 解得x =5,x +72又(27+20+y +34+34+34+32+42+41)÷8=34, 解得y =8,∴x +y =5+8=13.【练习2】【答案】D 【解析】从茎叶图的数据可以看出甲种树苗的平均高度为27,乙种树苗的平均高度为30,因此乙种树苗的平均高度大于甲种树苗的平均高度.又从茎叶图分析知道,甲种树苗的高度集中在20到30之间,因此长势更集中.【练习3】【答案】C【解析】从茎叶图提取两个人的成绩,分别求出两个人的平均分,得到甲的平均数比乙的平均数要低,但甲数据比较集中,所以成绩比较稳定.,,757782838590826x +++++==甲727681869192836x +++++==乙所以,x x <乙甲因为甲数据比较集中,所以成绩比较稳定.【三】其它类型的统计图表【例1】【答案】A【解析】 根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都是减少,所以A 错误.【例2】【答案】D【解析】由题意,根据正态分布密度曲线的对称性,可得:,()()1(01)220.13592PX P X P X μσμσμσμσ≤≤=-≤≤+--≤≤+=⎡⎤⎣⎦故所求的概率为.故选D.0.135910.932052P =-=【例3】【答案】i <8或i ≤7【解析】条形图的横坐标是身高,纵坐标为每个身高区间内的人数.条形图没有提供具体的数据信息.程序框图的算法含义是统计[160,180)内学生人数,即求A 4+A 5+A 6+A 7的和.2.巩固提升综合练习【练习1】【答案】C【解析】这10天中第一天,第三天和第四天共3天空气质量为一级,所以A 正确;从图可知从日到日日均值逐渐降低,所以B 正确;69 2.5PM 从图可知,这天中日均值最高的是月日,所以D 正确;10 2.5PM 126由图可知,这天中日均值的中位数是,所以C 不正确;10 2.5PM 4145432+=故选C .【练习2】【答案】 A【解析】根据选择D 方式的有18人,占15%,得总人数为=120,1815%故选择A 方式的人数为120-42-30-18=30.【练习3】【答案】D【解析】由图可知0℃在虚线框内,所以各月的平均最低气温都在0℃以上,A 正确;由图可知七月的平均温差比一月的平均温差大,B 正确;由图可知三月和十一月的平均最高气温都约为10℃,基本相同,C 正确;由图可知平均最高气温高于20℃的月份不是5个,D 不正确,故选D .三、课后自我检测1.【答案】 37;20【解析】由已知系统抽样的组距为5,所以相邻组间的号码相差5;由饼形图可知200名职工中,50岁以上人数:40-50岁人数:40岁以下人数=2∶3∶5,总样本为40人,分层抽样抽取每层人数比例为2∶3∶5.2.【答案】 D【解析】由已知得,2017年的就医费用为80 000×10%=8 000元,故2018年的就医费用为12 750元,所以该教师2018年的家庭总收入为=85 000(元).故选D.12 75015%3.【答案】A【解析】通解 设建设前经济收入为,则建设后经济收入为,则由饼图可得建设前种植收入为a 2a 0.6a,其他收入为,养殖收入为.建设后种植收入为,其他收入为,养殖收入为0.04a 0.3a 0.74a 0.1a ,养殖收入与第三产业收入的总和为,所以新农村建设后,种植收入减少是错误的.故0.6a 1.16a 选A .优解 因为,所以新农村建设后,种植收入增加,而不是减少,所以A 是错误的.0.60.372<⨯4.【答案】D【解析】自习时间不少于22.5小时的有,故选D .200(0.160.080.04) 2.5140⨯++⨯=5.【答案】乙 ; 数学【解析】①由图可知,甲的语文成绩排名比总成绩排名靠后;而乙的语文成绩排名比总成绩排名靠前,故填乙.②由图可知,比丙的数学成绩排名还靠后的人比较多;而总成绩的排名中比丙排名靠后的人数比较少,所以丙的数学成绩的排名更靠前,故填数学.6.【解析】(1)这600辆车在9:20~10:40时间段内通过该收费点的时刻的平均值为,即10点04分.()300.005500.015700.020900.0102064⨯+⨯+⨯+⨯⨯=(2)结合频率分布直方图和分层抽样的方法可知:抽取的10辆车中,在10:00前通过的车辆数就是位于时间分组中在这一区间内的车辆数,即,所以的可能取值[)20,60()0.0050.01520104+⨯⨯=X 为0,1,2,3,4.所以,,,()464101014C P X C ===()31644108121C C P X C ===()2264410327C C P X C ===,,()13644104335C C P XC ===()046441014210C C P X C ===所以的分布列为X X01234P114821374351210所以.()1834180123414217352105E X =⨯+⨯+⨯+⨯+⨯=(3)由(1)可得,64μ= ,()()()()2222230640.150640.370640.490640.2σ=-⨯+-⨯+-⨯+-⨯324=所以.18σ=估计在9:46~10:40这一时间段内通过的车辆数,也就是通过的车辆数,46100T <≤由,得 ()2,T N μσ~(641864218)P T -<≤+⨯ ,()()2222P T P T μσμσμσμσ-<≤+-<≤+=+0.8185=所以,估计在9:46~10:40这一时间段内通过的车辆数为(辆).10000.8185819⨯≈7.【解析】(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35的频率为3m 0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35的概率的估计值为0.48.3m (3)该家庭未使用节水龙头50天日用水量的平均数为.11(0.0510.1530.2520.3540.4590.55260.655)0.4850=⨯+⨯+⨯+⨯+⨯+⨯+⨯=x该家庭使用了节水龙头后50天日用水量的平均数为.21(0.0510.1550.25130.35100.45160.555)0.3550=⨯+⨯+⨯+⨯+⨯+⨯=x 估计使用节水龙头后,一年可节省水.3(0.480.35)36547.45(m )-⨯=8.【解析】(1)根据频率分布直方图估算的平均值:P .300.01410400.02610500.03610600.01410700.011048P =⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=(2)该市城区有4户市民十月人均生活支出比九月人均生活支出分别增加了42元,50元,52元,60元,从这4户中随机抽取2户,基本事件总数,246n C ==这2户值的和超过100元包含的基本事件有,,,,共4个,P (42,60)(50,52)(50,60)(52,60)这2户值的和超过100元的概率.∴P 4263p m n ===10.【解析】(可任选两个作答)(1)乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度;(2)甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散(或乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中);(3)甲品种棉花的纤维长度的中位数为307mm ,乙品种棉花的纤维长度的中位数为318mm ;(4)乙品种棉花的纤维长度基本上是对称的,而且大多集中在中间(均值附近),甲品种棉花的纤维长度除一个特殊值(352)外,也大致对称,其分布较均匀;。
统计学计算题例题(含答案)
1、某企业制定了销售额的五年计划, 该计划要求计划期的最后一年的年销售额应达到 1200万元。
实际执行最后两年情况如下表:请根据上表资料,对该企业五年计划的完成情况进行考核。
1、 计划完成相对数 =1410/1200*100%=117.5%该计划完成相对数指标为正指标, 计划完成相对数又大于 100% ,所以表示该计划超额完成。
从第 四年 5 月至第五年 4 月的一年的年销售额之和恰好为 1200 万元,所以该计划在第五年 4 月完成,提 前 8 个月完成。
2、 某地区制定了一个植树造林的五年计划,计划中设定的目标是五年累计植树造林面积为 2000 万 亩。
实际执行情况如下:请对该长期计划的完成情况进行考核。
2、 计划完成程度相对数 =2100/2000*100%=105%计划完成相对数指标大于100%, 且该指标为正指标 , 所以该计划超额完成截止第五年第三季度累计完成 2000 万亩造林面积,所以提前 1 个 季 度 完 成3、某班学生统计学课程考试成绩情况如下表:请根据上述资料计算该班统计学课程的平均成绩、成绩的中位数、众数和成绩的标准差。
3、某企业职工年龄情况如下表:X 二三于=4740/62=76.45 (分)Me=70+ (62/2-18) *10/20=76.5 (分)Mo=70+(20 J5)70/[(2CM5)+(2CM8)]=77 」4 (分)G-7(55-76.45f *3 +⋯⋯+ (95^76.45f *6/62=10.45 (分)4、某学校有5000 名学生,现从中按重复抽样方法抽取250 名同学,调查其每周观看电视的小时数的情况,获得资料如下表:请根据上述资料,以95% 的概率保证程度对全校学生每周平均收看电视时间进行区间估计。
4> 样本平均数X= Sxf/Sf-l250/250-5样 ______________ __________二>/ 刀(好予f/(工f—1 )二V 1136/249 二2. 14抽样平均误差U 二s/ Vn=0.14因为 F (t) =95%, 所以日.96抽样极限误差△ 二t U 二 1. 96*0. 14=0. 27 区间下限=5-0. 27=4. 73 区间上限二5+0. 27-5. 27全校学生每周平均收看电视的吋间在( 4.73,5.27) 小时之间,概率保证程度为95%5 、某企业对全自动生产线上的产品随机抽取1000 件进行检验,发现有45 件是不合格的,设定允许的极限误差为1.32% 。
高考数学经典试题与解析 专题九 计数原理与概率统计
专题九计数原理与概率统计——2025届高考数学考点剖析精创专题卷学校:___________姓名:___________班级:___________考号:___________一、选择题1.[2023年全国高考真题]某校文艺部有4名学生,其中高一、高二年级各2名.从这4名学生中随机选2名组织校文艺汇演,则这2名学生来自不同年级的概率为()A.16B.13C.12D.231.答案:D解析:依题意,用1A ,2A 表示高一的2名学生,1B ,2B 表示高二的2名学生,则从4名学生中随机选2名学生的选法有()12,A A ,()12,B B ,()11,A B ,()12,A B ,()21,A B ,()22,A B ,共6种,其中2名学生来自不同年级的选法有()11,A B ,()12,A B ,()21,A B ,()22,A B ,共4种,所以所求概率4263P ==,故选D.2.将甲、乙等5名同学分别保送到北京大学、上海交通大学、浙江大学三所大学就读,则每所大学至少保送一人的不同保送方法有()A.120种 B.150种 C.180种 D.240种2.答案:B解析:根据题意,分2步进行分析:①先将甲、乙等5名同学分成3组:若分成1,2,2的3组,则有12254222C C C15 A =(种)方法;若分成1,1,3的3组,则有11354322C C C 10 A =(种)方法,故将5人分成3组,每组至少有1人,有151025+=(种)分组方法.②将分好的3组对应三所大学,则每所大学至少保送一人的不同保送方法有3325A 150=(种).3.[2023春·高二·四川内江·期中校考]在12nx ⎫-⎪⎭的展开式中,只有第五项的二项式系数最大,则展开式中6x 的系数是()A.454B.358-C.358D.73.答案:C解析:依题意知第五项的二项式系数最大,所以一共是9项,所以8n =,二项式展开项的通项公式为842218811C C 22rrr rr r r r T x x x -++⎛⎫⎛⎫=-=- ⎪ ⎪⎝⎭⎝⎭,令462r +=,得4r =,所以6x 的系数为448135C 28⎛⎫-= ⎪⎝⎭.故选C.4.抛掷一枚质地均匀的骰子两次,记A ={两次的点数均为奇数},B ={两次的点数之和为8},则()P B A =∣()A.112B.29C.13D.234.答案:B解析:易知()()()n AB P BA n A =∣,其中AB 表示“两次的点数均为奇数,且两次的点数之和为8”,共有两种情况,即(3,5),(5,3),故()2n AB =.而1133()C C 9n A =⋅=,所以()2()()9n AB P B A n A ==∣.故选B.5.[2023春·高二·江苏盐城·月考联考]已知服从正态分布()2,N μσ的随机变量在区间(],μσμσ-+,(]2,2μσμσ-+和(]3,3μσμσ-+内取值的概率分别为68.26%,95.44%和99.74%.若某校高二年级1000名学生的某次考试成绩X 服从正态分布()290,15N ,则此次考试成绩在区间(]105,120内的学生大约有()A.477人B.136人C.341人D.131人5.答案:B 解析:根据题意,()()()60120751050.95440.68261051200.135922P X P X P X <≤-<≤-<≤===,则10000.1359135.9136⨯=≈,故此次考试成绩在区间(]105,120内的学生大约有136人.故选:B.6.某工厂为了对研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x (元)99.29.49.69.810销量y (件)1009493908578预计在今后的销售中,销量与单价仍然服从这种线性相关关系,且该产品的成本是5元/件,为使工厂获得最大利润,该产品的单价应定为()参考公式:对于一组数据()11,x y ,()22,x y ,…,(),n n x y ,其回归直线y bx a =+的斜率和截距的最小二乘估计分别为1221ˆniii nii x ynxy bxnx ==-=-∑∑,ˆˆay bx =-.参考数据:615116iii x y==∑,622160.7i i x x =-=∑.A.9.4元B.9.5元C.9.6元D.9.7元6.答案:B解析:由题意,得1(99.29.49.69.810)9.56x =⨯+++++=,1(1009493908578)906y =⨯+++++=,6162216511669.590ˆ200.76i ii ii x y xybxx ==--⨯⨯===--∑∑,ˆ909.520280a=+⨯=,则ˆ20280y x =-+.设工厂获得利润L 元,则2(5)(20280)20(9.5)405L x x x =--+=--+,当9.5x =时,L 取得最大值.所以当单价定为9.5元时,工厂获得最大利润,故选B.7.[2024春·高一·河南三门峡·期末校考]某高中为了积极响应国家“阳光体育运动”的号召,调查该校3000名学生每周平均体育运动时长的情况,从高一、高二、高三三个年级学生中按照4:3:3的比例进行分层随机抽样,收集了300名学生每周平均体育运动时长(单位:小时)的数据,整理后得到如图所示的频率分布直方图.下列说法不正确的是()A.估计该校学生每周平均体育运动时长为5.8小时B.估计该校高一年级学生每周平均体育运动时长不足4小时的人数为300C.估计该校学生每周平均体育运动时长不少于8小时的百分比为10%D.估计该校学生每周平均体育运动时长不少于8小时的人数为6007.答案:C解析:对于A,估计该校学生每周平均体育运动时长为10.0530.250.370.2590.15110.05 5.8⨯+⨯+⨯+⨯+⨯+⨯=(小时),故选项A 正确;对于B,该校高一年级的总人数为430001200433⨯=++,由题中频率分布直方图可知,该校学生每周平均体育运动时长不足4小时的频率为()0.0250.120.25+⨯=,所以估计该校高一年级学生每周平均体育运动时长不足4小时的人数为12000.25300⨯=,故选项B 正确;对于C,估计该校学生每周平均体育运动时长不少于8小时的百分比为()0.0750.0252100%20%+⨯⨯=,故选项C 错误;对于D,估计该校学生每周平均体育运动时长不少于8小时的人数为300020%600⨯=,故选项D 正确.故选:C.8.甲、乙、丙三人参加“社会主义核心价值观”演讲比赛,若甲、乙、丙三人能荣获一等奖的概率分别为12,23,34,且三人是否获得一等奖相互独立,则这三人中至少有两人获得一等奖的概率为()A.14B.724C.1124D.17248.答案:D解析:设甲、乙、丙获得一等奖的概率分别是()12P A =,()23P B =,()34P C =,则不获一等奖的概率分别是()11122P A =-=,()21133P B =-=,()31144P C =-=,则这三人中恰有两人获得一等奖的概率为:()()()()()()()()()()()()P ABC P ABC P ABC P A P B P C P A P B P C P A P B P C ++=++1231131211123423423424=⨯⨯+⨯⨯+⨯⨯=,这三人都获得一等奖的概率为()()()()12312344P ABC P A P B P C ==⨯⨯=,所以这三人中至少有两人获得一等奖的概率1111724424P =+=.故选:D.二、多项选择题9.[2020年全国高考真题]我国新冠肺炎疫情防控进入常态化,各地有序推动复工复产.下面是某地连续11天的复工、复产指数折线图.根据该折线图,()A.这11天复工指数和复产指数均逐日增加B.在这11天期间,复产指数的增量大于复工指数的增量C.第3天至第11天,复工指数和复产指数都超过80%D.第9天至第11天,复产指数的增量大于复工指数的增量9.答案:CD解析:由题图可知第8,9天复工指数和复产指数均减小,故A 错误;第1天时复工指数小于复产指数,第11天时两指数相等,故复产指数的增量小于复工指数的增量,故B 错误;由题图可知第3天至第11天,复工复产指数都超过80%,故C 正确;第9天至第11天,复产指数的增量大于复工指数的增量,故D 正确.10.已知()*nx n ⎛+∈ ⎝N 的展开式中共有7项,则该二项展开式中()A.所有项的二项式系数和为64 B.所有项的系数和为1C.二项式系数最大的项为第4项 D.有理项共有4项10.答案:ACD解析:由题意知6n =,则6x ⎛⎝的展开式的通项为3666216C C (0,1,2,,6)2rr rr r r r T x x r --+===⋅ .对于A ,所有项的二项式系数和为6264=,故A 正确;对于B ,令1x =,得6613122⎛⎫⎛⎫+= ⎪ ⎪⎝⎭⎝⎭,因此所有项的系数和为632⎛⎫⎪⎝⎭,不为1,故B 错误;对于C,由二项式系数的性质,可知6x ⎛⎝的展开式中第4项的二项式系数最大,为36C 20=,故C 正确;对于D ,当362r-∈Z ,即0,2,4,6r =时,对应的项为有理项,共有4项,故D 正确.故选ACD.11.[2023春·高二·江苏·期中联考]红、黄、蓝被称为三原色,选取任意几种颜色调配,可以调配出其他颜色.已知同一种颜色混合颜色不变,等量的红色加黄色调配出橙色,等量的红色加蓝色调配出紫色,等量的黄色加蓝色调配出绿色.现有红、黄、蓝颜料各2瓶,甲同学从6瓶中任取2瓶颜料,乙同学再从余下的4瓶中任取2瓶颜料,两人分别进行等量调配,A 表示事件“甲同学调配出红色”,B 表示事件“甲同学调配出绿色”,C 表示事件“乙同学调配出紫色”,则下列说法正确的是()A.1()15P A =B.1()4P C A =∣C.4()45P BC =D.事件B 与事件C 相互独立11.答案:AC解析:从6瓶中任取2瓶颜料的方法数为26C .对于A ,A 表示事件“甲同学调配出红色”,若调出红色,需要2瓶颜料均为红色,有22C 种方法,则2226C 1()C 15P A ==,故A 正确;对于B ,事件A 发生需要2瓶颜料均为红色,事件C 发生需要1瓶红色颜料和1瓶蓝色颜料,在事件A 发生的条件下,事件C 不可能发生,所以()0P CA =∣,故B 错误;对于C ,若事件B 发生,则甲同学取出1瓶黄色颜料和1瓶蓝色颜料,则112226C C 4()C 15P B ==,此时还剩1瓶黄色颜料和1瓶蓝色颜料,2瓶红色颜料,则1224C 1()C 3P C B ==∣,故414()()()15345P BC P B P C B =⨯=⨯=∣,故C 正确;对于D ,若事件C 发生,则乙取了1瓶红色颜料和1瓶蓝色颜料,甲同学取了至少1瓶黄色颜料或甲同学取了一瓶红色颜料和一瓶蓝色颜料,则21111111222242222264C C C C C C C C 4()C C 15P C ++==,444()()()151545P B P C P BC ⋅=⨯≠=,事件B 与事件C 不相互独立,故D 错误.故选AC.三、填空题12.一个三位自然数百位、十位、个位上的数字依次为a ,b ,c ,当且仅当有两个数字的和等于第三个数字时称为“有缘数”(如213,134等).若,,{1,2,3,4}a b c ∈,且a ,b ,c 互不相同,则这个三位数为“有缘数”的概率是_________.12.答案:12解析:由1,2,3组成的三位自然数为123,132,213,231,312,321,共6个;同理,由1,2,4组成的三位自然数有6个,由1,3,4组成的三位自然数有6个,由2,3,4组成的三位自然数有6个,共有24个三位自然数.由1,2,3或1,3,4组成的三位自然数为“有缘数”,共12个.所以这个三位数为“有缘数”的概率121242P ==.13.已知随机变量X 有三个不同的取值,分别是0,1,x ,其中(0,1)x ∈,又1(0)4P X ==,1(1)4P X ==,则随机变量X 方差的最小值为__________.13.答案:18解析:由1(0)4P X ==,1(1)4P X ==,得1()2P X x ==,所以随机变量X 的数学期望21()4x E X +=,则方差222221123121111()42444442162x x x D X x ⎡⎤+--⎛⎫⎛⎫⎛⎫⎛⎫=⨯+⨯+⨯=⨯-+⎢⎥ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎢⎥⎣⎦.当12x =时,()D X 取到最小值18,故答案为18.14.[2023届·西北工业大学附中·模拟考试]将8张连号的门票分给5个家庭,甲家庭需要3张连号的门票,乙家庭需要2张连号的门票,剩余的3张门票随机分给其余的3个家庭,并且甲、乙两个家庭不能连排在一起(甲、乙两个家庭内部成员的顺序不予考虑),则这8张门票不同的分配方法有_________种.14.答案:72解析:设8张门票的编号分别为1,2,3,4,5,6,7,8.若甲选123,则乙可以是56,67,78共3种,此时共有333A 18=种;若甲选234,则乙可以是67,78共2种,此时共有332A 12=种;若甲选345,则乙可以是78共1种,此时共有33A 6=种;若甲选456,则乙可以是12共1种,此时共有33A 6=种;若甲选567,则乙可以是12,23共2种,此时共有332A 12=种;若甲选678,则乙可以是12,23,34共3种,此时共有333A 18=种.综上所述,不同的分配方法有181266121872+++++=种.四、解答题15.[2024春·高一·青海西宁·期末]为了解学生的周末学习时间(单位:小时),高一年级某班班主任对本班40名学生某周末的学习时间进行了调查,将所得数据整理绘制出如图所示的频率分布直方图.根据直方图所提供的信息:(1)用分层抽样的方法在[)20,25和[]25,30中共抽取6人成立学习小组,再从该小组派3人接受检测,求检测的3人来自同一区间的概率;(2)估计这40名同学周末学习时间的25%分位数.15.答案:(1)1 5 ;(2)8.75小时.解析:(1)由图可知,40名学生中周末的学习时间在[)20,25的人数为0.035406⨯⨯=人,周末的学习时间在[]25,30的人数为0.0155403⨯⨯=人,从中用分层抽样抽取6人,则周末的学习时间在[)20,25的有4人,记为A,B,C,D;周末的学习时间在[]25,30的有2人,记为a,b;则再从中选派3人接受检测的基本事件有ABC,ABD,ABa,ABb,ACD,ACa,ACb, ADa,ADb,Aab,BCD,BCa,BCb,BDa,BDb,Bab,CDa,CDb,Cab,Dab共有20个,其中检测的3人来自同一区间的基本事件有ABC,ABD,ACD,BCD共有4个,所以检测的3人来自同一区间的概率41205 P==;(2)学习时间在5小时以下的频率为0.0250.10.25⨯=<,学习时间在10小时以下的频率为0.10.0450.30.25+⨯=>,所以25%分位数在区间[)5,10内,则0.250.1 558.750.30.1-+⨯=-,所以这40名同学周末学习时间的25%分位数为8.75小时.16.[2024春·高二·宁夏石嘴山·月考校考]2020年,是人类首次成功从北坡登顶珠峰60周年,也是中国首次精确测定并公布珠峰高程的45周年.华为帮助中国移动开通珠峰峰顶5G ,有助于测量信号的实时开通,为珠峰高程测量提供通信保障,也验证了超高海拔地区5G 信号覆盖的可能性,在持续高风速下5G 信号的稳定性,在条件恶劣地区通过简易设备传输视频信号的可能性.正如任总在一次采访中所说:“华为公司价值体系的理想是为人类服务.”有人曾问,在珠峰开通5G 的意义在哪里?“我认为它是科学技术的一次珠峰登顶,告诉全世界,华为5G 、中国5G 的底气来自哪里.现在,5G 的到来给人们的生活带来更加颠覆性的变革,某IT 公司基于领先技术的支持,5G 经济收入在短期内逐月攀升,该IT 公司在1月份至6月份的5G 经济收入y (单位:百万元)关于月份x 的数据如下表所示,并根据数据绘制了如图所示的散点图.月份x 123456收入y (百万元)6.68.616.121.633.041.0(1)根据散点图判断,y ax b =+与e dx y c =⋅(a ,b ,c ,d 均为常数)哪一个更适宜作为5G 经济收入y 关于月份x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的结果及表中的数据,求出y 关于x 的回归方程,并预测该公司7月份的5G 经济收入.(结果保留小数点后两位)(3)从前6个月的收入中抽取2个,记收入超过20百万元的个数为X ,求X 的分布列和数学期望.参考数据:x yu 621()i i x x =-∑61()()iii x x y y =--∑61()()iii x x uu =--∑ 1.52e 2.66e 3.5021.15 2.8517.70125.35 6.734.5714.30其中,设ln u y =,ln i i u y =(1,2,3,4,5,6i =).参考公式:对于一组具有线性相关关系的数据(),(21,2,3,,)i i x v n = ,其回归直线ˆˆˆvx βα=+的斜率和截距的最小二乘估计公式分别为()()()121ˆniii Ri i x x v v x x β==--=-∑∑,ˆˆv x αβ=-16.答案:(1)e dx y c =⋅更适宜(2) 1.520.38e ˆx y +=,65.35百万元(3)分布列见解析,1解析:(1)根据散点图判断,e dx y c =更适宜作为5G 经济收入y 关于月份x 的回归方程类型;(2)因为e dx y c =,所以两边同时取常用对数,得ln ln y c dx =+,设ln u y =,所以ln u c dx =+,因为 3.50x =, 2.85u =,所以61621()( 6.73ˆ0.380,17.70(iii ii x x u u dx x ==--==≈-∑∑所以ˆln 2.850.380 3.50 1.52c u dx=-≈-⨯=.所以ˆ 1.520.38u x =+,即ˆln 1.520.38y x =+,所以 1.520.38e ˆx y +=.令7x =,得 1.520.387 1.52 2.66ˆe e e 4.5714.3065.35y +⨯==⨯≈⨯≈,故预测该公司7月份的5G 经济收入大约为65.35百万元.(3)前6个月的收入中,收入超过20百万元的有3个,所以X 的取值为0,1,2,2326C 1(0)C 5P X ===,113326C C 3(1)C 5P X ===,2326C 1(2)C 5P X ===,所以X 的分布列为:X 012P153515所以()1310121555E X =⨯+⨯+⨯=.17.[2024春·高三·内蒙古赤峰·开学考试校考]卫生纸主要供人们生活日常卫生之用,是人民群众生活中不可缺少的纸种之一.某品牌卫生纸生产厂家为保证产品的质量,现从甲、乙两条生产线生产的产品中各随机抽取500件进行品质鉴定,并将统计结果整理如下:合格品优等品甲生产线250250乙生产线300200(1)判断能否有99.9%的把握认为产品的品质与生产线有关;(2)用频率近似为概率,从甲、乙两条生产线生产的产品中各随机抽取2件进行详细检测,记抽取的产品中优等品的件数为X ,求随机变量X 的分布列与数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d=+++()20P K k ≥0.100.050.0250.0100.0010k 2.7069.8415.0246.63510.82817.答案:(1)没有;(2)分布列见解析,95解析:(1)补充列联表如下:合格品优等品总计甲生产线250250500乙生产线300200500总计5504501000根据列联表中的数据,经计算得到221000(250200250300)10.10110.828550450500500K ⨯⨯-⨯=≈<⨯⨯⨯,所以没有99.9%的把握认为产品的品质与生产线有关.(2)由题意,甲生产线生产的产品中抽取优等品的频率为25015002=,乙生产线生产的产品中抽取优等品的频率为20025005=,所以估计从甲、乙生产线生产的产品中各随机抽取优等品的概率分别为12,25,由题意随机变量X 的所有可能取值是0,1,2,3,4,()22139025100P X ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭,()22211221312331C C 2525510P X ⎛⎫⎛⎫⎛⎫==⨯⨯+⨯⨯⨯= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭,()2222211221313212372C C 2525525100P X ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫==⨯+⨯⨯⨯⨯+⨯= ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭,()22211221212313C C 252555P X ⎛⎫⎛⎫⎛⎫==⨯⨯+⨯⨯⨯= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭,()2212142525P X ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭,故X 的分布列为:X 01234P91003103710015125所以X 的期望()933711901234100101003255E X =⨯+⨯+⨯+⨯+⨯=.18.[2024春·高二·福建宁德·期末]毒品是人类的公敌,禁毒是社会的责任,当前宁德市正在创建全国禁毒示范城市,我市组织学生参加禁毒知识竞赛,为了解学生对禁毒有关知识的掌握情况,采用随机抽样的方法抽取了500名学生进行调查,成绩全部分布在75145~分之间,根据调查结果绘制的学生成绩的频率分布直方图如图所示.(1)求频率分布直方图中a 的值;(2)由频率分布直方图可认为这次全市学生的竞赛成绩X 近似服从正态分布()2,N μσ,其中μ为样本平均数(同一组数据用该组数据的区间中点值作代表),13.σ=现从全市所有参赛的学生中随机抽取10人进行座谈,设其中竞赛成绩超过135.2分的人数为Y ,求随机变量Y 的期望.(结果精确到0.01);(3)全市组织各校知识竞赛成绩优秀的同学参加总决赛,总决赛采用闯关的形式进行,共有20个关卡,每个关卡的难度由计算机根据选手上一关卡的完成情况进行自动调整,第二关开始,若前一关未通过,则其通过本关的概率为12;若前一关通过,则本关通过的概率为13,已知甲同学第一关通过的概率为13,记甲同学通过第n 关的概率为n P ,请写出n P 的表达式,并求出n P 的最大值.附:若随机变量X 服从正态分布()2,N μσ,则()0.6827P X μσμσ-<≤+≈,()220.9545P X μσμσ-<≤+≈,()330.9973P X μσμσ-<≤+≈.18.答案:(1)0.012;(2)0.23;(3)13217216n n P -⎛⎫=+ ⎪⎝⎭,n P 的最大值为49.解析:(1)由频率分布直方图,得()100.0050.0190.030.020.0021a a ⨯++++++=,解得0.012a =.(2)由题意得:800.05900.121000.191100.3μ=⨯+⨯+⨯+⨯1200.21300.121400.02109.2+⨯+⨯+⨯=,()2109.2,13X N ~,()()()122135.220.022752P X P X P X μσμσμσ--<≤+>=>+=≈,()10,0.02275Y B ~,()0.22750.23E Y np ==≈.(3)记甲同学第()*n n ∈N 关通过为事件n A ,依题意,113P =,当2n ≥时,()113n n P A A -=,()112n n P A A -=,()n n P P A =,所以()()()()()1111n n n n n n n P A P A P A A P A P A A ----=+,所以()111111113262n n n n P P P P ---=+-=-+,所以1313767n n P P +⎛⎫-=- ⎪⎝⎭,又因为113P =,则1320721P -=-≠,所以数列37n P ⎧⎫-⎨⎬⎩⎭是首项为221-,公比为16-的等比数列,所以13217216n n P -⎛⎫=-- ⎪⎝⎭,当n 为奇数时,113213213721672167n n n P --⎛⎫⎛⎫=--=-<⎪⎪⎝⎭⎝⎭,当n 为偶数时,13217216n n P -⎛⎫=+ ⎪⎝⎭,则n P 随着n 的增大而减小,所以,249n P P ≤=,又4397>,所以n P 的最大值为49.19.[2024春·高二·江苏南通·月考校考]篮球运动是在1891年由美国马萨诸塞州斯普林尔德市基督教青年会训练学校体育教师詹姆士·奈史密斯博士,借鉴其他球类运动项目设计发明的.起初,他将两只桃篮钉在健身房内看台的栏杆上,桃篮上沿离地面约3.05米,用足球作为比赛工具,任何一方在获球后,利用传递、运拍,将球向篮内投掷,投球入篮得一分,按得分多少决定比赛胜负.在1891年的12月21日,举行了首次世界篮球比赛,后来篮球界就将此日定为国际篮球日.甲、乙两人进行投篮,比赛规则是:甲、乙每人投3球,进球多的一方获得胜利,胜利1次,则获得一个积分,平局或者输方不得分.已知甲和乙每次进球的概率分别是12和p ,且每人、每次进球与否都互不影响.(1)若23p =,求在进行一轮比赛后甲比乙多投进2球的概率;(2)若1223p ≤≤,且每轮比赛互不影响,乙要想至少获得3个积分且每轮比赛至少要超甲2个球,求:①设事件C 表示乙每轮比赛至少要超甲2个球,求()P C ;(结果用含p 的式子表示)②从数学期望的角度分析,理论上至少要进行多少轮比赛?19.答案:(1)124;(2)①321388p p +;②15解析:(1)设事件i A 表示甲在一轮比赛中投进i 个球,i B 表示乙在一轮比赛中投进i 个球,()0123i =,,,,D 表示进行一轮比赛后甲比乙多投进2球所以2031D A B A B =+()()()2031P D P A B P A B =+2332203133331111211C C C C 22323324⎛⎫⎛⎫⎛⎫⎛⎫=⨯⨯+⨯⨯= ⎪ ⎪ ⎪ ⎪⎝⎭⎝⨯⨯⨯⨯⎭⎝⎭⎝⎭(2)①()()()()203031P C P B A P B A P B A =++()3332231323311113C 1C 22288p p p p p ⎛⎫⎛⎫⎛⎫=-⨯++⎡⎤⎢⎥⎢⎥=+ ⎪ ⎪ ⎪⎝⎭⎝⎭⎣⎭⎦⎝;②设随机变量X 表示n 轮比赛后,乙在每轮比赛至少要超甲2个球的情况下获得的积分,则有3213,88X B n p p ⎛⎫~+ ⎪⎝⎭,故()321388E X n p p ⎛⎫=+ ⎪⎝⎭,要满足题意,则()3E X ≥,即3213388n p p ⎛⎫+≥ ⎪⎝⎭,又12,23p ⎡⎤∈⎢⎥⎣⎦,故3231388n p p ≥+,令()321388f x x x =+,12,23x ⎡⎤∈⎢⎥⎣⎦,则()()3208f x x x '=+>在12,23⎡⎤⎢⎥⎣⎦恒成立,即()f x 在12,23⎡⎤⎢⎥⎣⎦上单调递增,故()f x 的最大值为211354f ⎛⎫=⎪⎝⎭,即321388p p +的最大值为1154,于是,3231388p p +的最小值为16211,因162141511<<,故理论上至少要进行15轮比赛.。
统计学典型例题讲解参考答案
• 三个生产厂商生产的电池平均使用寿命不全相同
由于P<α,则拒绝原假设,可以认为三个生 产商生产的电池平均使用寿命不全相同。
2、多元回归分析实例
3、时间序列分析
某校学生人数逐年增加,1992年比1991年增 长8%,1993年比1992增长7%,2001年比 1993年增长56%,则1991-2001年平均增长速 度为( )。
(2)分析三个生产商生产的电池的平均寿命 之间有无显著差异?
差异源
组间 组内 总计
SS df MS F
P- F crit Value
() () 216.4 () () 14
307.8 () ()
0.000 3.885 31 29
பைடு நூலகம்
提出假设H0 : m1 = m2 =…= mk
• 三个生产厂商生产的电池平均使用寿命相同
某地区计划10年内GDP要翻两番,年均增长 率至少要保持在 ?
时间序列的长期趋势拟合为指数曲线时,若 b=1.2,表明该时间序列( )。
A.、每期增长速度为120% 增长量为1.2个单位
B、每期
C、每期增长速度为20% 降20%
D、逐期下
4、统计指数
1、为了检验不同品牌电池的质量,质检部 门抽检了3家生产商生产的5号电池,在每 个厂抽取5个,
差异源
组间 组内 总计
SS df MS F
P- F crit Value
() () 216.4 () () 14
307.8 () ()
0.000 3.885 31 29
(1)将方差分析表中的空缺数值补齐。
高中统计练习题及讲解
高中统计练习题及讲解一、选择题1. 以下哪个选项是描述数据集中趋势的统计量?- A. 方差- B. 标准差- C. 平均数- D. 极差2. 一组数据的中位数是50,众数是60,这组数据的分布可能是怎样的?- A. 正偏态分布- B. 负偏态分布- C. 对称分布- D. 无法确定二、填空题1. 某班级学生数学成绩的平均数为80分,方差为100,如果一个学生的成绩是90分,那么他的标准分是______。
2. 已知一组数据的中位数为40,如果将这组数据的每个数值都增加10,新的中位数为______。
三、解答题1. 某公司员工的月收入数据如下:4000元,5000元,6000元,7000元,8000元。
请计算这组数据的平均数、中位数和众数。
2. 某班学生期末考试成绩如下:70分,80分,90分,100分。
计算这组数据的方差和标准差。
四、数据分析题某市中学生的身高数据如下(单位:厘米):165,170,175,180,185。
请分析这组数据的分布特征,并计算其平均身高、中位数、众数、方差和标准差。
高中统计练习题讲解一、选择题1. C. 平均数是描述数据集中趋势的统计量,它表示数据集中所有数值的算术平均。
2. A. 如果中位数小于众数,通常意味着数据集呈现正偏态分布。
二、填空题1. 标准分是指一个数值与平均数的差除以标准差。
首先计算平均数:(4000 + 5000 + 6000 + 7000 + 8000) / 5 = 6000。
然后计算标准差:√(100) = 10。
最后计算标准分:(90 - 6000) / 10 = -5。
2. 当数据集中的每个数值都增加一个常数时,中位数也会增加相同的常数。
因此,新的中位数为40 + 10 = 50。
三、解答题1. 平均数 = (4000 + 5000 + 6000 + 7000 + 8000) / 5 = 6000元。
中位数 = 6000元(中间的数值)。
众数 = 6000元(出现次数最多的数值)。
统计有关经典例题解析、及高考题50道,带答案
【经典例题】【例1】(2008广东).为了调查某厂工人生产某种产品的能力,随机抽 查了20位工人某天生产该产品的数量.产品数量的分组区间为[)45,55,[)[)[)55,65,65,75,75,85,[)85,95由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在[)55,75的 人数是 . 【答案】13【解析】20(0.06510)13⨯⨯=,故答案为13.【例2】(2009山东)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的 产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( ).A. 90B.75C. 60D.45【答案】A【解析】产品净重小于100克的概率为(0.050+0.100)×2=0.300,已知样本中产品净重小于100克的个数是36,设样本容量为n ,则300.036=n,所以120=n ,净重大于或等于98克并且小于104克的产品的概率为(0.100+0.150+0.125)×2=0.75,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.75=90.故选A. 【例3】(2009上海)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”。
根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A. 甲地:总体均值为3,中位数为4B. 乙地:总体均值为1,总体方差大于0C. 丙地:中位数为2,众数为3D. 丁地:总体均值为2,总体方差为3 【答案】D【解析】根据信息可知,连续10天内,每天的新增疑似病例不能有超过7的数,选项A 中,中位数为4,可能存在大于7的数;同理,在选项C 中也有可能;选项B 中的总体方差大于0,叙述不明确,如果数目太大,也有可能存在大于7的数;选项D 中,根据方差公式,如果有大于7的数存在,那么方差不会为3,故答案选D. 【例4】(2009湖北)下图是样本容量为200的频率分布直方图。
高中数学涉及的统计学知识典型例题分析
高中数学涉及的统计学知识典型例题分析一、基础知识:(一)随机抽样:1、抽签法:把总体中的N 个个体编号,把号码写在号签上,将号签放在一个容器中搅拌均匀后,每次从中抽取一个号签,连续抽取n 次,就得到容量为n 的样本2、系统抽样:也称为等间隔抽样,大致分为以下几个步骤:(1)先将总体的N 个个体编号(2)确定分段间隔k ,设样本容量为n ,若N n 为整数,则N k n= (3)在第一段中用简单随机抽样确定第一个个体编号l ,则后面每段所确定的个体编号与前一段确定的个体编号差距为k ,例如:第2段所确定的个体编号为l k +,第m 段所确定的个体编号为()1l m k +−,直至完成样本注:(1)若N n不是整数,则先用简单随机抽样剔除若干个个体,使得剩下的个体数能被n 整除,再进行系统抽样。
例如501名学生所抽取的样本容量为10,则先随机抽去1个,剩下的500个个体参加系统抽样(2)利用系统抽样所抽出的个体编号排成等差数列,其公差为k3、分层抽样:也称为按比例抽样,是指在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本。
分层抽样后样本中各层的比例与总体中各个层次的比例相等,这条结论会经常用到(二)频率分布直方图:1、频数与频率(1)频数:指一组数据中个别数据重复出现的次数或一组数据在某个确定的范围内出现的数据的个数.(2)频率:是频数与数据组中所含数据的个数的比,即频率=频数/总数(3)各试验结果的频率之和等于12、频率分布直方图:若要统计每个小组数据在样本容量所占比例大小,则可通过频率分布表(表格形式)和频率分布直方图(图像形式)直观的列出(1)极差:一组数据中最大值与最小值的差(2)组距:将一组数据平均分成若干组(通常5-12组),则组内数据的极差称为组距,所以有组距=极差/组数(3)统计每组的频数,计算出每组的频率,便可根据频率作出频率分布直方图(4)在频率分布直方图中:横轴按组距分段,纵轴为“频率/组距”(5)频率分布直方图的特点:②因为各试验结果的频率之和等于1,所以可得在频率分布直方图中,各个矩形的面积和为1 (三)茎叶图:通常可用于统计和比较两组数据,其中茎是指中间的一列数,通常体现数据中除了末位数前面的其他数位,叶通常代表每个数据的末位数。
统计学题库+答案
统计学题库+答案一、单选题(共50题,每题1分,共50分)1、已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应该采用()。
A、简单算术平均数B、加权算术平均数C、加权调和平均数D、几何平均数正确答案:C2、当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于()。
A、函数关系B、回归关系C、随机关系D、相关关系正确答案:A3、如果分配数列把频数换成频率,那么方差()。
A、不变B、增大C、减小D、无法预期其变化正确答案:A4、按地理区域划片进行的区域抽样,其抽样方法属于()。
A、整群抽样B、等距抽样C、类型抽样D、简单随机抽样正确答案:A5、次数分配数列是()。
A、按数量标志分组形成的数列B、按品质标志分组形成的数列C、按统计指标分组所形成的数列D、按数量标志和品质标志分组所形成的数列正确答案:D6、按组距式分组()。
A、会使资料的真实性受到一定的影响B、会增强资料的真实性C、不会使资料的真实性受到损害D、所得资料是虚假的正确答案:A7、调查时间的含义是()。
A、调查资料报送的时间B、调查工作期限C、进行调查的时间D、调查资料所属的时间正确答案:D8、相关分析中,要求相关的两变量()。
A、都是随机的B、都不是随机变量C、其中因变量是随机变量D、其中自变量是随机变量正确答案:A9、某农贸市场土豆价格2月份比1月份上升5%,3月份比2月份下降2%,则3月份土豆价格与1月份相比()。
A、下降3%B、下降2%C、提高2.9%D、提高3%正确答案:C10、现象之间线性依存关系的程度越低,则相关系数()。
A、越接近于0B、越接近于1C、越接近于1D、在0.5和0.8之间正确答案:A11、计算平均指标最常用的方法和最基本的形式是()。
A、中位数B、众数C、调和平均数D、算术平均数正确答案:D12、全国的粮食产量与人口数之比是()。
A、总量指标B、平均指标C、相对指标D、数量指标正确答案:C13、相关系数的取值范围是()。
统计与统计案例练习题及知识点总结(全面)-高考数学
统计与统计案例练习题与知识点总结1.为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间【答案】C【分析】根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.【详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为0.020.040.066%+==,故A 正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为0.040.0230.1010%+⨯==,故B 正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.100.140.2020.6464%50%++⨯==>,故D 正确;该地农户家庭年收入的平均值的估计值为30.0240.0450.1060.1470.2080.2090.10100.10110.04120.02130.02140.027.68⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=(万元),超过6.5万元,故C 错误.综上,给出结论中不正确的是C.故选:C.【点睛】本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均值的估计值.注意各组的频率等于⨯频率组距组距.2.甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:22()()()()()n ad bc K a b c d a c b d -=++++()2P K k ≥0.0500.0100.001k3.8416.63510.828【答案】(1)75%;60%;(2)能.【分析】本题考查频率统计和独立性检验,属基础题,根据给出公式计算即可【详解】(1)甲机床生产的产品中的一级品的频率为15075% 200=,乙机床生产的产品中的一级品的频率为12060% 200=.(2)()22400150801205040010 6.63527013020020039K⨯-⨯==>>⨯⨯⨯,故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.1.随机抽样(1)简单随机抽样:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)分层抽样:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.用样本的频率分布估计总体分布(1)在频率分布直方图中,纵轴表示频率/组距,数据落在各小组内的频率用各小长方形的面积表示.各小长方形的面积的总和等于1.(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.(3)茎叶图茎是指中间的一列数,叶是从茎的旁边生长出来的数.3.用样本的数字特征估计总体的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x=x1+x2+…+x nn,反映了一组数据的平均水平.(4)标准差:是样本数据到平均数的一种平均距离,s=1[x1-x2+x2-x2+…+x n-x2].n[(x1-x)2+(x2-x)2+…+(x n-x)2](x n是样本数据,n是样本容量,x是样本平均数).(5)方差:s2=1n4.相关关系与回归方程(1)相关关系的分类①正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.②负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(2)线性相关关系如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(3)回归方程①最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.②回归方程方程y ^=b ^x +a ^是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ^,b ^是待定参数.(4)回归分析①定义:对具有相关关系的两个变量进行统计分析的一种常用方法.②样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中(x ,y )称为样本点的中心.③相关系数当r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.5.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为2×2列联表y 1y 2总计x 1a b a +b x 2c d c +d 总计a +cb +da +b +c +d构造一个随机变量K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d 为样本容量.(3)独立性检验:利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验.1.如图为国家统计局2021年1月19日发布的2020年各季度社会消费品零售总额及增速,则下列说法:①各季度社会消费品零售总额增速最快的是4季度;②各季度社会消费品零售总额增速最快的是2季度;③各季度社会消费品零售总额增量最大的是4季度;④各季度社会消费品零售总额增量最大的是2季度.其中所有正确说法的序号为()A.①④B.②③C.①③D.②④2.下图是2020年我国居民消费价格月度涨跌幅度图(来源于国家统计局网站)下列说法错误的是()A.1~12月月度同比的平均值为2.55B .1~12月月度环比的平均值为负数C .1~12月月度同比整体为下降趋势D .1~12月月度环比的方差大于月度同比的方差3.已知相关变量x 和y 的散点图如图所示,若用()11ln y b k x =⋅与22y kx b =+拟合时的相关系数分别为12,r r 则比较12,r r 的大小结果为()A .12r r >B .12r r =C .12r r <D .不确定4.下列说法中错误的个数是①某校共有女生2021人,用简单随机抽样的方法先剔除21人,再按系统抽样的方法抽取为200人,则每个女生被抽到的概率为110;②由样本数据得到的回归直线方程y bx a =+$$$必经过样本中心点()x y ;③如果落在回归直线上的样本点越多,则回归直线方程的拟合效果就越好;④在一个2×2列联表中,由计算得出220.21K =,而()210.8280.001P K ≥≈,则在犯错误的概率不超过0.001的前提下认为这两个变量之间有相关关系.()A .1B .2C .3D .45.质检机构为检测一大型超市某商品的质量情况,从编号为1~120的该商品中利用系统抽样的方法抽8件进行质检,若所抽样本中含有编号67的商品,则下列编号一定被抽到的是()A .112B .53C .38D .96.2020年是全面实现小康社会目标的一年,也是全面打赢脱贫攻坚战的一年,某研究性学习小组调查了某脱贫县的甲、乙两个家庭,对他们过去6年(2014年到2019年)的家庭收入情况分别进行统计,发现他们的收入逐年增长,得到这两个家庭的年人均纯收入(单位:百元/人)茎叶图.对甲、乙两个家庭的年人均纯收入(以下分别简称“甲”“乙”)情况的判断,不正确的是()A.过去的6年,“甲”的极差小于“乙”的极差B.过去的6年,“甲”的平均值小于“乙”的平均值C.过去的6年,“甲”的中位数小于“乙”的中位数D.过去的6年,“甲”的平均增长率小于“乙”的平均增长率7.为了普及新冠肺炎知识,增强疫情防控意识,某学校从高一和高二两个年级各抽取5位同学参加新冠肺炎知识测试,得分(十分制)情况如下表所示,则下列描述正确的是()高一年级组高二年级组得分45678得分569频数11111频数311A.高一年级组数据的平均数为6分,高二年级组数据的平均数为5分B.两组数据的中位数都是6分C.高一年级组数据的极差小于高二年级组数据的极差D.高一年级组成绩的方差小于高二年级组成绩的方差8.某中学2018年的高考考生人数是2015年高考考生人数的1.5倍,为了更好地对比该校考生的升学情况,统计了该校2015年和2018年的高考情况,得到如图柱状图:则下列结论正确的是()A.与2015年相比,2018年一本达线人数减少B .与2015年相比,2018年二本达线人数增加了0.5倍C .2015年与2018年艺体达线人数相同D .与2015年相比,2018年不上线的人数有所增加9.m 个数据的平均数为a ,中位数为b ,方差为c .若将这m 个数据均扩大到原来的2倍得到一组新数据,则下列关于这组新数据的说法正确的是()A .平均数为aB .中位数为2bC D .方差为2c10.已知变量y 关于x 的回归方程为0.5bx y e -=,其一组数据如表所示:若5x =,则预测y 值可能为()x1234ye3e 4e 6e A .5e B .112e C .7e D .152e 11.给出下列说法:①回归直线ˆˆˆy bx a =+恒过样本点的中心(x y ,且至少过一个样本点;②两个变量相关性越强,则相关系数||r 就越接近1;③将一组数据的每个数据都加一个相同的常数后,方差不变;④在回归直线方程ˆ20.5yx =-中,当解释变量x 增加一个单位时,预报变量ˆy 平均减少0.5个单位.其中说法正确的是()A .①②④B .②③④C .①③④D .②④12.在一次对性别与是否说谎有关的调查中,得到如下数据,根据表中数据判断如下结论中正确的是()性别说谎不说谎总计男6713女8917总计141630A .在此次调查中有95%的把握认为是否说谎与性别有关B .在此次调查中有99%的把握认为是否说谎与性别有关C .在此次调查中有99.5%的把握认为是否说谎与性别有关D .在此次调查中没有充分证据显示说谎与性别有关13.下列四个命题中,正确的有()①两个变量间的相关系数r 越小,说明两变量间的线性相关程度越低;②命题“x ∃∈R ,使得210x x ++<”的否定是:“对x ∀∈R ,均有210x x ++>”;③命题“p g ∧为真”是命题“p q ∨为真”的必要不充分条件;④若函数322()3f x x ax bx a =+++在1x =-有极值0,则2a =,9b =或1a =,3b =.A .0B .1C .2D .314.某中学共有1000人,其中男生700人,女生300人,为了了解该校学生每周平均体育锻炼时间的情况以及经常进行体育锻炼的学生是否与性别有关(经常进行体育锻炼是指:周平均体育锻炼时间不少于4小时),现在用分层抽样的方法从中收集200位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如图.已知在样本数据中,有40位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理()附:()()()()()22n ad bc K a c b d a d b c -=++++,其中n a b c d =+++.()20P K k ≥0.100.050.010.0050k 2.7063.8416.6357.879A .有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”B .有90%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C .有90%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”15.下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的概率为()A.0.2B.0.4C.0.5D.0.616.设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为()A.0.01B.0.1C.1D.1017.下图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件)若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为A.5,5B.3,5C.3,7D.5,718.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次[0,200](200,400](400,600]空气质量等级1(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好空气质量不好附:22()()()()()n ad bcKa b c d a c b d-=++++,P(K2≥k)0.0500.0100.001k 3.841 6.63510.82819.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++.P(K2≥k)0.0500.0100.001k 3.841 6.63510.82820.为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:是否需要志愿性别男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提供更好的调查方法来估计该地区老年人,需要志愿帮助的老年人的比例?说明理由附:1.C 【分析】根据折线统计图比较各季度社会消费品零售总额增速,可判断①②的正误;计算各季度社会消费品零售总额增量,可判断③④的正误.【详解】第1季度社会消费品零售总额增速为19.0%-,第2季度社会消费品零售总额增速为 3.9%-,第3季度社会消费品零售总额增速为0.9%,第4季度社会消费品零售总额增速为4.6%,故①正确,②错误;第2季度社会消费品零售总额增量为9.377.86 1.51-=(万亿元),第3季度社会消费品零售总额增量为10.119.370.74-=(万亿元),第4季度社会消费品零售总额增量为11.8710.11 1.76-=(万亿元).故③正确,④错误.故选:C.2.D 【分析】根据图表数据计算平均数,然后判断A 和B ;根据图表数据的变化趋势判断C 和D.【详解】同比平均数:()5.4 5.2 4.3 3.3 2.4 2.5 2.7 2.4 1.70.50.50.72.5512++++++++++-+=,环比平均数:()()()()()()1.40.8 1.20.90.80.10.60.40.20.30.60.20.02512++-+-+-+-++++-+-+=-,1-12月月度同比的平均值为2.55,选项A 正确;1~12月月度环比的平均值为0.025-,选项B 正确;观察图表可以得出,1~12月月度同比整体为下降趋势,选项C 正确;1~12月月度环比的波动小于月度同比的波动,选项D 错误.故选:D .3.C 【分析】由散点图可知,对数形式的拟合程度高,再根据负相关,比较两个相关系数大小.【详解】由散点图可知,()11ln y b k x =拟合比用22y k x b =+拟合的程度高,故12r r >;又因为此关系为负相关,1212,r r r r ∴->-<故选:C 4.B 【分析】由古典概型的特征可判断①;由回归直线方程的特征可判断②③;由独立性检验思想可判断④.【详解】①错误,古典概率中,每个个体被抽的概率都是一样的,都等于2002021;②正确由回归直线方程的特征可知回归直线方程y bx a =+$$$必经过样本中心点(),x y ;③错误,落在回归直线附近的样本点越多,则回归直线方程的拟合效果越好;④正确,当220.21K =,而()210.8280.001P K ≥≈,则在犯错误的概率不超过0.001的前提下认为这两个变量之间有相关关系所以错误个数为2.故选:B.5.A 【分析】根据系统抽样的特征,结合所给编号求出第一组抽取商品编号,即可求解.【详解】由题意知,组距为120158=,设第一组抽取编号为k ,则第n 组抽取的编号为15(1)n k -+,样本中含有编号67的商品,即15(51)67k ⨯-+=,可得7k =,因为1577112⨯+=,即第8组中抽取商品的编号为112.故选:A 6.B 【分析】对茎叶图进行数据分析,分别计算极差、平均数、中位数、及平均增长率,依次判断四个选项.【详解】对于A ,甲的极差为42366-=,乙的极差为41347-=,所以“甲”的极差小于“乙”的极差,A 正确;对于B ,甲的平均数是1230(363737384042)66⨯+++++=,乙的平均数为1228(343638394041)66⨯+++++=,所以“甲”的平均值大于“乙”的平均值,B 错误;对于C ,甲的中位数是1(3738)37.52⨯+=,乙的中位数是1(3839)38.52⨯+=,所以,“甲”的中位数小于“乙”的中位数,C 正确;对于D ,设过去6年甲的平均增长率为x ,则()636142x +=,解得:1x =-,即过去61-;1-.因为42413634<,所以“甲”的平均增长率小于“乙”的平均增长率,D 正确.故选:B.7.D 【分析】根据表中数据,依次讨论各选项即可得答案.【详解】对于A 选项,高一年级和高二年级的平均分均为6分,故A 选项错误;对于B 选项,高一年级的中位数是6,高二年级的中位数是5,故B 选项错误;对于C 选项,高一年级的极差为4,高二年级的极差为3,故高一年级组数据的极差大于高二年级组数据的极差,故C 选项错误;对于D 选项,高一年成绩的方差为()()()()()2222221465666768625S ⎡⎤=-+-+-+-+-=⎣⎦,高二年级成绩的方差为()()()222213566696 2.45S ⎡⎤=-+-+-=⎣⎦,满足,故D 选项正确;故选:D 8.D 【分析】设2015年该校参加高考的人数为S ,则2018年该校参加高考的人数为1.5S ,观察柱状统计图,找出各数据,再利用各数量间的关系列式计算得到【详解】设2015年该校参加高考的人数为S ,则2018年该校参加高考的人数为1.5S.对于选项A :2015年一本达线人数为0.28S ,2018年一本达线人数为0.24×1.5S =0.36S ,可见一本达线人数增加了,故A 错误;对于选项B :2015年二本达线人数为0.32S ,2018年二本达线人数为0.4×1.5S =0.6S ,显然2018年二本达线人数不是增加了0.5倍,故B 错误;对于选项C :2015年和2018年艺体达线率没变,但是人数是不相同的,故C 错误;对于选项D :2015年不上线人数为0.32S ,2018年不上线人数为0.28×1.5S=0.42S ,不达线人数有所增加,故D 正确.故选:D 9.B 【分析】m 个12,,,n x x x 数据的平均数为a ,中位数为b ,方差为c .若将这m 个数据均扩大到原来的2倍得到一组新数据122,2,,2n x x x ,根据平均数、中位数、方差、标准差的定义进行判断即可.【详解】m 个12,,,n x x x 数据的平均数为a ,中位数为b ,方差为c .若将这m 个数据均扩大到原来的2倍得到一组新数据122,2,,2n x x x ,则由于平均数为所有数之和除以m ,故平均数变为2a ,故A 错;中位数为这组数从小到大排列后中间的那个数或中间两数和的平均数,由于每个数都变为原来2倍,所以中位数也变为原来的2倍,即2b ,故B 对;方差描述的是这组数的波动情况,12,,,n x x x 的方差为c ,则122,2,,2n x x x 的方差为224c c =2c =,故C,D 错;故选:B 【点睛】熟悉平均数、中位数、方差、标准差的概念,特别是一组数据扩大某个倍数或增加某个数值的情况下,平均数、中位数、方差、标准差的变化.10.D 【分析】将回归方程左右同时取对数得:ln 0.5y bx =-,看作回归直线的形式,由回归直线过样本中心点可构造方程求得b ,由此得到回归方程;将5x =代入回归方程即可求得结果.【详解】由0.5bx y e-=得:ln 0.5y bx =-,346ln ln ln ln 12340.544e e e e b ++++++∴=⋅-,解得: 1.6b =,∴回归方程为 1.60.5x y e -=,若5x =,则1580.52y e e -==.故选:D.【点睛】关键点点睛:本题考查非线性回归中的预估值的求解,解题关键是能够通过对指数型回归模型左右同时取对数,将其变为线性回归的形式来进行求解.11.B 【分析】①中,根据回归直线方程的特征,可判定是不正确;②中,根据相关系数的意义,可判定是是正确的;③中,根据方差的计算公式,可判定是正确的;④中,根据回归系数的含义,可判定是正确的.【详解】对于①中,回归直线ˆˆˆy bx a =+恒过样本点的中心(x y ,但不一定过一个样本点,所以不正确;对于②中,根据相关系数的意义,可得两个变量相关性越强,则相关系数||r 就越接近1,所以是正确的;对于③中,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,所以是正确的;对于④中,根据回归系数的含义,可得在回归直线方程ˆ20.5yx =-中,当解释变量x 增加一个单位时,预报变量ˆy平均减少0.5个单位,所以是正确的.故选:B.【点睛】本题主要考查了统计知识的相关概念及判定,其中解答中熟记回归直线方程的特征,回归系数的含义,相关系数的意义,以及方程的计算方法是解答的关键,属于基础题.12.D 【解析】根据上表数据可求得20.027 1.323k ≈<,再结合课本上的概率附表可知在此次调查中没有充分证据显示说谎与性别有关,故选D 13.A 【分析】根据相关系数的定义可知①错误;根据特称命题(又叫存在性命题)的否定可知②错误;根据真值表即可判断“p q ∧为真”是命题“p q ∨为真”的充分不必要条件,故③错误;由条件可得,(1)0,(1)0,f f '-=-=解得a=2,b=9或a=1,b=3,经检验,当a=1,b=3时,22()3633(1)0f x x x x '=++=+≥恒成立,此时()f x 没有极值点,故④错误。
统计学综合应用题(有答案)中考23题必练经典
统计学综合应用题(有答案)中考23题必练经典1. 问题描述:某班级学生的身高数据如下:160 170 155 175 165 165 165 185 165 170请计算该班级学生的身高平均值和中位数。
解答步骤:平均值计算:首先将所有身高数据相加,得到总和:160 + 170 + 155 + 175 + 165 + 165 + 165 + 185 + 165 + 170 = 1695。
然后将总和除以学生人数,即10人,得到身高的平均值:1695 / 10 ≈ 169.5。
中位数计算:首先将身高数据从小到大排序:155, 160, 165, 165, 165, 165, 170, 170, 175, 185。
然后找到中间位置的身高数据,即第5个和第6个身高数据:165, 165。
由于这两个数据相同,所以中位数就是165。
2. 问题描述:某学生一周的研究时间如下:2 3 4 5 6 3 4请计算该学生一周的研究时间的方差。
解答步骤:首先计算研究时间的平均值:将所有研究时间相加,得到总和:2 + 3 + 4 + 5 + 6 + 3 + 4 = 27。
然后将总和除以一周的天数,即7天,得到研究时间的平均值:27 / 7 ≈ 3.857。
接下来计算每个研究时间与平均值之差的平方,并将所有平方差相加:(2 - 3.857)^2 + (3 - 3.857)^2 + (4 - 3.857)^2 + (5 - 3.857)^2 + (6 -3.857)^2 + (3 - 3.857)^2 + (4 - 3.857)^2 ≈ 3.857。
最后将平方差的总和除以一周的天数,即7天,得到研究时间的方差:3.857 / 7 ≈ 0.551。
3. 问题描述:某班级学生的考试成绩如下:85 90 95 80 85 90 90 85 95请计算该班级学生的成绩标准差。
解答步骤:首先计算成绩的平均值:将所有成绩相加,得到总和:85 + 90 + 95 + 80 + 85 + 90 + 90 + 85 + 95 = 795。
统计学高考试题及答案
统计学高考试题及答案统计学是一门应用数学学科,主要研究数据收集、分析和解释的方法与技巧。
对于那些打算考取相关专业的学生来说,了解并掌握高考中可能出现的统计学试题及答案,是非常重要的。
本文将介绍一些统计学高考试题的类型和相应的答案。
一、选择题1. 在一次调查中,有300位受访者,其中200人喝咖啡,100人喝茶。
则既不喝咖啡也不喝茶的人数为:A. 0人B. 100人C. 200人D. 300人答案:B. 100人解析:根据题意,喝咖啡的人有200人,喝茶的人有100人,总共有300人。
而既不喝咖啡也不喝茶的人数为300-200-100=100人。
2. 一组数据为7,8,9,10,11,12,则这组数据的四分位数为:A. 8B. 9C. 10D. 11答案:C. 10解析:四分位数是将一组数据按照大小顺序排列后,将其分成4等份,每一份的中间值即为四分位数。
在这组数据中,中位数为9,左边的数据为7,8,右边的数据为11,12。
所以四分位数为10。
二、填空题1. 某数列的前三项为1,3,5,如果从第4项开始,每一项都比前一项大2,则第10项是_____。
答案:17解析:根据题意,第4项为5+2=7,第5项为7+2=9,依此类推,第10项为5+(10-1)×2=5+9×2=5+18=23。
2. 某班级里有60名学生,其中有3人同时擅长数学和英语,15人擅长数学但不擅长英语,则既不擅长数学也不擅长英语的学生有_____名。
答案:42解析:根据题意,3人既擅长数学又擅长英语,15人只擅长数学不擅长英语,这两类学生共占了3+15=18名。
所以既不擅长数学也不擅长英语的学生数目为60-18=42名。
三、计算题1. 某市有5个区,每个区的人口数分别为10万,15万,8万,12万,6万。
则这5个区的人口的中位数为_____。
答案:10万解析:首先将五个区的人口数从小到大排列为6万,8万,10万,12万,15万。
统计高考真题大题解析答案
统计高考真题大题解析答案高考是每年千万考生都期盼和紧张的时刻,而统计学科也是其中一门相对较难的科目之一。
无论是对于广大考生还是对于家长和老师们来说,了解和掌握高考统计真题的解析答案,对于备考也是非常重要的。
本文将为大家解析一些高考统计学科的典型题目,帮助大家更好地理解和应对这门科目。
第一题:某校700位高三学生体重信息的频率分布如下图所示。
学校要求体重指数在18.5至23.9之间的学生视为健康范围内,请计算该校健康体重范围内的学生人数。
此题是一个统计数据的频率分布问题,可以通过绘制频率分布直方图来进行解答。
将体重范围分成若干个组,并计算每个组的频率,然后求出健康体重范围内的频率之和即可得到答案。
第二题:某城市男性和女性的身高数据如下表所示,请计算男性和女性身高的平均值和标准差,并判断两者之间的差异是否具有统计学意义。
此题是一个比较两组数据差异的问题,需要计算平均值和标准差,并进行假设检验来判断差异是否显著。
对于两组数据,分别计算其平均值和标准差,然后应用t检验或方差分析等方法来判断差异是否具有统计学意义。
如果计算得到的显著性水平小于设定的显著性水平(通常为0.05),则可以认为差异具有统计学意义。
第三题:某厂生产的汽车零部件自然寿命数据如下图所示,请根据数据判断该厂生产的零部件的寿命服从正态分布还是指数分布。
此题是一个判断数据分布的问题,需要根据给定的数据来确定数据的分布类型。
对于给定的数据,可以绘制直方图或者QQ图,通过观察数据的分布形态来判断其是否符合正态分布或指数分布。
如果数据的直方图呈现正态分布的形态或者QQ图上的数据点接近于一条直线,则可以判断该数据符合正态分布。
反之,如果数据的直方图呈现指数分布的形态,则可以判断该数据符合指数分布。
通过以上三个例题的解析,我们可以看到高考统计学科的试题常常涉及到数据的处理和分析,需要掌握一定的计算方法和统计原理。
在备考过程中,除了熟悉考纲和掌握基本概念外,还需要多做真题并进行解析,尤其是那些典型的大题。
统计学习题和答案解析[完整]
统计学习题和答案解析[完整]第一部分计量资料的统计描述一、最佳选择题1、描述一组偏态分布资料的变异度,以()指标较好。
A、全距B、标准差C、变异系数D、四分位数间距E、方差2.用均数和标准差可以全面描述()资料的特征。
A.正偏态分布 B.负偏态分布 C.正态分布D.对称分布 E.对数正态分布3.各观察值均加(或减)同一数后()。
A.均数不变,标准差改变 B.均数改变,标准差不变C.两者均不变 D.两者均改变 E.以上都不对4.比较身高和体重两组数据变异度大小宜采用()。
A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距5.偏态分布宜用()描述其分布的集中趋势。
A.算术均数 B.标准差 C.中位数 D.四分位数间距 E.方差6.各观察值同乘以一个不等于0的常数后,()不变。
A.算术均数 B.标准差 C.几何均数 D.中位数 E.变异系数7.()分布的资料,均数等于中位数。
A.对数正态 B.正偏态 C.负偏态 D.偏态 E.正态8.对数正态分布是一种()分布。
(说明:设X变量经Y=lgX变换后服从正态分布,问X变量属何种分布?)A.正态 B.近似正态 C.左偏态 D.右偏态 E.对称9.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。
A.均数 B.标准差 C.中位数 D.四分位数间距 E.几何均数10.血清学滴度资料最常用来表示其平均水平的指标是()。
A.算术平均数 B.中位数 C.几何均数 D.变异系数 E.标准差二、简答题1、对于一组近似正态分布的资料,除样本含量n外,还可计算,S和,问各说明什么?2、试述正态分布、标准正态分布及对数正态分布的某单位1999年正常成年女子血清联系和区别。
甘油三酯(mmol/L)测量结果3、说明频数分布表的用途。
4、变异系数的用途是什么?组段频数5、试述正态分布的面积分布规律。
0.6~ 10.7~ 3三、计算分析题0.8~ 91、根据1999年某地某单位的体检资料,116名正常 0.9~ 13成年女子的血清甘油三酯(mmol/L)测量结果如右表, 1.0~ 19 请据此资料: 1.1~ 25(1)描述集中趋势应选择何指标?并计算之。
高中数学第九章统计经典大题例题(带答案)
高中数学第九章统计经典大题例题单选题1、为保障食品安全,某监管部门对辖区内一家食品企业进行检查,现从其生产的某种产品中随机抽取100件作为样本,并以产品的一项关键质量指标值为检测依据,整理得到如下的样本频率分布直方图.若质量指标值在[25,35)内的产品为一等品,则该企业生产的产品为一等品的概率约为()A.0.38B.0.61C.0.122D.0.75答案:B×组距,即可得解.分析:利用频率=频率组距根据频率分布直方图可知,质量指标值在[25,35)内的概率P=(0.080+0.042)×5=0.122×5=0.61故选:B2、为了更好地支持“中小型企业”的发展,某市决定对部分企业的税收进行适当的减免,某机构调查了当地的中小型企业年收入情况,并根据所得数据画出了样本的频率分布直方图,下面三个结论:①样本数据落在区间[300,500)的频率为0.45;②如果规定年收入在500万元以内的企业才能享受减免税政策,估计有55%的当地中小型企业能享受到减免③样本的中位数为480万元.其中正确结论的个数为A.0B.1C.2D.3答案:D解析:根据直方图求出a=0.0025,求出[300,500)的频率,可判断①;求出[200,500)的频率,可判断②;根据中位数是从左到右频率为0.5的分界点,先确定在哪个区间,再求出占该区间的比例,求出中位数,判断③.由(0.001+0.0015+0,002+0.0005+2a)×100=1,a=0.0025,[300,500)的频率为(0.002+0.0025)×100=0.45,①正确;[200,500)的频率为(0.0015+0.002+0.0025)×100=0.55,②正确;[200,400)的频率为0.3,[200,500)的频率为0.55,,中位数在[400,500)且占该组的45×100=480,③正确.故中位数为400+0.5−0.30.25故选:D.小提示:本题考查补全直方图,由直方图求频率和平均数,属于基础题3、某地区对当地3000户家庭的当年所得年收入情况调查统计,年收入(单位:万元)的频率分布直方图如图所示,数据的分组依次为[2,4),[4,6),[6,8),[8,10],则年收入不超过6万元的家庭有( )A.900户B.600户C.300户D.150户分析:根据频率分布直方图求出[2,4)和[4,6)这两组的频率之和,用这个频率之和乘以样本总量3000即可的答案.由图可知,[2,4)和[4,6)这两组的频率之和为(0.05+0.1)×2=0.3,年收入不超过6万元的家庭有3000×0.3=900户.故选:A.4、新莽铜嘉量是由王莽国师刘歆等人设计制造的标准量器,它包括了龠(yuè)、合、升、斗、斛这五个容量单位.每一个量又有详细的分铭,记录了各器的径、深、底面积和容积.现根据铭文计算,当时制造容器时所用的圆周率分别为3.1547,3.1992,3.1498,3.2031,比《周髀算经》的“径一而周三”前进了一大步,则上面4个数据与祖冲之给出的约率(227≈3.1429)、密率(355113≈3.1416)这6个数据的中位数与极差分别为()A.3.1429,0.0615B.3.1523,0.0615C.3.1498,0.0484D.3.1547,0.0484答案:B分析:先对这6个数由小到大(或由大到小)排列,然后利用中位数和极差的定义求解即可所给6个数据由小到大排列依次为3.1416,3.1429,3.1498,3.1547,3.1992,3.2031,所以这6个数据的中位数为(3.1498+3.1547)÷2≈3.1523,极差为3.2031−3.1416=0.0615,故选:B.5、下表是某校校级联欢晚会比赛中12个班级的得分情况,则得分的30百分位数是()答案:D分析:根据百分位数的定义求解即可.12×30%=3.6,把12个班级的得分按照从小到大排序为7,7,8,9,9,10,10,10,11,13,13,14,可得30百分位数是第4个得分数,即9.故选:D6、某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图,90后从事互联网行业岗位分布条形图,则下列结论错误的是()注:90后指1990年及以后出生,80后指1980−1989年之间出生,80前指1979年及以前出生.A.互联网行业从业人员中从事技术和运营岗位的人数占总人数的三成以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.互联网行业中从事运营岗位的人数90后一定比80前多D.互联网行业中从事技术岗位的人数90后一定比80后多答案:D解析:根据整个互联网行业从业者年龄分布饼状图、90后从事互联网行业岗位分布条形图,对四个选项逐一分析,即可得出正确选项.对于选项A,因为互联网行业从业人员中,“90后”占比为56%,其中从事技术和运营岗位的人数占的比分别为39.6%和17%,则“90后”从事技术和运营岗位的人数占总人数的56%×(39.6%+17%)≈31.7%.“80前”和“80后”中必然也有从事技术和运营岗位的人,则总的占比一定超过三成,故选项A正确;对于选项B,因为互联网行业从业人员中,“90后”占比为56%,其中从事技术岗位的人数占的比为39.6%,则“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%.“80前”和“80后”中必然也有从事技术岗位的人,则总的占比一定超过20%,故选项B正确;对于选项C,“90后”从事运营岗位的人数占总人数的比为56%×17%≈9.5%,大于“80前”的总人数所占比3%,故选项C正确;选项D,“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%,“80后”的总人数所占比为41%,条件中未给出从事技术岗位的占比,故不能判断,所以选项D错误.故选:D.小提示:关键点点睛:本题考查利用扇形统计图和条形统计图解决实际问题,解本题的关键就是利用条形统计图中“90后”事互联网行业岗位的占比乘以“90后”所占总人数的占比,再对各选项逐一分析即可.7、总体由编号01,02,…,29,30的30个个体组成.利用下面的随机数表选取6个个体,选取方法是从如下随机数表的第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第6个个体的编号为()第1行78 16 62 32 08 02 62 42 62 52 53 69 97 28 01 98第2行32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81A.27B.26C.25D.19答案:D分析:根据随机数表法的步骤即可求得答案.由题意,取出的数有23,20,80(超出范围,故舍去),26,24,26(重复,故舍去),25,25(重复,故舍去),36(超出范围,故舍去),99(超出范围,故舍去),72(超出范围,故舍去),80(超出范围,故舍去),19.故选:D.8、某学校在校学生有2000人,为了增强学生的体质,学校举行了跑步和登山比赛,每人都参加且只参加其中一项比赛,高一、高二、高三年级参加跑步的人数分别为a,b,c,且a:b:c=2:5:3,全校参加登山的人数占总人数的1.为了了解学生对本次比赛的满意程度,按分层抽样的方法从中抽取一个容量为200的样本进4行调查,则应从高三年级参加跑步的学生中抽取()A.15人B.30人C.40人D.45人答案:D分析:由题知全校参加跑步的人数为2000×3=1500,再根据分层抽样的方法求解即可得答案.4=1500,解:由题意,可知全校参加跑步的人数为2000×34=450.所以a+b+c=1500.因为a:b:c=2:5:3,所以c=1500×32+5+3因为按分层抽样的方法从中抽取一个容量为200的样本,所以应从高三年级参加跑步的学生中抽取的人数为450×200=45.2000故选:D多选题9、最近几个月,新冠肺炎疫情又出现反复,各学校均加强了疫情防控要求,学生在进校时必须走测温通道,每天早中晚都要进行体温检测并将结果上报主管部门.某班级体温检测员对一周内甲乙两名同学的体温进行了统计,其结果如图所示,则下列结论正确的是()A.甲同学体温的极差为0.4℃B.乙同学体温的众数为36.4℃,中位数与平均数相等C.乙同学的体温比甲同学的体温稳定D.甲同学体温的第60百分位数为36.4℃答案:ABC分析:根据给定的折线图,逐一分析判断各个选项即可作答.观察折线图知,甲同学体温的极差为36.6−36.2=0.4℃,A正确;乙同学体温从小到大排成一列:36.3℃,36.3℃,36.4℃,36.4℃,36.4℃,36.5℃,36.5℃,(36.3×2+36.4×3+36.5×2)=46.4℃,B正乙同学体温的众数为36.4℃,中位数为36.4℃,平均数x=17确;乙同学的体温波动较甲同学的小,极差为0.2℃,也比甲同学的小,因此乙同学的体温比甲同学的体温稳定,C正确;将甲同学的体温从小到大排成一列:36.2℃,36.2℃,36.4℃,36.4℃,36.5℃,36.5℃,36.6℃,因7×60%=4.2,则甲同学体温的第60百分位数为36.5℃,D不正确.故选:ABC10、下表记录了某地区一年之内的月降水量是53mm和56mmC.该年份月降水量的25%分位数是52mmD.该年份月降水量的中位数是56mm答案:ACD分析:A. 利用极差的定义判断;B.利用众数的定义判断;C.利用百分位数的定义判断;D.利用中位数的定义判断.A. 该年份月降水量的极差是71-46=25mm,故正确;B.该年份月降水量的众数是56mm,故错误;C.该年份月降水量从小到大为46,48,51,53,53,56,56,56,56,58,64,66,71,12×25%=3,=52mm,故正确;所以年份月降水量的25%分位数是51+532D. 该年份月降水量从小到大为46,48,51,53,53,56,56,56,56,58,64,66,71,所以该年份月降水量的中位数是56+56=56mm,故正确;2故选:ACD11、某教育局对全区高一年级的学生身高进行抽样调查,随机抽取了200名学生,他们的身高都处在A,B,C,D,E五个层次内,根据抽样结果得到统计图表如下,则下列结论正确的是().A.男生人数为80人B.B层次男女生人数差值最大C.D层次男生人数多于女生人数D.E层次女生人数最少答案:ABD分析:根据条形图求出抽取女生人,得出抽取男生人,再对照图表判断选项中的命题是否正确即可.解:由条形图知,抽取女生学生有18+48+30+18+6=120(人),所以抽取男生有200−120=80(人),选项A正确;B层次的男生有80×(1−10%−15%−20%−25%)=24(人),A,B,C,D,E五个层次男生人数分别:8,24,20,16,12(人),与女生各层次差值分别为:10,24,10,2,6,选项B正确;D层次的男生有12(人),女生有18人,男生人数少于女生,选项C错误;E层次的女生人数最少,选项D正确.故选:ABD.12、某保险公司为客户定制了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险:戊,重大疾病保险,各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得出如下的统计图例:用该样本估计总体,以下四个选项正确的是()A.54周岁以上参保人数最少B.18~29周岁人群参保总费用最少C.丁险种更受参保人青睐D.30周岁以上的人群约占参保人群20%答案:AC分析:根据选项逐一对相应的统计图进行分析判断即可.解:对A:由扇形图可知,54周岁以上参保人数最少,故选项A正确;对B:由折线图可知,18~29周岁人群人均参保费用最少,但是由扇形图知参保人数并不是最少的,所以参保总费用不是最少,故选项B错误;对C:由柱状图可知,丁险种参保比例最高,故选项C正确;对D:由扇形图可知,30周岁以上的人群约占参保人群80%,故选项D错误.故选:AC.13、睡眠很重要,教育部《关于进一步加强中小学生睡眠管理工作的通知》中强调“小学生每天睡眠时间应达到10小时,初中生应达到9小时,高中生应达到8小时”.某机构调查了1万个学生时间利用信息得出下图,则以下判断正确的有()A .高三年级学生平均学习时间最长B .中小学生的平均睡眠时间都没有达到《通知》中的标准,其中高中生平均睡眠时间最接近标准C .大多数年龄段学生平均睡眠时间长于学习时间D .与高中生相比,大学生平均学习时间大幅下降,释放出的时间基本是在睡眠答案:BC分析:根据图象提供数据对选项进行分析,从而确定正确答案.根据图象可知,高三年级学生平均学习时间没有高二年级学生平均学习时间长,A 选项错误.根据图象可知,中小学生平均睡眠时间都没有达到《通知》中的标准,高中生平均睡眠时间最接近标准,B 选项正确.学习时间大于睡眠时间的有:初二、初三、高一、高二、高三,占比516.睡眠时间长于学习时间的占比1116,C 选项正确.从高三到大学一年级,学习时间减少9.65−5.71=3.94,睡眠时间增加8.52−7.9=0.62,所以D 选项错误. 故选:BC填空题14、已知一组样本数据5、2、3、6,则该组数据的第70百分位数为__________.答案:5分析:首先计算指数,再由百分位数的定义可得答案.解:这组样本数据5、2、3、6,从小到大排列为2、3、5、6,又4×70%=2.8,则该组数据的第70百分位数为第3个数5,所以答案是:5.15、若样本数据x1,x2,⋅⋅⋅,x8的标准差为1,则数据2x1−1,2x2−1,⋅⋅⋅,2x8−1的标准差为_______.答案:2解析:若一组数据x1,x2,x3,⋯,x n的方差为s2,则数据ax1+b,ax2+b,ax3+b,⋯,ax n+b的方差为a2s2.若样本数据x1,x2,⋅⋅⋅,x8的标准差为1,则其方差也为1,所以数据2x1−1,2x2−1,⋅⋅⋅,2x8−1的方差为4,标准差为2.所以答案是:2.16、某车间生产A,B,C三种不同型号的产品,产量之比分别为5:k:3,为检验产品的质量,现用分层抽样的方法抽取一个容量为120的样本进行检验,已知B种型号的产品共抽取了24件,则C种型号的产品抽取的件数为_________.答案:36分析:根据题意可得24120=k5+k+3,解方程求出k的值,再根据C种型号的产品所占的比例,求出C种型号的产品应抽取的数量.由题意,得24120=k5+k+3,所以k=2,所以C种型号的产品抽取的件数为120×35+2+3=36.所以答案是:36.解答题17、在①55%分位数,②众数这两个条件中任选一个,补充在下面问题中的横线上,并解答问题.维生素C又叫L-抗坏血酸,是一种水溶性维生素,是高等灵长类动物与其他少数生物的必需营养素.现从猕猴桃、柚子两种食物中测得每100克维生素C的含量(单位:mg)各10个数据如下,其中猕猴桃的一个数据x被污损.猕猴桃:104,119,106,102,132,107,113,134,116,x;柚子:121,113,109,122,114,116,132,121,131,117.已知x等于柚子的10个数据中的___________.(1)求x的值与猕猴桃的数据的中位数;(2)分别计算上述猕猴桃、柚子两种食物中测得每100克维生素C含量的平均数.答案:(1)121,中位数为114.5(2)115.4mg,119.6mg分析:(1)先将柚子从小到大排序,若选①,利用55%分位数的定义得到x=121,若选②,利用众数的定义进行也得到x=121,接着代入猕猴桃里面,从小到大排序算出中位数;(2)利用平均数的定义进行计算(1)柚子的10个数据按照从小到大的顺序排列为:109,113,114,116,117,121,121,122,131,132.选①,因为10×55%=5.5,所以柚子10个数据的55%分位数为第6个数,即121,所以x=121.猕猴桃的10个数据按照从小到大的顺序排列为:102,104,106,107,113,116,119,121,132,134,则(113+116)=114.5.中位数为12选②,因为柚子的10个数据的众数为121,所以x=121.猕猴桃的10个数据按照从小到大的顺序排列为:102,104,106,107,113,116,119,121,132,134,则(113+116)=114.5.中位数为12(2)×(102+104+106+107+113+116+119+121+由(1)得每100克猕猴桃维生素C含量的平均数为110132+134)=115.4mg×(109+113+114+116+117+121+121+122+131+每100克柚子维生素C含量的平均数为110132)=119.6mg18、从某校高一年级新生中随机抽取一个容量为20的身高样本,数据如下(单位:cm,数据间无大小顺序要求):152,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170,171,x,174,175.(1)若x为这组数据的一个众数,求x的取值集合;(2)若样本数据的第90百分位数是173,求x的值;(3)若x=174,试估计该校高一年级新生的平均身高.答案:(1){164,165,168,170}(2)172(3)166.5(cm)分析:(1)首先排列19个数据,根据众数的定义,即可确定x的取值集合;(2)首先确定第90百分位数是第18项和第19项数据的平均数,再讨论x的取值,根据百分位数,列式求值;(3)根据平均数公式,列式求值.(1)其余十九个数据152,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170,171,174,175中,数据出现的频数为3的数有165,170,出现频数为2的数据有164,168.因为x为这组数据的一个众数,所以x的取值集合为{164,165,168,170}.(2)因为20×90%=18,所以90百分位数是第18项和第19项数据的平均数,若x⩽171,则90百分位数为1(171+174)=17,矛盾.2(x+174)=173,所以x=172.若171<x<175,即12(174+175)=174.5,矛盾.若x⩾175,则90百分位数为12综上,x的值为172.(3)依题意可得152+155+158+164+164+165+165+165+166+167+168+168+169+170+170+170+171+174+174+175=3330所以平均数为3330÷20=166.5(cm),估计该校高一年级学生的平均身高.。
2023届高考数学专项(统计与统计案例)历年经典真题、模拟题练习(附答案)
s2 =
s=√0.029 6=0.02 √74 0.17.
^
二乘估计分别为:
∑ ( -)( -)
1
∑ ( -)2
1
^
,
^
.
^ ^
x+ 的斜率和截距的最小
答案解析
1.解 (1)根据产值增长率频数分布表得,所调查的 100 个企业中产值增长率不低于 40%的
14 7
=0.21.
100
企业频率为
2
=0.02.
100
2023 届高考数学专项(统计与统计案例)历年经典
真题、模拟题练习
1.某行业主管部门为了解本行业中小企业的生产情况,随机调查了 100 个企业,得到这些企业第一季
度相对于前一年第一季度产值增长率 y 的频数分布表.
y 的 [[0.20, [0.40, [0.60,
[0,0.20)
0.40) 0.60) 0.80)
参考公式:样本相关系数 r=
∑ (xi -x)(yi -y)
∑ -
1
n
2
∑ ( -)
i 1
1
2
∑ ( -)
1
∑
1
2
2 -
;
2
∑ 2 -
1
^
对于一组具有线性相关关系的数据(xi,yi)(i=1,2,…,n),其经验回归直线
1
∑ -
1
∑ 2 -
2
^
,
^
.
1
4.(历年ꞏ山东潍坊一模)在对人体的脂肪含量和年龄之间的关系的研究中,科研人员获得了一些年龄
高中统计案例试题及答案
高中统计案例试题及答案一、单项选择题(每题2分,共10分)1. 在统计学中,以下哪个选项不是数据收集的方法?A. 观察法B. 实验法C. 调查法D. 访谈法答案:D2. 以下哪种图形最适合展示两个变量之间的关系?A. 条形图B. 折线图C. 饼图D. 散点图答案:D3. 以下哪个指标可以用来衡量数据的离散程度?A. 平均数B. 中位数C. 众数D. 方差答案:D4. 在统计学中,以下哪个概念是描述数据分布的中心位置?A. 极差B. 四分位数C. 标准差D. 均值答案:D5. 以下哪个统计图可以展示数据随时间的变化趋势?A. 柱状图B. 饼图C. 散点图D. 折线图答案:D二、多项选择题(每题3分,共15分)1. 下列哪些因素会影响样本的代表性?A. 样本大小B. 抽样方法C. 样本的随机性D. 样本的多样性答案:A、B、C、D2. 在进行数据整理时,以下哪些步骤是必要的?A. 数据清洗B. 数据分类C. 数据编码D. 数据汇总答案:A、B、C、D3. 以下哪些统计量可以用来描述一组数据的集中趋势?A. 平均数B. 中位数C. 众数D. 极差答案:A、B、C4. 在统计分析中,以下哪些方法可以用来预测未来趋势?A. 线性回归B. 时间序列分析C. 移动平均法D. 指数平滑法答案:A、B、C、D5. 以下哪些图形可以用来展示分类数据的分布?A. 条形图B. 折线图C. 饼图D. 直方图答案:A、C三、填空题(每题2分,共10分)1. 在统计学中,数据的收集、处理、分析和解释的过程称为______。
答案:统计过程2. 当数据按照大小顺序排列后,位于中间位置的数值被称为______。
答案:中位数3. 标准差是衡量数据______程度的统计量。
答案:离散4. 在进行假设检验时,如果原假设被拒绝,则我们认为存在______。
答案:统计显著性5. 相关系数是用来衡量两个变量之间______关系的指标。
答案:线性相关四、简答题(每题5分,共20分)1. 简述什么是抽样误差,并举例说明。
(完整版)概率经典例题及解析、近年高考题50道带答案.doc
【经典例题】【例 1】( 2012 湖北) 如图,在圆心角为直角的扇形 OAB 中,分别以 OA , OB 为直径作两个半圆.在扇形OAB 内随机取一点,则此点取自阴影部分的概率是21 121 A .1- πB . 2 - πC . πD . π【答案】 A【解析】 令 OA=1,扇形 OAB 为对称图形, ACBD 围成面积为 S 1,围成 OC 为 S 2,作对称轴 OD ,则过 C 点. S 2 即为以 OA2 π 1 2 111 π -2 S2(2)-2×2×2=1为直径的半圆面积减去三角形OAC 的面积, S =8 .在扇形 OAD 中 2 为扇形面积减去三角S 2 S 1 1 21 S 2π -2 π -2π形 OAC 面积和 2 , 2 = 8 π×1 - 8 - 2 =16 , S 1+S 2= 4 ,扇形 OAB 面积 S= 4 ,选 A .【例 2】( 2013 湖北) 如图所示,将一个各面都涂了油漆的正方体,切割为 125 个同样大小的小正方体,经过搅拌后, 从中随机取一个小正方体,记它的涂漆面数为X ,则 X 的均值 E(X) = ( )1266 1687 A. 125B. 5C.125D. 5【答案】 B27 54 36 8 27【解析】 X 的取值为 0,1, 2,3 且 P(X = 0) =125,P(X = 1) =125,P(X = 2) = 125,P(X = 3) = 125,故 E(X) =0× 125+1× 54 36 8 6+2× +3× =,选B.125 125 125 5【例 3】( 2012 四川) 节日前夕,小李在家门前的树上挂了两串彩灯,这两串彩灯的第一次闪亮相互独立,且都在通 电后的 4 秒内任一时刻等可能发生,然后每串彩灯以 4 秒为间隔闪亮,那么这两串彩灯同时通电后,它们第一次闪亮的时刻相差不超过 2 秒的概率是 ()1 1 3 7 A. 4B. 2C. 4D. 8【答案】 C【解析】 设第一串彩灯在通电后第 x 秒闪亮, 第二串彩灯在通电后第 y 秒闪亮,由题意 0≤ x ≤ 4,满足条件的关系式0≤y ≤4,根据几何概型可知, 事件全体的测度 ( 面积 ) 为 16 平方单位,而满足条件的事件测度( 阴影部分面积 ) 为 12 平方单位,123故概率为 16= 4.【例 4】( 2009 江苏) 现有 5 根竹竿,它们的长度(单位: m )分别为 2.5,2.6,2.7,2.8,2.9,若从中一次随机抽取2 根竹竿,则它们的长度恰好相差 0.3m 的概率为 .【答案】 0.2 【解析】 从 5 根竹竿中一次随机抽取 2 根的可能的事件总数为 10,它们的长度恰好相差 0.3m 的事件数为 2,分别是:2.5 和 2.8 , 2.6 和 2.9 ,所求概率为 0.2【例 5】( 2013 江苏) 现有某类病毒记作 X m Y n ,其中正整数 m , n(m ≤7, n ≤ 9)可以任意选取,则 m , n 都取到奇数的概率为 ________.20【答案】【解析】 基本事件共有 7×9= 63 种, m 可以取 1, 3, 5,7, n 可以取 1, 3,5, 7, 9. 所以 m ,n 都取到奇数共有 2020种,故所求概率为63.【例 6】( 2013 山东) 在区间 [- 3,3] 上随机取一个数 x ,使得 |x + 1|- |x - 2| ≥1成立的概率为 ________.【答案】13【解析】 当 x<- 1 时,不等式化为- x - 1+ x -2≥1,此时无解;当- 1≤x ≤2 时,不等式化为 x +1+ x -2≥1,解之得 x ≥1;当 x>2 时,不等式化为 x + 1- x +2≥1,此时恒成立, ∴|x + 1| - |x -2| ≥1的解集为 [ 1,+∞ ) . 在 [ -3, 3]上使不等式有解的区间为 [ 1,3] ,由几何概型的概率公式得 P = 3- 1 1 .3-(- 3) =3【例 7】( 2013 北京)下图是某市 3 月 1 日至 14 日的空气质量指数趋势图, 空气质量指数小于 100 表示空气质量优良, 空气质量指数大于 200 表示空气重度污染. 某人随机选择 3 月 1 日至 3 月 13 日中的某一天到达该市, 并停留 2 天.( 1)求此人到达当日空气重度污染的概率;( 2)设 X 是此人停留 期间空气质量优良的天数,求 X 的分布列与数学期望;( 3)由图判断从哪天开始连续三天的空气质量指数方差最大?(结论不要求证明 )【答案】 132; 1213; 3 月 5 日【解析】 设 Ai 表示事件“此人于3 月 i 日到达该市” (i = 1, 2, , 13) .1(i ≠j) .根据题意, P(Ai) = ,且 Ai ∩Aj =13( 1)设 B 为事件“此人到达当日空气重度污染”,则B =A5∪A8.2所以 P(B) =P(A5∪A8)= P(A5) + P(A8) = .13( 2)由题意可知, X 的所有可能取值为 0,1, 2,且P(X= 1) =P(A3∪A6∪A7 ∪A11)4=P(A3) + P(A6) + P(A7) + P(A11) =13,P(X= 2) =P(A1∪A2∪A12∪A13)4=P(A1) + P(A2) + P(A12) + P(A13) =13,5P(X= 0) = 1- P(X= 1) - P(X= 2) =13.所以 X 的分布列为X 0 1 2P 5 4 4 13 13 135 4 4 12故 X 的期望 E(X) =0×+1×+2×= .13 13 13 13( 3)从 3 月 5 日开始连续三天的空气质量指数方差最大.【例 8】(2013 福建)某联欢晚会举行抽奖活动,举办方设置了甲、乙两种抽奖方案,方案甲的中奖率为2,中奖可以3 获得 2 分;方案乙的中奖率为2,中奖可以获得 3 分;未中奖则不得分.每人有且只有一次抽奖机会,每次抽奖中5奖与否互不影响,晚会结束后凭分数兑换奖品.( 1)若小明选择方案甲抽奖,小红选择方案乙抽奖,记他们的累计得分为X ,求 X≤3的概率;(2)若小明、小红两人都选择方案甲或都选择方案乙进行抽奖,问:他们选择何种方案抽奖,累计得分的数学期望较大?【答案】1115;方案甲.2 2【解析】方法一:( 1)由已知得,小明中奖的概率为3,小红中奖的概率为5,且两人中奖与否互不影响.记“这2 人的累计得分X≤3”的事件为A,则事件 A 的对立事件为“ X=5”,2 2 411因为 P(X=5) =×=,所以P(A)=1-P(X=5)=,3 5 151511即这两人的累计得分X≤3的概率为15.( 2)设小明、小红都选择方案甲抽奖中奖次数为X1,都选择方案乙抽奖中奖次数为X2,则这两人选择方案甲抽奖累计得分的数学期望为E(2X1) ,选择方案乙抽奖累计得分的数学期望为E(3X2) .2 2由已知可得,X1~ B 2,3, X2~ B 2,5,2 42 4所以 E(X1) =2×3=3, E(X2) =2×5=5,812从而 E(2X1) = 2E(X1) =, E(3X2) = 3E(X2) =.3 5因为 E(2X1)>E(3X2) ,所以他们都选择方案甲进行抽奖时,累计得分的数学期望较大.方法二:( 1)由已知得,小明中奖的概率为2,小红中奖的概率为2,且两人中奖与否互不影响.35记“这两人的累计得分 X ≤3”的事件为 A ,则事件 A 包含有“ X =0”“ X =2”“ X =3”三个两两互斥的事件,2 2 1 2 2 22 22, 因为 P(X = 0) = 1-× 1- = ,P(X = 2) = × 1-= ,P(X =3) = 1- × = 15 355355 3 511所以 P(A) = P(X = 0) + P(X = 2) + P(X = 3) =15,11即这两人的累计得分 X ≤3的概率为 15.( 2)设小明、小红都选择方案甲所获得的累计得分为 X1,都选择方案乙所获得的累计得分为X2,则 X1, X2 的分布列如下:X1 0 2 4 X2 0 3 6 P14 4 P912 4 9 9 9 2525251448所以 E(X1) =0× 9+2× 9+4× 9= 3,E(X2) =0× 9 +3× 12+6× 4 = 12.25 25 25 5因为 E(X1)>E(X2) ,所以他们都选择方案甲进行抽奖时,累计得分的数学期望较大.【例 9】( 2013 浙江) 设袋子中装有 a 个红球, b 个黄球, c 个蓝球,且规定:取出一个红球得1 分,取出一个黄球得2 分,取出一个蓝球得3 分.( 1)当 a = 3, b = 2,c = 1 时,从该袋子中任取 (有放回,且每球取到的机会均等 )2 个球,记随机变量 ξ为取出此 2球所得分数之和,求 ξ的分布列;( 2)从该袋子中任取 (每球取到的机会均等 )1 个球,记随机变量 η为取出此球所得分数. 若 E η= 5,D η=5,求 a ∶ b ∶ c.3 9【答案】 3∶ 2∶ 1【解析】( 1)由题意得,ξ= 2, 3, 4, 5, 6.P(ξ= 2) = 3×3 1= ,6×6 4 P(ξ= 3) =2×3×2= 1,6×6 32×3×1+2×2 5 P(ξ= 4) = 6×6 = 18. P(ξ= 5) = 2×2×1 16×6= 9,P(ξ= 6) = 1×1 1,= 366×6 所以 ξ 的分布列为ξ 2 3 4 5 6 P1 1 5 1 1 4318936( 2)由题意知 η 的分布列为η 1 2 3Pa b ca +b +c a + b + ca +b +ca 2b3c5所以 E η= a + b + c + a +b + c + a +b + c = 3,5 a 5 b 5c5D η= 1- 32· a + b + c +2- 32· a + b + c +3- 32· a + b + c = 9, 2a - b - 4c = 0,解得 a = 3c , b = 2c , 化简得a + 4b -11c = 0,故 a ∶b ∶c =3∶2∶1.【例 10】( 2009 北京理) 某学生在上学路上要经过 4 个路口, 假设在各路口是否遇到红灯是相互独立的,遇到红灯的 概率都是 1,遇到红灯时停留的时间都是2min.3( 1)求这名学生在上学路上到第三个路口时首次遇到红灯的概率; ( 2)求这名学生在上学路上因遇到红灯停留的总时间的分布列及期望 .【答案】4;327 8【解析】 本题主要考查随机事件、互斥事件、相互独立事件等概率知识、考查离散型随机变量的分布列和期望等基础 知识,考查运用概率与统计知识解决实际问题的能力.( 1)设这名学生在上学路上到第三个路口时首次遇到红灯为事件 A ,因为事件 A 等于事件“这名学生在第一和第二个路口没有遇到红灯,在第三个路口遇到红灯”,所以事件A 的概率为PA11111 4 .333 27( 2)由题意,可得可能取的值为 0,2, 4, 6,8(单位: min ) .事件“2k ”等价于事件“该学生在路上遇到k 次红灯”( k 0, 1, 2,3, 4),k 4 k∴ P2kC k412k 0,1,2,3,4,33∴即 的分布列是0 246 8P16 32 8818181278181∴ 的期望是 E16 32 88 1 82468.818127 81813【课堂练习】1.( 2013 广东) 已知离散型随机变量X 的分布列为X 1 2 3P3 3 151010则 X 的数学期望 E(X) = () 35A. 2B . 2 C. 2 D . 32.( 2013 陕西) 如图,在矩形区域 ABCD 的 A ,C 两点处各有一个通信基站,假设其信号的覆盖范围分别是扇形区 域 ADE 和扇形区域 CBF( 该矩形区域内无其他信号来源,基站工作正常 ).若在该矩形区域内随机地选一地点,则该地点无 信号的概率是 ( ).A .1- π π π D . π4 B . -1 B .2- 42 23.在棱长分别为 1, 2, 3 的长方体上随机选取两个相异顶点,若每个顶点被选的概率相同,则选到两个顶点的距离 大于 3的概率为 ()4 3 2 3A .7B . 7C . 7D . 144.( 2009 安徽理) 考察正方体 6 个面的中心,甲从这 6 个点中任意选两个点连成直线,乙也从这6 个点中任意选两个点连成直线,则所得的两条直线相互平行但不重合的概率等于12 34?BA .B .C .D .75757575?F?C?D? E? A5.( 2009 江西理) 为了庆祝六一儿童节,某食品厂制作了3 种不同的精美卡片,每袋食品随机装入一张卡片,集齐3种卡片可获奖,现购买该种食品5 袋,能获奖的概率为()3133 C .4850A .B .81D ..8181816.( 2009 辽宁文) ABCD 为长方形, AB = 2, BC =1,O 为 AB 的中点,在长方形ABCD 内随机取一点,取到的点到O 的距离大于 1 的概率为A .B . 1C .8D . 18447.( 2009 上海理) 若事件 E 与 F 相互独立,且 P EP F1 的值等于,则P EI F4A . 01 C .11B .4D .1628.( 2013 广州) 在区间 [1,5] 和[2, 4]上分别取一个数,记为a ,b ,则方程 x 2 y 22+b 2= 1 表示焦点在 x 轴上且离心率小a于 3的椭圆的概率为 ()2C .1711531A .2B . 3232D . 321, 2,3,9.已知数列 {a } 满足 a = a+ n - 1(n ≥2,n ∈ N),一颗质地均匀的正方体骰子,其六个面上的点数分别为nnn -14, 5, 6,将这颗骰子连续抛掷三次,得到的点数分别记为 a , b , c ,则满足集合 {a ,b , c} = {a 1, a 2, a 3}(1 ≤a i ≤6,i = 1, 2, 3)的概率是 ()1B . 1C . 1D . 1A .72 36 24 1210.( 2009 湖北文) 甲、乙、丙三人将参加某项测试,他们能达标的概率分别是0.8、 0.6、 0.5,则三人都达标的概率是,三人中至少有一人达标的概率是 。
统计专题训练经典练习题(含答案)
统计专题训练经典练习题(含答案)统计专题训练经典练题(含答案)以下是一些统计学的经典练题,附带答案供参考。
1. 对于一个班级的学生成绩,已知平均分为75分,标准差为5分。
如果班级总人数为100人,问有多少学生的成绩在65分以上?答案:根据正态分布的性质,我们可以应用标准正态分布表,计算得到 z 值为 (65-75)/5 = -2,查表得到对应的累积概率为 0.0228,因此在65分以上的学生人数约为0.0228 * 100 ≈ 2.28,即约有 2 名学生的成绩在65分以上。
2. 一家工厂生产的产品长度服从正态分布,平均长度为10cm,标准差为0.5cm。
若从该工厂中随机抽取50个产品,问有多少产品的长度在9.5cm至10cm之间?答案:由于从该工厂中抽取的产品长度服从正态分布,我们可以计算出抽样分布的均值和标准差为 10cm 和0.5cm/sqrt(50) ≈0.0707cm。
然后,我们可以将区间 [9.5cm, 10cm] 转化为 z 值计算区间内的概率。
计算得到 z 值为 (10-9.5)/0.0707 ≈ 7.07,查表得到对应的累积概率为 0.9999。
因此,在9.5cm至10cm之间的产品数量约为0.9999 * 50 ≈ 49.995,即约有 50 个产品的长度在9.5cm至10cm之间。
3. 某次调查发现,两种不同品牌的汽车在某一地区的市场占有率的估计值分别为 0.60 和 0.40,并且总样本量为 5000。
现在需要对这一地区汽车市场占有率的差异进行检验。
问如何构建零假设和备择假设?并说明该检验的类型。
答案:对于差异检验,我们可以构建如下的零假设和备择假设:零假设(H0):两个品牌的汽车市场占有率没有差异,即 p1= p2。
备择假设(H1):两个品牌的汽车市场占有率存在差异,即p1 ≠ p2。
该检验属于双侧检验,因为备择假设是双向的,即可能两个品牌的市场占有率存在大于和小于的差异。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【经典例题】【例1】(2008广东).为了调查某厂工人生产某种产品的能力,随机抽 查了20位工人某天生产该产品的数量.产品数量的分组区间为[)45,55,[)[)[)55,65,65,75,75,85,[)85,95由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在[)55,75的 人数是 . 【答案】13【解析】20(0.06510)13⨯⨯=,故答案为13.【例2】(2009山东)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的 产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( ).A. 90B.75C. 60D.45【答案】A【解析】产品净重小于100克的概率为(0.050+0.100)×2=0.300, 已知样本中产品净重小于100克的个数是36,设样本容量为n , 则300.036=n,所以120=n ,净重大于或等于98克并且小于104克的产品的概率为(0.100+0.150+0.125)×2=0.75,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.75=90.故选A.【例3】(2009上海)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”。
根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A. 甲地:总体均值为3,中位数为4B. 乙地:总体均值为1,总体方差大于0C. 丙地:中位数为2,众数为3D. 丁地:总体均值为2,总体方差为3 【答案】D【解析】根据信息可知,连续10天内,每天的新增疑似病例不能有超过7的数,选项A 中,中位数为4,可能存在大于7的数;同理,在选项C 中也有可能;选项B 中的总体方差大于0,叙述不明确,如果数目太大,也有可能存在大于7的数;选项D 中,根据方差公式,如果有大于7的数存在,那么方差不会为3,故答案选D.第8题图【例4】(2009湖北)下图是样本容量为200的频率分布直方图。
根据样本的频率分布直方图估计,样本数据落在[6,10]内的频数为 ,数据落在(2,10)内的概率约为 。
【答案】64【解析】观察直方图易得频数为2000.08464⨯⨯=,频率为0.140.4⨯=【例5】(2009福建)点A 为周长等于3的圆周上的一个定点,若在该圆周上随机取一点B ,则劣弧AB 的长度小于1的概率为 。
【答案】23【解析】可设1AB =,则1AB =,根据几何概率可知其整体事件是其周长3,则其概率是23【例6】(2013江苏)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:则成绩较为稳定(方差较小)的那位运动员成绩的方差为________. 【答案】2【解析】由题知x 甲=15(87+91+90+89+93)=90,s2甲=15(9+1+0+1+9)=4;x 乙=15(89+90+91+88+92)=90,s2乙=15(1+0+1+4+4)=2,所以s2甲>s2乙,故答案为2.【例7】(2011广东)在某次测验中,有6位同学的平均成绩为75分.用x n 表示编号为n (n=1,2,…,6)的同学所得成绩,且前5位同学的成绩如下:(1)求第6位同学的成绩6,及这6位同学成绩的标准差s ;(2)从前5位同学中,随机地选2位同学,求恰有1位同学成绩在区间(68,75)中的概率. 【答案】7;0.4【解析】(1)根据平均数的个数可得75=,∴x6=90,这六位同学的方差是(25+1+9+25+9+225)=49, ∴这六位同学的标准差是7(2)由题意知本题是一个古典概型,试验发生包含的事件是从5位同学中选2个,共有C52=10种结果, 满足条件的事件是恰有一位成绩在区间(68,75)中,共有C41=4种结果, 根据古典概型概率个数得到P==0.4.【例8】(2009广东)随机抽取某中学甲乙两班各10名同学,测量他们的身高 (单位:cm ),获得身高数据的茎叶图如图. (1)根据茎叶图判断哪个班的平均身高较高; (2)计算甲班的样本方差(3)现从乙班这10名同学中随机抽取两名身高不低于173cm 的同学,求身高为 176cm 的同学被抽中的概率. 【答案】乙班;57;25【解析】(1)由茎叶图可知:甲班身高集中于160179:之间,而乙班身高集中于170180: 之间。
因此乙班平均身高高于甲班;(2) 15816216316816817017117917918217010x +++++++++==甲班的样本方差为()()()()222221[(158170)16217016317016817016817010-+-+-+-+-()()()()()22222170170171170179170179170182170]+-+-+-+-+-=57 (3)设身高为176cm 的同学被抽中的事件为A ;从乙班10名同学中抽中两名身高不低于173cm 的同学有:(181,173) (181,176) (181,178) (181,179) (179,173) (179,176) (179,178) (178,173) (178, 176) (176,173)共10个基本事件,而事件A 含有4个基本事件; ()42105P A ∴== 【例9】(2009山东)一汽车厂生产A,B,C 三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):按类型分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A 类轿车10辆. (1)求z 的值.(2)用分层抽样的方法在C 类轿车中抽取一个容量为5的样本.将该样本看成一个总体,从中任取2辆,求至少有1辆舒适型轿车的概率;(3)用随机抽样的方法从B 类舒适型轿车中抽取8辆,经检测它们的得分如下:9.4, 8.6, 9.2, 9.6, 8.7, 9.3, 9.0, 8.2.把这8辆轿车的得分看作一个总体,从中任取一个数,求该数与样本平均数之差的绝对值不超过0.5的概率. 【答案】400;710;34【解析】(1)设该厂本月生产轿车为n 辆,由题意得,5010100300n =+,所以n=2000. z=2000-100-300-150-450-600=400 (2)设所抽样本中有m 辆舒适型轿车,因为用分层抽样的方法在C 类轿车中抽取一个容量为5的样本,所以40010005m=,解得m=2也就是抽取了2辆舒适型轿车,3辆标准型轿车,分别记作S 1,S 2;B 1,B 2,B 3,则从中任取2辆的所有基本事件为(S 1, B 1), (S 1, B 2) , (S 1, B 3) (S 2 ,B 1), (S 2 ,B 2), (S 2 ,B 3),( (S 1, S 2),(B 1 ,B 2), (B 2 ,B 3) ,(B 1 ,B 3)共10个,其中至少有1辆舒适型轿车的基本事件有7个基本事件: (S 1, B 1), (S 1, B 2) , (S 1, B 3) (S 2 ,B 1), (S 2 ,B 2), (S 2 ,B 3),( (S 1, S 2),所以从中任取2辆,至少有1辆舒适型轿车的概率为710. (3)样本的平均数为1(9.48.69.29.68.79.39.08.2)98x =+++++++=, 那么与样本平均数之差的绝对值不超过0.5的数为9.4, 8.6, 9.2, 8.7, 9.3, 9.0这6个数,总的个数为8,所以该数与样本平均数之差的绝对值不超过0.5的概率为34. 【例10】(2011北京)以下茎叶图记录了甲、乙两组各四名同学的植树棵树。
乙组记录中有一个数据模糊,无法确认,在图中以X 表示。
(1)如果X=8,求乙组同学植树棵树的平均数和方差;(2)如果X=9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵树Y 的分布列和数学期望。
(注:方差()()()2222121n s x x x x x x n ⎡⎤=-+-++-⎢⎥⎣⎦ ,其中x 为1x ,2x ,…… n x 的平均数)【答案】1116;19【解析】(1)当X=8时,由茎叶图可知,乙组同学的植树棵数是:8,8,9,10,所以平均数为;435410988=+++=x方差为.1611])43510()4359()4358()4358[(4122222=-+-+-+-=s (2)当X=9时,由茎叶图可知,甲组同学的植树棵树是:9,9,11,11;乙组同学的植树棵数是:9,8,9,10。
分别从甲、乙两组中随机选取一名同学,共有4×4=16种可能的结果,这两名同学植树总棵数Y 的可能取值为17,18,19,20,21事件“Y=17”等价于“甲组选出的同学植树9棵,乙组选出的同学植树8棵”所以该事件有2种可能的结果,因此P (Y=17)=.81162= 同理可得;41)18(==Y P ;41)19(==Y P .81)21(;41)20(====Y P Y P 所以随机变量Y 的分布列为:17(17)18(18)19(19)20(20)EY P Y P Y P Y P Y =⨯=+⨯=+⨯=+⨯=21(21)P Y +⨯==11111171819202184448⨯+⨯+⨯+⨯+⨯=19 【课堂练习】1.(2008山东)右图是根据《山东统计年整2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为( ) A. 304.6 B. 303.6 C. 302.6 D. 301.62.(2011湖北)已知随机变量ξ服从正态分布N (2,σ2),且P (ξ<4)=0.8,则P (0<ξ<2)等于( ). A .0.6 B .0.4 C .0.3 D .0.23.(2009四川)设矩形的长为a ,宽为b ,其比满足b ∶a =618.0215≈-,这种矩形给人以美感,称为黄金矩形。
黄金矩形常应用于工艺品设计中。
下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本: 甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是( ) A. 甲批次的总体平均数与标准值更接近 B. 乙批次的总体平均数与标准值更接近C. 两个批次总体平均数与标准值接近程度相同D. 两个批次总体平均数与标准值接近程度不能确定4.(2009陕西)某单位共有老、中、青职工430人,其中青年职工160人,中年职工人数是老年职工人数的2倍。