聚焦高考 统计解答题
高考数学复习专题训练—统计与概率解答题(含解析)
高考数学复习专题训练—统计与概率解答题1.(2021·广东广州二模改编)根据相关统计,2010年以后中国贫困人口规模呈逐年下降趋势,2011~2019年全国农村贫困发生率的散点图如下:注:年份代码1~9分别对应年份2011年~2019年.(1)求y 关于t 的经验回归方程(系数精确到0.01);(2)已知某贫困地区的农民人均年纯收入X (单位:万元)满足正态分布N (1.6,0.36),若该地区约有97.72%的农民人均纯收入高于该地区最低人均年纯收入标准,则该地区最低人均年纯收入标准大约为多少万元?参考数据与公式:∑i=19y i =54.2,∑i=19t i y i =183.6. 经验回归直线y ^=b ^t+a ^的斜率和截距的最小二乘估计分别为b ^=∑i=1n t i y i -nt y ∑i=1n (t i -t )2 ,a ^=y −b ^t . 若随机变量X 服从正态分布N (μ,σ2),则P (μ-σ≤X ≤μ+σ)≈0.682 7,P (μ-2σ≤X ≤μ+2σ)≈0.954 5,P (μ-3σ≤X ≤μ+3σ)≈0.997 3.2.(2021·湖北黄冈适应性考试改编)产品质量是企业的生命线.为提高产品质量,企业非常重视产品生产线的质量.某企业引进了生产同一种产品的A,B 两条生产线,为比较两条生产线的质量,从A,B 生产线生产的产品中各自随机抽取了100件产品进行检测,把产品等级结果和频数制成了如图的统计图.(1)依据小概率值α=0.025的独立性检验,分析数据,能否据此推断是否为一级品与生产线有关.(2)生产一件一级品可盈利100元,生产一件二级品可盈利50元,生产一件三级品则亏损20元,以频率估计概率.①分别估计A,B生产线生产一件产品的平均利润;②你认为哪条生产线的利润较为稳定?并说明理由.附:①参考公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.②临界值表:3.(2021·福建宁德模拟改编)某工厂为了检测一批新生产的零件是否合格,从中随机抽测100个零件的长度d(单位:mm).该样本数据分组如下:[57,58),[58,59),[59,60),[60,61),[61,62),[62,63],得到如图所示的频率分布直方图.经检测,样本中d大于61的零件有13个,长度分别为61.1,61.1,61.2,61.2,61.3,61.5,61.6,61.6,61.8,61.9,62.1,62.2,62.6.(1)求频率分布直方图中a,b,c的值及该样本的平均长度x(结果精确到1 mm,同一组数据用该区间的中点值作代表);(2)视该批次样本的频率为总体的概率,从工厂生产的这批新零件中随机选取3个,记ξ为抽取的零件长度在[59,61)的个数,求ξ的分布列和数学期望;(3)若变量X满足|P(μ-σ≤X≤μ+σ)-0.682 7|<0.03且|P(μ-2σ≤X≤μ+2σ)-0.954 5|≤0.03,则称变量X满足近似于正态分布N(μ,σ2)的概率分布.如果这批样本的长度d满足近似于正态分布N(x,12)的概率分布,则认为这批零件是合格的,将顺利出厂;否则不能出厂.请问,能否让该批零件出厂?4.(2021·山东潍坊期末)在一个系统中,每一个设备能正常工作的概率称为设备的可靠度,而系统能正常工作的概率称为系统的可靠度,为了增加系统的可靠度,人们经常使用“备用冗余设备”(即正在使用的设备出故障时才启动的设备).已知某计算机网络服务器系统采用的是“一用两备”(即一台正常设备,两台备用设备)的配置,这三台设备中,只要有一台能正常工作,计算机网络就不会断掉.设三台设备的可靠度均为r(0<r<1),它们之间相互不影响.(1)要使系统的可靠度不低于0.992,求r的最小值;(2)当r=0.9时,求能正常工作的设备数X的分布列;(3)已知某高科技产业园当前的计算机网络中每台设备的可靠度是0.7,根据以往经验可知,计算机网络断掉可能给该产业园带来约50万元的经济损失.为减少对该产业园带来的经济损失,有以下两种方案:方案1:更换部分设备的硬件,使得每台设备的可靠度维持在0.9,更新设备硬件总费用为8万元; 方案2:对系统的设备进行维护,使得设备可靠度维持在0.8,设备维护总费用为5万元.请从期望损失最小的角度判断决策部门该如何决策?答案及解析1.解 (1)t =1+2+3+4+5+6+7+8+99=5, y =12.7+10.2+8.5+7.2+5.7+4.5+3.1+1.7+0.69≈6.02, b ^=∑i=19t i y i -9t y∑i=19(t i -5)2=183.6-270.960≈-1.46,a ^=y −b ^t =6.02-(-1.46)×5=13.32.故y 关于t 的经验回归方程为y ^=-1.46t+13.32.(2)因为P (μ-2σ≤X ≤μ+2σ)≈0.954 5,所以P (X>μ-2σ)=0.954 5+1-0.954 52=0.977 25. 因为某贫困地区的农民人均年纯收入X 满足正态分布N (1.6,0.36),所以μ=1.6,σ=0.6,μ-2σ=0.4,P (X>0.4)=0.977 25,故该地区最低人均年纯收入标准大约为0.4万元.2.解 (1)根据已知数据可建立列联表如下:零假设为H 0:是否为一级品与生产线无关.χ2=n (ad -bc )2(a+b )(c+d )(a+c )(b+d )=200×(20×65-35×80)255×145×100×100≈5.643>5.024=x 0.025,依据小概率值α=0.025的独立性检验,推断H 0不成立,即认为是否为一级品与生产线有关.(2)A 生产线生产一件产品为一、二、三级品的概率分别为15,35,15.记A 生产线生产一件产品的利润为X ,则X 的取值为100,50,-20,其分布列为B生产线生产一件产品为一、二、三级品的概率分别为720,25 ,14.记B生产线生产一件产品的利润为Y,则Y的取值为100,50,-20, 其分布列为①E(X)=100×15+50×35+(-20)×15=46,E(Y)=100×720+50×25+(-20)×14=50.故A,B生产线生产一件产品的平均利润分别为46元、50元.②D(X)=(100-46)2×15+(50-46)2×35+(-20-46)2×15=1 464.D(Y)=(100-50)2×720+(50-50)2×25+(-20-50)2×14=2 100.因为D(X)<D(Y),所以A生产线的利润更为稳定.3.解(1)由题意可得P(61≤d<62)=10100=0.1,P(62≤d≤63)=3100=0.03,P(59≤d<60)=P(60≤d<61)=12(1-2×0.03-0.14-0.1)=0.35,所以a=0.031=0.03,b=0.11=0.1,c=0.351=0.35.x=(57.5+62.5)×0.03+58.5×0.14+(59.5+60.5)×0.35+61.5×0.1=59.94≈60.(2)由(1)可知从该工厂生产的新零件中随机选取1件,长度d在(59,61]的概率P=2×0.35=0.7,且随机变量ξ服从二项分布ξ~B(3,0.7),所以P(ξ=0)=C30×(1-0.7)3=0.027,P(ξ=1)=C31×0.7×(1-0.7)2=0.189,P(ξ=2)=C32×0.72×(1-0.7)=0.441,P(ξ=3)=C33×0.73=0.343,所以随机变量ξ的分布列为E(ξ)=0×0.027+1×0.189+2×0.441+3×0.343=2.1.(3)由(1)及题意可知x=60,σ=1.所以P(x-σ≤X≤x-σ)=P(59≤X≤61)=0.7.|P(x-σ≤X≤x+σ)-0.682 7|=|0.7-0.682 7|=0.017 3≤0.03,P(x-2σ≤X≤x-2σ)=P(58≤X≤62)=0.14+0.35+0.35+0.1=0.94,|P(x-2σ≤X≤x+2σ)-0.954 5|=|0.94-0.954 5|=0.014 5≤0.03.所以这批新零件的长度d满足近似于正态分布N(x,12)的概率分布.所以能让该批零件出厂.4.解(1)要使系统的可靠度不低于0.992,则P(X≥1)=1-P(X<1)=1-P(X=0)=1-(1-r)3≥0.992,解得r≥0.8,故r的最小值为0.8.(2)X为正常工作的设备数,由题意可知,X~B(3,r),P(X=0)=C30×0.90×(1-0.9)3=0.001,P(X=1)=C31×0.91×(1-0.9)2=0.027,P(X=2)=C32×0.92×(1-0.9)1=0.243,P(X=3)=C33×0.93×(1-0.9)0=0.729,从而X的分布列为(3)设方案1、方案2的总损失分别为X1,X2,采用方案1,更换部分设备的硬件,使得设备可靠度达到0.9,由(2)可知计算机网络断掉的概率为0.001,不断掉的概率为0.999,故E(X1)=80000+0.001×500 000=80 500元.采用方案2,对系统的设备进行维护,使得设备可靠度维持在0.8,由(1)可知计算机网络断掉的概率为0.008,故E(X2)=50 000+0.008×500 000=54 000元,因此,从期望损失最小的角度,决策部门应选择方案2.。
新高考新教材数学二轮复习六大核心主攻专题4概率与统计解答题专项4概率与统计的综合问题pptx课件
5
2
∑ 2 -5
=
-1 537
=-153.7,
10
=1
^
^
所以 = − =1 241.2-(-153.7)×3=1 702.3,
^
所以 y 关于 x 的经验回归方程为 =-153.7x+1 702.3.
将 2023 年对应的年份编号 x=6 代入经验回归方程得
^ =-153.7×6+1 702.3=780.1,
64
且SO2浓度不超过150的概率的估计值为 100=0.64.
(2)根据所给数据,完成下面的2×2列联表:
单位:μg/m3
PM2.5
SO2
[0,150]
(150,475]
[0,75]
(75,115]
所以 r=
5
∑ -5
=1
5
2 5 2
2
2
( ∑ -5 )( ∑ -5 )
=1
=1
≈
-1 537
≈-0.98.
1 564
说明 y 与 x 的线性相关程度相当高,
从而可以用线性回归模型拟合 y 与 x 的关系.
^
(2)由(1)可得 =
5
∑ -5
=1
×(24-20)+(14-10)×(23-20)=20+4+0+8+12=44,
5
5
2
2
∑ ( -) =16+4+0+4+16=40, ∑ ( -) =25+4+0+16+9=54,
i=1
所以 r=
44
40×54
高中数学第九章统计考点题型与解题方法(带答案)
高中数学第九章统计考点题型与解题方法单选题1、某工厂一年中各月份的收入、支出情况的统计如图所示,下列说法中错误的是()A.收入最高值与收入最低值的比是3︰1B.结余最高的月份是7月C.1至2月份的收入的变化率与4至5月份的收入的变化率相同D.前6个月的平均收入为40万元答案:D分析:根据统计图对选项逐一分析,由此确定说法错误的选项.最高收入90万元,最低收入30万元,所以A正确.结余最高的为7月,结余60万元,所以B正确.根据两点连线的斜率可知,1至2月份的收入的变化率与4至5月份的收入的变化率相同,所以C正确.前6个月的平均收入为40+60+30+30+50+60=45万元,所以D选项错误.6故选:D2、在样本的频率分布直方图中,一共有n(n≥4,n∈Z)个小矩形,第4个小矩形的面积等于其余(n−1)个,则第4个小矩形对应的频率为()小矩形面积和的37A.0.3B.0.4C.0.5D.0.7答案:A(1−x),解方程可分析:设第4个小矩形对应的频率为x,然后根据频率分布直方图的性质和题意可得x=37得结果设第4个小矩形对应的频率为x,则其余(n−1)个小矩形对应的频率为1−x,(1−x),解得x=0.3.所以x=37故选:A.3、下列调查中,适合普查的是()A.一批手机电池的使用寿命B.中国公民保护环境的意识C.你所在学校的男女同学的人数D.了解全国人民对建设高铁的意见答案:C分析:根据抽样调查和普查的特点即可判断.由题调查一批手机电池的使用寿命,中国公民保护环境的意识,了解全国人民对建设高铁的意见适合用抽样调查,调查所在学校的男女同学的人数适合普查.故选:C.4、m个数据的平均数为a,中位数为b,方差为c.若将这m个数据均扩大到原来的2倍得到一组新数据,则下列关于这组新数据的说法正确的是()A.平均数为a B.中位数为2b C.标准差为√2c D.方差为2c答案:B分析:m个x1,x2,⋯,x n数据的平均数为a,中位数为b,方差为c.若将这m个数据均扩大到原来的2倍得到一组新数据2x1,2x2,⋯,2x n,根据平均数、中位数、方差、标准差的定义进行判断即可.m个x1,x2,⋯,x n数据的平均数为a,中位数为b,方差为c.若将这m个数据均扩大到原来的2倍得到一组新数据2x1,2x2,⋯,2x n,则由于平均数为所有数之和除以m,故平均数变为2a,故A错;中位数为这组数从小到大排列后中间的那个数或中间两数和的平均数,由于每个数都变为原来2倍,所以中位数也变为原来的2倍,即2b,故B对;方差描述的是这组数的波动情况,x1,x2,⋯,x n的方差为c,则2x1,2x2,⋯,2x n的方差为22c=4c,标准差为√22c=2c,故C,D错;故选:B小提示:熟悉平均数、中位数、方差、标准差的概念,特别是一组数据扩大某个倍数或增加某个数值的情况下,平均数、中位数、方差、标准差的变化.5、抽样统计甲射击运动员10次的训练成绩分别为86,85,88,86,90,89,88,87,85,92,则这10次成绩的80%分位数为()A.88.5B.89C.91D.89.5答案:D分析:将数据从小到大排列,计算10×80%=8,得到答案.甲射击运动员10次的训练成绩从小到大分别为:85,85,86,86,87,88,88,89,90,92.10×80%=8,这10次成绩的80%分位数为:89+90=89.5.2故选:D.6、某汽车制造厂分别从A,B两类轮胎中各随机抽取了6个进行测试,下面列出了每一个轮胎行驶的最远里程(单位:103km).A类轮胎:94,96,99,99,105,107.B类轮胎:95,95,98,99,104,109.根据以上数据,下列说法正确的是()A.A类轮胎行驶的最远里程的众数小于B类轮胎行驶的最远里程的众数B.A类轮胎行驶的最远里程的极差等于B类轮胎行驶的最远里程的极差C.A类轮胎行驶的最远里程的平均数大于B类轮胎行驶的最远里程的平均数D.A类轮胎的性能更加稳定答案:D分析:根据众数、极差、平均数和方差的定义以及计算公式即可求解.解:对A:A类轮胎行驶的最远里程的众数为99,B类轮胎行驶的最远里程的众数为95,选项A错误;对B:A类轮胎行驶的最远里程的极差为13,B类轮胎行驶的最远里程的极差为14,选项B错误.对C :A 类轮胎行驶的最远里程的平均数为100+−6−4−1−1+5+76=100,B 类轮胎行驶的最远里程的平均数为100+−5−5−2−1+4+96=100,选项C 错误.对D :A 类轮胎行驶的最远里程的方差为(94−100)2+(96−100)2+(99−100)2×2+(105−100)2+(107−100)26=643,B 类轮胎行驶的最远里程的方差为(95−100)2×2+(98−100)2+(99−100)2+(104−100)2+(109−100)26=763>643,故A 类轮胎的性能更加稳定,选项D 正确. 故选:D.7、关于圆周率π,数学发展史上出现过许多很有创意的求法,如著名的浦丰实验和查理斯实验.受其启发,我们也可以通过设计下面的实验来估计π的值:先请全校m 名同学每人随机写下一个都小于1的正实数对(x,y );再统计两数能与1构成钝角三角形三边的数对(x,y )的个数a ;最后再根据统计数a 估计π的值,那么可以估计π的值约为( ) A .4am B .a+2mC .a+2m mD .4a+2m m答案:D解析:由试验结果知m 对0~1之间的均匀随机数x,y ,满足{0<x <10<y <1,面积为1,再计算构成钝角三角形三边的数对(x,y),满足条件的面积,由几何概型概率计算公式,得出所取的点在圆内的概率是圆的面积比正方形的面积,即可估计π的值.解:根据题意知,m 名同学取m 对都小于1的正实数对(x,y ),即{0<x <10<y <1,对应区域为边长为1的正方形,其面积为1,若两个正实数x,y 能与1构成钝角三角形三边,则有{x 2+y 2<1x +y >10<x <10<y <1,其面积S =π4−12;则有am=π4−12,解得π=4a+2m m故选:D .小提示:本题考查线性规划可行域问题及随机模拟法求圆周率的几何概型应用问题. 线性规划可行域是一个封闭的图形,可以直接解出可行域的面积;求解与面积有关的几何概型时,关键是弄清某事件对应的面积,必要时可根据题意构造两个变量,把变量看成点的坐标,找到试验全部结果构成的平面图形,以便求解.8、数据x1,x2,x3,…,x m的平均数为x,数据y1,y2,y3,…,y n的平均数为y,则数据x1,x2,x3,…,x m,y1,y2,y3,…,y n的平均数为()A.xn +ymB.xm+ynC.nx+mym+n D.mx+nym+n答案:D分析:利用平均数的计算公式计算.由题意得:x1+x2+x3+⋯+x m=mx,y1+y2+y3+⋯+y n=ny,所以x1+x2+x3+⋯+x m+y1+y2+y3+⋯+y nm+n =mx+nym+n故选:D多选题9、2020年突如其来的新冠肺炎疫情对房地产市场造成明显的冲击,如图为某市2020年国庆节7天假期的楼房认购量与成交量的折线图,某同学根据折线图对这7天的认购量(单位:套)与成交量(单位:套)作出如下判断,则判断正确的是()A.日成交量的中位数是16B.日成交量超过平均成交量的只有1天C.10月7日认购量量的增长率大于10月7日成交量的增长率D.日认购量的方差大于日成交量的方差答案:BD解析:根据拆线图判断各数据特征后判断各选项.由拆线图日成交量的中位数是26,A错;日成交量均值为13+8+32+16+26+38+1667≈42.7,大于均值的只有一天,B正确;10月7日认购量量的增长率为y1=276−112112≈1.464,成交量的增长率为y2=166−3838≈3.368,显然C错;日认购量的均值为223+105+91+107+100+112+2767≈144.857,由各数据与均值的差可以看出日认购量的方差大于日成交量的方差,D正确.故选:BD.小提示:关键点点睛:本题考查统计图表,考查拆线图的识别.解题关键是由拆线图得出各数据,然后求得各数据特征.如中位数,均值,增长率,方差,解题中还要善于估值,如本题中的方差,从而大致比较出大小.10、如图是国家统计局发布的2020年12月至2021年12月的全国居民消费价格涨跌幅,其中同比=本期数−去年同期数去年同期数×100%,环比=本期数−上期数上期数×100%.则下列说法正确的是()A.2020年12月至2021年12月全国居民消费价格环比的极差为1.5% B.2020年12月至2021年12月全国居民消费价格同比的中位数为0.9% C.这13个月中,2021年6月全国居民消费价格最低D.2021年比2020年全国居民消费平均价格增长大于1.0%答案:AB分析:计算出2020年12月至2021年12月全国居民消费价格环比的极差,可判断A选项;利用中位数的定义可判断B选项;根据涨幅可判断C选项;利用平均数公式可判断D选项.2020年12月至2021年12月全国居民消费价格环比的最大值为1.0%,最小值为−0.5%,所以其极差为1.5%,A项正确;2020年12月至2021年12月全国居民消费价格同比(单位:%)从小到大依次为−0.3、−0.2、0.2、0.4、0.7、0.8、0.9、1.0、1.1、1.3、1.5、1.5、2.3,其中位数为0.9%,B项正确;从环比来看,假设2020年全国居民消费平均价格为1,经计算可得2020年12月全国居民消费平均价格,C 项错误;2021年比2020年全国居民消费价格平均增长为1 12(−0.3−0.2+0.4+0.9+1.3+1.1+1.0+0.8+0.7+1.5+2.3+1.5)=1112<1.0,D项错误.故选:AB.11、如图所示的两个扇形统计图分别统计了某地2010年和2020年小学生参加课外兴趣班的情况,已知2020年当地小学生参加课外兴趣班的总人数是2010年当地小学生参加课外兴趣班的总人数的4倍,则下列说法正确的是()A.2020年参加音乐兴趣班的小学生人数是2010年参加音乐兴趣班的小学生人数的4倍B.这10年间,参加编程兴趣班的小学生人数变化最大C.2020年参加美术兴趣班的小学生人数少于2010年参加美术兴趣班的小学生人数D.相对于2010年,2020年参加不同课外兴趣班的小学生人数更平均答案:ABD分析:设2010年参加课外兴趣班的小学生总人数为a,则2020年参加课外兴趣班的小学生总人数是4a,根据扇形统计图中的比例计算,并逐项检验,即可得到结果.设2010年参加课外兴趣班的小学生总人数为a,则2020年参加课外兴趣班的小学生总人数是4a;由统计图可知,2010年参加音乐兴趣班的小学生人数是a×21%=0.21a,2020年参加音乐兴趣班的小学生人数是4a×21%=0.84a,故A正确.这10年间参加编程兴趣班的小学生人数变化量为4a×32%−a×5%=1.23a,这10年间参加语言表演的小学生人数变化量为4a×20%−a×14%=0.66a,这10年间参加音乐的小学生人数变化量为4a×21%−a×21%=0.63a,这10年间参加美术的小学生人数变化量为4a×27%−a×60%=0.48a,所以这10年间参加编程兴趣班的小学生人数变化量最大,故B正确.2020年参加美术兴趣班的小学生人数为4a×27%=1.08a,2010年参加美术兴趣班的小学生人数为a×60%=0.6a,1.08a>0.6a,故C不正确,根据扇形统计图中的比例分布,可知D正确.故选:ABD12、某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述正确的有()A.各月的平均最低气温都在0℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20℃的月份有5个答案:ABC分析:根据雷达图提供的数据判断各选项可得.对于选项A,由图易知各月的平均最低气温都在0℃以上,A正确;对于选项B,七月的平均最高气温点与平均最低气温点间的距离大于一月的平均最高气温点与平均最低气温点间的距离,所以七月的平均温差比一月的平均温差大,B正确;对于选项C,三月和十一月的平均最高气温均为10℃,所以C正确;对于选项D,平均最高气温高于20℃的月份有七月、八月,共2个月份,故D错误.故选:ABC.13、PM2.5是衡量空气质量的重要指标,下图是某地7月1日到10日的PM2.5日均值(单位:ug/m3)的折线图,则下列关于这10天中PM2.5日均值的说法正确的是A.众数为30B.中位数是31C.平均数小于中位数D.后4天的方差小于前4天的方差答案:AD分析:根据折线图,由众数,中位数,平均数,方差等概念及公式,逐项判断,即可得出结果.众数即是出现次数最多的数字,由折线图可得,众数为30,即A正确;中位数即是处在中间位置的数字,将折线图中数字由小到大依次排序,得到:17,25,30,30,31,32,34,38,42,126;处在中间位置的数字是:31,32,因此中位数为31.5,即B错;由折线图可得,平均数为:17+25+30+30+31+32+34+38+42+12610=40.5>31.5,故C错;前4天的平均数为:38+25+17+304=27.5,后4天的平均数为42+31+32+304=33.75前4天方差为:s12=(38−27.5)2+(25−27.5)2+(17−27.5)2+(30−27.5)24=58.25,后4天方差为:s22=(42−33.75)2+(31−33.75)2+(32−33.75)2+(30−33.75)24=23.1875,所以后4天的方差小于前4天的方差,故D正确.故选:AD.小提示:本题主要考查由折线图计算众数、中位数、平均数、方差等,属于基础题型.填空题14、某次数学考试中20个人的成绩如下:101,103,107,110,112,113,116,123,124,125,125,125,126,128,134,135,137,139,144,148,若这组数据的众数为a,中位数为b,极差为c,则a+b+ c=___________.答案:297分析:根据众数、中位数和极差的定义逐个求解再求和即可由题意,a=125,b=125,c=148−101=47,故a+b+c=125+125+47=297所以答案是:29715、某学校组织学生参加数学测试,成绩的频率分布直方图如下,数据的分组依次是[20,40),[40,60),[60,80),[80,100],则可估计这次数学测试成绩的第40百分位数是_________.答案:65分析:利用百分位数的定义求解.解:成绩在[20,60)的频率是(0.005+0.01)×20=0.3,成绩在[20,80)的频率为0.3+0.02×20=0.7,所以第40百分位数一定在[60,80)内,×20=65,所以这次数学测试成绩的第40百分位数是60+0.4−0.30.4所以答案是:6516、若一组数据x1,x2,x3,⋯,x n的平均数是30,另一组数据x1+y1,x2+y2,x3+y3,⋯,x n+y n的平均数是70,则第三组数据4y1+1,4y2+1,4y3+1,⋯,4y n+1的平均数是___________.答案:161分析:根据数据平均数计算公式可得.数据x1+y1,x2+y2,x3+y3,⋯,x n+y n共有n个,其平均数为1 n ∑(x i+y i)ni=1=1n∑x ini=1+1n∑y ini=1=30+y=70.因此y=40故数据4y1+1,4y2+1,4y3+1,⋯,4y n+1的平均数是4×40+1=161.所以答案是:161解答题17、某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:s12和s22.(1)求x,y,s12,s22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y−x≥2√s12+s2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).答案:(1)x=10,y=10.3,s12=0.036,s22=0.04;(2)新设备生产产品的该项指标的均值较旧设备有显著提高.分析:(1)根据平均数和方差的计算方法,计算出平均数和方差.(2)根据题目所给判断依据,结合(1)的结论进行判断.(1)x=9.8+10.3+10+10.2+9.9+9.8+10+10.1+10.2+9.710=10,y=10.1+10.4+10.1+10+10.1+10.3+10.6+10.5+10.4+10.510=10.3,s12=0.22+0.32+0+0.22+0.12+0.22+0+0.12+0.22+0.3210=0.036,s22=0.22+0.12+0.22+0.32+0.22+0+0.32+0.22+0.12+0.2210=0.04.(2)依题意,y−x=0.3=2×0.15=2√0.152=2√0.0225,2√0.036+0.0410=2√0.0076,y−x≥2√s12+s2210,所以新设备生产产品的该项指标的均值较旧设备有显著提高.18、“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.(1)求x;(2)求抽取的x人的年龄的中位数(结果保留整数);(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.①分别求5个年龄组和5个职业组成绩的平均数和方差;②以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.答案:(1)总体是该中学高三年级400名学生的视力;样本是所抽取的50名学生的视力.(2)答案见解析.分析:(1)根据总体与样本的定义直接写出;(2)根据抽签法与随机数法的抽样过程写出即可.解:(1)总体是该中学高三年级400名学生的视力;样本是所抽取的50名学生的视力.(2)选择①.利用抽签法步骤如下,第一步:将这50名学生编号,编号为1,2,3, (50)第二步:将50个号码分别写在纸条上,并揉成团,制成号签.第三步:将得到的号签放在一个不透明的容器中,搅拌均匀.第四步:从容器中逐一抽取6个号签,并记录上面的号码.对应上面6个号码的学生就是抽取的学生.选择②.利用随机数法步骤如下,第一步:将这50名学生编号,编号为01,02,03, (50)第二步:用计算机产生1~50范围内的整数随机数,把产生的随机数作为抽中的编号.第三步:重复第二步的过程,直到抽足6个号码.对应上面6个号码的学生就是抽取的学生.=0.05,即可求解.解析:(1)根据频率分布直方图求出第一组的频率,再由6x(2)设中位数为a,根据0.01×5+0.07×5+(a-30)×0.06=0.5,求解即可.(3)①求出平均数,再根据方差的式子即可求解;②比较平均数与方差即可得出结论.=0.05,∴x=120.(1)根据频率分布直方图得第一组的频率为0.01×5=0.05,∴6x(2)设中位数为a,则0.01×5+0.07×5+(a-30)×0.06=0.5,∴a=95≈32,则中位数为32.3(3)①5个年龄组成绩的平均数为x1=1×(93+96+97+94+90)=94,5×[(-1)2+22+32+02+(-4)2]=6.方差为s12=15×(93+98+94+95+90)=94,5个职业组成绩的平均数为x2=15×[(-1)2+42+02+12+(-4)2]=6.8.方差为s22=15②从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想合理即可).当今,青少年视力水平的下降已引起全社会的关注.为了了解某中学高三年级400名学生的视力情况,从中抽取了50名学生进行视力检测.(1)在这个问题中,总体、样本各是什么?(2)在①抽签法,②随机数法这两个条件中任选一个填入下面的横线上,并解答.为深入了解这50名学生的视力情况,从中随机抽取6人,请写出利用___9___抽取该样本的过程.。
聚焦高考统计知识的热点问题
十摩生座烴化解题篇•创新题追根溯源高一数学2019年2月_聚焦高考统i t知iR的热点问题■刘大鸣(特级教师)近几年高考对统计的考查主要是围绕“抽 样方法,茎叶图,频率分布直方图,样本的数字特征,回归分析”等核心考点展开的,着重考查同学们应用统计知识解决实际问题的核心素养。
下面以近几年高考试题为载体进行全方位的考点聚焦,希望对同学们的学习有所帮助。
热点1:分层抽样问题!1甲、乙两套设备生产的同类型产品共7 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测。
若样本中有50件产品由甲设备生产,则乙设备生产的产品总件数为____。
解:由题设可得抽样比为7800.%。
设4 800〇0热点2:根据扇形统计图合理进行判断洌2已知某地区中小学学生的近视情况分布如图1和图2所示。
为了解该地区中小学学生的近视形成原因,用分层抽样的方法抽取22的学生进行调查,则样本容量和抽取的高中生近视人数分别为&)。
A.200,20B.100,20C.200,10D.100,10图1甲设备生产的产品为工件, .50,可得60工.3000。
故乙设备生产的产品总件数为7 800 — 3 000.1 800。
品味:当个体差异较大时,常采用分层抽样法。
分层抽样就是按比例抽样,根据总体中的个体数N和样本容量n计算抽样比々. g,确定第i层应抽取的个体数为A .X 为第z层包含的个体数'当&不是整数时,要从总体中剔除多余的个体。
变式1:某工厂生产甲,乙,丙,丁四种不同型号的产品,产量(单位:件)分别为200, 700,300,100。
为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取的件数为____。
提示:依据分层抽样为按比例抽样的特点确定抽样比为%00,故抽取的件数为60X 30.18,即应从丙种型号的产品中抽取的件数为18。
解:根据图1可得总体个数,根据抽取比例可得样本容量。
统计高考真题大题解析答案
统计高考真题大题解析答案高考是每年千万考生都期盼和紧张的时刻,而统计学科也是其中一门相对较难的科目之一。
无论是对于广大考生还是对于家长和老师们来说,了解和掌握高考统计真题的解析答案,对于备考也是非常重要的。
本文将为大家解析一些高考统计学科的典型题目,帮助大家更好地理解和应对这门科目。
第一题:某校700位高三学生体重信息的频率分布如下图所示。
学校要求体重指数在18.5至23.9之间的学生视为健康范围内,请计算该校健康体重范围内的学生人数。
此题是一个统计数据的频率分布问题,可以通过绘制频率分布直方图来进行解答。
将体重范围分成若干个组,并计算每个组的频率,然后求出健康体重范围内的频率之和即可得到答案。
第二题:某城市男性和女性的身高数据如下表所示,请计算男性和女性身高的平均值和标准差,并判断两者之间的差异是否具有统计学意义。
此题是一个比较两组数据差异的问题,需要计算平均值和标准差,并进行假设检验来判断差异是否显著。
对于两组数据,分别计算其平均值和标准差,然后应用t检验或方差分析等方法来判断差异是否具有统计学意义。
如果计算得到的显著性水平小于设定的显著性水平(通常为0.05),则可以认为差异具有统计学意义。
第三题:某厂生产的汽车零部件自然寿命数据如下图所示,请根据数据判断该厂生产的零部件的寿命服从正态分布还是指数分布。
此题是一个判断数据分布的问题,需要根据给定的数据来确定数据的分布类型。
对于给定的数据,可以绘制直方图或者QQ图,通过观察数据的分布形态来判断其是否符合正态分布或指数分布。
如果数据的直方图呈现正态分布的形态或者QQ图上的数据点接近于一条直线,则可以判断该数据符合正态分布。
反之,如果数据的直方图呈现指数分布的形态,则可以判断该数据符合指数分布。
通过以上三个例题的解析,我们可以看到高考统计学科的试题常常涉及到数据的处理和分析,需要掌握一定的计算方法和统计原理。
在备考过程中,除了熟悉考纲和掌握基本概念外,还需要多做真题并进行解析,尤其是那些典型的大题。
高考统计题的热点题型与解法
ʏ山西省吕梁市贺昌中学 刘鹏飞近几年高考关于统计问题越来越注重对数据的分析处理能力的考查,考查知识点比较全面,如频率分布直方图㊁回归分析㊁独立性检验等㊂这需要同学们认真读题,读懂题意,尤其是理清题目中数据的特点,这样就能利用所学的统计知识来解决㊂题型一㊁统计图表中的数据分析问题统计图表的类型非常丰富,扇形图直观显示各部分所占总体的百分比,折线图直观显示数据的变化趋势,直方图直观显示数据的分布情况等㊂解答这类题目时,要准确识图,分析数据的变化或分布规律,从图表中提取关键信息进行定性判断或定量计算,如求样本数据的众数㊁中位数㊁平均数㊁方差等㊂例1 某校1500名学生参加交通安图1全知识竞赛,随机抽取了100名学生的竞赛成绩(单位:分),成绩的频率分布直方图如图1所示,则下列说法正确的是( )㊂A.频率分布直方图中a 的值为0.0045B .估计这100名学生竞赛成绩的第60百分位数为80C .估计这100名学生竞赛成绩的众数为80D .估计总体中成绩落在[70,80)内的学生人数为500解析:由10ˑ(2a +3a +7a +6a +2a )=1,可得a =0.005,故A 错误;可知每组的频率依次为0.10,0.15,0.35,0.30,0.10,前三组的频率和为0.10+0.15+0.35=0.6,所以这100名学生竞赛成绩的第60百分位数为80,故B 正确;因为[70,80)的频率最大,所以这100名学生竞赛成绩的众数为75,故C 错误;总体中成绩落在[70,80)内的学生人数为0.35ˑ1500=525,故D 错误㊂故选B ㊂点评:频率分布直方图的纵轴表示频率组距,所以每组样本的频率是对应矩形的面积㊂此题先根据频率之和为1求出a 的值,然后根据各组的频率求第60百分位数㊁众数,以及在[70,80)内的学生人数㊂题型二㊁回归模型的分析与建立问题根据两个变量的散点图,如果样本点分布在一条直线附近,那么两个变量具有线性相关性,可以建立一元线性回归模型㊂如果两个变量非线性相关,那么可以根据散点图的具体特征,通过换元,转化成线性回归模型㊂同时,要会根据题目给出的公式计算相关系数和决定系数㊂例2 为了研究某种细菌随天数x 变化的繁殖个数y ,收集数据如表1所示:表1天数x 123456繁殖个数y36132545100(1)判断^y =^b x +^a (^a ,^b 为常数)与^y =^c 1e ^c x (^c 1,^c 2为常数,且^c 1>0,^c 2ʂ0)哪一个适宜作为繁殖个数y 关于天数x 变化的回归方程类型?(2)对于非线性回归方程^y =^c 1e ^c x (^c 1,^c 2为常数,且^c 1>0,^c 2ʂ0),令z =l n y ,可以得到繁殖个数的对数z 关于天数x 具有线性关系及一些统计量的值(表2)㊂表2x3.50 y32z2.85ð6i =1(x i - x )217.5ð6i =1(x i - x )(y i - y )307ð6i =1(x i- x )(z i -z )12.12 ①证明:对于非线性回归方程^y =^c 1e ^c x ,令z =l n y ,可以得到繁殖个数的对数z 关于天数x 具有线性关系(即^z =^βx +^α,^β,^α为常数);②根据①的判断结果及表中数据,建立y 关于x 的回归方程(系数保留2位小数)㊂附:对于一组数据(u 1,v 1),(u 2,v 2), ,(u n ,v n ),其回归直线方程^v =^βu +^α的斜率和截距的最小二乘法估计公式分别为^β=ðni =1(u i- u )(v i - v )ðni =1(u i -u )2,^α= v -^βu ㊂解析:(1)如图2,作出繁殖个数y 关于图2天数x 变化的散点图㊂观察散点图知,样本点分布在一条指数型曲线周围,所以^y =^c 1e ^c x 更适宜作为繁殖个数y 关于天数x 变化的回归方程类型㊂(2)①由(1)知,^y =^c 1e ^c x(^c 1,^c 2为常数,且^c 1>0,^c 2ʂ0),又z =l n y ,因此l n ^y =l n (^c 1e ^c x )=l n ^c 1+l n e ^c x =l n ^c 1+^c 2x ㊂令^α=l n ^c 1,^β=^c 2,则有^z =^βx +^α,其中^β,^α为常数,所以繁殖个数的对数z 关于天数x 具有线性关系㊂②由①知,^c 2=^β=ð6i =1(x i- x )(z i - z )ð6i =1(x i-x )2=12.1217.5ʈ0.69,l n ^c 1=^α= z -^βx =2.85-0.69ˑ3.50ʈ0.44,因此^z =0.69x +0.44㊂所以y 关于x 的回归方程为^y =e0.69x +0.44㊂点评:第一问根据给定的数据作出散点图,再借助散点图即可判断指数型函数更适宜作为回归方程㊂第二问由选定的回归方程类型,取对数即可得z 关于天数x 具有线性关系,然后利用最小二乘法计算回归方程中的未知系数,最后要注意把方程还原成y 关于x 变化的回归方程㊂题型三、独立性检验问题独立性检验是对两个变量有关系的可信程度的判断,用独立性检验解决实际问题时,首先,提出零假设H 0:X 和Y 互相独立,并给出在实际问题中的解释㊂其次,根据2ˑ2列联表,计算χ2的值㊂最后,将χ2的值与临界值x α进行比较,得出推断结论:当χ2ȡx α时,推断H 0不成立,即认为X 和Y 不独立,该推断犯错误的概率不超过α;当χ2<x α时,推断H 0不成立,可以认为X 和Y 独立㊂例3 (2023年全国甲卷文19)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g)㊂试验结果如下:对照组的小白鼠体重的增加量从小到大排序为15.2,18.8,20.2,21.3,22.5,23.2,25.8,26.5,27.5,30.1,32.6,34.3,34.8,35.6,35.6,35.8,36.2,37.3,40.5,43.2;试验组的小白鼠体重的增加量从小到大排序为7.8,9.2,11.4,12.4,13.2,15.5,16.5,18.0,18.8,19.2,19.8,20.2,21.6,22.8,23.6,23.9,25.1,28.2,32.3,36.5㊂(1)计算试验组的样本平均数㊂(2)①求40只小白鼠体重的增加量的中位数m ,再分别统计两样本中小于m 与不小于m 的数据的个数,完成表3所示的列联表:表3<m ȡm对照组试验组②根据①中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异附:χ2=n (a d -b c )2(a +b )(c +d )(a +c )(b +d )㊂表4P (χ2ȡk )0.1000.0500.010k2.7063.8416.635解析:(1)试验组样本平均数为120(7.8+9.2+11.4+12.4+13.2+15.5+16.5+18.0+18.8+19.2+19.8+20.2+21.6+22.8+23.6+23.9+25.1+28.2+32.3+36.5)=39620=19.8㊂(2)①依题意,可知这40只小白鼠体重的中位数是将两组数据合在一起,从小到大排后第20位与第21位数据的平均数,由原数据可得第11位数据为18.8,后续依次为19.2,19.8,20.2,20.2,21.3,21.6,22.5,22.8,23.2,23.6, ,故第20位数据为23.2,第21位数据为23.6,所以m =23.2+23.62=23.4㊂故列联表为表5:表5<m ȡm 合计对照组61420试验组14620合计202040②由①得,χ2=40ˑ(6ˑ6-14ˑ14)220ˑ20ˑ20ˑ20=6.400>3.841,所以能有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异㊂点评:第一问直接根据平均数的定义进行计算;第二问是要将两组共40个数据合在一起,从小到大排序后再求中位数,考差了中位数的概念和计算;第三问根据已知公式计算χ2的值,查表即可得出答案㊂因此,正确完成列联表和计算χ2的值是解决独立性检验问题的关键㊂题型四㊁新定义㊁新情境问题在近几年高考中,出现了以新定义为背景的统计题,体现了统计在现实生活中的应用㊂解决这类问题要读懂题意,尤其是理解题目给出的新参数㊁新统计量的含义,合理地分析和处理数据,运用统计知识解决实际问题㊂例4 (2023年新高考Ⅱ卷19)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如图3和图4所示的患病者和未患病者该指标的频率分布直方图㊂图3利用该指标制定一个检测标准,需要确定临界值c ,将该指标大于c 的人判定为阳性,小于或等于c 的人判定为阴性㊂此检测标准的漏诊率是将患病者判定为阴图4性的概率,记为p (c );误诊率是将未患病者判定为阳性的概率,记为q (c )㊂假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率㊂(1)当漏诊率p (c )=0.5%时,求临界值c 和误诊率q (c );(2)设函数f (c )=p (c )+q (c ),当c ɪ[95,105]时,求f (c )的解析式,并求f (c )在区间[95,105]内的最小值㊂解析:(1)依题可知,图3中第一个小矩形的面积为5ˑ0.002>0.5%,所以95<c <100,所以(c -95)ˑ0.002=0.5%,解得c =97.5㊂q (c )=0.01ˑ(100-97.5)+5ˑ0.002=0.035=3.5%㊂(2)当c ɪ[95,100]时,f (c )=p (c )+q (c )=(c -95)ˑ0.002+(100-c )ˑ0.01+5ˑ0.002=-0.008c +0.82ȡ0.02;当c ɪ(100,105]时,f (c )=p (c )+q (c )=5ˑ0.002+(c -100)ˑ0.012+(105-c )ˑ0.002=0.01c -0.98>0.02㊂综上可得,函数f(c )=-0.008c +0.82,95ɤc ɤ100,0.01c -0.98,100<c ɤ105㊂所以f (c )在区间[95,105]内的最小值为0.02㊂点评:本题新定义了两个统计量:医学检测的漏诊率p (c )和误诊率q (c )㊂第一问由第一个频率分布直方图可先求出c ,再根据第二个频率分布直方图求出c ȡ97.5的矩形面积即可解出;第二问根据题意确定分段点100,即可得出f (c )的解析式,再根据分段函数的最值求法即可解出㊂本题不仅考查在新情境中运用统计知识解决问题,还与函数知识产生交汇,是一道值得好好研究的能力题㊂(责任编辑 王福华)强化数学运算,聚焦统计策略,提升核心素养以2023年高考数学全国乙卷第17题的解法溯源及拓展探究为例ʏ广东省广州市广州大同中学 袁 安2023年高考数学全国乙卷第17题貌似平淡无奇,实则韵味十足,蕴藏了众多的计算方法和数学思想㊂符合基础性㊁综合性㊁应用性㊁创新性的高考试题原则,是检测数学运算㊁数据分析等核心素养,选拔人才的基础好题㊂本文通过对新高考乙卷统计试题的分析㊁解答㊁溯源和再研究,为同学们解答高考试题提供思路和方法㊂一㊁真题呈现题目 (2023年全国乙卷17)某厂为比较甲㊁乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选择其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率㊂甲㊁乙两种工艺处理后的橡胶产品的伸缩率分别记为x i ,y i (i =1,2, ,10)㊂试验结果如表1:表1试验序号i 12345678910伸缩率x i 545533551522575544541568596548伸缩率y i 536527543530560533522550576536 记z i =x i -y i (i =1,2, ,10),记z 1,z 2,,z 10的样本平均数为 z ,样本方差为s 2㊂(1)求 z ,s 2;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果 z ȡ2s 210,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)㊂赏析:试题是通过公平的工业背景收集大量的数据,需要认真读题和审题,理解符号x i ,y i (i =1,2, ,10)及定义新符号z i =x i -y i (i =1,2, ,10)的意义,再根据统计分析,发现规律,解答问题㊂第(1)问比较简单,通过分析可知需要求10个数的均值与方差,但在高考的压力下,选择什么方法和策略是非常关键的㊂第(2)问是新定义题型,要求考生在理解给出数学符号及意义的基础上,对知识进行及时应用,并做出正确㊁合理的判断㊂这两个问题层层递进,步步提升,每一步都要求考生有较强的数据分析与处理能力㊂二㊁多角度解法荟萃(1)分析:求收集到的两组数据x i ,y i (i =1,2, ,10)对应的差值z i =x i -y i (i =1,2, ,10)的平均数与方差㊂可以根据试题要求,在原表格基础上快速求出对应的值,再通过相应的计算公式求解㊂解法一:妙用配凑,化零为整㊂由题意可得表2:表2试验序号i 12345678910伸缩率x i 545533551522575544541568596548伸缩率y i 536527543530560533522550576536z i968-8151119182012。
高考解答题专项六 概率与统计
题专项六
概率与统计
考情分析
从近五年的高考试题来看,对概率与统计的考查主要有四个方面:一是统计
与统计案例,其中回归分析、相关系数的计算、独立性检验、用样本的数
字特征估计总体的数字特征是考查重点,常与抽样方法、茎叶图、频率分
布直方图、概率等知识交汇考查;二是统计与概率分布的综合,常与抽样方
法、茎叶图、频率分布直方图、频率、概率以及函数知识、概率分布列
∑
i=1
2
2 -
,a=-b.
②线性相关系数 r=
∑ -
=1
.一般地,相关系数 r 的绝对值在 0.95
2 2
2
2
( ∑ - )( ∑ - )
=1
=1
以上(含 0.95)认为线性相关性较强;否则,线性相关性较弱.
5
5
=1
=1
2
=1
=
800
80×9 000
=
2 2
3
≈0.94.
(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分
层抽样.
理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正
相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数
量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的
=
1
10
×(10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.5)=10.3,
12
=
1
10
×[(9.8-10)2+(10.3-10)2+(10.0-10)2+(10.2-10)2+(9.9-10)2+
新高考数学统计解答题知识点
新高考数学统计解答题知识点一、概率与统计概率与统计是数学的一个重要分支,也是新高考数学中的一项重要内容。
在解答题中,概率与统计常常涉及到对数据的收集、整理、分析和解读,从而帮助我们更好地了解和描述数据的特征。
1. 数据的收集与整理在统计分析中,数据的收集非常关键。
我们通常可以通过问卷调查、实验观察、抽样调查等方法来获得数据。
数据的整理包括数据的分类、统计图表的制作等工作,以便进一步进行数据的分析。
2. 统计图表的制作与分析在统计解答题中,常用的统计图表有条形图、折线图、饼图、散点图等。
制作这些图表可以帮助我们更直观地了解数据的分布和变化趋势,从而对数据进行进一步分析。
3. 数据的分析与解读数据的分析与解读是解答统计题的关键步骤。
在分析中,我们可以通过计算平均数、中位数、众数等来描述数据的集中趋势;通过计算极差、方差、标准差等来描述数据的离散程度。
在解读中,我们可以根据数据的特点和趋势,给出合理的结论和推断。
二、概率与实验概率与实验是新高考数学中的另一重要内容。
在解答题中,概率与实验常常涉及到对随机事件的建模、实验设计和概率计算,从而帮助我们更好地预测和解释事件的可能性。
1. 随机事件的建模在解答题中,我们常常需要将一些随机事件建模为概率空间,以便进行后续的计算和分析。
建模的过程需要考虑事件的样本空间、事件的可能结果以及各结果发生的概率等。
2. 实验设计与模拟实验设计与模拟是解答概率与统计题的重要手段。
通过合理设计和实施实验,我们可以获得更多的数据,从而得到更准确的概率估计;通过模拟的方式,我们可以通过计算机程序来模拟随机事件的发生,从而进行更多次的实验。
3. 概率计算与推断概率计算与推断是解答概率与统计题的核心内容。
在计算中,我们可以通过概率公式、条件概率、独立事件等来计算事件的概率;在推断中,我们可以根据已知的概率、样本数据以及贝叶斯定理等,来进行事件的预测和解释。
三、实际问题的解决概率与统计在解决实际问题中发挥着重要作用。
数学高考统计大题
数学高考统计大题在数学高考中,统计大题是常见的题型之一,它主要考察学生对于统计学的理解和应用能力。
以下是一个可能的数学高考统计大题的示例:题目:某地区为了了解居民对公共交通的满意度,进行了一次随机抽样调查。
调查结果显示,有60%的居民对公共交通表示满意,40%的居民表示不满意。
同时,调查还发现,年龄在18-30岁之间的居民对公共交通的满意度为70%,而年龄在31-50岁之间的居民对公共交通的满意度为50%。
(1)请根据调查数据,制作一个条形图,展示不同年龄段居民对公共交通的满意度;(2)假设该地区共有100万居民,请估算对公共交通表示不满意的居民数量;(3)根据调查数据,分析该地区居民对公共交通满意度的特点,并提出一些改进建议。
解答:(1)根据调查数据,我们可以制作一个条形图来展示不同年龄段居民对公共交通的满意度。
具体来说,我们可以将年龄分为两个区间:18-30岁和31-50岁,然后根据调查数据计算出每个年龄段居民对公共交通的满意度,最后用条形图表示出来。
通过条形图可以直观地看出不同年龄段居民对公共交通的满意度差异。
(2)根据调查数据,我们可以估算对公共交通表示不满意的居民数量。
具体来说,我们可以用总人口数乘以不满意的比例,即100万× 40% = 40万。
因此,估计有40万居民对公共交通表示不满意。
(3)根据调查数据,我们可以分析该地区居民对公共交通满意度的特点并提出一些改进建议。
首先,我们可以看到总体满意度为60%,表明该地区居民对公共交通的整体满意度较高。
但是,不同年龄段的满意度存在差异,年龄在18-30岁之间的居民满意度较高,而年龄在31-50岁之间的居民满意度较低。
因此,我们可以针对不同年龄段居民的需求和特点,提出相应的改进建议。
例如,可以增加适合中年人的公交线路和班次,提高公交车和地铁站的舒适度和便捷度等措施。
如何增强高考物理统计题解题基础
如何增强高考物理统计题解题基础统计学是物理学中的一个重要分支,尤其在处理实验数据和科学研究中起着关键作用。
对于参加高考的学生来说,掌握统计题的解题技巧是非常重要的。
在这篇文章中,我们将探讨如何增强高考物理统计题解题基础。
1. 理解基本概念首先,要解决统计题,必须深入理解基本概念,如平均数、中位数、众数、方差、标准差等。
了解这些概念的定义、性质和计算方法是解决统计题的基础。
2. 掌握统计方法在高考物理统计题中,常常涉及到数据的收集、整理、分析和解释。
掌握以下统计方法对于解题至关重要:• 数据收集:了解实验设计和数据收集的方法,能够正确地收集和记录数据。
• 数据整理:学会使用图表(如直方图、散点图等)来展示数据,以便更直观地分析和理解数据。
• 数据分析:掌握运用统计量(如均值、方差等)来描述数据的特征,分析数据之间的关系。
• 结果解释:能够对统计分析结果进行合理的解释,并与实际问题相结合。
3. 熟悉公式和计算方法在高考物理统计题中,熟悉以下公式和计算方法是解题的关键:•平均数:x =∑x i n i=1n •中位数:将数据从小到大排列,位于中间位置的数。
•众数:数据中出现次数最多的数。
•方差:s 2=∑(n i=1x i −x)2n−1 • 标准差:s =√s 24. 培养解题思路解决高考物理统计题时,需要培养以下解题思路:•明确问题:仔细阅读题目,明确问题所涉及的物理量和统计方法。
•建立模型:根据题目所给信息,建立合适的统计模型。
•选择方法:根据问题的特点,选择合适的统计方法进行分析。
•计算结果:按照公式和方法进行计算,注意检查计算过程中的错误。
•解释结果:对计算结果进行合理的解释,并与实际问题相结合。
5. 练习和总结增强高考物理统计题解题基础,需要不断地练习和总结。
通过大量的练习题,掌握各种统计方法的运用和解题技巧。
在练习过程中,及时总结自己的错误和不足,不断提高解题能力。
6. 学习资源以下是一些建议的学习资源,有助于增强高考物理统计题解题基础:•课本和辅导书:详细讲解物理统计的基本概念和方法。
2020年高考统计问题聚焦
数学部分•创新题追根溯源去與足五高一使用2021年2月T于生豕,王勺匸■方勤2020年高考对统计的考查主要围绕''频率分布直方图、样本的数字特征、求线性回归方程•”等核心考点展开,重点考查同学们应用统计知识解决实际问题的能力。
聚焦1利用频率分布直方图的数据估计总体例1(2020年高考天津卷改编)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.315.33),[5.33, 5.35),…,5.45,5.47),5.47,5.49],并整理得到如图1所示的频率分布直方图,则在被抽取的零件中,直径落在区间[.43,5.47)内的个数为。
图1解:根据频率分布直方图可知,直径落在区间[5.43,5.47)内的零件频率为(6.25+ 5)X0.02=0.225,则在区间[.43,5.47)内的零件个数为80X0.225=18。
素养:利用频率分布直方图估计总体的分布情况:①最高的小长方形底边中点的横坐标即是众数;②中位数的左边和右边的小长方形的面积之和是相等的;③平均数是频率分布直方图的''重心”它等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和。
变式训练1某高校调查了200名学生每周的自习时间(单位:h)制成了如图2所示的频率分布直方图,其中自习时间的范围是[7.5—0],样本数据分组为[7.5,20),[0, 22.5),22.525),25,27.5),27.5—0]。
根据频率分布直方图,这200名学生中每周的自习时间不少于22.5h的人数是_____。
提示:由频率分布直方图可知,自习时间不少于22.5h的人数是200X(0.16+0.08+ 0.04)X2.5—140o聚焦2:样本的数字特征例2(2020年高考全国卷)在一组样本数据中,,,,出现的频率分别为P1p,P—,4,且H p z=1,则下面四种情形中,对应z—1样本的标准差最大的一组是))oA.p1—p4—0.1, p2=P—=0..B.p1—p4—0..,p2=p—=0.1C.p1—p4=0.2,p2—p—=0.3D.p1—p4=0.3?p2=p—=0.2解:计算出四个选项中对应数据的平均数和方差,由此可得标准差最大的一组。
2025届高考数学一轮复习人教A版多选题专题练:第九章-统计(含解析)
2025届高考数学一轮复习人教A 版多选题专题练:第九章 统计一、多项选择题1.2020年上半年,中国养猪企业受猪价高位的利好影响,大多收获史上最佳半年报业绩,部分企业半年报营业收入同比增长超过1倍.某养猪场抓住机遇,加大了生猪养殖规模,为了检测生猪的养殖情况,该养猪场对2000头生猪的体重(单位:kg )进行了统计,得到如图所示的频率分布直方图,则下列说法正确的是( )A.这2000头生猪体重的众数为160kgB.这2000头生猪中体重不低于200kg 的有80头C.这2000头生猪体重的中位数落在区间[140,160)内D.这2000头生猪体重的平均数为152.8kg2.某公司为了解用户对其产品的满意度,从甲、乙两地区分别随机调查了100个用户,根据用户对产品的满意度评分,分别得到甲地区和乙地区用户满意度评分的频率分布直方图,如图所示.若甲地区和乙地区用户满意度评分的中位数分别为1m ,2m ,平均数分别为1s ,2s ,则下面正确的是( )A.12m m >B.12m m <C.D.3.在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间的中点值作代表,则下列说法中正确的是( )A.成绩在[70,80)内的考生人数最多B.不及格的考生人数为1000C.考生竞赛成绩的平均分约为70.5分D.考生竞赛成绩的中位数为75分4.在我们发布的各类统计数据中,同比和环比都是反映增长速度的核心数据指标.如图是某专业机构统计的2022年1-12月中国校车销量走势图,则下列结论正确的是( )A.8月校车销量的同比增长率与环比增长率都是全年最高B.1-12月校车销量的同比增长率的平均数小于环比增长率的平均数C.1-12月校车销量的环比增长率的极差大于同比增长率的极差D.1-12月校车销量的环比增长率的方差大于同比增长率的方差12s s <12s s >5.某院校教师情况如下表所示.关于2020年、2021年、2022年这三年该院校的教师情况,下面说法正确的是( )A.2021年的男教师最多B.该校教师最多的是2022年C.2021年中年男教师比2020年中年男教师多80人D.2020年到2022年,该校青年年龄段的男教师人数增长率为220%6.某市2023年经过招商引资后,经济收入较前一年增加了一倍,实现翻番,为更好地了解该市的经济收入的变化情况,统计了该市招商引资前后的年经济收入构成比例,得到如下扇形图.则下列结论中正确的是( )A.招商引资后,工资净收入较前一年减少B.招商引资后,转移净收入是前一年的2.5倍D.招商引资后,经营净收入较前一年增加了一倍7.为了调查,两种药物预防某种疾病的效果,某研究所进行了动物试验.已知参与两种药物试验的动物的品种,状态,数量均相同,图1是药物试验结果对应的等高堆积条形图,图2是药物试验结果对应的等高堆积条形图,则( )A.服用药物的动物的患病比例低于未服用药物的动物的患病比例B.服用药物对预防该疾病没有效果C.在对药物的试验中,患病动物的数量约占参与药物试验动物总数量的D.药物比药物预防该种疾病的效果好当月增速100%-=⨯去年同期产量当月产量去年同期产量.C.2021年4月至2021年12月我国规模以上工业天然气产量当月增速的极差为12.6%D.2021年4月至2021年12月我国规模以上工业天然气日均产量的40%分位数为5.3亿立方米9.下列说法正确的是( )A.已知随机变量X 服从二项分布14,2B ⎛⎫ ⎪⎝⎭,则()1D X =B.设随机变量X 服从正态分布()0,1N ,若(1)0.15P X >=,则(10)0.15P X -<<=C.已知一组数据为1,2,3,4,5,6,7,8,9,10,则它的第70百分位数为7D.若事件A ,B 满足()0P A >,()0P B >,(|)()P B A P B =,则事件A ,B 相互独立10.“体育强则中国强,国运兴则体育兴”.为行战2024年巴黎奥运会,运动员们都在积极参加集训,已知某跳水运动员在一次集训中7位裁判给出的分敕分别为:9.1,9.3,9.4,9.6,9.8,10,10,则这组数据的( )A.平均数为9.6B.众数为1011.小明在家独自用下表分析高三前5次月考中数学的班级排名y 与考试次数x 的相关性时,忘记了6=,于是分别用6m =和8m =得到了两条回归直线方程:11y b x a =+,22y b x a =+,对应的相关系数分别为1r 、2r ,排名y 对应的方差分别为21s 、22s ,则下列结论正确的是( )(附:b =y =-A.12r r < B.2212s s < C.12b b < D.12a a <12.第75届联合国大会上,我国向世界郑重承诺力争在2030年前实现碳达峰,努力争取在2060年前实现碳中和.2021年全国两会的政府工作报告明确提出要扎实做好碳达峰、碳中和的各项工作,大力发展新能源.常见的新能源主要有潮汐能、风能、太阳能和地热能等.下图为2015年与2020年我国新增电力装机结构对比,则( )A.2015年我国新增电力装机中,火电装机占比最大B.2020年我国新增电力装机中,风电装机数多于火电装机数C.2020年我国水电新增装机数少于2015年D.2020年我国新增电力装机结构中,新能源装机占比大于2015年13.已知样本11:p ax ,,…,的均值为4,标准差为2,样本,,…,21n x -的方差为4,则样本和样本的( )A.平均数相等B.方差相等C.极差相等D.中位数相等14.某学校开展消防安全知识培训,对甲、乙两班学员进行消防安全知识测试,绘制测试成绩的频率分布直方图,如图所示:( )A.甲班成绩的平均数<甲班成绩的中位数B.乙班成绩的平均数<乙班成绩的中位数C.甲班成绩的平均数<乙班成绩的平均数D.乙班成绩的中位数<甲班成绩的中位数15.某校为了了解学生的身体素质,对2022届初三年级所有学生仰卧起坐一分钟的个数情况进行了数据统计,结果如图1所示.该校2023届初三学生人数较2022届初三学生人数上升了10%,2023届初三学生仰卧起坐一分钟的个数分布条形图如图2所示,则( )A.该校2022届初三年级学生仰卧起坐一分钟的个数在[)30,60内的学生人数占70%B.该校2023届初三学生仰卧起坐一分钟的个数在[]60,80内的学生人数比2022届初三学生仰卧起坐一分钟个数同个数段的学生人数的2.2倍还多C.该校2023届初三学生仰卧起坐一分钟个数和2022届初三学生仰卧起坐一分钟个数的中位数均在[)50,60内2ax n ax 12:21p x -221x -1p 2pD.相比于2022届初三学生仰卧起坐一分钟个数不小于50的人数,2023届初三学生仰卧起坐一分钟个数不小于50的人数占比增加16.有一组样本数据1x ,2x ,…,6x ,其中1x 是最小值,6x 是最大值,则( )A.2x ,3x ,4x ,5x 的平均数等于1x ,2x ,…,6x ,的平均数B.2x ,3x ,4x ,5x 的中位数等于1x ,2x ,…,6x ,的中位数C.2x ,3x ,4x ,5x 的标准差不小于1x ,2x ,…,6x ,的标准差D.2x ,3x ,4x ,5x 的极差不大于1x ,2x ,…,6x ,的极差17.我国居民收入与经济同步增长,人民生活水平显著提高.“三农”工作重心从脱贫攻坚转向全面推进乡村振兴,稳步实施乡村建设行动,为实现农村富强目标而努力.2017年~2021年某市城镇居民、农村居民年人均可支配收入比上年增长率如下图所示.根据下面图表,下列说法一定正确的是( )A.该市农村居民年人均可支配收入高于城镇居民B.对于该市居民年人均可支配收入比上年增长率的极差,城镇比农村的大C.对于该市居民年人均可支配收入比上年增长率的中位数,农村比城镇的大D.2021年该市城镇居民、农村居民年人均可支配收入比2020年有所上升18.某短视频平台以讲故事,赞家乡,聊美食,展才艺等形式展示了丰富多彩的新时代农村生活,吸引了众多粉丝,该平台通过直播带货把家乡的农产品推销到全国各地,从而推进了“新时代乡村振兴”.从平台的所有主播中,随机选取300人进行调查,其中青年人,中年人,其他人群三个年龄段的比例饼状图如图1所示,各年龄段主播的性别百分比等高堆积条形图如图2所示,则下列说法正确的有( )A.该平台女性主播占比的估计值为0.4B.从所调查的主播中,随机抽取一位参加短视频剪辑培训,则被抽到的主播是中年男性的概率为0.7C.按年龄段把所调查的主播分为三层,用分层抽样法抽取20名主播担当平台监管,若样本量按比例分配,则中年主播应抽取6名D.从所调查的主播中,随机选取一位作为幸运主播,已知该幸运主播是青年人的条件下,又是女性的概率为0.619.下列统计量中可用于度量样本1x,2x ,…,n x 离散程度的有( )A.1x ,2x ,…,n x 的标准差B.1x ,,…,的中位数C.1x ,2x ,…,n x 的极差D.1x ,2x ,…,n x 的平均数20.我国新冠肺炎疫情防控进入常态化,各地有序推动复工复产.下面是某地连续11天的复工、复产指数折线图.根据该折线图,( )A.这11天复工指数和复产指数均逐日增加B.在这11天期间,复产指数的增量大于复工指数的增量C.第3天至第11天,复工指数和复产指数都超过80%D.第9天至第11天,复产指数的增量大于复工指数的增量2x n x参考答案1.答案:BCD解析:由频率分布直方图可知,[140,160)这一组的数据对应的小长方形最高,所以这2000头生猪的体重的众数为150kg ,A 错误;这2000头生猪中体重不低于200kg 的有0.00220200080⨯⨯=(头),B 正确;因为生猪的体重在[80,140)内的频率为(0.0010.0040.01)200.3++⨯=,在[140,160)内的频率为0.016200.32⨯=,且0.30.320.620.5+=>,所以这2000头生猪体重的中位数落在区间[140,160)内,C 正确;这2000头生猪体重的平均数为(0.001900.004110⨯+⨯0.011300.0161500.0121700.0051900.002210)20152.8(kg)+⨯+⨯+⨯+⨯+⨯⨯=,D 正确.故选BCD.2.答案:BC解析:由题中频率分布直方图得,甲地区[40,60)的频率为(0.0150.020)100.35+⨯=,[60,70)的频率为0.025100.25⨯=,所以甲地区用户满意度评分的中位数10.50.356010660.25m -=+⨯=,甲地区的平均数1450.01510550.02010650.02510750.02010s =⨯⨯+⨯⨯+⨯⨯+⨯⨯850.01010950.0101067+⨯⨯+⨯⨯=.乙地区[50,70)的频率为(0.0050.020)100.25+⨯=,[70,80)的频率为0.035100.35⨯=,所以乙地区用户满意度评分的中位数20.50.25701077.10.35m -=+⨯≈,乙地区的平均数2550.00510650.02010750.03510850.02510950.01510s =⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯77.5=,所以12m m <,12s s <.故选BC.3.答案:ABC解析:由频率分布直方图可得,成绩在[70,80)内的频率最高,因此考生人数最多,故A 正确;由频率分布直方图可得,成绩在[40,60)内的频率为10(0.010.015)0.25⨯+=,因此不及格的人数为40000.251000⨯=,故B 正确;由频率分布直方图可得,平均分约为450.1550.15650.2750.3850.15950.170.5⨯+⨯+⨯+⨯+⨯+⨯=(分),故C 正确;因为成绩在[40,70)内的频率为10(0.010.0150.02)0.45⨯++=,在[70,80)内的频率为0.3,所以中位数为0.50.45701071.670.3-+⨯≈,故D 错误.故选ABC.4.答案:BCD解析:2022年8月校车销量的同比增长率比9月的低,故A 错误;由校车销量走势图知1-12月校车销量的同比增长率的平均数为负数,环比增长率的平均即招商引资后,转移净收入是前一年的2.5倍,可得B 正确;对于C ,由招商引资后的年经济收入构成比例可知转移净收入与财产净收入的总和占比为33%,小对于D ,招商引资后的经营净收入为230%0.6a a ⨯=,招商引资前的经营净收入为30%0.3a a ⨯=,可得招商引资后,经营净收入较前一年增加了一倍,即D 正确.故选:BD7.答案:AD解析:根据题中两组等高堆积条形图,可知服用药物的动物的患病比例低于未服用药物的动物的患病比例,所以正确;服用药物未患病的动物的频率明显大于未服用药物的,所以可以认为服用药物对预防该疾病有一定效果,所以B 不正确;在对药物的试验中,患病动物的数量占参与药物试验动物总数量的比例为100%204302000%60%⨯=+<,所以C 不正确;药物试验结果对应的等高堆积条形图显示未服用药与服用药动物的患病数量的差异较药物试验的大,所以药物比药物预防该种疾病的效果好,所以D 正确.故选:AD.8.答案:ACD解析:2021年10月份我国规模以上工业天然气产量当月增速为0.5个百分点,9月份增速为7.1个百分点,比上月放缓6.6个百分点.故A 正确;2021年8月我国规模以上工业天然气产量为亿立方米,故B 错误;2021年4月至12月我国规模以上工业天然气产量当月增速的极差为13.1%0.5%12.6%-=.故C 正确;2021年4月至12月我国规模以上工业天然气日均产量从小到大为5.1,5.1,5.2,5.3,5.4,5.6,5.7,5.9,6.2,因为,所以该组数据的40%分位数为5.3亿立方米,故D 正确.9.答案:AD解析:因为随机变量X 服从二项分布,则()114(1)122D X =⨯⨯-=,故A 正确;因为随机变量X 服从正态分布()0,1N ,则对称轴为0μ=,1(10)[12(1)]0.352P X P X -<<=->=,故B 错误;7.5=,故C 错误;因为()(|)()()P AB P B A P B P A ==,所以()()()P AB P A P B =,所以事件A ,B 相互独立.故选:AD.10.答案:ABD解析:对于A,平均数1(9.19.39.49.69.81010)9.67=++++++=,故A 正确;对于B,出现次数最多5.131158.1⨯=90.4 3.6⨯=14,2B ⎛⎫ ⎪⎝⎭的数为10,故B正确;对于C,70.8 5.6⨯=,第80百分位数为第6位,即10,故C错误;对于D,方差为正确.故选ABD.11.答案:BD解析:当m=123455++++==11066265n++++==,解得16n=,同理,当时,,,,,所以,,,,故选:BD.12.答案:ABD2222221(9.19.6)(9.39.6)(9.49.6)(9.69.6)(9.89.6)2(109.6)7⎡⎤-+-+-+-+-+-=⎣⎦16-223)(26)12-= 8m=22b=-212a=2r=228s=12r r>2212s s<12b b>12a a<解析:对于A ,2015年我国新增电力装机中火电装机占比50.65%,显然占比最大,故A 正确;对于B ,2020年我国新增电力装机中风电装机占比37.55%,火电装机占比29.53%,所以新增电力装机中风电装机数大于火电装机数,故B 正确;对于C ,虽然相对于2015年,2020年我国核电新增装机占比减少,但由于总装机数不确定,所以不能得出核电装机数减少的结论,故C 错误;对于D ,2015年我国新增电力装机中火电装机占比50.65%,所以新能源装机占比不超过50%,但2020年我国风电和太阳能新增装机占比和为62.8%大于50%,所以2020年我国新增电力装机结构中清洁能源占比增加,故D 正确.故选ABD.13.答案:BC解析:对于选项A,B,C,设样本1x ,2x ,…,x 2,极差为M ,中位数为q ,则4ax =,224a s =,244s =,所以21s =,2a =±,当2a =时,样本11:2p x ,22x ,…,2n x ;样本12:21p x -,221x -,…,21n x -,可得样本1p 的平均数为24x =,样本2p 的平均数为213x -=,样本1p 和样本2p 的极差相等为2M ,方差也相等为4,故B,C 正确;选项D,设样本1p 的中位数为2q ,则样本2p 的中位数为21q -,故D 错误.当2a =-时,样本11:2p x -,22x -,…,2n x -;样本12:21p x -,221x -,…,21n x -,可得样本1p 的平均数为24x -=,样本2p 的平均数为215x -=-,样本1p 和样本2p 的极差相等为2M ,方差也相等为4,故B,C 正确;选项D,设样本1p 的中位数为,则样本的中位数为,故D 错误.故选:BC.14.答案:BC解析:15.答案:ABD解析:2022届初三年级学生仰卧起坐一分钟的个数在[)30,60内的学生人数占比为20%25%25%70%++=,A 正确.由于2023届初三学生人数较2022届上升了10%,假设2q -2p 21q -2022届初三学生人数为(0)a a >,则仰卧起坐一分钟的个数在[]60,80内的学生人数为0.2a ,2023届初三学生仰卧起坐一分钟的个数在[]60,80内的学生人数为()110%41%0.451,0.4510.2 2.2a a a a ⨯+⨯=>⨯,B 正确.2022届初三学生仰卧起坐一分钟个数的中位数在[)40,50内,2023届初三学生仰卧起坐一分钟个数的中位数在[)50,60内,C 错误.2022届初三学生仰卧起坐一分钟个数不小于50的人数占由表中数据,可知增长率为正,即D 正确.故选:BCD18.答案:AC解析:A 选项,由图1可以看出选取300人中其他人群人数为30010%30⨯=,青年人人数为30060%180⨯=,中年人人数为()300110%60%90⨯--=,由图2可以看出青年人中女性人数为1804072⨯%=,中年人中女性人数为9030%27⨯=,其他人群中,女性人数为3070%21⨯=,0.4=,A 正确;B 选项,中年人中男性人数为9070%63⨯=,故从所调查的主播中,随机抽取一位参加短视频剪辑培训,则被抽到的主播是中年男性0.21=,B 错误;C 选项,三个年龄段人数比例为青年主播,中年主播和其他人群主播比例为6:3:1,故用分层抽样法抽取20名主播担当平台监管,若样本量按比例分配,则中年主播应抽取3206631⨯=++名,C 正确;D 选项,从所调查的主播中,随机选取一位作为幸运主播,设幸运主播是青年人为事件A ,随机选取一位作为幸运主播,设幸运主播是女性主播为事件B ,则()180n A =,()72n AB =,()()()720.4180n AB P B A n A ===,D 错误.19.答案:AC解析:平均数和中位数反映的是一组数据的平均水平,标准差和极差则体现了一组数据的离散程度.故选AC.20.答案:CD解析:由题图可知第8,9天复工指数和复产指数均减小,故A 错误;第1天时复工指数小于复产指数,第11天时两指数相等,故复产指数的增量小于复工指数的增量,故B 错误;由题图可知第3天至第11天,复工复产指数都超过80%,故C 正确;第9天至第11天,复产指数的增量大于复工指数的增量,故D 正确.。
2022届高考数学一轮复习精选试题:统计(解答题)
统计02解答题(本大题共6个小题,共70分,解答应写出文字说明,证明过程或演算步骤)1.对某校高三年级学生参加社区服务次数进行统计,随机抽取M 名学生作为样本,得到这M 名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:(Ⅰ)求出表中,M p 及图中a 的值;(Ⅱ)若该校高三学生有240人,试估计该校高三学生参加社区服务的次数在区间[10, 15)内的人数;(Ⅲ)在所取样本中,从参加社区服务的次数不少于20次的学生中任选2人,求至多一人参加社区服务次数在区间[25, 30)内的概率. 【答案】(Ⅰ)由分组[10,15)内的频数是10,频率是0.25知,100.25M=,所以40M =.因为频数之和为40,所以1024240m +++=,4m =,40.1040m p M === 因为a 是对应分组[15,20)的频率与组距的商,所以240.12405a ==⨯(Ⅱ)因为该校高三学生有240人,分组[10,15)内的频率是0.25, 所以估计该校高三学生参加社区服务的次数在此区间内的人数为60人(Ⅲ)这个样本参加社区服务的次数不少于20次的学生共有26m +=人, 设在区间[20,25]内的人为1224{,,,}a a a a ,在区间[25,30)内的人为12{,}b b . 则任选2人共有1213141112232421(,),(,),(,),(,),(,),(,),(,),(,),a a a a a a a b a b a a a a a b 2234(,),(,)a b a a ,3132414212(,),(,),(,),(,),(,)a b a b a b a b b b 15种情况,而两人都在[25,30)内只能是12{,}b b 一种, 所以所求概率为11411515P =-=2.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:已知在全部50人中随机抽取1人抽到喜爱打篮球的学生的概率为35. (1)请将上面的列联表补充完整;(2)是否有99.5%的把握认为喜爱打篮球与性别有关?说明你的理由;(3)已知喜爱打篮球的10位女生中,12345,,A A A A A ,,还喜欢打羽毛球,123B B B ,, 还喜欢打乒乓球,12C C ,还喜欢踢足球,现再从喜欢打羽毛球、喜欢打乒乓球、喜欢踢足球的女生中各选出1名进行其他方面的调查,求1B 和1C 不全被选中的概率.【答案】(1) 列联表补充如下:(2)∵2250(2015105)8.3337.87930202525K ⨯⨯-⨯=≈>⨯⨯⨯ ∴有99.5%的把握认为喜爱打篮球与性别有关.(3)从10位女生中选出喜欢打羽毛球、喜欢打乒乓球、喜欢踢足球的各1名,其一切可能的结果组成的基本事件如下:111112121()()()A B C A B C A B C ,,,,,,,,,122131()()A B C A B C ,,,,,,132(),A B C ,,211212221()()()A B C A B C A B C ,,,,,,,,,222()A B C ,,,231()A B C ,,,232()A B C ,,,311312321()()()A B C A B C A B C ,,,,,,,,,332()A B C ,,, 322331()()A B C A B C ,,,,,,411412421()()()A B C A B C A B C ,,,,,,,,, 422431432()()()A B C A B C A B C ,,,,,,,,,511512521()()()A B C A B C A B C ,,,,,,,,, 522531532()()()A B C A B C A B C ,,,,,,,,,基本事件的总数为30,用M 表示“11B C ,不全被选中”这一事件,则其对立事件M 表示“11B C ,全被选中”这一事件,由于M 由111211311()()()A B C A B C A B C ,,,,,,,,, 411511(,,),(,,)A B C A B C 5个基本事件组成,所以51()306P M ==,由对立事件的概率公式得15()1()166P M P M =-=-=.3.某产品的广告支出x(单位:万元)与销售收入y(单位:万元)之间有下表所对应的数据.(1)画出表中数据的散点图;(2)求出y 对x 的线性回归方程;(3)若广告费为9万元,则销售收入约为多少万元?【答案】 (1)散点图如图:(2)观察散点图可知各点大致分布在一条直线附近,列出下列表格,以备计算a 、b .于是5x 2=,69y 2=,代入公式得: 11223344222221234x y x y x y x y 4xy b x x x x 4x +++-=+++-25694184732255304()2-⨯⨯==-⨯, 69735a y bx 2.252=-=-⨯=-故y 与x 的线性回归方程为73y x 25=-,其中回归系数为735,它的意义是:广告支出每增加1万元,销售收入y 平均增加735万元.(3)当x=9万元时,73y 92129.45=⨯-=(万元).4.为适应新课改,切实减轻学生负担,提高学生综合素质,某市某学校高三年级文科生300人在数学选修4-4、4-5、4-7选课方面进行改革,由学生自由选择2门(不可多选或少选),选课情况如下表:(1)为了解学生情况,现采用分层抽样方法抽取了三科作业共50本,统计发现4-5有18本,试根据这一数据求出,a b 的值。
高三数学备考冲刺140分问题42实际应用中的统计解答题含解析
问题42实际应用中的统计解答题一、考情分析概率统计在高考中扮演着很重要的角色,概率统计解答题是全国卷及多数省市高考数学必考内容,内容主要涉及古典概型、相互独立事件的概率、条件概率、二项分布、正态分布、频率分布直方图、回归分析、离散型随机变量的分布列、期望与方差的实际应用等.回顾近几年的高考试题,可以看出概率统计解答题,大多紧密结合社会实际,以现实生活为背景设置试题,注重知识的综合应用与实际应用,作为考查实践能力的重要载体,命题者要求考生会收集、整理、分析数据,能从大量数据中抽取对研究问题有用的信息,建立数学模型,再应用数学原理和数学工具解决实际问题.该类问题阅读量一般比较大,但难度多为中等或中等偏易. 二、经验分享(1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1. 利用分布列中各概率之和为1可求参数的值,此时要注意检验,以保证每个概率值均为非负数.对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.(2)随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量稳定于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据.一般先比较均值,若均值相同,再用方差来决定.(3)解决正态分布问题有三个关键点:(1)对称轴x =μ;(2)标准差σ;(3)分布区间.利用对称性可求指定范围内的概率值;由μ,σ,分布区间的特征进行转化,使分布区间转化为3σ特殊区间,从而求出所求概率.注意只有在标准正态分布下对称轴才为x =0. (4)判定两个变量正、负相关性的方法①画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.②相关系数:r >0时,正相关;r <0时,负相关.③线性回归方程中:b ^>0时,正相关;b ^<0时,负相关.(5) 回归分析是处理变量相关关系的一种数学方法.主要解决:①确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;② 根据一组观测值,预测变量的取值及判断变量取值的变化趋势;③ 求出线性回归方程.线性回归分析问题的类型及解题方法 ①求线性回归方程利用公式,求出回归系数b ^,或待定系数法:利用回归直线过样本点的中心求系数.②利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.③利用回归直线判断正、负相关;决定正相关还是负相关的是系数b ^.(6)回归方程的拟合效果,可以利用相关系数判断,当|r |越趋近于1时,两变量的线性相关性越强. (7)比较几个分类变量有关联的可能性大小的方法①通过计算K 2的大小判断:K 2越大,两变量有关联的可能性越大.②通过计算|ad -bc |的大小判断:|ad -bc |越大,两变量有关联的可能性越大. (8)独立性检验的一般步骤 ①根据样本数据制成2×2列联表. ②根据公式计算K 2的观测值k .③比较k 与临界值的大小关系,作统计推断. 三、知识拓展 四、题型分析(一) 期望与方差的应用数学期望反应的是随机变量取值的平均水平,而方差则是反应随机变量取值在其平均值附近的离散程度.现代实际生活中,越来越多的决策需要应用数学期望与方差这思想来对事件发生大小的可能性进行评估,通过计算分析可以比较科学地得出各个方案的预期效果及出现偏差的大小,从而决定要选择的最佳方案.品种的优劣、仪器的好坏、预报的准确与否等很多问题都与这两个特征两量有关.(1)若我们希望实际的平均水平较理想,则先求随机变量12ξξ,的期望,当12E E ξξ=时,不应认为它们一定一样好,需要用12,D D ξξ来比较这两个随机变量的方差,确定它们的偏离程度. (2)若我们希望比较稳定性,应先考虑方差,再考虑均值是否相等或接近.【例1】例3.7(2018新课标I 卷理20)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为,且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为,求的最大值点.(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的作为的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用. (i )若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为,求;(ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?【分析】利用独立重复实验成功次数对应的概率,求得,之后对其求导,利用导数确定其单调性,再求最大值点,注意;(2)先根据第一问的条件,确定出,在解(i)的时候,先求件数对应的期望,之后应用变量之间的关系,求得赔偿费用的期望;在解(ii)的时候,就通过比较两个期望的大小,得到结果.【解析】(1)20件产品中恰有2件不合格品的概率为.因此.令,得.当时,;当时,.所以的最大值点为.(2)由(1)知,.(i)令表示余下的180件产品中的不合格品件数,依题意知,,即.所以.(ii)如果对余下的产品作检验,则这一箱产品所需要的检验费为400元.由于,故应该对余下的产品作检验.【点评】随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量稳定于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据.一般先比较均值,若均值相同,再用方差来决定.【小试牛刀】【广东省江门市2019届第一次模拟】甲、乙两家外卖公司,其送餐员的日工资方案如下:甲公司的底薪元,每单提成元;乙公司无底薪,单以内(含单)的部分每单提成元,大于单的部分每单提成元,假设同一公司送餐员一天的送餐单数相同,现从两家公司各随机抽取一名送餐员,并分别记录其天的送餐单数,得到如下频数表:甲公司送餐员送餐单数频数表乙公司送餐员送餐单数频数表(1)若将大于单的工作日称为“繁忙日”,根据以上频数表能否在犯错误的概率不超过的前提下认为“繁忙日”与公司有关?(2)若将频率视为概率,回答下列两个问题:①记乙公司送餐员日工资为(单位:元),求的分布列和数学期望;②小王打算到甲、乙两家公司中的一家应聘,你会推荐小王去哪家?为什么?参考公式和数据:【解析】(1)依题意得,公司与“繁忙日”列联表,,所以,能在犯错误的概率不超过的前提下认为“繁忙日”与公司有关 .(2)①设乙公司送餐员送餐单数为,则当时,,当时,,当时,,当时,,当时, . 所以,的所有可能取值为、、、、,的分布列为:.②依题意,甲公司送餐员日平均送餐单数为,所以甲公司送餐员日平均工资为(元),因为,故从更高收入角度考虑推荐小王去乙公司应聘;因为乙公司比甲公司繁忙,故从工作闲适角度考虑推荐小王去甲公司应聘. (二)正态分布的应用正态分布随处可见,处处显现着他神秘的身影.对于某一件事或者某个要达到的目标,很多很多的个体发挥出来的水平大致上服从正态分布.也就是说,对于大量个体的发挥统计,常常能看到正态分布“冥冥之中”束缚着整体的状态. 对于某个单独的单位,一般来说,对于“发挥出来的水平”这件事,也往往有波动的效果,不管是机器、工具还是我们人本身:有的时候,超水平发挥了;有的时候正常发挥;有的时候又会发挥失常.这种东西应该也可以抽象为围绕期望水平的正态分布. 而对于若干数据,包括发挥水平、排位情况,但是没有整体数据的时候,如果能推测是正态分布的情形,就可以近似计算出分布函数来,然后去估计其他的分布情况.这是反向推导的过程. 生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述.例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等.【例2】为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm ).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布()2,N μσ.(1)假设生产状态正常,记X 表示一天内抽取的16个零件中其尺寸在()–3,3μσμσ+之外的零件数,求()1P X …及X 的数学期望;(2)一天内抽检零件中,如果出现了尺寸在()–3,3μσμσ+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. (ⅰ)试说明上述监控生产过程方法的合理性; (ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:9.95 10.12 9.969.96 10.01 9.929.98 10.0410.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95经计算得16119.9716i i x x ===∑,0.212s ===,其中i x 为抽取的第i 个零件的尺寸,1216i =⋯,,,. 用样本平均数x 作为μ的估计值ˆμ,用样本标准差s 作为σ的估计值ˆσ,利用估计值判断是否需对当天的生产过程进行检查?剔除()ˆˆˆˆ3,3μσμσ-+之外的数据,用剩下的数据估计μ和σ(精确到0.01).附:若随机变量Z服从正态分布()2,N μσ,则()–330.9974P Z μσμσ<<+=,160.99740.9592≈0.09≈.【分析】 (1)先确定()~160.0026X B ,,再利用EX np =求期望;(2)(i )判断监控生产过程的方法是否合理,可通过一天内抽取的16个零件中,尺寸落()33μσμσ-+,之外概率的大小判断,(ii )剔除异常数据,在利用公式求μ和σ.【解析】 (1)由题可知尺寸落在()33μσμσ-+,之内的概率为0.9974,落在()33μσμσ-+,之外的概率为0.0026.()()016160C 10.99740.99740.9592P X ==-≈,()()11010.95920.0408P X P X =-=≈-=…,由题可知()~160.0026X B ,,所以()160.00260.0416E X =⨯=. (2)(i )尺寸落在()33μσμσ-+,之外的概率为0.0026,由正态分布知尺寸落()33μσμσ-+,之外为小概率事件,因此上述监控生产过程的方法合理.(ii )39.9730.2129.334μσ-=-⨯=,39.9730.21210.606μσ+=+⨯=,()()339.33410.606μσμσ-+=,,,因为()9.229.33410.606∉,, 所以需对当天的生产过程检查. 因此剔除9.22,剔除数据之后:9.97169.2210.0215μ⨯-==.()()()()()222222[9.9510.0210.1210.029.9610.029.9610.0210.0110.02σ=-+-+-+-+-+()()()()()222229.9210.029.9810.0210.0410.0210.2610.029.9110.02-+-+-+-+-+()()()()()22222110.1310.0210.0210.0210.0410.0210.0510.029.9510.02]0.00815-+-+-+-+-⨯≈.所以0.09σ=≈.【点评】正态分布是概率统计中相对较独立的一个考点,且已经从冷点转化为热点,求解此类问题,一般从,μσ入手,对于应用问题,要注意从较大的阅读量中提取有用的信息.以下两类问题是正态分布中的基本问题:(1)利用正态分布密度曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x=μ对称,及曲线与x轴之间的面积为1.(2)利用3σ原则求概率问题时,要注意把给出的区间或范围与正态变量的μ,σ进行对比联系,确定它们属于(μ-σ,μ+σ),(μ-2σ,μ+2σ),(μ-3σ,μ+3σ)中的哪一个.【小试牛刀】【山东省济宁市2019届高三第一次模拟】某学校为了了解全校学生的体重情况,从全校学生中随机抽取了100人的体重数据,结果这100人的体重全部介于45公斤到75公斤之间,现将结果按如下方式分为6组:第一组[45,50),第二组[50,55),…,第六组[70,75),得到如下图(1)所示的频率分布直方图,并发现这100人中,其体重低于55公斤的有15人,这15人体重数据的茎叶图如图(2)所示,以样本的频率作为总体的概率.(I)求频率分布直方图中的值;(II)从全校学生中随机抽取3名学生,记X为体重在[55,65)的人数,求X的概率分布列和数学期望;(III)由频率分布直方图可以认为,该校学生的体重近似服从正态分布,其中若,则认为该校学生的体重是正常的.试判断该校学生的体重是否正常?并说明理由.【解析】解:(Ⅰ)由图(2)知,100名样本中体重低于50公斤的有2人,用样本的频率估计总体的概率,可得体重低于50公斤的概率为,则,在上有13人,该组的频率为0.13,则,所以,即c=0.07.(Ⅱ)用样本的频率估计总体的概率,可知从全体学生中随机抽取一人,体重在的概率为0.07×10=0.7,随机抽取3人,相当于三次独立重复试验,随机变量X服从二项分布,则,,,,所以,X的概率分布列为:E(X)=3×0.7=2.1(Ⅲ)由N(60,25)得由图(2)知.所以可以认为该校学生的体重是正常的.(三) 用样本估计总体频率分布直方图是高考考查的热点,考查频率很高,题型有选择题、填空题,也有解答题,难度为低中档.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.【例3】2018年9月的台风“山竹”对我国多个省市的财产造成重大损害,据统计直接经济损失达亿元.某青年志愿者组织调查了某地区的个农户在该次台风中造成的直接经济损失,将收集的损失数据分成五组:,,,,(单位:元),得到如图所示的频率分布直方图.(1)试根据频率分布直方图估计该地区每个农户的损失(同一组中的数据用该区间的中点值代表);(2)台风后该青年志愿者与当地政府向社会发出倡议,为该地区的农户捐款帮扶,现从这户损失超过元的农户中随机抽取户进行重点帮扶,设抽出损失超过元的农户数为,求的分布列和数学期望. 【分析】(1)根据频率分布直方图计算每个农户的平均损失;(2)根据频率分布直方图计算随机变量X的可能取值,再求X的分布列和数学期望值.【解析】(1)记每个农户的平均损失为元,则;(2)由频率分布直方图,可得损失超过1000元的农户共有(0.00009+0.00003+0.00003)×2000×50=15(户),损失超过8000元的农户共有0.00003×2000×50=3(户),随机抽取2户,则X的可能取值为0,1,2;计算P(X=0)==,P(X=1)==,P(X=2)==,所以X的分布列为;数学期望为E(X)=0×+1×+2×=.【点评】用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,直方图比较直观. 【小试牛刀】中国农业银行开始为全国农行ATM 机安装刷脸取款系统.某农行营业点为调查居民对刷脸取款知识的了解情况,制作了刷脸取款知识有奖调查问卷,发放给2018年度该行的所有客户,并从参与调查且年龄(单位:岁)在[25,55]内的客户中随机抽取100名给予物质奖励,再从中选出一名客户参加幸运大抽奖.调查结果按年龄分成6组,制作成如下的频数分布表和女客户的年龄茎叶图,其中a ∶b ∶c =2∶4∶5.女客户的年龄茎叶图幸运大抽奖方案如下:客户最多有两次抽奖机会,每次抽奖的中奖率均为,第一次抽奖,若未中奖,则抽奖结束.若中奖,则通过抛掷一枚质地均匀的硬币,决定是否继续进行第二次抽奖.规定:抛出的硬币,若反面朝上,则客户获得5000元奖金,不进行第二次抽奖;若正面朝上,客户需进行第二次抽奖,且在第二次抽奖中,如果中奖,则获得奖金10000元,如果未中奖,则所获得的奖金为0元.(1)求a ,b ,c 的值,若分别从男、女客户中随机选取1人,求这2人的年龄均在[40,45)内的概率; (2)若参加幸运大抽奖的客户所获奖金(单位:元)用X 表示,求X 的分布列与数学期望E (X ). 【解析】(1)由频数分布表知,a+b+c=100-45=55. 因为a ∶b ∶c=2∶4∶5, 所以a=×55=10,b=×55=20,c=×55=25,由茎叶图可知年龄在[25,30)内的女客户有2人,年龄在[30,35)内的女客户有4人,年龄在[35,40)内的女客户有8人,年龄在[40,45)内的女客户有10人,年龄在[45,50)内的女客户有6人,年龄在[50,55]内的女客户有10人,故年龄在[40,45)内的男客户有15人,在100名客户中,男客户有60人,女客户有40人,所以从男客户中随机选取1人,年龄恰在[40,45)内的概率P 1=,从女客户中随机选取1人,年龄恰在[40,45)内的概率P 2=,则分别从男、女客户中随机选取1人,这2人的年龄均在[40,45)内的概率P =P 1×P 2=.(2)由题意可知,X 的所有可能取值为0,5000,10000,则P (X =0)=,P (X =5000)=,P (X =10000)=.X 的分布列为E (X )=0×+5000×+10000×=5200(元).(四) 回归分析回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则无意义.根据回归方程进行的估计仅是一个预测值,而不是真实发生的值. 用最小二乘法求回归方程,关键在于正确求出系数a ^,b ^,由于a ^,b ^的计算量较大,计算应仔细小心. 【例4】【湖北省黄冈市2019届模拟】某基地蔬菜大棚采用无土栽培方式种植各类蔬菜.根据过去50周的资料显示,该基地周光照量(小时)都在30小时以上,其中不足50小时的有5周,不低于50小时且不超过70小时的有35周,超过70小时的有10周.根据统计,该基地的西红柿增加量(千克)与使用某种液体肥料的质量(千克)之间的关系如图所示.(1)依据上图,是否可用线性回归模型拟合与的关系?请计算相关系数并加以说明(精确到0.01).(若,则线性相关程度很高,可用线性回归模型拟合)(2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪运行台数受周光照量限制,并有如下关系:周光照量(单位:若某台光照控制仪运行,则该台光照控制仪周利润为3000元;若某台光照控制仪未运行,则该台光照控制仪周亏损1000元.以频率作为概率,商家欲使周总利润的均值达到最大,应安装光照控制仪多少台?附:相关系数公式,参考数据:,.【分析】(1)根据公式得到相关系数的值,通过比较得到判断;(2)分别求出安装一台,两台,三台时的利润均值,得到结果.【解析】(1)由已知数据可得,.∵,,.∴相关系数.∵,∴可用线性回归模型拟合与的关系.(2)记商家周总利润为元,由条件可知至少需安装1台,最多安装3台光照控制仪.①安装1台光照控制仪可获得周总利润3000元.②安装2台光照控制仪的情形:当时,只有1台光照控制仪运行,此时周总利润(元),,当时,2台光照控制仪都运行,此时周总利润(元),,故的分布列为∴(元).③安装3台光照控制仪的情形:当时,只有1台光照控制仪运行,此时周总利润(元),,当时,有2台光照控制仪运行,此时周总利润(元),,当时,3台光照控制仪都运行,周总利润(元),,故的分布列为∴(元).综上可知,为使商家周总利润的均值达到最大,应该安装2台光照控制仪.【点评】判断两个变量是否具有相关关系的常用方法:(1)利用散点图进行判断;(2)利用相关系数r进行判断.【小试牛刀】【江西省临川第一中学等九校2019届高三3月联考】某商场营销人员进行某商品市场营销调查发现,每回馈消费者一定的点数,该商品每天的销量就会发生一定的变化,经过试点统计得到以下表:反馈点数(1)经分析发现,可用线性回归模型拟合当地该商品销量(千件)与返还点数之间的相关关系.请用最小二乘法求关于的线性回归方程,并预测若返回6个点时该商品当天销量;(2)若节日期间营销部对商品进行新一轮调整.已知某地拟购买该商品的消费群体十分庞大,经营销调研机构对其中的200名消费者的返点数额的心理预期值进行了一个抽样调查,得到如下一份频数表:(i)求这200位拟购买该商品的消费者对返点点数的心理预期值的样本平均数及中位数的估计值(同一区间的预期值可用该区间的中点值代替;估计值精确到0.1);(ii)将对返点点数的心理预期值在和的消费者分别定义为“欲望紧缩型”消费者和“欲望膨胀型”消费者,现采用分层抽样的方法从位于这两个区间的30名消费者中随机抽取6名,再从这6人中随机抽取3名进行跟踪调查,设抽出的3人中“欲望膨胀型”消费者的人数为随机变量,求的分布列及数学期望.参考公式及数据:①,;②.【解析】(1)易知,,,,.则关于的线性回归方程为,当时,,即返回6个点时该商品每天销量约为2百件.(2)(i)根据题意,这200位拟购买该商品的消费者对返回点数的心里预期值的平均值,及中位数的估计值分别为:,中位数的估计值为.(ii)抽取6名消费者中“欲望紧缩型”消费者人数为,“欲望膨胀型”消费者人数为.,,,故随机变量的分布列为.(五) 独立性检验独立性检验的一般步骤(1)假设两个分类变量x与y没有关系;(2)计算出K2的观测值,其中K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d);(3)把K2的值与临界值比较,作出合理的判断.【例5】【福建省莆田市2019届高三下学期教学质量检测】为推进“千村百镇计划”,年月某新能源公司开展“电动莆田绿色出行”活动,首批投放台型新能源车到莆田多个村镇,供当地村民免费试用三个月。
高考数学试题分项解析专题13 统计学生 理 试题
智才艺州攀枝花市创界学校2021年高考试题分项解析数学〔理科〕专题13统计〔学生〕一、选择题:1.(2021年高考卷理科4)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,……,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C.那么抽到的人中,做问卷B 的人数为〔〕〔A 〕7〔B 〕9〔C 〕10〔D 〕154.(2021年高考卷理科9)样本〔12,,,n x x x 〕的平均数为x ,样本〔12,,m y y y 〕的平均数为()y x y ≠,假设样本〔12,,,n x x x ,12,,m y y y 〕的平均数(1)z ax a y =+-,其中102α<<,那么n ,m 的大小关系为()A .n m <B .n m >C .n m =D .不能确定5.(2021年高考卷理科5)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如下列图,那么〔〕()A 甲的成绩的平均数小于乙的成绩的平均数()B 甲的成绩的中位数等于乙的成绩的中位数()C 甲的成绩的方差小于乙的成绩的方差()D 甲的成绩的极差小于乙的成绩的极差二、填空题:1.〔2021年高考卷2〕某高一、高二、高三年级的学生人数之比为334::,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,那么应从高二年级抽取名学生.三、解答题:1.(2021年高考卷理科17)〔本小题总分值是13分〕某班50位学生期中考试数学成绩的频率分布直方图如图4所示,其中成绩分组区间是:[40,50][50,60][60,70][70,80][80,90][90,100]。
〔1〕求图中x 的值;〔2〕从成绩不低于80分的学生中随机选取2人,该2人中成绩在90分以上〔含90分〕的人数记为,求的数学期望.2.(2021年高考卷理科17)〔本小题一共13分〕 其中a >0,c b a ++=600。
专题16 统计-2023年高考数学真题题源解密(新高考)(解析版)
专题16 统计目录一览2023真题展现考向一样本的数字特征考向二频率分布直方图真题考查解读近年真题对比考向一样本的数字特征考向二频率分布直方图考向三独立性检验命题规律解密名校模拟探源易错易混速记/二级结论速记考向一样本的数字特征1.(多选)(2023•新高考Ⅰ•第9题)有一组样本数据x1,x2,⋯,x6,其中x1是最小值,x6是最大值,则( )A.x2,x3,x4,x5的平均数等于x1,x2,⋯,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,⋯,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,⋯,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,⋯,x6的极差【答案】BD解:A选项,x2,x3,x4,x5的平均数不一定等于x1,x2,⋯,x6的平均数,A错误;B选项,x2,x3,x4,x5的中位数等于x3x42,x1,x2,⋯,x6的中位数等于x3x42,B正确;C选项,设样本数据x1,x2,⋯,x6为0,1,2,8,9,10,可知x1,x2,⋯,x6的平均数是5,x2,x3,x4,x5的平均数是5,x1,x2,⋯,x6的方差s12=16×[(0﹣5)2+(1﹣5)2+(2﹣5)2+(8﹣5)2+(9﹣5)2+(10﹣5)2]=50,x2,x3,x4,x5的方差s22=14×[(1﹣5)2+(2﹣5)2+(8﹣5)2+(9﹣5)2]=252,s12>s22,∴s1>s2,C错误.D选项,x6>x5,x2>x1,∴x6﹣x1>x5﹣x2,D正确.考向二频率分布直方图2.(2023•新高考Ⅱ•第19题)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性,此检测标准的漏诊率是将患病者判定为阴性的概率,记为p(c);误诊率是将未患病者判定为阳性的概率,记为q(c).假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.(1)当漏诊率p(c)=0.5%时,求临界值c和误诊率q(c);(2)设函数f(c)=p(c)+q(c).当c∈[95,105],求f(c)的解析式,并求f(c)在区间[95,105]的最小值.解:(1)当漏诊率p(c)=0.5%时,则(c﹣95)•0.002=0.5%,解得c=97.5;q(c)=0.01×2.5+5×0.002=0.035=3.5%;(2)当c∈[95,100]时,f(c)=p(c)+q(c)=(c﹣95)•0.002+(100﹣c)•0.01+5×0.002=﹣0.008c+0.82≥0.02,当c∈(100,105]时,f(c)=p(c)+q(c)=5×0.002+(c﹣100)•0.012+(105﹣c)•0.002=0.01c﹣0.98>0.02,故f(c)=−0.008c+0.82,95≤c≤100 0.01c−0.98,100<c≤105,所以f(c)的最小值为0.02.【命题意图】考查样本的数字特征、频率分布直方图、相关性、独立性检验.【考查要点】考查相关性、频率分布直方图、样本的数字特征、独立性检验、回归分析等.考查学生读取数据、分析数据、处理数据的能力.【得分要点】1.众数、中位数、平均数(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(x1+x2+⋯+x n).(3)平均数:一组数据的算术平均数,即x=1n2.频率分布直方图(1)频率分布直方图:在直角坐标系中,横轴表示样本数据,纵轴表示频率与组距的比值,将频率分布表中的各组频率的大小用相应矩形面积的大小来表示,由此画成的统计图叫做频率分布直方图.(2)频率分布直方图的特征①各长方形面积等于相应各组的频率的数值,所有小矩形面积和为1.②从频率分布直方图可以清楚地看出数据分布的总体趋势.③从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息被抹掉.(3)频率分布直方图求数据①众数:频率分布直方图中最高矩形的底边中点的横坐标.②平均数:频率分布直方图各小矩形的面积乘底边中点的横坐标之和.③中位数:把频率分布直方图分成两个面积相等部分的平行于y轴的直线横坐标.3.极差、方差与标准差(1)①用一组数据中最大数据减去最小数据的差来反映这组数据的变化范围,这个数据就叫极差.②一组数据中各数据与平均数差的平方和的平均数叫做方差.③方差的算术平方根就为标准差.(2)方差和标准差都是反映这组数据波动的大小,方差越大,数据的波动越大.4.独立性检验(1)分类变量: 如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)原理:假设性检验.一般情况下:假设分类变量X 和Y 之间没有关系,通过计算K 2值,然后查表对照相应的概率P ,发现这种假设正确的概率P 很小,从而推翻假设,最后得出X 和Y 之间有关系的可能性为(1﹣P ),也就是“X 和Y 有关系”.(表中的k 就是K 2的观测值,即k =K 2).利用随机变量2K (也可表示为2χ)2()()()()()n ad bc a b c d a c b d -=++++(其中n a b c d =+++为样本容量)来判断“两个变量有关系”的方法称为独立性检验.(3)2×2列联表:设X ,Y 为两个变量,它们的取值分别为12{}x x ,和12{}y y ,,其样本频数列联表(22⨯列联表)如下:1y 2y 总计1x a b a b +2x cd c d+总计a c+b d+a b c d+++(4)范围:K 2∈(0,+∞);性质:K 2越大,说明变量间越有关系.(5)解题步骤:①认真读题,取出相关数据,作出2×2列联表;②根据2×2列联表中的数据,计算K 2的观测值k ;③通过观测值k 与临界值k 0比较,得出事件有关的可能性大小.考查相关性、频率分布直方图、样本的数字特征、独立性检验、回归分析等.考查形式以多选题和解答题为主。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高考统计解答题聚焦搜集整理:黄开明17.(本小题满分14分)班主任为了对本班学生的考试成绩进行分析,决定从全班25名女同学,15名男同学中随机抽取一个容量为8的样本进行分析.(Ⅰ)如果按性别比例分层抽样,可以得到多少个不同的样本?(只要求写出算式即可,不必计算出结果).(Ⅱ)随机抽出8位,他们的数学分数从小到大排序是:60、65、70、75、80、85、90、95,物理分数从小到大排序是:72、77、80、84、88、90、93、95.(1)若规定85分以上(包括85分)为优秀,求这8位同学中恰有3位同学的数学和物理有线性相关性?如果具有线性相关性,求y 与x 的线性回归方程(系数精确到0.01);如果不具有线性相关性,请说明理由.参考公式:相关系数;)()())((1221∑∑==----=ni i ini i iy y x xy y x xr 回归直线的方程是:a bx y+=ˆ,其中i i ni ini i ix yx b y a x xy y x xb 是与其中ˆ;,)())((121-=---=∑∑==对应的回归估计值. 参考数据:,456)(,1050)(,85,5.7728112811≈-≈-==∑∑==i i y y x xy x.5.23550,4.21456,4.321050,688))((1811≈≈≈≈--∑=y y x xi17.解:(I )应选女生25×408=5(个),男生15×408=3(个),可以得到不同的样本个数是315525C C .……4分(II )(1)这8位同学中恰有3位同学的数学和物理分数均为优秀,则需要先从物理的4个优秀分数中选出3个与数学优秀分数对应,种数是)(343334A A C 或,然后剩下的5个数学分数和物理分数任意对应,种数是55A 。
根据乘法原理,满足条件的种数是553334A A C …………………………………………6分这8位同学的物理分数和数学分数分别对应的种数共有88A .…………7分故所求的概率.14188553334==A A A C P ………………………………10分 (2)变量y 与x 的相关系数是r =99.04.214.32688≈⨯.可以看出,物理与数学成绩是高度正相关.若以数学成绩x 为横坐标, 物理成绩y 为纵坐标做散点图如下 从散点图可以看出这些点大至分布 在一条直线附近,并且在逐步上升, 故物理与数学成绩是高度正相关. ………………………………12分设y 与x 线性回归方程y =bx +a 、 根据所给的数据,可以计算出 1050688=b =0.65,a =85-0.65×77.5=34.63, 所以y 与x 的回归方程是63.3465.0ˆ+=x y.……………………14分 19、(本小题满分12分)A 、B 两个投资项目的利润率分别为随机变量X 1和X 2。
根据市场(1)在A 、B 两个项目上各投资100万元,Y 1和Y 2分别表示投资项目A 和B 所获得的利润,求方差DY 1、DY 2;(2)将x (0≤x ≤100)万元投资A 项目,100-x 万元投资B 项目,f(x)表示投资A 项目所得利润的方差与投资B 项目所得利润的方差的和。
求f(x)的最小值,并指出x 为何值时,f(x)取到最小值。
(注:D(aX + b) = a 2DX )解:(Ⅰ)由题设可知1Y 和2Y 的分布列分别为150.8100.26EY =⨯+⨯=,221(56)0.8(106)0.24DY =-⨯+-⨯=, 220.280.5120.38EY =⨯+⨯+⨯=,2222(28)0.2(88)0.5(128)0.312DY =-⨯+-⨯+-⨯=.(Ⅱ)12100()100100x x f x D Y D Y -⎛⎫⎛⎫=+⎪ ⎪⎝⎭⎝⎭2212100100100x x DY DY -⎛⎫⎛⎫=+ ⎪ ⎪⎝⎭⎝⎭22243(100)100x x ⎡⎤=+-⎣⎦ 2224(46003100)100x x =-+⨯, 当6007524x ==⨯时,()3fx =为最小值. 19.(本小题满分12分)为了了解《中华人民共和国道路交通安全法》在学生中的普及情况,调查部门对某校6名学生进行问卷调查.6人得分情况如下: 5,6,7,8,9,10.把这6名学生的得分看成一个总体.(Ⅰ)求该总体的平均数;(Ⅱ)用简单随机抽样方法从这6名学生中抽取2名,他们的得分组成一个样本.求该样本平均数与总体平均数之差的绝对值不超过0.5的概率.19.解:(Ⅰ)总体平均数为1(5678910)7.56+++++=. ·························································································· 4分 (Ⅱ)设A 表示事件“样本平均数与总体平均数之差的绝对值不超过0.5”.从总体中抽取2个个体全部可能的基本结果有:(56),,(57),,(58),,(59),,(510),,(67),,(68),,(69),,(610),,(78),,(79),,(710),,(89),,(810),,(910),.共15个基本结果.事件A 包括的基本结果有:(59),,(510),,(68),,(69),,(610),,(78),,(79),.共有7个基本结果. 所以所求的概率为7()15P A =. ----------------------------------------------------12分19.(本小题满分10分)在某校举行的数学竞赛中,全体参赛学生的竞赛成绩近似服从正态分布(70,100)N 。
已知成绩在90分以上(含90分)的学生有12名。
(Ⅰ)、试问此次参赛学生总数约为多少人?(Ⅱ)、若该校计划奖励竞赛成绩排在前50名的学生,试问设奖的分数线约为多少分? 可共查阅的(部分)标准正态分布表00()()x P x x Φ=<点评:本小题主要考查正态分布,对独立事件的概念和标准正态分布的查阅,考查运用概率统计知识解决实际问题的能力。
解:(Ⅰ)设参赛学生的分数为ξ,因为ξ~N(70,100),由条件知,P(ξ≥90)=1-P (ξ<90)=1-F(90)=1-Φ)107090(-=1-Φ(2)=1-0.9772=0.228. 这说明成绩在90分以上(含90分)的学生人数约占全体参赛人数的2.28%,因此, 参赛总人数约为0228.012≈526(人)。
(Ⅱ)假定设奖的分数线为x 分,则 P(ξ≥x )=1-P (ξ<x )=1-F(90)=1-Φ)1070(-x =52650=0.0951, 即Φ)1070(-x =0.9049,查表得1070-x ≈1.31,解得x =83.1.故设奖得分数线约为83.1分。
17.(本小题满分12分)在生产过程中,测得纤维产品的纤度(表示纤维粗细的一种量)共有100个数据,将数据分组如右表:(I )在答题卡上完成频率分布表,并在给定的坐标 系中画出频率分布直方图;(II )估计纤度落在[1.381.50),中的概率及纤度小于 1.40的概率是多少?(III )统计方法中,同一组数据常用该组区间的中点值(例如区间[1.301.34),的中点值是1.32)作为 代表.据此,估计纤度的期望.17.本小题主要考查频率分布直方图、概率、期望等概念和用样本频率估计总体分布的统计方法,考查运用概率统计知识解决实际问题的能力. 解:(Ⅰ)样本数据(Ⅱ)纤度落在[)1.381.50,中的概率约为0.300.290.100.69++=,纤度小于1.40的概率约为10.040.250.300.442++⨯=. (Ⅲ)总体数据的期望约为1.320.04 1.360.25 1.400.30 1.440.29 1.480.10 1.520.02 1.4088⨯+⨯+⨯+⨯+⨯+⨯=.17.(本小题满分12分)某公司在过去几年内使用某种型号的灯管1000支,该公司对这些灯管的使用寿命(单位:(I )将各组的频率填入表中;(II )根据上述统计结果,计算灯管使用寿命不足1500小时的频率;(III )该公司某办公室新安装了这种型号的灯管3支,若将上述频率作为概率,试求至少有2支灯管的使用寿命不足1500小时的概率.17.本小题主要考查频率、概率、总体分布的估计、独立重复试验等基础知识,考查使用统计的有关知识解决实际问题的能力.满分12分. (I)解: (II )解:由(I )可得0.0480.1210.2080.2230.6+++=,所以灯管使用寿命不足1500小时的频率为0.6. ················································································································· 8分 (III )解:由(II )知,1支灯管使用寿命不足1500小时的概率0.6P =,根据在n 次独立重复试验中事件恰好发生k 次的概率公式可得223333(2)(3)C 0.60.40.60.648P P +=+=. 所以至少有2支灯管的使用寿命不足1500小时的概率是0.648. ···································· 12分 13..(2007北京理)(本小题共13分)某中学号召学生在今年春节期间至少参加一次社会公益活动(以下简称活动).该校合唱团共有100名学生,他们参加活动的次数统计如图所示. (I )求合唱团学生参加活动的人均次数; (II )从合唱团中任意选两名学生,求他们参加活动次数恰好相等的概率.(III )从合唱团中任选两名学生,用ξ表示这两人参加活动次数之差的绝对值,求随机变量ξ的分布列及数学期望E ξ. 3.(共13分)解:由图可知,参加活动1次、2次和3次的学生123人数分别为10、50和40.(I )该合唱团学生参加活动的人均次数为1102503402302.3100100⨯+⨯+⨯==.(II )从合唱团中任选两名学生,他们参加活动次数恰好相等的概率为222105040021004199C C C P C ++==. (III )从合唱团中任选两名学生,记“这两人中一人参加1次活动,另一人参加2次活动”为事件A ,“这两人中一人参加2次活动,另一人参加3次活动”为事件B ,“这两人中一人参加1次活动,另一人参加3次活动”为事件C .易知 (1)()()P P A P B ξ==+111110505040241001005099C C C C C C =+=;(2)()P P C ξ==1110402100899C C C ==; ξ的分布列:ξ12P41995099 899ξ的数学期望:4150820129999993E ξ=⨯+⨯+⨯=.。