最全高考数学统计专题解析版【真题】
高考数学复习专题训练—统计与概率解答题(含解析)

高考数学复习专题训练—统计与概率解答题1.(2021·广东广州二模改编)根据相关统计,2010年以后中国贫困人口规模呈逐年下降趋势,2011~2019年全国农村贫困发生率的散点图如下:注:年份代码1~9分别对应年份2011年~2019年.(1)求y 关于t 的经验回归方程(系数精确到0.01);(2)已知某贫困地区的农民人均年纯收入X (单位:万元)满足正态分布N (1.6,0.36),若该地区约有97.72%的农民人均纯收入高于该地区最低人均年纯收入标准,则该地区最低人均年纯收入标准大约为多少万元?参考数据与公式:∑i=19y i =54.2,∑i=19t i y i =183.6. 经验回归直线y ^=b ^t+a ^的斜率和截距的最小二乘估计分别为b ^=∑i=1n t i y i -nt y ∑i=1n (t i -t )2 ,a ^=y −b ^t . 若随机变量X 服从正态分布N (μ,σ2),则P (μ-σ≤X ≤μ+σ)≈0.682 7,P (μ-2σ≤X ≤μ+2σ)≈0.954 5,P (μ-3σ≤X ≤μ+3σ)≈0.997 3.2.(2021·湖北黄冈适应性考试改编)产品质量是企业的生命线.为提高产品质量,企业非常重视产品生产线的质量.某企业引进了生产同一种产品的A,B 两条生产线,为比较两条生产线的质量,从A,B 生产线生产的产品中各自随机抽取了100件产品进行检测,把产品等级结果和频数制成了如图的统计图.(1)依据小概率值α=0.025的独立性检验,分析数据,能否据此推断是否为一级品与生产线有关.(2)生产一件一级品可盈利100元,生产一件二级品可盈利50元,生产一件三级品则亏损20元,以频率估计概率.①分别估计A,B生产线生产一件产品的平均利润;②你认为哪条生产线的利润较为稳定?并说明理由.附:①参考公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.②临界值表:3.(2021·福建宁德模拟改编)某工厂为了检测一批新生产的零件是否合格,从中随机抽测100个零件的长度d(单位:mm).该样本数据分组如下:[57,58),[58,59),[59,60),[60,61),[61,62),[62,63],得到如图所示的频率分布直方图.经检测,样本中d大于61的零件有13个,长度分别为61.1,61.1,61.2,61.2,61.3,61.5,61.6,61.6,61.8,61.9,62.1,62.2,62.6.(1)求频率分布直方图中a,b,c的值及该样本的平均长度x(结果精确到1 mm,同一组数据用该区间的中点值作代表);(2)视该批次样本的频率为总体的概率,从工厂生产的这批新零件中随机选取3个,记ξ为抽取的零件长度在[59,61)的个数,求ξ的分布列和数学期望;(3)若变量X满足|P(μ-σ≤X≤μ+σ)-0.682 7|<0.03且|P(μ-2σ≤X≤μ+2σ)-0.954 5|≤0.03,则称变量X满足近似于正态分布N(μ,σ2)的概率分布.如果这批样本的长度d满足近似于正态分布N(x,12)的概率分布,则认为这批零件是合格的,将顺利出厂;否则不能出厂.请问,能否让该批零件出厂?4.(2021·山东潍坊期末)在一个系统中,每一个设备能正常工作的概率称为设备的可靠度,而系统能正常工作的概率称为系统的可靠度,为了增加系统的可靠度,人们经常使用“备用冗余设备”(即正在使用的设备出故障时才启动的设备).已知某计算机网络服务器系统采用的是“一用两备”(即一台正常设备,两台备用设备)的配置,这三台设备中,只要有一台能正常工作,计算机网络就不会断掉.设三台设备的可靠度均为r(0<r<1),它们之间相互不影响.(1)要使系统的可靠度不低于0.992,求r的最小值;(2)当r=0.9时,求能正常工作的设备数X的分布列;(3)已知某高科技产业园当前的计算机网络中每台设备的可靠度是0.7,根据以往经验可知,计算机网络断掉可能给该产业园带来约50万元的经济损失.为减少对该产业园带来的经济损失,有以下两种方案:方案1:更换部分设备的硬件,使得每台设备的可靠度维持在0.9,更新设备硬件总费用为8万元; 方案2:对系统的设备进行维护,使得设备可靠度维持在0.8,设备维护总费用为5万元.请从期望损失最小的角度判断决策部门该如何决策?答案及解析1.解 (1)t =1+2+3+4+5+6+7+8+99=5, y =12.7+10.2+8.5+7.2+5.7+4.5+3.1+1.7+0.69≈6.02, b ^=∑i=19t i y i -9t y∑i=19(t i -5)2=183.6-270.960≈-1.46,a ^=y −b ^t =6.02-(-1.46)×5=13.32.故y 关于t 的经验回归方程为y ^=-1.46t+13.32.(2)因为P (μ-2σ≤X ≤μ+2σ)≈0.954 5,所以P (X>μ-2σ)=0.954 5+1-0.954 52=0.977 25. 因为某贫困地区的农民人均年纯收入X 满足正态分布N (1.6,0.36),所以μ=1.6,σ=0.6,μ-2σ=0.4,P (X>0.4)=0.977 25,故该地区最低人均年纯收入标准大约为0.4万元.2.解 (1)根据已知数据可建立列联表如下:零假设为H 0:是否为一级品与生产线无关.χ2=n (ad -bc )2(a+b )(c+d )(a+c )(b+d )=200×(20×65-35×80)255×145×100×100≈5.643>5.024=x 0.025,依据小概率值α=0.025的独立性检验,推断H 0不成立,即认为是否为一级品与生产线有关.(2)A 生产线生产一件产品为一、二、三级品的概率分别为15,35,15.记A 生产线生产一件产品的利润为X ,则X 的取值为100,50,-20,其分布列为B生产线生产一件产品为一、二、三级品的概率分别为720,25 ,14.记B生产线生产一件产品的利润为Y,则Y的取值为100,50,-20, 其分布列为①E(X)=100×15+50×35+(-20)×15=46,E(Y)=100×720+50×25+(-20)×14=50.故A,B生产线生产一件产品的平均利润分别为46元、50元.②D(X)=(100-46)2×15+(50-46)2×35+(-20-46)2×15=1 464.D(Y)=(100-50)2×720+(50-50)2×25+(-20-50)2×14=2 100.因为D(X)<D(Y),所以A生产线的利润更为稳定.3.解(1)由题意可得P(61≤d<62)=10100=0.1,P(62≤d≤63)=3100=0.03,P(59≤d<60)=P(60≤d<61)=12(1-2×0.03-0.14-0.1)=0.35,所以a=0.031=0.03,b=0.11=0.1,c=0.351=0.35.x=(57.5+62.5)×0.03+58.5×0.14+(59.5+60.5)×0.35+61.5×0.1=59.94≈60.(2)由(1)可知从该工厂生产的新零件中随机选取1件,长度d在(59,61]的概率P=2×0.35=0.7,且随机变量ξ服从二项分布ξ~B(3,0.7),所以P(ξ=0)=C30×(1-0.7)3=0.027,P(ξ=1)=C31×0.7×(1-0.7)2=0.189,P(ξ=2)=C32×0.72×(1-0.7)=0.441,P(ξ=3)=C33×0.73=0.343,所以随机变量ξ的分布列为E(ξ)=0×0.027+1×0.189+2×0.441+3×0.343=2.1.(3)由(1)及题意可知x=60,σ=1.所以P(x-σ≤X≤x-σ)=P(59≤X≤61)=0.7.|P(x-σ≤X≤x+σ)-0.682 7|=|0.7-0.682 7|=0.017 3≤0.03,P(x-2σ≤X≤x-2σ)=P(58≤X≤62)=0.14+0.35+0.35+0.1=0.94,|P(x-2σ≤X≤x+2σ)-0.954 5|=|0.94-0.954 5|=0.014 5≤0.03.所以这批新零件的长度d满足近似于正态分布N(x,12)的概率分布.所以能让该批零件出厂.4.解(1)要使系统的可靠度不低于0.992,则P(X≥1)=1-P(X<1)=1-P(X=0)=1-(1-r)3≥0.992,解得r≥0.8,故r的最小值为0.8.(2)X为正常工作的设备数,由题意可知,X~B(3,r),P(X=0)=C30×0.90×(1-0.9)3=0.001,P(X=1)=C31×0.91×(1-0.9)2=0.027,P(X=2)=C32×0.92×(1-0.9)1=0.243,P(X=3)=C33×0.93×(1-0.9)0=0.729,从而X的分布列为(3)设方案1、方案2的总损失分别为X1,X2,采用方案1,更换部分设备的硬件,使得设备可靠度达到0.9,由(2)可知计算机网络断掉的概率为0.001,不断掉的概率为0.999,故E(X1)=80000+0.001×500 000=80 500元.采用方案2,对系统的设备进行维护,使得设备可靠度维持在0.8,由(1)可知计算机网络断掉的概率为0.008,故E(X2)=50 000+0.008×500 000=54 000元,因此,从期望损失最小的角度,决策部门应选择方案2.。
高考数学真题汇编12 统计 理 解析 试题

卜人入州八九几市潮王学校2021高考真题分类汇编:统计1.【2021高考真题理17】设443211010≤<<<≤x x x x ,5510=x ,随机变量1ξ取值54321x x x x x 、、、、的概率均为2.0,随机变量2ξ取值222221554433221x x x x x x x x x x +++++、、、、的概率也均为2.0,假设记21ξξD D 、分别为21ξξ、的方差,那么〔〕A .21ξξD D >B .21ξξD D =C .21ξξD D <D .1ξD 与2ξD 的大小关系与4321x x x x 、、、的取值有关【答案】A【解析】由题意可知21ξξE E =,又由题意可知,1ξ的波动性较大,从而有21ξξD D >.注意:此题也可利用特殊值法。
2.【2021高考真题理6】从甲乙两个城分别随机抽取16台自动售货机,对其销售额进展统计,统计数据用茎叶图表示〔如下列图〕,设甲乙两组数据的平均数分别为x 甲,x 乙,中位数分别为m 甲,m 乙,那么〔〕 A.x x <甲乙,m 甲>m 乙 B.x x <甲乙,m 甲<m 乙 C.x x >甲乙,m 甲>m 乙 D.x x >甲乙,m 甲<m 乙【答案】B.【解析】根据平均数的概念易计算出乙甲x x <,又2022218=+=甲m ,2923127=+=乙m 应选B. 3.【2021高考真题理4】采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[]1,450的人做问卷A ,编号落入区间[]451,750的人做问卷B ,其余的人做问卷C .那么抽到的人中,做问卷B 的人数为〔A 〕7〔B 〕9〔C 〕10〔D 〕15 【答案】C【解析】从960中用系统抽样抽取32人,那么每30人抽取一人,因为第一组号码为9,那么第二组为39,公差为30.所以通项为2130)1(309-=-+=n n a n ,由7502130451≤-≤n ,即302125302215≤≤n ,所以25,17,16 =n ,一共有1011625=+-人,选C. 4.【2021高考真题理9】样本〔12,,,n x x x 〕的平均数为x ,样本〔12,,m y y y 〕的平均数为()y x y ≠,假设样本〔12,,,n x x x ,12,,m y y y 〕的平均数(1)z ax a y =+-,其中102α<<,那么n,m 的大小关系为 A .nm <B .n m >C .n m =D .不能确定【答案】A【解析】由题意知样本),,,(11m n y y x x 的平均数为y nm mx n m n n m y m x n z +++=++=,又y x z )1(αα-+=,即nm mn m n +=-+=αα1,。
最全高考数学统计专题解析版【真题】doc资料(19页)

最全高考数学统计专题解析版【真题】doc资料(19页)0]的人数为A. 11A. 11B. 12C. 13D. 14WORD版))某班级有500.030WORD版))某班级有500.0300.0250CI50.0100.005o 讯甜70 80卿W2 . ( 20xx年普通高等学校招生统一考试安徽数学(理)试题(纯名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93. 下列说法一定正确的是()A ?这种抽样方法是一种分层抽样B ?这种抽样方法是一种系统抽样C.这五名男生成绩的方差大于这五名女生成绩的方差D ?该班级男生成绩的平均数小于该班女生成绩的平均数3 . ( 20xx年普通高等学校招生统一考试福建数学(理)试题(纯WORD版))某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分为6组:[40,50), [50,60),[60,70), [70,80), [80,90), [90,100)加以统计,得到如图所示的频率分布直方图,已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()588 B. 480 C. 450 D. 1204 . (20xx年高考xx卷(理))总体有编号为01,02,…,19,20的20个个体组成。
利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为7816657208026314070243699728019832049234493582003623486969387481A . 08B . 07C . 02D . 01(20xx年高考上海卷(理))盒子中装有编号为 1,2,3,4,5,6,7,8,9 的九个球,从中任意取出两个,则这两个球的编号之积为偶数的概率是(结果用最简分数表示)6.( 20xx年高考湖北卷(理))从某小区抽取100户居民进行月用电量调查,发现其用电量都在50到350度之间,频率分布直方图所示.(I)直方图中X的值为;7. ( 20xx年普通高等学校招生全国统一招生考试江苏卷(数学)(II)在这些用户中,用电量落在区间7. ( 20xx年普通高等学校招生全国统一招生考试江苏卷(数学)(已校对纯WORD版含附加题))抽样统计甲、乙两位设计运动员的5此训练成绩(单位:环),结果如下:运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为.8. (20xx年高考上海卷(理))设非零常数d是等差数列X1,X2,X3,L ,X19的公差,随机变量等可能地取值X1,X2,X3,L ,X19,则方差D9.(20xx年普通高等学校招生统一考试xx省数学(理)卷(纯 WORD版))某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,9.为个位数?第17第17题图((I )根据茎叶图计算样本均值;(n)日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间 12名工人中有几名优秀工人;(川)从该车间12名工人中,任取2人,求恰有1名优秀工人的概率?( 20xx年普通高等学校招生统一考试天津数学(理)试题(含答案))一个盒子里装有 7张卡片,其中有红色卡片4张,编号分别为1, 2, 3, 4;白色卡片3张,编号分别为2, 3,从盒子中任取4张卡片(假设取到任何一张卡片的可能性相同).(I )求取出的4张卡片中,含有编号为3的卡片的概率.(n)再取出的4张卡片中,红色卡片编号的最大值设为X求随机变量X 的分布列和数学期望?11 . (20xx年高考陕西卷(理))在一场娱乐晚会上,有5位民间歌手(1至5号)登台演唱,由现场数百名观众投票选出最受欢迎歌手?各位观众须彼此独立地在选票上选3名歌手,其中观众甲是1号歌手的歌迷,他必选1号,不选2号,另在3至5号中随机选2名.观众乙和丙对5位歌手的演唱没有偏爱,因此在1至5号中随机选3名歌手.(I )求观众甲选中3号歌手且观众乙未选中 3号歌手的概率;(n ) X表示3号歌手得到观众甲、乙、丙的票数之和,求X的分布列和数学期望.12. ( 20xx年普通高等学校招生统一考试xx数学(理)试题(含答案))某商场举行的“三色球”购物摸奖活动规定:在一次摸奖中,摸奖者先从装有 3个红球与4个白球的袋中任意摸出3个球,再从装有1个蓝球与2个白球的袋中任意摸出中红球与蓝球的个数,设一.二.三等奖如下:1个球,根据摸出4个球奖级摸出红.蓝球个数一等奖3红1蓝二等奖3红0蓝三等奖2红1蓝获奖金额200元50元10元其余情况无奖且每次摸奖最多只能获得一个奖级(1)求一次摸奖恰好摸到 1个红球的概率;(2)求摸奖者在一次摸奖中获奖金额X的分布列与期望 E X20xx年高考题【20xx 新课标文】在一组样本数据(X1, y1), (X2, y2),...,(xn, yn)(n>2, X1,X2, (x)1不全相等)的散点图中,若所有样本点(Xi, yi)(i=1,2,…,n)都在直线尸?x+1上,则这组样本数据的样本相关系数为1(A)— 1 ( B) 0 ( C)( D) 1【20xx山东文】(4)在某次测量中得到的 A样本数据如下:82, 84, 84, 86, 86 , 86,88, 88, 88, 88.若B样本数据恰好是 A样本数据都加2后所得数据,则 A, B两样本的下列数字特征对应相同的是(A)众数(B)平均数(C)中位数(D)标准差【20xx四川文】交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查。
高考数学专题统计测评含解析

第14章测评(时间:120分钟 满分:150分)一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.一个容量为20的样本,已知某组的频率为0.25,则该组的频数为( )A.2B.5C.15D.8020×0.25=5.2.某单位有职工750人,其中青年职工350人、中年职工250人、老年职工150人.为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为( ) A.7 B.15C.25D.35n,则n750=7350,解得n=15.3.有一个容量为66的样本,数据的分组及各组的频数如下: [11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9[23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12[35.5,39.5) 7 [39.5,43.5) 3则总体中大于或等于31.5的数据约占( )A.211B.13C.12D.2366,而落在[31.5,43.5)内的样本数为12+7+3=22,故总体中大于或等于31.5的数据约占2266=13.4.甲组数据为5,12,16,21,25,37,乙组数据为1,6,14,18,38,39,则甲、乙的平均数、极差及中位数相同的是( )A.极差B.平均数C.中位数D.都不相同,可知极差不同,甲的中位数为16+212=18.5,乙的中位数为14+182=16,x 甲=5+16+12+25+21+376=583,x 乙=1+6+14+18+38+396=583,所以甲、乙的平均数相同.故选B.5.下表记录了某地区一年之内的月平均降水量.月份123456789101112月平均降水量/cm5.84.85.34.65.65.65.17.15.65.36.46.625百分位数为( )A.5.1B.5.2C.5.3D.5.64.6,4.8,5.1,5.3,5.3,5.6,5.6,5.6,5.8,6.4,6.6,7.1,因为12×25%=3,所以25百分位数为5.1+5.32=5.2,故选B.6.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率直方图如图所示.由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a ,最大频率为0.32,则a 的值为( )A.64B.54C.48D.27100×(0.05+0.11)=16.因为后五组频数和为62,所以前三组频数和为38.所以第三组频数为38-16=22.又最大频率为0.32,故第四组频数为0.32×100=32.所以a=22+32=54.故选B.7.记样本x 1,x 2,…,x m 的平均数为x ,样本y 1,y 2,…,y n 的平均数为y (x ≠y ).若样本x 1,x 2,…,x m ,y 1,y 2,…,y n 的平均数为z =14x +34y ,则m n 的值为( )A.3B.4C.14D.13x 1+x 2+…+x m =m x ,y 1+y 2+…+y n =n y ,z =(x 1+x 2+…+x m )+(y 1+y 2+…+y n )m +n =mx +ny m +n =mx m +n +ny m +n =14x +34y .所以m m +n =14,n m +n =34,可得3m=n ,所以m n =13.8.从某项综合能力测试中抽取了100人的成绩,统计如下表所示,则这100人成绩的标准差为( )分数54321人数2010303010A.3B.2105C.3D.85∵x =5×20+4×10+3×30+2×30+1×10100=3,∴s 2=1100×(20×22+10×12+30×12+10×22)=160100=85,∴s=2105.二、选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.9.下列说法正确的是( )A.在统计里,最常用的简单随机抽样方法有抽签法和随机数表法B.一组数据的平均数一定小于这组数据中的每个数据C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D.一组数据的方差越大,说明这组数据的波动越大,不小于最小值,B 项错误,其余全对.10.如图①为某省2020年1~4月份快递业务量统计图,图②为该省2020年1~4月份快递业务收入统计图,对统计图理解正确的是( )①②A.2020年1~4月份快递业务量3月份最高,2月份最低,差值接近2 000万件B.2020年1~4月份快递业务量同比增长率均超过50%,在3月份最高,和春节蛰伏后网购迎来喷涨有关C.从两图中看,业务量与业务收入变化高度一致D.从1~4月份来看,业务量与业务收入有波动,但整体保持高速增长①可知快递业务量3月份为4 397万件,2月份为2 411万件,差值为4 397-2 411=1 986(万件),故A正确;由图①可知B也正确;对于C,由两图易知业务量从高到低变化排序是3月,4月,1月,2月,业务收入从高到低变化排序是3月,4月,1月,2月,保持高度一致,所以C正确;对于D,由图知业务收入2月比1月减少,4月比3月减少,整体不具备高速增长之说,所以D不正确.11.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”,根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A.甲地:总体平均数为3,中位数为4B.乙地:中位数为2,众数为3C.丙地:极差为3,80百分位数为4D.丁地:总体平均数为2,总体方差为37人,故A不正确;乙地中位数为2,众数为3,可以有一天的感染人数为8,故B不正确;C中数据的最大可能取值为7,故C正确;当总体平均数是2,若有一个数据超过7,则s2>110(8-2)2=3.6,则方差就超过3,所以总体平均数是2,总体方差为3时,没有数据超过7,故D正确.12.如图是某公司2020年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是( )A.2020年3月的销售任务是400台B.2020年月销售任务的平均值不超过600台C.2020年第一季度总销量为900台D.2020年月销量最大的是6月份3月份的销售任务是400台,所以A正确;由题图得2020年月销售任务超过600台的只有3个月,则平均值不超过600台,所以B正确;由题图得第一季度的总销量为300×50%+200×100%+400×120%=830(台),故C不正确;由题图得销量最大的月份是5月份,为800台,故D不正确.三、填空题:本题共4小题,每小题5分,共20分.13.某网站针对“是否支持某节目上春晚”对网民进行调查,得到如下数据:网民态度支持反对无所谓人数(单位:人)8000600010 000若采用分层抽样的方法从中抽取48人进行座谈,则持“支持”态度的网民抽取的人数为 .每个个体被抽到的概率等于488000+6000+10000=1500,∴1500×8 000=16.14.下列调查的样本不合理的是 .①在校内发出一千张印有全校各班级的选票,要求被调查学生在其中一个班级旁画“√”,以了解最受欢迎的教师是谁;②从一万多名工人中,经过选举,确定100名代表,然后投票表决,了解工人们对厂长的信任情况;③到老年公寓进行调查,了解全市老年人的健康状况;④为了了解全班同学每天的睡眠时间,在每个小组中各选取3名学生进行调查.在班级旁画“√”,与了解最受欢迎的教师没关系,故调查的样本不合理;②样本合理,属于合理的调查;③样本不合理,老年公寓中的老年人不能代表全市老年人,故样本缺少代表性;④在每个小组中各选取3名学生进行调查,属于合理调查.故调查的样本不合理的是①③.15.如图是样本容量为200的频率直方图.根据样本的频率直方图估计,样本数据落在[6,14)内的频数为 ,数据落在[2,14)内的频率约为 . 0.76样本数据落在[6,14)内的频率=0.08×4+0.09×4=0.68,且样本容量为200,∴样本数据落在[6,14)内的频数=0.68×200=136;∵数据落在[2,14)内的频率=(0.02+0.08+0.09)×4=0.76.16.某市2020年各月平均房价同比(与上一年同月比较)和环比(与相邻上月比较)涨幅情况如图所示,根据此图考虑该市2020年各月平均房价:①同比2019年有涨有跌;②同比涨幅3月份最大,12月份最小;③1月份最高;④5月比9月高.其中正确结论的编号为 .2020年各月平均房价同比(与上一年同月比较)和环比(与相邻上月比较)涨幅情况折线图,知该市2020年各月平均房价:①同比2019年一直在涨,故①错误;②同比涨幅3月份最大,12月份最小,故②正确;③因为1至4月房价一直在涨,所以1月份最高错误,故③错误;④因为5月至9月房价一直在涨,所以5月比9月低,故④错误.四、解答题:本题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤.17.(10分)已知数据x 1,x 2,…,x 10的平均数x =20,方差s 2=0.015.求:(1)3x 1,3x 2,…,3x 10的平均数和方差;(2)4x 1-2,4x 2-2,…,4x 10-2的平均数和方差.设3x 1,3x 2,…,3x 10的平均数为x ',方差为s'2,x '=110(3x 1+3x 2+…+3x 10)=310(x 1+x 2+…+x 10)=3x =3×20=60;s'2=110[(3x 1-3x )2+(3x 2-3x )2+…+(3x 10-3x )2]=910[(x 1-x )2+(x 2-x )2+…+(x 10-x )2]=9s 2=9×0.015=0.135.(2)设4x 1-2,4x 2-2,…,4x 10-2的平均数是x ″,方差为s ″2,∵x =110(x 1+x 2+…+x 10)=20,∴x ″=110(4x 1-2+4x 2-2+…+4x 10-2)=110(4x 1+4x 2+…+4x 10-20)=410(x 1+x 2+…+x 10)-2=4x -2=4×20-2=78.∵s 2=110[(x 1-x )2+(x 2-x )2+…+(x 10-x )2]=0.015,s ″2=110[(4x 1-2-4x +2)2+(4x 2-2-4x +2)2+…+(4x 10-2-4x +2)2]=1610[(x 1-x )2+(x 2-x )2+…+(x 10-x )2]=16×0.015=0.24.故4x 1-2,4x 2-2,…,4x 10-2的平均数和方差分别是78和0.24.18.(12分)随着“互联网+交通”模式的迅猛发展,“共享助力单车”在很多城市相继出现.某“共享助力单车”运营公司为了解某地区用户对该公司所提供的服务的满意度,随机调查了100名用户,得到用户的满意度评分,现将评分分为5组,如表:组别一二三四五满意度评分[0,2)[2,4)[4,6)[6,8)[8,10]频数510a 3216频率0.05b 0.37c.16(1)求表格中的a ,b ,c 的值;(2)估计用户的满意度评分的平均数;(3)若从这100名用户中随机抽取25人,估计满意度评分低于6分的人数为多少?由频数分布表得50.05=10b =a 0.37=32c ,解得a=37,b=0.1,c=0.32.(2)估计用户的满意度评分的平均数为1×0.05+3×0.1+5×0.37+7×0.32+9×0.16=5.88.(3)从这100名用户中随机抽取25人,估计满意度评分低于6分的人数为25×(0.05+0.1+0.37)=13.19.(12分)下表给出了某学校120名12岁男生的身高统计分组与频数(单位:cm).区间[122,126)[126,130)[130,134)[134,138)[138,142)[142,146)[146,150)[150,154)[154,158]人数58102233201165(1)列出样本的频率分布表;(2)画出频率直方图;(3)试估计身高小于134 cm的数据约占多少百分比(精确到1%).样本的频率分布表如下:区间[122,126)[126,130)[130,134)[134,138)[138,142)[142,146)[146,150)[150,154)[154,158]频数58102233201165频率124115112116011401611120120124(2)频率直方图如下:(3)根据样本的频率分布表估计身高小于134 cm的人数占总人数的23120×100%≈19%.20.(12分)现有A,B两个班级,每个班级各有45名学生参加测验,参加的每名学生可获得0分,1分,2分,3分,4分,5分,6分,7分,8分,9分这几种不同分值中的一种,A班的测试结果如下表所示:分数/分0123456789人数/名1357686432B班的成绩如图所示.(1)你认为哪个班级的成绩比较稳定?(2)若两班共有60人及格,则参加者最少获得多少分才可能及格.由表格得,A班的平均成绩=(1×3+2×5+3×7+4×6+5×8+6×6+7×4+8×3+9×2)÷45≈4.53(分),由图得,B班的平均成绩为(1×3+2×3+3×8+4×18+5×10+6×3)÷45≈3.84(分),∴A班的平均成绩高;又A班的成绩0~9分都有,B班成绩在1~6分之间,即A班分数更分散,B班分数更集中,∴A班的方差较大,∴B班的成绩比较稳定.(2)若两个班合计共有60人及格,即有30人不及格,从两表中可得出,3分(含3分)以下的有1+3+5+7+3+3+8=30(人),即参加者最少获4分才可以及格.21.(12分)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面统计图:记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数.(1)若n=19,求y与x的函数解析式;(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?当x≤19时,y=3 800;当x>19时,y=3 800+500(x-19)=500x-5 700.所以y与x的函数解析式为y=3800,x≤19,500x-5700,x>19(x∈N).(2)由统计图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购买易损零件上所需费用的平均数为1100×(3 800×70+4 300×20+4 800×10)=4 000,若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损零件上所需费用的平均数为1100×(4 000×90+4 500×10)=4 050.比较两个平均数可知,购买1台机器的同时应购买19个易损零件.22.(12分)某工厂有工人1 000名,其中250名工人参加过短期培训(称为A 类工人),另外750名工人参加过长期培训(称为B 类工人).现用分层抽样方法(按A 类、B 类分两层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(生产能力指一天加工的零件数).(1)A 类工人中和B 类工人中各抽查多少工人?(2)从A 类工人中的抽查结果和从B 类工人中的抽查结果分别如表1和表2.表1生产能力分组[100,110)[110,120)[120,130)[130,140)[140,150]人数48x 53表2生产能力分组[110,120)[120,130)[130,140)[140,150]人数6y 3618①先确定x ,y ,再补全频率直方图(如图).就生产能力而言,A 类工人中个体间的差异程度与B 类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)②分别估计A 类工人和B 类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).A 类工人生产能力的频率直方图B 类工人生产能力的频率直方图类工人中和B 类工人中分别抽查25名和75名.(2)①由4+8+x+5+3=25,得x=5.由6+y+36+18=75,得y=15.频率直方图如图:A 类工人生产能力的频率直方图B 类工人生产能力的频率直方图从图可以判断,B 类工人中个体间的差异程度更小.②x A =425×105+825×115+525×125+525×135+325×145=123,x B =675×115+1575×125+3675×135+1875×145=133.8,x =25100×123+75100×133.8=131.1.A类工人生产能力的平均数、B类工人生产能力的平均数以及全厂工人生产能力的平均数的估计值分别为123,133.8和131.1.。
高考真题与模拟训练 专题26 计数原理与概率统计(解析版)

专题26 计数原理与概率统计第一部分 真题分类1.(2021·天津高考真题)甲、乙两人在每次猜谜活动中各猜一个谜语,若一方猜对且另一方猜错,则猜对的一方获胜,否则本次平局,已知每次活动中,甲、乙猜对的概率分别为56和15,且每次活动中甲、乙猜对与否互不影响,各次活动也互不影响,则一次活动中,甲获胜的概率为____________,3次活动中,甲至少获胜2次的概率为______________. 【答案】23 2027【解析】由题可得一次活动中,甲获胜的概率为564253⨯=;则在3次活动中,甲至少获胜2次的概率为23232122033327C ⎛⎫⎛⎫⨯⨯+= ⎪ ⎪⎝⎭⎝⎭.故答案为:23;2027.2.(2021·江苏高考真题)下图是某项工程的网络图(单位:天),则从开始节点①到终止节点⑧的路径共有( )A .14条B .12条C .9条D .7条【答案】B【解析】由图可知,由①→④有3条路径,由④→⑥有2条路径,由⑥→⑧有2条路径,根据分步乘法计算原理可得从①→⑧共有32212⨯⨯=条路径. 故选:B3.(2021·江苏高考真题)已知()12nx -的展开式中2x 的系数为40,则n 等于( ) A .5 B .6 C .7 D .8【答案】A【解析】()()222221n C x n n x -=-,所以()21405n n n -=⇒=.故选:A.4.(2021·天津高考真题)从某网络平台推荐的影视作品中抽取400部,统计其评分分数据,将所得400个评分数据分为8组:[)66,70、[)70,74、、[]94,98,并整理得到如下的费率分布直方图,则评分在区间[)82,86内的影视作品数量是( )A .20B .40C .64D .80【答案】D【解析】由频率分布直方图可知,评分在区间[)82,86内的影视作品数量为4000.05480⨯⨯=. 故选:D.5.(2020·天津高考真题)从一批零件中抽取80个,测量其直径(单位:mm ),将所得数据分为9组:[)[)[)[]5.31,5.33,5.33,5.35,,5.45,5.47,5.47,5.49,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )A .10B .18C .20D .36【答案】B【解析】根据直方图,直径落在区间[)5.43,5.47之间的零件频率为:()6.25 5.000.020.225+⨯=, 则区间[)5.43,5.47内零件的个数为:800.22518⨯=. 故选:B.6.(2020·北京高考真题)在5(2)x 的展开式中,2x 的系数为( ). A .5- B .5C .10-D .10【答案】C 【解析】)52x 展开式的通项公式为:()()55215522r rrrr r r T Cx C x--+=-=-,令522r -=可得:1r =,则2x 的系数为:()()11522510C -=-⨯=-.故选:C.7.(2020·海南高考真题)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是A .这11天复工指数和复产指数均逐日增加;B .这11天期间,复产指数增量大于复工指数的增量;C .第3天至第11天复工复产指数均超过80%;D .第9天至第11天复产指数增量大于复工指数的增量; 【答案】CD【解析】由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,第10天到第11复工指数减少,第8天到第9天复产指数减少,故A 错误;由图可知,第一天的复产指标与复工指标的差大于第11天的复产指标与复工指标的差,所以这11天期间,复产指数增量小于复工指数的增量,故B 错误;由图可知,第3天至第11天复工复产指数均超过80%,故C 正确;由图可知,第9天至第11天复产指数增量大于复工指数的增量,故D 正确;8.(2021·江苏高考真题)已知关于x 的二次函数()24f x ax bx a =-+.(1)若{}1,1,2,3a ∈-,{}0,1,2b ∈,求事件(){A f x =在[)1,+∞上是增函数}的概率; (2)若[]1,2a ∈,[]0,2b ∈,求事件B =“方程()0f x =没有实数根”的概率. 【答案】(1)512;(2)38.【解析】(1)根据题意有:0a >,且对称轴21bx a=. 基本事件总数为114312C C ⋅=,满足事件A 的事件数为(1,0),(2,0),(2,1),(3,0),(3,1)共有5个,P ∴(A )512=; (2)方程240ax bx a -+=无实根,则22(4)40a b a ≠⎧⎨--<⎩,∴22040a ab ≠⎧⎨->⎩, 又[1a ∈,2],[0b ∈,2],20a b ∴->, 如图,∴11(1)1322()28P B +⨯==.9.(2021·全国高考真题)一种微生物群体可以经过自身繁殖不断生存下来,设一个这种微生物为第0代,经过一次繁殖后为第1代,再经过一次繁殖后为第2代……,该微生物每代繁殖的个数是相互独立的且有相同的分布列,设X 表示1个微生物个体繁殖下一代的个数,()(0,1,2,3)i P X i p i ===. (1)已知01230.4,0.3,0.2,0.1p p p p ====,求()E X ;(2)设p 表示该种微生物经过多代繁殖后临近灭绝的概率,p 是关于x 的方程:230123p p x p x p x x+++=的一个最小正实根,求证:当()1E X ≤时,1p =,当()1E X >时,1p <; (3)根据你的理解说明(2)问结论的实际含义. 【答案】(1)1;(2)见解析;(3)见解析. 【解析】(1)()00.410.320.230.11E X =⨯+⨯+⨯+⨯=.(2)设()()3232101f x p x p x p x p =++-+,因为32101p p p p +++=,故()()32322030f x p x p x p p p x p =+-+++,若()1E X ≤,则123231p p p ++≤,故2302p p p +≤.()()23220332f x p x p x p p p '=+-++,因为()()20300f p p p '=-++<,()230120f p p p '=+-≤, 故()f x '有两个不同零点12,x x ,且1201x x <<≤,且()()12,,x x x ∈-∞⋃+∞时,()0f x '>;()12,x x x ∈时,()0f x '<; 故()f x 在()1,x -∞,()2,x +∞上为增函数,在()12,x x 上为减函数, 若21x =,因为()f x 在()2,x +∞为增函数且()10f =,而当()20,x x ∈时,因为()f x 在()12,x x 上为减函数,故()()()210f x f x f >==,故1为230123p p x p x p x x +++=的一个最小正实根,若21>x ,因为()10f =且在()20,x 上为减函数,故1为230123p p x p x p x x +++=的一个最小正实根,综上,若()1E X ≤,则1p =.若()1E X >,则123231p p p ++>,故2302p p p +>. 此时()()20300f p p p '=-++<,()230120f p p p '=+->, 故()f x '有两个不同零点34,x x ,且3401x x <<<, 且()()34,,x x x ∈-∞+∞时,()0f x '>;()34,x x x ∈时,()0f x '<;故()f x 在()3,x -∞,()4,x +∞上为增函数,在()34,x x 上为减函数, 而()10f =,故()40f x <,又()000f p =>,故()f x 在()40,x 存在一个零点p ,且1p <.所以p 为230123p p x p x p x x +++=的一个最小正实根,此时1p <,故当()1E X >时,1p <.(3)意义:每一个该种微生物繁殖后代的平均数不超过1,则若干代必然灭绝,若繁殖后代的平均数超过1,则若干代后被灭绝的概率小于1.10.(2020·海南高考真题)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和2SO 浓度(单位:3μg/m ),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150”的概率; (2)根据所给数据,完成下面的22⨯列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与2SO 浓度有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,【答案】(1)0.64;(2)答案见解析;(3)有.【解析】(1)由表格可知,该市100天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的天数有32618864+++=天,所以该市一天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的概率为640.64100=; (2)由所给数据,可得22⨯列联表为:2SO2.5PM[]0,150(]150,475合计[]0,7564 16 80 (]75,11510 10 20 合计7426100222()100(64101610)()()()()80207426n ad bc K a b c d a c b d -⨯⨯-⨯==++++⨯⨯⨯36007.4844 6.635481=≈>,因为根据临界值表可知,有99%的把握认为该市一天空气中 2.5PM 浓度与2SO 浓度有关.第二部分 模拟训练1.三国时代吴国数学家赵爽所注《周髀算经》中给出了勾股定理的绝妙证明,下面是赵爽的弦图及注文,弦图是一个以勾股形之弦为边的正方形,其面积称为弦实,图中包含四个全等的勾股形及一个小正方形,分别涂成红(朱)色及黄色,其面积称为朱实、黄实,利用2⨯勾⨯股+(股-勾)2=4⨯朱实+黄实=弦实,化简,得勾2+股2=弦2,设勾股中勾股比为1:3,若向弦图内随机抛掷1000颗图钉(大小忽略不计),则落在红(朱)色图形内的图钉数大约为()(参考数据:2 1.414,3 1.732≈≈)A.866 B.500 C.300 D.134【答案】A【解析】不妨设勾长13则朱色面积为1314232⨯=22132,面积为224=,所以落在红(朱)色图形内的图钉数大约为2310005003500 1.732866=≈⨯=.故选:A2.琵琶、二胡、编钟、箫、笛、瑟、琴、埙、笙和鼓这十种民族乐器被称为“中国古代十大乐器”.为弘扬中国传统文化,某校以这十种乐器为题材,在周末学生兴趣活动中开展了“中国古代乐器”知识讲座,共连续安排四节课,一节课只讲一种乐器,一种乐器最多安排一节课,则琵琶、二胡一定安排,且这两种乐器互不相邻的概率为()A.1360B.16C.115D.715【答案】C【解析】由题意得:10种乐器种任选4种,故总的可能性有410A种,琵琶、二胡一定安排且不相邻的可能性有2283A A种,所以两种乐器互不相邻的概率2283410115A APA==.故选:C3.造纸术、印刷术、指南针、火药被称为中国古代四大发明,这四种发明对中国古代的政治、经济、文化的发展产生了巨大的推动作用;2017年5月,来自“一带一路”沿线的20国青年评选出了“中国的新四大发明”:高铁、扫码支付、共享单车和网购.若从这8个发明中任取两个发明,则两个都是新四大发明的概率为( ) A .114B .17C .314D .14【答案】C【解析】从8个发明中任取两个发明共有28C 28=种, 两个都是新四大发明的有24C 6=种, ∴所求概率为632814P ==, 故选:C4.蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x (每分钟鸣叫的次数)与气温y (单位:℃)存在着较强的线性相关关系.某地观测人员根据下表的观测数据,建立了y 关于x 的线性回归方程ˆ0.25yx k =+ x (次数/分钟)2030405060y (℃) 25 27.5 29 32.5 36则当蟋蟀每分钟鸣叫60次时,该地当时的气温预报值为( ) A .33℃ B .34℃C .35℃D .35.5℃【答案】C【解析】由题意,得40x=,30y =,则0.25300.254020k y x =-=-⨯=;当60x =时,35y =. 故选:C.5.将一线段AB 分为两线段AC ,CB ,使得其中较长的一段AC 是全长AB 与另一段CB 的比例中项,即满足AC AB =BC AC =512-≈0.618,后人把这个数称为黄金分割,把点C 称为线段AB 的黄金分割点.图中在ABC 中,若点P ,Q 为线段BC 的两个黄金分割点,在ABC 内任取一点M ,则点M 落在APQ 内的概率为( )A .512B 5-2C .514-D .522-【答案】B【解析】由几何概型公式知,所求概率为515112252 APQABCBC BCS PQ BQ BPS BC BC BC⎛⎫----⎪-⎝⎭====-.故选:B.6.在新冠疫情的持续影响下,全国各地电影院等密闭式文娱场所停业近半年,电影行业面临巨大损失.2011~2020年上半年的票房走势如下图所示,则下列说法正确的是()A.自2011年以来,每年上半年的票房收入逐年增加B.自2011年以来,每年上半年的票房收入增速为负的有5年C.2018年上半年的票房收入增速最大D.2020年上半年的票房收入增速最小【答案】D【解析】由图易知自2011年以来,每年上半年的票房收入相比前一年有增有减,增速为负的有3年,故A,B错误;2017年上半年的票房收入增速最大,故C错误;2020年上半年的票房收入增速最小,故D正确.故选:D7.某士特产超市为预估2021年元旦期间游客购买土特产的情况,对2020年元且期间的90位游客购买情况进行统计,得到如下人数分布表.购买金额(元)[0,15)[15,30)[30,45)[45,60)[60,75)[75,90)人数10 15 20 15 20 1060元与性别有关.不小于60元小于60元合计(23次,每次中奖概率为P (每次抽奖互不影响,且P 的值等于人数分布表中购买金额不少于60元的频率),中奖1次减5元,中奖2次减10元,中奖3次减15元若游客甲计划购买80元的土特产,请列出实际付款数X (元)的分布列并求其数学期望. 参考公式及数据:22()()()()()n ad bc K a b c d a c b d -=++++,n a b c d =+++附表:【答案】(1)列联表见解析,有95%的把握认为购买金额是否少于60元与性别有关;(2)分布列见解析,75EX =.【解析】(1)22⨯列联表如下:2290(12204018)1440 5.830 3.84130605238247K ⨯⨯-⨯==≈>⨯⨯⨯,因此有95%的把握认为购买金额是否少于60元与性别有关. (2)X 可能取值为65,70,75,80,且10201903p +==. 由题意知:33311(65)327P X C ⎛⎫=== ⎪⎝⎭,223122(70)339P X C ⎛⎫==⨯= ⎪⎝⎭,213124(75)339P X C ⎛⎫==⨯⨯= ⎪⎝⎭,30328(80)327P X C ⎛⎫=== ⎪⎝⎭, 所以X 的分布列为1246570758075279927EX =⨯+⨯+⨯+⨯=. 8.一年一度的剁手狂欢节——“双十一”,使千万女性朋友们非常纠结.2020年双十一,淘宝点燃火炬瓜分2.5个亿,淘宝、京东、天猫等各大电商平台从10月20号就开始预订,进行了强大的销售攻势.天猫某知名服装经营店,在10月21号到10月27号一周内,每天销售预定服装的件数x (百件)与获得的纯利润y (单位:百元)之间的一组数据关系如下表:(1)若y 与x (2)试求y 与x 的线性回归方程;(3)该服装经营店打算11月2号结束双十一预定活动,预计在结束活动之前,每天销售服装的件数x (百件)与获得的纯利润y (单位:百元)之间的关系仍然服从(1)中的线性关系,若结束当天能销售服装14百件,估计这一天获得的纯利润与前一周的平均利润相差多少百元?(有关计算精确到小数点后两位)参考公式与数据:ˆˆˆybx a =+,()()()121ˆniii nii x x y y b x x ==--=-∑∑,ˆˆay bx =-.713487i ii x y==∑.【答案】(1)y 与x 是正相关;(2)ˆ 4.7551.36yx =+;(3)结束当天获得的纯利润比前一周的平均利润多38.00百元.【解析】解:(1)由题目中的数据表格可以看出,y 随着x 的增大而增大, ∴判断出y 与x 是正相关; (2)由题设知,721280ii x==∑,345678967x ++++++==,6669738189909155977y ++++++==,∴5593487761337ˆ 4.7528073628b -⨯⨯===-⨯, 则559ˆ6 4.7551.367a=-⨯≈, ∴线性回归直线方程为ˆ 4.7551.36yx =+; (3)由(1)知,当14x =时, 4.751451.361ˆ17.86y=⨯+=(百元), ∴11月2号这天估计可获得的纯利润大约为117.86百元; 由(1)知,前一周的平均利润为55979.867y =≈(百元), 故结束当天获得的纯利润比前一周的平均利润多38.00百元.。
概率与统计(选择、填空题)(理科专用)(解析版)-五年(18-22)高考数学真题分项汇编(全国通用)

专题15概率与统计(选择题、填空题)(理科专用)1.【2022年全国乙卷】某棋手与甲、乙、丙三位棋手各比赛一盘,各盘比赛结果相互独立.已知该棋手与甲、乙、丙比赛获胜的概率分别为1,2,3,且3>2>1>0.记该棋手连胜两盘的概率为p,则()A.p与该棋手和甲、乙、丙的比赛次序无关B.该棋手在第二盘与甲比赛,p最大C.该棋手在第二盘与乙比赛,p最大D.该棋手在第二盘与丙比赛,p最大【答案】D【解析】【分析】该棋手连胜两盘,则第二盘为必胜盘.分别求得该棋手在第二盘与甲比赛且连胜两盘的概率;该棋手在第二盘与乙比赛且连胜两盘的概率乙;该棋手在第二盘与丙比赛且连胜两盘甲的概率丙.并对三者进行比较即可解决【详解】该棋手连胜两盘,则第二盘为必胜盘,记该棋手在第二盘与甲比赛,且连胜两盘的概率为甲则甲=2(1−2)13+221(1−3)=21(2+3)−4123记该棋手在第二盘与乙比赛,且连胜两盘的概率为乙则乙=2(1−1)23+212(1−3)=22(1+3)−4123记该棋手在第二盘与丙比赛,且连胜两盘的概率为丙则丙=2(1−1)32+213(1−2)=23(1+2)−4123则甲−乙=21(2+3)−4123−22(1+3)−4123=21−23<0乙−丙=22(1+3)−4123−23(1+2)−4123=22−31<0即甲<乙,乙<丙,则该棋手在第二盘与丙比赛,最大.选项D判断正确;选项BC判断错误;与该棋手与甲、乙、丙的比赛次序有关.选项A判断错误.故选:D2.【2022年新高考1卷】从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为()A.16B.13C.12D.23【答案】D【解析】【分析】由古典概型概率公式结合组合、列举法即可得解.【详解】从2至8的7个整数中随机取2个不同的数,共有C 72=21种不同的取法,若两数不互质,不同的取法有:(2,4),(2,6),(2,8),(3,6),(4,6),(4,8),(6,8),共7种,故所求概率=21−721=23.故选:D.3.【2021年甲卷理科】已知12,F F 是双曲线C 的两个焦点,P 为C 上一点,且121260,3F PF PF PF ∠=︒=,则C 的离心率为()A 72B .132C D 【答案】A 【解析】【分析】根据双曲线的定义及条件,表示出12,PF PF ,结合余弦定理可得答案.【详解】因为213PF PF =,由双曲线的定义可得12222PF PF PF a -==,所以2PF a =,13PF a =;因为1260F PF ∠=︒,由余弦定理可得2224923cos60c a a a a =+-⨯⋅⋅︒,整理可得2247c a =,所以22274a c e ==,即2e =.故选:A 【点睛】关键点睛:双曲线的定义是入手点,利用余弦定理建立,a c 间的等量关系是求解的关键.4.【2021年甲卷理科】将4个1和2个0随机排成一行,则2个0不相邻的概率为()A .13B .25C .23D .45【答案】C 【解析】【分析】采用插空法,4个1产生5个空,分2个0相邻和2个0不相邻进行求解.【详解】将4个1和2个0随机排成一行,可利用插空法,4个1产生5个空,若2个0相邻,则有155C =种排法,若2个0不相邻,则有2510C =种排法,所以2个0不相邻的概率为1025103=+.故选:C.5.【2021年乙卷理科】在区间(0,1)与(1,2)中各随机取1个数,则两数之和大于74的概率为()A .79B .2332C .932D .29【答案】B 【解析】【分析】设从区间()()0,1,1,2中随机取出的数分别为,x y ,则实验的所有结果构成区域为(){},01,12x y x y Ω=<<<<,设事件A 表示两数之和大于74,则构成的区域为()7,01,12,4A x y x y x y ⎧⎫=<<<+⎨⎬⎩⎭,分别求出,A Ω对应的区域面积,根据几何概型的的概率公式即可解出.【详解】如图所示:设从区间()()0,1,1,2中随机取出的数分别为,x y ,则实验的所有结果构成区域为(){},01,12x y x y Ω=<<<<,其面积为111SΩ=⨯=.设事件A 表示两数之和大于74,则构成的区域为()7,01,12,4A x y x y x y ⎧⎫=<<<+⎨⎬⎩⎭,即图中的阴影部分,其面积为13323124432A S =-⨯⨯=,所以()2332A S P A S Ω==.故选:B.【点睛】本题主要考查利用线性规划解决几何概型中的面积问题,解题关键是准确求出事件,A Ω对应的区域面积,即可顺利解出.6.【2021年新高考1卷】有6个相同的球,分别标有数字1,2,3,4,5,6,从中有放回的随机取两次,每次取1个球,甲表示事件“第一次取出的球的数字是1”,乙表示事件“第二次取出的球的数字是2”,丙表示事件“两次取出的球的数字之和是8”,丁表示事件“两次取出的球的数字之和是7”,则()A .甲与丙相互独立B .甲与丁相互独立C .乙与丙相互独立D .丙与丁相互独立【答案】B 【解析】【分析】根据独立事件概率关系逐一判断【详解】11561()()()()6636366P P P P =====甲,乙,丙丁,1()0()()()()()36P P P P P P =≠==甲丙甲丙,甲丁甲丁,1()()()()0()()36P P P P P P =≠=≠乙丙乙丙,丙丁丁丙,故选:B 【点睛】判断事件,A B 是否独立,先计算对应概率,再判断()()()P A P B P AB =是否成立7.【2021年新高考2卷】某物理量的测量结果服从正态分布()210,N σ,下列结论中不正确的是()A .σ越小,该物理量在一次测量中在(9.9,10.1)的概率越大B .该物理量在一次测量中大于10的概率为0.5C .该物理量在一次测量中小于9.99与大于10.01的概率相等D .该物理量在一次测量中落在(9.9,10.2)与落在(10,10.3)的概率相等【答案】D 【解析】【分析】由正态分布密度曲线的特征逐项判断即可得解.【详解】对于A ,2σ为数据的方差,所以σ越小,数据在10μ=附近越集中,所以测量结果落在()9.9,10.1内的概率越大,故A 正确;对于B ,由正态分布密度曲线的对称性可知该物理量一次测量大于10的概率为0.5,故B正确;对于C ,由正态分布密度曲线的对称性可知该物理量一次测量结果大于10.01的概率与小于9.99的概率相等,故C 正确;对于D ,因为该物理量一次测量结果落在()9.9,10.0的概率与落在()10.2,10.3的概率不同,所以一次测量结果落在()9.9,10.2的概率与落在()10,10.3的概率不同,故D 错误.故选:D.8.【2020年新课标1卷理科】某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i = 得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是()A .y a bx =+B .2y a bx =+C .e x y a b =+D .ln y a b x=+【答案】D 【解析】【分析】根据散点图的分布可选择合适的函数模型.【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近,因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+.故选:D.【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.9.【2020年新课标2卷理科】在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05,志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者()A .10名B .18名C .24名D .32名【答案】B 【解析】【分析】算出第二天订单数,除以志愿者每天能完成的订单配货数即可.【详解】由题意,第二天新增订单数为50016001200900+-=,9001850=,故至少需要志愿者18名.故选:B 【点晴】本题主要考查函数模型的简单应用,属于基础题.10.【2020年新课标3卷理科】在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p ,且411i i p ==∑,则下面四种情形中,对应样本的标准差最大的一组是()A .14230.1,0.4p p p p ====B .14230.4,0.1p p p p ====C .14230.2,0.3p p p p ====D .14230.3,0.2p p p p ====【答案】B 【解析】【分析】计算出四个选项中对应数据的平均数和方差,由此可得出标准差最大的一组.【详解】对于A 选项,该组数据的平均数为()()140.1230.4 2.5A x =+⨯++⨯=,方差为()()()()222221 2.50.12 2.50.43 2.50.44 2.50.10.65As =-⨯+-⨯+-⨯+-⨯=;对于B 选项,该组数据的平均数为()()140.4230.1 2.5B x =+⨯++⨯=,方差为()()()()222221 2.50.42 2.50.13 2.50.14 2.50.4 1.85Bs =-⨯+-⨯+-⨯+-⨯=;对于C 选项,该组数据的平均数为()()140.2230.3 2.5C x =+⨯++⨯=,方差为()()()()222221 2.50.22 2.50.33 2.50.34 2.50.2 1.05Cs =-⨯+-⨯+-⨯+-⨯=;对于D 选项,该组数据的平均数为()()140.3230.2 2.5D x =+⨯++⨯=,方差为()()()()222221 2.50.32 2.50.23 2.50.24 2.50.3 1.45Ds =-⨯+-⨯+-⨯+-⨯=.因此,B 选项这一组的标准差最大.故选:B.【点睛】本题考查标准差的大小比较,考查方差公式的应用,考查计算能力,属于基础题.11.【2020年新高考1卷(山东卷)】某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是()A .62%B .56%C .46%D .42%【答案】C 【解析】【分析】记“该中学学生喜欢足球”为事件A ,“该中学学生喜欢游泳”为事件B ,则“该中学学生喜欢足球或游泳”为事件A B +,“该中学学生既喜欢足球又喜欢游泳”为事件A B ⋅,然后根据积事件的概率公式()P A B ⋅=()()()P A P B P A B +-+可得结果.【详解】记“该中学学生喜欢足球”为事件A ,“该中学学生喜欢游泳”为事件B ,则“该中学学生喜欢足球或游泳”为事件A B +,“该中学学生既喜欢足球又喜欢游泳”为事件A B ⋅,则()0.6P A =,()0.82P B =,()0.96P A B +=,所以()P A B ⋅=()()()P A P B P A B +-+0.60.820.960.46=+-=所以该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例为46%.故选:C.【点睛】本题考查了积事件的概率公式,属于基础题.12.【2019年新课标1卷理科】我国古代典籍《周易》用“卦”描述万物的变化.每一“重卦”由从下到上排列的6个爻组成,爻分为阳爻“——”和阴爻“——”,如图就是一重卦.在所有重卦中随机取一重卦,则该重卦恰有3个阳爻的概率是A .516B .1132C .2132D .1116【答案】A【分析】本题主要考查利用两个计数原理与排列组合计算古典概型问题,渗透了传统文化、数学计算等数学素养,“重卦”中每一爻有两种情况,基本事件计算是住店问题,该重卦恰有3个阳爻是相同元素的排列问题,利用直接法即可计算.【详解】由题知,每一爻有2种情况,一重卦的6爻有62情况,其中6爻中恰有3个阳爻情况有36C ,所以该重卦恰有3个阳爻的概率为3662C =516,故选A .【点睛】对利用排列组合计算古典概型问题,首先要分析元素是否可重复,其次要分析是排列问题还是组合问题.本题是重复元素的排列问题,所以基本事件的计算是“住店”问题,满足条件事件的计算是相同元素的排列问题即为组合问题.13.【2019年新课标2卷理科】演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A .中位数B .平均数C .方差D .极差【答案】A 【解析】【分析】可不用动笔,直接得到答案,亦可采用特殊数据,特值法筛选答案.【详解】设9位评委评分按从小到大排列为123489x x x x x x ≤≤≤≤≤ .则①原始中位数为5x ,去掉最低分1x ,最高分9x ,后剩余2348x x x x ≤≤≤ ,中位数仍为5x ,∴A 正确.②原始平均数1234891()9x x x x x x x =+++++ ,后来平均数234817x x x x x '=+++ ()平均数受极端值影响较大,∴x 与x '不一定相同,B 不正确③()()()222219119S x x x x x x ⎡⎤=-+-++-⎣⎦ ()()()222223817s x x x x x x ⎡⎤'=-'+-'++-'⎢⎥⎣⎦ 由②易知,C 不正确.④原极差91=x -x ,后来极差82=x -x 可能相等可能变小,D 不正确.本题旨在考查学生对中位数、平均数、方差、极差本质的理解.14.【2019年新课标3卷理科】《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为A.0.5B.0.6C.0.7D.0.8【答案】C【解析】根据题先求出阅读过西游记的人数,进而得解.【详解】由题意得,阅读过《西游记》的学生人数为90-80+60=70,则其与该校学生人数之比为70÷100=0.7.故选C.【点睛】本题考查容斥原理,渗透了数据处理和数学运算素养.采取去重法,利用转化与化归思想解题.15.【2018年新课标1卷理科】某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【答案】A【解析】【分析】首先设出新农村建设前的经济收入为M ,根据题意,得到新农村建设后的经济收入为2M ,之后从图中各项收入所占的比例,得到其对应的收入是多少,从而可以比较其大小,并且得到其相应的关系,从而得出正确的选项.【详解】设新农村建设前的收入为M ,而新农村建设后的收入为2M ,则新农村建设前种植收入为0.6M ,而新农村建设后的种植收入为0.74M ,所以种植收入增加了,所以A 项不正确;新农村建设前其他收入我0.04M ,新农村建设后其他收入为0.1M ,故增加了一倍以上,所以B 项正确;新农村建设前,养殖收入为0.3M ,新农村建设后为0.6M ,所以增加了一倍,所以C 项正确;新农村建设后,养殖收入与第三产业收入的综合占经济收入的30%28%58%50%+=>,所以超过了经济收入的一半,所以D 正确;故选A.点睛:该题考查的是有关新农村建设前后的经济收入的构成比例的饼形图,要会从图中读出相应的信息即可得结果.16.【2018年新课标1卷理科】如图来自古希腊数学家希波克拉底所研究的几何图形.此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC 的斜边BC ,直角边AB ,AC .△ABC 的三边所围成的区域记为I ,黑色部分记为II ,其余部分记为III .在整个图形中随机取一点,此点取自I ,II ,III 的概率分别记为p 1,p 2,p 3,则A .p 1=p 2B .p 1=p 3C .p 2=p 3D .p 1=p 2+p 3【答案】A 【解析】【分析】首先设出直角三角形三条边的长度,根据其为直角三角形,从而得到三边的关系,然后应用相应的面积公式求得各个区域的面积,根据其数值大小,确定其关系,再利用面积型几何概型的概率公式确定出p 1,p 2,p 3的关系,从而求得结果.【详解】设,,AC b AB c BC a ===,则有222b c a +=,从而可以求得ABC ∆的面积为112=S bc ,黑色部分的面积为22221()()[()]2222c b a S bc πππ=⋅+⋅-⋅-2221(4442c b a bc π=+-+22211422c b a bc bc π+-=⋅+=,其余部分的面积为22311122282a a S bc bc ππ⎛⎫=⋅-=- ⎪⎝⎭,所以有12S S =,根据面积型几何概型的概率公式,可以得到12p p =,故选A.点睛:该题考查的是面积型几何概型的有关问题,题中需要解决的是概率的大小,根据面积型几何概型的概率公式,将比较概率的大小问题转化为比较区域的面积的大小,利用相关图形的面积公式求得结果.17.【2018年新课标2卷理科】我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如30723=+.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是A .112B .114C .115D .118【答案】C【解析】【详解】分析:先确定不超过30的素数,再确定两个不同的数的和等于30的取法,最后根据古典概型概率公式求概率.详解:不超过30的素数有2,3,5,7,11,13,17,19,23,29,共10个,随机选取两个不同的数,共有21045C =种方法,因为7+23=11+19=13+17=30,所以随机选取两个不同的数,其和等于30的有3种方法,故概率为31=4515,选C.点睛:古典概型中基本事件数的探求方法:(1)列举法.(2)树状图法:适合于较为复杂的问题中的基本事件的探求.对于基本事件有“有序”与“无序”区别的题目,常采用树状图法.(3)列表法:适用于多元素基本事件的求解问题,通过列表把复杂的题目简单化、抽象的题目具体化.(4)排列组合法:适用于限制条件较多且元素数目较多的题目.18.【2018年新课标3卷理科】某群体中的每位成员使用移动支付的概率都为p ,各成员的支付方式相互独立,设X 为该群体的10位成员中使用移动支付的人数, 2.4DX =,()()46P X P X =<=,则p =A .0.7B .0.6C .0.4D .0.3【答案】B【解析】【详解】分析:判断出为二项分布,利用公式()()D X np 1p =-进行计算即可.()()D X np 1p =- p 0.4∴=或p 0.6=()()()()6444661010P X 41P X 61C p p C p p ==-<==-,()221p p ∴-<,可知p 0.5>故答案选B.点睛:本题主要考查二项分布相关知识,属于中档题.19.【2021年新高考1卷】有一组样本数据1x ,2x ,…,n x ,由这组数据得到新样本数据1y ,2y ,…,n y ,其中i i y x c =+(1,2,,),i n c =⋅⋅⋅为非零常数,则()A .两组样本数据的样本平均数相同B .两组样本数据的样本中位数相同C .两组样本数据的样本标准差相同D .两组样本数据的样本极差相同【答案】CD【解析】【分析】A 、C 利用两组数据的线性关系有()()E y E x c =+、()()D y D x =,即可判断正误;根据中位数、极差的定义,结合已知线性关系可判断B 、D 的正误.【详解】A :()()()E y E x c E x c =+=+且0c ≠,故平均数不相同,错误;B :若第一组中位数为i x ,则第二组的中位数为i i y x c =+,显然不相同,错误;C :()()()()D y D x D c D x =+=,故方差相同,正确;D :由极差的定义知:若第一组的极差为max min x x -,则第二组的极差为max min max min max min ()()y y x c x c x x -=+-+=-,故极差相同,正确;故选:CD20.【2021年新高考2卷】下列统计量中,能度量样本12,,,n x x x 的离散程度的是()A .样本12,,,n x x x 的标准差B .样本12,,,n x x x 的中位数C .样本12,,,n x x x 的极差D .样本12,,,n x x x 的平均数【答案】AC【解析】【分析】考查所给的选项哪些是考查数据的离散程度,哪些是考查数据的集中趋势即可确定正确选项.【详解】由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势;故选:AC.21.【2020年新高考1卷(山东卷)】信息熵是信息论中的一个重要概念.设随机变量X 所有可能的取值为1,2,,n ,且1()0(1,2,,),1ni i i P X i p i n p ===>==∑ ,定义X 的信息熵21()log n i i i H X p p ==-∑.()A .若n =1,则H (X )=0B .若n =2,则H (X )随着1p 的增大而增大C .若1(1,2,,)i p i n n == ,则H (X )随着n 的增大而增大D .若n =2m ,随机变量Y 所有可能的取值为1,2,,m ,且21()(1,2,,)j m j P Y j p p j m +-==+= ,则H (X )≤H (Y )【答案】AC【解析】【分析】对于A 选项,求得()H X ,由此判断出A 选项;对于B 选项,利用特殊值法进行排除;对于C 选项,计算出()H X ,利用对数函数的性质可判断出C 选项;对于D 选项,计算出()(),H X H Y ,利用基本不等式和对数函数的性质判断出D 选项.【详解】对于A 选项,若1n =,则11,1i p ==,所以()()21log 10H X =-⨯=,所以A 选项正确.对于B 选项,若2n =,则1,2i =,211p p =-,所以()()()121121X log 1log 1H p p p p =-⋅+-⋅-⎡⎤⎣⎦,当114p =时,()221133log log 4444H X ⎛⎫=-⋅+⋅ ⎪⎝⎭,当13p 4=时,()223311log log 4444H X ⎛⎫=-⋅+⋅ ⎪⎝⎭,两者相等,所以B 选项错误.对于C 选项,若()11,2,,i p i n n== ,则()222111log log log H X n n nn n ⎛⎫=-⋅⨯=-= ⎪⎝⎭,则()H X 随着n 的增大而增大,所以C 选项正确.对于D 选项,若2n m =,随机变量Y 的所有可能的取值为1,2,,m ,且()21j m j P Y j p p +-==+(1,2,,j m = ).()2222111log log m m i i i i i iH X p p p p ===-⋅=⋅∑∑122221222122121111log log log log m m m mp p p p p p p p --=⋅+⋅++⋅+⋅ .()H Y =()()()122221212122211111log log log m m m m m m m m p p p p p p p p p p p p -+-++⋅+⋅+++⋅+++ 12222122212221221121111log log log log m m m m m mp p p p p p p p p p p p ---=⋅+⋅++⋅+⋅++++ 由于()01,2,,2i p i m >= ,所以2111i i m i p p p +->+,所以222111log log i i m i p p p +->+,所以222111log log i i i i m ip p p p p +-⋅>⋅+,所以()()H X H Y >,所以D 选项错误.故选:AC【点睛】本小题主要考查对新定义“信息熵”的理解和运用,考查分析、思考和解决问题的能力,涉及对数运算和对数函数及不等式的基本性质的运用,属于难题.22.【2020年新高考2卷(海南卷)】我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是A .这11天复工指数和复产指数均逐日增加;B .这11天期间,复产指数增量大于复工指数的增量;C.第3天至第11天复工复产指数均超过80%;D.第9天至第11天复产指数增量大于复工指数的增量;【答案】CD【解析】【分析】注意到折线图中有递减部分,可判定A错误;注意考查第1天和第11天的复工复产指数的差的大小,可判定B错误;根据图象,结合复工复产指数的意义和增量的意义可以判定CD 正确.【详解】由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,第10天到第11复工指数减少,第8天到第9天复产指数减少,故A错误;由图可知,第一天的复产指标与复工指标的差大于第11天的复产指标与复工指标的差,所以这11天期间,复产指数增量小于复工指数的增量,故B错误;由图可知,第3天至第11天复工复产指数均超过80%,故C正确;由图可知,第9天至第11天复产指数增量大于复工指数的增量,故D正确;【点睛】本题考查折线图表示的函数的认知与理解,考查理解能力,识图能力,推理能力,难点在于指数增量的理解与观测,属中档题.23.【2022年全国甲卷】从正方体的8个顶点中任选4个,则这4个点在同一个平面的概率为________.【答案】635.【解析】【分析】根据古典概型的概率公式即可求出.【详解】从正方体的8个顶点中任取4个,有=C84=70个结果,这4个点在同一个平面的有= 6+6=12个,故所求概率==1270=635.故答案为:635.24.【2022年新高考2卷】已知随机变量X服从正态分布2,2,且o2<≤2.5)=0.36,则o>2.5)=____________.【答案】0.14##750.【解析】【分析】根据正态分布曲线的性质即可解出.【详解】因为∼2,2,所以<2=>2=0.5,因此>2.5=>2−2<≤2.5=0.5−0.36=0.14.故答案为:0.14.25.【2019年新课标1卷理科】甲、乙两队进行篮球决赛,采取七场四胜制(当一队赢得四场胜利时,该队获胜,决赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队以4∶1获胜的概率是____________.【答案】0.18【解析】【分析】本题应注意分情况讨论,即前五场甲队获胜的两种情况,应用独立事件的概率的计算公式求解.题目有一定的难度,注重了基础知识、基本计算能力及分类讨论思想的考查.【详解】前四场中有一场客场输,第五场赢时,甲队以4:1获胜的概率是30.60.50.520.108,⨯⨯⨯=前四场中有一场主场输,第五场赢时,甲队以4:1获胜的概率是220.40.60.520.072,⨯⨯⨯=综上所述,甲队以4:1获胜的概率是0.1080.0720.18.q =+=【点睛】由于本题题干较长,所以,易错点之一就是能否静心读题,正确理解题意;易错点之二是思维的全面性是否具备,要考虑甲队以4:1获胜的两种情况;易错点之三是是否能够准确计算.26.【2019年新课标2卷理科】我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为___________.【答案】0.98.【解析】【分析】本题考查通过统计数据进行概率的估计,采取估算法,利用概率思想解题.【详解】由题意得,经停该高铁站的列车正点数约为100.97200.98100.9939.2⨯+⨯+⨯=,其中高铁个数为10+20+10=40,所以该站所有高铁平均正点率约为39.20.9840=.【点睛】本题考点为概率统计,渗透了数据处理和数学运算素养.侧重统计数据的概率估算,难度不大.易忽视概率的估算值不是精确值而失误,根据分类抽样的统计数据,估算出正点列车数量与列车总数的比值.。
高考数学专题《概率与统计》解读含答案解析

重难点04 概率与统计新高考概率与统计主要考查统计分析、变量的相关关系,独立性检验、用样本估计总体及其特征的思想,以排列组合为工具,考查对五个概率事件的判断识别及其概率的计算。
试题考查特点是以实际应用问题为载体,小题部分主要是考查排列组合与古典概型,解答题部分主要考查独立性检验、超几何分布、离散型分布以及正态分布对应的数学期望以及方差。
概率的应用立意高,情境新,赋予时代气息,贴近学生的实际生活。
取代了传统意义上的应用题,成为高考中的亮点。
解答题中概率与统计的交汇是近几年考查的热点趋势,应该引起关注。
求解概率问题首先确定是何值概型再用相应公式进行计算,特别对于解互斥事件(独立事件)的概率时,要注意两点:(1)仔细审题,明确题中的几个事件是否为互斥事件(独立事件),要结合题意分析清楚这些事件互斥(独立)的原因;(2)要注意所求的事件是包含这些互斥事件(独立事件)中的哪几个事件的和(积),如果不符合以上两点,就不能用互斥事件的和的概率.离散型随机变量的均值和方差是概率知识的进一步延伸,是当前高考的热点内容.解决均值和方差问题,都离不开随机变量的分布列,另外在求解分布列时还要注意分布列性质的应用.捆绑法:题目中规定相邻的几个元素捆绑成一个组,当作一个大元素参与排列。
相离问题插空排:元素相离(即不相邻)问题,可先把无位置要求的几个元素全排列,再把规定的相离的几个元素插入上述几个元素的空位和两端。
定序问题缩倍法:在排列问题中限制某几个元素必须保持一定的顺序,可用缩小倍数的方法。
标号排位问题分步法:把元素排到指定位置上,可先把某个元素按规定排入,第二步再排另一个元素,如此继续下去,依次即可完成。
有序分配问题逐分法:有序分配问题指把元素分成若干组,可用逐步下量分组法。
对于二项式定理的应用,只要会求对应的常数项以及对应的n项即可,但是应注意是二项式系数还是系数。
新高考统计主要考查统计分析、变量的相关关系,独立性检验、用样本估计总体及其特征的思想,以排列组合为工具,考查对五个概率事件的判断识别及其概率的计算。
历年(2019-2024)全国高考数学真题分类(统计与数字特征)汇编(附答案)

历年(2019-2024)全国高考数学真题分类(统计与数字特征)汇编考点01 随机抽样1.(2023∙全国新Ⅱ卷∙高考真题)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有( ).A .4515400200C C ⋅种B .2040400200C C ⋅种 C .3030400200C C ⋅种D .4020400200C C ⋅种考点02 图表类统计图综合1.(2022∙天津∙高考真题)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,右图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .8B .12C .16D .182.(2021∙天津∙高考真题)从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[)66,70、[)70,74、L 、[]94,98,并整理得到如下的频率分布直方图,则评分在区间[)82,86内的影视作品数量是( )A.20 B.40 C.64 D.804.(2021∙全国甲卷∙高考真题)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间5.(2020∙全国新Ⅱ卷∙高考真题)(多选)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是A.这11天复工指数和复产指数均逐日增加;B.这11天期间,复产指数增量大于复工指数的增量;C.第3天至第11天复工复产指数均超过80%;D.第9天至第11天复产指数增量大于复工指数的增量;5.(2020∙天津∙高考真题)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[)[)[)[],并整理得到如下频率分布直方图,则在被抽取的零件中,5.31,5.33,5.33,5.35,,5.45,5.47,5.47,5.49直径落在区间[5.43,5.47)内的个数为()A.10 B.18 C.20 D.36考点03 样本的数字特征一、单选题1.(2024∙全国新Ⅱ卷∙高考真题)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理如下表亩产[900,950) [950,1000) [1000,1050) [1050,1100) [1100,1150) [1150,1200) 量频数 6 12 18 30 24 10根据表中数据,下列结论中正确的是()A.100块稻田亩产量的中位数小于1050kgB.100块稻田中亩产量低于1100kg的稻田所占比例超过80%C.100块稻田亩产量的极差介于200kg至300kg之间D.100块稻田亩产量的平均值介于900kg至1000kg之间2.(2022∙全国乙卷∙高考真题)分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h),得如下茎叶图:则下列结论中错误的是()A.甲同学周课外体育运动时长的样本中位数为7.4B.乙同学周课外体育运动时长的样本平均数大于8C .甲同学周课外体育运动时长大于8的概率的估计值大于0.4D .乙同学周课外体育运动时长大于8的概率的估计值大于0.63.(2022∙全国甲卷∙高考真题)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则( )A .讲座前问卷答题的正确率的中位数小于70%B .讲座后问卷答题的正确率的平均数大于85%C .讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D .讲座后问卷答题的正确率的极差大于讲座前正确率的极差4.(2020∙全国∙高考真题)在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p ,且411i i p ==∑,则下面四种情形中,对应样本的标准差最大的一组是( )A .14230.1,0.4p p p p ====B .14230.4,0.1p p p p ====C .14230.2,0.3p p p p ====D .14230.3,0.2p p p p ====5.(2020∙全国∙高考真题)设一组样本数据x 1,x 2,…,xn 的方差为0.01,则数据10x 1,10x 2,…,10xn 的方差为( )A .0.01B .0.1C .1D .106.(2019∙全国∙高考真题)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A .中位数B .平均数C .方差D .极差二、多选题9.(2023∙全国新Ⅰ卷∙高考真题)有一组样本数据126,,,x x x ⋅⋅⋅,其中1x 是最小值,6x 是最大值,则( ) A .2345,,,x x x x 的平均数等于126,,,x x x ⋅⋅⋅的平均数B .2345,,,x x x x 的中位数等于126,,,x x x ⋅⋅⋅的中位数C .2345,,,x x x x 的标准差不小于126,,,x x x ⋅⋅⋅的标准差D .2345,,,x x x x 的极差不大于126,,,x x x ⋅⋅⋅的极差10.(2021∙全国新Ⅱ卷∙高考真题)下列统计量中,能度量样本12,,,n x x x 的离散程度的是( )A .样本12,,,n x x x 的标准差B .样本12,,,n x x x 的中位数C .样本12,,,n x x x 的极差D .样本12,,,n x x x 的平均数11.(2021∙全国新Ⅰ卷∙高考真题)有一组样本数据1x ,2x ,…,n x ,由这组数据得到新样本数据1y ,2y ,…,n y ,其中i i y x c =+(1,2,,),i n c =⋅⋅⋅为非零常数,则( )A .两组样本数据的样本平均数相同B .两组样本数据的样本中位数相同C .两组样本数据的样本标准差相同D .两组样本数据的样本极差相同三、填空题12.(2020∙江苏∙高考真题)已知一组数据4,2,3,5,6a a -的平均数为4,则a 的值是 .13.(2019∙江苏∙高考真题)已知一组数据6,7,8,8,9,10,则该组数据的方差是 .考点04 变量间的相关关系1.(2024∙天津∙高考真题)下列图中,线性相关性系数最大的是( )A .B .C .D .2.(2023∙天津∙高考真题)鸢是鹰科的一种鸟,《诗经∙大雅∙旱麓》曰:“鸢飞戾天,鱼跃余渊”. 鸢尾花因花瓣形如鸢尾而得名,寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:cm ),绘制散点图如图所示,计算得样本相关系数为0.8642r =,利用最小二乘法求得相应的经验回归方程为 0.75010.6105y x =+,根据以上信息,如下判断正确的为( )A .花瓣长度和花萼长度不存在相关关系B .花瓣长度和花萼长度负相关C .花萼长度为7cm 的该品种鸢尾花的花瓣长度的平均值为5.8612cmD .若从样本中抽取一部分,则这部分的相关系数一定是0.86423.(2020∙全国∙高考真题)某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i = 得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( )A .y a bx =+B .2y a bx =+C .e x y a b =+D .ln y a b x =+参考答案考点01 随机抽样1.(2023∙全国新Ⅱ卷∙高考真题)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有( ).A .4515400200C C ⋅种B .2040400200C C ⋅种 C .3030400200C C ⋅种 D .4020400200C C ⋅种【答案】D【详细分析】利用分层抽样的原理和组合公式即可得到答案. 【答案详解】根据分层抽样的定义知初中部共抽取4006040600⨯=人,高中部共抽取2006020600⨯=, 根据组合公式和分步计数原理则不同的抽样结果共有4020400200C C ⋅种.故选:D.考点02 图表类统计图综合1.(2022∙天津∙高考真题)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,右图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .8B .12C .16D .18【答案】B 【详细分析】结合已知条件和频率分布直方图求出志愿者的总人数,进而求出第三组的总人数,从而可以求得结果. 【答案详解】志愿者的总人数为20(0.240.16)1+⨯=50, 所以第三组人数为50×0.36=18,有疗效的人数为18-6=12.故选:B.2.(2021∙天津∙高考真题)从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[)66,70、[)70,74、L 、[]94,98,并整理得到如下的频率分布直方图,则评分在区间[)82,86内的影视作品数量是( )A .20B .40C .64D .80【答案】D 【详细分析】利用频率分布直方图可计算出评分在区间[)82,86内的影视作品数量.【答案详解】由频率分布直方图可知,评分在区间[)82,86内的影视作品数量为4000.05480⨯⨯=.故选:D.4.(2021∙全国甲卷∙高考真题)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是( )A .该地农户家庭年收入低于4.5万元的农户比率估计为6%B .该地农户家庭年收入不低于10.5万元的农户比率估计为10%C .估计该地农户家庭年收入的平均值不超过6.5万元D .估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间【答案】C【详细分析】根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.【答案详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为0.020.040.066%+==,故A 正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为0.040.0230.1010%+⨯==,故B 正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.100.140.2020.6464%50%++⨯==>,故D 正确;该地农户家庭年收入的平均值的估计值为30.0240.0450.1060.1470.2080.2090.10100.10110.04120.02130.02140.027.68⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=(万元),超过6.5万元,故C 错误.综上,给出结论中不正确的是C.故选:C.【名师点评】本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均值的估计值.注意各组的频率等于⨯频率组距组距. 5.(2020∙全国新Ⅱ卷∙高考真题)(多选)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是A .这11天复工指数和复产指数均逐日增加;B .这11天期间,复产指数增量大于复工指数的增量;C .第3天至第11天复工复产指数均超过80%;D .第9天至第11天复产指数增量大于复工指数的增量;【答案】CD【详细分析】注意到折线图中有递减部分,可判定A 错误;注意考查第1天和第11天的复工复产指数的差的大小,可判定B 错误;根据图象,结合复工复产指数的意义和增量的意义可以判定CD 正确.【答案详解】由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,第10天到第11复工指数减少,第8天到第9天复产指数减少,故A 错误;由图可知,第一天的复产指标与复工指标的差大于第11天的复产指标与复工指标的差,所以这11天期间,复产指数增量小于复工指数的增量,故B 错误;由图可知,第3天至第11天复工复产指数均超过80%,故C 正确;由图可知,第9天至第11天复产指数增量大于复工指数的增量,故D 正确;【名师点评】本题考查折线图表示的函数的认知与理解,考查理解能力,识图能力,推理能力,难点在于指数增量的理解与观测,属中档题.5.(2020∙天津∙高考真题)从一批零件中抽取80个,测量其直径(单位:mm ),将所得数据分为9组:[)[)[)[]5.31,5.33,5.33,5.35,,5.45,5.47,5.47,5.49 ,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )A .10B .18C .20D .36【答案】B 【详细分析】根据直方图确定直径落在区间[)5.43,5.47之间的零件频率,然后结合样本总数计算其个数即可. 【答案详解】根据直方图,直径落在区间[)5.43,5.47之间的零件频率为:()6.25 5.000.020.225+⨯=, 则区间[)5.43,5.47内零件的个数为:800.22518⨯=.故选:B.【名师点评】本题主要考查频率分布直方图的计算与实际应用,属于中等题.考点03 样本的数字特征一、单选题1.(2024∙全国新Ⅱ卷∙高考真题)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg )并整理如下表 亩产量[900,950) [950,1000) [1000,1050) [1050,1100) [1100,1150) [1150,1200) 频数 6 12 18 30 24 10 根据表中数据,下列结论中正确的是( )A .100块稻田亩产量的中位数小于1050kgB .100块稻田中亩产量低于1100kg 的稻田所占比例超过80%C .100块稻田亩产量的极差介于200kg 至300kg 之间D .100块稻田亩产量的平均值介于900kg 至1000kg 之间【答案】C【详细分析】计算出前三段频数即可判断A ;计算出低于1100kg 的频数,再计算比例即可判断B ;根据极差计算方法即可判断C ;根据平均值计算公式即可判断D.【答案详解】对于 A, 根据频数分布表可知, 612183650++=<,所以亩产量的中位数不小于 1050kg , 故 A 错误;对于B ,亩产量不低于1100kg 的频数为341024=+,所以低于1100kg 的稻田占比为1003466%100-=,故B 错误; 对于C ,稻田亩产量的极差最大为1200900300-=,最小为1150950200-=,故C 正确;对于D ,由频数分布表可得,平均值为1(692512975181025301075241125101175)1067100⨯⨯+⨯+⨯+⨯+⨯+⨯=,故D 错误. 故选;C.2.(2022∙全国乙卷∙高考真题)分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h ),得如下茎叶图:则下列结论中错误的是( )A .甲同学周课外体育运动时长的样本中位数为7.4B .乙同学周课外体育运动时长的样本平均数大于8C .甲同学周课外体育运动时长大于8的概率的估计值大于0.4D .乙同学周课外体育运动时长大于8的概率的估计值大于0.6【答案】C【详细分析】结合茎叶图、中位数、平均数、古典概型等知识确定正确答案.【答案详解】对于A 选项,甲同学周课外体育运动时长的样本中位数为7.37.57.42+=,A 选项结论正确.对于B 选项,乙同学课外体育运动时长的样本平均数为:6.37.47.68.18.28.28.58.68.68.68.69.09.29.39.810.18.50625816+++++++++++++++=>, B 选项结论正确.对于C 选项,甲同学周课外体育运动时长大于8的概率的估计值60.3750.416=<, C 选项结论错误.对于D 选项,乙同学周课外体育运动时长大于8的概率的估计值130.81250.616=>, D 选项结论正确.故选:C3.(2022∙全国甲卷∙高考真题)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则( )A .讲座前问卷答题的正确率的中位数小于70%B .讲座后问卷答题的正确率的平均数大于85%C .讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D .讲座后问卷答题的正确率的极差大于讲座前正确率的极差【答案】B【详细分析】由图表信息,结合中位数、平均数、标准差、极差的概念,逐项判断即可得解. 【答案详解】讲座前中位数为70%75%70%2+>,所以A 错; 讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,所以B 对;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C 错;讲座后问卷答题的正确率的极差为100%80%20%-=,讲座前问卷答题的正确率的极差为95%60%35%20%-=>,所以D 错.故选:B.4.(2020∙全国∙高考真题)在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p ,且411i i p ==∑,则下面四种情形中,对应样本的标准差最大的一组是( )A .14230.1,0.4p p p p ====B .14230.4,0.1p p p p ====C .14230.2,0.3p p p p ====D .14230.3,0.2p p p p ====【答案】B【详细分析】计算出四个选项中对应数据的平均数和方差,由此可得出标准差最大的一组.【答案详解】对于A 选项,该组数据的平均数为()()140.1230.4 2.5A x =+⨯++⨯=,方差为()()()()222221 2.50.12 2.50.43 2.50.44 2.50.10.65A s =-⨯+-⨯+-⨯+-⨯=; 对于B 选项,该组数据的平均数为()()140.4230.1 2.5B x =+⨯++⨯=,方差为()()()()222221 2.50.42 2.50.13 2.50.14 2.50.4 1.85B s =-⨯+-⨯+-⨯+-⨯=; 对于C 选项,该组数据的平均数为()()140.2230.3 2.5C x =+⨯++⨯=,方差为()()()()222221 2.50.22 2.50.33 2.50.34 2.50.2 1.05C s =-⨯+-⨯+-⨯+-⨯=; 对于D 选项,该组数据的平均数为()()140.3230.2 2.5D x =+⨯++⨯=,方差为()()()()222221 2.50.32 2.50.23 2.50.24 2.50.3 1.45D s =-⨯+-⨯+-⨯+-⨯=. 因此,B 选项这一组的标准差最大.故选:B.【名师点评】本题考查标准差的大小比较,考查方差公式的应用,考查计算能力,属于基础题. 5.(2020∙全国∙高考真题)设一组样本数据x 1,x 2,…,xn 的方差为0.01,则数据10x 1,10x 2,…,10xn 的方差为( )A .0.01B .0.1C .1D .10【答案】C【详细分析】根据新数据与原数据关系确定方差关系,即得结果. 【答案详解】因为数据(1,2,,)i ax b i n +=L ,的方差是数据(1,2,,)i x i n =L ,的方差的2a 倍, 所以所求数据方差为2100.01=1⨯故选:C【名师点评】本题考查方差,考查基本详细分析求解能力,属基础题.6.(2019∙全国∙高考真题)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A .中位数B .平均数C .方差D .极差【答案】A【详细分析】可不用动笔,直接得到答案,亦可采用特殊数据,特值法筛选答案.【答案详解】设9位评委评分按从小到大排列为123489x x x x x x ≤≤≤≤≤ .则①原始中位数为5x ,去掉最低分1x ,最高分9x ,后剩余2348x x x x ≤≤≤ ,中位数仍为5x ,∴A 正确. ②原始平均数1234891()9x x x x x x x =+++++ ,后来平均数234817x x x x x '=+++ () 平均数受极端值影响较大,∴x 与x '不一定相同,B 不正确 ③()()()222219119S x x x x x x ⎡⎤=-+-++-⎣⎦ ()()()222223817s x x x x x x ⎡⎤'=-'+-'++-'⎢⎥⎣⎦ 由②易知,C 不正确. ④原极差91=x -x ,后来极差82=x -x 可能相等可能变小,D 不正确.【名师点评】本题旨在考查学生对中位数、平均数、方差、极差本质的理解.考点04 变量间的相关关系1.(2024∙天津∙高考真题)下列图中,线性相关性系数最大的是( )A .B .C .D .【答案】A【详细分析】由点的分布特征可直接判断【答案详解】观察4幅图可知,A 图散点分布比较集中,且大体接近某一条直线,线性回归模型拟合效果比较好,呈现明显的正相关,r 值相比于其他3图更接近1.故选:A2.(2023∙天津∙高考真题)鸢是鹰科的一种鸟,《诗经∙大雅∙旱麓》曰:“鸢飞戾天,鱼跃余渊”. 鸢尾花因花瓣形如鸢尾而得名,寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:cm ),绘制散点图如图所示,计算得样本相关系数为0.8642r =,利用最小二乘法求得相应的经验回归方程为 0.75010.6105y x =+,根据以上信息,如下判断正确的为( )A .花瓣长度和花萼长度不存在相关关系B .花瓣长度和花萼长度负相关C .花萼长度为7cm 的该品种鸢尾花的花瓣长度的平均值为5.8612cmD .若从样本中抽取一部分,则这部分的相关系数一定是0.8642【答案】C【详细分析】根据散点图的特点及经验回归方程可判断ABC 选项,根据相关系数的定义可以判断D 选项.【答案详解】根据散点的集中程度可知,花瓣长度和花萼长度有相关性,A 选项错误散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现正相关性,B 选项错误,把7x =代入 0.75010.6105y x =+可得 5.8612cm y =,C 选项正确;由于0.8642r =是全部数据的相关系数,取出来一部分数据,相关性可能变强,可能变弱,即取出的数据的相关系数不一定是0.8642,D 选项错误故选:C3.(2020∙全国∙高考真题)某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i = 得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( )A .y a bx =+B .2y a bx =+C .e x y a b =+D .ln y a b x =+ 【答案】D【详细分析】根据散点图的分布可选择合适的函数模型.【答案详解】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+. 故选:D.【名师点评】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.。
高考数学-概率与统计(含22年真题讲解)

高考数学-概率与统计(含22年真题讲解)1.【2022年全国甲卷】某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则()A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差【答案】B【解析】【分析】由图表信息,结合中位数、平均数、标准差、极差的概念,逐项判断即可得解.【详解】>70%,所以A错;讲座前中位数为70%+75%2讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,所以B对;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C错;讲座后问卷答题的正确率的极差为100%−80%=20%,讲座前问卷答题的正确率的极差为95%−60%=35%>20%,所以D错.故选:B.2.【2022年全国甲卷】从分别写有1,2,3,4,5,6的6张卡片中无放回随机抽取2张,则抽到的2张卡片上的数字之积是4的倍数的概率为()A.15B.13C.25D.23【答案】C【解析】【分析】先列举出所有情况,再从中挑出数字之积是4的倍数的情况,由古典概型求概率即可.【详解】从6张卡片中无放回抽取2张,共有(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3 ,4),(3,5),(3,6),(4,5),(4,6),(5,6)15种情况,其中数字之积为4的倍数的有(1,4),(2,4),(2,6),(3,4),(4,5),(4,6)6种情况,故概率为615=25.故选:C.3.【2022年全国乙卷】分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h),得如下茎叶图:则下列结论中错误的是()A.甲同学周课外体育运动时长的样本中位数为7.4B.乙同学周课外体育运动时长的样本平均数大于8C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6【答案】C【解析】【分析】结合茎叶图、中位数、平均数、古典概型等知识确定正确答案.【详解】=7.4,A选项结论正确.对于A选项,甲同学周课外体育运动时长的样本中位数为7.3+7.52对于B选项,乙同学课外体育运动时长的样本平均数为:6.3+7.4+7.6+8.1+8.2+8.2+8.5+8.6+8.6+8.6+8.6+9.0+9.2+9.3+9.8+10.1=8.50625>8,16B选项结论正确.=0.375<0.4,对于C选项,甲同学周课外体育运动时长大于8的概率的估计值616C选项结论错误.=0.8125>0.6,对于D选项,乙同学周课外体育运动时长大于8的概率的估计值1316D选项结论正确.故选:C4.【2022年全国乙卷】某棋手与甲、乙、丙三位棋手各比赛一盘,各盘比赛结果相互独立.已知该棋手与甲、乙、丙比赛获胜的概率分别为p1,p2,p3,且p3>p2>p1>0.记该棋手连胜两盘的概率为p,则()A.p与该棋手和甲、乙、丙的比赛次序无关B.该棋手在第二盘与甲比赛,p最大C.该棋手在第二盘与乙比赛,p最大D.该棋手在第二盘与丙比赛,p最大【答案】D【解析】【分析】该棋手连胜两盘,则第二盘为必胜盘.分别求得该棋手在第二盘与甲比赛且连胜两盘的概率p;该棋手在第二盘与乙比赛且连胜两盘的概率p乙;该棋手在第二盘与丙比赛且连胜两盘甲的概率p丙.并对三者进行比较即可解决【详解】该棋手连胜两盘,则第二盘为必胜盘,记该棋手在第二盘与甲比赛,且连胜两盘的概率为p甲则p甲=2(1−p2)p1p3+2p2p1(1−p3)=2p1(p2+p3)−4p1p2p3记该棋手在第二盘与乙比赛,且连胜两盘的概率为p乙则p乙=2(1−p1)p2p3+2p1p2(1−p3)=2p2(p1+p3)−4p1p2p3记该棋手在第二盘与丙比赛,且连胜两盘的概率为p丙则p丙=2(1−p1)p3p2+2p1p3(1−p2)=2p3(p1+p2)−4p1p2p3则p甲−p乙=2p1(p2+p3)−4p1p2p3−[2p2(p1+p3)−4p1p2p3]=2(p1−p2)p3<0p 乙−p丙=2p2(p1+p3)−4p1p2p3−[2p3(p1+p2)−4p1p2p3]=2(p2−p3)p1<0即p甲<p乙,p乙<p丙,则该棋手在第二盘与丙比赛,p最大.选项D判断正确;选项BC判断错误;p与该棋手与甲、乙、丙的比赛次序有关.选项A判断错误.故选:D5.【2022年新高考1卷】从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为()A.16B.13C.12D.23【答案】D【解析】【分析】由古典概型概率公式结合组合、列举法即可得解.【详解】从2至8的7个整数中随机取2个不同的数,共有C72=21种不同的取法,若两数不互质,不同的取法有:(2,4),(2,6),(2,8),(3,6),(4,6),(4,8),(6,8),共7种,故所求概率P=21−721=23.故选:D.6.【2022年全国甲卷】从正方体的8个顶点中任选4个,则这4个点在同一个平面的概率为________.【答案】635.【解析】【分析】根据古典概型的概率公式即可求出.【详解】从正方体的8个顶点中任取4个,有n=C84=70个结果,这4个点在同一个平面的有m=6+6=12个,故所求概率P=mn =1270=635.故答案为:635.7.【2022年全国乙卷】从甲、乙等5名同学中随机选3名参加社区服务工作,则甲、乙都入选的概率为____________.【答案】310##0.3【解析】【分析】根据古典概型计算即可【详解】从5名同学中随机选3名的方法数为C53=10甲、乙都入选的方法数为C31=3,所以甲、乙都入选的概率P=310故答案为:3108.【2022年新高考2卷】已知随机变量X服从正态分布N(2,σ2),且P(2<X≤2.5)=0.36,则P(X>2.5)=____________.【答案】0.14##750.【解析】【分析】根据正态分布曲线的性质即可解出.【详解】因为X∼N(2,σ2),所以P(X<2)=P(X>2)=0.5,因此P(X>2.5)=P(X>2)−P(2<X ≤2.5)=0.5−0.36=0.14.故答案为:0.14.9.【2022年浙江】现有7张卡片,分别写上数字1,2,2,3,4,5,6.从这7张卡片中随机抽取3张,记所抽取卡片上数字的最小值为ξ,则P(ξ=2)=__________,E(ξ)=_________.【答案】 1635, 127##157 【解析】 【分析】利用古典概型概率公式求P(ξ=2),由条件求ξ分布列,再由期望公式求其期望. 【详解】从写有数字1,2,2,3,4,5,6的7张卡片中任取3张共有C 73种取法,其中所抽取的卡片上的数字的最小值为2的取法有C 41+C 21C 42种,所以P(ξ=2)=C 41+C 21C 42C 73=1635,由已知可得ξ的取值有1,2,3,4, P(ξ=1)=C 62C 73=1535,P(ξ=2)=1635,,P(ξ=3)=C 32C 73=335,P(ξ=4)=1C 73=135所以E(ξ)=1×1535+2×1635+3×335+4×135=127,故答案为:1635,127.10.【2022年全国甲卷】甲、乙两城之间的长途客车均由A 和B 两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率; (2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关? 附:K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d), P (K 2⩾k )0.100 0.050 0.010 k2.7063.8416.635【答案】(1)A ,B 两家公司长途客车准点的概率分别为1213,78(2)有 【解析】 【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;(2)根据表格中数据及公式计算K 2,再利用临界值表比较即可得结论. (1)根据表中数据,A 共有班次260次,准点班次有240次, 设A 家公司长途客车准点事件为M , 则P(M)=240260=1213;B 共有班次240次,准点班次有210次, 设B 家公司长途客车准点事件为N , 则P(N)=210240=78.A 家公司长途客车准点的概率为1213; B 家公司长途客车准点的概率为78. (2)列联表K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=500×(240×30−210×20)2260×240×450×50≈3.205>2.706,根据临界值表可知,有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.11.【2022年全国甲卷】甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立. (1)求甲学校获得冠军的概率;(2)用X 表示乙学校的总得分,求X 的分布列与期望.【答案】(1)0.6;(2)分布列见解析,E(X)=13.【解析】【分析】(1)设甲在三个项目中获胜的事件依次记为A,B,C,再根据甲获得冠军则至少获胜两个项目,利用互斥事件的概率加法公式以及相互独立事件的乘法公式即可求出;(2)依题可知,X的可能取值为0,10,20,30,再分别计算出对应的概率,列出分布列,即可求出期望.(1)设甲在三个项目中获胜的事件依次记为A,B,C,所以甲学校获得冠军的概率为P=P(ABC)+P(A BC)+P(AB̅C)+P(ABC)=0.5×0.4×0.8+0.5×0.4×0.8+0.5×0.6×0.8+0.5×0.4×0.2=0.16+0.16+0.24+0.04=0.6.(2)依题可知,X的可能取值为0,10,20,30,所以,P(X=0)=0.5×0.4×0.8=0.16,P(X=10)=0.5×0.4×0.8+0.5×0.6×0.8+0.5×0.4×0.2=0.44,P(X=20)=0.5×0.6×0.8+0.5×0.4×0.2+0.5×0.6×0.2=0.34,P(X=30)=0.5×0.6×0.2=0.06.即X的分布列为期望E(X)=0×0.16+10×0.44+20×0.34+30×0.06=13.12.【2022年全国乙卷】某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:2)和材积量(单位:3),得到如下数据:并计算得∑x i 210i=1=0.038,∑y i 210i=1=1.6158,∑x i y i10i=1=0.2474. (1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量; (2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m 2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值. 附:相关系数r =∑(x i−x̅)n i=1(y i −y̅)√∑(x i −x̅)2ni=1∑(y i−y ̅)2ni=1√1.896≈1.377.【答案】(1)0.06m 2;0.39m 3 (2)0.97 (3)1209m 3 【解析】 【分析】(1)计算出样本的一棵根部横截面积的平均值及一棵材积量平均值,即可估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)代入题给相关系数公式去计算即可求得样本的相关系数值;(3)依据树木的材积量与其根部横截面积近似成正比,列方程即可求得该林区这种树木的总材积量的估计值. (1)样本中10棵这种树木的根部横截面积的平均值x̅=0.610=0.06样本中10棵这种树木的材积量的平均值y̅=3.910=0.39据此可估计该林区这种树木平均一棵的根部横截面积为0.06m 2, 平均一棵的材积量为0.39m 3 (2)r =∑(x i −x)10i=1(y i −y)√∑10i=1(x i −x)2∑10i=1(y i −y)2=∑10i=1i i 10xy√(∑10i=1x i 2−10x2)(∑10i=1y i 2−10y 2)=0.2474−10×0.06×0.39√(0.038−10×0.062)(1.6158−10×0.392)=0.0134√0.0001896≈0.01340.01377≈0.97则r ≈0.97 (3)设该林区这种树木的总材积量的估计值为Y m 3, 又已知树木的材积量与其根部横截面积近似成正比, 可得0.060.39=186Y,解之得Y =1209m 3. 则该林区这种树木的总材积量估计为1209m 313.【2022年新高考1卷】一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?(2)从该地的人群中任选一人,A 表示事件“选到的人卫生习惯不够良好”,B 表示事件“选到的人患有该疾病”.P(B|A)P(B ̅|A)与P(B|A )P(B ̅|A )的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R .(ⅰ)证明:R =P(A|B)P(A |B)⋅P(A |B ̅)P(A|B ̅);(ⅱ)利用该调查数据,给出P(A|B),P(A|B ̅)的估计值,并利用(ⅰ)的结果给出R 的估计值.附K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),【答案】(1)答案见解析 (2)(i )证明见解析;(ii)R =6; 【解析】【分析】(1)由所给数据结合公式求出K2的值,将其与临界值比较大小,由此确定是否有99%的把握认为患该疾病群体与未黄该疾病群体的卫生习惯有差异;(2)(i) 根据定义结合条件概率公式即可完成证明;(ii)根据(i)结合已知数据求R.(1)由已知K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=200(40×90−60×10)250×150×100×100=24,又P(K2≥6.635)=0.01,24>6.635,所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.(2)(i)因为R=P(B|A)P(B̅|A)⋅P(B̅|A)P(B|A)=P(AB)P(A)⋅P(A)P(AB̅)⋅P(A B̅)P(A)⋅P(A)P(A B),所以R=P(AB)P(B)⋅P(B)P(A B)⋅P(A B̅)P(B̅)⋅P(B̅)P(AB̅)所以R=P(A|B)P(A|B)⋅P(A|B̅) P(A|B̅),(ii)由已知P(A|B)=40100,P(A|B̅)=10100,又P(A|B)=60100,P(A|B̅)=90100,所以R=P(A|B)P(A|B)⋅P(A|B̅)P(A|B̅)=614.【2022年新高考2卷】在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).【答案】(1)44.65岁;(2)0.89;(3)0.0014.【解析】【分析】(1)根据平均值等于各矩形的面积乘以对应区间的中点值的和即可求出;(2)设A={一人患这种疾病的年龄在区间[20,70)},根据对立事件的概率公式P(A)=1−P (A)即可解出;(3)根据条件概率公式即可求出.(1)平均年龄x̅=(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023 +55×0.020+65×0.012+75×0.006+85×0.002)×10=44.65(岁).(2)设A={一人患这种疾病的年龄在区间[20,70)},所以P(A)=1−P(A)=1−(0.001+0.002+0.006+0.002)×10=1−0.11=0.89.(3)设B={任选一人年龄位于区间[40,50)},C={任选一人患这种疾病},则由条件概率公式可得P(C|B)=P(BC)P(B)=0.1%×0.023×1016%=0.001×0.230.16=0.0014375≈0.0014.15.【2022年北京】在校运动会上,只有甲、乙、丙三名同学参加铅球比赛,比赛成绩达到9.50m以上(含9.50m)的同学将获得优秀奖.为预测获得优秀奖的人数及冠军得主,收集了甲、乙、丙以往的比赛成绩,并整理得到如下数据(单位:m):甲:9.80,9.70,9.55,9.54,9.48,9.42,9.40,935,9.30,9.25;乙:9.78,9.56,9.51,9.36,9.32,9.23;丙:9.85,9.65,9.20,9.16.假设用频率估计概率,且甲、乙、丙的比赛成绩相互独立.(1)估计甲在校运动会铅球比赛中获得优秀奖的概率;(2)设X是甲、乙、丙在校运动会铅球比赛中获得优秀奖的总人数,估计X的数学期望E(X);(3)在校运动会铅球比赛中,甲、乙、丙谁获得冠军的概率估计值最大?(结论不要求证明)【答案】(1)0.4(2)75(3)丙【解析】【分析】(1)由频率估计概率即可(2)求解得X的分布列,即可计算出X的数学期望.(3)计算出各自获得最高成绩的概率,再根据其各自的最高成绩可判断丙夺冠的概率估计值最大.(1)由频率估计概率可得甲获得优秀的概率为0.4,乙获得优秀的概率为0.5,丙获得优秀的概率为0.5,故答案为0.4(2)设甲获得优秀为事件A1,乙获得优秀为事件A2,丙获得优秀为事件A3P(X=0)=P(A1̅̅̅A2̅̅̅A3̅̅̅)=0.6×0.5×0.5=3,20P(X=1)=P(A1A2̅̅̅A3̅̅̅)+P(A1̅̅̅A2A3̅̅̅)+P(A1̅̅̅A2̅̅̅A3)=0.4×0.5×0.5+0.6×0.5×0.5+0.6×0.5×0.5=8,20P(X=2)=P(A1A2A3̅̅̅)+P(A1A2̅̅̅A3)+P(A1̅̅̅A2A3)=0.4×0.5×0.5+0.4×0.5×0.5+0.6×0.5×0.5=7,20P(X=3)=P(A1A2A3)=0.4×0.5×0.5=2.20∴X的分布列为∴E(X)=0×320+1×820+2×720+3×220=75 (3)丙夺冠概率估计值最大.因为铅球比赛无论比赛几次就取最高成绩.比赛一次,丙获得9.85的概率为14,甲获得9.80的概率为110,乙获得9.78的概率为16.并且丙的最高成绩是所有成绩中最高的,比赛次数越多,对丙越有利.1.(2022·河南省杞县高中模拟预测(理))某市有11名选手参加了田径男子100米赛的选拔比赛,前5名可以参加省举办的田径赛,如果各个选手的选拔赛成绩均不相同,选手小强已经知道了自己的成绩,为了判断自己能否参加省举办的田径赛,他还需要知道这11名选手成绩的( ) A .平均数 B .中位数 C .众数 D .方差【答案】B 【解析】 【分析】中位数恰好是第6名,比中位数成绩高即可确认自己能否进入省田径赛. 【详解】因为11名选手成绩的中位数恰好是第6名,知道了第6名的成绩,小强就可以判断自己是否能参加省举办的田径赛了,其余数字特征不能反映名次. 故选:B .2.(2022·黑龙江·大庆实验中学模拟预测(理))2021年5月30日清晨5时01分,天舟二号货运飞船在成功发射约8小时后,与中国空间站天和核心舱完成自主快速交接.如果下次执行空间站的任务由3名航天员承担,需要在3名女性航天员和3名男性航天员中选择,则选出的3名航天员中既有男性航天员又有女性航天员的概率为( ) A .67B .910 C .25D .415【答案】B 【解析】 【分析】利用对立事件和古典概型的概率公式求解即可. 【详解】设“选出的3名航天员中既有男性航天员又有女性航天员”为事件M ,则()333336C C 91C 10P M ==+-.故选:B.3.(2022·全国·模拟预测(文))如图是一组实验数据的散点图,拟合方程()0by c x x=+>,令1t x=,则y 关于t 的回归直线过点()2,5,()12,25,则当()1.01,1.02y ∈时,x 的取值范围是( )A .()0.01,0.02B .()50,100C .()0.02,0.04D .()100,200【答案】D 【解析】 【分析】 先令1t x =可得()0y bt c t =+>,由y 关于t 的回归直线过点()2,5,()12,25可得522512b c b c=+⎧⎨=+⎩从而求得21y t =+,再由y 的范围求得t 的范围,进而求得x 的范围. 【详解】根据题意可得()0y bt c t =+>,由y 关于t 的回归直线过点()2,5,()12,25可得:522512b cb c =+⎧⎨=+⎩,所以2,1b c ==, 所以21y t =+,由()1.01,1.02y ∈可得1.0121 1.02t <+<, 所以0.0050.01t <<, 所以10.0050.01x<<,所以100200x <<, 故选:D4.(2022·辽宁实验中学模拟预测)某国计划采购疫苗,现在成熟的疫苗中,三种来自中国,一种来自美国,一种来自英国,一种由美国和德国共同研发,从这6种疫苗中随机采购三种,若采购每种疫苗都是等可能的,则买到中国疫苗的概率为( ) A .16B .12C .910D .1920【答案】D 【解析】 【分析】由对立事件的概率公式计算. 【详解】没有买到中国疫苗的概率为13611C 20P ==, 所以买到中国疫苗的概率为119120P P =-=. 故选:D .5.(2022·四川省泸县第二中学模拟预测(理))食物链亦称“营养链”,是指生态系统中各种生物为维持其本身的生命活动,必须以其他生物为食物的这种由食物联结起来的链锁关系.如图为某个生态环境中的食物链,若从鹰、麻雀、兔、田鼠以及蝗虫中任意选取两种,则这两种生物不能构成摄食关系的概率( )A .35B .25C .23D .13【解析】 【分析】用列举法写出构成的摄食关系,计数后可求得概率. 【详解】从鹰、麻雀、兔、田鼠以及蝗虫中任意选取两种,共有10种选法:鹰麻雀,鹰兔,鹰田鼠,鹰蝗虫,麻雀兔,麻雀田鼠,麻雀蝗虫,兔田鼠,兔蝗虫,田鼠蝗虫.其中田鼠鹰,兔鹰,麻雀鹰,蝗虫麻雀共四种可构成摄食关系,不能构成摄食关系的有6种,所以概率为63105P ==. 故选:A .6.(2022·山东潍坊·模拟预测)Poisson 分布是统计学里常见的离散型概率分布,由法国数学家西莫恩·德尼·泊松首次提出,Poisson 分布的概率分布列为()()e 0,1,2,!kP X K k k λλ-===⋅⋅⋅,其中e 为自然对数的底数,λ是Poisson 分布的均值.当二项分布的n 很大()20n ≥而p 很小()0.05p ≤时,Poisson 分布可作为二项分布的近似.假设每个大肠杆菌基因组含有10000个核苷酸对,采用20.05/J m 紫外线照射大肠杆菌时,每个核苷酸对产生嘧啶二体的概率均为0.0003,已知该菌株基因组有一个嘧啶二体就致死,则致死率是( ) A .31e -- B .3e - C .313e -- D .314e --【答案】A 【解析】 【分析】结合题意1000020n =≥,0.00030.05p =≤,此时Poisson 分布满足二项分布的近似条件,再计算二项分布的均值为Poisson 分布的均值λ,再代入公式先求不致死的概率,再用对立事件的概率和为1计算即可 【详解】由题, 1000020n =≥,0.00030.05p =≤,此时Poisson 分布满足二项分布的近似的条件,此时100000.00033λ=⨯=,故不致死的概率为()03330e e 0!P X --===,故致死的概率为()3101e P X --==-7.(2022·河南安阳·模拟预测(理))某房产销售公司有800名销售人员,为了了解销售人员上一个季度的房屋销量,公司随机选取了部分销售人员对其房屋销量进行了统计,得到上一季度销售人员的房屋销量(20,4)X N ,则全公司上一季度至少完成22套房屋销售的人员大概有( )附:若随机变量X 服从正态分布()2,N μσ,则()0.6827P X μσμσ-<≤+≈,(22)0.9545P X μσμσ-<≤+≈,(33)0.9973P X μσμσ-<≤+≈.A .254人B .127人C .18人D .36人【答案】B 【解析】 【分析】根据正态分布的性质求出()22P X ≥,从而估计出人数; 【详解】 解:因为(20,4)X N ,所以20μ=,2σ=,所以()1()10.6827220.1586522P X P X μσμσ--<≤+-≥===所以全公司上一季度至少完成22套房屋销售的人员大概有8000.15865127⨯≈(人); 故选:B8.(2022·河南·模拟预测)某公司生产的一种产品按照质量由高到低分为A ,B ,C ,D 四级,为了增加产量、提高质量,该公司改进了一次生产工艺,使得生产总量增加了一倍.为了解新生产工艺的效果,对改进生产工艺前、后的四级产品的占比情况进行了统计,绘制了如下扇形图:根据以上信息:下列推断合理的是( ) A .改进生产工艺后,A 级产品的数量没有变化B.改进生产工艺后,D级产品的数量减少C.改进生产工艺后,C级产品的数量减少D.改进生产工艺后,B级产品的数量增加了不到一倍【答案】C【解析】【分析】由题可得改进生产工艺前后四个等级的生产量,逐项分析即得.【详解】设原生产总量为1,则改进生产工艺后生产总量为2,所以原A,B,C,D等级的生产量为0.3,0.37,0.28,0.05,改进生产工艺后四个等级的生产量为0.6,1.2,0.12,0.08,故改进生产工艺后,A级产品的数量增加,故A错误;改进生产工艺后,D级产品的数量增加,故B错误;改进生产工艺后,C级产品的数量减少,故C正确;改进生产工艺后,B级产品的数量增加超过2倍,故D错误.故选:C.9.(2022·河南安阳·模拟预测(文))为推动就业与培养有机联动、人才供需有效对接,促进高校毕业生更加充分更高质量就业,教育部今年首次实施供需对接就业育人项目.现安排甲、乙两所高校与3家用人单位开展项目对接,若每所高校至少对接两家用人单位,则两所高校的选择涉及到全部3家用人单位的概率为()A.12B.23C.34D.1316【答案】D【解析】【分析】由古典概型与对立事件的概率公式求解即可【详解】因为每所高校至少对接两家用人单位,所以每所高校共有2333314C C+=+=种选择,所以甲、乙两所高校共有4416⨯=种选择,其中甲、乙两所高校的选择涉及两家用人单位的情况有233C =种,所以甲、乙两所高校的选择涉及到全部3家用人单位的概率为31311616P =-=, 故选:D10.(2022·江苏·南京师大附中模拟预测)某同学在课外阅读时了解到概率统计中的马尔可夫不等式,该不等式描述的是对非负的随机变量X 和任意的正数a ,都有()()(),P X a f E X a ≥≤,其中()(),f E X a 是关于数学期望()E X 和a 的表达式.由于记忆模糊,该同学只能确定()(),f E X a 的具体形式是下列四个选项中的某一种.请你根据自己的理解,确定该形式为( ) A .()aE X B .()1aE XC .()a E XD .()E X a【答案】D 【解析】 【分析】根据期望的计算公式,以及m x a ≥即可求解. 【详解】设非负随机变量X 的所有可能取值按从小到大依次为0,i x i N *>∈,对应的概率分别为,0i i p p >设满足i x a ≥的有,,,m a a x k m n m N k N **≤≤∈∈,()ani i k P X a p =≥=∑,()111a ai nk i iii n i ii k i ax pE ax p x pX a -===+==∑∑∑,因为m x a ≥,所以1mx a≥()()()1111a a aaannniiiiiik k i k i k i k ii i i i x px px px p p P X a P X a E aa aaaX --=====⎛⎫+≥+=+≥≥≥ ⎪⎝⎭=∑∑∑∑∑故选:D11.(2022·吉林·三模(理))为了切实维护居民合法权益,提高居民识骗防骗能力,守好居民的“钱袋子”,某社区开展“全民反诈在行动——反诈骗知识竞赛”活动,现从参加该活动的居民中随机抽取了100名,统计出他们竞赛成绩分布如下:(1)求抽取的100名居民竞赛成绩的平均分x 和方差2s (同一组中数据用该组区间的中点值为代表);(2)以频率估计概率,发现该社区参赛居民竞赛成绩X 近似地服从正态分布()2,N μσ,其中μ近似为样本成绩平均分x ,2σ近似为样本成缋方差2s ,若2μσμσ-<≤+X ,参赛居民可获得“参赛纪念证书”;若2μσ>+X ,参赛居民可获得“反诈先锋证书”,①若该社区有3000名居民参加本次竞赛活动,试估计获得“参赛纪念证书”的居民人数(结果保留整数);②试判断竞赛成绩为96分的居民能否获得“反诈先锋证书”. 附:若()2,XN μσ,则()0.6827P X μσμσ-<≤+≈,(22)0.9545P X μσμσ-<≤+≈,(33)0.9973P X μσμσ-<≤+≈.【答案】(1)75x =,2100s = (2)①2456 ;②能 【解析】 【分析】(1)利用公式直接求出均值、方差即可;(2)①结合给的概率和正态分布的性质,确定获得“参赛纪念证书”,进而计算可得人数; ②利用正态分布的知识求出2μσ>+X ,即95>X ,进而可得结果. (1)100名居民本次竞赛成绩平均分24224028445556575859575100100100100100100=⨯+⨯+⨯+⨯+⨯+⨯=x , 100名居民本次竞赛成绩方差22222422(4575)(5575)(6575)100100100=-⨯+-⨯+-⨯s 22240284(7575)(8575)(9575)100100100100+-⨯+-⨯+-⨯=, (2)①由于μ近似为样本成绩平均分x ,2σ近似为样本成绩方差2s , 所以,275,100μσ==,可知,10σ=,由于竞赛成绩X 近似地服从正态分布()2,N μσ,因此竞赛居民可获得“参赛纪念证书”的概率 (2)P X μσμσ-<≤+11()(22)22μσμσμσμσ=-<≤++-<≤+P X P X 110.68270.95450.818622≈⨯+⨯= 30000.81862455.82456⨯=≈估计获得“参赛纪念证书”的居民人数为2456;②当2μσ>+X 时,即95>X 时,参赛居民可获得“反诈先锋证书”, 所以竞赛成绩为96分的居民能获得“反诈先峰证书”.12.(2022·贵州·贵阳一中模拟预测(文))“十四五”规划纲要提出,全面推动长江经济带发展,协同推动生态环境保护和经济发展长江水资源约占全国总量的36%,长江流域河湖、水库、湿地面积约占全国的20%,珍稀濒危植物占全国的39.7%,淡水鱼类占全国的33%.长江经济带在我国生态文明建设中占据重要位置.长江流域某地区经过治理,生态系统得到很大改善,水生动物数量有所增加.为调查该地区某种水生动物的数量,将其分成面积相近的100个水域,从这些水域中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据()(),1,2,,20,i i x y i =其中i x 和i y 分别表示第i 个样区的水草覆盖面积(单位:公顷)和这种水生动物的数量,并计算得20160i i x ==∑,2011200i i y ==∑,2021-)120,i i x x ==∑(2021-)9000,i i y ==∑(y 201-)-)1000.i iix x y ==∑((y (1)求该地区这种水生动物数量的估计值(这种水生动物数量的估计值等于样区这种水生动物数量的平均数乘以地块数); (2)求样本()(),1,2,,20i i x y i =的相关系数(精确到0.01);(3)根据现有统计资料,各地块间水草覆盖面积差异很大.为提高样本的代表性以获得该地区这种水生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数-)-) 1.732.niix y x r =≈∑((y【答案】(1)6000 (2)0.96(3)采用分层抽样的方法,理由见解析 【解析】 【分析】(1)根据该地区这种水生动物数量的估计值的计算方法求解即可; (2)根据相关系数的公式求解即可;(3)根据(2)中的结论各样区的这种水生动物的数量与水草覆盖面积有很强的正相关性考虑即可 (1)样区水生动物平均数为201111200602020i i y ==⨯=∑, 地块数为100,该地区这种水生动物的估计值为100606000⨯=. (2)样本()(),1,2,,20i i x y i =⋯的相关系数为()()20,0.96.iix x y y r -===≈∑ (3)由(2)知各样区的这种水生动物的数量与水草覆盖面积有很强的正相关性,由于各地块间水草覆盖面积差异很大,从而各地块间这种野生动物的数量差异很大,所以采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,从而可以获得该地区这种水生动物数量更准确的估计.13.(2022·河南开封·模拟预测(理))大豆是我国重要的农作物,种植历史悠久.某种子实验基地培育出某大豆新品种,为检验其最佳播种日期,在A ,B 两块试验田上进行实验(两地块的土质等情况一致).6月25日在A 试验田播种该品种大豆,7月10日在B 试验田播种该品种大豆.收获大豆时,从中各随机抽取20份(每份1千粒),并测量出每份的质量(单位:克),按照[)100,150,[)150,200,[]200,250进行分组,得到如下表格:。
2019年全国高考数学·分类汇编 专题05 统计(解析版)

专题05 统计【母题来源】【2019年高考全国Ⅱ卷理数】演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A.中位数B.平均数C.方差D.极差【答案】A【命题意图】高考对本部分内容的考查以能力为主,重点考查用样本估计总体.【命题规律】考查系统抽样、分层抽样的应用,利用随机抽样的方法解决抽取样本的相关问题,利用频率分布直方图计算(求频率、频数等)样本数据的数字特征(平均数、方差、标准差等). 根据样本数据求基本的数字特征,利用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题.【答题模板】解答本类题目,以2019年高考真题为例,一般考虑如下两步:第一步:明确相关概念以及计算公式.第二步:根据概念以及公式求结果.【方法总结】(1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.(2)已知频率分布直方图,求某种范围内的数据,可利用图形及已知范围结合求解.(3)平均数和方差都是重要的数字特征,是对总体的一种简明的阐述.平均数、中位数、众数描述总体的集中趋势,方差和标准差描述波动大小.1.【东北师大附中、重庆一中、吉大附中、长春十一中等2019届高三联合模拟考试数学试题】已知甲、乙两组数据的茎叶图如图所示,若它们的中位数相同,则甲组数据的平均数为A.32 B.33C.34 D.35【答案】A2.【黑龙江省哈尔滨市呼兰区第一中学2019届高三上学期第三次(12月)数学试题】甲、乙两名同学八次数学测试成绩如茎叶图所示,则甲同学成绩的众数与乙同学成绩的中位数依次为A.85,86 B.85,85,C.86,85 D.86,86【答案】B3.【四川省泸州市泸县第一中学2019届高三三诊模拟数学试题】军训时,甲、乙两名同学进行射击比赛,共比赛10场,每场比赛各射击四次,且用每场击中环数之和作为该场比赛的成绩.数学老师将甲、乙两名同学的10场比赛成绩绘成如图所示的茎叶图,并给出下列4个结论:(1)甲的平均成绩比乙的平均成绩高;(2)甲的成绩的极差是29;(3)乙的成绩的众数是21;(4)乙的成绩的中位数是18.则这4个结论中,正确结论的个数为A.1 B.2 C.3 D.4【答案】C4.【甘肃省白银市靖远县2019届高三第四次联考数学试题】某学生5次考试的成绩(单位:分)分别为85,67,m,m ,若该学生在这5次考试中成绩的中位数为80,则得分的平均数不可能为80,93,其中0A.70B.75C.80D.85【答案】D5.【辽宁省辽阳市2019届高三下学期一模数学试题】某市体育局将从甲、乙、丙、丁四人中选一人参加全省100米仰泳比赛,现将他们最近集训的10次成绩(单位:秒)的平均数与方差制成表格如下:根据表中的数据,应选哪位选手参加全省的比赛A.甲B.乙C.丙D.丁【答案】D6.【甘肃省天水市第一中学2019届高三一轮复习第六次质量检测数学试题】甲乙两名同学6次考试的成绩统计如图,甲乙两组数据的平均数分别为x 甲、x 乙标准差分别为σ甲、σ乙,则A .x x <甲乙,σσ<甲乙B .x x <甲乙,σσ>甲乙C .x x >甲乙,σσ<甲乙D .x x >甲乙,σσ>甲乙【答案】C7.【辽宁省大连市2019年普通高中学生学业水平考试模拟数学试题】在某次考试中,共有100个学生参加考试,如果某题的得分情况如表:那么这些得分的众数是 A .37.0% B .20.2%C .0分D .4分【答案】C8.【甘肃、青海、宁夏2019届高三3月联考数学试题】从某小学随机抽取100名学生,将他们的身高(单位:厘米)分布情况汇总如表:由此表估计这100名小学生身高的中位数为(精确到0.1) A .119.3 B .119.7 C .123.3 D .126.7【答案】C9.【吉林省长春市2019届高三质量监测(二)数学试题卷】下边的折线图给出的是甲、乙两只股票在某年中每月的收盘价格,已知股票甲的极差是6.88元,标准差为2.04元;股票乙的极差为27.47元,标准差为9.63元,根据这两只股票在这一年中的波动程度,给出下列结论:①股票甲在这一年中波动相对较小,表现的更加稳定;②购买股票乙风险高但可能获得高回报;③股票甲的走势相对平稳,股票乙的股价波动较大;④两只般票在全年都处于上升趋势.其中正确结论的个数是A.1 B.2 C.3 D.4【答案】C10.【山东省临沂市2019届高三2月教学质量检测数学试题】已知8位学生的某次数学测试成绩的茎叶图如图,则下列说法正确的是A.众数为7 B.极差为19C.中位数为64.5 D.平均数为64【答案】C11.【宁夏银川一中2019届高三年级第二次模拟考试数学试题】高铁、扫码支付、共享单车、网购被称为中国的“新四大发明”,为评估共享单车的使用情况,选了n座城市作实验基地,这n座城市共享单车的使用量(单位:人次/天)分别为x1,x2,…,x n,下面给出的指标中可以用来评估共享单车使用量的稳定程度的是A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数【答案】B12.【新疆2019届高三第一次毕业诊断及模拟测试数学试题】在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是A.甲地:总体均值为3,中位数为4B.乙地:总体均值为1,总体方差大于0C.丙地:中位数为2,众数为3D.丁地:总体均值为2,总体方差为3【答案】D。
专题16 统计-2023年高考数学真题题源解密(新高考)(解析版)

专题16 统计目录一览2023真题展现考向一样本的数字特征考向二频率分布直方图真题考查解读近年真题对比考向一样本的数字特征考向二频率分布直方图考向三独立性检验命题规律解密名校模拟探源易错易混速记/二级结论速记考向一样本的数字特征1.(多选)(2023•新高考Ⅰ•第9题)有一组样本数据x1,x2,⋯,x6,其中x1是最小值,x6是最大值,则( )A.x2,x3,x4,x5的平均数等于x1,x2,⋯,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,⋯,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,⋯,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,⋯,x6的极差【答案】BD解:A选项,x2,x3,x4,x5的平均数不一定等于x1,x2,⋯,x6的平均数,A错误;B选项,x2,x3,x4,x5的中位数等于x3x42,x1,x2,⋯,x6的中位数等于x3x42,B正确;C选项,设样本数据x1,x2,⋯,x6为0,1,2,8,9,10,可知x1,x2,⋯,x6的平均数是5,x2,x3,x4,x5的平均数是5,x1,x2,⋯,x6的方差s12=16×[(0﹣5)2+(1﹣5)2+(2﹣5)2+(8﹣5)2+(9﹣5)2+(10﹣5)2]=50,x2,x3,x4,x5的方差s22=14×[(1﹣5)2+(2﹣5)2+(8﹣5)2+(9﹣5)2]=252,s12>s22,∴s1>s2,C错误.D选项,x6>x5,x2>x1,∴x6﹣x1>x5﹣x2,D正确.考向二频率分布直方图2.(2023•新高考Ⅱ•第19题)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性,此检测标准的漏诊率是将患病者判定为阴性的概率,记为p(c);误诊率是将未患病者判定为阳性的概率,记为q(c).假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.(1)当漏诊率p(c)=0.5%时,求临界值c和误诊率q(c);(2)设函数f(c)=p(c)+q(c).当c∈[95,105],求f(c)的解析式,并求f(c)在区间[95,105]的最小值.解:(1)当漏诊率p(c)=0.5%时,则(c﹣95)•0.002=0.5%,解得c=97.5;q(c)=0.01×2.5+5×0.002=0.035=3.5%;(2)当c∈[95,100]时,f(c)=p(c)+q(c)=(c﹣95)•0.002+(100﹣c)•0.01+5×0.002=﹣0.008c+0.82≥0.02,当c∈(100,105]时,f(c)=p(c)+q(c)=5×0.002+(c﹣100)•0.012+(105﹣c)•0.002=0.01c﹣0.98>0.02,故f(c)=−0.008c+0.82,95≤c≤100 0.01c−0.98,100<c≤105,所以f(c)的最小值为0.02.【命题意图】考查样本的数字特征、频率分布直方图、相关性、独立性检验.【考查要点】考查相关性、频率分布直方图、样本的数字特征、独立性检验、回归分析等.考查学生读取数据、分析数据、处理数据的能力.【得分要点】1.众数、中位数、平均数(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(x1+x2+⋯+x n).(3)平均数:一组数据的算术平均数,即x=1n2.频率分布直方图(1)频率分布直方图:在直角坐标系中,横轴表示样本数据,纵轴表示频率与组距的比值,将频率分布表中的各组频率的大小用相应矩形面积的大小来表示,由此画成的统计图叫做频率分布直方图.(2)频率分布直方图的特征①各长方形面积等于相应各组的频率的数值,所有小矩形面积和为1.②从频率分布直方图可以清楚地看出数据分布的总体趋势.③从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息被抹掉.(3)频率分布直方图求数据①众数:频率分布直方图中最高矩形的底边中点的横坐标.②平均数:频率分布直方图各小矩形的面积乘底边中点的横坐标之和.③中位数:把频率分布直方图分成两个面积相等部分的平行于y轴的直线横坐标.3.极差、方差与标准差(1)①用一组数据中最大数据减去最小数据的差来反映这组数据的变化范围,这个数据就叫极差.②一组数据中各数据与平均数差的平方和的平均数叫做方差.③方差的算术平方根就为标准差.(2)方差和标准差都是反映这组数据波动的大小,方差越大,数据的波动越大.4.独立性检验(1)分类变量: 如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)原理:假设性检验.一般情况下:假设分类变量X 和Y 之间没有关系,通过计算K 2值,然后查表对照相应的概率P ,发现这种假设正确的概率P 很小,从而推翻假设,最后得出X 和Y 之间有关系的可能性为(1﹣P ),也就是“X 和Y 有关系”.(表中的k 就是K 2的观测值,即k =K 2).利用随机变量2K (也可表示为2χ)2()()()()()n ad bc a b c d a c b d -=++++(其中n a b c d =+++为样本容量)来判断“两个变量有关系”的方法称为独立性检验.(3)2×2列联表:设X ,Y 为两个变量,它们的取值分别为12{}x x ,和12{}y y ,,其样本频数列联表(22⨯列联表)如下:1y 2y 总计1x a b a b +2x cd c d+总计a c+b d+a b c d+++(4)范围:K 2∈(0,+∞);性质:K 2越大,说明变量间越有关系.(5)解题步骤:①认真读题,取出相关数据,作出2×2列联表;②根据2×2列联表中的数据,计算K 2的观测值k ;③通过观测值k 与临界值k 0比较,得出事件有关的可能性大小.考查相关性、频率分布直方图、样本的数字特征、独立性检验、回归分析等.考查形式以多选题和解答题为主。
专题16 决策问题-2021年新高考数学题型全归纳之概率统计(解析版)

专题16 决策问题例1. 某公司准备上市一款新型轿车零配件,上市之前拟在其一个下属4S 店进行连续30天的试销,定价为1000元/件.(1)设日销售40个零件的概率为(01)p p <<,记5天中恰有2天销售40个零件的概率为z ,写出z 关于p 的函数关系式.(2)试销结束后统计得到该4S 店这30内的日销售量(单位:件)的数据如下表:其中,有两个数据未给出.试销结束后,这款零件正式上市,每件的定价仍为1000元,但生产公司对该款零件不零售,只提供零件的整箱批发,大箱每箱有55件,批发价为550元/件;小箱每箱有40件,批发价为600元/件,以这30天统计的各日销售量的频率作为试销后各日销售量发生的概率.该4S 店决定每天批发两箱,若同时批发大箱和小箱,则先销售小箱内的零件,同时根据公司规定,当天没销售出的零件按批发价的9折转给该公司的另一下属4S 店,假设日销售量为80件的概率为15.(i )设该4S 店批发两大箱,当天这款零件的利润为随机变量X ;批发两小箱,当天这款零件的利润为随机变量Y ,求EX 和EY ;(ii )以日利润的数学期望作为决策依据,该4S 店每天应该按什么方案批发零件?【解析】(1)由题意可得223235(1)10(1)z C p p p p =-=-,01p <<,(2)由题意日销售量为80件的概率为15,日销售量为100的概率为32111105510---=,(i )批发两大箱,则批发成本为60500元,当日销售量为40件时,利润为:401000605007055090% 1.415⨯-+⨯⨯=(万元), 当日销售量为60件时,利润为:601000605005055090% 2.425⨯-+⨯⨯=(万元),当日销售量为80件时,利润为:801000605003055090% 3.435⨯-+⨯⨯=(万元), 当日销售量为100件时,利润为:1001000605001055090% 4.445⨯-+⨯⨯=(万元), 32111.415 2.425 3.435 4.445 2.526105510EX ∴=⨯+⨯+⨯+⨯=(万元).若批发两小箱,则批发成本为48000元,当日销售量为40件时,利润为:401000480004060090% 1.36⨯-+⨯⨯=(万元), 当日销售量为60件时,利润为:601000480002060090% 2.28⨯-+⨯⨯=(万元), 当日销售量为80件或100件时,利润为:80100048000 3.2⨯-=(万元), 3231.36 2.28 3.2 2.2810510EY ∴=⨯+⨯+⨯=(万元). (ii )当4S 店批发一大箱和一小箱时,成本为54250万元,当天这款零件的利润为随机变量ξ, 当日销售量为40件时,利润为:401000542505555090% 1.2975⨯-+⨯⨯=(万元), 当日销售量为60件时,利润为:601000542503555090% 2.3075⨯-+⨯⨯=(万元), 当日销售量为80件时,利润为:801000542501555090% 3.3175⨯-+⨯⨯=(万元), 当日销售量为100件时,利润为:95100054250 4.075⨯-=(万元), 32111.2975 2.3075 3.3175 4.075 2.38325105510E ∴=⨯+⨯+⨯+⨯=ξ(万元). EY E EX ∴<<ξ,∴以日利润的数学期望作为决策依据,该4S 店每天应该按批发两大箱.例2. 某工厂预购买软件服务,有如下两种方案:方案一:软件服务公司每日收取工厂60元,对于提供的软件服务每次10元;方案二:软件服务公司每日收取工厂200元,若每日软件服务不超过15次,不另外收费,若超过15次,超过部分的软件服务每次收费标准为20元.(1)设日收费为y 元,每天软件服务的次数为x ,试写出两种方案中y 与x 的函数关系式;(2)该工厂对过去100天的软件服务的次数进行了统计,得到如图所示的条形图,依据该统计数据,把频率视为概率,从节约成本的角度考虑,从两个方案中选择一个,哪个方案更合适?请说明理由.【解析】解:(1)由题可知,方案一中的日收费y 与x 的函数关系式为1060=+y x ,∈x N . 方案二中的日收费y 与x 的函数关系式为200152010015⎧≤∈⎪=⎨->∈⎪⎩,,,,x x N y x x x N .(2)设方案一中的日收费为X ,由条形图可得X 的分布列为).所以从节约成本的角度考虑,选择方案一.例3. 某厂有4台大型机器,在一个月中,一台机器至多出现1次故障,出现故障时需1名工人进行维修,且每台机器是否出现故障是相互独立的,每台机器出现故障的概率为13.(1)若出现故障的机器台数为X ,求X 的分布列;(2)该厂到多少名工人才能保证每台机器在任何时刻同时出现故障时能及时进行维修的概率不小于90%? (3)已知一名工人每月只有维修1台机器的能力,每月需支付给每位工人1万元的工资,每台机器不出现故障或出现故障能及时维修,就产生5万元的利润,否则将不产生利润,若该厂现有2名工人,求该厂每月获利的数学期望.【解析】解:(1)一台机器运行是否出现故障看作一次实验,在一次试验中,机器出现故障的概率为13,4台机器相当于4次独立试验,设出现故障的机器台数为X ,则143~(,)X B ,0442160381===()()P X C , 134123213381==⋅⋅=()()P X C , 2224122423381===()()()P X C , 33412833381===()()()P X C , 则的分布列为:(2)设该厂有n 名工人,则“每台机器在任何时刻同时出现故障能及时进行维修”为X n ,则,,,,,这个互斥事件的和事件,则:7280908181≤≤%, ∴至少要3名工人,才能保证每台机器在任何时刻同时出现故障时能及时进行维修的概率不小于90%.(3)设该厂获利为Y 万元,则Y 的所有可能取值为18,13,8, 721801281===+=+==()()()()P Y P X P X P X , 813381====()()P Y P X , 18481====()()P Y P X ,728114081813881818181∴=⨯+⨯+⨯=()E Y . ∴该厂获利的均值为140881. 例4. 某精密仪器生产车间每天生产n 个零件,质检员小张每天都会随机地从中抽取50个零件进行检查是否合格,若较多零件不合格,则需对其余所有零件进行检查.根据多年的生产数据和经验,这些零件的长度服从正态分布10(N ,201.)(单位:微米μ)m ,且相互独立.若零件的长度d 满足97103μμ<<..m d m ,则认为该零件是合格的,否则该零件不合格.(1)假设某一天小张抽查出不合格的零件数为X ,求2≥()P X 及X 的数学期望EX ;(2)小张某天恰好从50个零件中检查出2个不合格的零件,若以此频率作为当天生产零件的不合格率.已知检查一个零件的成本为10元,而每个不合格零件流入市场带来的损失为260元.假设n 充分大,为了使损失尽量小,小张是否需要检查其余所有零件,试说明理由.附:若随机变量ξ服从正态分布2μσ(,)N ,则3309987μσξμσ-<<+=().P ,500998709370=..,49099870001300012⨯=....【解析】解:(1)1495050211010998700013099870003≥=-=-==-⋅⋅-=()()()....P X P X P X C , 由于X 满足二项分布,故00013500065=⨯=..EX . (2)由题意可知不合格率为250, 若不检查,损失的期望为2522602020505=⨯⨯-=-()E Y n n , 若检查,成本为10n ,由于5221020102055-=--=-()E Y n n n n , 当n 充分大时,2102005-=->()E Y n n 所以为了使损失尽量小,小张需要检查其余所有零件.例5. 某企业质量检验员为了检测生产线上零件的质量情况,从生产线上随机抽取了80个零件进行测量,根据所测量的零件尺寸(单位:)mm ,得到如图的频率分布直方图:(1)根据频率分布直方图,求这80个零件尺寸的中位数(结果精确到001.);(2)若从这80个零件中尺寸位于625[.,645.)之外的零件中随机抽取4个,设X 表示尺寸在645[.,65]上的零件个数,求X 的分布列及数学期望EX ;(3)已知尺寸在630[.,645.)上的零件为一等品,否则为二等品,将这80个零件尺寸的样本频率视为概率.现对生产线上生产的零件进行成箱包装出售,每箱100个.企业在交付买家之前需要决策是否对每箱的所有零件进行检验,已知每个零件的检验费用为99元.若检验,则将检验出的二等品更换为一等品;若不检验,如果有二等品进入买家手中,企业要向买家对每个二等品支付500元的赔偿费用.现对一箱零件随机抽检了11个,结果有1个二等品,以整箱检验费用与赔偿费用之和的期望值作为决策依据,该企业是否对该箱余下的所有零件进行检验?请说明理由.【解析】解:(1)由于620[.,630.)内的频率为0075022505015+⨯=(..)..,630[.,635.)内的频率为075050375⨯=..., 设中位数为630∈[.x ,635.),由0156307505+-⨯=.()..x ,得6347≈.x ,故中位数为63.47;(2)这80个零件中尺寸位于625[.,645.)之外的零件共有7个,其中尺寸位于620[.,625.)内的有3个, 位于645[.,65)共有4个,随机抽取4个, 则1=X ,2,3,4,3134474135===()C C P X C , 22344718235===()C C P X C ,133********===()C C P X C , 44471435===()C P X C ,418121161234353535357=⋅+⋅+⋅+⋅=EX ; (3)根据图象,每个零件是二等品的概率为0075022501000502=++⨯=(...)..P , 设余下的89个零件中二等品的个数为8902~(,.)Y B , 由二项分布公式,8902178=⨯=..EY ,若不对余下的零件作检验,设检验费用与赔偿费用的和为S ,11995001089500=⨯+=+S Y Y ,若对余下的零件作检验,则这一箱检验费用为9900元, 以整箱检验费用与赔偿费用之和的期望值作为决策依据, 则11995009989=⨯+=ES EY ,因为9900>ES ,所以应该对余下的零件作检验.(或者9989=ES 与9900相差不大,可以不做检验都行.)例6. 某单位准备购买三台设备,型号分别为A ,B ,C 已知这三台设备均使用同一种易耗品,提供设备的商家规定:可以在购买设备的同时购买该易耗品,每件易耗品的价格为100元,也可以在设备使用过程中,随时单独购买易耗品,每件易耗品的价格为200元.为了决策在购买设备时应同时购买的易耗品的件数.该单位调查了这三种型号的设备各60台,调査每台设备在一个月中使用的易耗品的件数,并得到统计将调查的每种型号的设备的频率视为概率,各台设备在易耗品的使用上相互独立. (1)求该单位一个月中A ,B ,C 三台设备使用的易耗品总数超过21件的概率;(2)以该单位一个月购买易耗品所需总费用的期望值为决策依据,该单位在购买设备时应同时购买20件还是21件易耗品?【解析】解:(1)由题中的表格可知A 型号的设备一个月使用易耗品的件数为6和7的频率均为301602=, B 型号的设备一个月使用易耗品的件数为6,7,8的频率均为301301101602602606===,,, C 型号的设备一个月使用易耗品的件数为7和8的频率均为453151604604==,, 设该单位一个月中A ,B ,C 三台设备使用易耗品的件数分别为x ,y ,z ,则1672====()()P x P x ,116732====(),()P x P x , 131878644======(),(),()P y P z P z ,设该单位三台设备一个月中使用易耗品的件数总数为X , 则212223>==+=()()()P X P X P X ,而22688778787=====+===+===()(,,)(,,)(,,)P X P x y z P x y z P x y z 111111113726422426448=⨯⨯+⨯⨯+⨯⨯=11112378826448======⨯⨯=()(,,)P X P x y z , 故7112148486>=+=()P X ,即该单位一个月中A ,B ,C 三台设备使用的易耗品总数超过21件的概率为16; (2)以题意知,X 所有可能的取值为19,20,21,22,23, 1131196672348======⨯⨯=()(,,)P X P x y z , 20668677767=====+===+===,,()(,,)(,,)()P X P x y z P x y z P x y z 1111131131723422423448=⨯⨯+⨯⨯+⨯⨯=21678687768777=====+===+===+===()(,,)(,,)(,,)(,,)P X P x y z P x y z P x y z P x y z 1111131111131722426423422448=⨯⨯+⨯⨯+⨯⨯+⨯⨯=由(1)知,7122234848====(),()P X P X , 若该单位在购买设备的同时购买了20件易耗品,设该单位一个月中购买易耗品所需的总费用为1Y 元,则1Y 的所有可能取值为2000,2200,2400,2600, 1117232000192084848===+==+=()()()P Y P X P X , 11722002148====()()P Y P X , 1724002248====()()P Y P X , 1126002348====()()P Y P X , 12317712000220024002600214248484848=⨯+⨯+⨯+⨯≈EY , 若该单位在购买设备的同时购买了21件易耗品,设该单位一个月中购买易耗品所需的总费用为2Y 元,则2Y 的所有可能取值为2100,2300,2500,21171752100192021848486===+=+==++=()()()()P Y P X P X P X , 2723002248====()()P Y P X , 2125002348====()()P Y P X , 2571210023002500213864848=⨯+⨯+⨯≈EY , 故21<EY EY ,所以该单位在购买设备时应该购买21件易耗品.例7. 自2013年10月习近平主席提出建设“一带一路”的合作倡议以来,我国积极建立与沿线国家的经济合作伙伴关系.某公司为了扩大生产规模,欲在海上丝绸之路经济带(南线):泉州-福州-广州-海口-北海(广西)-河内-吉隆坡-雅加达-科伦坡-加尔各答-内罗毕-雅典-威尼斯的13个城市中选择3个城市建设自己的工业厂房,根据这13个城市的需求量生产某产品,并将其销往这13个城市. (1)求所选的3个城市中至少有1个在国内的概率;(2)已知每间工业厂房的月产量为10万件,若一间厂房正常生产,则每月或获得利润100万;若一间厂房闲置,则该厂房每月亏损50万,该公司为了确定建设工业厂房的数目()*1013,n n n N ≤≤∈,统计了近5年来这13个城市中该产品的月需求量数据,得如下频数分布表:若以每月需求量的频率代替每月需求量的概率,欲使该产品的每月总利润的数学期望达到最大,应建设工业厂房多少间?【解析】(1)记事件A 为“该公司所选的3个城市中至少有1个在国内”,则()()3831328115111143143C P A P A C =-=-=-=, 所以该公司所选的3个城市中至少有1个在国内的概率为115143. (2)设该产品每月的总利润为Y ,①当10n =时,1000Y =万元. ②当11n =时,Y 的分布列为所以()9500.111000.91085E Y =⨯+⨯=万元. ③当12n =时,Y 的分布列为所以()9000.110500.412000.51110E Y =⨯+⨯+⨯=万元. ④当13n =时,Y 的分布列为所以()8500.110000.411500.313000.21090E Y =⨯+⨯+⨯+⨯=万元. 综上可知,当12n =时()1110E Y =万元最大,故建设厂房12间.例8. 某钢铁加工厂新生产一批钢管,为了了解这批产品的质量状况,检验员随机抽取了100件钢管作为样本进行检测,将它们的内径尺寸作为质量指标值,由检测结果得如下频率分布表和频率分布直方图:(1)求a,b;(2)根据质量标准规定:钢管内径尺寸大于等于25.75或小于25.15为不合格,钢管内径尺寸在[25.15,25.35]或[25.45,25.75]为合格,钢管内径尺寸在[25.35,25.45]为优等.钢管的检测费用为2元/根,把样本的频率分布作为这批钢管的概率分布.(i)若从这批钢管中随机抽取3根,求内径尺寸为优等钢管根数X的分布列和数学期望;m m 根,若有两种销售方案:(ii)已知这批钢管共有(100)第一种方案:不再对该批剩余钢管进行检测,扣除100根样品中的不合格钢管后,其余所有钢管均以50元/根售出;第二种方案:对该批钢管进行一一检测,不合格钢管不销售,并且每根不合格钢管损失20元,合格等级的钢管50元/根,优等钢管60元/根. 请你为该企业选择最好的销售方案,并说明理由.【解析】(1)由题意知:1810 1.8100b =⨯=, 所以( 2.3 1.8 1.41a ++++ 0.30.2)0.11++⨯=, 所以3a =.(2)(i )由(1)知,钢管内径尺寸为优等的概率为0.3,X 所有可能的取值为0,1,2,3,()03300.70.343P X C ==⨯=, ()12310.70.30.441P X C ==⨯⨯=, ()22320.70.3=0.189P X C ==⨯⨯, ()33330.30.027P X C ==⨯=,故X 的分布列为()30.30.9E X =⨯=(ii )按第一种方案:()1502200y m =--= 50300m -,按第二种方案:20.6850y m =⨯⨯+ 0.36020.022049.6m m m m ⨯⨯--⨯⨯=,()125030049.6y y m m -=-- 0.4300m =-,若750m >时,12y y >,则按第一种方案, 若750m =时,12y y =,则第一、第二方案均可, 若100750m <<时,12y y <,则按第二种方案, 故当750m >时,按第一种方案,750m=时,第一、二种方案均可,<<时,按第二种方案.m100750例9.某商家每年都参加为期5天的商品展销会,在该展销会上商品的日销售量与是否下雨有关.经统计,2015年该商家的商品日销售情况如下表:以2015年雨天和非雨天的日平均销售量估计相应天气的销售量.若2016年5天的展销会中每天下雨的概率均为60%,且每天下雨与否相互独立.(Ⅰ)估计2016年展会期间能够售出的该商品的件数;(Ⅱ)该商品成本价为90元/件,销售价为110元/件.(ⅰ)将销售利润X(单位:元)表示为2016年5天的展销会中下雨天数t的函数;(ⅱ)由于2016年参展总费用上涨到2500元,商家决定若最终获利大于8000元的概率超过0.6才继续参展,请你为商家是否参展作出决策,并说明理由.【解析】(Ⅰ)由2015年该商家的商品日销售情况表可知:2015年雨天的日平均销售量为100件,非雨天的日平均销售量为125件,设2016年5天的展销会中下雨的天数为t ,则⎛⎫ ⎪⎝⎭3~5,5t B ,所以=⨯=3()535E t ,所以估计2016年5天的展销会有3天下雨,2天不下雨, 所以估计2016年展会期间能够售出的该商品的件数为⨯+⨯=10031252550(件).(Ⅱ)(ⅰ)依题意得,销售利润=+-⨯-=-∈[100125(5)](11090)12500500,X t t t t N(ⅱ)设商家最终获利为Y ,则=-=-250010000500Y X t , 若最终获利大于8000元,则->100005008000t ,解得<4t ,所以=0,1,2,3t ,又因为⎛⎫⎪⎝⎭3~5,5t B ,所以最终获利大于8000元的概率为:==+=+=+=(0)(1)(2)(3)P P t P t P t P t⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫=+++ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭5142332012355553232323255555555C C C C =+++=>32240720108020720.631253125312531253125 所以商家应决定参加2016年的展销会. 注:本小题也可用对立事件的概率计算.=-=-=1(4)(5)P P t P t⎛⎫⎛⎫⎛⎫=-- ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭41545553231555C C=>20720.63125所以商家应决定参加2016年的展销会.例10.某公司准备将1000万元资金投入到市环保工程建设中,现有甲、乙两个建设项目供选择,若投资甲项目一年后可获得的利润为1ξ(万元)的概率分布列如表所示:且1ξ的期望()1120E ξ=;若投资乙项目一年后可获得的利润2ξ(万元)与该项目建设材料的成本有关,在生产的过程中,公司将根据成本情况决定是否受第二和第三季度进行产品的价格调整,两次调整相互独立,且调整的概率分别为(01)p p <<和1p -,乙项目产品价格一年内调整次数X (次)与2ξ的关系如表所示:(1)求,m n 的值; (2)求2ξ的分布列;(3)根据投资回报率的大小请你为公司决策:当p 在什么范围时选择投资乙项目,并预测投资乙项目的最大投资回报率是多少?(投资回报率=年均利润/投资总额×100%)【解析】(1)由题意得:0.411101200.4170120m n m n ++=⎧⎨+⨯+=⎩,得:0.5m =,0.1n =.(2)2ξ的可能取值为41.2,117.6,204.0,()241.2(1)[1(1)](1)P p p p p ξ==---=-()222117.6[1(1)](1)(1)(1)P p p p p p p ξ==--+--=+- ()2204.0(1)P p p ξ==-所以2ξ的分布列为(3)由(2)可得:()22241.2(1)117.6(1)204.0(1)E p p p p p p ξ⎡⎤=⨯-+⨯+-+⨯-⎣⎦21010117.6p p =-++根据投资回报率的计算办法,如果选择投资乙项目,只需()()12E E ξξ<,即21201010117.6p p <-++,得0.40.6p <<.因为()221010117.6E p p ξ=-++,所以当12P =时,()2E ξ取到最大值为120.1,所以预测投资回报率的最大值为12.01%.例11.某地政府拟在该地一水库上建造一座水电站,用泄流水量发电.下图是根据该水库历年的日泄流量的水文资料画成的日泄流量X (单位:万立方米)的频率分布直方图(不完整),已知[)0,120X ∈,历年中日泄流量在区间[30,60)的年平均天数为156,一年按364天计.(Ⅰ)请把频率分布直方图补充完整;(Ⅱ)该水电站希望安装的发电机尽可能运行,但每30万立方米的日泄流量才够运行一台发电机,如6090X ≤<时才够运行两台发电机,若运行一台发电机,每天可获利润为4000元,若不运行,则该台发电机每天亏损500元,以各段的频率作为相应段的概率,以水电站日利润的期望值为决策依据,问:为使水电站日利润的期望值最大,该水电站应安装多少台发电机?【解析】(Ⅰ)在区间[30,60)的频率为15633647= 31==73070⨯频率组距, 设在区间[0,30)上, a =频率组距,则11130170105210a ⎛⎫+++⨯= ⎪⎝⎭,解得1210a =, 补充频率分布直方图如图;(Ⅱ)记水电站日利润为Y元.由(Ⅰ)知:不能运行发电机的概率为17,恰好运行一台发电机的概率为37,恰好运行二台发电机的概率为27,恰好运行三台发电机的概率为17,①若安装1台发电机,则Y的值为-500,4000,其分布列为E(Y)=5004000777-⨯+⨯=;②若安装2台发电机,则Y的值为-1000,3500,8000,其分布列为E(Y)=1000350080007777-⨯+⨯+⨯=;③若安装3台发电机,则Y的值为-1500,3000,7500,12000,其分布列为E(Y)=1500300075001200077777-⨯+⨯+⨯+⨯=;∵345003350023500 777>>∴要使水电站日利润的期望值最大,该水电站应安装3台发电机.。
-高考数学真题分类汇编第二章统计(含解析)新人教版必修3(20200623103340)

其中 0
1 ,则 n, m 的大小关系为 2
A. n m B . n m C . n m D .不能确定
【答案】 A
【解析】本题考查统计中的平均数,作差法比较大小以及整体思想
.
x (1 ) y ,
由统计学知识,可得 x1 x2
x1 x2
xn y1 y2
xn nx, y1 y2
ym my ,
ym m n z m n x 1 y .
C. x甲 x乙 , m甲 m乙
D. x甲 x乙 , m甲 m乙
【解析】从茎叶图来看乙中数据集中,甲比较分散,所以
x甲 x乙,又 m甲 = 18+22 =20 2
【答案】 B
27+31
m乙 =
=29.
2
选 B.
【点评】该题主要考查统计图表和样本数据特征以及数据处理能力
.
2. (2012 ·山东高考卷· T4·5 分 ) 采用系统抽样方法从 960 人中抽取 32 人做问卷调查,为
【解析】【解析】由回归方程为 y =0.85x-85.71 知 y 随 x 的增大而增大,所以 y 与 x 具有
正的线性相关关 系,由 最小二乘 法建立的回归 方程得过 程知
y? bx a bx y bx (a y bx ) ,所以回归直线过样本点的中心( x , y ),利用回
归方程可以预测估计总体,所以 D 不正确 .
m n x m n 1 y,
所以 nx my m n x m n 1 y .
n mn ,
所以
m m n1 .
故 n m (m n)[ (1 )] (m n)(2 1).
因为 0
1 , 所以 2 2
1 0 . 所以 n m 0 . 即 n m .
概率与统计- 高考数学试题分项版解析(解析版)

专题11 概率与统计1. 【2014高考福建卷文第13题】如图,在边长为1的正方形中,随机撒1000粒豆子,有180粒落到阴影部分,据此估计阴影部分的面积为___________.2. 【2014高考广东卷文第6题】为了了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )A.50B.40C.25D.203. 【2014高考广东卷文第12题】从字母a 、b 、c 、d 、e 中任取两个不同的字母,则取到字母a 的概率为 .4. 【2014高考湖北卷文第5题】随机投掷两枚均匀的投骰子,他们向上的点数之和不超过5的概率为1P ,点数之和大于5的概率为2P ,点数之和为偶数的概率为3P ,则( )A. 321P P P <<B. 312P P P <<C. 231P P P <<D. 213P P P << 【答案】C 【解析】试题分析:依题意,36101=P ,3626361012=-=P ,36183=P ,所以231P P P <<.选C. 考点:古典概型公式求概率,容易题.5. 【2014高考湖北卷文第6题】根据如下样本数据:x3 4 56 78y4.02.55.0-0.50.2-0.3-得到的回归方程为a bx y+=ˆ,则( ) A.0a > ,0<b B.0a > ,0>b C.0a < ,0<b D.0a < ,0>b6. 【2014高考湖北卷文第11题】甲、乙两套设备生产的同类产品共4800件,采用分层抽样的方法从中抽取一个容量为80 的样本进行检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.7. 【2014高考湖南卷文第3题】对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为123,,p p p ,则( )123.A p p p =< 231.B p p p =< 132.C p p p =< 123.D p p p ==【答案】D【解析】根据随机抽样的原理可得简单随机抽样,分层抽样,系统抽样都必须满足每个个体被抽到的概率相等,即123p p p ==,故选D. 【考点定位】抽样调查8. 【2014高考湖南卷文第5题】在区间[2,3]-上随机选取一个数X ,则1X ≤的概率为( )4.5A 3.5B 2.5C 1.5D 9. 【2014高考江苏卷第4题】 从1,2,3,6这四个数中一次随机地取2个数,则所取两个数的乘积为6的概率为 .10. 【2014高考江苏卷第6题】某种树木的底部周长的取值范围是[]80,130,它的频率分布直方图如图所示,则在抽测的60株树木中,有 株树木的底部周长小于100 cm.【答案】24【解析】由题意在抽测的60株树木中,底部周长小于100cm 的株数为(0.0150.025)106024+⨯⨯=.【考点】频率分布直方图.11. 【2014高考江西卷文3第题】掷两颗均匀的骰子,则点数之和为5的概率等于( )1.18A 1.9B 1.6C 1.12D12. 【2014高考江西卷文第7题】某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是( ) 表1 不及格 及格 总计 男 6 14 20 女1022 32 总计 16 3652A.成绩 表2 不及格 及格 总计 男 4 16 20 女1220 32 总计 163652B.视力表3 不及格 及格 总计 男 8 12 20 女824 32 总计 163652C.智商表4 不及格 及格 总计 男 14 6 20 女23032总计 16 36 52D.阅读量13.14. 【2014高考辽宁卷文第6题】若将一个质点随机投入如图所示的长方形ABCD 中,其中AB=2,BC=1,则质点落在以AB 为直径的半圆内的概率是( ) A .2π B .4π C .6π D .8π 15. 【2014高考全国1卷文第13题】将2本不同的数学书和1本语文书在书架上随机排成一行,则2本数学书相邻的概率为________. 【答案】23【解析】试题分析:根据题意显然这是一个古典概型,其基本事件有:数1,数2,语; 数1,语,数2;数2,数1,语; 数2,语,数1;语,数2,数1; 语,数1,数2共有6种,其中2本数学书相邻的有4种,则其概率为:42P63 ==.考点:古典概率的计算16.【2014高考全国2卷文第13题】甲,乙两名运动员各自等可能地从红、白、蓝3种颜色的运动服中选择1种,则他们选择相同颜色运动服的概率为_______.17.【2014高考山东卷文第8题】为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,⋅⋅⋅⋅⋅⋅,第五组,右图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.18【答案】C【解析】由图知,样本总数为2050.0.160.24N==+设第三组中有疗效的人数为x,则60.36,1250xx+==,故选C.考点:频率分布直方图.18.【2014高考陕西卷文第6题】从正方形四个顶点及其中心这5个点中,任取2个点,则这2个点的距离小于该正方形边长的概率为( )1.5A2.5B3.5C4.5D19. 【2014高考陕西卷文第9题】某公司10位员工的月工资(单位:元)为1x ,2x ,…,10x ,其均值和方差分别为x 和2s ,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为(A )x ,22s 100+ (B )100x +,22s 100+ (C )x ,2s (D )100x +,2s20.【2014高考四川卷文第2题】在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析。
专题63 统计与概率专题训练(新高考地区专用)(解析版)

专题63 统计与概率专题训练一、选择题:本题共8小题,每小题5分,共40分。
在每小题给出的四个选项中,只有一项是符合题目要求的。
1.小笼包在生活中非常常见,不同地方做出来的小笼包有不同的特色,无锡有一家商铺制作一种一笼有8个且是8种口味的小笼包,这8种口味分别为蟹粉味、鹅肝味、墨鱼味、芝士味、麻辣味,蒜香味、人参味,酱香味,将这样的一笼小包取出,排成一排,则人参味小笼包既与蟹粉味小包相邻又与墨鱼味小笼包相邻的概率为( )。
A 、281B 、161C 、81 D 、72 【答案】A【解析】将这8种口味的小笼包排成一排有88A 种排法,人参味小笼包既与蟹粉味小包相邻又与墨鱼味小笼包相邻有6622A A ⋅种排法,故所求概率为281886622=⋅A A A ,故选A 。
2.组数1a 、2a 、3a 、…、n a 的平均数是x ,方差是2s ,则另一组数121-a 、122-a 、123-a 、…、12-n a 的平均数和方差分别是( )。
A 、12-x ,2sB 、12-x ,22sC 、x 2,2sD 、12-x ,12222++s s 【答案】C【解析】由题意可知,x a E n =)(,2)(s a D n =,+∈N n ,根据数学期望与方差的公式得:121)(2)12(-=-=-x a E a E n n ,222)()2()12(s a D a D n n ==-,故选C 。
3.某校欲从高三年级学生编排的4个歌舞节目和2个小品节目中随机选出3个节目,参加学校举行的”迎新春”文艺汇演,则所选的3个节目中至少有1个是小品节目的概率为( )。
A 、51B 、52 C 、53 D 、54 【答案】D【解析】从6个节目中任选3个共有2036=C 种选法, 至少含有1个小品节目的共有1614222412=⋅+⋅C C C C 种选法, 故所选的3个节目中至少有1个是小品节目的概率为542016=,故选D 。
专题18 统计综合-2021年高考数学(理)母题题源解密(解析版)

专题18 统计综合【母题原题1】【2020年高考全国Ⅲ卷,理数】某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,【答案】(1)该市一天的空气质量等级分别为1、2、3、4的概率分别为0.43、0.27、0.21、0.09;(2)350;(3)有,理由见解析.【解析】 【分析】(1)根据频数分布表可计算出该市一天的空气质量等级分别为1、2、3、4的概率; (2)利用每组的中点值乘以频数,相加后除以100可得结果;(3)根据表格中的数据完善22⨯列联表,计算出2K 的观测值,再结合临界值表可得结论. 【详解】(1)由频数分布表可知,该市一天的空气质量等级为1的概率为216250.43100++=,等级为2的概率为510120.27100++=,等级为3的概率为6780.21100++=,等级为4的概率为7200.09100++=;(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为100203003550045350100⨯+⨯+⨯=(3)22⨯列联表如下:()221003383722 5.820 3.84155457030K ⨯⨯-⨯=≈>⨯⨯⨯,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.【点睛】本题考查利用频数分布表计算频率和平均数,同时也考查了独立性检验的应用,考查数据处理能力,属于基础题.【母题原题2】【2019年高考全国Ⅲ卷理数】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C 为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P (C )的估计值为0.70. (1)求乙离子残留百分比直方图中a ,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表). 【答案】(1) 0.35a =,0.10b =;(2)4.05,6. 【解析】(1)由已知得0.70=a +0.20+0.15,故a =0.35. b =1–0.05–0.15–0.70=0.10.(2)甲离子残留百分比的平均值的估计值为 2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05. 乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.【名师点睛】本题考查频率分布直方图和平均数,属于基础题.【母题原题3】【2018年高考全国Ⅲ卷理数】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min )绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:()()()()()22n ad bcKa b c d a c b d-=++++,【答案】(1)第二种生产方式的效率更高.理由见解析(2)80(3)能【解析】(1)第二种生产方式的效率更高.理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.(2)由茎叶图知7981802m+==.列联表如下:(3)由于2240(151555)10 6.63520202020K⨯-⨯==>⨯⨯⨯,所以有99%的把握认为两种生产方式的效率有差异.【名师点睛】本题主要考查了茎叶图和独立性检验,考察学生的计算能力和分析问题的能力,贴近生活.【命题意图】主要考查频率分布直方图、考查独立性检验、考查变量间的相关关系.考查考生的数据分析能力、逻辑推理能力.【命题规律】统计的解答题通常考查随机抽样,频率分布直方图,变量的相关性,独立性检验,求线性回归方程、利用回归方程进行预测等,常与概率知识相交汇命题.【答题模板】1.频率分布表与频率分布直方图的绘制步骤如下:(1)求极差,即求一组数据中最大值与最小值的差;(2)决定组距与组数;(3)将数据分组;(4)列频率分布表,落在各小组内的数据的个数叫作频数,每小组的频数与样本容量的比值叫作这一小组的频率,计算各小组的频率,列出频率分布表;(5)画频率分布直方图,依据频率分布表画出频率分布直方图,其中纵坐标(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组上的小长方形的面积,即每个小长方形的面积=组距×频率组距=频率.各个小长方形的面积的总和等于1.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作频率分布直方图时所分的组数增加,组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.独立性检验的一般步骤(1)根据样本数据列出2×2列联表.(2)计算随机变量K2的观测值k,查下表确定临界值k0.P(K2≥k0)0.50 0.40 0.25 0.15 0.10k00.455 0.708 1.323 2.072 2.706P(K2≥k0)0.05 0.025 0.010 0.005 0.001k0 3.841 5.024 6.635 7.879 10.828 (3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过P(K2≥k0);否则,就认为在犯错误的概率不超过P(K2≥k0)的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.【知识总结】1.众数、中位数、平均数定义特点众数在一组数据中出现次数最多的数.体现了样本数据的最大集中点,不受极端值的影响,而且不唯一.中位数将一组数据按大小顺序依次排列(相同的数据要重复列出),处在最中间位置的那个数据(或最中间两个数据的平均数).中位数不受极端值的影响,仅利用了排在中间位置的数据的信息,只有一个.平均数一组数据的算术平均数.与每一个样本数据有关,只有一个.(1)众数、中位数与平均数都是描述一组数据的集中趋势的量,平均数是最重要的量.(2)平均数反映的是一组数据的平均水平,众数和中位数则反映一组数据的“重心”.(3)在实际问题中求得的平均数、众数和中位数应带上单位.2.极差、标准差与方差定义特点极差一组数据中最大值与最小值的差反映一组数据的波动情况,一般情况下,极差大,则数据的波动性大;极差小,则数据的波动性小,但极差只考虑了两个极端值,可靠性较差.标准差标准差是样本数据到平均数的一种平均距离,即反映了各个样本数据聚集于样本平均数周围的程度.标准差越小,表明各个样本数据在样本平均数周围越集中;标准差越大,表明各个样本数据在样本平均数的两边越分散.方差方差是标准差的平方,即s2=1n[(x1–x)2+(x2–x)2+…+(x n–x)2]同标准差一样,方差也是用来衡量样本数据的离散程度的,但是平方后扩大了偏差的程度.3.平均数的性质(1)若给定一组数据x1,x2,…,x n的平均数为x,则ax1,ax2,…,ax n的平均数为a x;ax1+b,ax2+b,…,ax n+b的平均数为a x+b.(2)若M个数的平均数是X,N个数的平均数是Y,则这(M+N)个数的平均数是MX+NYM+N;若两组数据x1,x2,…,x n和y1,y2,…,y n的平均数分别是x和y,则x1+y1,x2+y2,…,x n+y n的平均数是x+y.4.方差的性质若给定一组数据x1,x2,…,x n,其方差为s2,则ax1,ax2,…,ax n的方差为a2s2;ax1+b,ax2+b,…,ax n+b的方差为a2s2,特别地,当a=1时,有x1+b,x2+b,…,x n+b的方差为s2,这说明将一组数据中的每一个数据都加上一个相同的常数,方差是不变的,即不影响数据的波动性.【方法总结】1.在频率分布直方图中:(1)众数是最高的小长方形底边中点的横坐标;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,其估计值等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.绘制频率分布直方图时需注意:(1)频率分布直方图中的纵轴表示频率组距,而不是频率;(2)频率分布直方图中各小长方形的高之比就是相应各组的频率之比;(3)频率分布直方图中各个小长方形的面积是相应各组的频率,所有的小长方形的面积之和等于1,即频率之和为1.3.由频率分布直方图进行相关计算时,需掌握下列关系式:(1)频率组距×组距=频率;(2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数.4.作样本的茎叶图时,要先根据数据的特点确定茎、叶,再作茎叶图.茎部位的数字由上向下,从小到大排列;叶部位的数字由内向外,从小到大排列.5.给定两组数据的茎叶图,比较数字特征时,“重心”下移者平均数较大,数据集中者方差较小.6.用样本的数字特征估计总体的数字特征类型1:直接给出样本数据,根据平均数、众数、方差、标准差的概念进行相关计算得出相应数据.类型2:利用茎叶图给出样本数据,一般情况下,茎叶图中的数据多为两位数(茎叶图中,一位数的“茎”处的数字为0),明确每一行中“茎”处的数字是该行数字共用的十位数字,“叶”处的数字是个位数字,正确写出茎叶图中的所有数字,再根据平均数、中位数、众数、方差、标准差的概念进行相关计算.1.(2020·广西壮族自治区高三月考(理))水稻是人类重要的粮食作物之一,耕种与食用的历史都相当悠久,日前我国南方农户在播种水稻时一般有直播、撒酒两种方式.为比较在两种不同的播种方式下水稻产量的区别,某市红旗农场于2019年选取了200块农田,分成两组,每组100块,进行试验.其中第一组采用直播的方式进行播种,第二组采用撒播的方式进行播种.得到数据如下表:约定亩产超过900斤(含900斤)为“产量高”,否则为“产量低”(1)请根据以上统计数据估计100块直播农田的平均产量(同一组中的数据用该组区间的中点值为代表)(2)请根据以上统计数据填写下面的2×2列联表,并判断是否有99%的把握认为“产量高”与“播种方式”有关?附22()()()()()n ad bc K a b c d a c b d -=++++:【答案】(1)100块直播农田的平均产量为907斤,(2)有99%的把握认为“产量高”与“播种方式”有关. 【解析】【分析】(1)根据48183931850870890910930100100100100100X =⨯+⨯+⨯+⨯+⨯,算出答案即可 (2)由题目中给的数据完善22⨯列联表,然后算出2K 的观察值即可 【详解】(1)100块直播农田的平均产量为:48183931850870890910930907100100100100100X =⨯+⨯+⨯+⨯+⨯=(斤) (2)由题中所给的数据得到22⨯列联表如下所示:由表中的数据可得2K 的观察值()2120820070503050258 6.01001635300k ⨯⨯⨯>⨯⨯-⨯==>所以有99%的把握认为“产量高”与“播种方式”有关【点睛】本题考查的是平均数的算法及独立性检验,考查了学生的计算能力,属于基础题.2.(2020·钦州市第三中学高三月考(理))某花圃为提高某品种花苗质量,开展技术创新活动,在,A B 实验地分别用甲、乙方法培育该品种花苗.为观测其生长情况,分别在实验地随机抽取各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图,记综合评分为80分及以上的花苗为优质花苗.(1)用样本估计总体,以频率作为概率,若在,A B两块实验地随机抽取3株花苗,求所抽取的花苗中优质花苗数的分布列和数学期望;(2)填写下面的列联表,并判断是否有99%的把握认为优质花苗与培育方法有关.附:下面的临界值表仅供参考.(参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++)【答案】(1)分布列见解析,9()5E X=;(2)列联表见解析;有99%的把握认为优质花苗与培育方法有关系.【解析】【分析】(1)根据题意,可知0,1,2,3X =.由独立重复试验概率求法依次求得各组概率,即可得分布列;由数学期望公式即可求解.(2)求得优质花苗的数量,填写列联表.由列联表求得2K 值,与临界值比较即可判断.【详解】(1)由频率分布直方图可知,优质花苗的频率为(0.040.02)100.6+⨯=,即概率为0.6. 设所抽取的花苗为优质花苗的株数为X ,则35~3,X B ⎛⎫ ⎪⎝⎭,于是30328(0)5125P X C ⎛⎫==⨯=⎪⎝⎭; 2133236(1)55125P X C ⎛⎫==⨯⨯=⎪⎝⎭; 2233254(2)55125P X C ⎛⎫==⨯⨯=⎪⎝⎭;333327(3)5125P X C ⎛⎫==⨯=⎪⎝⎭. 其分布列为:所以,所抽取的花苗为优质花苗的数学期望()355E X =⨯= (2)频率分布直方图,优质花苗的频率为(0.040.02)100.6+⨯=,则样本中优质花苗的株数为60株,列联表如下表所示:可得22100(20103040)16.667 6.63560405050K ⨯-⨯=≈>⨯⨯⨯.所以,有99%的把握认为优质花苗与培育方法有关系【点睛】本题考查了频率分布直方图的应用,离散型随机变量的分布列与均值求法,独立性检验思想的应用,属于基础题.3.(2020·广西壮族自治区高三其他(理))某学生为了测试煤气灶烧水如何节省煤气的问题设计了一个实验,并获得了煤气开关旋钮旋转的弧度数x 与烧开一壶水所用时间y 的一组数据,且作了一定的数据处理(如表),得到了散点图(如图).表中211i w x =,101110i i w w ==∑.(1)根据散点图判断,y a bx =+与2dy c x=+哪一个更适宜作烧水时间y 关于开关旋钮旋转的弧度数x 的回归方程类型?(不必说明理由)(2)根据判断结果和表中数据,建立y 关于x 的回归方程;(3)若旋转的弧度数x 与单位时间内煤气输出量t 成正比,那么x 为多少时,烧开一壶水最省煤气? 附:对于一组数据()11,u v ,()22,u v ,()33,u v ,…,(),n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为()()()121niii nii v v u u u u β==--=-∑∑,v u αβ=-.【答案】(1)2d y c x =+更适宜(2)2205y x =+(3)x 为2时,烧开一壶水最省煤气【解析】【分析】(1)根据散点图是否按直线型分布作答;(2)根据回归系数公式得出y 关于ω的线性回归方程,再得出y 关于x 的回归方程; (3)利用基本不等式得出煤气用量的最小值及其成立的条件. 【详解】(1)2dy c x=+更适宜作烧水时间y 关于开关旋钮旋转的弧度数x 的回归方程类型. (2)由公式可得:()()()101102116.2200.81iii i i w w y y d w w==--===-∑∑, 20.6200.785c y dw =-=-⨯=,所以所求回归方程为2205y x =+. (3)设t kx =,则煤气用量220205520k S yt kx kx k x x ⎛⎫==+=+≥= ⎪⎝⎭, 当且仅当205kkx x=时取“=”,即2x =时,煤气用量最小. 故x 为2时,烧开一壶水最省煤气.【点睛】本题考查拟合模型的选择,回归方程的求解,涉及均值不等式的使用,属综合中档题. 4.(2020·广西壮族自治区高三一模(理))某校为了了解高一新生是否愿意参加军训,随机调查了80名新生,得到如下2×2列联表(1)写出表中x,y,z,M,N的值,并判断是否有99.9%的把握认为愿意参加军训与性别有关;(2)在被调查的不愿意参加军训的学生中,随机抽出3人,记这3人中男生的人数为ξ,求ξ的分布列和数学期望.参考公式:()()()()()22n ad bcKa b c d a c b d-=++++附:【答案】(1)M=40,x=35,z=20,y=20,N=55,有99.9%的把握认为愿意参加志愿者填报培训与性别有关.(2)分布列见详解,E(ξ)69 115 =.【解析】【分析】(1)根据表格中数据,即可求得x,y,z,M,N的值,再计算2K,结合参考表格即可作出判断;(2)列出ξ的取值,根据古典概型概率计算公式求得分布列,再根据分布列计算数学期望即可.【详解】(1)由表格数据可知:M=80﹣40=40,x=40﹣5=35,z=25﹣5=20,y=40﹣20=20,N=80﹣25=55,∵K2280(2035510)40402555⨯-⨯=≈⨯⨯⨯13.09>10.828,∴有99.9%的把握认为愿意参加志愿者填报培训与性别有关.(2)在被调查的不愿意参加军训的学生中,随机抽出3人,记这3人中男生的人数为ξ,则ξ的可能取值为0,1,2,3,P(ξ=0)32032557115CC==,P(ξ=1)125203251946C CC==,P (ξ=2)21520325223C C C ==, P (ξ=3)353251230C C ==,∴ξ的分布列为:E (ξ)01231154623230115=⨯+⨯+⨯+⨯=. 【点睛】本题考查独立性检验中2K 的计算,以及古典概型的概率计算,涉及离散型随机变量的分布列和数学期望的求解,属综合中档题.5.(2020·宜宾市叙州区第一中学校高二月考(理)) 2022年北京冬奥会的申办成功与“3亿人上冰雪”口号的提出,将冰雪这个冷项目迅速炒“热”.北京某综合大学计划在一年级开设冰球课程,为了解学生对冰球运动的兴趣,随机从该校一年级学生中抽取了100人进行调查,其中女生中对冰球运动有兴趣的占23,而男生有10人表示对冰球运动没有兴趣. (1)完成下面的22⨯列联表,并回答能否在犯错误的概率不超过0.1的前提下认为“对冰球是否有兴趣与性别有关”?(2)若将频率视为概率,现再从该校一年级全体学生中,采用随机抽样的方法每次抽取1名学生,抽取5次,记被抽取的5名学生中对冰球有兴趣的人数为X ,若每次抽取的结果是相互独立的,求X 的分布列、期望和方差. 附表:参考公式:()()()()()22,.n ad bc K n a b c d a b c d a c b d -==+++++++【答案】(1)见解析;(2)见解析.【解析】(1)根据已知数据得到如下列联表:根据列联表中的数据,得到2K 的观测值()25510044551510301003.030 2.767525033k ⨯⨯⨯⨯-⨯≈>⨯==, 所以能在犯错误的概率不超过0.1的前提下可以认为“对冰球是否有兴趣与性别有关”. (2)由列联表中数据可知,对冰球有兴趣的学生频率是34,将频率视为概率,即从大一学生中抽取一名学生,对冰球有兴趣的概率是34, 由题意知3~(5,)X B ,从而X 的分布列为:()315544E X np ==⨯=,()()33151514416D X np p ⎛⎫=-=⨯⨯-= ⎪⎝⎭.6.(2020·四川省泸县第二中学高二月考(理))2019年初,某高级中学教务处为了解该高级中学学生的作文水平,从该高级中学学生某次考试成绩中按文科、理科用分层抽样方法抽取400人的成绩作为样本,得到成绩频率分布直方图如图所示,::1:2:4a b c =,参考的文科生与理科生人数之比为1:4,成绩(单位:分)分布在[]0,60的范围内且将成绩(单位:分)分为[)0,10,[)10,20,[)20,30,[)30,40,[)40,50,[]50,60六个部分,规定成绩分数在50分以及50分以上的作文被评为“优秀作文”,成绩分数在50分以下的作文被评为“非优秀作文”.(1)求实数,,a b c 的值; (2)(i )完成下面22⨯列联表;(ii )以样本数据研究学生的作文水平,能否在犯错误的概率不超过0.010的情况下认为获得“优秀作文”与学生的“文理科“有关?注:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【答案】(1)0.005a =,0.01b =,0.02c =(2)(i )填表见解析(ii )在犯错误的概率不超过0.010的情况下,不能认为“获得优秀作文”与“学生的文理科”有关 【解析】【分析】(1)根据频率直方图得到()100.35a b c ⨯++=,::1:2:4a b c =,解得答案. (2)(i )计算400人中文科生的数量为80,理科生的数量为320,完善列联表得到答案. (2)(ii )计算2 1.32 6.635K ≈<,对比临界值表得到答案.【详解】(1)由频率分布直方图可知,()()101100.0180.0220.0250.35a b c ⨯++=-⨯++=, 因为::1:2:4a b c =,所以240.035a b c a a a ++=++=, 解得0.005a =,所以20.01b a ==,40.02c a ==. 即0.005a =,0.01b =,0.02c =.(2)(i )获奖的人数为0.0051040020⨯⨯=人, 因为参考的文科生与理科生人数之比为1:4, 所以400人中文科生的数量为1400805⨯=,理科生的数量为40080320-=. 由表可知,获奖的文科生有6人,所以获奖的理科生有20614-=人, 不获奖的文科生有80674-=人,不获奖的理科生有32014306-=. 于是可以得到22⨯列联表如下:(ii )计算()2240063061474 1.32 6.6352038080320K ⨯⨯-⨯=≈<⨯⨯⨯; 所以在犯错误的概率不超过0.010的情况下,不能认为“获得优秀作文”与“学生的文理科”有关. 【点睛】本题考查了频率直方图,列联表,独立性检验,意在考查学生的计算能力和应用能力. 7.(2020·四川省绵阳南山中学高三一模(理))为调查某地区被隔离者是否需要社区非医护人员提供帮助,用简单随机抽样方法从该地区调查了500位被隔离者,结果如下:(1)估计该地区被隔离者中,需要社区非医护人员提供帮助的被隔离者的比例;(2)能否有99%的把握认为该地区的被隔离者是否需要社区非医护人员提供帮助与性别有关? 【答案】(1)14%;(2)有99%的把握认为该地区的被隔离者是否需要帮助与性别有关. 【解析】【分析】(1)计算出样本中需要提供帮助的被隔离者所占比,由此估计该地区被隔离者所占比例; (2)根据列联表的数据,计算出随机变量的观测值29.967K ≈,比0.010所对应的k 值6.635大,得出结论“有99%的把握认为该地区的被隔离者是否需要帮助与性别有关”. 【详解】解:(1)∵调查的500位被隔离者中有403070+=位 需要社区非医护人员提供帮助,∴该地区被隔离者中需要帮助的被隔离者的比例的估算值为7014%500=; (2)根据列联表所给的数据,代入随机变量的观测值公式,22500(4027030160)9.96770430200300K ⨯⨯-⨯=≈⨯⨯⨯.∵9.967 6.635>,∴有99%的把握认为该地区的被隔离者是否需要帮助与性别有关. 【点睛】本题考查了古典概型,考查了独立性检验的问题,属于基础题.8.(2020·四川省阆中中学高三其他(理))共享单车进驻城市,绿色出行引领时尚.某市有统计数据显示,2020年该市共享单车用户年龄等级分布如图1所示,一周内市民使用单车的频率分布扇形图如图2所示.若将共享单车用户按照年龄分为“年轻人”(20岁-39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用单车用户”,使用次数为5次或不足5次的称为“不常使用单车用户”.已知在“经常使用单车用户”中有56是“年轻人”.(1)现对该市市民进行“经常使用共享单车与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根据图表中的数据,补全下列22⨯列联表,并根据列联表的独立性检验,判断是否有85%的把握认为经常使用共享单车与年龄有关?使用共享单车情况与年龄列联表(2)将(1)中频率视为概率,若从该市市民中随机任取3人,设其中经常使用共享单车的“非年轻人”人数为随机变量X,求X的分布列与期望.参考数据:独立性检验界值表其中,22()()()()()n ad bcKa b c d a c b d-=++++,n a b c d=+++【答案】(1)列联表见解析,有85%的把握可以认为经常使用共享单车与年龄有关;(2)分布列见解析,数学期望为0.3.【解析】【分析】(1)补全的列联表,利用公式求得2 2.083 2.072K≈>,即可得到结论;(2)由(1)的列联表可知,经常使用单车的“非年轻人”的概率,即可利用独立重复试验求解随机变量X取每个数值的概率,列出分布列,求解数学期望. 【详解】(1)补全的列联表如下:于是100a =,20b =,60c =,20d =,∴22200(100206020) 2.083 2.0721208016040K ⨯⨯-⨯=≈>⨯⨯⨯,即有85%的把握可以认为经常使用共享单车与年龄有关. (2)由(1)的列联表可知,经常使用共享单车的“非年轻人”占样本总数的频率为20100%10%200⨯=, 即在抽取的用户中出现经常使用单车的“非年轻人”的概率为0.1, ∵~(3,0.1)X B ,0,1,2,3X =∴3(0)(10.1)0.729P X ==-=,(1)0.243P X ==(2)0.027P X ==,3(3)0.10.001P X ===,∴X 的分布列为∴X 的数学期望()30.10.3E X =⨯=.【点睛】本题主要考查了22⨯列联表,独立性检验,二项分布,二项分布的期望,属于中档题. 9.(2020·四川省宜宾市第四中学校高三二模(理))2020年春季,某出租汽车公司决定更换一批新的小汽车以代替原来报废的出租车,现有采购成本分别为11万元/辆和8万元/辆的,A B 两款车型,根据以往这两种出租车车型的数据,得到两款出租车车型使用寿命频数表如下:(1)填写下表,并判断是否有99%的把握认为出租车的使用寿命年数与汽车车型有关?(2)从A和B的车型中各随机抽取1车,以X表示这2车中使用寿命不低于7年的车数,求X的分布列和数学期望;(3)根据公司要求,采购成本由出租公司负责,平均每辆出租车每年上交公司6万元,其余维修和保险等费用自理.假设每辆出租车的使用寿命都是整数年,用频率估计每辆出租车使用寿命的概率,分别以这10辆出租车所产生的平均利润作为决策依据,如果你是该公司的负责人,会选择采购哪款车型?附:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++.【答案】(1)填表答案见解析,有99%的把握认为出租车的使用寿命年数与汽车车型有关.(2)分布列答案见解析,数学期望:1.2.(3)采购B款车型.【解析】【分析】(1)根据题目所给数据填写22⨯列联表,计算出2K的值,由此判断出有99%的把握认为出租车的使用寿命年数与汽车车型有关.(2)利用相互独立事件概率乘法公式计算出分布列,并求得数学期望.(3)分别计算出两种车型的平均利润,由此判断出采购B款车型.【详解】(1)填表如下:。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十一章统计、统计案例第一部分六年高考荟萃2013年高考题1 .(2013年高考陕西卷(理))某单位有840名职工, 现采用系统抽样方法, 抽取42人做问卷调查, 将840人按1, 2, , 840随机编号, 则抽取的42人中, 编号落入区间[481,720]的人数为()A.11 B.12 C.13 D.142 .(2013年普通高等学校招生统一考试安徽数学(理)试题(纯WORD版))某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是()A.这种抽样方法是一种分层抽样B.这种抽样方法是一种系统抽样C.这五名男生成绩的方差大于这五名女生成绩的方差D.该班级男生成绩的平均数小于该班女生成绩的平均数3 .(2013年普通高等学校招生统一考试福建数学(理)试题(纯WORD版))某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分为6组:[40,50), [50,60),[60,70), [70,80), [80,90), [90,100)加以统计,得到如图所示的频率分布直方图,已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480 C.450 D.1204 .(2013年高考江西卷(理))总体有编号为01,02,…,19,20的20个个体组成。
利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为7816 6572 0802 6314 0702 4369 9728 01983204 9234 4935 8200 3623 4869 6938 7481()A.08 B.07 C.02 D.015.(2013年高考上海卷(理))盒子中装有编号为1,2,3,4,5,6,7,8,9的九个球,从中任意取出两个,则这两个球的编号之积为偶数的概率是___________(结果用最简分数表示)6.(2013年高考湖北卷(理))从某小区抽取100户居民进行月用电量调查,发现其用电量都在50到350度之间,频率分布直方图所示.(I)直方图中x 的值为___________; (II)在这些用户中,用电量落在区间100,250内的户数为_____________.7.(2013年普通高等学校招生全国统一招生考试江苏卷(数学)(已校对纯WORD 版含附加题))抽样统计甲、乙两位设计运动员的5此训练成绩(单位:环),结果如下: 运动员第1次第2次第3次第4次第5次甲87 91 90 89 93 乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为_____________.8.(2013年高考上海卷(理))设非零常数d 是等差数列12319,,,,x x x x 的公差,随机变量等可能地取值12319,,,,x x x x ,则方差_______D9.(2013年普通高等学校招生统一考试广东省数学(理)卷(纯WORD 版))某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.(Ⅰ) 根据茎叶图计算样本均值;(Ⅱ) 日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间12名工人中有几名优秀工人;(Ⅲ) 从该车间12名工人中,任取2人,求恰有1名优秀工人的概率.17920153第17题图10.(2013年普通高等学校招生统一考试天津数学(理)试题(含答案))一个盒子里装有7张卡片, 其中有红色卡片4张, 编号分别为1, 2, 3, 4; 白色卡片3张, 编号分别为2, 3, 4. 从盒子中任取4张卡片 (假设取到任何一张卡片的可能性相同).(Ⅰ) 求取出的4张卡片中, 含有编号为3的卡片的概率.(Ⅱ) 再取出的4张卡片中, 红色卡片编号的最大值设为X, 求随机变量X的分布列和数学期望.11.(2013年高考陕西卷(理))在一场娱乐晚会上, 有5位民间歌手(1至5号)登台演唱, 由现场数百名观众投票选出最受欢迎歌手. 各位观众须彼此独立地在选票上选3名歌手, 其中观众甲是1号歌手的歌迷, 他必选1号, 不选2号, 另在3至5号中随机选2名. 观众乙和丙对5位歌手的演唱没有偏爱, 因此在1至5号中随机选3名歌手.(Ⅰ) 求观众甲选中3号歌手且观众乙未选中3号歌手的概率;(Ⅱ) X表示3号歌手得到观众甲、乙、丙的票数之和, 求X的分布列和数学期望.12.(2013年普通高等学校招生统一考试重庆数学(理)试题(含答案))某商场举行的“三色球”购物摸奖活动规定:在一次摸奖中,摸奖者先从装有3个红球与4个白球的袋中任意摸出3个球,再从装有1个蓝球与2个白球的袋中任意摸出1个球,根据摸出4个球中红球与蓝球的个数,设一.二.三等奖如下:奖级摸出红.蓝球个数获奖金额一等奖3红1蓝200元二等奖3红0蓝50元三等奖2红1蓝10元其余情况无奖且每次摸奖最多只能获得一个奖级.(1)求一次摸奖恰好摸到1个红球的概率;(2)求摸奖者在一次摸奖中获奖金额X的分布列与期望E X.2012年高考题1.【2012新课标文】在一组样本数据(x1,y1),(x2,y2),…,(x n,y n)(n≥2,x1,x2,…,x n不全相等)的散点图中,若所有样本点(x i,y i)(i=1,2,…,n)都在直线y=12x+1上,则这组样本数据的样本相关系数为(A)-1 (B)0 (C)12(D)12.【2012山东文】(4)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据都加2后所得数据,则A,B两样本的下列数字特征对应相同的是(A)众数(B)平均数(C)中位数(D)标准差3.【2012四川文】交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查。
假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人。
若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为()A、101B、808C、1212D、20124.【2012陕西文】对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则改样本的中位数、众数、极差分别是()A.46,45,56 B.46,45,53C.47,45,56 D.45,47,535.【2012江西文】小波一星期的总开支分布图如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为A.30%B.10%C.3%D.不能确定6.【2012湖南文】设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论中不正确...的是A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kg7.【2012湖北文】容量为20的样本数据,分组后的频数如下表则样本数据落在区间[10,40]的频率为A 0.35B 0.45C 0.55D 0.658.【2012广东文由正整数组成的一组数据1234,,,x x x x ,其平均数和中位数都是2,且标准差等于1,则这组数据为.(从小到大排列)9.【2012山东文】右图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为____.10.【2012浙江文】某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为____________. 11.【2012湖南文】图2是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为_________.08910352图(注:方差2222121()()()nsx x x x x x n,其中x 为x 1,x 2,…,x n 的平均数)12.【2012湖北文】一支田径运动队有男运动员56人,女运动员42人。
现用分层抽样的方法抽取若干人,若抽取的男运动员有8人,则抽取的女运动员有______人。
13.【2102福建文】一支田径队有男女运动员98人,其中男运动员有56人.按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是_______.14.【2012江苏】某学校高一、高二、高三年级的学生人数之比为334::,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取名学生.15.【2012辽宁文】电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名。
下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图;将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性。
(Ⅰ)根据已知条件完成下面的22列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷合计男女合计(Ⅱ)将日均收看该体育项目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率。
附2 2112212211212(), n n n n nn n n n16.【2012安徽文】若某产品的直径长与标准值的差的绝对值不超过...1mm 时,则视为合格品,否则视为不合格品。
在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5000件进行检测,结果发现有50件不合格品。
计算这50件不合格品的直径长与标准值的差(单位:mm), 将所得数据分组,得到如下频率分布表:分组频数频率[-3, -2) 0.10[-2, -1) 8(1,2] 0.50(2,3] 10(3,4]合计50 1.00(Ⅰ)将上面表格中缺少的数据填在答题卡...的相应位置;(Ⅱ)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;(Ⅲ)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品。