高三上学期一轮复习数学单元过关检测--- 统计
高考第一轮复习数学:123统计-教案(含习题及答案).
12.3 统 计●知识梳理1.抽样当总体中的个体较少时,一般可用简单随机抽样;当总体中的个体较多时,一般可用系统抽样;当总体由差异明显的几部分组成时,一般可用分层抽样,而简单随机抽样作为一种最简单的抽样方法,又在其中处于一种非常重要的地位.实施简单随机抽样,主要有两种方法:抽签法和随机数表法.系统抽样适用于总体中的个体数较多的情况,因为这时采用简单随机抽样就显得不方便,系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均匀分后的每一段进行抽样时,采用的是简单随机抽样;与简单随机抽样一样,系统抽样也属于等概率抽样.分层抽样在内容上与系统抽样是平行的,在每一层进行抽样时,采用简单随机抽样或系统抽样,分层抽样也是等概率抽样.2.样本与总体用样本估计总体是研究统计问题的一种思想方法.当总体中的个体取不同数值很少时,其频率分布表由所取样本的不同数值及其相应的频率来表示,其几何表示就是相应的条形图,当总体中的个体取不同值较多,甚至无限时,其频率分布的研究要用到初中学过的整理样本数据的知识.用样本估计总体,除在整体上用样本的频率分布去估计总体的分布以外,还可以从特征数上进行估计,即用样本的平均数去估计总体的平均数,用关于样本的方差(标准差)去估计总体的方差(标准差).3.正态分布正态分布在实际生产、生活中有着广泛的应用,很多变量,如测量的误差、产品的尺寸等服从或近似服从正态分布,利用正态分布的有关性质可以对产品进行假设检验.4.线性回归直线设x 、y 是具有相关关系的两个变量,且相应于n 组观察值的n 个点大致分布在一条直线的附近,我们把整体上这n 个点最接近的一条直线叫线性回归直线.特别提示在三种抽样中,简单随机抽样是最简单、最基本的抽样方法,其他两种抽样方法是建立在它的基础上的.三种抽样方法的共同点是:它们都是等概率抽样,体现了抽样的公平性.三种抽样方法各有其特点和适用范围,在抽样实践中要根据具体情况选用相应的抽样方法.●点击双基1.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一容量为3的样本,则某特定个体入样的概率是 A.310C 3 B.89103⨯⨯ C.103 D. 101 解析:简单随机抽样中每一个体的入样概率为Nn . 答案:C2.(2004年江苏,6)某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示.根据条形图可得这50名学生这一天平均每人的课外阅读时间为 055人数(人)h )A.0.6 hB.0.9 hC.1.0 hD.1.5 h解析:一天平均每人的课外阅读时间应为一天的总阅读时间与学生数的比,即 5050.2105.1100.1205.050⨯+⨯+⨯+⨯+⨯=0.9 h. 答案:B3.一个年级有12个班,每个班有50名同学,随机编号为1~50号,为了了解他们在课外的兴趣爱好,要求每班的33号学生留下来参加阅卷调查,这里运用的抽样方法是A.分层抽样法B.抽签法C.随机数表法D.系统抽样法答案:D4.如果随机变量ξ~N (μ,σ2),且E ξ=3,D ξ=1,则P (-1<ξ≤1)等于A.2Φ(1)-1B.Φ(4)-Φ(2)C.Φ(2)-Φ(4)D.Φ(-4)-Φ(-2)解析:对正态分布,μ=E ξ=3,σ2=D ξ=1,故P (-1<ξ≤1)=Φ(1-3)-Φ(-1-3)=Φ(-2)-Φ(-4)=Φ(4)-Φ(2).答案:B5.为考虑广告费用x 与销售额y 之间的关系,抽取了5家餐厅,得到如下数据: 广告费用(千元) 1.0 4.06.0 10.0 14.0 销售额(千元) 19.0 44.0 40.0 52.0 53.0 现要使销售额达到6万元,则需广告费用为______.(保留两位有效数字)解析:先求出回归方程yˆ=bx+a ,令y ˆ=6,得x=1.5万元. 答案:1.5万元●典例剖析【例1】 某批零件共160个,其中,一级品48个,二级品64个,三级品32个,等外品16个.从中抽取一个容量为20的样本.请说明分别用简单随机抽样、系统抽样和分层抽样法抽取时总体中的每个个体被取到的概率均相同.剖析:要说明每个个体被取到的概率相同,只需计算出用三种抽样方法抽取个体时,每个个体被取到的概率.解:(1)简单随机抽样法:可采取抽签法,将160个零件按1~160编号,相应地制作1~160号的160个签,从中随机抽20个.显然每个个体被抽到的概率为16020=81. (2)系统抽样法:将160个零件从1至160编上号,按编号顺序分成20组,每组8个.然后在第1组用抽签法随机抽取一个号码,如它是第k 号(1≤k ≤8),则在其余组中分别抽取第k+8n (n=1,2,3,…,19)号,此时每个个体被抽到的概率为81. (3)分层抽样法:按比例16020=81,分别在一级品、二级品、三级品、等外品中抽取48×81=6个,64×81=8个,32×81=4个,16×81=2个,每个个体被抽到的概率分别为486,648,324,162,即都是81. 综上可知,无论采取哪种抽样,总体的每个个体被抽到的概率都是81. 评述:三种抽样方法的共同点就是每个个体被抽到的概率相同,这样样本的抽取体现了公平性和客观性.思考讨论现有20张奖券,已知只有一张能获奖,甲从中任摸一张,中奖的概率为201,刮开一看没中奖.乙再从余下19张中任摸一张,中奖概率为191,这样说甲、乙中奖的概率不一样,是否正确?【例2】 将温度调节器放置在贮存着某种液体的容器内,调节器设定在d ℃,液体的温度ξ(单位:℃)是一个随机变量,且ξ~N (d ,0.52).(1)若d=90°,求ξ<89的概率;(2)若要保持液体的温度至少为80 ℃的概率不低于0.99,问d 至少是多少?(其中若η~N (0,1),则Φ(2)=P (η<2)=0.9772,Φ(-2.327)=P (η<-2.327)=0.01).剖析:(1)要求P (ξ<89)=F (89),∵ξ~N (d ,0.5)不是标准正态分布,而给出的是Φ(2),Φ(-2.327),故需转化为标准正态分布的数值.(2)转化为标准正态分布下的数值求概率p ,再利用p ≥0.99,解d.解:(1)P (ξ<89)=F (89)=Φ(5.09089-)=Φ(-2)=1-Φ(2)=1-0.9772=0.0228. (2)由已知d 满足0.99≤P (ξ≥80),即1-P (ξ<80)≥1-0.01,∴P (ξ<80)≤0.01.∴Φ(5.080d -)≤0.01=Φ(-2.327). ∴5.080d -≤-2.327. ∴d ≤81.1635.故d 至少为81.1635.评述:(1)若ξ~N (0,1),则η=σμξ-~N (0,1).(2)标准正态分布的密度函数f (x )是偶函数,x<0时,f (x )为增函数,x>0时,f (x )为减函数.深化拓展在实际生活中,常用统计中假设检验的思想检验产品是否合格,方法是:(1)提出统计假设:某种指标服从正态分布N (μ,σ2);(2)确定一次试验中的取值a ;(2)作出统计推断:若a ∈(μ-3σ,μ+3σ),则接受假设,若a ∈(μ-3σ,μ+3σ),则拒绝假设.如:某砖瓦厂生产的砖的“抗断强度”ξ服从正态分布N (30,0.8),质检人员从该厂某一天生产的1000块砖中随机抽查一块,测得它的抗断强度为27.5 kg/cm 2,你认为该厂这天生产的这批砖是否合格?为什么?分析:由于在一次试验中ξ落在区间(μ-3σ,μ+3σ)内的概率为0.997,故ξ几乎必然落在上述区间内.于是把μ=30,σ=0.8代入,算出区间(μ-3σ,μ+3σ)=(27.6,32.4),而27.5∉(27.6,32.4).∴据此认为这批砖不合格.【例3】 已知测量误差ξ~N (2,100)(cm ),必须进行多少次测量,才能使至少有一次测量误差的绝对值不超过8 cm 的频率大于0.9?解:设η表示n 次测量中绝对误差不超过8 cm 的次数,则η~B (n ,p ).其中P=P (|ξ|<8)=Φ(1028-)-Φ(1028--)=Φ(0.6)-1+Φ(1)=0.7258-1+0.8413=0.5671.由题意,∵P (η≥1)>0.9,n 应满足P (η≥1)=1-P (η=0)=1-(1-p )n >0.9,∴n>)5671.01lg()9.01lg(--=4329.0lg 1-=2.75. 因此,至少要进行3次测量,才能使至少有一次误差的绝对值不超过8 cm 的概率大于0.9. ●闯关训练夯实基础1.对总数为N 的一批零件抽取一个容量为30的样本,若每个零件被抽取的概率为0.25,则N 等于A.150B.200C.120D.100解析:∵N30=0.25,∴N=120.答案:C2.设随机变量ξ~N (μ,σ),且P (ξ≤C )=P (ξ>C ),则C 等于A.0B.σC.-μD.μ解析:由正态曲线的图象关于直线x=μ对称可得答案为D.答案:D3.(2003年全国,14)某公司生产三种型号的轿车,产量分别为1200辆、6000辆和2000辆,为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取______辆、______辆、______辆.解析:因总轿车数为9200辆,而抽取46辆进行检验,抽样比例为920046=2001,而三种型号的轿车有显著区别.根据分层抽样分为三层按2001比例分别有6辆、30辆、10辆. 答案:6 30 104.某厂生产的零件外直径ξ~N (8.0,1.52)(mm ),今从该厂上、下午生产的零件中各随机取出一个,测得其外直径分别为7.9 mm 和7.5 mm ,则可认为A.上、下午生产情况均为正常B.上、下午生产情况均为异常C.上午生产情况正常,下午生产情况异常D.上午生产情况异常,下午生产情况正常解析:根据3σ原则,在8+3×1.5=8.45(mm )与8-3×1.5=7.55(mm )之外时为异常. 答案:C5.随机变量ξ服从正态分布N (0,1),如果P (ξ<1)=0.8413,求P (-1<ξ<0). 解:∵ξ~N (0,1),∴P (-1<ξ<0)=P (0<ξ<1)=Φ(1)-Φ(0)=0.8413-0.5=0.3413.6.公共汽车门的高度是按照确保99%以上的成年男子头部不跟车门顶部碰撞设计的,如果某地成年男子的身高ξ~N (173,72)(cm ),问车门应设计多高?解:设公共汽车门的设计高度为x cm ,由题意,需使P (ξ≥x )<1%.∵ξ~N (173,72),∴P (ξ≤x )=Φ(7173-x )>0.99. 查表得7173-x >2.33,∴x >189.31,即公共汽车门的高度应设计为190 cm ,可确保99%以上的成年男子头部不跟车门顶部碰撞.培养能力7.一投资者在两个投资方案中选择一个,这两个投资方案的利润x (万元)分别服从正态分布N (8,32)和N (6,22),投资者要求利润超过5万元的概率尽量地大,那么他应选择哪一个方案?解:对第一个方案,有x ~N (8,32),于是P (x>5)=1-P (x ≤5)=1-F (5)=1-Φ(385-)=1-Φ(-1)=1-[1-Φ(1)]=Φ(1)=0.8413. 对第二个方案,有x ~N (6,22),于是P (x>5)=1-P (x ≤5)=1-F (5)=1-Φ(265-)=1-Φ(-0.5)=Φ(0.5)=0.6915.相比之下,“利润超过5万元”的概率以第一个方案为好,可选第一个方案.探究创新(2)画出频率分布直方图和累积频率分布图;(3)根据累积频率分布图,总体中小于22的样本数据大约占多大的百分比?(2)频率分布直方图及累积频率分布图如下:(3横坐标为22,落在21~24的区间内,折线图在这段区间上的线段所在的直线方程是y -0.3=21243.051.0--(x -21), 即y=0.07x -1.17.当x=22时,y=1.54-0.17=0.37.因此,总体中小于22的数据大约占37%.●思悟小结以上两种情况的不同之处在于前者的频率分布表中列出的是几个不同数值的频率,相应的条形图是用其高度来取各个值的频率的;后者的频率分布表中列出的是在各个不同区间内取值的频率,相应的直方图是用图形面积的大小来表示在各个区间内取值的频率.●教师下载中心教学点睛简单随机抽样,有以下特点:(1)它要求被抽取样本的总体的个体数有限.这样,就便于对其中各个个体被抽取的概率进行分析.(2)它是从总体中逐个地进行抽取,这样,就便于在抽样实践中进行操作.(3)它是一种不放回抽样.由于抽样实践中多采用不放回抽样,使其具有较广泛的实用性,而且由于所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算.(4)它是一种等概率抽样.不仅每次从总体中抽取一个个体时,各个个体被抽取的概率相等,而且在整个抽样过程当中,各个个体被抽取的概率相等,从而保证了这种抽样方法的公平性.频率分布随着样本容量的增大更加接近总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布直方图就会演变成一条光滑曲线——反映总体分布的频率密度曲线,基于频率分布与相应的总体分布的关系,且通常我们并不知道一个总体的分布,因此,我们往往是从总体中抽取一个样本,用样本的频率分布去估计相应的总体分布.统计中假设检验的基本思想是:根据小概率事件在一次试验中几乎不可能发生的原理和从总体中抽测的个体的数值,对事先所作的统计假设作出判断:是拒绝假设,还是接受假设.拓展例题【例题】 设有一样本x 1,x 2,…,x n ,其标准差为s x ,另有一样本y 1,y 2,…,y n ,其中y i =3x i +2(i=1,2,…,n ),其标准差为s y ,求证:s y =3s x .证明:∵x =nx x x n ++21, ∴y =ny y y n ++21 =nx x x n )23()23()23(21++++++ =nn x x x n 2)(321+++ =3x +2. ∴s y 2=n1[(y 12+y 22+…+y n 2)-n y 2] =n1[(3x 1+2)2+(3x 2+2)2+…+(3x n +2)2-n (3x +2)2] =n1[9(x 12+x 22+…+x n 2)+12(x 1+x 2+…+x n )+4n -n (9x 2+12x +4)] =n9[(x 12+x 22+…+x n 2)-n x 2] =9s x 2.∵s x ≥0,s y ≥0,∴s y =3s x .。
测试卷15 统计(A)-2020年高考数学一轮复习必修1—5册(人教A版)单元过关检测试卷(解析版)
高中数学单元过关测试卷统计(A )(测试卷15)测试时间:120分钟 满分:150分一、选择题(每小题5分,共60分)(每小题有四个选项,只有一个正确)1.下面的抽样方法是简单随机抽样的为( )A .在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B .某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C .某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D .用抽签方法从10件产品中选取3件进行质量检验 【答案】D【解析】A ,B 选项中为系统抽样,C 为分层抽样.2.一支田径队共有运动员98人,其中女运动员42人,用分层抽样的方法抽取一个样本,每名运动员被抽到的概率都是27,则男运动员应抽取( )A .18人B .16人C .14人D .12人【答案】B【解析】∵田径队共有运动员98人,其中女运动员有42人,∴男运动员有56人, ∵每名运动员被抽到的概率都是27,∴男运动员应抽取56×27=16(人),故选B .3.重庆市2016年各月的平均气温(℃)数据的茎叶图如图所示,则这组数据的中位数是( )A .19B .20C .21.5D .23【答案】B【解析】由茎叶图可知这组数据由小到大依次为8,9,12,15,18,20,20,23,23,28,31,32,所以中位数为20+202=20.4.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图(如图).根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 【答案】A【解析】对于选项A ,由图易知月接待游客量每年7,8月份明显高于12月份,故A 错; 对于选项B ,观察折线图的变化趋势可知年接待游客量逐年增加,故B 正确; 对于选项C ,D ,由图可知显然正确. 故选A .5.如图所示对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图①;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图②.由这两个散点图可以判断( )图① 图②A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关 【答案】C【解析】由题图①可知y 随x 的增大而减小,各点整体呈下降趋势,故变量x 与y 负相关,由题图②知v 随u 的增大而增大,各点整体呈上升趋势,故变量v 与u 正相关.6.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423;②y 与x 负相关且y ^=-3.476x +5.648; ③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确...的结论的序号是( ) A .①② B .②③ C .③④ D .①④【答案】D【解析】由回归直线方程y ^=b ^x +a ^,知当b ^>0时,y 与x 正相关;当b ^<0时,y 与x 负相关.∴①④一定错误.故选D.7.从编号为001,002,…,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为( )A .480B .481C .482D .483【答案】C【解析】根据系统抽样的定义可知样本的编号成等差数列,令a 1=7,a 2=32,则d =25,所以7+25(n -1)≤500,所以n ≤20.72,因为n ∈N *,所以n 的最大值为20,最大编号为7+25×(20-1)=482.8.某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n 的样本,已知从高中生中抽取70人,则n 为( )A .100B .150C .200D .250【答案】A【解析】样本抽取比例为703 500=150,该校总人数为1 500+3 500=5 000,则n 5 000=150,故n =100,选A .9.某工厂的三个车间在12月份共生产了3 600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从第一、二、三车间抽取的产品数分别为a ,b ,c ,且a ,b ,c 构成等差数列,则第二车间生产的产品数为( )A .800B .1 000C .1 200D .1 500【答案】C【解析】因为a ,b ,c 成等差数列,所以2b =a +c ,所以a +b +c3=b ,所以从第二车间抽取的产品数占抽样产品总数的13,根据分层抽样的性质,可知第二车间生产的产品数占总数的13,即13×3 600=1 200.10.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为() A.8B.15C.16D.32【答案】C【解析】已知样本数据x1,x2,…,x10的标准差为s=8,则s2=64,数据2x1-1,2x2-1,…,2x10-1的方差为22s2=22×64,所以其标准差为22×64=2×8=16.11.下列说法错误的是()A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B.在线性回归分析中,相关系数r的值越大,变量间的相关性越强C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好【答案】B【解析】根据相关关系的概念知A正确;当r>0时,r越大,相关性越强,当r<0时,r越大,相关性越弱,故B不正确;对于一组数据拟合程度好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好;二是R2越大,拟合效果越好,所以R2为0.98的模型比R2为0.80的模型拟合的效果好,C,D正确,故选B.12.为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为()A.①③B.①④C.②③D.②④【答案】B【解析】由茎叶图中的数据通过计算求得x甲=29,x乙=30,s甲= 3.6,s乙=2,∴x甲<x乙,s甲>s乙,故①④正确.故选B.二、填空题(每小题5分,共20分)13.某大学为了了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.【答案】60【解析】根据题意,应从一年级本科生中抽取的人数为44+5+5+6×300=60.14.已知一组正数x 1,x 2,x 3,x 4的方差s 2=14(x 21+x 22+x 23+x 24-16),则数据x 1+2,x 2+2,x 3+2,x 4+2的平均数为________.【答案】4【解析】因为一组正数x 1,x 2,x 3,x 4的方差s 2=14(x 21+x 22+x 23+x 24-4x 2),所以4x 2=16,得x =2(负舍),所以x 1+2,x 2+2,x 3+2,x 4+2的平均数为x 1+2+x 2+2+x 3+2+x 4+24=x +2=4.15.某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________. 【答案】 (1)3 (2)6 000【解析】(1)由0.1×1.5+0.1×2.5+0.1a +0.1×2.0+0.1×0.8+0.1×0.2=1,解得a =3. (2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6. 因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.16.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据得回归直线方程y =b x +a 中的b =-2,预测当气温为-4 ℃时,用电量为________度. 【答案】68【解析】根据题意知x =18+13+10+(-1)4=10,y =24+34+38+644=40,因为回归直线过样本点的中心,所以a ^=40-(-2)×10=60,所以当x =-4时,y =(-2)×(-4)+60=68,所以用电量为68度.三、解答题(6大题,共70分)17.(10分)某车间将10名技工平均分成甲、乙两组加工某种零件,在单位时间内每个技工加工的合格零件数的统计数据的茎叶图如图所示,已知两组技工在单位时间内加工的合格零件的平均数都为10.(1)求出m ,n 的值;(2)求出甲、乙两组技工在单位时间内加工的合格零件的方差s 2甲和s 2乙,并由此分析两组技工的加工水平. 【解析】 (1)根据题意可知:x 甲=15(7+8+10+12+10+m )=10,x 乙=15(9+n +10+11+12)=10,∴m =3,n =8.(2)s 2甲=15[(7-10)2+(8-10)2+(10-10)2+(12-10)2+(13-10)2]=5.2, s 2乙=15[(8-10)2+(9-10)2+(10-10)2+(11-10)2+(12-10)2]=2, ∵x 甲=x 乙,s 2甲>s 2乙,∴甲、乙两组的平均水平相当,乙组更稳定一些.18.(12分)一企业从某条生产线上随机抽取100件产品,测量这些产品的某项技术指标值x ,得到如下的频率分布表:(2)若x <13或x ≥21,则该产品不合格.现从不合格的产品中随机抽取2件,求抽取的2件产品中技术指标值小于13的产品恰有一件的概率.【解析】 (1)频率分布直方图为估计平均值:x =12×0.02+14×0.12+16×0.34+18×0.38+20×0.10+22×0.04=17.08. 估计众数:18.(2)设“从不合格的产品中任取2件,技术指标值小于13的产品恰有一件”为事件A ,则P (A )=C 12C 14C 26=815.19.(12分)某校在高一年级学生中,对自然科学类、社会科学类校本选修课程的选课意向进行调查.现从高一年级学生中随机抽取180名学生,其中男生105名;在这180名学生中选择社会科学类的男生、女生均为45名.(1)试问:从高一年级学生中随机抽取1人,抽到男生的概率约为多少?(2)根据抽取的180名学生的调查结果,完成下面的2×2列联表.并判断能否在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关?附:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .【解析】 (1)从高一年级学生中随机抽取1人,抽到男生的概率约为105180=712.(2)根据统计数据,可得2×2列联表如下:则K 2=180×(60×45-30×45)105×75×90×90=367≈5.142 9>5.024,所以能在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关.20.(12分)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1-7分别对应年份2008-2014.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注参考数据:∑7i =1y i =9.32,∑7i =1t i y i =40.17,∑7i =1(y i -y )2=0.55,7≈2.646.参考公式:相关系数r =∑n i =1 (t i -t )(y i -y )∑n i =1(t i -t )2∑n i =1(y i -y )2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为b ^=∑ni =1 (t i -t )(y i -y )∑ni =1(t i -t )2,a ^=y --b ^t . 【解析】 (1)由折线图中的数据和附注中的参考数据得t =4,∑7i =1(t i -t )2=28,∑7i =1 (y i -y )2=0.55,∑7i =1(t i -t )(y i -y )=∑7i =1t i y i -t ∑7i =1y i =40.17-4×9.32=2.89, r ≈2.892×2.646×0.55≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得b ^=∑7i =1 (t i -t )(y i -y )∑7i =1(t i -t )2=2.8928≈0.103, a ^=y -b ^t ≈1.331-0.103×4≈0.92. 所以y 关于t 的回归方程为y ^=0.92+0.10t .将2016年对应的t =9代入回归方程得y ^=0.92+0.10×9=1.82. 所以预测2016年我国生活垃圾无害化处理量将约为1.82亿吨.21.(12分)经国务院批复同意,郑州成功入围国家中心城市.某校学生社团针对“郑州的发展环境”对20名学生进行问卷调查打分(满分100分),得到茎叶图,如图9-3-19①:① ②(1)分别计算男生、女生打分的平均分,并用数字特征评价男、女生打分的数据分布情况;(2)如图9-3-19②是按照打分区间[50,60),[60,70),[70,80),[80,90),[90,100]绘制的频率分布直方图,求最高矩形的高;(3)从打分在70分以下(不含70分)的学生中抽取3人,求有女生被抽中的概率. 【解析】 (1)男生打分平均数为110(53+55+62+65+70+71+73+74+86+81)=69; 女生打分平均数为110(68+69+76+75+70+78+79+82+87+96)=78. 易得s 2男=99.6,s 2女=68,说明男生打分数据比较分散(答案不唯一,通过观察茎叶图或者众数中位数说明,理由充分即可).(2)h =920÷10=0.045.(3)设“有女生被抽中”为事件A ,打分在70分以下(不含70分)的学生中女生有2人,设为a ,b ,男生4人,设为c ,d ,e ,f .基本事件有abc ,abd ,abe ,abf ,acd ,ace ,acf ,ade ,adf ,aef ,bcd ,bce ,bcf ,bde ,bdf ,bef ,cde ,cdf ,cef ,def ,共20种,其中有女生的有16种,所以P (A )=1620=45.22.(12分)下表数据为某地区某种农产品的年产量x (单位:吨)及对应销售价格y (单位:千元/吨).(1)若y 与x y 关于x 的线性回归方程y ^=b ^x +a ^;(2)若每吨该农产品的成本为13.1千元,假设该农产品可全部卖出,预测当年产量为多少吨时,年利润Z 最大?参考公式:⎩⎪⎨⎪⎧b ^=∑ni =1x i y i -n x -y -∑n i =1x 2i -n x-2=∑n i =1 (x i -x )(y i -y -)∑ni =1(x i -x )2,a ^=y --b ^x -.【解析】 (1)∵x =1+2+3+4+55=3,y -=70+65+55+38+225=50,∑5i =1x i y i =1×70+2×65+3×55+4×38+5×22=627, ∑5i =1x 2i =1+4+9+16+25=55,根据公式解得b ^=-12.3, a ^=50+12.3×3=86.9, ∴y ^=-12.3x +86.9.(2)∵年利润Z =x (86.9-12.3x )-13.1x =-12.3x 2+73.8x =-12.3(x -3)2+110.7, ∴当x =3时,年利润Z 最大.。
高考数学一轮复习 12.2 统计随堂检测 理(含解析)人教
【优化方案】2014届高考数学一轮复习 12.2 统计随堂检测理
(含解析)人教版
某校一课外小组对南昌市工薪阶层关于“楼市限购令”态度进行调查,随机抽调了50人,他们月收入频数分布及对“楼市限购令”赞成人数如下表.
(2)若从收入(单位:百元)在[15,25),[25,35)的被调查者中各随机选取两人进行追踪调查,记选中的4人中不赞成“楼市限购令”人数为ξ,求随机变量ξ的分布列和数学期望.
解:(1)各组的频率分别是0.1,0.2,0.3,0.2,0.1,0.1,
所以图中各组的纵坐标分别是0.01,0.02,0.03,0.02,0.01,0.01,
(2)ξ所有可能取值有0,1,2,3,
P (ξ=0)=C 24C 25×C 28C 210=610×2845=84225
, P (ξ=1)=C 14C 25×C 28C 210+C 24C 25×C 18C 12C 210=410×2845+610×1645=104225
, P (ξ=2)=C 14C 25×C 18C 12C 210+C 24C 25×C 22C 210=410×1645+610×145=35225
, P (ξ=3)=C 14C 25·C 22C 210=410×145=2225
. 所以ξ的分布列是
所以ξ的期望值是Eξ=0+225+225+225=5.。
高三数学第一轮复习测试及详细解答(10)—《排列、组合、二项式、概率与统计》
n nnn高三数学第一轮复习单元测试(9)—《排列、组合、二项式、概率与统计》一、选择题:本大题共 12 小题,每小题 5 分,共 60 分.在每小题给出的四个选项中。
只有一项是符合题目要求的. 1.(理)下列随机变量中,不是离散型随机变量的是()A .从 10 只编号的球(0 号到 9 号)中任取一只,被取出的球的号码ξB .抛掷两个骰子,所得的最大点数ξC .[0,10]区间内任一实数与它四舍五人取整后的整数的差值ξD .一电信局在未来某日内接到的电话呼叫次数ξ(文)现有 10 张奖票,只有 1 张可中奖,第一人与第十人抽中奖的概率为( )1 1 A . ,1021 1B . ,2 1011C .,10 1019D .,10 102.为了让人们感知丢弃塑料袋对环境造成的影响,某班环保小组的六名同学记录了自己家中一周内丢的塑料袋的数量,结果如下(单位:个):33、25、28、26、25、31.如果该班有 45 名学生,那么根据提供的数据估计本周全班同学各家共丢弃塑料袋 ( ) A .900 个 B .1080 个 C .1260 个 D .1800 个3.假定有一排蜂房,形状如图,一只蜜蜂在左下角的蜂房中,由于受了点伤,只能爬,不能飞,而且只能永远向右方(包括右上,右下)爬行,从一间蜂房爬到与之相邻的右方蜂房中去,从最初位置爬到 4 号蜂房中,则不同的爬法有 ( ) A .4 种B .6 种C .8 种D .10 种2n +1 与 A 3 的大小关系是()2n +1 > A 3 2n +1 < A 3 2n +1 = A 3 D .大小关系不定niilog 2 f (3) 5.(理)若 f (m )=∑ m Cn ,则i =01 A .2 B .2等于()2 f (1) C .1 D .3(文)某校从 8 名教师中选派 4 名教师同时去 4 个边远地区支教(每地 1 人),其中甲和乙不同去,则不同的选派方案共有 种 A .1320B .288C .1530D .6706.(理)在二项式( x - i )6 的展开式中(其中i 2=-1),各项系数的和为()A .64 iB .-64 iC .64D .-643 4.A A .A B .A C .A log(文)已知(2a3+ 1)n 的展开式的常数项是第7 项,则正整数n 的值为()aA.7 B.8 C .9 D.10 7.右图中有一个信号源和五个接收器。
高考数学一轮复习《统计》练习题(含答案)
高考数学一轮复习《统计》练习题(含答案)一、单选题1.已知条件p :11x -<<,q :x >m ,若p 是q 的充分不必要条件,则实数m 的取值范围是( ) A .[)1,-+∞B .(),1-∞-C .()1,0-D .(],1-∞-2.下表为随机数表的一部分:08015 17727 45318 22374 21115 78253 77214 77402 43236 00210 45521 64237已知甲班有60位同学,编号为00~59号,规定:利用上面的随机数表,从第1行第4列的数开始,从左向右依次读取2个数,则抽到的第8位同学的编号是( ) A .11B .15C .25D .373.一组数据的方差为()20S S ≥,将该组数据都乘以2,所得到的一组新数据的标准差为( )A .22S B .SC .2SD .2S4.甲、乙两所学校的男女生比例如图所示,已知甲校学生总数为1500,乙校学生总数为1000,下列结论错误的是( )A .甲校女生比乙校女生多B .乙校男生比甲校男生少C .乙校女生比甲校男生少D .甲校女生比乙校男生少5.某校共有学生3000人,为了解学生的身高情况,用分层抽样的方法从三个年级中抽取容量为100的样本,其中高一抽取40人,高二抽取30人,则该校高三学生人数为( ) A .600B .800C .900D .12006.设某高中的男生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据()(12)i i x y i n =,,,,,用最小二乘法建立的回归方程为ˆ0.8580.71y x =-,则下列结论中不正确的是( ) A .y 与x 有正的线性相关关系B .回归直线过样本点的中心(),x yC .若该高中某男生身高增加1cm ,则其体重约增加0.85kgD .若该高中某男生身高为170cm ,则可断定其体重必为63.79kg 7.x 是12100,,,x x x 的平均值,5为4120,,,x x x 的平均值,10为4142100,,,x x x 的平均值,则x =( ) A .8B .9C .15D .1528.某学校有男生400人,女生600人.为调查该校全体学生每天睡眠时间,采用分层抽样的方法抽取样本,计算得男生每天睡眠时间均值为7.5小时,方差为1,女生每天睡眠时间为7小时,方差为0.5.若男、女样本量按比例分配,则可估计总体方差为( ). A .0.45B .0.62C .0.7D .0.769.某样本点)()(,1,2,,i i x y i n =⋅⋅⋅的经验回归方程为ˆ0.50.7yx =+,当8x =时,y 的实际值为4.5,则当8x =时,预测值与实际值的差值为( ). A .0.1B .0.2C .0.3D .0.410.若数据9,m ,6,n ,5的平均数为7,方差为2,则数据11,9,21m -,17,21n -的平均数和方差分别为( ) A .13,4B .14,4C .13,8D .14,811.2021年起,我市将试行“3+1+2”的普通高考新模式,即除语文、数学、外语3门必选科目外,考生再从物理、历史中选1门,从化学、生物、地理、政治中选2门作为选考科目.为了帮助学生合理选科,某中学将高一每个学生的六门科目综合成绩按比例均缩放成5分制,绘制成雷达图.甲同学的成绩雷达图如图所示,下面叙述一定不正确的是( )A .甲的化学成绩领先年级平均分最多.B .甲有2个科目的成绩低于年级平均分.C .甲的成绩最好的前两个科目是化学和地理.D .对甲而言,物理、化学、地理是比较理想的一种选科结果.12.冬末春初,乍暖还寒,人们容易感冒发热,若发生群体性发热,则会影响到人们的身体健康,干扰正常工作生产,某大型公司规定:若任意连续7天,每天不超过5人体温高于37.3℃,则称没有发生群体性发热,下列连续7天体温高于37.3℃人数的统计特征数中,能判定该公司没有发生群体性发热的为( )(1)中位数为3,众数为2 (2)均值小于1,中位数为1(3)均值为3,众数为4 (4)均值为2 A .(1)(3)B .(3)(4)C .(2)(3)D .(2)(4)二、填空题13.某校高一、高二、高三年级的学生人数之比为5:5:4,现按年级用分层抽样的方法抽取若干人,若抽取的高三年级的学生人数为20,则抽取的样本容量为______.14.已知具有线性相关的变量x 、y ,设其样本点为()(1,2,,,8)i i i A x y i =,回归直线方程为1ˆ2yx b =+,若128(6,2)OA OA OA +++=(O 为原点),则b =_______.15.已知一组数据按顺序排列为:12,16,20,n ,46,51,58,60.若这组数据的第30百分位数的两倍与这组数据的第50百分位数相等,则n 的值为___________.16.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:由表中的数据得线性回归方程为y bx a =+,其中20b =-,预测当产品价格定为9.5(元)时,销量约为__________件.三、解答题17.某区政府组织了以“不忘初心,牢记使命”为主题的教育活动,为统计全区党员干部一周参与主题教育活动的时间,从全区的党员干部中随机抽取n 名,获得了他们一周参与主题教育活动时间(单位:h )的频率分布直方图如图所示,已知参与主题教育活动时间在(]12,16内的人数为92.(1)求n 的值;(2)以每组数据所在区间的中点值作为本组的代表,估算这些党员干部参与主题教育活动时间的中位数(中位数精确到0.01).(3)如果计划对参与主题教育活动时间在(]16,24内的党员干部给予奖励,且在(]16,20,(]20,24内的分别评为二等奖和一等奖,那么按照分层抽样的方法从获得一、二等奖的党员干部中选取5人参加社区义务宣讲活动,再从这5人中随机抽取2人作为主宣讲人,求这2人均是二等奖的概率.18.由于疫情影响,今年我们学校开展线上教学,高一年级某班班主任为了了解学生上网学习时间,对本班40名学生某天上网学习时间进行了调查,将数据(取整数)整理后,绘制出如图所示频率分布直方图,已知从左到右各个小组的频率分别是0.15,0.25,0.35,0.20,0.05,则根据直方图所提供的信息:(1)这一天上网学习时间在100~119分钟之间的学生有多少人?(2)估计这40位同学的线上平均学习时间(同一组中的数据用该组区间的中点值为代表)以及中位数分别是多少?(精确到0.1)(3)如果只用这40名学生这一天上网学习时间作为样本去推断该校高一年级全体学生该天的上网学习时间,这样推断是否合理?为什么?19.省政府坚持以习近平新时代中国特色社会主义思想为指导,落实全国、全省教育大会部署,坚持社会主义办学方向,落实立德树人根本任务,发展素质教育,推进育人方式变革,引导全社会树立科学的教育质量观和人才培养观,切实减轻有损中小学生身心健康的过重学业负担,遵循教育教学规律,促进中小学生健康成长,培养德智体美劳全面发展的社会主义建设者和接班人.从某市抽取1000名一年级小学生进行调查,统计他们每周做作业的时长(单位:小时),根据结果绘制的频率分布直方图如下:(1)根据频率分布直方图,求所有被抽查小学生每周做作业的平均时长和中位数;(同一组中的数据用该组区间的中点值作代表)(2)①为了进一步了解,现采用分层抽样的方法从[8,10]和[10,12]组中抽取50名学生,则两组各抽取多少人?②再利用分层抽样从抽取的50人中选5人参加一个座谈会.现从参加座谈会的5名学生中随机抽取两人发言,求[8,10]小组中恰有2人发言的概率?20.为了调查某地区高中女生的日均消费情况,研究人员随机抽取了该地区5000名高中女生作出调查,所得数据统计如下图所示.(1)求a 的值以及这5000名高中女生的日均消费的平均数(同一组数据用该组区间的中间值代替);(2)在样本中,现按照分层抽样的方法从该地区消费在[)15,20与[)20,25的高中女生中随机抽取9人,若再从9人中随机抽取3人,记这3人中消费在[)15,20的人数为X ,求X 的分布列以及数学期望.21.道德与法律的联系:法律、道德都是行为规范,都是为规范人们的行为而规定的行动准则.1.法律需要道德的奠基和撑持;2.道德的实施需要法律的强制保障.某校进行了一次道德与法律的相关测试(满分:100分),并随机抽取了50个统计其分数,得到的结果如下表所示: 成绩/分 [)0,20[)20,40[)40,60[)60,80[)80,100人数/个 44102210(1)若同一组数据用该区间中点值作代表,试估计这次测试的平均分和中位数(所得结果四舍五入保留整数);(2)假设处于[)20,40的4个人的成绩分别为20,26,35,38,求表中成绩的10%分位数; (3)以频率估计概率,若在这个学校中,随机挑选3人,记3人的成绩在[)80,100间的数量为随机变量X ,求X 的分布列和数学期望()E X .22.某校从高三年级学生中随机抽取100名学生的某次数学考试成绩,将其成绩分成[)50,60,[)60,70,[)70,80,[)80,90,[]90,100的5组,制成如图所示的频率分布直方图.(1)求图中x 的值;(2)估计这组数据的平均数;(3)若成绩在[)50,60内的学生中男生占40%.现从成绩在[)50,60内的学生中随机抽取2人进行分析,求2人中恰有1名女生的概率.23.某校从高三学生中选取了50名学生参加数学质量检测,成绩(单位:分)分组及各组的频数如下:[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出频率分布表;(2)画出频率直方图及频率折线图.24.某农业科学研究所为检验某农作物种子的培育有效率,进行了如下试验:一是对该农作物的10000粒种子进行培育,发现有20粒种子未发芽;二是将未进行培育的该农作物的2500粒种子种植在5块试验田中,各试验田种植的种子数及未发芽数如下表:(1)求y 关于x 的回归直线方程; (2)在上述试验下,若以1nN-表示该农作物种子的培育有效率,其中n 为进行培育的10000粒种子的未发芽数,N 为依据上述回归方程估算的未进行培育的10000粒种子的未发芽数,请估计该农作物种子的培育有效率(结果保留3位有效数字).参考公式;在回归方程ˆˆˆy bx a =+中,1221ˆni ii nii x y nx ybxnx==-⋅=-∑∑,ˆˆa y bx=-参考答案1.D2.A3.D4.D5.C6.D7.A8.D9.B10.C11.A12.D 13.7014.18-##-0.12515.34 16.6017.(1)由已知可得,0.25(0.02500.04750.05000.0125)0.1150a =-+++=. 则0.1150492n ⨯⨯=,得922000.11504n ==⨯.(2)设中位数为x ,则0.050040.01254(16)0.11500.5x ⨯+⨯+-⨯=,得13.83x ≈.(3)按照分层抽样的方法从(16,20]内选取的人数为0.050540.05000.0125⨯=+,从(20,24]内选取的人数为0.0125510.05000.0125⨯=+.记二等奖的4人分别为a ,b ,c ,d ,一等奖的1人为A ,事件E 为“从这5人中抽取2人作为主宣讲人,且这2人均是二等奖”.从这5人中随机抽取2人的基本事件为(,)a b ,(,)a c ,(,)a d ,(,)a A ,(,)b c ,(,)b d ,(,)b A ,(,)c d ,(,)c A ,(,)d A ,共10种,其中2人均是二等奖的情况有(,)a b ,(,)a c ,(,)a d ,(,)b c ,(,)b d ,(,)c d ,共6种, 由古典概型的概率计算公式得()63105P E ==. 18.(1)因为频数=样本容量⨯频率,一天上网学习时间在100119分钟之间的学生所占频率为0.35,所以一天上网学习时间在100~119分钟之间的学生人数为400.3514⨯=(人) (2)40位同学的线上学习时间估计值为:0.1569.90.2589.90.35109.90.20129.90.05149.9104.9⨯+⨯+⨯+⨯+⨯=分钟在中位数左边和右边的小长方形的面积和是相等的,设在99.9~119.9靠近左侧长度为x ,则0.15+0.25+0.350.5x =解得0.27x ≈; 所以中位数估计值是99.9+0.27=100.17100.2≈(3)因为该样本的选取只在高一某班,不具有代表性,所以这样推断不合理. 19.(1)设抽查学生做作业的平均时长为x ,中位数为y ,0.0510.130.2550.370.1590.1110.0513 6.8x =⨯+⨯+⨯+⨯+⨯+⨯+⨯=, 0.050.10.250.15(6)0.5y y =+++⨯-=,解得203y =即抽查学生做作业的平均时长为6.8,中位数为203. (2)①[8,10]组的人数为10000.15150⨯=人,设抽取的人数为a ,[]10,12组的人数为10000.1100⨯=人, 设抽取的人数为b ,则50150100250a b ==,解得30a =,20b = 所以在[8,10]和[]10,12两组中分别抽取30人和20人,②再抽取5人,其中[8,10]和[]10,12两组中分别抽取3人和2人,将[8,10]组中被抽取的工作人员标记为1A ,2A ,3A ,将[]10,12中的标记为1B ,2B . 设事件C 表示从[8,10]小组中恰好抽取2人,则抽取的情况如下:{}12,A A ,{}13,A A ,{}11,A B ,{}12,A B ,{}23,A A ,{}21,A B ,{}22,A B ,{}31,A B ,{}32,A B ,{}12,B B 共10种情况;其中在[8,10]中恰好抽取2人有3种,则3()10P C =. 20.(1)由题意得,()20.040.080.0651a +++⨯=,解得0.01a =,故所求平均数为17.50.427.50.332.50.0537.50.0524.25⨯0.2+22.5⨯+⨯+⨯++=(元); (2)由题意得,消费在[)15,20,[)20,25的高中女生分别有3人和6人,故X 的可能取值为0,1,2,3,∴()6033395021C C P X C ===,()21633915128C C P X C ===,()1263393214C C P X C ===,()0363391384C C P X C ===, 故X 的分布列为:∴()515310123121281484E X =⨯+⨯+⨯+⨯=; 故答案为:1. 21.(1)估计这次测试的平均分为1043045010702290106250x ⨯+⨯+⨯+⨯+⨯==(分);设这次测试的中位数为0x ,显然()060,80x ∈,则060441022200.550x -+++⋅=,解得066x ≈(分). 即估计这次测试的中位数为66.(2)由于5010%5⨯=,所以表中成绩的10%分位数为2026232+=. (3)X 所有可能取值为0,1,2,3.由表中数据可知,任意挑选一人,成绩在[)80,100间的概率为101505=. 所以()346405125P X ⎛⎫=== ⎪⎝⎭,()21341481C 55125P X ⎛⎫=== ⎪⎝⎭, ()122341122C 55125P X ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭,()31135125P X ⎛⎫=== ⎪⎝⎭, 故X 的分布列为故X 的数学期望()6448121301231251251251255E X =⨯+⨯+⨯+⨯=. 22.(1)由频率分布直方图得()0.0050.0350.0300.010101x ++++⨯=,解得0.020x =, 所以图中x 的值是0.020.(2)由频率分布直方图得这组数据的平均数: (550.005650.020750.03585x =⨯+⨯+⨯+⨯)0.030950.0101077+⨯⨯=, 所以这组数据的平均数为77.(3)数学成绩在[)50,60内的人数为0. 005101005⨯⨯=(人),其中男生人数为540%2⨯=(人),则女生人数为3人,记2名男生分别为1A ,2A ,3名女生分别为1B ,2B ,3B ,从数学成绩在[)50,60内的5人中随机抽取2人进行分析的基本事件为:121112132122A A A B A B A B A B A B ,,,,,,23121323A B B B B B B B ,,,,共10个不同结果,它们等可能, 其中2人中恰有1名女生的基本事件为111213212223,,,,,A B A B A B A B A B A B ,共6种结果, 所以2人中恰有1名女生的概率为为63105=. 23.(1)解:频率分布表如下:(2) 频率直方图及频率折线图如图所示.24. (1)依题意,3004005006007005005x ++++==,2466755y ++++==, 513002400450066006700713700ii i x y ==⋅+⋅+⋅+⋅+⋅=∑, 52222221(34567)100001350000i i x==++++⋅=∑, 于是得512252113700550051200ˆ0.01213500005500100000i ii i i x y nx y b x nx==-⋅-⋅⋅====-⋅-∑∑,ˆˆ50.0125001ay bx =-=-⨯=-, 所以y 关于x 的回归直线方程为ˆ0.0121yx =-; (2)由(1)知,估计未进行培育的10000粒种子的未发芽数N 约为:ˆ0.012100001119y =⨯-=,而已培育的10000粒种子有20粒种子未发芽,即20n =, 所以该农作物种子的培育有效率为209910832119119-=≈。
高考数学一轮复习概率与统计单元专项练习题附参考答案
高考数学一轮复习概率与统计单元专项练习题附参考答案1.(理)设,那么的展开式中的系数不可能是( )A.10B.40C.50D.80(文)为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是( )A.20B.30C.40D.502.(理)四棱锥的8条棱代表8种不同的化工产品,有公共点的两条棱代表的化工产品放在同一仓库是危险的,没有公共顶点的两条棱所代表的化工产品放在同一仓库是平安的,现打算用编号为①、②、③、④的4个仓库存放这8种化工产品,那么平安存放的不同方法种数为( )A.96B.48C.24D.0(文)从数字1,2,3,4,5,中,随机抽取3个数字(允许重复)组成一个三位数,其各位数字之和等于9的概率为( )A. B. C. D.3.甲:A1、A2是互斥事件;乙:A1、A2是对立事件,那么( )A.甲是乙的充分但不必要条件B.甲是乙的必要但不充分条件C. 甲是乙的充要条件D. 甲既不是乙的充分条件,也不是乙的必要条件4.某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,,270;使用系统抽样时,将学生统一随机编号1,2,,270,并将整个编号依次分为10段。
如果抽得号码有以下四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270;关于上述样本的以下结论中,正确的选项是( )A.②、③都不能为系统抽样B.②、④都不能为分层抽样C.①、④都可能为系统抽样D.①、③都可能为分层抽样5.在正方体上任选3个顶点连成三角形,那么所得的三角形是直角非等腰三角形的概率为( )A. B. C. D.6.在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就()A.越大B.越小C.无法判断D.以上都不对7.(理)抛掷两个骰子,至少有一个4点或5点出现时,就说这些试验成功,那么在10次试验中,成功次数的期望是( )A. B. C. D.(文)为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如右,由于不慎将局部数据丧失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,那么a, b的值分别为( )A.0,27,78B.0,27,83C.2.7,78D.2.7,838.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.这组数据的平均数为10,方差为2,那么|x-y|的值为( )A.1B.2C.3D.49.一项研究要确定是否能够根据施肥量预测作物的产量。
高三上学期一轮复习数学单元过关检测---统计
高三上学期一轮复习数学单元过关检测---统计综合检测一.选择题: (以下题目从4项答案中选出一项,每小题5分,共40分)1. 为了了解1200名学生对学校某项教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔(抽样距)K 为()(A)40 (B)30 (C)20 (D)12[解析]A.[抽样距=40301200=] 2. 设有一个回归方程y=2-1.5x ,当变量x 增加一个单位时 ( )A .y 平均增加1.5个单位B .y 平均增加2个单位C .y 平均减少1.5个单位D .y 平均减少2个单位[解析]C3. (08东北师大附中)要完成下列2项调查:① 从某社区125户高收入家庭,280户中等收入家庭,95户低收入家庭中选出100户调查社会购买力的某项指标② 从某中学高一年级的12名体育特长生中选出3人调查学习负担情况. 应采用的抽样方法是A .①用随机抽样法②用系统抽样法B .①用分层抽样法②用随机抽样法C .①用系统抽样法②用分层抽样法D .①、②都用分层抽样法 [解析] B4. 由一组数据),(,),,(),,(2211n n y x y x y x 得到的回归直线bx a y +=?,对于下列说法: ① 直线bx a y+=?必过点),(y x ;②直线bx a y+=?中的∑∑∑∑∑=====--=n i ni i i n i n i ni i i i i x x n y x y x n b 1122111)())((;③直线bx a y+=?中的a 与b 的关系为x b y a -=. 其中正确的说法有() A.0个 B.1个 C.2个 D.3个[解析]D5. 为研究变量x 和y 的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程1l 和2l ,两人计算知x 相同,y 也相同,则1l 与2l 的关系为 ( ) A .重合 B.平行 C .相交于点),(y xD. 无法判断 [解析] C6. 在抽查某产品尺寸的过程中,将其尺寸分成若干组,[]b a ,是其中一组,抽查出的个数在605040302010321参加人数活动次数该组上的频率为m ,该组上的直方图的高为h ,则[]b a -等于()(A)hm (B)m h (C)hm(D)与m,n 无关7. (09四校联考)为了解一片经济林的生长情况,随机测量了其中100株树木的底部周长(单位:cm )。
【绿色通道】2020高三数学一轮复习 第10章 统计 统计案例检测 文 新人教A版
单元质量检测(10)一、选择题1.某班的78名同学已编号1,2,3,…,78,为了解该班同学的作业情况,老师收取了学号能被5整除的15名同学的作业本,这里运用的抽样方法是( ) A.简单随机抽样法B.系统抽样法C.分层抽样法D.抽签法解析:系统抽样适用于个体较多但均衡的总体,学号能被5整除,即将学生均匀分成几部分,又是从某一部分抽出一学生,所以符合系统抽样的定义,又无明显层次差异,也不宜采取分层抽样,故采用系统抽样.答案:B2.某地区有300家商店,其中大型商店有30家,中型商店有75家,小型商店有195家,为了掌握各商店的营业情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的中型商店数是( ) A.2 B.3C.5 D.13解析:在整个抽样过程中,每个个体被抽到的概率为20300=115,则抽取的中型商店数为75×115=5.答案:C3.将容量为100的样本数据,按从小到大的顺序分成8个小组,如下表:则第6( ) A.0.14 B.14C.0.15 D.15解析:x=100-(9+14+14+13+12+13+10)=15,∴频率为15100=0.15.答案:C4.选择薪水高的职业是人之常情,假如张伟和李强两人大学毕业有甲、乙两个公司可供选择,现从甲、乙两个公司分别随机抽取了50名员工的月工资的资料,统计如下:的工作,则他俩分别选择的公司是( )A .甲、乙B .乙、甲C .都选择甲D .都选择乙解析:由表中的信息可知,甲公司的工资标准差远小于乙公司的工资标准差,这表示甲公司的工资比较稳定,张伟想找一份工资比较稳定的工作,会选择甲公司;而乙公司的工资最大值和极差远大于甲公司的工资最大值和极差,李强想找一份有挑战性的工作,会选择乙公司.答案:A5.为了解1200名学生对学校某项教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔(抽样距)k 为( )A .40B .30C .20D .12解析:k =120030=40.答案:A 6.下列四个命题①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越小; ②残差平方和越小的模型,拟合的效果越好;③用相关指数R 2来刻画回归效果,R 2越小,说明模型的拟合效果越好; ④随机误差e 是衡量预报精确度的一个量,它满足E (e )=0. 则正确命题的序号是( )A .①③B .②④C .①④D .②③解析:由数理统计的有关概念,可以判断①错误,应该是相关系数的绝对值;||r 越接近1,相关性越强,③错误,应该是R 2越趋近1,效果越好.答案:B7.一组数据的标准差为s ,将这组数据中每一个数据都扩大到原来的2倍,所得到的一组数据的方差是( )A.s 22 B .4s 2C .2s 2D .s 2解析:平均数也扩大到原来的二倍,则s ′2=1n[(2x 1-2x -)2+(2x 2-2x -)2+…+(2x n -2x -)2]=4·1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]=4s 2.答案:B8.关于统计数据的分析,有以下几个结论: ①一组数不可能有两个众数;②将一组数据中的每个数据都减去同一个数后,方差没有变化;③调查剧院中观众观看感受时,从50排(每排人数相同)中任意抽取一排的人进行调查,属于分层抽样;④一组数据的方差一定是正数; ⑤如右图是随机抽取的200辆汽车通过某一段公路时的时速分布直方图,根据这个直方图,可以得到时速在[50,60)的汽车大约是60辆.则这5种说法中错误的个数是( )A .2B .3C .4D .5解析:一组数中可以有两个众数,故①错;根据方差的计算法可知②正确;③属于简单随机抽样,错误;④错误,因为方差可以是零;⑤正确.故错误的说法有3个.答案:B9.(2020·山东高考)下图是根据《山东统计年鉴2020》中的资料作成的1997年至2020年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到1997年至2020年我省城镇居民百户家庭人口数的平均数为( )21583 63247A.304.6C.302.6 D.301.6解析:由于数字的上下对称性,可以知道将个位数字都看成0时,平均数为300,又个位数字的平均数是(1+1+5+8+2+6+0+2+4+7)÷10=3.6,故平均数是303.6.答案:B10.(2020·安徽名校联考二)在第29届北京奥运会上,中国健儿取得了51金、21银、28铜的好成绩,稳居金牌榜榜首,由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见,有网友为此进行了调查,在参加调查的2548名男性中有1560名持反对意见,2452名女性中有1200名持反对意见,在运用这些数据说明性别对判断“中国进入了世界体育强国之列”是否有关系时,用什么方法最有说服力( ) A.平均数与方差B.回归直线方程C.独立性检验D.概率解析:由于参加调查的公民按性别被分成了两组,而且每一组又被分成了两种情况,认为有关与无关,符合2×2列联表的要求,故用独立性检验最有说服力.答案:C11.(2020·厦门适应性考试)为了了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机选取了60名高中生,通过问卷调查,得到以下数据:( ) A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关解析:根据独立性检验的基本思想和临界值表可以知道,有99.5%的把握认为课外阅读量大与作文成绩优秀有关.答案:D12.(2020·上海高考)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例的数据,一定符合该标志的是( ) A.甲地:总体均值为3,中位数为4B.乙地:总体均值为1,总体方差大于0C.丙地:中位数为2,众数为3D.丁地:总体均值为2,总体方差为3解析:只有D选项符合题意,当总体均值为2,方差为3时,必满足题意.答案:D二、填空题13.某学校共有师生2400人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是________.解析:设学生的人数为x,则160×x=150,x=2250.2400则教师的人数为2400-2250=150.答案:15014.如下图是某样本数据的茎叶统计图,则该样本数据的众数为________.94673 6答案:8415.为了开展“家电下乡”活动,政府调查某地区家庭拥有彩电的情况,从该地区的10万户居民中,随机抽查了 96户,这96户拥有彩电的情况如下:________.解析:样本中农村没有彩电的比例为P =1414+42×100%=25%,集镇中没有彩电的比例为Q =44+36×100%=10%,则该地区没有彩电的总户数约为105×53+5×25%+105×33+5×10%=15625+3750=19375(户).答案:1937516.(2020·合肥三检)在2020年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x 元和销售量y 件之间的一组数据如下表所示:通过分析,y 对商品的价格x 的回归直线方程为________.解析:∑i =15x i y i =392,x -=10,y -=8,∑i =15(x i -x -)2=2.5,代入公式,得b ^=-3.2,所以,a ^=y --b ^x -=40,故回归直线方程为y ^=-3.2x +40.答案:y ^=-3.2x +40 三、解答题17.某重点中学高中各班级学生人数如下表所示:学校计划召开学生代表座谈会.请根据上述基本数据,设计一个容量为总体容量的120的抽样方案.解:由表中基本数据可知,高一学生总数为145人,高二学生总数为150人,高三学生总数为155人,第一步:确定高一、高二、高三的被抽个体数.由于总体容量与样本容量之比为20,所以样本中包含的各年级个体数应为145÷20≈7,150÷20≈8,155÷20≈8.第二步:将高一年级被抽到的个体数分配到各班.由于抽样比为7145,所以1班、2班、3班被抽到的人数分别为7145×45≈2,7145×48≈2,7145×52≈3. 第三步:将高二年级被抽到的个体数分配到各班.由于抽样比为8150,所以1班、2班、3班被抽到的人数分别为8150×46≈2,8150×54≈3,8150×50≈3.第四步:将高三年级被抽到的个体数分配到各班.由于抽样比为8155,所以1班、2班、3班被抽到的人数分别为8155×48≈2,8155×55≈3,8155×52≈3.18.一次科技知识竞赛,两组学生成绩统计如下:这次竞赛中的成绩谁优谁次?并说明理由.解:(1)从众数看,甲为90分,乙为70分,甲组成绩较好;(2)从中位数看,两组中位数都为80分,但在80分(含80分)以上,甲组有33人,乙组有26人,甲组人数多于乙组人数,甲组成绩较好;(3)从方差看,s 2甲=172,s 2乙=256,甲组成绩波动较小,较稳定;(4)从得满分情况来看,甲组人数6人,乙组人数12人,成绩较好者应为乙组.19.为研究是否喜欢饮酒与性别之间的关系,在某地区随机抽取290人,得到如下列联表:利用列联表的独立性检验判断是否有超过95%的把握认为饮酒与性别有关系?解:由列联表中的数据得 K 2=290×101×20-124×452146×144×225×65≈11.953.∵K 2≈11.953>10.828.∴有99.9%的把握认为“是否喜欢饮酒与性别有关”.20.某中学高一(2)班甲、乙两名同学自高中以来每场数学考试成绩情况如下: 甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107; 乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人的数学成绩茎叶图.请根据茎叶图对两人的成绩进行比较. 解:作出茎叶图:甲乙 5 6 651 7 9 9861 8 368 541 9 3889 7 10 13 011498;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88.因此乙同学发挥比较稳定,总体得分情况比甲同学好.21.(2020·佛山二检)“世界睡眠日”定在每年的3月21日.2020年的世界睡眠日的主题是“科学管理睡眠”,以提高公众对健康睡眠的自我管理能力和科学认识.为此某网站2020年3月13日到3月20日持续一周的在线调查,共有200人参加调查,现将数据整理分组如题中表格所示.(1)画出整理数据的频率分布直方图; (2)睡眠时间小于8小时的概率是多少?男 101 45 146 女 124 20 144 总计22565290(3)为了对数据进行分析,采用了计算机辅助计算,分析中一部分计算见算法流程图,求输出S的值,并说明S的统计意义.(注:框图中的赋值符号“=”也可写成“←”或“:=”)序号(i)分组睡眠时间(小时)组中值(m i)频数(人数)频率(f i)1[4,5) 4.580.042[5,6) 5.5520.263[6,7) 6.5600.304[7,8)7.5560.285[8,9)8.5200.106[9,10]9.540.02(2)睡眠时间小于8小时的概率是P=0.04+0.26+0.30+0.28=0.88.(3)首先要理解直到型循环结构图的含义,输入m i,f i的值后,由赋值语句:S=S+m i·f i 可知,流程图进入一个求和状态.令a i=m i·f i(i=1,2,…,6),数列{a i}的前i项和为T i,即:T6=4.5×0.04+5.5×0.26+6.5×0.30+7.5×0.28+8.5×0.10+9.5×0.02=6.70,则输出S的值为6.70.S的统计意义即是指参加调查者的平均睡眠时间,从统计量的角度来看,即是睡眠时间的期望值.22.(2020·泉州质量检查)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:日期1月 10日 2月 10日 3月 10日 4月 10日 5月 10日 6月 10日 昼夜温差x (℃) 10 11 13 12 8 6 就诊人数y (人)222529261612归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?(参考公式:b ^=∑i =1nx i -x-y i -y-∑i =1nx i -x-2,a ^=y --b ^x -.)解:(1)设抽到相邻两个月的数据为事件A ,因为从6组数据中选取2组数据共有C 26=15种情况,每种情况都是等可能出现的,其中,抽到相邻两个月的数据的情况有5种,所以P (A )=515=13.(2)由表中数据求得x -=11,y -=24, 由参考公式可得b ^=187,再由a ^=y --b ^x -求得a ^=-307,所以y 关于x 的线性回归方程为y ^=187x -307.(3)当x =10时,y ^=1507,⎪⎪⎪⎪⎪⎪1507-22=47<2;同样,当x =6时,y ^=787,⎪⎪⎪⎪⎪⎪787-12=67<2.所以,该小组所得线性回归方程是理想的.。
备战2020年高考数学一轮复习 第13单元 统计、统计案例与概率单元训练(A卷,理,含解析)
12.【答案】C
【解析】由题意,知 ,即 ,解得 ,
所以由长度的几何概型可得概率为 ,故选C.
第Ⅱ卷
二、填空题:本大题共4小题,每小题5分.
附: , .
20.(12分)随着教育信息化2.0时代的到来,依托网络进行线上培训越来越便捷,逐步成为实现全民终身学习的重要支撑.最近某高校继续教育学院采用线上和线下相结合的方式开展了一次300名学员参加的“国学经典诵读”专题培训.为了解参训学员对于线上培训、线下培训的满意程度,
学院随机选取了50名学员,将他们分成两组,每组25人,分别对线上、线下两种培训进行满意度测评,根据学员的评分(满分100分)绘制了如下茎叶图:
A. B.
C. D.
10.为了判断高中生选修理科是否与性别有关.现随机抽取50名学生,得到如下 列联表:
根据表中数据,得到 的观测值 ,若已知 , ,则认为选修理科与性别有关系出错的可能性约为()
A. B. C. D.
11.甲、乙两人各写一张贺年卡随意送给丙、丁两人中的一人,则甲、乙将贺年卡都送给丁的概率为( )
则满足条件的 个编号为 , , , , , ,
则第 个编号为 ,故选D.
4.【答案】B
【解析】设 年参加考试 人,则 年参加考试 人,根据图表得出两年各个等级的人数如下图所示:
年份
A
B
C
D
E
2016
2018
由图可知A,C,D选项错误,B选项正确,故本小题选B.
5.【答案】A
【解析】由题意,根据品滚石的计算公式,可得 ,
(1)根据茎叶图判断学员对于线上、线下哪种培训的满意度更高?并说明理由;
(2)求50名学员满意度评分的中位数 ,并将评分不超过 、超过 分别视为“基本满意"、
21-统计、统计案例(高三数学第一轮复习同步测试题)
高三数学第一轮复习同步测试题(21)—统计、统计案例一、选择题:(本大题共12小题,每小题5分,共60分)1.下列说法中正确说法的个数是().①总体中的个体数不多时宜用简单随机抽样法;②在总体均分后的每一部分进行抽样时,采用的是简单随机抽样;③百货商场的抓奖活动是抽签法;④整个抽样过程中,每个个体被抽取的概率相等(有剔除时例外).A.1 B.2 C.3 D.42.为了了解所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是( )A.总体 B.个体是每一个零件 C.总体的一个样本 D.样本容量3.用随机数表法从100名学生(其中男生25人)中抽取20人进行评教,某男学生被抽到的概率是( ).A.1100B.125C.15D.144.问题:①某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户,为了了解社会购买力的某项指标,要从中抽出一个容量为100的样本;②从10名学生中抽出3个参加座谈会.方法:Ⅰ简单随机抽样;Ⅱ系统抽样;Ⅲ分层抽样.问题与方法配对正确的是( )A.①Ⅲ,②ⅠB.①Ⅰ,②ⅡC.①Ⅱ,②ⅢD.①Ⅲ,②Ⅱ5.某班共有学生54人,学号分别为1-54号,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号、29号、42号的同学在样本中,那么样本中还有一个同学的学号是( )A.10 B.16 C.53 D.326.10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,19,17,16,14,12,则这一天10名工人生产的零件的中位数是( ).A.14 B.16 C.15 D.177.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为( ).A. 65B.65C. 2 D.28.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( )A.57.2,3.6 B.57.2,56.4 C.62.8,63.6 D.62.8,3.69. 对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(u i、v i)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断( ).A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关10.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( ). A.y ^=-10x +200 B.y ^=10x +200 C.y ^=-10x -200 D.y ^=10x -200 11. 在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12D .112为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为( )A .9B .10C .11D .12 二、填空题(本大题共4小题,每小题5分,共20分)13. 某校进行数学竞赛,将考生的成绩分成90分以下、90~120分、120~150分三种情况进行统计,发现三个成绩段的人数之比依次为5∶3∶1,现用分层抽样的方法抽出一个容量为m 的样本,其中分数在90~120分的人数是45,则此样本的容量 m =________.14. 在一项大西瓜品种的实验中,共收获甲种大西瓜13个、 乙种大西瓜11个,并把这些大西瓜的重量(单位:斤,1斤=500克)制成了茎叶图,如图所示,据此茎叶图写出对甲乙两种大西瓜重量的两条统计结论是:(1)____________________;(2)________________ 15. 甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):如果甲、乙两人中只有1人入选,则入选的最佳人选应是________16. 在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算K 2的观测值k =27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的(有关,无关).三、解答题(本大题共6小题,共70分。
(天津专用)2020届高考数学一轮复习单元质检11统计与统计案例(含解析)新人教A
单元质检十一统计与统计事例(时间:45分钟满分:100 分)一、选择题(本大题共6小题,每题7分,共42分)1.为完成以下两项检查:①从某社区125户高收入家庭、选出100户,检查社会购买能力的某项指标;②从某中学的280户中等收入家庭、95户低收入家庭中15名艺术专长生中选出3名检查学习负担状况.宜采纳的抽样方法挨次是( )A.①抽签法,②随机数表法B.①分层抽样,②简单随机抽样C.①②都用抽签法D.①②都用分层抽样2.某大学对1000名学生的自主招生水平测试成绩进行统计这1000名学生在该次自主招生水平测试中成绩不低于,获取样本频率分布直方图70分的学生数是(如图),(则)A.300B.400C.500D.6003.某校共有2000 年级女生的概率是为( ) 名学生,各年级男、女生人数如表所示0.18.现用分层抽样的方法在全校抽取.已知在全校学生中随机抽取1名,抽到二64名学生,则应在三年级抽取的学生人数一年级二年级三年级女生363xy男生387390zA.12B.16C.18D.244 PM2 5是指大气中直径小于或等于25微米的颗粒物,也称为可入肺颗粒物. 依据某地某日早7点.. .到晚8 点甲、乙两个PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图以以下图,则甲、乙两地PM25的方差较小的是( ).A.甲B.乙C.甲、乙相等D.没法确立5.某高校进行自主招生,先从报名者中挑选出400人参加笔试,再按笔试成绩择精选出100人参加面试.现随机检查了24名笔试者的成绩,以下表所示:分数段[60,65) [65,70) [70,75) [75,80) [80,85) [85,90]人数 2 3 4 9 5 1据此预计同意参加面试的分数线是( )A.75B.80C.85D.906.为认识某社区居民的家庭年收入与年支出的关系,随机检查了该社区5户家庭,获取以下统计数据表:收入x/万元8.2 8.6 10.0 11.3 11.9支出y/万元6.2 7.5 8.0 8.5 9.8依据上表可得回归直线方程x+,此中=0.76, .据此预计,该社区一户年收入为15万元家庭的年支出为( )A.11.4万元B.11.8万元C.12.0万元D.12.2万元二、填空题(本大题共3小题,每题7分,共21分)7.若一组样本数据2,3,7,8, a的均匀数为5,则该组数据的方差s2= .8.某高中1000名学生的身高状况以下表,已知从这批学生中随机抽取1名,抽到偏矮男生的概率为012,若用分层抽样的方法,从这批学生中随机抽取50名,偏高学生有名..偏矮正常偏高女生人数100273y男生人数x287z9.某企业三月中旬生产A,B,C三种产品共3 000 件,依据分层抽样的结果,企业统计员制作了以下的统计表格:产品种类AB C产品数目/件1300样本容量/件130因为不当心,表格中A,C产品的有关数据已被污染看不清楚,统计员记得A产品的样本容量比C 产品的样本容量多10,依据以上信息,可得C的产品数目是件.三、解答题(本大题共3小题,共37分)10.(12分)最近几年来,城市“共享单车”的投放在我国各地迅猛发展,“共享单车”为人们的出行供给了很大的便利,但也给城市的管理带来了一些困难.现某城市为认识人们对“共享单车”投放的认可度,对[15,45]岁年龄段的人群随机抽取n人进行了一次“你能否同意投放共享单车”的问卷调查,依据检查结果获取以下统计表和各年龄段人数频率分布直方图:组号分组同意投放的人数同意投放人数占本组的频率第一组[15,20) 120 0.6第二组[20,25) 195 p第三组[25,30) 100 0.5第四组[30,35) a 0.4第五组[35,40) 30 0.3第六组[40,45) 15 0.3(1)补全频率分布直方图,并求n,a,p的值;(2) 在第四、五、六组“同意投放共享单车”的人中,用分层抽样的方法抽取7人参加“共享单车”骑车体验活动,求第四、五、六组应分别抽取的人数;(3) 在(2)中抽取的7人中随机选派2人作为正副队长,求所选派的2人没有第四组人的概率.11.(12分)跟着我国经济的发展,居民的存储存款逐年增加.设某地区城乡居民人民币存储存款(年底余额)以下表:年份2014 2015 2016 2017 2018时间代号t 1 2 3 4 5存储存款y/千亿元 5 6 7 8 10(1) 求y关于t的线性回归方程t+;(2) 用所求回归方程展望该地区2019年(t=6)的人民币存储存款.附:回归方程t+中, -. -12.(13分)某中学为研究学生的身体素质与课外体育锻炼时间的关系,对该校200名学生的课外体育锻炼均匀每天运动的时间(单位:min)进行检查,将采集到的数据分成[0,10),[10,20),[20,30),[30,40),[40,50),[50,60]六组,并作出频率分布直方图(如图).将日均课外体育锻炼时间不低于40min的学生议论为“课外体育达标”.(1)请依据频率分布直方图中的数据填写下边的2×2列联表,并经过计算判断能否能在犯错误的概率不超出0.01的前提下以为“课外体育达标”与性别有关?课外体育不达标课外体育达标总计男60女110总计(2)现从“课外体育达标”学生中按分层抽样抽取5人,再从这知识问卷检查,求抽取的这2人课外体育锻炼时间都在[40,50)5名学生中随机抽取内的概率.2人参加体育附参照公式与数据:K2= -P(K2≥k0)0.10 0.05 0.010 0.005 0.001k02.7063.841 6.635 7.879 10.828单元质检十一统计与统计事例1.B 分析因为社会购买能力的某项指标受家庭收入的影响,而社区中各个家庭收入差异明显,所以①用分层抽样法;从某中学的15名艺术专长生中选出3名检查学习负担状况,个体之间差异不大,且整体和样本容量较小,所以②用简单随机抽样法.2.D 分析依题意,得题中的1000名学生在该次自主招生水平测试中成绩不低于70分的学生数是1000×(0.035+0. 015+0.010)×10=600,应选D.3.B 分析由题意可得二年级的女生的人数为 2000×0.18=360,则一、二年级学生总数 363+387+360+390 =1500,故三年级学生总数是2000-1500=500.所以,用分层抽样法在三年级抽取的学生数为 64×=16.应选B .4.A 分析从茎叶图上可以观察到 :甲监测点的样本数据比乙监测点的样本数据更加集中 ,所以甲地PM2.5的方差较小.5 .B 分析因为参加笔试的 400人中择精选出100人,所以每个人被择精选出的概率 P=.因为随机检查24名笔试者,所以预计可以参加面试的人数为 24×=6.观察表格可知,分数在[80,85)的 有5 人,分数在[85,90)的有1人,故面试的分数线大体为 80分,应选B .6 . B 分析由题意知, 10,==8,∴ =8-0.76×10=0.4,∴当x=15时,=0.76×15+0.4=11.8(万元).7.分析 ∵ 5, 5= ∴a=.∴s 2=[(2-5)2+(3-5)2+(7-5)2+(8-5)2+(5-5)2]=. 8.11分析由题意可知x=1000×0.12=120, 所以y+z=220.所以偏高学生占学生总数的比率为,所以随机抽取的50名学生中,偏高学生有 50×=11(名).9 . 800分析设样本容量为 x ,则 × 1300 130, 300= x=. 故A 产品和C 产品在样本中共有 300-130=170(件).设C 产品的样本容量为 y , 则10170,解得80y+y+= y=.所以C产品的数目为×80=800(件).10.解(1)补全的频率分布直方图如图.由频率表中第五组数据可知,第五组总人数为=100,再结合频率分布直方图可知n==1000,所以a=0.03×5×1000×0.4=60,第二组的频率为0.3,所以p==0.65.(2)因为第四、五、六组“同意投放共享单车”的人数共有105 人,由分层抽样原理可知,第四、五、六组分别取的人数为4人,2 人,1 人.(3)设第四组4 人为A,A ,A ,A ,第五组2人为B,B ,第六组1人为C,则从7 人中随机抽取2人的所1 2 3 4 1 2有可能的结果为AA,AA,AA,AB,AB,AC,AA,AA,AB,A B,AC,AA,AB,AB,AC,AB,A B,A C,BB,BC,BC,共1 2 1 3 1 4 1 1 1 2 1 2 3 2 4 2 1 2 2 2 3 4 3 1 3 2 3 4 1 4 2 4 1 2 1 221种;此中恰好没有第四组人的全部可能结果为BB,B C,BC,共3种;所以所抽取的2人中恰好没1 2 1 2有第四组人的概率为P=.11 .解(1) 列表计算以下:i t i y i t i y i1 1 5 1 52 2 6 4 123 3 7 9 214 4 8 16 325 5 10 25 5015 36 55 120这里n=5,t i==3,y i==7.2,-5=55-5×32=10,ty 5120 53 7212,从而- 1 2, 72 1 . 2 3 36,-故所求回归方程为=1.2t+3.6.(2)将t=6代入回归方程可展望该地区2019年的人民币存储存款为=1.2×6+3.6=10.8(千亿元).12.解(1)依据频率分布直方图,得“课外体育达标”的学生数为200×(0.020+0.005)×10=50. 由2×2列联表可知“课外体育达标”的男生人数为30,女生人数为20.补全2×2列联表以下:课外体育不达标课外体育达标总计男60 30 90女90 20 110总计150 50 200计算K2= - = - ≈6.061<6.635,故在犯错误的概率不超出0.01的前提下不可以以为“课外体育达标”与性别有关(2)从“课外体育达标”学生中按分层抽样抽取5人,此中课外体育锻炼时间在.[40,50)内有5×=4(人), 分别记为a,b,c,d;在[50,60]上有1人,记为E.从这5人中抽取2人,总的基本领件有ab,ac,ad,aE,bc,bd,bE,cd,cE,dE 共10种,此中2人都在[40,50)内的基本领件有ab,ac,ad,bc,bd,cd 共6种,故所求的概率为=0.6.。
高三数学一轮复习单元训练统计
大学附中2021届高三数学一轮复习单元训练:统计创 作人:历恰面 日 期: 2020年1月1日本套试卷分第一卷(选择题)和第二卷(非选择题)两局部.满分是150分.考试时间是是120分钟.第一卷(选择题 一共60分)一、选择题(本大题一一共12个小题,每一小题5分,一共60分,在每一小题给出的四个选项里面,只有一项是哪一项符合题目要求的)1.经过对2K 的统计量的研究,得到了假设干个临界值,当2K 的观测值 3.841k >时,我们( )D .没有充分理由说明事件A 与B 有关 【答案】A2.对于线性相关系数,表达正确的选项是( )A .||1,||r r ≤越接近于1,相关程度越弱,|r|越接近于0,相关程度越强B .||1,||r r ≤越接近于1,相关程度越强,|r|越接近于0,相关程度越弱C .||(0,),||r r ∈+∞越大,相关程度越强;|r|越小,相关程度越弱D .||(0,),||r r ∈+∞越大,相关程度越弱;|r|越小,相关程度越强【答案】B3.有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间是和平均学习成绩;③某人每日吸烟量和其身体安康情况;④正方形的边长和面积;⑤汽车的重量和百公里耗油量.其中两个变量成正相关的是( )A.①③B.②④C.②⑤D.④⑤【答案】C4.两个变量x,y与其线性相关系数r有以下说法(1〕假设r>0,那么x增大时,y也相应增大;(2〕假设r<0,那么x增大时,y也相应增大;(3〕假设r=1或者r=-1,那么x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上,其中正确的有( )A.①②B.②③C.①③D.①②③【答案】C5.对100只小白鼠进展某种激素试验,其中雄性小白鼠、雌性小白鼠对激素的敏感情况统计得到如以下联表由22()5.56()()()()n ad bcKa b c d a c b d-=≈++++附表:那么以下说法正确的选项是( )A .在犯错误的概率不超过000.1的前提下认为“对激素敏感与性别有关〞;B ..在犯错误的概率不超过000.1的前提下认为“对激素敏感与性别无关〞;C .有0095以上的把握认为“对激素敏感与性别有关〞;D .有0095以上的把握认为“对激素敏感与性别无关〞; 【答案】C6.对变量x, y 有观测数据〔1x ,1y 〕〔i=1,2,…,10〕,得散点图1;对变量u ,v 有观测数据〔1u ,1v 〕〔i=1,2,…,10〕,得散点图2. 由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关 【答案】C7.对两个变量y 和x 进展回归分析,得到一组样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),那么以下说法中不正确的选项是( )A .由样本数据得到的回归方程=x +必过样本点的中心(x ,y )B .残差平方和越小的模型,拟合的效果越好C .用相关指数R 2来刻画回归效果,R 2的值越小,说明模型的拟合效果越好D.在残差图中,残差点比拟均匀地落在程度带状区域中,说明选用的模型比拟适宜,带状区域越窄,说明回归方程的预报准确度越高;【答案】C8.,x y的值如表所示:假如y与x呈线性相关且回归直线方程为72y bx=+,那么b=( )A.12-B.12C.110-D.110【答案】B9.给出以下结论:在回归分析中可用(1〕可用相关指数2R的值判断模型的拟合效果,2R越大,模型的拟合效果越好;(2〕可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;(3〕可用相关系数r的值判断模型的拟合效果,r越大,模型的拟合效果越好;(4〕可用残差图判断模型的拟合效果,残差点比拟均匀地落在程度的带状区域中,说明这样的模型比拟适宜.带状区域的宽度越窄,说明模型的拟合精度越高.以上结论中,正确的选项是( )A.〔1〕〔3〕〔4〕B.〔1〕〔4〕C.〔2〕〔3〕〔4〕D.〔1〕〔2〕〔3〕【答案】B10.现有以下两项调查:①某校高二年级一共有15个班,现从中选择2个班,检查其清洁卫生状况;②某有大型、中型与小型的商店一共1500家,三者数量之比为1∶5∶9.为了调查全商店每日零售额情况,抽取其中15家进展调查.完成①、②这两项调查宜采用的抽样方法依次是( )A.简单随机抽样法,分层抽样法B.系统抽样法,简单随机抽样法C.分层抽样法,系统抽样法D.系统抽样法,分层抽样法【答案】A11.为防止某种疾病,今研制一种新的预防药.任选取100只小白鼠作试验,得到如下的列联表:2 3.2079K的观测值为,那么在犯错误的概率不超过( )的前提下认为“药物对防止某种疾病有效〞。
2017届高三数学(全国人教A版,文)一轮复习单元滚动检测第十单元 统计与统计案例
高三单元滚动检测卷·数学考生注意:1.本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分,共4页.2.答卷前,考生务必用蓝、黑色字迹的钢笔或圆珠笔将自己的姓名、班级、学号填写在相应位置上.3.本次考试时间120分钟,满分150分. 4.请在密封线内作答,保持试卷清洁完整.单元检测十 统计与统计案例第Ⅰ卷一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.为规范学校办学,省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应为( ) A .13 B .19 C .20D .512.从N 个编号中抽取n 个号码入样,若采用系统抽样方法进行抽取,则分段间隔应为( ) A.Nn B .n C .[N n]D .[Nn]+13.如图表示甲、乙两名篮球运动员每场比赛得分情况的茎叶图,则甲和乙得分的中位数的和是( )A .56分B .57分C .58分D .59分4.高二第二学期期中考试,按照甲、乙两个班级学生数学考试成绩优秀和不优秀统计后,得到如下列联表: 班级与成绩列联表则随机变量K 2A .0.600 B .0.828 C .2.712D .6.004 5.把容量为100的某个样本数据分成10组,并填写频率分布表,若前7组频率之和为0.79,则剩下3组的频率之和为( ) A .0.21% B .0.21 C .21D .无法确定6.如图是一次选秀节目上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数为85,则a 2+b 2的最小值是( )A .24B .32C .36D .487.(2014·重庆)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3B.y ^=2x -2.4C.y ^=-2x +9.5 D.y ^=-0.3x +4.48.某校为了研究学生的性别和对待某一活动的态度(支持和不支持)的关系,运用2×2列联表进行独立性检验,经计算K 2=7.069,则所得到的统计学结论是:有多大的把握认为“学生性别与支持该活动有关系.”( ) 附:A.0.1%C .99%D .99.9%9.一个频率分布表(样本容量为30)不小心被损坏了一部分(如图),只记得样本中数据在[20,60)上的频率为0.8,则估计样本分别在[40,50),[50,60)上的数据个数可能是( )A .7和6B .6和9C .8和9D .9和1010.对四组数据进行统计,获得图所示的散点图,关于其相关系数的比较,正确的是( )A .r 2<r 4<0<r 3<r 1B .r 4<r 2<0<r 1<r 3C .r 4<r 2<0<r 3<r 1D .r 2<r 4<0<r 1<r 311.(2015·驻马店模拟)中央电视台为了调查近三年的春晚节目中各类节目的受欢迎程度,用分层抽样的方法,从2011年至2013年春晚的50个歌舞类节目,40个戏曲类节目,30个小品类节目中抽取样本进行调查,若样本中的歌舞类和戏曲类节目共有27个,则样本容量为( ) A .36 B .35 C .32D .3012.(2015·蚌埠模拟)给出以下命题: ①若p 或q 为假命题,则p 与q 均为假命题;②对具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i ) (i =1,2,…,8),其线性回归方程是y =13x +a ,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+y 3+…+y 8)=6,则实数a =14;③对于分类变量X 与Y 的随机变量χ2来说,χ2越小,“X 与Y 有关联”的把握程度越大; ④已知x -12-x ≥0,则函数f (x )=2x +1x 的最小值为16.其中真命题的个数为( ) A .0 B .1 C .2 D .3第Ⅱ卷二、填空题(本大题共4小题,每小题5分,共20分.把答案填在题中横线上)13.从某中学高一年级中随机抽取100名同学,将他们的成绩(单位:分)数据绘制成频率分布直方图(如图).则这100名学生成绩的平均数,中位数分别为________.14.已知某单位有40名职工,现要从中抽取5名职工对其体重进行统计,将全体职工随机按1~40编号,并按编号顺序平均分成5组,按系统抽样方法在各组内抽取一个号码.(1)若第1组抽出的号码为2,则所有被抽出职工的号码为________________;(2)分别统计这5名职工的体重(单位:kg),获得体重数据的茎叶图如图所示,则该样本的方差为________.15.已知总体的各个个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a=________,b=________.16.关于统计数据的分析,有以下几个结论:①一组数不可能有两个众数;②将一组数据中的每个数据都减去同一个数后,方差没有变化;③调查剧院中观众观看感受时,从50排(每排人数相同)中任意抽取一排的人进行调查,属于分层抽样;④一组数据的方差一定是正数;⑤如图是随机抽取的200辆汽车通过某一段公路时的时速频率分布直方图,根据这个直方图,可以得到时速在[50,60)的汽车大约是60辆,则这五种说法中错误的是________.三、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤) 17.(10分)(2015·济南模拟)从某高校高三年级800名男生中随机抽取50名学生测量其身高,据测量,被测学生的身高全部在155 cm到195 cm之间,将测量结果按如下方式分成8组:第一组[155,160),第二组[160,165),…,第八组[190,195],下图是按上述分组得到的频率分布直方图的一部分.已知第一组与第八组的人数相同,第七组与第六组的人数差恰好为第八组与第七组的人数差.求下列频率分布表中所标字母的值,并补充完成频率分布直方图.频率分布表:18.(12分)(2014·课标全国Ⅱ)某地区2007年至2013年农村居民家庭人均纯收入y (单位:千元)的数据如下表:(1)求(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:b ^=∑i =1n(t i -t )(y i -y )∑i =1n(t i -t )2,a ^=y -b ^t .19.(12分)为使学生更好地了解中华民族伟大复兴的历史知识,某校组织了一次以“我的梦,中国梦”为主题的知识竞赛,每班选25名同学参加比赛,成绩分为A,B,C,D四个等级,其中相应等级的得分依次记为100分、90分、80分、70分,学校将某年级的一班和二班的成绩整理并绘制成统计图:请根据以上提供的信息解答下列问题:(1)把一班竞赛成绩统计图补充完整;(2)写出下表中a,b,c的值.(3)①从平均数和中位数方面来比较一班和二班的成绩;②从平均数和众数方面来比较一班和二班的成绩;③从B级以上(包括B级)的人数方面来比较一班和二班的成绩.20.(12分)学校举行“文明环保,从我做起”征文比赛,现有甲、乙两班各上交30篇作文,现将两班的各30篇作文的成绩(单位:分)统计如下:甲班:乙班:根据上面提供的信息回答下列问题(1)表中x=________,甲班学生成绩的中位数落在等级________中,扇形统计图中等级D部分的扇形圆心角n的度数是________.(2)现学校决定从两班所有A等级成绩的学生中随机抽取2名同学参加市级征文比赛,求抽取到两名学生恰好来自同一班级的概率(请列树状图或列表求解).21.(12分)甲、乙两位学生参加数学竞赛培训,现分别从他们的培训期间参加的若干次预赛成绩中随机抽取8次,记录如下甲:82,91,79,78,95,88,83,84乙:92,95,80,75,83,80,90,85(1)画出甲、乙两位学生成绩的茎叶图;(2)现要从中选派一人参加数学竞赛,从统计学角度,你认为派哪位学生参加合适,请说明理由.22.(12分)(2014·安徽)某高校共有学生15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均体育运动时间超过4小时的概率;(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d).答案解析1.C [抽样间隔为46-33=13, 故另一位同学的编号为7+13=20,选C.] 2.C3.B [由图知甲的中位数为32,乙的中位数为25,故和为57.] 4.A [由题意知a =11,b =34,c =8,d =37,n =90, 则K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d )的值约为0.600,故选A.]5.B [剩下3组的频率之和为1-0.79=0.21.] 6.B [根据题意,得4+a +6+b +75=5,得a +b =8.方法一 由b =8-a ,得a 2+b 2=a 2+(8-a )2=2a 2-16a +64, 其中a ,b 满足0≤a ≤9,0≤b ≤9, 所以0≤a ≤9,0≤8-a ≤9, 即0≤a ≤8且a 是整数,设函数f (a )=2a 2-16a +64,分析知当a =4时, f (a )取得最小值32,所以a 2+b 2的最小值是32.故选B. 方法二 由a +b =8,且a ,b ≥0, 得8≥2ab ,故ab ≤16,则a 2+b 2=(a +b )2-2ab ≥64-32=32, 当且仅当a =b =4时等号成立, 所以a 2+b 2的最小值是32.]7.A [因为变量x 和y 正相关,则回归直线的斜率为正,故可以排除选项C 和D. 因为样本点的中心在回归直线上,把点(3,3.5)分别代入选项A 和B 中的直线方程进行检验,可以排除B ,故选A.]8.C [因为7.069与附表中的6.635最接近,所以得到的统计学结论是:有1-0.010=0.99=99%的把握认为“学生性别与支持该活动有关系”,选C.] 9.B [因样本中数据在[20,60)上的频率为0.8, 则样本中数据在[20,60)上的频数为30×0.8=24. 又因为样本中数据在[20,40)上的频数为4+5=9, 所以样本在[40,60)上的数据的个数为24-9=15.由选项知B 符合.]10.A [易知题中图(1)与图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,则r 2<r 4<0<r 3<r 1.]11.A [设从30个小品类节目中抽取x 个,则有x 30=2750+40,解得x =9.则27+9=36,所以样本容量为36.]12.B [①正确.②中a =18,所以②不正确.③中χ2越小,“X 与Y 有关联”的把握程度越小,所以③不正确.由x -12-x ≥0可得1≤x <2,因为f (x )=2x +1x ≥22=4,当且仅当x =1时取等号,所以④不正确.] 13.125,124解析 由图可知(a +a -0.005)×10=1-(0.010+0.015+0.030)×10,解得a =0.025, 则x =105×0.1+115×0.3+125×0.25+135×0.2+145×0.15=125. 中位数在120~130之间,设为x ,则0.01×10+0.03×10+0.025×(x -120)=0.5, 解得x =124.14.(1)2,10,18,26,34 (2)62解析 (1)由题意知被抽出职工的号码为2,10,18,26,34. (2)由题中茎叶图知5名职工体重的平均数 x =59+62+70+73+815=69,则该样本的方差s 2=15×[(59-69)2+(62-69)2+(70-69)2+(73-69)2+(81-69)2]=62.15.10.5 10.5解析 由于总体的中位数为10.5,则a +b =21, 所以该组数据平均值为x =10,又方差s 2=(a -10)2+(b -10)2+k10,其中k 为常数,所以要使该总体的方差最小,可以取a =10.5,b =10.5. 16.①③④解析 一组数中可以有两个众数,故①错误;根据方差的计算法可知②正确;③属于简单随机抽样,错误;④错误,因为方差可以是零;⑤正确.17.解 由频率分布直方图可知前五组的频率和是(0.008+0.016+0.04+0.04+0.06)×5=0.82,第八组的频率是0.008×5=0.04,所以第六、七组的频率和是1-0.82-0.04=0.14,所以第八组的人数为50×0.04=2,第六、七组的总人数为50×0.14=7. 由已知得x +m =7,m -x =2-m , 解得x =4,m =3.所以y =0.08,n =0.06,z =0.016,p =0.012. 补充完成频率分布直方图如图所示.18.解 (1)由所给数据计算得t =17(1+2+3+4+5+6+7)=4,y =17(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑i =17(t i -t )2=9+4+1+0+1+4+9=28,∑i =17(t i -t )(y i -y )=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b ^=∑i =17(t i -t )(y i -y )∑i =17(t i -t )2=1428=0.5, a ^=y -b ^t =4.3-0.5×4=2.3,所求线性回归方程为y ^=0.5t +2.3.(2)由(1)知,b ^=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t =9代入(1)中的回归方程,得y ^=0.5×9+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.19.解 (1)25-6-12-5=2(人).(2)a =87.6,b =90,c =100.(3)①一班和二班平均数相等,一班的中位数大于二班的中位数,故一班的成绩好于二班. ②一班和二班平均数相等,一班的众数小于二班的众数,故二班的成绩好于一班; ③B 级以上(包括B 级)一班18人,二班12人,故一班的成绩好于二班. 20.(1)2 B 36°解析 x =30-15-10-3=2;中位数落在等级B 中;等级D 部分的扇形圆心角n =360°×330=36°.(2)解 乙班A 等级的人数是:30×10%=3,则甲班的二个人用甲1,甲2表示,乙班的三个人用乙1、乙2、乙3表示.共有20种情况,则抽取到两名学生恰好来自同一班级的概率是820=25.21.解 (1)茎叶图如图(2)方法一 x 甲=x 乙=85,但s 2甲<s 2乙,所以选派甲合适.方法二 假设含90分为高分,则甲的高分率为28,乙的高分率为38,所以派乙合适.或:假设含85分为高分,则甲的高分率为38,乙的高分率为12,所以派乙合适.22.解 (1)300×4 50015 000=90,所以应收集90位女生的样本数据. (2)由频率分布直方图得 1-2×(0.025+0.100)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.(3)由(2)知,300位学生中有300×0.75=225(人)的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下: 每周平均体育运动时间与性别列联表结合列联表可算得K 2=300×(45×60-165×30)75×225×210×90=10021≈4.762>3.841.所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.。
高三数学一轮总复习第十一章统计初步单元检测新人教A版
高三数学一轮总复习第十一章统计初步单元检测新人教A版第十一章统计初步时间: 120 分钟分值:150分第Ⅰ卷 ( 选择题共60分)一、选择题: ( 本大题共12 小题,每题 5 分,共 60 分.在每题给出的四个选项中,只有一项为哪一项切合题目要求的)1.某地共有10 万户居民,从中随机检查了1000 户,拥有彩电的检查结果以下表:彩电城市乡村有432400无48120若该地域城市与乡村住户之比为 4 6,预计该地域无彩电的乡村总户数为() A. 0.123 万户B. 1.385 万户C. 1.8 万户 D . 1.2 万户6 120分析:预计该地域无彩电的乡村总户数为:10×10×520= 1.385万.答案: B2.在一次期末统考取,有考生1000 名,现要认识这1000 名学生的数学成绩,从中抽取 100 名学生的数学成绩进行剖析统计,在这一过程中,整体是指() A. 1000 名考生B. 1000 名考生的数学成绩C. 100 名考生D. 100 名考生的数学成绩分析:整体是指需要研究的对象,此题的要旨是剖析考生的数学成绩,故应选 B.答案: B3.从 50 件产品中,采纳逐个抽取的方法抽取 5 件产品,若此中只有一件次品,在送质检部门进行查验时次品被抽到的概率是()A. 0.1 B.0.02C. 0 或 1 D .以上都不对n 5分析:次品被抽到的概率,即入样的概率p=N=50=0.1.答案: A4.现有a件产品,此中包含 b 件次品,假如从中不放回地抽取了 c 件产品,则均匀能抽到多少件次品 ()b bcA . ( c + 1) a B. ab acC . ( c - a ) a D. bx bbc分析: 设能够抽到 x 件次品,则 c =a ,∴ x = a .答案: B12n的均匀数为 212n的 5.若数据 x ,x , , x x ,方差为 s ,则 3x + 5,3 x + 5, , 3x + 5 均匀数和方差分别是 ( )A. x , s 2 B . 3 x + 5,9 s 2 C . 3 x + 5, s 2D . 3 x + 5,9 s 2+ 30s + 25 分析: 代入公式易得为 B.答案: B6.从 107 名学生中, 采纳简单随机抽样法抽取10 名学生作为样本, 则每名学生被抽到的概率为 ()11A.100B.107 110C.10D.107100 1 10分析: p = 107×10= 107. 答案: D7.已知正数a1, 2, 3, 4, 5 的均匀数是x 2,将这些数据都减去x 后获取的新数据的a aa a均匀数是 6,则 x 的值是 ()A .2B .35C .4 D. 22a 1+ a 2+a 3+ a 4+ a 5分析: ∵ x = 5,6=a 1-x + a 2- x+ a 3- x+ a 4- x+ a 5- x5= x 2- x ,∴ x =- 2( 舍 ) 或 x = 3.答案: B8.甲、乙两名射手各打5 发子弹,命中环数以下:甲:68 9 9 8乙:107 7 7 9则两人的射击成绩 ()A .甲比乙稳固B .乙比甲稳固C .甲、乙稳固程度同样D .没法比较分析: 由样本均匀数和样本方差的计算公式可得x 甲 = x 乙 , s 甲 2< s 乙 2.答案: A9.以下图,是一批产品中抽样数据的频次散布图,由图中能够看出出现频次最大的范围是()A . (8.1,8.3)B . (8.2,8.4)C . (8.4,8.6) D. (8.5,8.7)分析:图中每个长方形的面积表示相应数据的频次, 察看可知在 (8.4,8.6) 上频次最大.答案: C10.已知一组数据a 1, 2, 3, a 4 的均匀数是 1,且a 2+ 222 2= 20,则这组数据1 + 3 +4aaaa a的方差为 ()A .1B .5C .4D .20分析: 由 1= a+ a + a + a,且12344212222s = 4[( a 1-1) + ( a 2- 1) +( a 3- 1) + ( a 4- 1) ]1 a 2+ 22a 22a 1+ 2+3+ 4) +4]= [(1+3+4 )-2(4aaa aa21可得 s = ×(20 - 8+ 4) = 4.答案: C11.在一次歌手大奖赛上,七位评委为某歌手打出的分数以下:9.4,8.4,9.4,9.9,9.6,9.4,9.7 ,去掉一个最高分和一个最低分后,所剩数据的均匀值和方差分别为 ()A. 9.4,0.484 B . 9.4,0.016C. 9.5,0.04 D . 9.5,0.016分析:去掉一个最高分9.9 ,再去掉一个最低分8.4 ,节余分值为9.4,9.4,9.6,9.4,9.7,9.4 ×3+ 9.6 + 9.70.016.均匀值: 5 = 9.5 ,代入方差公式可知方差为答案: D12《.中华人民共和国道路交通安全法》规定:车辆驾驶员血液酒精浓度在20~ 80 mg/100 ml( 不含 80) 之间,属于酒后驾车;血液酒精浓度在80 mg/100 ml( 含 80) 以上时,属于醉酒驾车.据《法制晚报》报导,2009 年 8 月 15 日至 8 月 28 日,全国查处酒后驾车和醉酒驾车的共有 28800 人,如图是对这28800 人血液中酒精浓度进行检测所得结果的频次散布直方图,此中属于醉酒驾车的人数约为( )A. 2160 B . 2880C. 4320 D . 8640分析:依题意得,属于醉酒驾车的人数约为28800×(0.005 +0.01) ×10=4320,选 C.答案: C第Ⅱ卷 ( 非选择题共90分)二、填空题: ( 本大题共 4 小题,每题 5 分,共 20 分.请把正确答案填在题中横线上.)13.利用简单随机抽样法,从n 个个体( n>13)中抽取13个个体,若第二次抽取时,余1下的每个个体被抽取到的概率为 3 ,则在整个抽样过程中,各个个体都被抽取到的概率为________.分析:第二次抽取时,余下的每个个体被抽到的概率为136人.所,所以余下的人数为3以 n=37.则在整个抽样过程中,各个个体被抽取到的概率为13 37 .13答案:3714.容量为100 的某个样本数据拆分为10 组,并填写频次散布表,若前七组频次之和为 0.79 ,而剩下的三组的频次成公差为 0.05 的等差数列,则剩下的三组中频次最大的一组的频次为 ________.分析:依题意,剩下三组的频次之和为1- 0.79 = 0.21 ,∴ 0.21 =a1+a1+d+a1+ 2d=3a1+0.15. 得a1= 0.02. ∴频次最大的一组的频次为0.02 +2×0.0 5= 0.12.答案: 0.1215.从甲、乙两个整体中各抽取了一个样本:甲: 900 920 900 850 910920乙: 890 960 950 850 860890整体颠簸较小的是________.1分析: x 甲=6×(0+20+0-50+10+20)+900=900,1x 乙=6×(-10+60+50-50-40-10)+900=900,s 2 1 2 2 -900) 2 ] =3400 ≈567,甲=×[(900 - 900) +(920 - 900) ++ (92066s 2 1 2 2 -900) 2 ] =10400乙=6×[(890 - 900) +(960 - 900) ++ (890 6 ≈1733.∴颠簸较小的是甲.答案:甲16.某路段检查站监控录像显示,在某时段内,有 1 000 辆汽车经过该站,此刻随机抽取此中的200 辆汽车进行车速剖析,剖析的结果表示为如图的频次散布直方图,则预计在这一时段内经过该站的汽车中车速不小于90 km/h 的约有 ________辆. ( 注:剖析时车速均取整数 )分析:由图可知,车速小于 90 km/h 的汽车总数的频次之和为(0.01 + 0.02 +0.04) ×10 =0.7 ,所以车速不小于 90 km/h 的汽车总数的频次之和为1- 0.7 = 0.3. 所以,在这一段时间内经过该站的车速不小于90 km/h 的汽车有 1000×0.3 = 300 辆.答案: 300三、解答题: ( 本大题共 6 小题,共 70 分.解答应写出文字说明、证明过程或演算步骤.)17. ( 本小题满分10 分 ) 某班有 50 名学生 ( 男生 30 名,女生20 名 ) ,现检查均匀身高,1准备抽取10,问应怎样抽样?假如已知男、女生身高有明显差别,又应怎样抽样?分析: (1) 运用简单随机抽样方法从50 名学生中抽取 5 名学生作为样本.(2)若男、女生身高有明显差别,则运用分层抽样法抽样,分别运用简单随机抽样法从30 名男生中抽取 3 名,从20 名女生中抽取 2 名,将这5 名学生构成样本即为所求.18.( 本小题满分12 分 ) 为了预计某产品寿命的散布,对产品进行抽样查验,记录以下 ( 单位:小时 )214 425 214 407 227 146 317 369 504 153320 510 364 276 305 417 307 524 573 326167 335 540 338 407 586 331 290 368 410316 475 311 260 133 314 426 366 213 495176 554 368 412 374 251 327 489 329 246331 459 316 248 549 365 445 399 370 123326 534 318 552 323 188 352 447 452 337522 363 234 432 357 566 111 333 467 265488 585 355 355 413 316 479 197 384 278316 501 312 289 303 102 402 597 397 203(1) 列出频次散布表;(2) 画出频次散布的直方图.分析:第一要求列出频次散布表,而后作出频次散布的直方图,能够依据以下的步骤进行:①计算数据中最大值和最小值的差,即极差.知道了极差就知道了这组数据的改动范围有多大:这里最大值是597,最小值是102,这里我们不如能够以为数据的颠簸范围是100~600.②决定组数和组距,组距是指每个小组的两个端点之间的距离,这里我们取为100,即寿命为 100~ 200,200 ~ 300,300 ~ 400,400 ~ 500,500 ~ 600 这五组.③决定分点.④列频次散布表.⑤绘制频次散布直方图.(1) 频次散布表以下:寿命:小时个数累计频数频次100~ 200正正100.10200~ 300 正正正15 0.15300~ 400 正正正正正正正正40 0.40400~ 500 正正正正20 0.20500~ 600 正正正15 0.15共计100 1.00(2)频次散布的直方图以以下图所示:19.( 本小题满分12 分 ) 灯泡厂从某日生产的一批灯泡中抽取10 个进行寿命测试,得灯泡寿命数据 ( 天 ) 以下:30 35 25 25 30 34 26 25 29 21求该灯泡的均匀寿命预计值x 和均匀方差值s2 .分析: x =30+ 35+ 25+ 25+ 30+ 34+ 26+ 25+ 29+ 2110=280= 28,102 1 2 2 2 2 2 2s =10×[(30 - 28) + (35 - 28) + (25 - 28) + (25 - 28) + (30 - 28) + (34 - 28) + (26 -28) 2+ (25 -28) 2+ (29 - 28) 2+ (21 - 28) 2]4+ 49+ 9+ 9+ 4+ 36+ 4+ 9+ 1+49=10174=10= 17.4.20. ( 本小题满分12 分) 在学校展开的综合实践活动中,某班进行了小制作评选,作品上交时间为 5 月 1 日至 30 日,评委会把同学们上交作品的件数依据 5 天一组分组统计,绘制了频次散布直方图( 以下图 ) .已知从左到右各长方形的高的比为2︰3︰4︰6︰4︰1,第三组的频数为12,请解答以下各题.(1) 本次活动共有多少件作品参加评选? (2) 哪组上交的作品数目最多?有多少件?(3) 经过评选,第四组和第六组分别有10 件、 2 件作品获奖,问这两组哪一组获奖率较高?分析: (1) 依题意可算出第三组的频次为41= .2+ 3+4+ 6+ 4+ 1512 1设共有 n 件作品,则 n = 5∴ n = 60( 件 ) .6(2) 由直方图,可看出第四组上交作品数目最多,共有 60× 20= 18( 件 ) .(3) 第四组获奖率为 10 =5,18 922 6 第六组获奖率为1 =3=9,60× 20所以第六组获奖率较高.21.( 本小题满分 12 分 ) 某班 40 人随机分为两组,第一组 18 人,第二组 22 人,两组学生在某次数学检测中的成绩如表:分组均匀成绩标准差第一组 90 6第二组804求全班的均匀成绩和标准差.分析: 设全班的均匀成绩为x ,全班成绩的方差为 s 2,则212 22 2= 36,s 1=[( x 1 + x 2 + + x 18 ) -18×90 ]18212222= 22[( x∴ x 1169=40×(90 ×18+80×22) = 2 = 84.5 ,2 1 22 2 2 2 2 2s = 40[( x 1 +x2+ + x 18 ) + ( x 19 + x 20 + + x 40 ) -40· x ] 1 ×[18 ×(36 + 8100) +22×(16 + 6400) -40× 1692 = ] 404 12 = 40×(146448+ 141152-10×169 )1 = 40×1990= 49.75.∴ s = 199 ≈7.05.2评论: 均匀成绩应为总成绩除以总人数,而总成绩可由每构成绩之和求得. 22. ( 本小题满分 12 分 )2008 年 12 月 11 日,在南京大学举办的2009 届大学毕业生人才招聘会上, 有一家企业的招聘员告诉大学生王某:“我们企业的收入水平很高”,“昨年,在 50 名员工中,最高年收入达到了100 万,他们年收入的均匀数为 3.5 万”,假如王某希望获取年薪 2.5 万元.(1) 你可否依据以上信息判断王某能否能够成为此企业的一名高收入者?(2) 假如招聘员持续告诉王某,“员工收入的变化范围是从 0.5 万到 100 万”,这个信息能否足以使王某作出决定能否受聘?为何?(3) 假如招聘员持续给王某供给了以下信息,员工收入的中间 50%(即去掉最少的 25%和最多的 25%后所剩下的 ) 的变化范围是 1 万到 3 万,王某又该怎样使用这条信息来做出能否受聘的决定?剖析: 代入方差公式s 2= 1[(x 12+22+ + n 2) - n x 2] 即可求得.n x x分析: (1) 不可以.由于均匀收入和最高收入相差太多,说明高收入的员工不过很少量,49此刻已经知道起码有一个人的收入为x 50 = 100 万元,那么其余员工的收入之和为 =i = 13.5 ×50- 100= 75( 万 ) .每人均匀只有 1.53 万元,假如再有 n 个收入特别高者,那么初进企业的员工的收入将会很低.(2) 不可以.要看中位数是多少(3) 能.能够确立有75%的员工薪资在 1 万元以上,此中 25%的员工薪资在 3 万元以上..。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
综合检测一.选择题: (以下题目从4项答案中选出一项,每小题5分,共40分)1. 为了了解1200名学生对学校某项教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔(抽样距)K 为( )(A)40 (B)30 (C)20 (D)12[解析]A.[抽样距=40301200=] 2. 设有一个回归方程y=2-1.5x ,当变量x 增加一个单位时 ( )A .y 平均增加1.5个单位B .y 平均增加2个单位C .y 平均减少1.5个单位D .y 平均减少2个单位[解析]C3. (08东北师大附中)要完成下列2项调查:① 从某社区125户高收入家庭,280户中等收入家庭,95户低收入家庭中选出100户调查社会购买力的某项指标② 从某中学高一年级的12名体育特长生中选出3人调查学习负担情况. 应采用的抽样方法是A .①用随机抽样法②用系统抽样法B .①用分层抽样法②用随机抽样法C .①用系统抽样法②用分层抽样法D .①、②都用分层抽样法 [解析] B4. 由一组数据),(,),,(),,(2211n n y x y x y x 得到的回归直线bx a y +=ˆ,对于下列说法: ① 直线bx a y+=ˆ必过点),(y x ; ②直线bx a y+=ˆ中的∑∑∑∑∑=====--=n i ni i i n i n i ni i i i i x x n y x y x n b 1122111)())((;③直线bx a y+=ˆ中的a 与b 的关系为x b y a -=. 其中正确的说法有 ( ) A.0个 B.1个 C.2个 D.3个[解析]D5. 为研究变量x 和y 的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程1l 和2l ,两人计算知x 相同,y 也相同,则1l 与2l 的关系为 ( ) A .重合 B.平行 C .相交于点),(y x D. 无法判断 [解析] C6. 在抽查某产品尺寸的过程中,将其尺寸分成若干组,[]b a ,是其中一组,抽查出的个数在605040302010321参加人数活动次数该组上的频率为m ,该组上的直方图的高为h ,则[]b a -等于( ) (A)hm (B)m h (C)hm(D)与m,n 无关 7. (09四校联考)为了解一片经济林的生长情况,随机测量了其中100株树木的底部周长(单位:cm )。
根据所得数据画出样本的频率分布直方图(如右),那么在这100株树木中,底部周长小于110cm 的株数是 (A ).30 (B )60 (C )70 (D )80 [解析] C [7010010)04.002.001.0(=⨯⨯++]8. 某班有48名学生,某次数学考试的成绩,经计算平均分为70分,标准差为S ,后来发现登录有误,甲得80分却记为50分,乙得70误登为100分,更正后重新计算得标准差为1S ,则S 与1S 之间的大小关系为( )(A)S=1S (B)S<1S (C) 1S >S (D)大小关系不确定[解析]C.[S S m S m S <∴-+-+=-+-+=12221222,48)7070()7080(,48)70100()7050(] 二.填空题: (本大题共7小题,每小题5分,满分30分.其中13~15题是选做题,考生只能选做二题,三题全答的,只计算前两题得分)9. 下列4组变量:①学习时间与他(她)的考试成绩②人的年龄与他(她)拥有的财富③凸多边形的边数与内角和④城镇居民的平均工资与消费水平,它们之间具有相关关系的是 (写出所有满足条件的组号) [解析] ①④10. 用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生随机地从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是___________. [解析] [设第一组抽取的号码为x ,则第16组抽取的号码为815⨯+x ,6126120=∴=+∴x x ]11. (2019揭阳一模)某中学号召学生在暑假期间至少参加一次社会 公益活动(以下简称活动).该校文学社共有100名学生,他们参加 活动的次数统计如右图所示.则该文学社学生参加活动的人均次数 为 ;从文学社中任意选两名学生,他们参加活动次数不 同的概率是 . [解析] 2.2;61112. (2019·江苏泰州)下表是某厂1~4月份用水量(单位:百吨)的一组数据,月份x 1 2 3 4 用水量y4.5432.5由其散点图可知,用水量y 与月份x 之间有较好的线性关系,其线性回归方程是______.(写成一次函数的形式)[解析] 25.57.0ˆ+-=x y13. 从2019名学生中选取100名组成合唱团,若采用下面的方法选取:先用简单随机抽样从2019人中剔除8人,剩下的2019人再按系统抽样的方法进行,则每人被选上的概率为 . [解析]50225.[等概率抽样,每个人被抽到的概率为502252008100=] 14. 若某函数模型对一组数据的残差平方和为89,其相关指数为0.95,则总偏差平方和为 ,回归平方和为 . [解析] 1780;1691 [总偏差平方和残差平方和-=12R ,回归平方和=169195.01780=⨯]15. (2019广州调研文、理)某校对全校男女学生共1600名进行健康调查,选用分层抽样法抽取一个容量为200的样本.已知女生比男生少抽了10人,则该校的女生人数应是 人. [解析] 760.[760160020095=⨯] 三.解答题:16.甲、已两个班中个抽出10名同学的英语口语成绩,他们的成绩如下表,成绩的众数和中位数[解析] (1) 甲 乙5 8 36 47 94 7 45669866431 8 02 ……………………………….4分 0 9(2).甲班10名同学的英语口语平均成绩 甲x =80.4, 已班10名同学的英语口语平均成绩已x =72.1,估计甲班的英语口语平均成绩约为80.4,已班的英语口语平均成绩约为72.1………….8分(3)甲班10名同学英语口语成绩中86出现2次,其余都只出现1次,故众数为86; 将10个数从小到大排列,第5、6个数都是86 ,故中位数为86…………………..12分. 17. 在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人,六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主。
(1)根据以上数据建立一个2×2的列联表; (2)判断人的饮食习惯是否与年龄有关. [解析](1)2×2的列联表如右:…………………………………………6分(2) 提出统计假设,0H :假设人的饮食习惯与年龄无关,22124(43332721) 6.20170546460χ⨯-⨯=≈⨯⨯⨯当统计假设0H 成立时,25.024χ≥的概率约为2.5%,即有97.5%的把握认为“人的饮食习惯与年龄有关”. ………………………………………………12分 18. 某班40人平均分成两组,两组学生一次考试的成绩情况如下表:[解析]设第一组20个学生的成绩分别为2021,,,x x x , 第二组20个学生的成绩分别为2021,,,y y y ,依题意,180020902021=⨯=+++x x x , 160020802021=⨯=+++y y y 所以,全班平均分为8540160018004020212021=+=+++++++y y y x x x ……5分620)90()90()90(2202221=-++-+-x x x ,420)80()80()80(2202221=-++-+-y y y22202122022216209020)(180⨯=⨯++++-+++∴x x x x x x22202122022214208020)(160⨯=⨯++++-+++y y y y y y1627206209020)(1802220212202221=⨯+⨯-+++=+++∴x x x x x x1283204208020)(1602220212202221=⨯+⨯-+++=+++y y y y y y …………10分又222222)85()85()85()85()85()85(-++-+-+-++-+-y y y x x x)(17020212202221x x x x x x +++-+++= 2202122022218540)(170⨯++++-++++y y y y y y2040=所以,全班的标准差为14.740204040)85()85()85()85()85()85(22022212202221≈=-++-+-+-++-+-y y y x x x …………………………………………………………………………14分19. 在某班随机抽得10名学生,他们在高一高二的数学成绩如下表所示:(2)如果y 与x 具有相关关系,求回归直线方程;(3)若该班某同学在高一的数学成绩为80分,试估计他在高二的数学成绩. [解析](1)由表中所给数据,计算得:,723,710,3.72,71101101∑∑======i i i i y x y x∑∑∑======10121012101.52541,50520,51467i i i ii iiy xy x∑∑∑===---=1012210122101)10)(10(10i i i i i ii y y x x yx yx r=)3.721052541)(711050520(723715146722⨯-⨯-⨯-05.0632.07802972.0r =>≈故y 与x 具有相关关系 …………………………………………………………6分(2)设回归方程为bx a y+=ˆ,则22.17110505203.727110514671010210122101≈⨯-⨯⨯-=--∑∑==i i i ii xx yx yx b 32.147122.13.72-=⨯-=-=x b y a ,所以回归方程为32.1422.1ˆ-=x y …………11分 (3)当80=x 时,代入回归方程的8328.83ˆ≈=y估计这位同学在高二的数学成绩为83分 …………………………………….14分 20. (2019·江苏苏北三市联考)某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:((Ⅱ)求年推销金额y 关于工作年限x 的线性回归方程;(Ⅲ)若第6名推销员的工作年限为11年,试估计他的年推销金额.(参考数据: 1.04≈1.02;由检验水平0.01及23n -=,查表得0.010.959r =.) [解析] (Ⅰ)由1()()ni i i x x y y =--∑=10,21()n i i x x =-=∑20,21()ni i y y =-=∑ 5.2,可得()()0.98nii xx y y r --≈∑. ∴年推销金额y 与工作年限x 之间的相关系数约为0.98. ………………………5分 (Ⅱ) 由(Ⅰ)知,0.010.980.959r r =>=,∴可以认为年推销金额y 与工作年限x 之间具有较强的线性相关关系. 设所求的线性回归方程为ˆybx a =+, 则121()()100.520()niii nii x x yy b x x ==--===-∑∑,0.4a y bx =-=. ∴年推销金额y 关于工作年限x 的线性回归方程为0.50.4y x =+. ……………………10分 (Ⅲ) 由(Ⅱ) 可知,当x=11时,0.50.40.5110.4 5.9y x =+=⨯+=万元.∴可以估计第6名推销员的年推销金额为5.9万元. ……………………………14分21. 为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛. 为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计. 请你根据尚未完成并有局部污损的频率分布表和频数分布直方图,解答下列问题:(Ⅰ)填充频率分布表的空格(将答案直接填在表格内); (Ⅱ)补全频数条形图;(Ⅲ)若成绩在75.5~85.5分的学生为二等奖,问获得二等奖的学生约为多少人? 解:(1)---------------------4分(2) 频数直方图如右上所示--------------------------------8分(3) 成绩在75.5~80.5分的学生占70.5~80.5分的学生的510,因为成绩在70.5~80.5分的学生频率为0.2 ,所以成绩在76.5~80.5分的学生频率为0.1 ,---------10分 成绩在80.5~85.5分的学生占80.5~90.5分的学生的105,因为成绩在80.5~90.5分的学生分组 频数 频率 50.5~60.5 4 0.08 60.5~70.5 0.16 70.5~80.5 10 80.5~90.5 16 0.32 90.5~100.5 合计50分组 频数 频率 50.5~60.5 4 0.08 60.5~70.5 8 0.16 70.5~80.5 10 0.20 80.5~90.5 16 0.32 90.5~100.5 12 0.24 合计501.00频率为0.32 ,所以成绩在80.5~85.5分的学生频率为0.16 -------------12分所以成绩在76.5~85.5分的学生频率为0.26,由于有900名学生参加了这次竞赛,所以该校获得二等奖的学生约为0.26⨯900=234(人)------------------14分。