人教版数学必修三统计单元测试

合集下载

必修三统计单元测试(含答案)

必修三统计单元测试(含答案)

统计单元测试 数学试卷(时间:120分钟 满分:150分)一、选择题(本大题共12小题,每小题5分,共60分) 1. 下面的抽样方法是简单随机抽样的是( ) A .在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709为三等奖B .某车间包装一种产品,在自动的传送带上,每隔5分钟抽一包产品,称其重量是否合格C .某校分别从行政、教师、后勤人员中抽取2人,14人,4人了解学校机构改革的意见D .用抽签法从10件产品中选取3件进行质量检验2. 从某年级1 000名学生中抽取125名学生进行体重的统计分析,就这个问题来说,下列说法正确的是( )A .1 000名学生是总体B .每个被抽查的学生是个体C .抽查的125名学生的体重是一个样本D .抽取的125名学生的体重是样本容量 3. 从随机编号为0001,0002,…,1500的1500名参加这次全市期中考试的学生中用系统抽样的方法抽取一个样本进行成绩分析,已知样本中编号最小的两个编号分别0018,0068,则样本中最大的编号应该是( ) A .1466B .1467C .1468D .14694. 某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36的样本,则老年人、中年人、青年人分别应抽取的人数是( ) A .7,11,19 B .6,12,18 C .6,13,17 D .7,12,175. x 是1x 、2x 、、100x 的平均数,a 是1x 、2x 、、40x 的平均数,b 是41x 、42x 、、100x 的平均数,则下列各式正确的是( ) A .2355x a b =+B .3255x a b =+C.x a b =+D .2a bx +=6. 若数据x 1,x 2,…,x n 的平均数为x ,方差为s 2,则3x 1+5,3x 2+5,…,3x n +5的平均数和标准差分别为( ) A .x ,sB .3x +5,sC .3x +5,3sD .3x +5,9s 2+30s +257. 总体由编号为01,02,…,39,40的40个个体组成.利用下面的随机数表选取6个个体,选取方法是从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第6个个体的编号为( )50 44 66 44 21 66 06 58 05 62 61 65 54 35 02 42 35 48 96 32 14 52 41 52 48[ 22 66 22 15 86 26 63 75 41 99 58 42 36 72 24 58 37 52 1851 03 37 18 39 11A .21B .24C .15D .328. 某校为了对初三学生的体重进行摸底调查,随机抽取了50名学生的体重(kg),将所得数据整理后,画出了频率分布直方图,如图所示,体重在[45,50)内适合跑步训练,体重在[50,55)内适合跳远训练,体重在[55,60)内适合投掷相关方面训练,估计该校初三学生适合参加跑步、跳远、投掷三项训练的集训人数之比为( )A .4∶3∶1B .5∶3∶1C .5∶3∶2D .3∶2∶19. 用系统抽样法(按等距的规则)要从140名学生中抽取容量为20的样本,将140名学生从1~140编号.按编号顺序平均分成20组(1~7号,8~14号,…,134~140号),若第17组抽出的号码为117,则第一组中按此抽样方法确定的号码是( )A .7B .5C .4D .3 10.某种产品的广告费支出x 与销售额y (单位:万元)之间有如下对应数据:x 2 4 5 6 8y 30 40 t 50 70根据上表提供的数据,求出y 关于x 的回归直线方程为y =6.5x +17.5,那么表中t 的值为( ) A .40 B .50 C .60 D .7011.为了考查两个变量x 和y 之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为1l 、2l ,已知两人得的试验数据中,变量x 和y 的数据的平均值都相等,且分别都是s 、t ,那么下列说法正确的是( ) A .直线1l 和2l 一定有公共点()s t ,B .必有直线12l l ∥C .直线1l 和2l 相交,但交点不一定是()s t ,D .1l 和2l 必定重合12.在某地区某高传染性病毒流行期间,为了建立指标显示疫情已受控制,以便向该地区居民显示可以过正常生活,有公共卫生专家建议的指标是“连续7天每天新增感染人数不超过5人”,根据连续7天的新增病例数计算,下列各项中,一定符合上述指标的是( )①平均数x ≤3;②标准差s ≤2;③平均数x ≤3且标准差s ≤2;④平均数x ≤3且极差小于或等于2;⑤众数等于1且极差小于或等于4.A .①②B .③④C .③④⑤D .④⑤ 二、填空题(本大题共4小题,每小题5分,共20分)13.某工厂生产了 60个零件,现将所有零件随机编号,用系统抽样方法,抽取一个容量为 5的样本.已知4号、16号、40号、52号零件在样本中,则样本中还有一个零件的编号是________. 14.若a 1,a 2,…,a 20这20个数据的平均数为x ,方差为0.21,则a 1,a 2,…,a 20,x 这21个数据的方差为 .15.某高中在校学生2 000人,高一与高二人数相同并都比高三多1人.为了响应“阳光体育运动”号召,学校举行了“元旦”跑步和登山比赛活动.每人都参加而且只参与了其中一项比赛,各年级参与比赛人数情况如右表:其中a ∶b ∶c =2∶3∶5,全校参与登山的人数占总人数的25.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则高二参与跑步的学生中应抽取 人.16.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.三、解答题(本大题共6小题,共70分)17.(10分)一批产品中,有一级品100个,二级品60个,三级品40个,用分层抽样的方法,从这批产品中抽取一个容量为20的样本,写出抽样过程.18.(12分)为了了解学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,所得数据整理后,画出频率分布直方图,图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)学生跳绳次数的中位数落在哪个小组内?(2)第二小组的频率是多少?样本容量是多少?(3)若次数在110以上(含110次)为良好,试估计该学校全体高一学生的良好率是多少?19.(12分)今年西南一地区遭遇严重干旱,某乡计划向上级申请支援,为上报需水量,乡长事先抽样调查了100户村民的月均用水量,得到这100户村民月均用水量的频率分布表如下表:(月均用水量的单位:吨)用水量分组频数频率[0.5,2.5)12[2.5,4.5)[4.5,6.5)40[6.5,8.5)0.18[8.5,10.5]6合计1001(1)请完成该频率分布表,并画出相对应的频率分布直方图和频率分布折线图;(2)估计样本的中位数是多少?(3)已知上级将按每户月均用水量向该乡调水,若该乡共有1 200户,请估计上级支援该乡的月调水量是多少吨?20.(12分)某次运动会甲、乙两名射击运动员的成绩如下:甲:9.4 8.7 7.5 8.4 10.1 10.5 10.7 7.2 7.8 10.8 乙:9.1 8.7 7.1 9.8 9.7 8.5 10.1 9.2 10.1 9.1 (1)用茎叶图表示甲、乙两人的成绩; (2)根据茎叶图分析甲、乙两人的成绩;(3)分别计算两个样本的平均数和标准差,并根据计算结果估计哪位运动员的成绩比较稳定.21.(12分)在某次综合素质测试中,共设有40个考室,每个考室30名考生.在考试结束后,为调查其测试前的培训辅导情况与测试成绩的相关性,抽取每个考室中座位号为05的考生,统计了他们的成绩,得到如图所示的频率分布直方图.(1)在这个调查采样中,采用的是什么抽样方法? (2)估计这次测试中优秀(80分及以上)的人数;(3)写出这40名考生成绩的众数、中位数、平均数的估计值.22.(12分)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.(1)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y 关于x 的线性回归方程y bx a =+;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想? 参考数据1125132912268161092⨯+⨯+⨯+⨯=,22221113128498+++=(参考公式:1221ni ii nii x ynx y b xnx==-=-∑∑121()()()niii nii x x yy x x ==--=-∑∑,a y bx =-)数学试卷答案1-5.DCCBA 6-10.CCBBC 11-12.AD13.28 14.0.2 15.36 16.0.03 3 (第一空2分,第二空3分) 17.解 分层抽样方法:先将总体按其级别分为三层,一级品有100个,产品按00,01,…,99编号,二级品有60个,产品按00,01,…,59编号,三级品有40个,产品按00,01,…,39编号.因总体个数∶样本容量为10∶1,故用简单随机抽样的方法,在一级品中抽10个,二级品中抽6个,三级品中抽4个.这样就可得到一个容量为20的样本.18.解 (1)∵前三组的频率和为2+4+1750=2350<12,前四组的频率之和为2+4+17+1550=3850>12,∴中位数落在第四小组内. (2)频率为:42+4+17+15+9+3=0.08,又∵频率=第二小组频数样本容量,∴样本容量=频数频率=120.08=150.(3)由图可估计所求良好率约为: 17+15+9+32+4+17+15+9+3×100%=88%19.解 (1)频率分布表与相应的频率分布直方图和频率分布折线图如下:(2)前两个矩形面积和为0.12+0.24,第三个矩形一半的面积为0.5-(0.12+0.24),则所求的中位数为:4.5+0.5-(0.12+0.24)0.2=4.5+0.7=5.2.(3)该乡每户平均月均用水量估计为(1.5×12+3.5×24+5.5×40+7.5×18+9.5×6)/100=5.14. 上级支援该乡的月调水量应为5.14×1 200=6 168. 答 上级支援该乡的月调水量是6 168吨.20. 解:(1)如答图所示,茎表示成绩的整数环数,叶表示小数点后的数字.(2)由茎叶图可看出:乙的成绩大致对称.因此乙发挥稳定性好,甲波动性大.(3)甲成绩的平均数=110×(9.4+8.7+7.5+8.4+10.1+10.5+10.7+7.2+7.8+10.8)=9.11,s 甲 1.3,乙成绩的平均数=110×(9.1+8.7+7.1+9.8+9.7+8.5+10.1+9.2+10.1+9.1)=9.14,s 乙=0.9. 因为s 甲>s 乙,这说明了甲运动员成绩的波动程度大于乙运动员成绩的波动程度.所以我们估计乙运动员的成绩比较稳定.21. 解:(1)采用的是系统抽样;(2)由于80分及以上的频率=(0.05+0.02)×5=0.35,因此这次测试中优秀人数约为40×30×0.35=420(人);(3)成绩在[75,80)的人数最多,因此众数的估计值是75280+=77.5(分);中位数的估计值=75+0.50.050.10.20.060---=77.5(分);平均数的估计值=62.5×0.05+67.5×0.1+72.5×0.2+77.5×0.3+82.5×0.25+87.5×0.1=77(分). 22. 解:(1)由数据求得11=x , 24=y 由公式求得718=b ,再由 730-=-=x b y a 所以关于的线性回归方程为183077y =⨯- (2)当10=x 时,7150ˆ=y,2227150<- 同理, 当6=x 时, 78ˆ7y=,781227-<, 所以,该小组所得线性回归方程是理想的.。

(好题)高中数学必修三第一章《统计》测试卷(有答案解析)(1)

(好题)高中数学必修三第一章《统计》测试卷(有答案解析)(1)

一、选择题1.工人月工资y(元)与劳动生产率x(千元)变化的回归直线方程为=50+80x,下列判断不正确的是()A.劳动生产率为1000元时,工资约为130元B.工人月工资与劳动者生产率具有正相关关系C.劳动生产率提高1000元时,则工资约提高130元D.当月工资为210元时,劳动生产率约为2000元2.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是()A.海水稻根系深度的中位数是45.5B.普通水稻根系深度的众数是32C.海水稻根系深度的平均数大于普通水稻根系深度的平均数D.普通水稻根系深度的方差小于海水稻根系深度的方差3.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已9,11的学生人数为25,则n的值为()知学习时长在[)A.40 B.50 C.80 D.1004.将某选手的7个得分去掉1个最高分,去掉1个最低分,5个剩余分数的平均分为21,现场作的7个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则5个剩余分数的方差为( )A .1167B .365C .36D .6755.某产品的广告费用与销售额的统计数据如下表:( ) 广告费用(万元) 销售客(万元)根据上表中的数据可以求得线性回归方程中的为,据此模型预报广告费用为万元时销售额为( ) A .万元B .万元C .万元D .万元6.某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则42x y +的值是( )A .12B .14C .16D .187.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是( )A .45B .47C .48D .638.在一次53.5公里的自行车个人赛中,25名参赛选手的成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为125-号,再用系统抽样方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为()A .95B .96C .97D .989.①45化为二进制数为(2)101101;②一个总体含有1000个个体(编号为0000,0001,…,0999),采用系统抽样从中抽取一个容量为50的样本,若第一个抽取的编号为0008,则第六个编号为0128; ③已知a ,b ,c 为ABC ∆三个内角A ,B ,C 的对边,其中3a =,4c =,6A π=,则这样的三角形有两个解.以上说法正确的个数是( ) A .0B .1C .2D .310.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3,则直线OP (O 为原点)的斜率的取值范围是3333(,)(,)22-∞-. A .①②③B .①③④C .①②④D .②③④11.某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为( ) A .30B .25C .20D .1512.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响.对近8年的年宣传费i x 和年销售量()1,2,...8i y i =数据作了初步处理,得到下面的散点图及一些统计量的值.有下列5个曲线类型:①ˆˆy bxa =+;②y c x d =+;③ln y p q x =+;④21k xy k e =+;⑤212y c x c =+,则较适宜作为年销售量y 关于年宣传费x 的回归方程的是( ) A .①②B .②③C .②④D .③⑤二、填空题13.如图是某地区2018年12个月的空气质量指数以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述正确的是______.①2月相比去年同期变化幅度最小,3月的空气质量指数最高;②第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小; ③第三季度空气质量指数相比去年同期变化幅度的方差最小; ④空气质量指数涨幅从高到低居于前三位的月份为6、8、4月.14.对两个变量y 和x 进行回归分析,得到一组样本数据()11,x y ,()22,x y ,…,(),n n x y ,则下列说法中正确的序号是______.①由样本数据得到的回归直线方程y bx a =+必过样本点的中心 ②残差平方和越小的模型,拟合的效果越好③用相关指数2R 来刻画回归效果,2R 越小说明拟合效果越好④若变量y 和x 之间的相关系数为0.946r =-,则变量y 和x 之间线性相关性强 15.数列{}n a 是公差不为零的等差数列,其前n 项和为n S ,若记数据1a ,2a ,3a ,⋅⋅⋅,2019a 的标准差为1σ,数据11S ,22S ,33S ,⋅⋅⋅,20192019S 的标准差为2σ,则12σσ=________ 16.某住宅小区有居民2万户,从中随机抽取200户,调查是否安装宽带,调查结果如下表所示:则该小区已安装宽带的居民估计有______户.17.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.18.变量X 与Y 相对应的5组数据和变量U 与V 相对应的5组数据统计如表:用b 1表示变量Y 与X 之间的回归系数,b 2表示变量V 与U 之间的回归系数,则b 1与b 2的大小关系是___.19.抽样统计甲、乙两位同学5次数学成绩绘制成如下图所示的茎叶图,则成绩较稳定的那位同学成绩的方差为__________.20.某班运动队由足球运动员18人、篮球运动员12人、乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n的样本,若分别采用系统抽样法和分层抽样法,则都不用剔除个体;当样本容量为n+1时,若采用系统抽样法,则需要剔除1个个体,那么样本容量n为________.三、解答题21.为了解某市家庭用电量的情况,该市统计局调查了100户居民去年一年的月均用电量,发现他们的用电量都在50kW·h至350kW·h之间,进行适当分组后,画出频率分布直方图如图所示.(I)求a的值;(Ⅱ)求被调查用户中,用电量大于250kW·h的户数;(III)为了既满足居民的基本用电需求,又提高能源的利用效率,市政府计划采用阶梯定价,希望使80%的居民缴费在第一档(费用最低),请给出第一档用电标准(单位:kW·h)的建议,并简要说明理由.22.已知某校6个学生的数学和物理成绩如下表:学生的编号i123456数学i x898779817890物理i y797577737274(1)若在本次考试中,规定数学在80分以上(包括80分)且物理在75分以上(包括75分)的学生为理科小能手.从这6个学生中抽出2个学生,设X 表示理科小能手的人数,求X 的分布列和数学期望;(2)通过大量事实证明发现,一个学生的数学成绩和物理成绩具有很强的线性相关关系,在上述表格是正确的前提下,用x 表示数学成绩,用y 表示物理成绩,求y 与x 的回归方程.参考数据和公式:ˆˆˆybx a =+,其中1122211()()ˆ()nniii ii i nniii i x x y y x y nx yb x x xnx====---⋅==--∑∑∑∑,ˆˆay bx =-. 23.“水是生命之源”,但是据科学界统计可用淡水资源仅占地球储水总量的2.8%,全世界近80%人口受到水荒的威胁.某市为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (吨):一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照00.50.51,...,[[[44.5,),,),)分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有60万居民,估计全市居民中月均用水量不低于2.5吨的人数,并说明理由;(3)若该市政府希望使82%的居民每月的用水不按议价收费,估计x 的值,并说明理由.24.党的十八大以来,我国精准扶贫已经实施了六年,我国贫困人口从2012年的9899万人,减少到2018年的1660万人,2019年将努力实现减少贫困人口1000万人以上的目标,力争2020年在现行标准下,农村贫困人口全部脱贫,贫困县全部脱贫摘帽.某市为深入分析该市当前扶贫领域存在的突出问题,市扶贫办近三年来,每半年对贫困户(用y 表示,单位:万户)进行取样,统计结果如图所示,从2016年6月底到2019年6月底的共进行了七次统计,统计时间用序号t 表示,例如:2016年12月底(时间序号为2)贫困户为5.2万户.(1)求y 关于t 的线性回归方程y bx a =+,并预测到2020年12月底,该市能否实现贫困户全部脱贫;(2)为尽快打赢脱贫攻坚战,该市扶贫办在2019年6月底时,对全市贫困户随机抽取了100户贫困户,对每个家庭最主要经济收入来源进行抽样调查,统计结果如图.并决定据此选派一批农业技术人员对全市所有贫困户中,家庭最主要经济收入来源为养殖收入和种植收入的贫困户进行对口帮扶,每一名农业技术人员对口帮扶贫困户90户,则该市应分别安排多少农业技术人员对家庭最主要经济收入来源为养殖收入和种植收入的贫困户进行对口帮扶? 附:回归直线的斜率和截距的最小二乘法估计公式分别为:()()()1122211nniii ii i nniii i tty y t y nt yb tttnt====---==--∑∑∑∑,a y bt =-25.学校为了了解高三学生每天自主学习中国古典文学的时间,随机抽取了高三男生和女生各50名进行问卷调查,其中每天自主学习中国古典文学的时间超过3小时的学生称为“古文迷”,否则为“非古文迷”,调查结果如表:古文迷 非古文迷 合计 男生 26 24 50 女生 30 20 50 合计5644100(Ⅰ)根据表中数据能否判断有60%的把握认为“古文迷”与性别有关?(Ⅱ)现从调查的女生中按分层抽样的方法抽出5人进行调查,求所抽取的5人中“古文迷”和“非古文迷”的人数;(Ⅲ)现从(Ⅱ)中所抽取的5人中再随机抽取3人进行调查,记这3人中“古文迷”的人数为ξ,求随机变量ξ的分布列与数学期望.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:26.经营费用指流通企业对在经营过程中发生除经营成本以外的所有费用,如管理费用、财务费用、法律费用等,这些费用没有直接用于生产产品或提供服务,但它是影响公司收益的重要因素.某创业公司从2014年开始创业到2019年每年的经营费用y (万元)、年份及其编号t ,有如下统计资料:已知该公司从2014年到2019年年平均经营费用为16万元,且经营费用y 与年份编号t 呈线性相关关系.(1)求2019年该公司的经营费用;(2)y 关于t 的回归方程为 2.6y t a =+,求a ,并预测2020年所需要支出的经营费用; (3)该公司对2019年卖出的产品进行质量指标值检测,由检测结果得如图所示频率分布直方图:预计2020年生产产品质量指标值分布与上一年一致,将图表中频率作为总体的概率.当每件产品质量指标值不低于215时为优质品,指标值在185到215之间是合格品,指标值低于185时为次品.出售产品时,每件优质品可获利1.5万元,每件合格品可获利0.7万元,次品不仅全额退款,还要对客户进行赔付,所以每件次品亏损1.3万元.若2020年该公司的产量为500台,请你预测2020年该公司的总利润(总利润=销售利润-经营费用).【参考答案】***试卷处理标记,请不要删除一、选择题1.C解析:C【解析】试题分析:根据线性回归方程=50+80x的意义,对选项中的命题进行分析、判断即可.解:根据线性回归方程为=50+80x,得;劳动生产率为1000元时,工资约为50+80×1=130元,A正确;∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B正确;劳动生产率提高1000元时,工资约提高=80元,C错误;当月工资为210元时,210=50+80x,解得x=2,此时劳动生产率约为2000元,D正确.故选C.考点:线性回归方程.2.D解析:D 【分析】选项A 求出海水稻根系深度的中位数是444745.52+=,判断选项A 正确;选项B 写出普通水稻根系深度的众数是32,判断选项B 正确;选项C 先求出海水稻根系深度的平均数,再求出普通水稻根系深度的平均数,判断选项C 正确;选项D 先求出普通水稻根系深度的方差,再求出海水稻根系深度的方差,判断选项D 错误. 【详解】解:选项A :海水稻根系深度的中位数是444745.52+=,故选项A 正确; 选项B :普通水稻根系深度的众数是32,故选项B 正确;选项C :海水稻根系深度的平均数393938434447495050514510+++++++++=,普通水稻根系深度的平均数252732323436384041453510+++++++++=,故选项C 正确;选项D :普通水稻根系深度的方差2222222211[(3845)(3945)(3945)(4345)(4445)(4745)(4945)(5045)10S =-+-+-+-+-+-+-+-+, 海水稻根系深度的方差2222222221[(2535)(2735)(3235)(3235)(3435)(3635)(3835)(4035)(10S =-+-+-+-+-+-+-+-+,故选项D 错误 故选:D. 【点睛】本题考查根据茎叶图求中位数、众数、平均数、方差,是基础题. 3.B解析:B 【分析】由频率分布直方图的性质,求得0.25x =,再结合频率分布直方图的频率的计算方法,即可求解. 【详解】由频率分布直方图的性质,可得()20.050.150.051x +++=,解得0.25x =, 所以学习时长在[)9,11的频率2520.5x n==,解得50n =. 故选:B . 【点睛】本题主要考查了频率分布直方图性质及其应用,其中解答中熟记频率分布直方图的性质是解答的关键,着重考查了数据分析能力,以及计算能力.4.B解析:B 【分析】由剩余5个分数的平均数为21,据茎叶图列方程求出x =4,由此能求出5个剩余分数的方差. 【详解】∵将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为21, ∴由茎叶图得:1724202020215x+++++=得x =4,∴5个分数的方差为:S 2=()()()()()222221361721242120212021242155⎡⎤-+-+-+-+-=⎣⎦ 故选B 【点睛】本题考查方差的求法,考查平均数、方差、茎叶图基础知识,考查运算求解能力,考查数形结合思想,是基础题.5.B解析:B 【解析】 【分析】 先求出,由样本点的中心在回归直线上,可求出,从而求出回归方程,然后令,可求出答案.【详解】 由题意,,则样本中心点在回归方程上,则,故线性回归方程为,则广告费用为万元时销售额为万元,故选B.【点睛】本题考查了线性回归方程的求法,考查了学生的计算能力,属于基础题.6.A解析:A 【分析】由题,中位数为12,求得4x y +=,再求得平均数,利用总体标准差最小和基本不等式求得x ,y 的值,即可求得答案. 【详解】由题,因为中位数为12,所以242x yx y +=∴+= 数据的平均数为:1(22342019192021)11.410x y ++++++++++= 要使该总体的标准最小,即方差最小,所以222222.8(1011.4)(1011.4)( 1.4)( 1.4)2()0.722x y x y x y +-+-++-=-+-≥= 当且紧当 1.4 1.4x y -=-,取等号,即2x y ==时,总体标准差最小 此时4212x y += 故选A 【点睛】本题考查了茎叶图,熟悉茎叶图,清楚中位数、标准差的求法是解题的关键,属于中档题型.7.A解析:A 【解析】 【分析】由茎叶图确定所给的所有数据,然后确定中位数即可. 【详解】各数据为:12 20 31 32 34 45 45 45 47 47 48 50 50 61 63, 最中间的数为:45,所以,中位数为45. 本题选择A 选项. 【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.8.C解析:C 【分析】结合系统抽样法的方法,得出其他四名选手的成绩,然后计算平均数,即可. 【详解】结合系统抽样法,可知间隔5个人抽取一次,甲为85,则其他人分别是88,94,99,107,故平均数为88+94+99+107=974,故选C.【点睛】考查了系统抽样法,关键该抽取方法每间隔相同人数中抽取一人,计算平均数,即可,难度中等.9.C解析:C 【解析】分析:①根据进位制的互化可得结果;②根据系统抽样的性质可得结论;③由正弦定理可得结论.详解:①45222...1÷=,22211...0÷=,112 5...1÷=,52 2...1÷=,22 1...0÷=,120...1÷=,故()()10245101101=,①正确;②因为1000个个题抽取50个样本,∴每个样本编号间隔为20,第六个编号为8205108+⨯=,即编号为0108,故②错误;③由正弦定理可得342,1sin 32sinC C ==,,c a C >∴∠可能是锐角,也可能是钝角,三角形有两个解,③正确,故选C.点睛:本题主要考查进位制、正弦定理的应用,分层抽样的应用,意在考查综合运用所学知识解决问题的能力,属于中档题.10.C解析:C 【分析】利用线性回归方程系数的几何意义,圆锥曲线离心率的范围,椭圆的性质,逐一判断即可. 【详解】①设某大学的女生体重y (kg )与身高x (cm )具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的线性回归方程为y ∧=0.85x ﹣85.71,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ,正确;②关于x 的方程x 2﹣mx +1=0(m >2)的两根之和大于2,两根之积等于1,故两根中,一根大于1,一根大于0小于1,故可分别作为椭圆和双曲线的离心率.正确; ③设定圆C 的方程为(x ﹣a )2+(x ﹣b )2=r 2,其上定点A (x 0,y 0),设B (a +r cosθ,b +r sinθ),P (x ,y ),由12OP =(OA OB +)得0022x a rcos x y b rsin y θθ++⎧=⎪⎪⎨++⎪=⎪⎩,消掉参数θ,得:(2x ﹣x 0﹣a )2+(2y﹣y 0﹣b )2=r 2,即动点P 的轨迹为圆, ∴故③不正确;④由22143x y +=,得a 2=4,b 2=3,∴1c ==.则F (﹣1,0),如图:过F 作垂直于x 轴的直线,交椭圆于A (x 轴上方),则x A =﹣1, 代入椭圆方程可得32A y =. 当P 为椭圆上顶点时,P (0FP k =32OA k =-, ∴当直线FP时,直线OP 的斜率的取值范围是32⎛⎫-∞- ⎪⎝⎭,. 当P 为椭圆下顶点时,P (0,∴当直线FP 时,直线OP 的斜率的取值范围是(8,32),综上,直线OP (O 为原点)的斜率的取值范围是32⎛⎫-∞- ⎪⎝⎭,∪,32). 故选C 【点睛】本题以命题真假的判断为载体,着重考查了相关系数、离心率、椭圆简单的几何性质等知识点,属于中档题.11.C解析:C 【详解】 抽取比例为150130000200=, 1400020200∴⨯=, 抽取数量为20,故选C.12.B解析:B 【解析】分析:先根据散点图确定函数趋势,再结合五个选择项函数图像,进行判断选择. 详解:从散点图知,样本点分布在开口向右的抛物线(上支)附近或对数曲线(上部分)的附近,所以y =d 或y =p +q ln x 较适宜,故选B . 点睛:本题考查散点图以及函数图像,考查识别能力.二、填空题13.①②③【分析】根据折线的变化率得到相比去年同期变化幅度、升降趋势逐一验证即可【详解】根据折现统计图可得2月相比去年同期变化幅度最小3月的空气质量指数最高故①正确;第一季度的空气质量指数的平均值最大第解析:①②③ 【分析】根据折线的变化率,得到相比去年同期变化幅度、升降趋势,逐一验证即可. 【详解】根据折现统计图可得,2月相比去年同期变化幅度最小,3月的空气质量指数最高,故①正确;第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小,故②正确;第三季度空气质量指数相比去年同期变化幅度的方差最小,故③正确; 空气质量指数涨幅从高到低居于前三位的月份为6、8、9月,故④错误,故答案为:①②③. 【点睛】本题考查条形统计图和折线图的应用,重点考查数据分析,从表中准确获取信息是关键,属于中档题型.14.①②④【分析】根据两个变量线性相关的概念及性质逐项判定即可求解【详解】由题意根据回归直线方程的特征可得线性回归直线方程一定过样本中心所以①正确;根据残差的概念可得残差平方和越小的模型拟合效果越好所以解析:①②④ 【分析】根据两个变量线性相关的概念及性质,逐项判定,即可求解. 【详解】由题意,根据回归直线方程的特征,可得线性回归直线方程一定过样本中心,所以①正确;根据残差的概念,可得残差平方和越小的模型,拟合效果越好,所以②正确; 根据相关指数的概念,可得2R 越大说明拟合效果越好,所以③不正确;若变量y 和x 之间的相关系数为0.946r =-,则变量y 和x 之间负相关,且线性相关性强,所以④正确; 故答案为:①②④. 【点睛】本题主要考查了两个变量的线性相关性的概念与判定,其中解答中熟记线性相关的基本概念和结论是解答的关键,属于基础题.15.2【分析】根据等差数列性质分析两组数据之间关系再根据数据变化规律确定对应标准差变化规律即得结果【详解】因为数列是公差不为零的等差数列其前项和为所以因此即故答案为:2【点睛】本题考查等差数列和项性质以解析:2 【分析】根据等差数列性质分析两组数据之间关系,再根据数据变化规律确定对应标准差变化规律,即得结果. 【详解】因为数列{}n a 是公差不为零的等差数列,其前n 项和为n S ,所以111=+222n n n a a a a n S +=, 因此2112σσ=,即122σσ=故答案为:2 【点睛】本题考查等差数列和项性质以及数据变化对标准差的影响规律,考查综合分析求解能力,属中档题.16.【分析】计算出抽样中已安装宽带的用户比例乘以总人数求得小区已安装宽带的居民数【详解】抽样中已安装宽带的用户比例为故小区已安装宽带的居民有户【点睛】本小题主要考查用样本估计总体考查频率的计算属于基础题 解析:10200【分析】计算出抽样中已安装宽带的用户比例,乘以总人数,求得小区已安装宽带的居民数. 【详解】抽样中已安装宽带的用户比例为604251200100+=,故小区已安装宽带的居民有512000010200100⨯=户. 【点睛】 本小题主要考查用样本估计总体,考查频率的计算,属于基础题.17.2【解析】【分析】根据系统抽样的概念结合可得最后结果为2【详解】学生总数不能被容量整除根据系统抽样的方法应从总体中随机剔除个体保证整除∵故应从总体中随机剔除个体的数目是2故答案为2【点睛】本题主要考解析:2 【解析】 【分析】根据系统抽样的概念结合2544262=⨯+,可得最后结果为2. 【详解】学生总数不能被容量整除,根据系统抽样的方法,应从总体中随机剔除个体,保证整除. ∵2544262=⨯+,故应从总体中随机剔除个体的数目是2,故答案为2. 【点睛】本题主要考查系统抽样,属于基础题;从容量为N 的总体中抽取容量为n 的样本,系统抽样的前面两个步骤是:(1)将总体中的N 个个体进行编号;(2)当Nn为整数时,抽样距即为N n ;当N n 不是整数时,从总体中剔除一些个体,使剩下的总体中的个体的个数N '能被n 整除.18.【解析】分析:根据回归系数几何意义得详解:因为Y 与X 之间正增长所以因为V 与U 之间负增长所以因此点睛:函数关系是一种确定的关系相关关系是一种非确定的关系事实上函数关系是两个非随机变量的关系而相关关系是解析:12b b >. 【解析】分析:根据回归系数几何意义得120b b >> 详解:因为Y 与X 之间正增长,所以10b >因为V 与U 之间负增长,所以20b < 因此120b b >>,点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .b 的正负,决定正相关与负相关.19.2【解析】分析:由茎叶图的分布可知乙同学的成绩会比较稳定先求出乙同学的平均成绩利用求方差的公式即可求得方差值详解:由茎叶图中成绩的分布情况可知乙同学的最低成绩比甲高乙同学的最高成绩比甲低所以成绩分布解析:2 【解析】分析:由茎叶图的分布可知,乙同学的成绩会比较稳定.先求出乙同学的平均成绩,利用求方差的公式即可求得方差值.详解:由茎叶图中成绩的分布情况可知,乙同学的最低成绩比甲高,乙同学的最高成绩比甲低,所以成绩分布相对较为集中,所以乙同学成绩的方差小,成绩较稳定. 设乙同学的平均成绩为x ,则8889909192905x ++++==所以乙同学成绩的方差()()()()()2222221889089909090919092905s ⎡⎤=-+-+-+-+-⎣⎦()14101425=++++= 所以乙同学成绩的方差为2点睛:方差体现了数据的离散程度,茎叶图中都保留了原始数据,因此可以从茎叶图中直接观察来比较方差的大小.要熟练掌握方差的计算公式.本题主要考查了简单的概念和计算,属于简单题.20.6【解析】n 为18+12+6=36的正约数因为18:12:6=3:2:1所以n 为6的倍数因此因为当样本容量为时若采用系统抽样法则需要剔除1个个体所以n+1为35的正约数因此解析:6 【解析】n 为18+12+6=36的正约数,因为18:12:6=3:2:1,所以n 为6的倍数,因此6,12,18,24,30,36n =因为当样本容量为1n +时,若采用系统抽样法,则需要剔除1个个体,所以n+1为35的正约数,因此6n =三、解答题。

人教A版高中数学必修三 第2章 统计 单元检测(A)

人教A版高中数学必修三 第2章 统计 单元检测(A)

人教A版高中数学必修三第2章《统计》单元检测(A)一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.从某年级1 000名学生中抽取125名学生进行体重的统计分析,就这个问题来说,下列说法正确的是()A.1 000名学生是总体B.每个被抽查的学生是个体C.抽查的125名学生的体重是一个样本D.抽取的125名学生的体重是样本容量2.为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样3.为了调查参加运动会的500名运动员的身高情况,从中抽查了50名运动员的身高,就这个问题来说,下列说法正确的是()A.50名运动员是总体B.每个运动员是个体C.抽取的50名运动员是样本D.样本容量是504.某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个.命中个数的茎叶图如右图,则下面结论中错误的一个是()A.甲的极差是29 B.乙的众数是21C.甲罚球命中率比乙高D.甲的中位数是245.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图1;对变量u,v 有观测数据(u i,v i)(i=1,2,…,10),得散点图2.由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关6.高三某班有学生56人,现将所有同学随机编号,用系统抽样的方法抽取一个容量为4的样本,已知5号、33号、47号学生在样本中,则样本中还有一个学生的编号为()A.13 B.17 C.19 D.217.两个变量之间的相关关系是一种()A.确定性关系B.线性关系C.非确定性关系D.非线性关系8.下列有关线性回归的说法,不正确的是()A.相关关系的两个变量不一定是因果关系B.散点图能直观地反映数据的相关程度C.回归直线最能代表线性相关的两个变量之间的关系D.任一组数据都有回归直线方程9.某年级有1 000名学生,现从中抽取100人作为样本,采用系统抽样的方法,将全体学生按照1~1 000编号,并按照编号顺序平均分成100组(1~10号,11~20号,…,991~1 000号).若从第1组抽出的编号为6,则从第10组抽出的编号为()A.86 B.96 C.106 D.97 10.从存放号码分别为1,2,…,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:卡片号码 1 2 3 4 5 6 7 8 9 10取到的次数13 8 5 7 6 13 18 10 11 9A.0.53 B.0.5 C.0.47 D.0.37 11.观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿的体重在[2700,3 000]的频率为( )A .0.001B .0.01C .0.003D .0.3 12.下图是根据《**统计年鉴2010》中的资料作成的2000年至2009年某省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到2000年至2009年我省城镇居民百户家庭人口数的平均数为( )A .304.6B .303.6C .302.6D .301.6 二、填空题(本大题共5小题,每小题4分,共20分)13.已知一个回归直线方程为y ^=1.5x +45(x i ∈{1,5,7,13,19}),则y =________. 14.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为________.15.某市居民2005~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)年份 2005 2006 2007 2008 2009 收入x 11.5 12.1 13 13.3 15 支出Y6.88.89.81012家庭年平均收入与年平均支出有________线性相关关系.16.某公司有员工49人,其中30岁以上的员工有14人,没超过30岁的员工有35人,为了解员工的健康情况,用分层抽样方法抽一个容量为7的样本,其中30岁以上的员工应抽取________人.17.某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示.现在用分层抽样方法从三个分厂生产的产品中共抽取100件做使用寿命的测试,则第一分厂应抽取的产品件数为________.由所得样品的测试结果计算出一、二、三分厂取出的产品的使用寿命平均值分别为1 020小时、980小时、1 030小时,估计这个企业所生产的该产品的平均使用寿命为________小时.三、解答题(本大题共6小题,共70分)18.(10分)某产品的广告支出x(单位:万元)与销售收入y(单位:万元)之间有下表所对应的数据:广告支出x(单位:万元) 1 2 3 4销售收入y(单位:万元) 12 28 42 56(1)(2)求出y对x的回归直线方程;(3)若广告费为9万元,则销售收入约为多少万元?19.(12分)为了了解学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)学生跳绳次数的中位数落在哪个小组内?(2)第二小组的频率是多少?样本容量是多少?(3)若次数在110以上(含110次)为良好,试估计该学校全体高一学生的良好率是多少?20.(12分)从一批苹果中,随机抽取50个,其重量(单位:克)的频数分布表如下:分组(重量) [80,85) [85,90) [90,95) [95,100)频数(个) 5 10 20 15(2)用分层抽样的方法从重量在[80,85)和[95,100)的苹果中共抽取4个,其中重量在[80,85)的有几个?(3)在(2)中抽出的4个苹果中,任取2个,求重量在[80,85)和[90,100)中各有1个的概率.21.(12分)随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查了10个家庭,得数据如下:家庭编号 1 2 3 4 5 6 7 8 9 10x i收入)0.8 1.1 1.3 1.5 1.5 1.8 2.0 2.2 2.4 2.8千元y i(支出)0.7 1.0 1.2 1.0 1.3 1.5 1.3 1.7 2.0 2.5千元(1)(2)若二者线性相关,求回归直线方程.22成绩1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90(单位m)人数 2 3 2 3 4 1 1 1;(2)分析这些数据的含义.23.(12分)农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种麦苗的试验田中各抽取6株麦苗测量麦苗的株高,数据如下:(单位:cm)甲:9,10,11,12,10,20乙:8,14,13,10,12,21.(1)在右面给出的方框内绘出所抽取的甲、乙两种麦苗株高的茎叶图;(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗的长势情况.第2章《统计》单元检测(A)解答一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.从某年级1 000名学生中抽取125名学生进行体重的统计分析,就这个问题来说,下列说法正确的是()A.1 000名学生是总体B.每个被抽查的学生是个体C.抽查的125名学生的体重是一个样本D.抽取的125名学生的体重是样本容量[答案] C[解析] 在初中学过:“在统计中,所有考察对象的全体叫做总体,其中每一个所要考察的对象叫做个体,从总体中抽取的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本容量.”因此题中所指的对象应是体重,故A、B错误,样本容量应为125,故D错误.2.为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样[答案] C[解析] 由分层抽样的定义知,合理的抽样方法是分层抽样,要按学段分层,故选C.3.为了调查参加运动会的500名运动员的身高情况,从中抽查了50名运动员的身高,就这个问题来说,下列说法正确的是()A.50名运动员是总体B.每个运动员是个体C.抽取的50名运动员是样本D.样本容量是50[答案] D[解析] 在这个问题中所要考察的对象是身高,另一方面,样本容量是指样本中的个体数目.4.某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个.命中个数的茎叶图如右图,则下面结论中错误的一个是()A.甲的极差是29 B.乙的众数是21C.甲罚球命中率比乙高D.甲的中位数是24[答案] D[解析] 甲的极差是37-8=29;乙的众数显然是21;甲的平均数显然高于乙,即C成立;甲的中位数应该是22+242=23.5.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图1;对变量u,v 有观测数据(u i,v i)(i=1,2,…,10),得散点图2.由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关[答案] C[解析] 由点的分布知x与y负相关,u与v正相关.6.高三某班有学生56人,现将所有同学随机编号,用系统抽样的方法抽取一个容量为4的样本,已知5号、33号、47号学生在样本中,则样本中还有一个学生的编号为()A.13 B.17 C.19 D.21[答案] C[解析] 用系统抽样法从56名学生中抽取4人,则分段间隔为14,若第一段抽出的号为5,则其他段抽取的号应为:19,33,47,故选C.7.两个变量之间的相关关系是一种()A.确定性关系B.线性关系C.非确定性关系D.非线性关系[答案] C8.下列有关线性回归的说法,不正确的是()A.相关关系的两个变量不一定是因果关系B.散点图能直观地反映数据的相关程度C.回归直线最能代表线性相关的两个变量之间的关系D.任一组数据都有回归直线方程[答案] D[解析]根据两个变量具有相关关系的概念,可知A正确,散点图能直观地描述呈相关关系的两个变量的相关程度,且回归直线最能代表它们之间的相关关系,所以B、C正确.只有线性相关的数据才有回归直线方程,所以D不正确.9.某年级有1 000名学生,现从中抽取100人作为样本,采用系统抽样的方法,将全体学生按照1~1 000编号,并按照编号顺序平均分成100组(1~10号,11~20号,…,991~1 000号).若从第1组抽出的编号为6,则从第10组抽出的编号为()A.86 B.96 C.106 D.97[答案] B[解析] 由题意,可知系统抽样的组数为100,间隔为10,由第一组抽出的号码为6,则由系统抽样的法则,可知第n组抽出个数的号码应为6+10(n-1),所以第10组应抽出的号码为6+10×(10-1)=96.10.从存放号码分别为1,2,…,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:卡片号码 1 2 3 4 5 6 7 8 9 10取到的次数13 8 5 7 6 13 18 10 11 9A.0.53 B.0.5 C.0.47 D.0.37 [答案] A[解析]1100(13+5+6+18+11)=0.53.11.观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿的体重在[2 700,3 000]的频率为()A.0.001 B.0.01 C.0.003 D.0.3[答案] D[解析] 频率=频率组距×组距,由图易知:频率组距=0.001,组距=3 000-2 700=300,∴频率=0.001×300=0.312.下图是根据《**统计年鉴2010》中的资料作成的2000年至2009年某省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到2000年至2009年我省城镇居民百户家庭人口数的平均数为( )A .304.6B .303.6C .302.6D .301.6 [答案] B二、填空题(本大题共4小题,每小题5分,共20分)13.已知一个回归直线方程为y ^=1.5x +45(x i ∈{1,5,7,13,19}),则y =________. [答案] 58.5[解析] 回归直线方程为y ^=1.5x +45经过点(x ,y ),由x =9,知y =58.5. 14.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为________. [答案] 15[解析] 由题意知,青年职工人数中年职工人数老年职工人数=350250150=753.由样本中青年职工为7人得样本容量为15.15.某市居民2005~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)年份 2005 2006 2007 2008 2009 收入x 11.5 12.1 13 13.3 15 支出Y6.88.89.81012家庭年平均收入与年平均支出有________线性相关关系. [答案] 13 正16.某公司有员工49人,其中30岁以上的员工有14人,没超过30岁的员工有35人,为了解员工的健康情况,用分层抽样方法抽一个容量为7的样本,其中30岁以上的员工应抽取________人.[答案] 217.某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示.现在用分层抽样方法从三个分厂生产的产品中共抽取100件做使用寿命的测试,则第一分厂应抽取的产品件数为________.由所得样品的测试结果计算出一、二、三分厂取出的产品的使用寿命平均值分别为1 020小时、980小时、1 030小时,估计这个企业所生产的该产品的平均使用寿命为________小时.[答案] 50 1015[解析]第一分厂应抽取的产品件数为100×50%=50.该产品的平均使用寿命为1 020×0.5+980×0.2+1 030×0.3=1 015(小时).三、解答题(本大题共6小题,共70分)18.(10分)某产品的广告支出x(单位:万元)与销售收入y(单位:万元)之间有下表所对应的数据:广告支出x(单位:万元) 1 2 3 4销售收入y(单位:万元) 12 28 42 56(1)(2)求出y对x的回归直线方程;(3)若广告费为9万元,则销售收入约为多少万元?解(1)作出的散点图如图所示(2)序号x y x2xy1 1 12 1 122 2 28 4 563 3 42 9 1264 4 56 16 224∑10 138 30 418易得x =52,y =692,所以b ^=∑4i =1x i y i-4x y ∑4i =1x 2i-4x 2=418-4×52×69230-4×⎝ ⎛⎭⎪⎫522=735,a ^=y -b ^x =692-735×52=-2. 故y 对x 的回归直线方程为y ^=735x -2.(3)当x =9时,y ^=735×9-2=129.4.故当广告费为9万元时,销售收入约为129.4万元.19.(12分)为了了解学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)学生跳绳次数的中位数落在哪个小组内? (2)第二小组的频率是多少?样本容量是多少?(3)若次数在110以上(含110次)为良好,试估计该学校全体高一学生的良好率是多少?解 (1)∵前三组的频率和为2+4+1750=2350<12,前四组的频率之和为2+4+17+1550=3850>12,∴中位数落在第四小组内.(2)频率为:42+4+17+15+9+3=0.08,又∵频率=第二小组频数样本容量,∴样本容量=频数频率=120.08=150.(3)由图可估计所求良好率约为:17+15+9+32+4+17+15+9+3×100%=88%.20.(12分)从一批苹果中,随机抽取50个,其重量(单位:克)的频数分布表如下:分组(重量) [80,85) [85,90) [90,95) [95,100) 频数(个)5102015(1)根据频数分布表计算苹果的重量在[90,95)的频率;(2)用分层抽样的方法从重量在[80,85)和[95,100)的苹果中共抽取4个,其中重量在[80,85)的有几个?(3)在(2)中抽出的4个苹果中,任取2个,求重量在[80,85)和[90,100)中各有1个的概率.解:(1)由题意知苹果的样本总数n =50,在[90,95)的频数是20,所以苹果的重量在[90,95)的频率是2050=0.4.(2)设从重量在[80,85)的苹果中抽取x 个,则从重量在[95,100)的苹果中抽取(4-x)个.因为表格中[80,85),[95,100)的频数分别是5,15,所以515=x (4-x),解得x =1.即重量在[80,85)的有1个.(3)在(2)中抽出的4个苹果中,重量在[80,85)的有1个,记为a ,重量在[95,100)的有3个,记为b 1,b 2,b 3,任取2个,有ab 1,ab 2,ab 3,b 1b 2,b 1b 3,b 2b 3共6种不同方法.重量在[80,85)和[95,100)中各有1个的事件记为A ,事件A 包含的基本事件为ab 1,ab 2,ab 3,共3个,由古典概型的概率计算公式得P(A)=36=12.21.(12分)随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查了10个家庭,得数据如下:家庭编号 1 2 3 4 5 6 7 8 9 10 x i 收入)千元 0.8 1.1 1.3 1.5 1.5 1.8 2.0 2.2 2.4 2.8y i (支出)千元0.7 1.0 1.2 1.0 1.3 1.5 1.3 1.7 2.0 2.5(1)(2)若二者线性相关,求回归直线方程.解 (1)作出散点图:观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系.(2)x =110(0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74,y =110(0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)=1.42,∑10i =1x i y i =27.51,∑10i =1x 2i=33.72, b ^=∑10i =1x i y i -10x y ∑10i =1x 2i-10x 2≈0.813 6,a ^=1.42-1.74×0.813 6≈0.004 3,∴回归方程为y ^=0.813 6x +0.004 3.22成绩 (单位m) 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90 人数23234111; (2)分析这些数据的含义.解 (1)在17个数据中,1.75出现了4次,次数最多,即众数是1.75; 把成绩从小到大排列,中间一个数即第9个数据是1.70中的一个,即中位数是1.70;平均数x =117(1.50×2+1.60×3+…+1.90×1)≈1.69(m)因此,17名运动员成绩的众数、中位数、平均数依次为1.75 m ,1.70 m,1.69 m.(2)众数是1.75说明了跳1.75 m 的人数最多;中位数是1.70 m 说明了1.70 m 以下和1.70 m 以上的成绩个数相等;平均数是1.69 m 说明了所有参赛运动员平均成绩是1.69 m.23.(12分)农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种麦苗的试验田中各抽取6株麦苗测量麦苗的株高,数据如下:(单位:cm)甲:9,10,11,12,10,20 乙:8,14,13,10,12,21.(1)在右面给出的方框内绘出所抽取的甲、乙两种麦苗株高的茎叶图; (2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗的长势情况.解 (1)茎叶图如图所示:(2)x 甲=9+10+11+12+10+206=12,x 乙=8+14+13+10+12+216=13,s 2甲=16×[(9-12)2+(10-12)2+(11-12)2+(12-12)2+(10-12)2+(20-12)2]≈13.67,s 2乙=16×[(8-13)2+(14-13)2+(13-13)2+(10-13)2+(12-13)2+(21-13)2]≈16.67.因为x 甲<x 乙,所以乙种麦苗平均株高较高,又因为s 2甲<s 2乙,所以甲种麦苗长的较为整齐.。

(易错题)高中数学必修三第一章《统计》检测卷(含答案解析)(3)

(易错题)高中数学必修三第一章《统计》检测卷(含答案解析)(3)

一、选择题1.某校举行演讲比赛,9位评委给选手A 打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若统计员计算无误,则数字x 应该是( )A .5B .4C .3D .22.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是( )A .成绩B .视力C .智商D .阅读量3.图1是某学习小组学生数学考试成绩的茎叶图,1号到16号的同学的成绩依次为1A ,216,,A A ,图2是统计茎叶图中成绩在一定范围内的学生情况的程序框图,那么该程序框图输出的结果是( )A .10B .6C .7D .164.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差D .极差5.已知一组数据的茎叶图如图所示,则该组数据的平均数为( )A .85B .84C .83D .816.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( ) x 8 10 11 12 14 y2125m2835A .26B .27C .28D .297. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日8.学校为了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:将阅读时间不低于30分钟的观众称为“阅读霸”,则下列命题正确的是( ) A .抽样表明,该校有一半学生为阅读霸 B .该校只有50名学生不喜欢阅读 C .该校只有50名学生喜欢阅读 D .抽样表明,该校有50名学生为阅读霸9.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9C .y =1.9x +1.04D .y =1.05x -0.910.如图是两组各7名同学体重(单位:kg )数据的茎叶图,设1、2两组数据的平均数依次为1x 和2x ,标准差依次为12s s 、,那么( )(注:标准差222121[()()...()]n s x x x x x x n=-+-++-A .1212,x x s s >>B .1212,x x s s ><C .1212,x x s s <<D .1212,x x s s11.甲、乙两名同学在五次数学考试中的成绩统计如下面的茎叶图所示,若甲、乙两人的平均成绩分别是1x ,2x ,观察茎叶图,下列结论正确的是( )A .12x x <,乙比甲成绩稳定B .12x x >,乙比甲成绩稳定C .12x x <,甲比乙成绩稳定D .12x x >,甲比乙成绩稳定12.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响.对近8年的年宣传费i x 和年销售量()1,2,...8i y i =数据作了初步处理,得到下面的散点图及一些统计量的值.有下列5个曲线类型:①ˆˆy bxa =+;②y x d =+;③ln y p q x =+;④21k xy k e =+;⑤212y c x c =+,则较适宜作为年销售量y 关于年宣传费x 的回归方程的是( ) A .①②B .②③C .②④D .③⑤二、填空题13.已知数据1x ,2x ,…,10x 的方差为1,且()()()222123222x x x -+-+-()2102170x ++-=,则数据1x ,2x ,…,10x 的平均数是________.14.福利彩票“双色球”中红色球由编号为01,02,…,33的33个个体组成,某彩民利用下面的随机数表(下表是随机数表的第一行和第二行)选取6个红色球,选取方法是从随机数表中第1行的第6列和第7列数字开始,由左到右依次选取两个数字,则选出来的第3个红色球的编号为______.49 54 43 54 82 17 37 93 23 28 87 35 20 56 43 84 26 34 91 6457 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7615.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.16.某高中有高一学生320人,高二学生400人,高三学生360人.现采用分层抽样调查学生的视力情况.已知从高一学生中抽取了8人,则三个年级一共抽取了__________人。

人教A版必修3统计单元测试(三套含解析)

人教A版必修3统计单元测试(三套含解析)

(一)一、选择题(共12小题,每小题5.0分,共60分)1.有下列关系:(1)人的年龄与他(她)体内脂肪含量之间的关系;(2)曲线上的点与该点的坐标之间的关系;(3)红橙的产量与气候之间的关系;(4)学生与他(她)的学号之间的关系.其中有相关关系的是()A. (1)(2)B. (1)(3)C. (1)(4)D. (3)(4)2.在抽样过程中,每次抽取的个体不再放回总体的为不放回抽样.在简单随机抽样、系统抽样、分层抽样中,为不放回抽样的有()A. 1个B. 2个C. 3个D. 0个3.为调查某中学学生平均每人每天参加体育锻炼时间X(单位:分钟),按锻炼时间分下列四种情况统计:①0~10分钟;②10~20分钟;③20~30分钟;④30分钟以上.有2 000名中学生参加了此项活动.下表是此次调查中的频数分布表.国家规定中学生每天参加体育锻炼时间达到30分钟以上者,才能保持良好健康的身体发展,则平均每天保持良好健康的身体发展的学生的频率是()A. 0.1B. 0.2C. 0.3D. 0.44.在由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的点所构成的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-2x+1上,则这组样本数据中变量x,y的相关系数为()A.-2B.-1C. 1D. 25.已知具有线性相关的两个变量x,y之间的一组数据如表:且线性回归方程是错误!未找到引用源。

=0.95x+2.6,则t等于()A. 6.7B. 6.6C. 6.5D. 6.46.如图是甲、乙两名运动员某赛季6个场次得分的茎叶图,用错误!未找到引用源。

甲、错误!未找到引用源。

乙分别表示甲乙得分的平均数,则下列说法正确的是()A.错误!未找到引用源。

甲>错误!未找到引用源。

乙且甲得分比乙稳定B.错误!未找到引用源。

甲=错误!未找到引用源。

乙且乙得分比甲稳定C.错误!未找到引用源。

(好题)高中数学必修三第一章《统计》测试题(包含答案解析)(1)

(好题)高中数学必修三第一章《统计》测试题(包含答案解析)(1)

一、选择题1.为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如下图),已知从左到右各长方形高的比为2:3:5:6:3:1,则该班学生数学成绩在(80,100)之间的学生人数是( )A .32B .27C .24D .332.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元3.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+4.某赛季甲、乙两名篮球运动员每场比赛得分用茎叶图表示,茎叶图中甲得分的部分数据丢失(如图),但甲得分的折线图完好,则下列结论正确的是( )A .甲得分的极差是11B .乙得分的中位数是18.5C .甲运动员得分有一半在区间[]20,30上D .甲运动员得分的平均值比乙运动员得分的平均值高5.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差D .极差6.某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则42x y +的值是( )A .12B .14C .16D .187.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( ) x 8 10 11 12 14 y2125m2835A .26B .27C .28D .298.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .9.已知某8个数的平均数为3,方差为2,现加入一个新数据3,此时这9个数的平均数为x ,方差为2s ,则( ) A .3x =,22s < B .3x =,22s > C .3x >,22s <D .3x >,22s >10.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( ) A .10B .11C .12D .1311.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位12.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为 A .12B .14C .16D .18二、填空题13.如图是某地区2018年12个月的空气质量指数以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述正确的是______.①2月相比去年同期变化幅度最小,3月的空气质量指数最高;②第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小; ③第三季度空气质量指数相比去年同期变化幅度的方差最小; ④空气质量指数涨幅从高到低居于前三位的月份为6、8、4月.14.水痘是一种传染性很强的病毒性疾病,容易在春天爆发,武汉疾控中心为了调查某高校高一年级学生注射水痘疫苗的人数,在高一年级随机抽取了5个班级,每个班级的人数互不相同,若把每个班抽取的人数作为样本数据,已知样本平均数为5,样本方差为4,则样本数据中最大值为__________.15.已知一组数据6,7,8,x ,y 的平均数是8,且90xy =,则该组数据的方差为_______. 16.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________. 17.给出下列命题:①若函数()y f x =满足(1)(1)f x f x -=+,则函数()f x 的图象关于直线1x =对称; ②点(2,1)关于直线10x y -+=的对称点为(0,3);③通过回归方程y bx a =+可以估计和观测变量的取值和变化趋势;④正弦函数是奇函数,2()sin(1)f x x =+是正弦函数,所以2()sin(1)f x x =+是奇函数,上述推理错误的原因是大前提不正确. 其中真命题的序号是__________.18.某校对全校1200名男女学生进行健康调查,采用分层抽样法抽取一个容量为200的样本,已知女生抽了95人,则该校的男生数是__________.19.已知某产品连续4个月的广告费i x (千元)与销售额i y (万元)(1,2,3,4i =),经过对这些数据的处理,得到如下数据信息:①441118,14ii i i xy ====∑∑;②广告费用x 和销售额y 之间具有较强的线性相关关系;③回归直线方程y bx a =+中的0.8b =. 那么广告费用为6千元时,则可预测销售额约为__________万元.20.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b+的最小值为__________.三、解答题21.某北方村庄4个草莓基地,采用水培阳光栽培方式种植的草莓个大味美,一上市便成为消费者争相购买的对象.光照是影响草莓生长的关键因素,过去50年的资料显示,该村庄一年当中12个月份的月光照量X (小时)的频率分布直方图如下图所示(注:月光照量指的是当月阳光照射总时长).(1)求月光照量X (小时)的平均数和中位数;(2)现准备按照月光照量来分层抽样,抽取一年中的4个月份来比较草莓的生长状况,问:应在月光照量[160,240)X ∈,[240,320)X ∈,[320,400]X ∈的区间内各抽取多少个月份?(3)假设每年中最热的5,6,7,8,9,10月的月光照量X 是大于等于240小时,且6,7,8月的月光照量X 是大于等于320小时,那么,从该村庄2018年的5,6,7,8,9,10这6个月份之中随机抽取2个月份的月光照量进行调查,求抽取到的2个月份的月光照量X (小时)都不低于320的概率.22.潜叶蝇是南方地区水稻容易遭受的虫害之一,成虫将虫卵产在叶片里,待虫卵孵化之后幼虫会在叶片中啃叶肉,使得秧苗的叶片呈现白色的状态,进而降低水稻产量.经研究,每只潜叶蝇的平均产卵数y 和夏季平均温度x 有关,现收集了某地区以往6年的数据,得到下面数据统计表格. 平均温度C i x ︒ 21 23 25 27 29 31 平均产卵数i y 个711212264115(Ⅰ)根据相关系数r 判断,潜叶蝇的平均产卵数y 与平均温度x 是否具有较强的线性相关关系,若有较强的线性相关关系,求出线性回归方程y bx a =+,若没有较强的线性相关关系,请说明理由(一般情况下,当0.75r >时,可认为变量有较强的线性相关关系);(Ⅱ)根据以往的统计,该地区夏季平均气温为()C ξ︒近似地服从正太分布()226.5,N σ,且()125282P ξ<≤=.当该地区某年平均温度达到28C ︒以上时,潜叶蝇快速繁殖引发虫害,需要进行一次人工治理,每次的人工治理成本为200元/公顷(其他情况均不需要人工治理),且虫害一定会导致水稻减产,对过往10次爆发虫害时的减产损失进行统计,结果如下: 每次虫害减产损失(元/公顷)10001400用样本的频率估计概率,预测未来2年,每公顷水稻可能因潜叶蝇虫害造成的经济损失Y (元)的数学期望.(经济损失=减产损失+治理成本) 参考公式和数据:()()ni i x xy yr --=∑()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-()()61700iii x x y y =--=∑,6214126ii x==∑,61240i i y==∑,()6218816i i y y=-=∑,8.4≈786≈.23. 2.5PM 是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与 2.5PM 的浓度是否相关,现采集到某城市周一至周五某时间段车流量与2.5PM 浓度的数据如下表:(1)根据上表数据,求出这五组数据组成的散点图的样本中心坐标; (2)用最小二乘法求出y 关于x 的线性回归方程y bx a =+;(3)若周六同一时间段车流量是100万辆,试根据(2)求出的线性回归方程预测,此时2.5PM 的浓度是多少?(参考公式:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-)24.经销商小王对其所经营的某一型号二手汽车的使用年数(010)x x <≤与销售价格y (单位:万元/辆)进行整理,得到如下的对应数据: (1)试求y 关于x 的回归直线方程;(2)已知每辆该型号汽车的收购价格为20.05 1.7517.2=-+w x x 万元,根据(1)中所求的回归方程,预测x 为何值时,小王销售一辆该型号汽车所获得的利润z 最大.附:回归方程ˆybx a =+中,1221ˆˆˆˆ,ni ii nii x ynx y b ay bx xnx -=-==--∑∑ 25.某校为了了解甲、乙两班的数学学习情况,从两班各抽出10名学生进行数学水平测试,成绩如下(单位:分):甲班:82 84 85 89 79 80 91 89 79 74 乙班:90 76 86 81 84 87 86 82 85 83 (1)求两个样本的平均数; (2)求两个样本的方差和标准差; (3)试分析比较两个班的学习情况.26.某市举办了一次“诗词大赛”,分预赛和复赛两个环节,已知共有20000名学生参加了预赛,现从参加预赛的全体学生中随机地抽取100人的预赛成绩作为样本,得到如下的统计数据.地抽取2人,求恰有1人预赛成绩优良的概率;(2)由样本数据分析可知,该市全体参加预赛学生的预赛成绩Z 服从正态分布()2,N μσ,其中μ可近似为样本中的100名学生预赛成绩的平均值(同一组数据用该组数据的中间值代替),且2361σ=.利用该正态分布,估计全市参加预赛的全体学生中预赛成绩不低于72分的人数;(3)预赛成绩不低于91分的学生将参加复赛,复赛规则如下: ①参加复赛的学生的初始分都设置为100分;②参加复赛的学生可在答题前自己决定答题数量n ,每一题都需要“花”掉一定分数来获取答题资格(即用分数来买答题资格),规定答第k 题时“花”掉的分数为()0.21,2,k k n =; ③每答对一题得2分,答错得0分;④答完n 题后参加复赛学生的最终分数即为复赛成绩.已知学生甲答对每道题的概率均为0.75,且每题答对与否都相互独立,则当他的答题数量n 为多少时,他的复赛成绩的期望值最大?参考数据:若()2~,Z Nμσ,则() 6.827P Z μσμσ-<<+≈,()220.9545P Z μσμσ-<<+≈,()330.9973P Z μσμσ-<<+≈【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【详解】高的比就是频率的比,所以各区间上的频率可依次设为2x,3x,5x,6x,3x,x,,同它们的和为1235631,20x x x x x x x +++++=∴=,所以该班学生数学成绩在[80,100)之间的学生人数是1(56)6011603320x +⨯⨯=⨯⨯=,故选D 2.C解析:C 【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.3.D解析:D 【分析】根据散点图的分布可选择合适的函数模型. 【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+. 故选:D. 【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.4.D解析:D 【分析】根据茎叶图和折线图依次判断每个选项得到答案.A. 甲得分的极差是28919-=,A 错误;B. 乙得分的中位数是161716.52+=,B 错误; C. 甲运动员得分在区间[]20,30上有3个,C 错误; D. 甲运动员得分的平均值为:912131315202628178+++++++=,乙运动员得分的平均值为:914151617181920168+++++++=,故D 正确.故选:D . 【点睛】本题考查了茎叶图和折线图,意在考查学生的计算能力和理解能力.5.A解析:A 【分析】可不用动笔,直接得到答案,亦可采用特殊数据,特值法筛选答案. 【详解】设9位评委评分按从小到大排列为123489x x x x x x ≤≤≤≤≤.则①原始中位数为5x ,去掉最低分1x ,最高分9x ,后剩余2348x x x x ≤≤≤,中位数仍为5x ,∴A 正确. ②原始平均数1234891()9x x x x x x x =+++++,后来平均数234817x x x x x '=+++()平均数受极端值影响较大,∴x 与x '不一定相同,B 不正确 ③()()()222219119S x x x x x x ⎡⎤=-+-++-⎣⎦()()()222223817s x x x x x x ⎡⎤'=-'+-'++-'⎢⎥⎣⎦由②易知,C 不正确.④原极差91=x -x ,后来极差82=x -x 可能相等可能变小,D 不正确. 【点睛】本题旨在考查学生对中位数、平均数、方差、极差本质的理解.6.A解析:A 【分析】由题,中位数为12,求得4x y +=,再求得平均数,利用总体标准差最小和基本不等式求得x ,y 的值,即可求得答案.由题,因为中位数为12,所以242x yx y +=∴+= 数据的平均数为:1(22342019192021)11.410x y ++++++++++= 要使该总体的标准最小,即方差最小,所以222222.8(1011.4)(1011.4)( 1.4)( 1.4)2()0.722x y x y x y +-+-++-=-+-≥= 当且紧当 1.4 1.4x y -=-,取等号,即2x y ==时,总体标准差最小 此时4212x y += 故选A 【点睛】本题考查了茎叶图,熟悉茎叶图,清楚中位数、标准差的求法是解题的关键,属于中档题型.7.A解析:A 【解析】 【分析】首先求得x 的平均值,然后利用线性回归方程过样本中心点求解m 的值即可. 【详解】 由题意可得:810111214115x ++++==,由线性回归方程的性质可知:99112744y =⨯+=, 故21252835275m++++=,26m ∴=.故选:A . 【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x 与y 之间的关系,这条直线过样本中心点.8.D解析:D 【解析】 【分析】 先计算,代入回归直线方程,可得,从而可求得结果.【详解】因为,所以, 代入回归直线方程可求得, 所以, 故选D.【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.9.A解析:A【分析】由题意计算出加入新数据后的平均数,然后比较方差【详解】()18138x x +⋯+=, ()181339x x +⋯++=, 3x ∴=,由方差的定义可知加入新数据3,样本数据会变得更加稳定故22s <故选A【点睛】本题主要考查了加入数据后平均数和方差的变化,代入公式计算出结果,较为基础 10.C解析:C【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n =30n ﹣19,由401≤30n ﹣21≤755,求得正整数n 的个数,即可得出结论.【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列, 又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,∴等差数列的通项公式为a n =11+(n ﹣1)30=30n ﹣19,由401≤30n ﹣19≤755,n 为正整数可得14≤n ≤25,∴做问卷C 的人数为25﹣14+1=12,故选C .【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.11.C解析:C【解析】【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论.【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位,即减少1.5个单位,故选C.【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目. 12.C解析:C【解析】【分析】根据分层抽样的定义求出在各层中的抽样比,即样本容量比上总体容量,按此比例求出在高三年级中抽取的人数.【详解】 根据题意得,用分层抽样在各层中的抽样比为421105020=, 则在高三年级抽取的人数是14001625⨯=人, 故选C.【点睛】该题所考查的是有关分层抽样的问题,在解题的过程中,需要明确无论采用哪种抽样方法,都必须保证每个个体被抽到的概率是相等的,所以注意成比例的问题. 二、填空题13.①②③【分析】根据折线的变化率得到相比去年同期变化幅度、升降趋势逐一验证即可【详解】根据折现统计图可得2月相比去年同期变化幅度最小3月的空气质量指数最高故①正确;第一季度的空气质量指数的平均值最大第 解析:①②③【分析】根据折线的变化率,得到相比去年同期变化幅度、升降趋势,逐一验证即可.【详解】根据折现统计图可得,2月相比去年同期变化幅度最小,3月的空气质量指数最高,故①正确;第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小,故②正确;第三季度空气质量指数相比去年同期变化幅度的方差最小,故③正确;空气质量指数涨幅从高到低居于前三位的月份为6、8、9月,故④错误,故答案为:①②③.【点睛】本题考查条形统计图和折线图的应用,重点考查数据分析,从表中准确获取信息是关键,属于中档题型.14.8【分析】先设五个班的人数分别为样本平均数为5又因样本方差为4则代入大于且不相等的整数可得的值依次为24568即可得最大值【详解】解:设五个班的人数分别为则则所以的值依次为24568即有最大值为8故解析:8【分析】先设五个班的人数分别为1a ,2a ,3a ,4a ,5a ,样本平均数为5,1234525a a a a a ++++=,又因样本方差为4,则()()()()()22222123455555520a a a a a -+-+-+-+-=,代入大于0且不相等的整数,可得1a ,2a ,3a ,4a ,5a 的值依次为2,4,5,6,8,即可得最大值.【详解】解:设五个班的人数分别为1a ,2a ,3a ,4a ,5a , 则()12345155a a a a a ++++=, 15()()()()()2222212345555554a a a a a ⎡⎤-+-+-+-+-=⎣⎦, 则1234525a a a a a ++++=,()()()()()22222123455555520a a a a a -+-+-+-+-=,所以1a ,2a ,3a ,4a ,5a 的值依次为2,4,5,6,8,即有最大值为8.故答案为: 8【点睛】 本题考查利用平均数公式和方差公式求样本数据中的最大值,是基础题.合理应用公式是关键. 15.2【分析】根据题意列出关于的等量关系式结合求得的值利用方差公式求得结果【详解】一组数据的平均数是8且所以化简得又所以的值分别为或所以该组数据的方差为:故答案是:2【点睛】该题考查的是有关求一组数据的 解析:2【分析】根据题意,列出关于,x y 的等量关系式,结合90xy =,求得,x y 的值,利用方差公式求得结果.【详解】一组数据6,7,8,,x y 的平均数是8,且90xy =,所以6788540x y ++++=⨯=,化简得19x y +=,又90xy =,所以,x y 的值分别为10,9或9,10,所以该组数据的方差为:222222110[(68)(78)(88)(98)(108)]255s =-+-+-+-+-==, 故答案是:2.【点睛】该题考查的是有关求一组数据的方差的问题,涉及到的知识点有方差公式,属于简单题目. 16.2【解析】【分析】根据系统抽样的概念结合可得最后结果为2【详解】学生总数不能被容量整除根据系统抽样的方法应从总体中随机剔除个体保证整除∵故应从总体中随机剔除个体的数目是2故答案为2【点睛】本题主要考 解析:2【解析】【分析】根据系统抽样的概念结合2544262=⨯+,可得最后结果为2.【详解】学生总数不能被容量整除,根据系统抽样的方法,应从总体中随机剔除个体,保证整除. ∵2544262=⨯+,故应从总体中随机剔除个体的数目是2,故答案为2.【点睛】本题主要考查系统抽样,属于基础题;从容量为N 的总体中抽取容量为n 的样本,系统抽样的前面两个步骤是:(1)将总体中的N 个个体进行编号;(2)当N n 为整数时,抽样距即为N n ;当N n不是整数时,从总体中剔除一些个体,使剩下的总体中的个体的个数N '能被n 整除.17.②③【解析】分析:根据函数的周期性可判断①;根据垂直平分线的几何特征可判断②;根据回归直线的实际意义可判断③;根据演绎推理及正弦函数的定义可判断④详解:①若函数满足则函数是周期为2的周期函数但不一定解析:②③【解析】分析:根据函数的周期性,可判断① ;根据垂直平分线的几何特征,可判断②;根据回归直线的实际意义,可判断③;根据演绎推理及正弦函数的定义,可判断④.详解:①若函数()y f x =满足()()11f x f x -=+,则函数()f x 是周期为2的周期函数,但不一定具有对称性,①错误;②点()()2,1?0,3确定直线的斜率为1-,与直线 10x y -+=垂直,且中点()1,2在直线10x y -+=上,故点()()2,1?0,3关于直线10x y -+=的对称,②正确;③通过回归方程ˆˆˆy bx a =+可以估计和观测变量的取值和变化趋势,③正确;④正弦函数是奇函数,()()2sin 1f x x =+是正弦函数,所以()()2sin 1f x x =+是奇函数,上述推理错误的原因是小前提不正确,④错误,故答案为②③.点睛:本题主要通过对多个命题真假的判断,主要综合考查函数的周期性、点关于直线对称、以及回归分析与“三段论”,属于难题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.18.630【解析】每层的抽样比为女生抽了95人所以男生抽取105人因此共有男生人故填630解析:630【解析】 每层的抽样比为200112006=,女生抽了95人,所以男生抽取105人,因此共有男生1056630⨯=人,故填630.19.【解析】因此解析:4.7【解析】18914779,0.80.1424222ˆx y a ====∴=-⨯=- 因此0.860.1 4.7y =⨯-= 20.2【解析】由茎叶图及10个班级的得分的平均数是90可得∴当且仅当即时取等号故答案为2解析:2【解析】由茎叶图及10个班级的得分的平均数是90可得8a b += ∴1911919191()()(19)(10)(1023)28888b a b a a b a b a b a b a b +=⨯++=+++=++≥+⨯=,当且仅当9b a a b=,即36b a ==时,取等号 故答案为2 三、解答题21.(1)平均数为260(小时);中位数为240(小时)(2)2,1,1(3)15 【分析】(1)利用各频率之和为1,计算出a ,然后根据频率分布直方图以及平均数,中位数的求法,可得结果.(2)根据月光照量[160,240)X ∈、[240,320)X ∈、[320,400]X ∈的频率之比为111::244,结合分层抽样的方法,可得结果. (3)采用列举法,将“6个月份之中随机抽取2个月份”所有情况列举出来,并计算“抽取到的2个月份的月光照量X (小时)都不低于320”的个数,结合古典概型可得结果.【详解】(1)根据各频率之和为1,则0.062580()801a a ⨯++⨯=,解得0.003125a =.月光照量X (小时)的平均数为()802000.00625+2800.0031253600.003125X =⨯⨯+⨯ 所以260X =(小时)设月光照量X (小时)的中位数为0X ,则0[240,320]X ∈.根据中位数的定义,其左右两边的频率相等,都为0.5,可得()00.00625802400.0031250.5X ⨯+-⨯=,解得0240X =.所以月光照量X (小时)的中位数为240(小时).(2)因为月光照量[160,240)X ∈、[240,320)X ∈、[320,400]X ∈的频率之比为111::244, 所以若准备按照月光照量来分层抽样,抽取一年中的4个月份来比较草莓的生长状况,那么,抽取的月光照量[160,240)X ∈,[240,320)X ∈,[320,400]X ∈的月份数分别为11142,41,41244⨯=⨯=⨯=. (3)由题意,月光照量[240,320)X ∈的有5,9,10月, 月光照量[320,400]X ∈的有6,7,8月,故从该村庄2018年的5,6,7,8,9,10月份之中随机抽取2个月份的月光照量X (小时)进行调查,所有的情况有:(5,9),(5,10),(5,6),(5,7),(5,8);(9,10),(9,6),(9,7),(9,8);(10,6),(10,7),(10,8);(6,7),(6,8);(7,8)共15种;其中,抽取到的2个月份的月光照量X (小时)都不低于320的情况有:(6,7),(6,8),(7,8)共3种;故所抽取到的2个月份的月光照量X (小时)都不低于320的概率31155P ==. 【点睛】 本题考查频率分布直方图中平均数,中位数的计算,以及古典概型的应用,分清题意,熟悉公式,耐心计算,属中档题.22.(Ⅰ)具有较强的线性相关关系,10220y x =-;(Ⅱ)330元【分析】(Ⅰ)代入公式计算r ,再做判断,根据公式求,b a ,即得结果;(Ⅱ)先确定温度达到28C ︒以上时概率,再确定随机变量取法,分别求出对应概率,最后根据数学期望公式求结果.【详解】(Ⅰ)21232527293171121226411526,4066x y ++++++++++=======()()7000.75786n i ix x y y r --==>=>∑ 所以潜叶蝇的平均产卵数y 与平均温度x 具有较强的线性相关关系, ()()()1217001070n i i i n i i x x y yb x x ==--===-∑∑,401026220a y bx =-=-⨯=- 10220y bx a x ∴=+=-;(Ⅱ)()12528,2P ξ<≤=()C ξ︒近似地服从正太分布()226.5,N σ, ()()12528128,24P P ξξ-<≤∴>== 0,1200,1600Y = 13141163(0)1,(1200),(1600)444101041020P Y P Y P Y ==-===⨯===⨯= 313()01200140033041020E Y =⨯+⨯+⨯=(元) 【点睛】本题考查线性回归方程、数学期望公式、正态分布,考查综合分析求解能力,属中档题. 23.(1)()54,42(2)0.72 3.12y x =+(3)75.12微克/立方米【分析】(1)求出,x y 从而得到样本点的中心;(2)利用参考公式求出()52150ii x x =-=∑,()()136n i ii x x y y =--=∑,从而得到b ,再将样本中心坐标代入求得a ,从而得到回归方程;(3)将100x =代入回方程,求出y 的值,即可得到答案.【详解】(1)5051545758394042444554,4255x y ++++++++====, 所以样本中心坐标为()54,42.(2)因为()52116991650i i x x =-=+++=∑, ()()1(4)(3)(3)(2)324336n ii i x x y y =--=-⋅-+-⋅-+⋅+⋅=∑, 所以360.7250b ==, 3.12a =, 线性回归方程为0.72 3.12y x =+.(3)0.72100 3.1275.12y =⨯+=(微克/立方米)此时 2.5PM 的浓度是75.12微克/立方米.【点睛】本题考查回归直线方程的最小二乘法求解及回归方程的应用,考查数据处理能力,求解时注意运算的准确性.24.(1) 1.4518.7y x =-+;(2)3【分析】(1)由表中数据计算x 、y ,求出ˆb、ˆa ,即可写出回归直线方程; (2)写出利润函数z y w =-,利用二次函数的图象与性质求出3x =时z 取得最大值.【详解】解:(1)由表中数据得,1(246810)65x =⨯++++=, 1(16139.57 4.5)105y =⨯++++=, 由最小二乘法求得:22222221641369.58710 4.5561058ˆ 1.452468105640b ⨯+⨯+⨯+⨯+⨯-⨯⨯-===-++++-⨯, ˆ10(1.45)618.7a=--⨯=, 所以y 关于x 的回归直线方程为 1.4518.7y x =-+;(2)根据题意,利润函数为:22( 1.4518.7)(0.05 1.7517.2)0.050.3 1.5z y w x x x x x =-=-+--+=-++, 所以,当0.332(0.05)x =-=⨯-时,二次函数z 取得最大值为1.95; 即预测3x =时,小王销售一辆该型号汽车所获得的利润z 最大.【点睛】本题考查了回归直线方程的求法,以及二次函数的图象与性质的应用,考查计算能力. 25.(1)=83.2x 甲,=84x 乙;(2)22=26.36=13.2S S 甲乙,,=5.13S 甲,=3.63S 乙;(3)乙班的总体学习情况比甲班好【解析】试题分析:每组样本数据有10个,求样本的平均数利用平均数公式,10个数的平均数等于这10个数的和除以10;比较平均分的大小可以看出两个班学生平均水平的高低,求样本的方差只需使用方差公式,求这10个数与平均数的差的平方方和再除以10;比较两组数据方差的大小就可得出两组数据的标准差的大小,标准差较小者成绩较稳定 . 试题 (1)x 甲=110×(82+84+85+89+79+80+91+89+79+74)=83. 2, x 乙=110×(90+76+86+81+84+87+86+82+85+83)=84. (2)2S 甲=110×[(82-83. 2)2+(84-83. 2)2+(85-83. 2)2+(89-83. 2)2+(79-83. 2)2+(80-83. 2)2+(91-83. 2)2+(89-83. 2)2+(79-83. 2)2+(74-83. 2)2]=26. 36, 2S 甲=110[(90-84)2+(76-84)2+(86-84)2+(81-84)2+(84-84)2+(87-84)2+(86-84)2+(82-84)2+(85-84)2+(83-84)2]=13. 2,则s 甲,s 乙≈3. 63.。

(典型题)高中数学必修三第一章《统计》检测卷(有答案解析)

(典型题)高中数学必修三第一章《统计》检测卷(有答案解析)

一、选择题1.为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如下图),已知从左到右各长方形高的比为2:3:5:6:3:1,则该班学生数学成绩在(80,100)之间的学生人数是( )A .32B .27C .24D .332.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+3.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n 个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已知学习时长在[)9,11的学生人数为25,则n 的值为( )A.40 B.50 C.80 D.1004.如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,苹果销量约占20%,三星销量约占30%).根据该图,以下结论中一定正确的是()A.华为的全年销量最大B.苹果第二季度的销量大于第三季度的销量C.华为销量最大的是第四季度D.三星销量最小的是第四季度5.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示:价格99.510.511销售量11865由散点图可知,销售量与价格之间有较强的线性相关关系,其线性回归方程是,且,则其中的()A.10 B.11 C.12 D.10.56.将某选手的7个得分去掉1个最高分,去掉1个最低分,5个剩余分数的平均分为21,现场作的7个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则5个剩余分数的方差为( )A .1167B .365C .36D .6757.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( ) x 8 10 11 12 14 y2125m2835A .26B .27C .28D .298.通过实验,得到一组数据如下:2,5,8,9,x ,已知这组数据的平均数为6,则这组数据的方差为( ) A .3.2B .4C .6D .6.59.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795B .0780C .0810D .081510.某宠物商店对30只宠物狗的体重(单位:千克)作了测量,并根据所得数据画出了频率分布直方图如下图所示,则这30只宠物狗体重(单位:千克)的平均值大约为( )A .15.5B .15.6C .15.7D .1611.甲、乙两名选手参加歌手大赛时,5名评委打的分数用如图所示的茎叶图表示,s 1,s 2分别表示甲、乙选手分数的标准差,则s 1与s 2的关系是( ).A .s 1>s 2B .s 1=s 2C .s 1<s 2D .不确定12.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表: 时间周一 周二 周三周四 周五 车流量x (万辆) 100 102 108 114 116 浓度y (微克)7880848890根据上表数据,用最小二乘法求出y 与x 的线性回归方程是( )参考公式:121()()()niii ni i x x y y b x x ==--=-∑∑,a y b x =-⋅;参考数据:108x =,84y =;A .0.6274ˆ.2yx =+ B .0.7264ˆ.2y x =+ C .0.7164ˆ.1y x =+ D .0.6264ˆ.2y x =+ 二、填空题13.某社会爱心组织面向全市征召义务宣传志愿者.现从符合条件的志愿者中随机抽取100名按年龄分组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45),得到的频率分布直方图如图所示.若从第3,4,5组中用分层抽样的方法抽取6名志愿者参与广场的宣传活动,应从第3组抽取__________名志愿者.14.对具有线性相关关系的变量x ,y 有一组观测数据()(),1,2,3,,8i i x y i =,其回归直线方程是12y x a =+,且8116i i x ==∑,8148i i y ==∑,则实数a =__________.15.通过市场调查,得到某种产品的资金投入x (单位:万元)与获得的利润y (单位:万元)的数据,如表所示: 资金投入x 2 3 4 5 6 利润y0.40.611.21.8根据表格提供的数据,用最小二乘法求线性回归直线方程为0.36ˆˆybx =-,现投入资金15万元,求获得利润的估计值(单位:万元)为_____________.16.对两个变量y 和x 进行回归分析,得到一组样本数据()11,x y ,()22,x y ,…,(),n n x y ,则下列说法中正确的序号是______.①由样本数据得到的回归直线方程y bx a =+必过样本点的中心 ②残差平方和越小的模型,拟合的效果越好③用相关指数2R 来刻画回归效果,2R 越小说明拟合效果越好④若变量y 和x 之间的相关系数为0.946r =-,则变量y 和x 之间线性相关性强 17.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____18.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..19.某校有高一学生n 名,其中男生数与女生数之比为6:5,为了解学生的视力情况,现要求按分层抽样的方法抽取一个样本容量为10n的样本,若样本中男生比女生多12人,则n =_______.20.已知一组数据x ,8,7,9,7,若这组数据的平均数为8,则它们的方差为______.三、解答题21.某科研课题组通过一款手机APP 软件,调查了某市1000名跑步爱好者平均每周的跑步量(简称“周跑量”),得到如下的频数分布表: 周跑量 [)10,15 [)15,20 [)20,25 [)25,30 [)30,35 [)35,40 [)40,45 [)45,50 []50,55人数100120130180220150603010周跑量 小于20公 20公里到 不小于40 类别 休闲跑者 核心跑者 精英跑者 装备价格250040004500);(3)根据跑步爱好者的周跑量,将跑步爱好者分成以下三类,不同类别的跑者购买的装备的价格不一样(如表),根据以上数据,估计该市每位跑步爱好者购买装备,平均需要花费多少元?22.某地政府拟在该地一水库上建造一座水电站,用泄流水量发电.下图是根据该水库历年的日泄流量的水文资料画成的日泄流量X (单位:万立方米)的频率分布直方图(不完整),已知[)0,120X ∈,历年中日泄流量在区间[30,60) 的年平均天数为156,一年按364天计.(Ⅰ)请把频率分布直方图补充完整;(Ⅱ)该水电站希望安装的发电机尽可能运行,但每30万立方米的日泄流量才够运行一台发电机,如6090X ≤<时才够运行两台发电机,若运行一台发电机,每天可获利润为4000元,若不运行,则该台发电机每天亏损500元,以各段的频率作为相应段的概率,以水电站日利润的期望值为决策依据,问:为使水电站日利润的期望值最大,该水电站应安装多少台发电机?23.假设关于某设备的使用年限x (年)和所支出的维修费用y (万元),有如下的统计资料:由资料可知y 对x 呈线性相关关系. (1)求y 关于x 的线性回归方程;(2)请估计该设备使用年限为15年时的维修费用.参考公式:线性回归方程y bx a =+的最小二乘法计算公式:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-,参考数据:5115263748510120i ii x y==⨯+⨯+⨯+⨯+⨯=∑24.为研究冬季昼夜温差大小对某反季节大豆新品种发芽率的影响,某校课外兴趣小组记录了5组昼夜温差与100颗种子发芽数,得到如下资料:经分析,这组数据具有较强的线性相关关系,因此该小组确定的研究方案是:先从这五组数据中选取3组数据求出线性回归方程,再用没选取的2组数据进行检验.(1)若选取的是第2,3,4组的数据,求出y 关于x 的线性回归方程ˆˆˆybx a =+; (2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?(参考公式:()()()1122211ˆn ni i i i i i n n i i i i x x y y x y nxy b x x x nx ====---==--∑∑∑∑,ˆˆa y bx =-) 25.某校为了了解甲、乙两班的数学学习情况,从两班各抽出10名学生进行数学水平测试,成绩如下(单位:分):甲班:82 84 85 89 79 80 91 89 79 74 乙班:90 76 86 81 84 87 86 82 85 83 (1)求两个样本的平均数;(2)求两个样本的方差和标准差; (3)试分析比较两个班的学习情况.26.某公司有400名员工,根据男女员工人数比例,用分层随机抽样的方法从中抽取了100人,调查他们的通勤时间(上下班途中花费的总时间,单位:分钟),将数据按照[)20,30,[)30,40,,[]80,90分成7组,并整理得到如下频率分布直方图:(I )从总体中随机抽取1人,估计其通勤时间小于40分钟的概率; (Ⅱ)求样本数据的中位数的估计值;(Ⅲ)已知样本中通勤时间大于或等于60分钟的人都是男员工,通勤时间小于60分钟的人中有一半是男员工,求该公司男员工的人数.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【详解】高的比就是频率的比,所以各区间上的频率可依次设为2x,3x,5x,6x,3x,x,,同它们的和为1235631,20x x x x x x x +++++=∴=,所以该班学生数学成绩在[80,100)之间的学生人数是1(56)6011603320x +⨯⨯=⨯⨯=,故选D 2.D解析:D 【分析】根据散点图的分布可选择合适的函数模型. 【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+. 故选:D. 【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.3.B解析:B 【分析】由频率分布直方图的性质,求得0.25x =,再结合频率分布直方图的频率的计算方法,即可求解. 【详解】由频率分布直方图的性质,可得()20.050.150.051x +++=,解得0.25x =, 所以学习时长在[)9,11的频率2520.5x n==,解得50n =. 故选:B . 【点睛】本题主要考查了频率分布直方图性质及其应用,其中解答中熟记频率分布直方图的性质是解答的关键,着重考查了数据分析能力,以及计算能力.4.A解析:A 【分析】根据图象即可看出,华为在每个季度的销量都最大,从而得出华为的全年销量最大,从而得出A 正确;由于不知每个季度的销量多少,从而苹果、华为和三星在哪个季度的销量大或小是没法判断的,从而得出选项B ,C ,D 都错误. 【详解】根据图象可看出,华为在每个季度的销量都最大,所以华为的全年销量最大;每个季度的销量不知道,根据每个季度的百分比是不能比较苹果在第二季度和第三季度销量多少的,同样不能判断华为在哪个季度销量最大,三星在哪个季度销量最小;B ∴,C ,D 都错误,故选A . 【点睛】本题主要考查对销量百分比堆积图的理解.5.A解析:A 【解析】 【分析】由表求得,,代入回归直线方程,联立方程组,即可求解,得到答案.【详解】由题意,5家商场的售价元和销售量件之间的一组数据,可得,,又由回归直线的方程,则,即,又因为,解得,故选A.【点睛】本题主要考查了回归直线方程的特征及其应用,其中解答中熟记回归直线方程的特征,准确计算是解答的关键,着重考查了推理与运算能力,属于基础题.6.B解析:B 【分析】由剩余5个分数的平均数为21,据茎叶图列方程求出x =4,由此能求出5个剩余分数的方差. 【详解】∵将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为21, ∴由茎叶图得:1724202020215x+++++=得x =4,∴5个分数的方差为:S 2=()()()()()222221361721242120212021242155⎡⎤-+-+-+-+-=⎣⎦ 故选B 【点睛】本题考查方差的求法,考查平均数、方差、茎叶图基础知识,考查运算求解能力,考查数形结合思想,是基础题.7.A解析:A 【解析】 【分析】首先求得x 的平均值,然后利用线性回归方程过样本中心点求解m 的值即可. 【详解】 由题意可得:810111214115x ++++==,由线性回归方程的性质可知:99112744y =⨯+=, 故21252835275m++++=,26m ∴=.故选:A .【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x 与y 之间的关系,这条直线过样本中心点.8.C解析:C 【解析】分析:利用平均数的公式,求得6x =,得到数据2,5,8,9,6,再利用方差的计算公式,即求解数据的方差.详解:由题意,一组数据2,5,8,9,x 的平均数为6,即258924655x xx +++++===,解得6x =,所以数据2,5,8,9,6的方差为2222221[(26)(56)(86)(96)(66)]65s =-+-+-+-+-=,故选C.点睛:本题主要考查了数据的数字特的计算,其中熟记数据的平均数的公式和数据的方差的计算公式是解答的关键,着重考查了推理与运算能力,属于基础题.9.A解析:A 【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为10002050= 所以抽取的第40个数为1520(401)795+⨯-=选A.点睛:本题考查系统抽样概念,考查基本求解能力.10.B解析:B 【分析】由频率分布直方图分别计算出各组得频率、频数,然后再计算出体重的平均值 【详解】由频率分布直方图可以计算出各组频率分别为:0.10.20.250.250.15,,,,,0.05 频数为:367.57.54.51.5,,,,, 则平均值为:113136157.5177.519 4.521 1.515.630⨯+⨯+⨯+⨯+⨯+⨯=故选B 【点睛】本题主要考查了由频率分布直方图计算平均数,需要注意计算不要出错11.C解析:C 【分析】先求均值,再根据标准差公式求标准差,最后比较大小. 【详解】乙选手分数的平均数分别为7885848192767780949384,84,55++++++++====因此s 1<s 2,选C. 【点睛】本题考查标准差,考查基本求解能力.12.B解析:B 【解析】 【分析】利用最小二乘法做出线性回归直线的方程的系数,写出回归直线的方程,得到结果. 【详解】由题意,b=22222210078102801088411488116905108841001021081141165108⨯+⨯+⨯+⨯+⨯-⨯⨯++++-⨯=0.72, a=84﹣0.72×108=6.24,∴y =0.72x+6.24, 故选:B . 【点睛】本题主要考查线性回归方程,属于难题.求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算211,,,nnii i i i x y x x y ==∑∑的值;③计算回归系数ˆˆ,ab ;④写出回归直线方程为ˆˆˆy bx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.二、填空题13.【分析】先分别求出这3组的人数再利用分层抽样的方法即可得出答案【详解】第3组的人数为第4组的人数为第5组的人数为所以这三组共有60名志愿者所以利用分层抽样的方法在60名志愿者中抽取6名志愿者第三组应解析:3【分析】先分别求出这3组的人数,再利用分层抽样的方法即可得出答案. 【详解】第3组的人数为10050.0630⨯⨯=, 第4组的人数为10050.0420⨯⨯=, 第5组的人数为1000.02510⨯⨯=, 所以这三组共有60名志愿者,所以利用分层抽样的方法在60名志愿者中抽取6名志愿者,第三组应抽取306360⨯=名, 故答案为:3. 【点睛】关键点点睛:该题考查的是有关频率分布直方图的识别以及分层抽样某层抽取个数的问题,正确解题的关键是掌握在抽取过程中每个个题被抽到的机会均等.14.5【分析】求出数据的中心(26)代入回归直线方程即可【详解】由已知∵回归直线方程一定过样本点中心∴∴故答案为:5【点睛】本题考查了线性回归方程考查了计算能力和逻辑推理能力属于一般题目解析:5 【分析】求出数据的中心(2,6),代入回归直线方程即可. 【详解】由已知2x =,6y =,∵回归直线方程12y x a =+一定过样本点中心(),x y ∴1622a =⨯+ ∴5a = 故答案为:5 【点睛】本题考查了线性回归方程,考查了计算能力和逻辑推理能力,属于一般题目.15.【分析】根据线性回归方程过样本数据中心点可求出b 代入即可求解【详解】由表中数据可得所以过点代入可得所以当时即获得利润大约为万元故答案为:【点睛】本题主要考查了线性回归方程样本数据中心点线性回归方程的 解析:4.74【分析】根据线性回归方程过样本数据中心点,可求出b ,代入15x =即可求解. 【详解】由表中数据可得4,1x y ==,所以0.36ˆˆybx =-过点(4,1), 代入可得0.34b =,所以ˆˆ0.340.36yx =-, 当15x =时,0.34150.34ˆ6 4.7y=⨯-=, 即获得利润大约为4.74万元. 故答案为:4.74 【点睛】本题主要考查了线性回归方程,样本数据中心点,线性回归方程的应用,属于中档题.16.①②④【分析】根据两个变量线性相关的概念及性质逐项判定即可求解【详解】由题意根据回归直线方程的特征可得线性回归直线方程一定过样本中心所以①正确;根据残差的概念可得残差平方和越小的模型拟合效果越好所以解析:①②④ 【分析】根据两个变量线性相关的概念及性质,逐项判定,即可求解. 【详解】由题意,根据回归直线方程的特征,可得线性回归直线方程一定过样本中心,所以①正确;根据残差的概念,可得残差平方和越小的模型,拟合效果越好,所以②正确; 根据相关指数的概念,可得2R 越大说明拟合效果越好,所以③不正确;若变量y 和x 之间的相关系数为0.946r =-,则变量y 和x 之间负相关,且线性相关性强,所以④正确; 故答案为:①②④. 【点睛】本题主要考查了两个变量的线性相关性的概念与判定,其中解答中熟记线性相关的基本概念和结论是解答的关键,属于基础题.17.或【分析】利用平均数与方差公式直接求解即可【详解】由题去掉最高与最低分后的测试成绩为8284848689则平均数方差故答案为:或【点睛】本题考查茎叶图考查平均数与方差的计算是基础题解析:5.6或285【分析】利用平均数与方差公式直接求解即可 【详解】由题去掉最高与最低分后的测试成绩为82,84,84,86,89,则平均数8284848689855x ++++==方差()()()()()2222221288582858485848586858955s ⎡⎤=-+-+-+-+-=⎣⎦ 故答案为:5.6或285【点睛】本题考查茎叶图,考查平均数与方差的计算,是基础题18.5000【分析】由题意其他年级抽取200人其他年级共有学生2000人根据题意列出等式即可求出该校学生总人数【详解】由题意其他年级抽取200人其他年级共有学生2000人则该校学生总人数为人故答案是:5解析:5000 【分析】由题意,其他年级抽取200人,其他年级共有学生2000人,根据题意列出等式,即可求出该校学生总人数. 【详解】由题意,其他年级抽取200人,其他年级共有学生2000人, 则该校学生总人数为20005005000200⨯=人,故答案是:5000. 【点睛】该题考查的是有关分层抽样的问题,涉及到的知识点有分层抽样要求每个个体被抽到的概率是相等的,属于简单题目.19.【分析】依题意可得解之即得解【详解】依题意可得解得故答案为1320【点睛】本题主要考查分层抽样意在考查学生对这些知识的理解掌握水平和分析推理能力 解析:1320【分析】 依题意可得6512111110n⎛⎫-⨯= ⎪⎝⎭,解之即得解. 【详解】依题意可得6512111110n⎛⎫-⨯= ⎪⎝⎭,解得1320n =. 故答案为1320 【点睛】本题主要考查分层抽样,意在考查学生对这些知识的理解掌握水平和分析推理能力.20.【解析】因为平均数为所以方差为解析:45【解析】因为平均数为8,所以9,x = 方差为222214[10111]55++++=三、解答题21.(1)见解析;(2)中位数29.2,众数32.5;(3)平均花费3720元. 【分析】(1)由频数分布表能补全该市1000名跑步爱好者周跑量的频率分布直方图. (2)由频率分布直方图能求出样本的中位数.(3)分别求出休闲跑者、核心跑者、精英跑者的人数,由此能估计该市每位跑步爱好者购买装备平均需要花费多少钱. 【详解】(1)补全该市1000名跑步爱好者周跑量的频率分布直方图,如下:(2)中位数的估计值:由50.0250.02450.0260.350.5⨯+⨯+⨯=<,0.3550.0360.530.5+⨯=>, 所以中位数位于区间[)25,30中,设中位数为x ,则()0.35250.0360.5x +-⨯=, 解得29.2x ≈.即样本中位数是29.2.因为样本中频率最高的一组为[30,35),所以样本的众数为32.5.(3)依题意可知,休闲跑者共有()50.0250.024*******⨯+⨯⨯=人, 核心跑者()50.02650.03650.04450.0301000680⨯+⨯+⨯+⨯⨯=人, 精英跑者1000220680100--=人, 所以该市每位跑步爱好者购买装备,平均需要22025006804000100450037201000⨯+⨯+⨯=元.即该市每位跑步爱好者购买装备,平均需要3720元. 【点睛】本题考查频率分布直方图的作法,考查样本的中位数、平均数的求法,考查运算求解能力,是基础题.22.(Ⅰ)见解析;(Ⅱ)要使水电站日利润的期望值最大,该水电站应安装3台发电机. 【详解】试题分析:(Ⅰ)可利用频率分布直方图的性质,补全图像;(Ⅱ)分别计算安装1台,2台,3台的日利润的期望值,然后进行比较. (Ⅰ)在区间[30,60)的频率为15633647= 31==73070⨯频率组距, 设在区间[0,30)上,a 频率组距=, 则11130170105210a ⎛⎫+++⨯= ⎪⎝⎭, 解得1210a =, 补充频率分布直方图如图;(Ⅱ)记水电站日利润为Y 元.由(Ⅰ)知:不能运行发电机的概率为17,恰好运行一台发电机的概率为37,恰好运行二台发电机的概率为27,恰好运行三台发电机的概率为17,①若安装1台发电机,则Y 的值为-500,4000,其分布列为Y -5004000P1767E (Y )=5004000777-⨯+⨯=; ②若安装2台发电机,则Y 的值为-1000,3500,8000,其分布列为 Y-100035008000E (Y )=1000350080007777-⨯+⨯+⨯=; ③若安装3台发电机,则Y 的值为-1500,3000,7500,12000,其分布列为E (Y )=1500300075001200077777-⨯+⨯+⨯+⨯=; ∵345003350023500777>> ∴要使水电站日利润的期望值最大,该水电站应安装3台发电机. 23.(1) 1.2 3.6y x =+;(2)21.6万元. 【分析】(1)先求出年限x 和维修费用y 的平均值,即得到样本中心点,利用最小二乘法得到线性回归方程的系数,根据样本中心点在线性回归直线上,得到a 值,即得线性回归方程; (2)将15x =代入回归直线方程即可求得结果. 【详解】 (1)1234535x ++++==,5678107.25++++==y51120i i i x y ==∑,522222211234555ii x ==++++=∑ 25945nx =⨯=,537.2108nx y =⨯⨯=∴1201081.25545b -==-,7.2 1.23 3.6a =-⨯=∴y 关于x 的线性回归方程为 1.2 3.6y x =+(2)在上述回归方程中,当15x =时得21.6y = ∴该设备使用年限为15年时的维修费用大约为21.6万元. 【点睛】本题考查回归直线方程的求解及其应用,其中认真审题,准确合理的运算是解决此类问题的关键,考查运算能力,属于基础题.24.(1)5ˆ32yx =-(2)可靠 【分析】(1)根据所给的数据,先做出,y x 的平均数,即做出本组数据的样本中心点,根据最小二乘法求出线性回归方程的系数,写出线性回归方程;(2)根据估计数据与所选出的检验数据的误差均不超过2颗,就认为得到的线性回归方程是可靠的,根据求得的结果和所给的数据进行比较,得到所求的方程是可靠的. 【详解】 (1)由题意:111312123x ++==,253026273y ++==, ()()()()()()()()()()()()31122331322221231ˆii i i i x x y y x x y y x x y y x x y y b x x x x x x x x ==----+--+--==-+-+--∑∑ ()()()()()()()()()22211122527131230271212262752111213121212-⨯-+-⨯-+-⨯-==-+-+-. 527123ˆˆ2ay bx =-=-⨯=-, 故回归直线方程为:ˆ532yx =-. (2)当10x =时,510322,2223122y =⨯-=-=<, 当8x =时,58317,1716122y =⨯-=-=<,所以(1)中所得的回归直线方程是可靠的. 【点睛】本题主要考查线性回归方程的求解与应用,属于中档题.求回归直线方程的步骤:①依据样本数据确定两个变量具有线性相关关系;②计算211,,,nniiii i x y x x y==∑∑的值;③计算回归系数,a b ;④写出回归直线方程为ˆy bx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势. 25.(1)=83.2x 甲,=84x 乙;(2)22=26.36=13.2S S 甲乙,,=5.13S 甲,=3.63S 乙;(3)乙班的总体学习情况比甲班好 【解析】试题分析:每组样本数据有10个,求样本的平均数利用平均数公式,10个数的平均数等于这10个数的和除以10;比较平均分的大小可以看出两个班学生平均水平的高低,求样本的方差只需使用方差公式,求这10个数与平均数的差的平方方和再除以10;比较两组数据方差的大小就可得出两组数据的标准差的大小,标准差较小者成绩较稳定 . 试题 (1)x 甲=110×(82+84+85+89+79+80+91+89+79+74)=83. 2, x 乙=110×(90+76+86+81+84+87+86+82+85+83)=84.(2)2S 甲=110×[(82-83. 2)2+(84-83. 2)2+(85-83. 2)2+(89-83. 2)2+(79-83. 2)2+(80-83. 2)2+(91-83. 2)2+(89-83. 2)2+(79-83. 2)2+(74-83. 2)2]=26. 36,2S 甲=110[(90-84)2+(76-84)2+(86-84)2+(81-84)2+(84-84)2+(87-84)2+(86-84)2+(82-84)2+(85-84)2+(83-84)2]=13. 2,则s 甲,s 乙≈3. 63.(3)由于x x <甲乙,则甲班比乙班平均水平低.由于S S >甲乙,则甲班没有乙班稳定. 所以乙班的总体学习情况比甲班好【点睛】怎样求样本的平均数,n 个数的平均数等于这n 个数的和除以n ;比较平均数的大小可以看出两个样本平均水平的高低,怎样求样本的方差,就是求这n 个数与平均数的差的平方方和再除以n ;比较两组数据方差的大小就可得出两组数据的标准差的大小,标准差较小者成绩较稳定 .26.(Ⅰ)0.6;(Ⅱ)37.5;(Ⅲ)220. 【分析】(Ⅰ)根据频率分布直方图求解即可;(Ⅱ)先根据频率分布直方图判断中位数落在哪一区间上,然后利用中位数将频率分布直方图的面积分为相等的两部分求解;(Ⅲ)先计算出样本中男员工的人数,计算出男员工所占的比例,然后估计总体中男员工的人数. 【详解】解:(1)由频率分布直方图可知,样本中通勤时间小于40的概率()100.020.040.6p =⨯+=,故从总体中随机抽取1人,估计其通勤时间小于40分钟的概率也为0.6.(Ⅱ)由图可知,样本的中位数位于[)30,40之间,设中位数为x ,则()0.2300.040.5x +-⨯=,解得37.5x =,故中位数为37.5.(Ⅲ)样本中通勤时间大于或等于60分钟的人的概率为0.1,共10人,通勤时间小于60分钟的人的频率为0.9,其中男员工有11000.9452⨯⨯=人,所以样本中男员工共有55人,占样本容量的55%,故该公司男员工人数为40055%220⨯=人. 【点睛】本题考查频率分布直方图的应用,考查用样本估计总体,难度一般.。

(好题)高中数学必修三第一章《统计》测试题(包含答案解析)(3)

(好题)高中数学必修三第一章《统计》测试题(包含答案解析)(3)

一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆybx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.2015年年岁史诗大剧《芈月传》风靡大江南北,影响力不亚于以前的《甄嬛传》.某记者调查了大量《芈月传》的观众,发现年龄段与爱看的比例存在较好的线性相关关系,年龄在[]10,14,[]15,19,[]20,24,[]25,29,[]30,34的爱看比例分别为10%,18%,20%,30%,%t .现用这5个年龄段的中间值x 代表年龄段,如12代表[]10,14,17代表[]15,19,根据前四个数据求得x 关于爱看比例y 的线性回归方程为( 4.68)%y kx =-,由此可推测t 的值为( )A .33B .35C .37D .393.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为 ( ) A .45,75,15B .45,45,45C .45,60,30D .30,90,154.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s <>5.一组数据的平均数为m ,方差为n ,将这组数据的每个数都加上(0)a a >得到一组新数据,则下列说法正确的是( ) A .这组新数据的平均不变 B .这组新数据的平均数为am C .这组新数据的方差为2a nD .这组新数据的方差不变6.某产品的广告费用与销售额的统计数据如下表:( ) 广告费用(万元) 销售客(万元)根据上表中的数据可以求得线性回归方程中的为,据此模型预报广告费用为万元时销售额为( ) A .万元B .万元C .万元D .万元7.在一段时间内,某种商品的价格x (元)和销售量y (件)之间的一组数据如下表: 价格x (元) 4 6 8 10 12 销售量y (件)358910若y 与x 呈线性相关关系,且解得回归直线ˆˆˆybx a =+的斜率0.9b ∧=,则a ∧的值为( ) A .0.2 B .-0.7 C .-0.2 D .0.78.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( ) x 8 10 11 12 14 y2125m2835A .26B .27C .28D .299.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .10.已知某8个数的平均数为3,方差为2,现加入一个新数据3,此时这9个数的平均数为x ,方差为2s ,则( ) A .3x =,22s < B .3x =,22s > C .3x >,22s <D .3x >,22s >11.甲、乙两名选手参加歌手大赛时,5名评委打的分数用如图所示的茎叶图表示,s 1,s 2分别表示甲、乙选手分数的标准差,则s 1与s 2的关系是( ).A .s 1>s 2B .s 1=s 2C .s 1<s 2D .不确定12.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( )A .y 平均增加1.5个单位B .y 平均增加2个单位C .y 平均减少1.5个单位D .y 平均减少2个单位二、填空题13.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高[)120130,,[)130140,,[]140,150三组内的学生中,用分层抽样的方法抽取18人参加一项活动,则从身高在[]140,150内的学生中抽取的人数应为________.14.水痘是一种传染性很强的病毒性疾病,易在春天爆发.市疾控中心为了调查某校高年级学生注射水症疫苗的人数,在高一年级随机抽取5个班级,每个班抽取的人数互不相同,若把每个班级抽取的人数作为样本数据.已知样本平均数为7,样本方差为4,则样本数据中的最小值是______. 15.已知一组样本数据1210,x x x ,且22212102020x x x +++=,平均数9=x ,则该组数据的标准差为__________.16.若1a ,2a ,…,20a 这20个数据的平均数为x ,方差为0.21,则1a ,2a ,…,20a ,x 这21个数据的方差为__________.17.为调查某校学生每天用于课外阅读的时间,现从该校3000名学生中随机抽取100名学生进行问卷调查,所得数据均在区间[50,100]上,其频率分布直方图如图所示,则估计该校学生中每天用于阅读的时间在[70,80)(单位:分钟)内的学生人数为____.18.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:^y =0.245x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_______万元.19.某种活性细胞的存活率(%)y 与存放温度()x C ︒之间具有线性相关关系,样本数据如下表所示: 存放温度()x C ︒ 10 4 -2 -8 存活率(%)y20445680经计算得回归直线的斜率为-3.2.若存放温度为6C ︒,则这种细胞存活率的预报值为__________%.20.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b+的最小值为__________.三、解答题21.我国北方广大农村地区、一些城镇以及部分大中城市的周边区域,还在大量采用分散燃煤和散烧煤取暖,既影响了居民基本生活的改善,也加重了北方地区冬季的雾霾天气.推进北方地区冬季清洁取暖,是重大民生工程、民心工程,关系北方地区广大群众温暖过冬,关系雾霾天能不能减少,是能源生产和消费革命、农村生活方式革命的重要内容.2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改电用户大幅度增加,下面条形图反映了某省2018年1~7月份煤改气、煤改电的用户数量.(1)在给定坐标系中作出煤改气、煤改电用户数量y 随月份t 变化的散点图,并用散点图和相关系数说明y 与t 之间具有线性相关性;(2)建立y 关于t 的回归方程(系数精确到0.01),预测11月份该省煤改气、煤改电的用户数量. 参考数据:7772111y9.24,t 7 2.646iiii i i i y=====⋅≈≈∑∑∑(y -y ).参考公式:相关系数()()()()()()11112211niinn ni i i i i i nni i i i i i i t t y y r t ty y t y t y t ty y ======⋅--=⋅--=-⋅-⋅-∑∑∑∑∑∑.回归方程ˆy a bt=+中斜率和截距的最小二乘估计公式分别为:()()()121ˆˆˆ,nii i ni i tty y bay bt t t==⋅--==-⋅-∑∑. 22.某北方村庄4个草莓基地,采用水培阳光栽培方式种植的草莓个大味美,一上市便成为消费者争相购买的对象.光照是影响草莓生长的关键因素,过去50年的资料显示,该村庄一年当中12个月份的月光照量X (小时)的频率分布直方图如下图所示(注:月光照量指的是当月阳光照射总时长).(1)求月光照量X (小时)的平均数和中位数;(2)现准备按照月光照量来分层抽样,抽取一年中的4个月份来比较草莓的生长状况,问:应在月光照量[160,240)X ∈,[240,320)X ∈,[320,400]X ∈的区间内各抽取多少个月份?(3)假设每年中最热的5,6,7,8,9,10月的月光照量X 是大于等于240小时,且6,7,8月的月光照量X 是大于等于320小时,那么,从该村庄2018年的5,6,7,8,9,10这6个月份之中随机抽取2个月份的月光照量进行调查,求抽取到的2个月份的月光照量X (小时)都不低于320的概率.23.某校高一年级举行“抗击新冠肺炎”在线知识问答比赛,现将60名参赛学生的成绩(满分100分)统计如下: 分组 频数 频率 [50,60) 18 0.30 [60,70) 24 0.40 [70,80) 9 0.15 [80,90) 6 0.10 [90,100]30.05(1)根据上面的统计表,作出这些数据的频率分布直方图;(2)求这60名参赛学生成绩的平均数(同一组中的数据用该组区间的中间值作代表)和中位数.24.某微商对某种产品每天的销售量(单位:件)进行为期一个月(按30天计算)的数据统计分析,并得出了这种产品该月销售量的频率分布直方图(如图).假设用直方图中所得的频率来估计相应事件发生的概率.(Ⅰ)求频率分布直方图中a 的值;(Ⅱ)若微商在一天的销售量不低于25件,则上级商企会给微商赠送100元的礼金,估计该微商在一年内获得的礼金数.25.为保护农民种粮收益,促进粮食生产,确保国家粮食安全,调动广大农民生产粮食的积极性,从2014年开始,国家实施了对种粮农民直接补贴的政策通过对2014~2018年的数据进行调查,发现某地区发放粮食补贴额x (单位:亿元)与该地区粮食产量y (单位:万亿吨)之间存在着线性相关关系,统计数据如下表: 年份 2014 2015 2016 2017 2018 补贴额x /亿元 9 10 12 11 8 粮食产量y /万亿2526312721(1)请根据上表所给的数据,求出y 关于x 的线性回归直线方程ˆˆˆybx a =+; (2)通过对该地区粮食产量的分析研究,计划2019年在该地区发放粮食补贴7亿元,请根据(1)中所得到的线性回归直线方程,预测2019年该地区的粮食产量.参考公式:()()()121ˆniii nii x x y y bx x ==--=-∑∑,ˆˆay bx =-. 26.零部件生产水平是评判一个国家高端装备制造能力的重要标准之一,其中切割加工技术是一项重要技术某精密仪器制造商研发了一种切割设备,用来生产高精度的机械零件,经过长期生产检验,可以认为该设备生产的零件尺寸服从正态分布N (μ,σ2).某机械加工厂购买了该切割设备,在正式投入生产前进行了试生产,从试生产的零件中任意抽取10件作为样本,下面是样本的尺寸x i (i =1,2,3,…,10,单位:mm ): 100.03 100.4 99.92 100.52 99.98 100.3599.92100.44100.66100.78用样本的平均数x 作为μ的估计值,用样本的标准差s 作为σ的估计值.(1)按照技术标准的要求,若样本尺寸均在(μ﹣3σ,μ+3σ)范围内,则认定该设备质量合格,根据数据判断该切割设备的质量是否合格.(2)该机械加工厂将该切割设备投入生产,对生产的零件制定了两种销售方案(假设每种方案对销售量没有影响):方案1:每个零件均按70元定价销售;方案2:若零件的实际尺寸在(99.7,100.3)范围内,则该零件为A 级零件,每个零件定价100元,否则为B 级零件,每个零件定价60元. 哪种销售方案的利润更大?请根据数据计算说明.附:1021ii x =∑≈100601.8,样本方差()22221111n n i i i i s x x x nx n n ==⎛⎫=-=- ⎪⎝⎭∑∑.若X ~N (μ,σ2),则P (μ﹣σ<X <μ+σ)=0.6827,P (μ﹣2σ<X <μ+2σ)=0.9545【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】由已知求得 x , y ,进一步求得 a ,得到线性回归方程,取16x =求得y 值即可. 【详解】8.38.69.911.1512.1 10x +++=+=, 5.97.88.18.49.858y ++++==.又 0.78b =,∴ 80.78100.2a y bx --⨯===. ∴ 0.780.2y x =+.取16x =,得 0.78160.212.68y ⨯+==万元,故选A . 【点睛】本题主要考查线性回归方程的求法,考查了学生的计算能力,属于中档题.2.B解析:B 【解析】前4个数据对应的19.5x = ,0.195y = (把百分数转化为小数),而0( 4.68)0y kx ∧=-=0.0468bx -,0.19519.50.0468b ∧∴=⨯-,0.0124b ∧∴=,0(1.24 4.68)0y x ∧∴=- ,当3034322x +==, 1.2432 4.6835t =⨯-=.3.C解析:C 【解析】因为共有学生2700,抽取135,所以抽样比为1352700,故各年级分别应抽取135900452700⨯=,1351200602700⨯=,135600302700⨯=,故选C. 4.A解析:A 【分析】根据题中所给的平均数的条件,重新列式求新数据的平均数,根据方差公式写出两组数据的方差,并比较大小. 【详解】 由题意,可得7050806070907050x ⨯+-+-==,设收集的48个准确数据分别记为1248,,,x x x ,则222221248175[(70)(70)(70)(6070)(9070)]50x x x =-+-++-+-+-22212481[(70)(70)(70)500]50x x x =-+-++-+,22222212481[(70)(70)(70)(8070)(7070)]50s x x x =-+-++-+-+-22212481[(70)(70)(70)100]7550x x x =-+-++-+<,所以275s <.故选:A . 【点睛】本题主要考查了数据的平均数和方差的计算公式的应用,其中解答中熟记数据的平均数和方差的公式,合理准确计算是解答的关键,着重考查了推理与运算能力,是基础题.5.D解析:D 【分析】考查平均数和方差的性质,基础题. 【详解】设这一组数据为()1,n X a a =,由()()E X a E X a +=+,()()D X a D X +=,故选:D . 【点睛】本题主要考查方差的性质,考查了运算能力,属于容易题.6.B解析:B 【解析】 【分析】 先求出,由样本点的中心在回归直线上,可求出,从而求出回归方程,然后令,可求出答案.【详解】 由题意,,则样本中心点在回归方程上,则,故线性回归方程为,则广告费用为万元时销售额为万元,故选B.【点睛】本题考查了线性回归方程的求法,考查了学生的计算能力,属于基础题.7.C解析:C 【解析】 【分析】由题意利用线性回归方程的性质计算可得a 的值. 【详解】 由于468101285x ++++==,35891075y ++++==,由于线性回归方程过样本中心点(),x y ,故:70.98a =⨯+, 据此可得:0.2a =-. 故选C . 【点睛】本题主要考查线性回归方程的性质及其应用,属于中等题.8.A解析:A 【解析】 【分析】首先求得x 的平均值,然后利用线性回归方程过样本中心点求解m 的值即可. 【详解】 由题意可得:810111214115x ++++==,由线性回归方程的性质可知:99112744y =⨯+=, 故21252835275m++++=,26m ∴=.故选:A . 【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x 与y 之间的关系,这条直线过样本中心点.9.D解析:D 【解析】 【分析】 先计算,代入回归直线方程,可得,从而可求得结果.【详解】 因为,所以,代入回归直线方程可求得,所以,故选D. 【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.10.A解析:A 【分析】由题意计算出加入新数据后的平均数,然后比较方差 【详解】()18138x x +⋯+=, ()181339x x +⋯++=, 3x ∴=,由方差的定义可知加入新数据3,样本数据会变得更加稳定 故22s < 故选A 【点睛】本题主要考查了加入数据后平均数和方差的变化,代入公式计算出结果,较为基础11.C解析:C 【分析】先求均值,再根据标准差公式求标准差,最后比较大小. 【详解】乙选手分数的平均数分别为7885848192767780949384,84,55++++++++====因此s 1<s 2,选C. 【点睛】本题考查标准差,考查基本求解能力.12.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.二、填空题13.3【分析】先由频率之和等于1得出的值计算身高在的频率之比根据比例得出身高在内的学生中抽取的人数【详解】身高在的频率之比为所以从身高在内的学生中抽取的人数应为故答案为:【点睛】本题主要考查了根据频率分解析:3 【分析】先由频率之和等于1得出a 的值,计算身高在[)120,130,[)130,140,[]140,150的频率之比,根据比例得出身高在[]140,150内的学生中抽取的人数.(0.0050.010.020.035)101a ++++⨯=0.03a ∴=身高在[)120,130,[)130,140,[]140,150的频率之比为0.03:0.02:0.013:2:1= 所以从身高在[]140,150内的学生中抽取的人数应为11836⨯= 故答案为:3 【点睛】本题主要考查了根据频率分布直方图求参数的值以及分层抽样计算各层总数,属于中档题.14.4【分析】首先设个班抽取的人数由小到大分别为根据题意得到再求数据中的最小值即可【详解】设个班抽取的人数由小到大分别为由题知:即若时则则四个数为:或此时一定有相同的数与已知矛盾若时则则四个数为:此时为解析:4 【分析】首先设5个班抽取的人数由小到大分别为12345,,,,x x x x x ,根据题意得到()()()()()22222123457777720x x x x x -+-+-+-+-=,再求数据中的最小值即可.【详解】设5个班抽取的人数由小到大分别为12345,,,,x x x x x ,由题知:()()()()()222221234517777745x x x x x ⎡⎤-+-+-+-+-=⎣⎦, 即()()()()()22222123457777720x x x x x -+-+-+-+-=. 若13x =时,则()()()()2222234577774x x x x -+-+-+-=, 则()()()()222223457,7,7,7x x x x ----四个数为:1,1,1,1或4,0,0,0, 此时2345,,,x x x x 一定有相同的数,与已知矛盾.若14x =时,则()()()()22222345777711x x x x -+-+-+-=, 则()()()()222223457,7,7,7x x x x ----四个数为:1,0,1,9, 此时12345,,,,x x x x x 为4,6,7,8,10,符合题意. 故答案为:4 【点睛】本题主要考查方差的定义,熟记定义为解题的关键,属于中档题.15.11【分析】根据题意利用方差公式计算可得数据的方差进而利用标准差公式可得答案【详解】根据题意一组样本数据且平均数则其方差则其标准差故答案为:11【点睛】本题主要考查平均数方差与标准差属于基础题样本方解析:11根据题意,利用方差公式计算可得数据的方差,进而利用标准差公式可得答案. 【详解】根据题意,一组样本数据1210,,...,x x x ,且22212102020x x x ++⋯+=,平均数9x =, 则其方差()()()()22221210110S x x x x x x =-+-+⋯+-()2222121011012110x x x x =++⋯+-=,则其标准差11S ==, 故答案为:11. 【点睛】本题主要考查平均数、方差与标准差,属于基础题. 样本方差2222121[()()...()]n s x x x x x x n=-+-++-,标准差s =16.【分析】根据平均数与方差的概念利用公式准确计算即可求解【详解】由题意数据…这20个数据的平均数为方差为由方差的公式可得所以所以故答案为:【点睛】本题主要考查了平均数与方差的概念及应用其中解答中熟记平 解析:0.20【分析】根据平均数与方差的概念,利用公式,准确计算,即可求解. 【详解】由题意,数据1a ,2a ,…,20a 这20个数据的平均数为x ,方差为0.21, 由方差的公式,可得222212201[()()()]0.2120s a x a x a x =⨯-+-++-=,所以2221220()()() 4.2a x a x a x -+-++-=,所以22222122011[()()()()] 4.20.202121s a x a x a x x x '=⨯-+-++-+-=⨯=, 故答案为:0.20. 【点睛】本题主要考查了平均数与方差的概念及应用,其中解答中熟记平均数和方差的计算公式,准确运算是解答的关键,着重考查了计算能力,属于基础题.17.【分析】利用频率分布直方图中频率和为1求a 值根据7080)的频率求出在此区间的人数即可【详解】由1﹣005﹣035﹣02﹣01=03故a =003故阅读的时间在7080)(单位:分钟)内的学生人数为:解析:900【分析】利用频率分布直方图中频率和为1求a 值,根据[70,80)的频率求出在此区间的人数即可. 【详解】由1﹣0.05﹣0.35﹣0.2﹣0.1=0.3, 故a =0.03,故阅读的时间在[70,80)(单位:分钟)内的学生人数为:0.3×3000=900, 故答案为900. 【点睛】本题考查频率分布直方图中的有关性质的应用,考查直方图中频率和频数的求法.18.245【解析】当变为时=0245(x+1)+0321=0245x+0321+0245而0245x+0321+0245-(0245x+0321)=0245因此家庭年收入每增加1万元年饮食支出平均增加0解析:245 【解析】当x 变为1x +时,y ∧=0.245(x+1)+0.321=0.245x+0.321+0.245,而0.245x+0.321+0.245-(0.245x+0.321)=0.245.因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元,本题填写0.245.19.34【解析】分析:由题意求出代入公式求值从而得到回归直线方程代入代入即可得到答案详解:由题意设回归方程由表中数据可得:;代入回归方程可得当时可得故答案为34点睛:该题考查的是有关回归直线的有关问题在解析:34 【解析】分析:由题意求出,x y ,代入公式求值^a ,从而得到回归直线方程,代入6x =代入即可得到答案.详解:由题意,设回归方程 3.2ˆ,ˆyx a =-+ 由表中数据可得:1,50x y ==;代入回归方程可得ˆ53.2a=. 当6x =时,可得3.2653.234y =-⨯+=,故答案为34.点睛:该题考查的是有关回归直线的有关问题,在解题的过程中,涉及到的知识点有回归直线过均值点,即样本中心点,利用题中所给的表格中的数据,计算得出相应的量,代入式子求得对应的结果.20.2【解析】由茎叶图及10个班级的得分的平均数是90可得∴当且仅当即时取等号故答案为2解析:2 【解析】由茎叶图及10个班级的得分的平均数是90可得8a b += ∴1911919191()()(19)(10)(1023)28888b a b a a b a b a b a b a b +=⨯++=+++=++≥+⨯=,当且仅当9b aa b=,即36b a ==时,取等号 故答案为2三、解答题21.(1)散点图见解析,y 与t 的线性相关性相当高,理由见解析;(2)0.920.1011 2.02y =+⨯=,2.02万户.【分析】(1)根据表格中对应的t 与y 的关系,描绘散点图,并根据参考数据求r ,说明相关性;(2)根据参考数据求ˆb和ˆa ,求回归直线方程,并令11t =,求y 的预测值.【详解】(1)作出散点图如图所示:由条形图数据和参考数据得()()7722114,0.53i i i i t t ty y ===⋅-=⋅-≈∑∑,()()77711139.7549.24 2.79ii i i i i i i tty y t y t y ===⋅--=-=-⨯=∑∑∑,2.790.990.532 2.646r ≈≈⨯⨯.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关性相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由9.24 1.327y ==及(1)得()()()717212.79ˆ0.1028iii i i t t y y b t t==⋅--==≈⋅-∑∑, ˆˆ 1.320.1040.92ay bt =-≈-⨯=,所以,y 关于t 的回归方程为:0.920.10y t =+. 将11t=代入回归方程得:0.920.1011 2.02y =+⨯=,所以预测11月份该省煤改气、煤改电的用户数量达到2.02万户. 【点睛】关键点点睛:本题考查回归直线方程,此类问题的关键是根据参考数据和公式相结合,求ˆb和ˆa ,一般计算量较大,需计算严谨,准确. 22.(1)平均数为260(小时);中位数为240(小时)(2)2,1,1(3)15【分析】(1)利用各频率之和为1,计算出a ,然后根据频率分布直方图以及平均数,中位数的求法,可得结果.(2)根据月光照量[160,240)X ∈、[240,320)X ∈、[320,400]X ∈的频率之比为111::244,结合分层抽样的方法,可得结果. (3)采用列举法,将“6个月份之中随机抽取2个月份”所有情况列举出来,并计算“抽取到的2个月份的月光照量X (小时)都不低于320”的个数,结合古典概型可得结果. 【详解】(1)根据各频率之和为1, 则0.062580()801a a ⨯++⨯=, 解得0.003125a =.月光照量X (小时)的平均数为()802000.00625+2800.0031253600.003125X =⨯⨯+⨯所以260X =(小时)设月光照量X (小时)的中位数为0X , 则0[240,320]X ∈.根据中位数的定义, 其左右两边的频率相等,都为0.5,可得()00.00625802400.0031250.5X ⨯+-⨯=,解得0240X =.所以月光照量X (小时)的中位数为240(小时). (2)因为月光照量[160,240)X ∈、[240,320)X ∈、[320,400]X ∈的频率之比为111::244,所以若准备按照月光照量来分层抽样,抽取一年中的4个月份来比较草莓的生长状况,那么,抽取的月光照量[160,240)X ∈,[240,320)X ∈,[320,400]X ∈的月份数分别为11142,41,41244⨯=⨯=⨯=. (3)由题意,月光照量[240,320)X ∈的有5,9,10月, 月光照量[320,400]X ∈的有6,7,8月, 故从该村庄2018年的5,6,7,8,9,10月份 之中随机抽取2个月份的月光照量X (小时) 进行调查,所有的情况有:(5,9),(5,10),(5,6),(5,7),(5,8); (9,10),(9,6),(9,7),(9,8); (10,6),(10,7),(10,8); (6,7),(6,8);(7,8)共15种;其中,抽取到的2个月份的月光照量X (小时)都不低于320的情况有: (6,7),(6,8),(7,8)共3种;故所抽取到的2个月份的月光照量X (小时)都不低于320的概率31155P ==. 【点睛】本题考查频率分布直方图中平均数,中位数的计算,以及古典概型的应用,分清题意,熟悉公式,耐心计算,属中档题.23.(1)直方图见解析;(2)67分,65分. 【分析】(1)由统计表算出各频率,作出频率分布直方图;(2)取各组数据中间值乘以频率再相加可得总平均值,求出频率0.5对应的成绩(此成绩在[60,70)之间]. 【详解】(1)根据统计表,作出这些数据的频率分布直方图如图:(2)由表中数据可知,这60名参赛学生成绩的平均数550.3650.4750. 15850.1950.0567x =⨯+⨯+⨯+⨯+⨯=分.因为这60名参赛学生成绩在[50,60)的频率为0.30.5<,成绩在[50,70)的频率为0.70.5>,所以这60名.参赛学生成绩的中位数在[60,70)之间.设这60名参赛学生成绩的中位数为x ,则()0.04600.2x ⨯-=,解得65x =, 故这60名参赛学生成绩的中位数为65分. 【点睛】本题考查频率分布直方图,考查由频率分布直方图求均值和中位数.考查了学生的数据处理能力,运算求解能力,属于中档题. 24.(Ⅰ)0.02;(Ⅱ)10800元. 【分析】(Ⅰ)由频率分布直方图中小矩形面积和为1能求出a .(Ⅱ)根据频率分布直方图,日销售量不低于25件的天数为(0.040.02)5309+⨯⨯=,一个月可获得的奖励为900元,由此可以估计一年内获得的礼金数. 【详解】(Ⅰ)由题意可得1[1(0.010.060.070.04)5]0.025a =-+++⨯=. (Ⅱ)根据频率分布直方图知,日销售量不低于25件的天数为:()0.040.025309+⨯⨯=(天),一个月可获得的礼金数为9100900⨯=(元),依此可以估计该微商一年内获得的礼金数为9001210800⨯=元. 【点睛】本题考查频率的求法,考查频率分布直方图的性质等基础知识,考查样本估计总体以及运算求解能力、数形结合思想的应用,是基础题.25.(1)ˆ 2.24yx =+;(2)19.4万亿吨. 【分析】(1)利用最小二乘法公式求回归直线的系()()()51521ˆiii ii x x y y bx x ==--=-∑∑,即可得答案;(2)将7x =代入回归方程ˆ 2.24yx =+,可得,ˆ19.4y =,即可得答案; 【详解】解:(1)由表中所给数据可得,91012118105x ++++==,2526312721265y ++++==,代入公式()()()51521ˆiii ii x x y y bx x ==--=-∑∑,解得ˆ 2.2b=,所以ˆˆ4a y bx =-=. 故所求的y 关于x 的线性回归直线方程为ˆ 2.24yx =+. (2)由题意,将7x =代入回归方程ˆ 2.24yx =+,可得,ˆ19.4y =. 所以预测2019年该地区的粮食产量大约为19.4万亿吨. 【点睛】本题考查利用最小二乘法求回归直线方程、回归方程进行预报,考查数据处理能力. 26.(1)合格,理由见解析;(2)方案2,理由见详解. 【分析】(1)求得10个数据的平均数和标准差,根据题意,即可判断;(2)设出方案2中零件价格的随机变量,结合正态分布求得零件价格的分布列和数学期望,即可比较大小,则问题得解. 【详解】(1)由表格中数据可得:x 1011100.310i i x ===∑,()101022221111(10)0.091010i i i i s x x x x ===-=-=∑∑.故可得:100.3μ=,0.3σ=. 因为所有样本都在区间()99.4,101.2, 故该切割设备质量合格.(2)对方案2,设零件价格的随机变量为X ,故X 可取60,100, 根据(1)中所求,可得()()()10099.7100.320.47725P X P x P x μσμ==<<=-<<=;()()6011000.52275P X P X ==-==.故()600.522751000.47725600.51000.477770E X =⨯+⨯>⨯+⨯=>. 又方案1中,每个零件售价均为70,故可得方案2的利润更大.【点睛】本题考查平均数和方差标准差的计算,涉及正态分布,随即变量数学期望的求解,属综合中档题.。

(典型题)高中数学必修三第一章《统计》测试(有答案解析)(1)

(典型题)高中数学必修三第一章《统计》测试(有答案解析)(1)

一、选择题1.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元2.某班统计一次数学测验的平均分与方差,计算完毕才发现有位同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( )A .1x x =,221s s = B .1x x =,221s s < C .1x x =,221s s >D .1x x <,221s s =3.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+4.某赛季甲、乙两名篮球运动员每场比赛得分用茎叶图表示,茎叶图中甲得分的部分数据丢失(如图),但甲得分的折线图完好,则下列结论正确的是( )A .甲得分的极差是11B .乙得分的中位数是18.5C .甲运动员得分有一半在区间[]20,30上D .甲运动员得分的平均值比乙运动员得分的平均值高5.一组数据的平均数为x ,方差为2s ,将这组数据的每个数都乘以()0a a>得到一组新数据,则下列说法正确的是( ) A .这组新数据的平均数为x B .这组新数据的平均数为a x + C .这组新数据的方差为2asD .这组新数据的标准差为2a s6.已知某8个数的平均数为3,方差为2,现加入一个新数据3,此时这9个数的平均数为x ,方差为2s ,则( ) A .3x =,22s < B .3x =,22s > C .3x >,22s <D .3x >,22s >7.如图是两组各7名同学体重(单位:kg )数据的茎叶图,设1、2两组数据的平均数依次为1x 和2x ,标准差依次为12s s 、,那么( )(注:标准差222121[()()...()]n s x x x x x x n=-+-++-A .1212,x x s s >>B .1212,x x s s ><C .1212,x x s s <<D .1212,x x s s8.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x (万元)8.28.610.011.311.9支出y (万元)6.27.58.0 8.59.8根据上表可得回归直线方程ˆˆˆybx a =+,其中ˆˆˆ0.76,b a y bx ==-,据此估计,该社区一户收入为15万元家庭年支出为( ) A .11.4万元 B .11.8万元C .12.0万元D .12.2万元9.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和9210.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,则该45名学生的数学成绩的中位数为( )A .127B .128C .128.5D .12911.已知一组数据12,,,n x x x 的平均数3x =,则数据1232,32,,32n x x x +++的平均数为( ) A .3B .5C .9D .1112.下列说法:①设有一个回归方程35y x =-,变量x 增加一个单位时,y 平均增加5个单位;②线性回归直线ˆybx a =+必过必过点(),x y ;③在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病;其中错误的个数是( ) A .0B .1C .2D .3二、填空题13.如图是某地区2018年12个月的空气质量指数以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述正确的是______.①2月相比去年同期变化幅度最小,3月的空气质量指数最高;②第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小; ③第三季度空气质量指数相比去年同期变化幅度的方差最小; ④空气质量指数涨幅从高到低居于前三位的月份为6、8、4月.14.通过市场调查,得到某种产品的资金投入x (单位:万元)与获得的利润y (单位:万元)的数据,如表所示: 资金投入x 2 3 4 5 6 利润y0.40.611.21.8根据表格提供的数据,用最小二乘法求线性回归直线方程为0.36ˆˆybx =-,现投入资金15万元,求获得利润的估计值(单位:万元)为_____________.15.一组数据由小到大依次为2,4,5,7,,,12,13,14,15a b ,且平均数为9,则49a b+的最小值为________.16.下图是华师一附中数学讲故事大赛7位评委给某位学生的表演打出的分数的茎叶图.记分员在去掉一个最高分和一个最低分后,算得平均分为91分,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若记分员计算无误,则数字x 应该是____________.17.已知一组数据:5.7,5.8,6.1,6.4,6.5,则该数据的方差是__________.18.某班60名学生参加普法知识竞赛,成绩都在区间[40100],上,其频率分布直方图如图所示,则成绩不低于60分的人数为___.19.某校高三年级共有800名学生,现采用系统抽样的方法,抽取25名学生做问卷调查,将这800名学生按1,2,...,800随机编号,按编号顺序平均分组.若从第5组抽取的编号为136,则从第2组中抽取的编号为__________.20.如图是某工厂对一批新产品长度(单位:)mm 检测结果的频率分布直方图.估计这批产品的中位数为______.三、解答题21.“湖广熟,天下足”,鱼米之乡的湖北是全国重要的农产品生产地.而受疫情影响,像莲藕、小龙虾等湖北很多优质农副产品近期都面临销售难题.为了让淜北尽快恢复正常,央视主持人朱广权化身直播带货官,和网红们一起为湖北产品做公益直播.在为湖北某地区的小龙虾进行带货时,需大致了解该地区小龙虾的产量,通过调查发现湖北某地区近几年的小龙虾产量统计如下表: 年份 2014 2015 2016 2017 2018 2019 年份代码t 1 2 3 4 5 6 年产量y (万吨)6.66.97.47.788.4(1)根据表中数据,建立关于t 的线性回归方程y bt a =+; (2)请你根据线性回归方程预测今年(2020年)该地区小龙虾的年产量.附:对于一组数据()11,t y ,()22,t y ,…,(),n n t y ,其回归直线y bt a =+的斜率和截距的最小二乘估计分别为:()()()121ˆniii ni i t t y y bt t ==--=-∑∑,a y bt =-.(参考数据:()()616.3ii i tty y =--=∑)22.“水是生命之源”,但是据科学界统计可用淡水资源仅占地球储水总量的2.8%,全世界近80%人口受到水荒的威胁.某市为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (吨):一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照00.50.51,...,[[[44.5,),,),)分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有60万居民,估计全市居民中月均用水量不低于2.5吨的人数,并说明理由;(3)若该市政府希望使82%的居民每月的用水不按议价收费,估计x 的值,并说明理由.23.某微商对某种产品每天的销售量(单位:件)进行为期一个月(按30天计算)的数据统计分析,并得出了这种产品该月销售量的频率分布直方图(如图).假设用直方图中所得的频率来估计相应事件发生的概率.(Ⅰ)求频率分布直方图中a 的值;(Ⅱ)若微商在一天的销售量不低于25件,则上级商企会给微商赠送100元的礼金,估计该微商在一年内获得的礼金数.24.某市为了解疫情过后制造业企业的复工复产情况,随机调查了100家企业,得到这些企业4月份较3月份产值增长率x 的频率分布表如下:(1)估计制造业企业中产值增长率不低于60%的企业比例及产值负增长的企业比例; (2)求制造业企业产值增长率的平均数与方差的估计值(同一组中的数据用该组区间的中点值为代表).25.某校为了了解甲、乙两班的数学学习情况,从两班各抽出10名学生进行数学水平测试,成绩如下(单位:分):甲班:82 84 85 89 79 80 91 89 79 74 乙班:90 76 86 81 84 87 86 82 85 83 (1)求两个样本的平均数; (2)求两个样本的方差和标准差; (3)试分析比较两个班的学习情况.26.近年来,国家对西部发展出台了很多优惠政策,为了更有效促进发展,需要对一种旧能源材料进行技术革新,为了了解此种材料年产量x (吨)对价格y (万元/吨)和年利润z (万元)的影响,有关部门对近五年此种材料的年产量和价格统计如表,若 5.5y =.(1)求表格中c 的值;(2)求y 关于x 的线性回归方程y bx a =+;(3)若每吨该产品的成本为2万元,假设该产品可全部卖出,预测当年产量为多少时,年利润z 取得最大值?参考公式:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.2.C解析:C 【分析】根据平均数和方差公式计算比较即可. 【详解】设这个班有n 个同学,分数分别是123,,,,n a a a a ⋅⋅⋅,假设第i 个同学的成绩没录入,这一次计算时,总分是()1n x -,方差为()()()()()222222121111i i n s a x a x a x a x a x n -+⎡⎤=-+-+⋅⋅⋅+-+-+⋅⋅⋅+-⎣⎦-; 第二次计算时,()11n nxx x -+=x =,方差为()()()()()()222222221121111++i i i n n s a x a x a x a x a x a x s n n-+-⎡⎤=-+-⋅⋅⋅-+-+-+⋅⋅⋅+-=⎣⎦故有1x x =,221s s >.故选:C 【点睛】本题主要考查样本的平均数和方差公式;属于中档题.3.D解析:D 【分析】根据散点图的分布可选择合适的函数模型. 【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+. 故选:D. 【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.4.D解析:D 【分析】根据茎叶图和折线图依次判断每个选项得到答案. 【详解】A. 甲得分的极差是28919-=,A 错误;B. 乙得分的中位数是161716.52+=,B 错误; C. 甲运动员得分在区间[]20,30上有3个,C 错误; D. 甲运动员得分的平均值为:912131315202628178+++++++=,乙运动员得分的平均值为:914151617181920168+++++++=,故D 正确.故选:D . 【点睛】本题考查了茎叶图和折线图,意在考查学生的计算能力和理解能力.5.D解析:D 【分析】根据平均数及方差的定义可知,一组数据的每个数都乘以a 得到一组新数据,平均值变为原来a 倍,方差变为原来2a 倍. 【详解】设一组数据1234,,,,,n x x x x x ⋯的平均数为x ,方差为2s , 则平均值为()12341n ax ax ax ax ax ax n++++⋯+=, ()()()()()22222212341n s x xxxxxxxx x n ⎡⎤=-+-+-+-+⋯+-⎢⎥⎣⎦,()()()()()222222212341n ax axaxaxaxaxaxaxax ax a s n ⎡⎤∴-+-+-+-+⋯+-=⋅⎢⎥⎣⎦故选:D. 【点睛】本题主要考查了方差,平均数的概念,灵活运用公式计算是解题关键,属于中档题.6.A解析:A 【分析】由题意计算出加入新数据后的平均数,然后比较方差 【详解】()18138x x +⋯+=, ()181339x x +⋯++=, 3x ∴=,由方差的定义可知加入新数据3,样本数据会变得更加稳定 故22s < 故选A 【点睛】本题主要考查了加入数据后平均数和方差的变化,代入公式计算出结果,较为基础7.C解析:C 【分析】由茎叶图分别计算出两组数的平均数和标准差,然后比较大小 【详解】读取茎叶图得到两组数据分别为: (1)53565758617072,,,,,, (2)54565860617273,,,,,,()()11503678112022617x kg =+⨯++++++=,()()215046810112223627x kg =+⨯++++++=,()()()2221131653615661...726177s ⎡⎤=-+-++-=⎣⎦, ()()()2222134254625662 (736277)s ⎡⎤=-+-++-=⎣⎦, 则1212,x x s s << 故选C 【点睛】本题给出茎叶图,需要求出数据的平均数和方差,着重考查了茎叶图的认识,样本特征数的计算等知识,属于基础题.8.B解析:B 【解析】 试题分析:由题,,所以.试题 由已知,又因为ˆˆˆybx a =+,ˆˆˆ0.76,b a y bx ==- 所以,即该家庭支出为万元.考点:线性回归与变量间的关系. 9.A解析:A【解析】8个班参加合唱比赛的得分从小到大排列分别是87,89,90,91,92,93,94,96,中位数是91,92,的平均数91.5,平均数是87+89+90+91+92+93+94+968=91.5 10.D解析:D【解析】分析:由茎叶图得出45名学生的数学成绩,从而求出中位数.详解:根据茎叶图得出45名学生的数学成绩,可知中位数为129.故选D.点睛:本题考查了茎叶图的应用问题,解题时应根据茎叶图中的数据,进行解答,属基础题..11.D解析:D【解析】分析:一组数据中的每一个数加或减一个数,它的平均数也加或减这个数;;依此规律求解即可.详解::∵一组数据12,,,n x x x 的平均数为3,∴另一组数据1232,32,,32n x x x +++的平均数 121211323232[32]33211n n x x x x x x n n n=++++⋯++=++⋯++=⨯+=()(), 故选D.点睛:本题考查了平均数,平均数是指在一组数据中所有数据之和再除以数据的个数.它是反映数据集中趋势的一项指标.12.C解析:C【解析】分析:利用回归方程和独立性检验对每一个命题逐一判断.详解:对于①,一个回归方程35y x =-,变量x 增加一个单位时,y 应平均减少5个单位,所以该命题是错误的;对于②,线性回归直线ˆybx a =+必过必过点(),x y ,是正确的;对于③,在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,并不能说明他有99%的可能患肺病,所以该命题是错误的.故答案为:C.点睛:本题主要考查回归方程和独立性检验,意在考查学生对这些知识的掌握水平和分析推理能力.二、填空题13.①②③【分析】根据折线的变化率得到相比去年同期变化幅度、升降趋势逐一验证即可【详解】根据折现统计图可得2月相比去年同期变化幅度最小3月的空气质量指数最高故①正确;第一季度的空气质量指数的平均值最大第解析:①②③【分析】根据折线的变化率,得到相比去年同期变化幅度、升降趋势,逐一验证即可.【详解】根据折现统计图可得,2月相比去年同期变化幅度最小,3月的空气质量指数最高,故①正确;第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小,故②正确;第三季度空气质量指数相比去年同期变化幅度的方差最小,故③正确;空气质量指数涨幅从高到低居于前三位的月份为6、8、9月,故④错误,故答案为:①②③.【点睛】本题考查条形统计图和折线图的应用,重点考查数据分析,从表中准确获取信息是关键,属于中档题型.14.【分析】根据线性回归方程过样本数据中心点可求出b 代入即可求解【详解】由表中数据可得所以过点代入可得所以当时即获得利润大约为万元故答案为:【点睛】本题主要考查了线性回归方程样本数据中心点线性回归方程的解析:4.74【分析】根据线性回归方程过样本数据中心点,可求出b ,代入15x =即可求解.【详解】 由表中数据可得4,1x y ==,所以0.36ˆˆybx =-过点(4,1), 代入可得0.34b =,所以ˆˆ0.340.36yx =-, 当15x =时,0.34150.34ˆ6 4.7y=⨯-=, 即获得利润大约为4.74万元.故答案为:4.74【点睛】本题主要考查了线性回归方程,样本数据中心点,线性回归方程的应用,属于中档题.15.【分析】由已知可得利用基本不等式即可求出的最小值【详解】一组数据由小到大依次为且平均数为9故当且仅当时等号成立的最小值为故答案为:【点睛】本题考查基本不等式在最值中的应用关键要对1做代换属于中档题 解析:2518【分析】由已知可得18,712a b a b +=≤≤≤,利用基本不等式,即可求出49a b +的最小值. 【详解】一组数据由小到大依次为2,4,5,7,,,12,13,14,15a b ,且平均数为9,故18,712,118a b a b a b ++=≤≤≤=, 49149()()18a b a b a b+=++ 149125(13)(13181818b a a b =++≥+= 当且仅当3654,55a b ==时,等号成立, 49a b+的最小值为2518. 故答案为:2518【点睛】本题考查基本不等式在最值中的应用,关键要对“1”做代换,属于中档题. 16.1【分析】因为题目中要去掉一个最高分所以对进行分类讨论然后结合平均数的计算公式求出结果【详解】若去掉一个最高分和一个最低分86分后平均分为不符合题意故最高分为94分去掉一个最高分94分去掉一个最低分解析:1【分析】因为题目中要去掉一个最高分,所以对x 进行分类讨论,然后结合平均数的计算公式求出结果【详解】若4x >,去掉一个最高分()90x +和一个最低分86分后,平均分为()1899291949291.65++++=,不符合题意,故4x ≤,最高分为94分,去掉一个最高分94分,去掉一个最低分86分后,平均分()18992909192915x +++++=,解得1x =,故数字x 为1【点睛】本题考查了由茎叶图求平均值,理解题目意思运用平均数计算公式即可求出结果,注意分类讨论17.1【解析】分析:先利用平均数公式求出平均数再利用方差公式即可得结果详解:的平均数为的方差为故答案为点睛:本题考查主要考查平均数公式与方差公式属于基础题样本数据的算术平均数公式;样本方差公式标准差解析:1【解析】分析:先利用平均数公式求出平均数,再利用方差公式即可得结果.详解:5.7,5.8,6.1,6.4,6.5的平均数为5.7+5.8+6.1+6.4+6.5 6.15=, 5.7,5.8,6.1,6.4,6.5∴的方差为()()()()()222225.7 6.1+5.8 6.1+6.1 6.1+6.4 6.1+6.5 6.10.15-----=,故答案为0.1. 点睛:本题考查主要考查平均数公式与方差公式,属于基础题. 样本数据的算术平均数公式 12n 1(x +x +...+x )x n =;样本方差公式2222121[()()...()]n s x x x x x x n=-+-++-,标准差s =18.30【解析】由题意可得:则成绩不低于分的人数为人解析:30【解析】由题意可得:()400.0150.0300.0250.0051030⨯+++⨯=则成绩不低于60分的人数为30人19.8【解析】由题意得从名学生中采用系统抽样的方法抽取名学生需要把名学生平均分成组每组人设第一组抽取的号码为则第组抽取的号码为解得点睛:本题考查了抽样方法中的系统抽样问题对于系统抽样的抽法是先对总体编号解析:8【解析】由题意得,从800名学生中采用系统抽样的方法抽取25名学生,需要把800名学生平均分成25组,每组8003225=人, 设第一组抽取的号码为x ,则第5组抽取的号码为432136x +⨯=,解得8x =. 点睛:本题考查了抽样方法中的系统抽样问题,对于系统抽样的抽法是先对总体编号,根据样本平均分组,确定组距,再在第一组中抽取一个编号,依次等距抽取,其中把握系统抽样的原则是解答此类问题的关键.20.5【解析】根据频率分布直方图得;∵002×5+004×5=03<0503+008×5=07>05;∴中位数应在20∼25内设中位数为x 则03+(x−20)×008=05解得x=225;∴这批产品的中解析:5【解析】根据频率分布直方图,得;∵0.02×5+0.04×5=0.3<0.5,0.3+0.08×5=0.7>0.5;∴中位数应在20∼25内,设中位数为x ,则0.3+(x −20)×0.08=0.5,解得x =22.5;∴这批产品的中位数是22.5.故答案为22.5.点睛:用频率分布直方图估计总体特征数字的方法:①众数:最高小长方形底边中点的横坐标;②中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;③平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.三、解答题21.(1)0.36 6.24y x =+;(2)8.76万吨.【分析】(1)由题意求得知 3.5t =,7.5=y ,()62117.5i i t t =-=∑,运用公式求得b ,代入可求得y 关于t 的线性回归方程.(2)由(1)得的线性回归方程,代入年份代码7t =计算,可预测2020年该地区小龙虾的年产量.【详解】(1)由题知 3.5t =,7.5=y ,()62117.5i i t t =-=∑,()()()61621 6.30.3617.5ˆi ii i i t t y y b t t ==--===-∑∑, 又 6.24=-=a y bt .所以,y 关于t 的线性回归方程为0.36 6.24y x =+.(2)由(1)得,当年份为2020年时,年份代码7t =,此时0.367 6.248.76=⨯+=y .所以,可预测,2020年该地区小龙虾的年产量为8.76万吨.【点睛】本题考查线性回归方程的求解,利用线性回归方程对总体进行估计,属于中档题.22.(1)0.3;(2)16.2万;(3)2.8吨.【分析】(1)通过频率之和为1,构造方程求得结果;(2)计算出样本中不低于2.5吨人数占比,从而求得全市的人数;(3)由频率分布直方图频率分布可知2.53x <<,然后根据平均分布列方程求得相应结果.【详解】(1)由概率统计相关知识,可知各组频率之和的值为1即频率分布直方图各小矩形面积之和为1()0.50.080.160.40.520.120.080.0421a ∴⨯+++++++=解得:0.3a =(2)由图可知,不低于2.5吨人数所占百分比为()0.50.30.120.080.0427%⨯+++= ∴全市月均用水量不低于2.5吨的人数为:600.2716.2⨯=(万)(3)由(2)可知,月均用水量小于2.5吨的居民人数所占百分比为:73%即73%的居民月均用水量小于2.5吨,同理,88%的居民月均用水量小于3吨故2.53x <<假设月均用水量平均分布,则()82%73%2.5 2.80.3x -=+=(吨) 注:本次估计默认组间是平均分布,与实际可能会产生一定误差【点睛】本题考查补全频率分布直方图、利用频率分布直方图估计总体数据特征的问题,属于基础题.23.(Ⅰ)0.02;(Ⅱ)10800元.【分析】(Ⅰ)由频率分布直方图中小矩形面积和为1能求出a .(Ⅱ)根据频率分布直方图,日销售量不低于25件的天数为(0.040.02)5309+⨯⨯=,一个月可获得的奖励为900元,由此可以估计一年内获得的礼金数.【详解】(Ⅰ)由题意可得1[1(0.010.060.070.04)5]0.025a =-+++⨯=. (Ⅱ)根据频率分布直方图知,日销售量不低于25件的天数为: ()0.040.025309+⨯⨯=(天),一个月可获得的礼金数为9100900⨯=(元),依此可以估计该微商一年内获得的礼金数为9001210800⨯=元.【点睛】本题考查频率的求法,考查频率分布直方图的性质等基础知识,考查样本估计总体以及运算求解能力、数形结合思想的应用,是基础题.24.(1)4%,13%.;(2)平均数为0.20,方差的估计值为0.0364.【分析】(1)直接根据频率分布表即可得到答案.(2)首先根据频率分布表估计企业产值增长率的平均数,然后再求方差即可.【详解】(1)制造业企业中产值增长率不低于60%的企业比例为4100%4%100⨯=, 产值负增长的企业比例13100%13%100⨯=, 所以制造业企业中产值增长率不低于60%的企业比例4%,产值负增长的企业比例13%. (2)100家制造业企业产值增长率的平均数为()1130.10400.10350.3080.5040.700.20100⎡⎤⨯-+⨯+⨯+⨯+⨯=⎣⎦, 方差为()222221130.100.2040(0.100.20)35(0.300.20)8(0.500.20)4(0.700.20)100⎡⎤⨯--+⨯-+⨯-+⨯-+⨯-⎣⎦0.0364=所以制造业企业产值增长率的平均数为0.20,方差的估计值为0.0364.【点睛】本题第一问考查频率分布表,第二问考查根据频率分布表估计平均值和方差,同时考查学生的计算能力,属于中档题.25.(1)=83.2x 甲,=84x 乙;(2)22=26.36=13.2S S 甲乙,,=5.13S 甲,=3.63S 乙;(3)乙班的总体学习情况比甲班好【解析】试题分析:每组样本数据有10个,求样本的平均数利用平均数公式,10个数的平均数等于这10个数的和除以10;比较平均分的大小可以看出两个班学生平均水平的高低,求样本的方差只需使用方差公式,求这10个数与平均数的差的平方方和再除以10;比较两组数据方差的大小就可得出两组数据的标准差的大小,标准差较小者成绩较稳定 .试题(1)x 甲=110×(82+84+85+89+79+80+91+89+79+74)=83. 2, x 乙=110×(90+76+86+81+84+87+86+82+85+83)=84. (2)2S 甲=110×[(82-83. 2)2+(84-83. 2)2+(85-83. 2)2+(89-83. 2)2+(79-83. 2)2+(80-83. 2)2+(91-83. 2)2+(89-83. 2)2+(79-83. 2)2+(74-83. 2)2]=26. 36, 2S 甲=110[(90-84)2+(76-84)2+(86-84)2+(81-84)2+(84-84)2+(87-84)2+(86-84)2+(82-84)2+(85-84)2+(83-84)2]=13. 2, 则s 甲,s 乙≈3. 63.(3)由于x x <甲乙,则甲班比乙班平均水平低.由于S S >甲乙,则甲班没有乙班稳定. 所以乙班的总体学习情况比甲班好【点睛】怎样求样本的平均数,n 个数的平均数等于这n 个数的和除以n ;比较平均数的大小可以看出两个样本平均水平的高低,怎样求样本的方差,就是求这n 个数与平均数的差的平方方和再除以n ;比较两组数据方差的大小就可得出两组数据的标准差的大小,标准差较小者成绩较稳定 .26.(1)2.5;(2) 1.49.7y x =-+;(3)年产量约为3.5吨时,年利润z 取得最大值.【分析】(1)由均值概念求得c ;(2)根据所给数据计算系数即得;(3)利用(2)中回归直线方程作出预估值进行计算利润后,再由二次函数性质得最大值.【详解】(1)8764 5.55c y ++++==,解得 2.5c =; (2)1234535x ++++==, 5118275 2.568.5ii i x y ==⨯+⨯++⨯=∑, 1222222168.553 5.5 1.4(125)53n i ii n i i x y nx y b x nx==--⨯⨯===-+++-⨯-∑∑,5.5(1.4)39.7a y bx =-=--⨯=,所以回归直线方程为 1.49.7y x =-+.(3)由(2)2(2)(1.49.7) 1.49.7z y x x x x x =-=-+=-+, 所以9.7 3.52( 1.4)x =-≈⨯-(吨)利润最大. 【点睛】本题考查线性回归直线方程,考查回归方程的实际应用.考查学生的数据处理能力,运算求解能力.。

人教版数学必修三统计单元测试

人教版数学必修三统计单元测试

人教版数学必修三统计单元测试SANY标准化小组 #QS8QHH-HHGX8Q8-GNHHJ8-HHMHGN#第二章 必修三统计单元测试一、选择题(本大题共12小题,每小题5分,共60分)1.从某年级1 000名学生中抽取125名学生进行体重的统计分析,就这个问题来说,下列说法正确的是( )A .1 000名学生是总体B .每个被抽查的学生是个体C .抽查的125名学生的体重是一个样本D .抽取的125名学生的体重是样本容量2.由小到大排列的一组数据x 1,x 2,x 3,x 4,x 5,其中每个数据都小于-1,那么对于样本1,x 1,-x 2,x 3,-x 4,x 5的中位数可以表示为( )(1+x 2) (x 2-x 1) (1+x 5) (x 3-x 4)3.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36的样本,则老年人、中年人、青年人分别应抽取的人数是( )A .7,11,19B .6,12,18C .6,13,17D .7,12,174.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图2.由这两个散点图可以判断( ) A .变量x 与y 正相关,u 与v 正相关 B .变量x 与y 正相关,u 与v 负相关 C .变量x 与y 负相关,u 与v 正相关 D .变量x 与y 负相关,u 与v 负相关5.已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是2,方差是13,那么另一组数3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数,方差分别是( )A .2,13B .2,1C .4,23D .4,36.某学院有4个饲养房,分别养有18,54,24,48只白鼠供实验用.某项实验需抽取24只白鼠,你认为最合适的抽样方法是( ) A .在每个饲养房各抽取6只B .把所有白鼠都加上编有不同号码的颈圈,用随机抽样法确定24只C .从4个饲养房分别抽取3,9,4,8只D .先确定这4个饲养房应分别抽取3,9,4,8只,再由各饲养房自己加号码颈圈,用简单随机抽样的方法确定7.下列有关线性回归的说法,不正确的是( )A .相关关系的两个变量不一定是因果关系B .散点图能直观地反映数据的相关程度C .回归直线最能代表线性相关的两个变量之间的关系D .任一组数据都有回归直线方程 8.已知施肥量与水稻产量之间的回归直线方程为y ^=+257,则施肥量x =30时,对产量y 的估计值为( )A .B .C .400D .9.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A.甲地:总体均值为3,中位数为4 B.乙地:总体均值为1,总体方差大于0 C.丙地:中位数为2,众数为3 D.丁地:总体均值为2,总体方差为3 10.某高中在校学生2 000人,高一与高二人数相同并都比高三多1人.为了响应“阳光体育运动”号召,学校举行了“元旦”跑步和登山比赛活动.每人都参加而且只参与了其高一高二高三跑步a b c登山x y z其中a∶b∶c=2∶3∶5,全校参与登山的人数占总人数的25.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则高二参与跑步的学生中应抽取( )A.36人 B.60人 C.24人 D.30人11.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们所有比赛得分的情况用如右图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为( )A.19,13 B.13,19 C.20,18D.18,2012.从一堆苹果中任取了20个,并得到它们的质量(单位:克)数据分组[90,100)[100,110)[110,120)[120,130)[130,140)[140,150]频数1231031A.题号123456789101112答案二、填空题(本大题共13.甲、乙、丙、丁四名射击手在选拔赛中的平均环数x及其标准差s如下表所示,则选送决赛的最佳人选应是甲乙丙丁7887s314.一组数据23,27,20,18,是________.15.某市居民2005~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)年份20052006200720082009收入x1315支出________线性相关关系.16.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温.由表中数据得回归直线方程y =b x +a 中b =-2,据此预测当气温为5℃时,用电量的度数约为______.三、解答题(本大题共6小题,共70分)17.(10分)一批产品中,有一级品100个,二级品60个,三级品40个,用分层抽样的方法,从这批产品中抽取一个容量为20的样本,写出抽样过程.18.(12分)为了了解学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)学生跳绳次数的中位数落在哪个小组内 (2)第二小组的频率是多少样本容量是多少(3)若次数在110以上(含110次)为良好,试估计该学校全体高一学生的良好率是多少19.(12分)为了研究三月下旬的平均气温(x )与四月棉花害虫化蛹高峰日(y )的关系,某地区观察了2003已知x 与y 为27℃,试估计2010年四月化蛹高峰日为哪天20.(12分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y ((1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的回归直线方程y ^=b ^x +a ^;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤 (参考数值:3×+4×3+5×4+6×=21.(12分)农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种麦苗的试验田中各抽取6株麦苗测量麦苗的株高,数据如下:(单位:cm) 甲:9,10,11,12,10,20 乙:8,14,13,10,12,21.(1)在右面给出的方框内绘出所抽取的甲、乙两种麦苗株高的茎叶图;(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗的长势情况.22.(12分)从高三抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图.试利用频率分布直方图求:(1)这50名学生成绩的众数与中位数. (2)这50名学生的平均成绩.第二章 统 计1.C [在初中学过:“在统计中,所有考察对象的全体叫做总体,其中每一个所要考察的对象叫做个体,从总体中抽取的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本容量.”因此题中所指的对象应是体重,故A 、B 错误,样本容量应为125,故D 错误.]2.C [由题意把样本从小到大排序为x 1,x 3,x 5,1,-x 4,-x 2,因此得中位数为12(1+x 5).]3.B [因27∶54∶81=1∶2∶3,16×36=6,26×36=12,36×36=18.]4.C [由点的分布知x 与y 负相关,u 与v 正相关.]5.D [因为数据x 1,x 2,x 3,x 4,x 5的平均数是2,方差是13,所以x =2,15∑5i =1 (x i -2)2=13,因此数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数为: 15∑5i =1 (3x i -2)=3×15∑5i =1x i -2=4, 方差为:15∑5i =1 (3x i -2-x )2=15∑5i =1 (3x i -6)2=9×15∑5i =1 (x i -2)2=9×13=3.]6.D [因为这24只白鼠要从4个饲养房中抽取,因此要用分层抽样决定各个饲养房应抽取的只数,再用简单随机抽样法从各个饲养房选出所需白鼠.C 虽然用了分层抽样,但在每个层中没有考虑到个体的差异,也就是说在各个饲养房中抽取样本时,没有表明是否具有随机性,故选D.]7.D [根据两个变量具有相关关系的概念,可知A 正确,散点图能直观地描述呈相关关系的两个变量的相关程度,且回归直线最能代表它们之间的相关关系,所以B 、C 正确.只有线性相关的数据才有回归直线方程,所以D 不正确.]8.B [成线性相关关系的两个变量可以通过回归直线方程进行预测,本题中当x =30时,y ^=×30+257=.]9.D [由于甲地总体均值为3,中位数为4,即中间两个数(第5、6天)人数的平均数为4,因此后面的人数可以大于7,故甲地不符合.乙地中总体均值为1,因此这10天的感染人数总和为10,又由于方差大于0,故这10天中不可能每天都是1,可以有一天大于7,故乙地不符合.丙地中中位数为2,众数为3,3出现的最多,并且可以出现8,故丙地不符合.故丁地符合.]10.A [由题意知高一、高二、高三的人数分别为667,667,666. 设a =2k ,b =3k ,c =5k ,则a +b +c =35×2 000,即k =120.∴b =3×120=360.又2 000人中抽取200人的样本,即每10人中抽取一人,则360人中应抽取36人,故选A.]11.A [分别将甲、乙两名运动员的得分从小到大排列,中间位置的分数则为中位数.]12.B [由数据分布表可知,质量不小于120克的苹果有10+3+1=14(个),占苹果总数的1420×100%=70%.]13.乙解析 平均数反映平均水平大小,标准差表明稳定性.标准差越小,稳定性越好. 14.2215.13 正 16.40解析 ∵x =14(14+12+8+6)=10,y =14(22+26+34+38)=30,∴a ^=y -b ^x =30+2×10=50.∴当x =5时,y ^=-2×5+50=40. 17.解 分层抽样方法:先将总体按其级别分为三层,一级品有100个,产品按00,01,…,99编号,二级品有60个,产品按00,01,…,59编号,三级品有40个,产品按00,01,…,39编号.因总体个数∶样本容量为10∶1,故用简单随机抽样的方法,在一级品中抽10个,二级品中抽6个,三级品中抽4个.这样就可得到一个容量为20的样本.18.解 (1)∵前三组的频率和为2+4+1750=2350<12,前四组的频率之和为2+4+17+1550=3850>12,∴中位数落在第四小组内.(2)频率为:42+4+17+15+9+3=,又∵频率=第二小组频数样本容量,∴样本容量=频数频率=错误!=150. (3)由图可估计所求良好率约为:17+15+9+32+4+17+15+9+3×100%=88%.19.解 由题意知: x ≈,y =,∑6i =1x 2i =5 , ∑6i =1x i y i =1 , ∴b ^=∑6i =1x i y i -6x y ∑6i =1x 2i -6x 2≈-,a ^=y -b ^x ≈,∴回归方程为y ^=-+.当x =27时,y ^=-×27+=,据此,可估计该地区2010年4月12日或13日为化蛹高峰日.20.解 (1)散点图如下:(2)x =3+4+5+64=,y =错误!=,∑4i =1x i y i =3×+4×3+5×4+6×=, ∑4i =1x 2i =32+42+52+62=86, ∴b ^=∑4i =1x i y i -4x y ∑4i =1x 2i -4x 2=错误!=,a ^=y -b ^ x =-×=.∴y ^=+.∴所求的回归直线方程为y ^=+. (3)现在生产100吨甲产品用煤y ^=×100+=,∴90-=.∴生产能耗比技改前降低约吨标准煤. 21.解 (1)茎叶图如图所示:(2)x 甲=9+10+11+12+10+206=12,x 乙=8+14+13+10+12+216=13,s2甲=16×[(9-12)2+(10-12)2+(11-12)2+(12-12)2+(10-12)2+(20-12)2]≈,s2乙=16×[(8-13)2+(14-13)2+(13-13)2+(10-13)2+(12-13)2+(21-13)2]≈.因为x甲<x乙,所以乙种麦苗平均株高较高,又因为s2甲<s2乙,所以甲种麦苗长的较为整齐.22.解(1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形框的中间值的横坐标即为所求,所以众数应为75.由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将频率分布直方图中所有小矩形的面积一分为二的直线所对应的成绩即为所求.∵×10+×10+×10=++=,∴前三个小矩形面积的和为.而第四个小矩形面积为0.03×10=,+>,∴中位数应位于第四个小矩形内.设其底边为x,高为,∴令=得x≈,故中位数约为70+=.(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积即可.∴平均成绩为45××10)+55××10)+65××10)+75××10)+85××10)+95××10)≈74.。

(好题)高中数学必修三第一章《统计》检测卷(答案解析)

(好题)高中数学必修三第一章《统计》检测卷(答案解析)

一、选择题1.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s <>2.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n 个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已知学习时长在[)9,11的学生人数为25,则n 的值为( )A .40B .50C .80D .1003.某赛季甲、乙两名篮球运动员每场比赛得分用茎叶图表示,茎叶图中甲得分的部分数据丢失(如图),但甲得分的折线图完好,则下列结论正确的是( )A .甲得分的极差是11B .乙得分的中位数是18.5C .甲运动员得分有一半在区间[]20,30上D .甲运动员得分的平均值比乙运动员得分的平均值高4.在一段时间内,某种商品的价格x (元)和销售量y (件)之间的一组数据如下表:价格x (元) 4 6 8 10 12 销售量y (件)358910若y 与x 呈线性相关关系,且解得回归直线ˆˆˆybx a =+的斜率0.9b ∧=,则a ∧的值为( ) A .0.2 B .-0.7 C .-0.2 D .0.75.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是( )A .45B .47C .48D .636.已知x ,y 取值如下表:x0 1 4 5 6 8 y 1.31.85.66.17.49.3从所得的散点图分析可知:y 与x 线性相关,且 1.03y x a =+,则a =( ) A .1.53B .1.33C .1.23D .1.137.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系 价格(万元) 25 23.5 22 20.5 销售量(辆)30333639已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆybx =+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39B .42C .45D .508.某宠物商店对30只宠物狗的体重(单位:千克)作了测量,并根据所得数据画出了频率分布直方图如下图所示,则这30只宠物狗体重(单位:千克)的平均值大约为( )A .15.5B .15.6C .15.7D .169.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元10.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变11.为了考察两个变量x 和y 之间的线性相关性,甲.乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2.已知在两个人的试验中发现对变量x 的观测数据的平均值恰好相等,都为s ,对变量y 的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是( ) A .直线l 1和l 2有交点(s ,t)B .直线l 1和l 2相交,但是交点未必是点(s ,t)C .直线l 1和l 2由于斜率相等,所以必定平行D .直线l 1和l 2必定重合 12.已知一组数据12,,,n x x x 的平均数3x =,则数据1232,32,,32n x x x +++的平均数为( ) A .3B .5C .9D .11二、填空题13.某社会爱心组织面向全市征召义务宣传志愿者.现从符合条件的志愿者中随机抽取100名按年龄分组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45),得到的频率分布直方图如图所示.若从第3,4,5组中用分层抽样的方法抽取6名志愿者参与广场的宣传活动,应从第3组抽取__________名志愿者.14.水痘是一种传染性很强的病毒性疾病,易在春天爆发.市疾控中心为了调查某校高年级学生注射水症疫苗的人数,在高一年级随机抽取5个班级,每个班抽取的人数互不相同,若把每个班级抽取的人数作为样本数据.已知样本平均数为7,样本方差为4,则样本数据中的最小值是______.15.中医药是反映中华民族对生命、健康和疾病的认识,具有悠久历史传统和独特理论及技术方法的医药学体系,是中华文明的瑰宝.某科研机构研究发现,某品种中成药的药物成份A 的含量x (单位:g )与药物功效y (单位:药物单位)之间具有关系:(20)y x x =-.检测这种药品一个批次的5个样本,得到成份A 的平均值为8g ,标准差为2g ,估计这批中成药的药物功效的平均值为__________药物单位.16.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:^y =0.245x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_______万元.17.某老师从星期一到星期五收到信件数分别是10,6,8,5,6,则该组数据的方差2s =___________________.18.某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~1000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为_________19.为了解某地区某种农产品的年产量x (单位:吨)对价格y (单位:千元/吨)的影响,对近五年该农产品的年产量和价格统计如下表:x1 2 3 4 5 y 7.06.5m3.82.2已知x 和y 具有线性相关关系,且回归方程为 1.238.69y x =-+,那么表中m 的值为__________.20.某班运动队由足球运动员18人、篮球运动员12人、乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n 的样本,若分别采用系统抽样法和分层抽样法,则都不用剔除个体;当样本容量为n +1时,若采用系统抽样法,则需要剔除1个个体,那么样本容量n 为________.三、解答题21.某微商对某种产品每天的销售量(单位:件)进行为期一个月(按30天计算)的数据统计分析,并得出了这种产品该月销售量的频率分布直方图(如图).假设用直方图中所得的频率来估计相应事件发生的概率.(Ⅰ)求频率分布直方图中a 的值;(Ⅱ)若微商在一天的销售量不低于25件,则上级商企会给微商赠送100元的礼金,估计该微商在一年内获得的礼金数.22.为培养学生在高中阶段的数学能力,某校将举行数学建模竞赛.已知该竞赛共有60名学生参加,他们成绩的频率分布直方图如图所示.(1)估计这60名参赛学生成绩的中位数;(2)为了对数据进行分析,将60分以下的成绩定为不合格.60分以上(含60分)的成绩定为合格,某评估专家决定利用分层抽样的方法从这60名学生中选取10人,然后从这10人中抽取4人参加座谈会,记ξ为抽取的4人中,成绩不合格的人数,求ξ的分布列与数学期望;(3)已知这60名学生的数学建模竞赛成绩Z 服从正态分布()2,Nμσ,其中μ可用样本平均数近似代替,2σ可用样本方差近似代替(同一组数据用该区间的中点值作代表),若成绩在46分以上的学生均能得到奖励,本次数学建模竞赛满分为100分,估计此次竞赛受到奖励的人数(结果根据四舍五人保留整数).参考数据:()0.6827P Z μσμσ-<≤+≈,()220.9545P Z μσμσ-<≤+≈,()330.9973P Z μσμσ-<≤+≈.23.某地区不同身高的未成年男性的体重平均值如下表:(1)根据散点图判断,y a bx =+与xy a b =⋅哪一个能比较近似地反映这个地区未成年男性体重kg y 与身高cm x 的回归方程类型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及下表中数据,建立y 关于x 的回归方程(表中ln i i u y =,0.66 1.93e ≈,0.22 1.02e ≈).xyu()1221ii x x =-∑()()121iii x x y y =--∑ ()()121iii x x u u =--∑11524.0532.9614200 6143.3 284参考公式:()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---⋅==--∑∑∑∑,a y b x =-⋅.24.全世界越来越关注环境保护问题,某监测站点于2016年8月某日起连续n 天监测空气质量指数(AQI ),数据统计如下: 空气质量指数(3/g m μ) 0-50 51-100 101-150 151-200 201-250 空气质量等级 空气优 空气良 轻度污染中度污染 重度污染 天数2040m105(1)根据所给统计表和频率分布直方图中的信息求出,n m 的值,并完成频率分布直方图;(2)在空气质量指数分别为51-100和151-200的监测数据中,用分层抽样的方法抽取5天,从中任意选取2天,求事件A“两天空气都为良”发生的概率.25.近年来,国家对西部发展出台了很多优惠政策,为了更有效促进发展,需要对一种旧能源材料进行技术革新,为了了解此种材料年产量x(吨)对价格y(万元/吨)和年利润z (万元)的影响,有关部门对近五年此种材料的年产量和价格统计如表,若 5.5y=.x 12345y8764c(1)求表格中c的值;(2)求y关于x的线性回归方程y bx a=+;(3)若每吨该产品的成本为2万元,假设该产品可全部卖出,预测当年产量为多少时,年利润z取得最大值?参考公式:1221ni iiniix y nx ybx nx==-=-∑∑,a y bx=-.26.某公司有400名员工,根据男女员工人数比例,用分层随机抽样的方法从中抽取了100人,调查他们的通勤时间(上下班途中花费的总时间,单位:分钟),将数据按照[)20,30,[)30,40,,[]80,90分成7组,并整理得到如下频率分布直方图:(I)从总体中随机抽取1人,估计其通勤时间小于40分钟的概率;(Ⅱ)求样本数据的中位数的估计值;(Ⅲ)已知样本中通勤时间大于或等于60分钟的人都是男员工,通勤时间小于60分钟的人中有一半是男员工,求该公司男员工的人数.【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】根据题中所给的平均数的条件,重新列式求新数据的平均数,根据方差公式写出两组数据的方差,并比较大小. 【详解】 由题意,可得7050806070907050x ⨯+-+-==,设收集的48个准确数据分别记为1248,,,x x x ,则222221248175[(70)(70)(70)(6070)(9070)]50x x x =-+-++-+-+-22212481[(70)(70)(70)500]50x x x =-+-++-+,22222212481[(70)(70)(70)(8070)(7070)]50s x x x =-+-++-+-+-22212481[(70)(70)(70)100]7550x x x =-+-++-+<,所以275s <.故选:A . 【点睛】 本题主要考查了数据的平均数和方差的计算公式的应用,其中解答中熟记数据的平均数和方差的公式,合理准确计算是解答的关键,着重考查了推理与运算能力,是基础题.2.B解析:B 【分析】由频率分布直方图的性质,求得0.25x =,再结合频率分布直方图的频率的计算方法,即可求解. 【详解】由频率分布直方图的性质,可得()20.050.150.051x +++=,解得0.25x =, 所以学习时长在[)9,11的频率2520.5x n==,解得50n =. 故选:B . 【点睛】本题主要考查了频率分布直方图性质及其应用,其中解答中熟记频率分布直方图的性质是解答的关键,着重考查了数据分析能力,以及计算能力.3.D解析:D根据茎叶图和折线图依次判断每个选项得到答案. 【详解】A. 甲得分的极差是28919-=,A 错误;B. 乙得分的中位数是161716.52+=,B 错误; C. 甲运动员得分在区间[]20,30上有3个,C 错误; D. 甲运动员得分的平均值为:912131315202628178+++++++=,乙运动员得分的平均值为:914151617181920168+++++++=,故D 正确.故选:D . 【点睛】本题考查了茎叶图和折线图,意在考查学生的计算能力和理解能力.4.C解析:C 【解析】 【分析】由题意利用线性回归方程的性质计算可得a 的值. 【详解】 由于468101285x ++++==,35891075y ++++==,由于线性回归方程过样本中心点(),x y ,故:70.98a =⨯+, 据此可得:0.2a =-. 故选C . 【点睛】本题主要考查线性回归方程的性质及其应用,属于中等题.5.A解析:A 【解析】 【分析】由茎叶图确定所给的所有数据,然后确定中位数即可. 【详解】各数据为:12 20 31 32 34 45 45 45 47 47 48 50 50 61 63, 最中间的数为:45,所以,中位数为45. 本题选择A 选项. 【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计6.D解析:D 【解析】分析:首先根据题中所给的表中的数据,计算得出样本中心点的坐标,利用回归直线必过样本中心点,代入求得结果. 详解:依题意得,1(014568)46x =⨯+++++=,1(1.3 1.8 5.6 6.17.49.3) 5.256y =+++++=,因为回归直线必过样本中心点(,)x y ,即点(4,5.25),所以有5.25 1.034ˆa=⨯+,解得ˆ 1.13a =,故选D. 点睛:该题考查的是有关回归直线的有关问题,涉及到的知识点有回归直线一定过样本中心点,计算得出相应坐标的平均值,求得样本中心点的坐标,代入求得结果.7.B解析:B 【解析】分析:先求均值,确定ˆb,再求自变量为19对应函数值得结果. 详解:因为2523.52220.5330333639122,344442x y ++++++====,所以1348022,3224ˆb-==- 所以19(2)8042y =⨯-+=选B.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .8.B解析:B 【分析】由频率分布直方图分别计算出各组得频率、频数,然后再计算出体重的平均值 【详解】由频率分布直方图可以计算出各组频率分别为:0.10.20.250.250.15,,,,,0.05 频数为:367.57.54.51.5,,,,, 则平均值为:113136157.5177.519 4.521 1.515.630⨯+⨯+⨯+⨯+⨯+⨯=【点睛】本题主要考查了由频率分布直方图计算平均数,需要注意计算不要出错9.B解析:B 【详解】试题分析:4235492639543.5,4244x y ++++++====, ∵数据的样本中心点在线性回归直线上,回归方程ˆˆˆybx a =+中的ˆb 为9.4, ∴42=9.4×3.5+a , ∴ˆa =9.1,∴线性回归方程是y=9.4x+9.1,∴广告费用为6万元时销售额为9.4×6+9.1=65.5 考点:线性回归方程10.A解析:A 【分析】可以通过n P 与0P 之间的大小关系进行判断. 【详解】当10k -<<时,()011011nk k <+<<+<,, 所以()001nn P P k P =+<,呈下降趋势. 【点睛】判断变化率可以通过比较初始值与变化之后的数值之间的大小来判断.11.A解析:A 【分析】由题意知,两个人在试验中发现对变量x 的观测数据的平均值都是s ,对变量y 的观测数据的平均值都是t ,所以两组数据的样本中心点是(s ,t ),回归直线经过样本的中心点,得到直线l 1和l 2都过(s ,t ). 【详解】∵两组数据变量x 的观测值的平均值都是s , 对变量y 的观测值的平均值都是t , ∴两组数据的样本中心点都是(s ,t ) ∵数据的样本中心点一定在线性回归直线上, ∴回归直线l 1和l 2都过点(s ,t ) ∴两条直线有公共点(s ,t )【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x 与Y 之间的关系,这条直线过样本中心点.12.D解析:D 【解析】分析:一组数据中的每一个数加或减一个数,它的平均数也加或减这个数;;依此规律求解即可.详解::∵一组数据12,,,n x x x 的平均数为3, ∴另一组数据1232,32,,32n x x x +++的平均数121211323232[32]33211n n x x x x x x n n n=++++⋯++=++⋯++=⨯+=()(), 故选D.点睛:本题考查了平均数,平均数是指在一组数据中所有数据之和再除以数据的个数.它是反映数据集中趋势的一项指标.二、填空题13.【分析】先分别求出这3组的人数再利用分层抽样的方法即可得出答案【详解】第3组的人数为第4组的人数为第5组的人数为所以这三组共有60名志愿者所以利用分层抽样的方法在60名志愿者中抽取6名志愿者第三组应 解析:3【分析】先分别求出这3组的人数,再利用分层抽样的方法即可得出答案. 【详解】第3组的人数为10050.0630⨯⨯=, 第4组的人数为10050.0420⨯⨯=, 第5组的人数为1000.02510⨯⨯=, 所以这三组共有60名志愿者,所以利用分层抽样的方法在60名志愿者中抽取6名志愿者,第三组应抽取306360⨯=名, 故答案为:3. 【点睛】关键点点睛:该题考查的是有关频率分布直方图的识别以及分层抽样某层抽取个数的问题,正确解题的关键是掌握在抽取过程中每个个题被抽到的机会均等.14.4【分析】首先设个班抽取的人数由小到大分别为根据题意得到再求数据中的最小值即可【详解】设个班抽取的人数由小到大分别为由题知:即若时则则四个数为:或此时一定有相同的数与已知矛盾若时则则四个数为:此时为解析:4 【分析】首先设5个班抽取的人数由小到大分别为12345,,,,x x x x x ,根据题意得到()()()()()22222123457777720x x x x x -+-+-+-+-=,再求数据中的最小值即可.【详解】设5个班抽取的人数由小到大分别为12345,,,,x x x x x ,由题知:()()()()()222221234517777745x x x x x ⎡⎤-+-+-+-+-=⎣⎦, 即()()()()()22222123457777720x x x x x -+-+-+-+-=. 若13x =时,则()()()()2222234577774x x x x -+-+-+-=, 则()()()()222223457,7,7,7x x x x ----四个数为:1,1,1,1或4,0,0,0, 此时2345,,,x x x x 一定有相同的数,与已知矛盾.若14x =时,则()()()()22222345777711x x x x -+-+-+-=, 则()()()()222223457,7,7,7x x x x ----四个数为:1,0,1,9, 此时12345,,,,x x x x x 为4,6,7,8,10,符合题意. 故答案为:4 【点睛】本题主要考查方差的定义,熟记定义为解题的关键,属于中档题.15.92【解析】【分析】由题可得进而可得再计算出从而得出答案【详解】5个样本成份的平均值为标准差为所以即解得因为所以所以这批中成药的药物功效的平均值药物单位【点睛】本题考查求几个数的平均数解题的关键是求解析:92 【解析】 【分析】由题可得1234540x x x x x ++++=,()()()22212520x x x x x x -+-++-=进而可得222125340x x x +++=,再计算出125y y y +++,从而得出答案.【详解】5个样本12345,,,,x x x x x 成份A 的平均值为8g ,标准差为2g ,所以1234540x x x x x ++++=,()()()22212520x x x x x x -+-++-=,即()22221251252520x x x x x x x x +++-++++=,解得222125340x x x +++=因为2(20)20y x x x x =-=-,所以()()22212512512520460y y y x x x x x x +++=+++-+++=所以这批中成药的药物功效的平均值460925y ==药物单位 【点睛】本题考查求几个数的平均数,解题的关键是求出222125x x x +++,属于一般题.16.245【解析】当变为时=0245(x+1)+0321=0245x+0321+0245而0245x+0321+0245-(0245x+0321)=0245因此家庭年收入每增加1万元年饮食支出平均增加0解析:245 【解析】当x 变为1x +时,y ∧=0.245(x+1)+0.321=0.245x+0.321+0.245,而0.245x+0.321+0.245-(0.245x+0.321)=0.245.因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元,本题填写0.245.17.【解析】试题分析:由平均数及方差的定义可得;考点:样本数据的数字特征:平均值与方差 解析:165【解析】试题分析:由平均数及方差的定义可得10685675x ++++==;222222116[(107)(67)(87)(57)(67)] 3.255s =-+-+-+-+-==.考点:样本数据的数字特征:平均值与方差.18.18【解析】【分析】由题意知抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为即可解得【详解】因为抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为解得【点睛】本题主要考解析:18 【解析】 【分析】由题意知,抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,即可解得. 【详解】因为抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,解得18x =. 【点睛】本题主要考查了系统抽样,属于中档题.19.5【解析】将样本中心代入回归方程得到m=55故答案为:55解析:5 【解析】19.5,15,5my x +== 将样本中心代入回归方程得到m=5.5. 故答案为:5.5. 20.6【解析】n 为18+12+6=36的正约数因为18:12:6=3:2:1所以n 为6的倍数因此因为当样本容量为时若采用系统抽样法则需要剔除1个个体所以n+1为35的正约数因此解析:6 【解析】n 为18+12+6=36的正约数,因为18:12:6=3:2:1,所以n 为6的倍数,因此6,12,18,24,30,36n =因为当样本容量为1n +时,若采用系统抽样法,则需要剔除1个个体,所以n+1为35的正约数,因此6n =三、解答题21.(Ⅰ)0.02;(Ⅱ)10800元. 【分析】(Ⅰ)由频率分布直方图中小矩形面积和为1能求出a .(Ⅱ)根据频率分布直方图,日销售量不低于25件的天数为(0.040.02)5309+⨯⨯=,一个月可获得的奖励为900元,由此可以估计一年内获得的礼金数. 【详解】(Ⅰ)由题意可得1[1(0.010.060.070.04)5]0.025a =-+++⨯=. (Ⅱ)根据频率分布直方图知,日销售量不低于25件的天数为:()0.040.025309+⨯⨯=(天),一个月可获得的礼金数为9100900⨯=(元),依此可以估计该微商一年内获得的礼金数为9001210800⨯=元. 【点睛】本题考查频率的求法,考查频率分布直方图的性质等基础知识,考查样本估计总体以及运算求解能力、数形结合思想的应用,是基础题. 22.(1)中位数为65;(2)分布列见解析;期望为5635;(3)50. 【分析】(1)由图中的数据可判断中位数在60分到80分之间,若设中位数为x ,则()0.005200.01520600.020.5x ⨯+⨯+-⨯=,从而可求得中位数;(2)结合频率分布直方图和分层抽样的方法可知,抽取的10人中合格的人数为6人,不合格的人数为4人,则ξ的可能取值为0,1,2,3,4,求出各自的概率,从而可得ξ的分布列与数学期望;(3)由已知求出=64=18μσ,,从而可得()()6418641846820.6827P Z P Z -<≤+=<≤≈,再利用正态分布的对称性可求得结果 【详解】(1)设中位数为x ,则()0.005200.01520600.020.5x ⨯+⨯+-⨯=,解得65x =,所以这60名参赛学生成绩的中位数为65.(2)结合频率分布直方图和分层抽样的方法可知,抽取的10人中合格的人数为()0.010.0220106+⨯⨯=,不合格的人数为1064-=.由题意可知ξ的可能取值为0,1,2,3,4.则()464101014C P C ξ===,()13464108121C C P C ξ===,()2246410327C C P C ξ===,()31464103435C C C P ξ===,()4441014210C P C ξ===.所以ξ的分布列为所以ξ的数学期望01234142173521035E ξ=⨯+⨯+⨯+⨯+⨯=. (3)由题意可得,()300.005500.015700.02900.012064μ=⨯+⨯+⨯+⨯⨯=,()()()222230640.150640.370640.4σ=-⨯+-⨯+-⨯()290640.2324+-⨯=,则18σ=,由Z 服从正态分布()2,Nμσ,得()()6418641846820.6827P Z P Z -<≤+=<≤≈,则()()18210.68270.158652P Z >≈-=,()460.68270.158650.84135P Z >≈+=,所以此次竞赛受到奖励的人数为600.8413550⨯≈. 【点睛】此题考查频率分布直方图、分层抽样、离散型随机变量的分布列、正态分布等知识,考查分析问题的能力和计算能力,属于中档题 23.(1)x y a b =⋅;(2) 1.93 1.02x y =⨯. 【分析】(1)根据散点图的趋势可以判断回归方程类型.(2)令ln u y =,由x y a b =⋅,得()1212ln ,ln u c x c c b c a =+==,由公式计算可得回归方程. 【详解】(1)根据散点图判断,x y a b =⋅能比较近似地反映这个地区未成年男性体重kg y 与身高cm x 的回归方程类型.(2)令ln u y =,由x y a b =⋅,得()1212ln ,ln u c x c c b c a =+==,()()()121112212840.0214200iii ii x x u u c x x ====--=-∑∑, 而 2.96u =,所以21 2.960.021150.66c u c x =-⋅=-⨯=,0.020.66u x =+,所以0.020.660.660.02 1.93 1.02x x x y e e e +==⨯=⨯,y 关于x 的回归方程为 1.93 1.02x y =⨯.【点睛】本题考查由散点图辨别回归方程的类型,求回归方程,属于中档题. 24.(1)答案见解析;(2)35. 【解析】【试题分析】(1)借助题设中提供的频率分布直方图,算出0-50的频率为0.004500.2⨯=,进而求出样本容量200.2100n =÷=,从而求出25m =,最后完成频率分布直方图;(2)先运用分层抽样的方法求出空气质量指数为51-100和151200-的监测天数中分别抽取4天和1天,即将空气质量指数为51-100的4天分别记为,,,a b c d ;将空气质量指数为151-200的1天记为e ,算出从中任取2天的基本事件数为10种和其中事件A “两天空气都为良”包含的基本事件数为6种,进而算得事件A “两天都为良”发生的概率是()63105P A ==: (1)由频率分布直方图可知0-50的频率为0.004500.2⨯=, 所以200.2100n =÷=,从而25m =, 频率分布直方图补充如下图所示.(2)在空气质量指数为51-100和151200-的监测天数中分别抽取4天和1天,在所抽取的5天中,将空气质量指数为51-100的4天分别记为,,,a b c d ;将空气质量指数为151-200的1天记为e ,从中任取2天的基本事件分别为:(),a b ,(),a c ,(),a d ,(),a e ,(),b c ,(),b d ,(),b e ,(),c d ,(),c e ,(),d e ,共10种.其中事件A “两天空气都为良”包含的基本事件为:(),a b ,(),a c ,(),a d ,(),b c ,(),b d 共6种,所以事件A “两天都为良”发生的概率是()63105P A ==. 25.(1)2.5;(2) 1.49.7y x =-+;(3)年产量约为3.5吨时,年利润z 取得最大值. 【分析】(1)由均值概念求得c ; (2)根据所给数据计算系数即得;(3)利用(2)中回归直线方程作出预估值进行计算利润后,再由二次函数性质得最大值. 【详解】 (1)8764 5.55cy ++++==,解得 2.5c =;(2)1234535x ++++==,5118275 2.568.5i ii x y==⨯+⨯++⨯=∑,1222222168.553 5.51.4(125)53ni ii ni i x y nx yb x nx==--⨯⨯===-+++-⨯-∑∑,5.5(1.4)39.7a y bx =-=--⨯=,所以回归直线方程为 1.49.7y x =-+.(3)由(2)2(2)(1.49.7) 1.49.7z y x x x x x =-=-+=-+, 所以9.73.52( 1.4)x =-≈⨯-(吨)利润最大.【点睛】本题考查线性回归直线方程,考查回归方程的实际应用.考查学生的数据处理能力,运算求解能力.26.(Ⅰ)0.6;(Ⅱ)37.5;(Ⅲ)220. 【分析】(Ⅰ)根据频率分布直方图求解即可;(Ⅱ)先根据频率分布直方图判断中位数落在哪一区间上,然后利用中位数将频率分布直方图的面积分为相等的两部分求解;(Ⅲ)先计算出样本中男员工的人数,计算出男员工所占的比例,然后估计总体中男员工的人数. 【详解】解:(1)由频率分布直方图可知,样本中通勤时间小于40的概率()100.020.040.6p =⨯+=,故从总体中随机抽取1人,估计其通勤时间小于40分钟的概率也为0.6.(Ⅱ)由图可知,样本的中位数位于[)30,40之间,设中位数为x ,则()0.2300.040.5x +-⨯=,解得37.5x =,故中位数为37.5.(Ⅲ)样本中通勤时间大于或等于60分钟的人的概率为0.1,共10人,通勤时间小于60分钟的人的频率为0.9,其中男员工有11000.9452⨯⨯=人,所以样本中男员工共有55人,占样本容量的55%,故该公司男员工人数为40055%220⨯=人. 【点睛】本题考查频率分布直方图的应用,考查用样本估计总体,难度一般.。

(易错题)高中数学必修三第一章《统计》测试卷(含答案解析)(3)

(易错题)高中数学必修三第一章《统计》测试卷(含答案解析)(3)

一、选择题1.为了了解某同学的数学学习情况,对他的6次数学测试成绩进行统计,作出的茎叶图如图所示,则下列关于该同学数学成绩的说法正确的是( )A.中位数为83 B.众数为85 C.平均数为85 D.方差为19 2.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已9,11的学生人数为25,则n的值为()知学习时长在[)A.40 B.50 C.80 D.100a a>得到一组新数3.一组数据的平均数为m,方差为n,将这组数据的每个数都加上(0)据,则下列说法正确的是()A.这组新数据的平均不变B.这组新数据的平均数为amC.这组新数据的方差为2a n D.这组新数据的方差不变4.有200人参加了一次会议,为了了解这200人参加会议的体会,将这200人随机号为001,002,003,…,200,用系统抽样的方法(等距离)抽出20人,若编号为006,036,041,176, 196的5个人中有1个没有抽到,则这个编号是()A.006 B.041 C.176 D.1965.在一段时间内,某种商品的价格x(元)和销售量y(件)之间的一组数据如下表:价格x(元)4681012销售量y(件)358910若y 与x 呈线性相关关系,且解得回归直线ˆˆˆybx a =+的斜率0.9b ∧=,则a ∧的值为( ) A .0.2 B .-0.7 C .-0.2 D .0.76.统计某校n 名学生的某次数学同步练习成绩,根据成绩分数依次分成六组:[)[)[)[)[)[]90,100,100,110,110,120,120,130,130,140,140,150,得到频率分布直方图如图所示,若不低于140分的人数为110.①0.031m =;②800n =;③100分以下的人数为60;④分数在区间[)120,140的人数占大半.则说法正确的是( )A .①②B .①③C .②③D .②④7.已知x ,y 取值如下表:x0 1 4 5 6 8 y 1.31.85.66.17.49.3从所得的散点图分析可知:y 与x 线性相关,且 1.03y x a =+,则a =( ) A .1.53B .1.33C .1.23D .1.138.已知变量,x y 之间的线性回归方程为0.47.6=-+y x ,且变量,x y 之间的一组相关数据如表所示,则下列说法错误的是( )A .变量,x y 之间呈现负相关关系B .m 的值等于5C .变量,x y 之间的相关系数0.4=-rD .由表格数据知,该回归直线必过点()9,49.某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为( ) A .30 B .25C .20D .1510.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .9111.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变12.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是( )A .4B .5C .6D .7二、填空题13.已知一组数据6,7,8,x ,y 的平均数是8,且90xy =,则该组数据的方差为_______. 14.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..15.下表记录了某公司投入广告费x 与销售额y 的统计结果,由表可得线性回归方程为^^^y b x a =+,据此方程预报当6x =时,y =__. x4 2 35 y 49263954附:参考公式:^1122211()()()n niii ii i nni i i i x x y y x y nx yb x x x nx====---==--∑∑∑∑,^^^a y b x =-16.现有10个数,其平均数为3,且这10个数的平方和是100,则这组数据的标准差是______.17.某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~1000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为_________18.为了了解某学校男生的身体发育情况,随机抽查了该校100名男生的体重情况,整理所得数据并画出样本的频率分布直方图.根据此图估计该校2000名男生中体重在~的人数为__________.kg7078()19.某种产品的广告费支出x与销售额y之间有如下对应数据(单位:百万元),根据下表求出y关于x的线性回归方程为 6.517.5y x=+,x24568y304057a69则表中a的值为__________.20.在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88,若B样本数据恰好是A样本数据每个都加2后所得数据,则,A B两样本的数字特征(众数、中位数、平均数、方差)对应相同的是__________.三、解答题21.据统计某品牌服装专卖店一周内每天获取得纯利润y(百元)与每天销售这种服装件数x(百件)之间有如下一组数据.x3456789y66697381899091该专卖店计划在国庆节举行大型促销活动以提高该品牌服装的知名度,为了检验服装的质量,现从厂家购进的500件服装中抽取60件进行检验,(服装进货编号为001-500).(1)利用随机数表抽样本时,如果从随机数表第8行第2列的数开始按三位数连贯向右读取,试写出最先检测的5件服装的编号;(2)求该专卖店每天的纯利y与每天销售件数x之间的回归直线方程.(精确到0.01)(3)估计每天销售1200件这种服装时获多少纯利润?附表:(随机数表第7行至第9行)84421 75331 57245 50688 77047 44767 21763 35025 83921 2067663016 47859 16955 56719 98105 07185 12867 35807 44395 2387933211 23429 78645 60782 52420 74438 15510 01342 99660 27954参考数据:721280i i x==∑,72145309i i y ==∑,713487i i i x y ==∑.参考公式:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-22.某家庭2015-2019年的年收入和年支出情况统计如下表:(1)已知y 与x 具有线性相关关系,求y 关于x 的线性回归方程(精确到0.01); (2)假设受新冠肺炎疫情影响,该家庭2020年的年收入为9.5万元,请根据(1)中的线性回归方程预测该家庭2020年的年支出金额.(参考公式:回归方程ˆˆy bxa =+中斜率和截距的最小二乘估计分别为()()()1122211ˆn niii ii i nni ii i x x y y x y n x ybx x xn x ====---⋅⋅==--⋅∑∑∑∑,ˆˆay bx =-) 23.脐橙营养丰富,含有人体所必需的各类营养成份,若规定单个脐橙重量(单位:千克)在[0.1,0.3)的脐橙是“普通果”,重量在[0.3,0.5)的磨橙是“精品果”,重量在[0.5,0.7]的脐橙是“特级果”,有一果农今年种植脐橙,大获丰收为了了解脐橙的品质,随机摘取100个脐橙进行检测,其重量分别在[0.1,0.2),[0.2,0.3),[0.3,0.4),[0.4,0.5),[0.5,0.6),[0.6,0.7]中,经统计得到如图所示频率分布直方图(1)将频率视为概率,用样本估计总体.现有一名消费者从脐橙果园中,随机摘取5个脐橙,求恰有3个是“精品果”的概率.(2)现从摘取的100个脐橙中,采用分层抽样的方式从重量为[0.4,0.5),[0.5,0.6)的脐橙中随机抽取10个,再从这10个抽取3个,记随机变量X表示重量在[0.5,0.6)内的脐橙个数,求X的分布列及数学期望.24.某“双一流”大学专业奖学金是以所学专业各科考试成绩作为评选依据,分为专业一等奖学金(奖金额3000元)、专业二等奖学金(奖金额1500元)及专业三等奖学金(奖金额600元),且专业奖学金每个学生一年最多只能获得一次.图(1)是统计了该校2018年500名学生周课外平均学习时间频率分布直方图,图(2)是这500名学生在2018年周课外平均学习时间段获得专业奖学金的频率柱状图.(Ⅰ)求这500名学生中获得专业三等奖学金的人数;(Ⅱ)若周课外平均学习时间超过35小时称为“努力型”学生,否则称为“非努力型”学生,列22联表并判断是否有99.9%的把握认为该校学生获得专业一、二等奖学金与是否是“努力型”学生有关?(Ⅲ)若以频率作为概率,从该校任选一名学生,记该学生2018年获得的专业奖学金额为随机变量X,求随机变量X的分布列和期望.22()()()()()n ad bc K a b c d a c b d -=++++25.现有某高新技术企业年研发费用投入x (百万元)与企业年利润y (百万元)之间具有线性相关关系,近5年的年科研费用和年利润具体数据如下表:(1)画出散点图;(2)求y 对x 的回归直线方程;(3)如果该企业某年研发费用投入8百万元,预测该企业获得年利润为多少?参考公式:用最小二乘法求回归方程ˆˆˆybx a =+的系数ˆˆ,a b 计算公式: 1221ˆˆˆ·,ni ii nii x y nx y bay bx xnx ==-==--∑∑ 26.随着各国经贸关系的进一步加深,许多国外的热带水果进入国内市场,牛油果作为一种热带水果,越来越多的中国消费者对这种水果有了一种全新的认识,它富含多种维生素、丰富的脂肪和蛋白质,钠、钾、镁、钙等含量也高,除作生果食用外也可作菜肴和罐头.牛油果原产于墨西哥和中美洲,后在加利福尼亚州被普遍种植.因此加利福尼亚州成为世界上最大的牛油果生产地,在全世界热带和亚热带地区均有种植,但以美国南部、危地马拉、墨西哥及古巴栽培最多,并形成了墨西哥系、危地马拉系、西印度系三大种群,我国的广东、海南、福建、广西、台湾、云南及四川等地都有少量栽培.市场上的牛油果大部分都是进口的.为了调查市场上牛油果的等级代码数值x 与销售单价y 之间的关系,经统计得到如下数据:(1)已知销售单价y 与等级代码数值x 之间存在线性相关关系,利用前5组数据求出y 关于x 的线性回归方程;(2)若由(1)中线性回归方程得到的估计值与最后一组数据的实际值之间的误差不超过1,则认为所求回归方程是有效可靠的,请判断所求回归直线方程是否有效可靠? (3)若一果园估计可以收获等级代码数值为85的牛油果980kg ,求该果园估计收入为多少元.参考公式:对一组数据()11,x y ,()22,x y ,…,(),n n x y ,其回归直线y bx a =+的斜率和截距的最小二乘估计分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,b y bx =-.参考数据:516169.6i ii x y==∑,52117820i i x ==∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】试题分析:A 选项,中位数是84;B 选项,众数是出现最多的数,故是83;C 选项,平均数是85,正确;D 选项,方差是,错误.考点:•茎叶图的识别 相关量的定义2.B解析:B 【分析】由频率分布直方图的性质,求得0.25x =,再结合频率分布直方图的频率的计算方法,即可求解. 【详解】由频率分布直方图的性质,可得()20.050.150.051x +++=,解得0.25x =, 所以学习时长在[)9,11的频率2520.5x n==,解得50n =. 故选:B . 【点睛】本题主要考查了频率分布直方图性质及其应用,其中解答中熟记频率分布直方图的性质是解答的关键,着重考查了数据分析能力,以及计算能力.3.D解析:D 【分析】考查平均数和方差的性质,基础题.【详解】设这一组数据为()1,n X a a =,由()()E X a E X a +=+,()()D X a D X +=,故选:D . 【点睛】本题主要考查方差的性质,考查了运算能力,属于容易题.4.B解析:B 【解析】 【分析】求得抽样的间隔为10,得出若在第1组中抽取的数字为6,则抽取的号码满足104n -,即可出判定,得到答案. 【详解】由题意,从200人中用系统抽样的方法抽取20人,所以抽样的间隔为2001020=, 若在第1组中抽取的数字为006,则抽取的号码满足6(1)10104n n +-⨯=-,其中n N +∈,其中当4n =时,抽取的号码为36;当18n =时,抽取的号码为176;当20n =时,抽取的号码为196,所以041这个编号不在抽取的号码中,故选B. 【点睛】本题主要考查了系统抽样的应用,其中解答中熟记系统抽样的抽取方法是解答的关键,着重考查了运算与求解能力,属于基础题.5.C解析:C 【解析】 【分析】由题意利用线性回归方程的性质计算可得a 的值. 【详解】 由于468101285x ++++==,35891075y ++++==,由于线性回归方程过样本中心点(),x y ,故:70.98a =⨯+, 据此可得:0.2a =-. 故选C . 【点睛】本题主要考查线性回归方程的性质及其应用,属于中等题.6.B解析:B 【分析】根据频率分布直方图的性质和频率分布直方图中样本估计总体,准确运算,即可求解. 【详解】由题意,根据频率分布直方图的性质得10(0.0200.0160.0160.0110.006)1m +++++=,解得0.031m =.故①正确;因为不低于140分的频率为0.011100.11⨯=,所以11010000.11n ==,故②错误; 由100分以下的频率为0.00610=0.06⨯,所以100分以下的人数为10000.06=60⨯, 故③正确;分数在区间[120,140)的人数占0.031100.016100.47⨯+⨯=,占小半.故④错误.所以说法正确的是①③. 故选B. 【点睛】本题主要考查了频率分布直方图的应用,其中解答熟记频率分布直方图的性质,以及在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小长方形的面积的和等于1,着重考查了分析问题和解答问题的能力,属于基础题.7.D解析:D 【解析】分析:首先根据题中所给的表中的数据,计算得出样本中心点的坐标,利用回归直线必过样本中心点,代入求得结果. 详解:依题意得,1(014568)46x =⨯+++++=,1(1.3 1.8 5.6 6.17.49.3) 5.256y =+++++=,因为回归直线必过样本中心点(,)x y ,即点(4,5.25),所以有5.25 1.034ˆa=⨯+,解得ˆ 1.13a =,故选D. 点睛:该题考查的是有关回归直线的有关问题,涉及到的知识点有回归直线一定过样本中心点,计算得出相应坐标的平均值,求得样本中心点的坐标,代入求得结果.8.C解析:C 【解析】分析:根据线性回归方程的性质依次判断各选项即可.详解:对于A :根据b 的正负即可判断正负相关关系.线性回归方程为0.47.6y x =-+,b=﹣0.7<0,负相关.对于B :根据表中数据:x =9.可得y =4.即()16+3244m ++=,解得:m=5. 对于C :相关系数和斜率不是一回事,只有当样本点都落在直线上是才满足两者相等,这个题目显然不满足,故不正确.对于D :由线性回归方程一定过(x ,y ),即(9,4). 故选:C .点睛:本题考查了线性回归方程的求法及应用,属于基础题,对于回归方程,一定要注意隐含条件,样本中心满足回归方程,再者计算精准,正确理解题意,应用回归方程对总体进行估计.9.C解析:C 【详解】 抽取比例为150130000200=, 1400020200∴⨯=, 抽取数量为20,故选C.10.A解析:A 【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可. 【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95, 所以中位数为90+91=90.52,故选A. 【点睛】本题主要考查了中位数,茎叶图,属于中档题.11.A解析:A 【分析】可以通过n P 与0P 之间的大小关系进行判断. 【详解】当10k -<<时,()011011nk k <+<<+<,, 所以()001nn P P k P =+<,呈下降趋势. 【点睛】判断变化率可以通过比较初始值与变化之后的数值之间的大小来判断.12.B解析:B 【解析】分析:首先写出所有学生的乘积,然后结合系统抽样的方法整理计算即可求得最终结果.详解:由题意可知,学生的成绩如下:111,111,112,113,113; 116,117,117,118,118; 120,120,121,122,122; 123,124,124,126127; 128,128,129,129,129; 131,131,131,132,132; 132,133,134,134,135; 137,138,138,138,139; 140,142,142,143,144.用系统抽样方法从中抽取9人,则每5人中抽取一人,即上述分组中每组抽取一人, 则所抽取的学生的成绩在区间[]120,135上的学生人数为5. 本题选择B 选项.点睛:本题主要考查系统抽样的概念及其应用,茎叶图的识别等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.2【分析】根据题意列出关于的等量关系式结合求得的值利用方差公式求得结果【详解】一组数据的平均数是8且所以化简得又所以的值分别为或所以该组数据的方差为:故答案是:2【点睛】该题考查的是有关求一组数据的解析:2 【分析】根据题意,列出关于,x y 的等量关系式,结合90xy =,求得,x y 的值,利用方差公式求得结果. 【详解】一组数据6,7,8,,x y 的平均数是8,且90xy =, 所以6788540x y ++++=⨯=, 化简得19x y +=,又90xy =, 所以,x y 的值分别为10,9或9,10, 所以该组数据的方差为:222222110[(68)(78)(88)(98)(108)]255s =-+-+-+-+-==,故答案是:2. 【点睛】该题考查的是有关求一组数据的方差的问题,涉及到的知识点有方差公式,属于简单题目.14.5000【分析】由题意其他年级抽取200人其他年级共有学生2000人根据题意列出等式即可求出该校学生总人数【详解】由题意其他年级抽取200人其他年级共有学生2000人则该校学生总人数为人故答案是:5解析:5000 【分析】由题意,其他年级抽取200人,其他年级共有学生2000人,根据题意列出等式,即可求出该校学生总人数. 【详解】由题意,其他年级抽取200人,其他年级共有学生2000人, 则该校学生总人数为20005005000200⨯=人,故答案是:5000. 【点睛】该题考查的是有关分层抽样的问题,涉及到的知识点有分层抽样要求每个个体被抽到的概率是相等的,属于简单题目.15.5【分析】根据表中数据先求出回归方程然后将代入可得到答案【详解】由题意故回归方程为当时【点睛】本题考查了回归方程的求法考查了学生的计算求解能力属于基础题解析:5 【分析】根据表中数据,先求出回归方程,然后将6x =代入,可得到答案. 【详解】 由题意,2345 3.54x +++==,49263954424y +++==,4144492263395544 3.54263558847i ii x y xy =-=⨯+⨯+⨯+⨯-⨯⨯=-=∑,2211649254 3.5 3.55nii xnx =-=+++-⨯⨯=∑,479.45ˆb==,42ˆˆ9.4 3.59.1ay bx =-=-⨯=,故回归方程为9.194ˆ.y x =+, 当6x =时,9.19.4665.5y =+⨯=. 【点睛】本题考查了回归方程的求法,考查了学生的计算求解能力,属于基础题.16.1【解析】【分析】设这10个数为则这组数据的方差为:由此能求出这组数据的标准差【详解】现有10个数其平均数为3且这10个数的平方和是100设这10个数为则这组数据的方差为:这组数据的标准差故答案为1解析:1 【解析】 【分析】设这10个数为1x ,2x ,3x ,⋯,10x ,则12310310x x x x +++⋯+=,222212310100x x x x +++⋯+=,这组数据的方差为:()()22222222212310123101231011[()()())69101010S x x x x x x x x x x x x x x x x ⎛⎤⎤⎡=-+-+-+⋯+-=+++⋯+-+++⋯++⨯ ⎥⎥⎢⎦⎣⎝⎦,由此能求出这组数据的标准差.【详解】现有10个数,其平均数为3,且这10个数的平方和是100, 设这10个数为1x ,2x ,3x ,⋯,10x , 则12310310x x x x +++⋯+=,222212310100x x x x +++⋯+=,∴这组数据的方差为:()()22222222212310123101231011[()()())691011010S x x x x x x x x x x x x x x x x ⎛⎤⎤⎡=-+-+-+⋯+-=+++⋯+-+++⋯++⨯= ⎥⎥⎢⎦⎣⎝⎦,∴这组数据的标准差1S =.故答案为1. 【点睛】本题考查一组数据的标准差的求法,考查平均数、方差等基础知识,考查运算求解能力,考查函数与方程思想,是基础题.17.18【解析】【分析】由题意知抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为即可解得【详解】因为抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为解得【点睛】本题主要考解析:18 【解析】 【分析】由题意知,抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,即可解得. 【详解】因为抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,解得18x =. 【点睛】本题主要考查了系统抽样,属于中档题.18.240【解析】该校2000名男生中体重在的人数为解析:240 【解析】该校2000名男生中体重在()7078kg ~的人数为2000(0.020.01)4240⨯+⨯=.19.54【解析】代入回归方程可得所以故答案为解析:54 【解析】2456855x ++++== ,代入回归方程 6.5175ˆ.yx =+可得50y = ,所以()53040576954a y =⨯-+++=,故答案为54.20.方差【解析】根据样本数字特征样本数据都加上2后新数据的众数中位数和平均数都增加2只有方差计算公式为结果不变故答案为方差解析:方差 【解析】根据样本数字特征,样本数据都加上2后新数据的众数、中位数和平均数都增加2,只有方差计算公式为2211()n i i S x x n ==-∑,结果不变,故答案为方差.三、解答题21.(1)301,169,105,071,286;(2) 4.7551.36y x =+;(3)10836元. 【分析】(1)按照规则直接读取随机数表即可得解;(2)由题中数据可得x 、y ,代入公式即可得b 、a ,即可得解; (3)将12x =代入线性回归方程中,即可得解. 【详解】(1)由随机数表可得,最先检测的5件服装的编号为:301,169,105,071,286; (2)由题意345678967x ++++++==,6669738189909155977y ++++++==,所以717222155973487767 4.75280767i ii ii x y x yb xx==--⨯⨯===-⨯-∑∑,5596 4.7551.367a y bx -⨯≈=-=, 所以该专卖店每天的纯利y 与每天销售件数x 之间的回归直线方程为 4.7551.36y x =+; (3)当12x =时, 4.751251.36108.36y =⨯+=(百元), 故可估计每天销售1200件这种服装时获纯利润10836元. 【点睛】本题考查了随机数表的应用及线性回归方程的求解与应用,考查了运算求解能力,属于中档题.22.(1)0.780.24y x =+;(2)7.65万元. 【分析】(1)利用回归直线方程计算公式,计算出回归直线方程. (2)将9.5x =代入回归直线方程,求得预测值. 【详解】(1)由题可得()199.61010.411105x =⨯++++=, ()17.37.588.58.785y =⨯++++=,()()()5222222110.400.41 2.32i i x x =-=-+-+++=∑,()()()()()()5110.70.40.5000.40.510.7 1.8iii x x y y =--=-⨯-+-⨯-+⨯+⨯+⨯=∑,()()()515211.845ˆ0.782.3258iii ii x x y y bx x ==--===≈-∑∑, 45ˆˆ8100.2458x ay b =-⋅=-⨯≈, 则y 关于x 的线性回归方程为0.780.24y x =+.(2)当2020年的年收入为9.5x =万元时,0.789.50.247.65y =⨯+=. 所以预测该家庭2020年的年支出金额为7.65万元. 【点睛】本小题主要考查回归直线方程的计算,考查利用回归直线方程进行预测,属于中档题. 23.(1)516(2)见解析 【分析】(1)根据题意,先得到随机摘取一个脐橙,是“精品果”的概率为0.5,并且随机摘取5个脐橙,其中“精品果”的个数符合二项分布,再根据二项分布的概率公式,列出式子,得到答案.(2)先判断出X 可取的值为0,1,2,3,分别计算出其概率,然后列出概率分布列,再根据随机变量的数学期望公式,计算出其数学期望. 【详解】(1)从从脐橙果园中,随机摘取5个脐橙,其中“精品果”的个数记为Y , 由图可知,随机摘取一个脐橙,是“精品果”的概率为:0.2+0.3=0.5, ∴Y ~B (5,12), ∴随机摘取5个脐橙,恰有3个是“精品果”的概率为: P (Y =3)3325115()()2216C ==. (2)依题意,抽取10个脐橙,重量为[0.3,0.4),[0.4,0.5)的个数分别为6和4, X 的可能取值为0,1,2,3,P (X =0)3631016C C ==,P (X =1)216431012C C C ==,P (X =2)1264310310C C C ==,P (X =3)34310130C C ==, ∴X 的分布列为:E (X )01236210305=⨯+⨯+⨯+⨯=. 【点睛】本题考查满足二项分布的概率问题,以及随机变量的概率分布列和数学期望,属于中档题. 24.(Ⅰ)160人;(Ⅱ)有;(Ⅲ)见解析. 【分析】(Ⅰ)根据频率之和为1,得到获得三等奖学金的频率,再由总人数得到答案;(Ⅱ)根据频率分布直方图和频率柱状图,填写好列联表,再计算出2K 进行判断,得到答案;(Ⅲ)先得到X 可取的值,再分别求出其概率,根据数学期望的公式,得到答案. 【详解】()I 获得三等奖学金的频率为:()()()0.0080.0160.0450.150.040.0560.01650.40.0160.00850.40.32++⨯⨯+++⨯⨯++⨯⨯=5000.32160⨯=,故这500名学生获得专业三等奖学金的人数为160人.()II 每周课外学习时间不超过35小时的“非努力型”学生有()5000.0080.0160.040.040.0560.0165440⨯+++++⨯=人,其中获得一、二等奖学金学生有()()()5000.0080.0160.0450.055000.040.0560.01650.250.0592x ++⨯⨯+⨯++⨯⨯+=每周课外学习时间超过35小时称为“努力型”学生有5000.1260⨯=人, 其中获得一、二等奖学金学生有()600.350.2536⨯+=人,22⨯列联表如图所示:()250034836922442.3610.8344060128372K ⨯⨯-⨯=≈>⨯⨯⨯故有99.9%的把握认为获得一二等奖学金与学习“努力型”学生的学习时间有关;()III X 的可能取值为0,600,1500,3000 ()6000.32P X ==, ()15000.198P X ==, ()30000.058P X ==,()010.320.1980.0580.424P X ==---=X 的分布列00.4246000.3215000.19830000.058192297174663EX x =⨯+⨯++⨯=++=元. 【点睛】本题考查利用频率分布直方图求频率和频数,通过求2K 的值进行判断是否相关,随机变量的分布列和数学期望,属于中档题.25.(1)见解析(2) 1.1.7ˆ0yx =+(3)9.5百万元 【解析】试题分析:(1)根据表格中的数据,在坐标系中描出点,将点连起来,就画出了散点图;(2)根据题目中的数据计算出 1.1,0.ˆˆ7ba ==,代入平均值3,4x y ==,即可得到回归方程;(3)将8x =,代入回归方程即可得到预测值. (1)散点图(2)由题意可知,12345234473,455x y ++++++++====,51122334445771i ii x y==⨯+⨯+⨯+⨯+⨯=∑,522222211234555i i x ==++++=∑,根据公式,可求得2715341.1,4 1.130.ˆˆ75553ba -⨯⨯===-⨯=-⨯, 故所求回归直线的方程为 1.1.7ˆ0y x =+; (3)令8x =,得到预测值 1.1809.5ˆ.7y=⨯+=(百万元) 答:如果该企业某年研发费用投入8百万元,预测该企业获得年利润为9.5百万元. 26.(1)0.1849.968y x =+;(2)所求回归直线方程是有效可靠的;(3)该果园预计收入25095.84元. 【分析】(1)求出x 的平均值x ,y 的平均值y ,再根据公式求出b 和a ,即可得出回归方程; (2)将88x =代入(1)中的回归方程,求出y ,然后用25.8y 和1比较即可判断;(3)将85x =代入回归方程估计出单价,即可计算出收入. 【详解】(1)由题意,得3848586878585x ++++==,16.818.820.822.82420.645y ++++==,则515222156169.655820.641840.1841782055810005i ii ii x y x yb xx ==-⋅-⨯⨯====-⨯-∑∑, 20.640.184589.968a y bx =-=-⨯=,故所求回归方程为0.1849.968y x =+;(2)当88x =时,0.184889.96826.16y =⨯+=,所以26.1625.80.361-=<,所以所求回归直线方程是有效可靠的; (3)当85x =,0.184859.96825.608y =⨯+=, 所以25.60898025095.84⨯=(元), 所以该果园预计收入25095.84元. 【点睛】本题考查回归方程的求法以及利用回归方程估计值,属于基础题.。

高一数学必修三《统计》单元测试

高一数学必修三《统计》单元测试

高一数学必修三《统计》单元测试一、选择题:(本大题共10小题,每小题4分,共40分)1.某学校为了了解高一年级学生对教师教学的意见,打算从高一年级2007名学生中抽取50名进行抽查,若采用下面的方法选取:先用简单随机抽样从2007人中剔除7人,剩下2000人再按系统抽样的方法进行,则每人入选的机会()A. 不全相等B. 均不相等C. 都相等D. 无法确定2.有20位同学,编号从1至20,现在从中抽取4人作问卷调查,用系统抽样方法确定所抽的编号为( )A.5,10,15,20B.2,6,10,14C.2,4,6,8D.5,8,11,143.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为(1);在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为(2)。

则完成(1)、(2)这两项调查宜采用的抽样方法依次是()A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法4.频率分布直方图中,小长方形的面积等于( )A.相应各组的频数B.相应各组的频率C.组数D.组距5.从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,已知不超过70分的人数为8人,其累计频率为0.4,则这样的样本容量是 ( )A. 20人B. 40人C. 70人D. 80人6.在下列各图中,每个图的两个变量具有相关关系的图是()(2)(3)(4)A.(1)(2) B.(1)(3) C.(2)(4) D.(2)(3)若热茶杯数y与气温x近似地满足线性关系,则其关系式最接近的是()A. 6y x=+ B. 42y x=+ C. 260y x=-+ D. 378y x=-+8.根据某水文观测点的历史统计数据,得到某条河流水位的频率分布直方图如下.从图中可以看出,该水文观测点平均至少一百年才遇到一次的洪水的最低水位是()A.48米B.49米C.50米D.51米9.由小到大排列的一组数据:54321,,,,xxxxx,其中每个数据都小于2-,则样本1,2x-,5432,,,xxxx-的中位数可以表示为()A.232xx+B.212xx-C.225x+D.243xx-二、填空题:(本大题共5小题,每小题4分,共20分)11.管理人员从一池塘内捞出30条鱼,做上标记后放回池塘。

(好题)高中数学必修三第一章《统计》测试卷(答案解析)(1)

(好题)高中数学必修三第一章《统计》测试卷(答案解析)(1)

一、选择题1.某商场为了了解毛衣的月销售量y(件)与月平均气温x(C︒)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:︒171382月平均气温x C月销售量y(件)24334055由表中数据算出线性回归方程y bx a=+中的2b=-,气象部门预测下个月的平均气温为6C︒,据此估计该商场下个月毛衣销售量约为()A.58件B.40件C.38件D.46件2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是()A.成绩B.视力C.智商D.阅读量3.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s <>4.已知变量x ,y 的关系可以用模型kx y ce =拟合,设ln z y =,其变换后得到一组数据下:x 16 17 18 19 z50344131由上表可得线性回归方程4z x a =-+,则( ) A .4-B .4e -C .109D .109e5.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n 个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已知学习时长在[)9,11的学生人数为25,则n 的值为( )A .40B .50C .80D .1006.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.57. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日8.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( ) A .70和50B .70和67C .75和50D .75和679.已知变量,x y 之间的线性回归方程为0.47.6=-+y x ,且变量,x y 之间的一组相关数据如表所示,则下列说法错误的是( )A .变量,x y 之间呈现负相关关系B .m 的值等于5C .变量,x y 之间的相关系数0.4=-rD .由表格数据知,该回归直线必过点()9,410.某宠物商店对30只宠物狗的体重(单位:千克)作了测量,并根据所得数据画出了频率分布直方图如下图所示,则这30只宠物狗体重(单位:千克)的平均值大约为( )A .15.5B .15.6C .15.7D .1611.甲、乙两名选手参加歌手大赛时,5名评委打的分数用如图所示的茎叶图表示,s 1,s 2分别表示甲、乙选手分数的标准差,则s 1与s 2的关系是( ).A.s1>s2B.s1=s2C.s1<s2D.不确定12.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数()A.40 B.45 C.48 D.50二、填空题13.某社会爱心组织面向全市征召义务宣传志愿者.现从符合条件的志愿者中随机抽取100名按年龄分组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45),得到的频率分布直方图如图所示.若从第3,4,5组中用分层抽样的方法抽取6名志愿者参与广场的宣传活动,应从第3组抽取__________名志愿者.14.如图是甲、乙两人在10天中每天加工零件个数的茎叶图,若这10天甲加工零件个数+=______.的中位数为a,乙加工零件个数的平均数为b,则a b15.对具有线性相关关系的变量,x y ,有一组观测数据(,)i i x y (1,2,3,,10i =),其回归直线方程是3ˆ2ˆybx =+,且121012103()30x x x y y y +++=+++=,则b =______.16.某学校高一年级男生人数占该年级学生人数的45%,在一次考试中,男、女生平均分数依次为72、74,则这次考试该年级学生的平均分数为__________.17.某高中有高一学生320人,高二学生400人,高三学生360人.现采用分层抽样调查学生的视力情况.已知从高一学生中抽取了8人,则三个年级一共抽取了__________人。

(经典)高中数学必修三单元测试题附答案解析

(经典)高中数学必修三单元测试题附答案解析

(数学3必修)第二章:统计 [基础训练A 组] 一、选择题1.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( )A . c b a >>B .a c b >>C .b a c >>D .a b c >>2.下列说法错误的是 ( )A .在统计里,把所需考察对象的全体叫作总体B .一组数据的平均数一定大于这组数据中的每个数据C .平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D .一组数据的方差越大,说明这组数据的波动越大3.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差是( ) A .3.5 B .3- C .3 D .5.0- 4. 要了解全市高一学生身高在某一范围的学生所占比例的大小,需知道相应样本的( )A . 平均数B . 方差C . 众数D . 频率分布5.要从已编号(160)的60枚最新研制的某型导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是( )A .5,10,15,20,25,30B .3,13,23,33,43,53C .1,2,3,4,5,6D .2,4,8,16,32,48 6.容量为100的样本数据,按从小到大的顺序分为8组,如下表:组号 1 2 3 4 5 6 7 8 频数 10 13 x 14 15 13 12 9第三组的频数和频率分别是 ( )A .14和0.14B .0.14和14C .141和0.14 D . 31和141二、填空题1.为了了解参加运动会的2000名运动员的年龄情况,从中抽取100名运动员;就这个问题,下列说法中正确的有 ;① 2000名运动员是总体;②每个运动员是个体;③所抽取的100名运动员是一个样本;④样本容量为100;⑤这个抽样方法可采用按年龄进行分层抽样;⑥每个运动员被抽到的概率相等。

(易错题)高中数学必修三第一章《统计》检测题(含答案解析)(2)

(易错题)高中数学必修三第一章《统计》检测题(含答案解析)(2)

一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆybx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元 B .13.88万元C .12.78万元D .14.28万元2.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元3.为了解一片经济树林的生长情况,随机测量了其中100株树木的底部周长(单位:cm ),根据所得数据画出样本的频率分布直方图如图所示.那么在这100株树木中,底部周长小于110cm 的株数n 是 ( )A .30B .60C .70D .804.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm ),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是( )A .海水稻根系深度的中位数是45.5B .普通水稻根系深度的众数是32C .海水稻根系深度的平均数大于普通水稻根系深度的平均数D .普通水稻根系深度的方差小于海水稻根系深度的方差5.某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是 A .8号学生 B .200号学生C .616号学生D .815号学生6.通过实验,得到一组数据如下:2,5,8,9,x ,已知这组数据的平均数为6,则这组数据的方差为( ) A .3.2B .4C .6D .6.57.已知某8个数的平均数为3,方差为2,现加入一个新数据3,此时这9个数的平均数为x ,方差为2s ,则( ) A .3x =,22s < B .3x =,22s > C .3x >,22s <D .3x >,22s >8.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( ) A .10B .11C .12D .139.某校高一年级有学生1800人,高二年级有学生1500人,高三年级有1200人,为了调查学生的视力状况,采用分层抽样的方法抽取学生,若在抽取的样本中,高一年级的学生有60人,则该样本中高三年级的学生人数为( ) A .60B .50C .40D .3010.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表: 时间周一 周二 周三 周四 周五 车流量x (万辆) 100 102 108 114 116 浓度y (微克)7880848890根据上表数据,用最小二乘法求出y 与x 的线性回归方程是( )参考公式:121()()()niii ni i x x y y b x x ==--=-∑∑,a y b x =-⋅;参考数据:108x =,84y =;A .0.6274ˆ.2yx =+ B .0.7264ˆ.2y x =+ C .0.7164ˆ.1y x =+ D .0.6264ˆ.2y x =+ 11.下列说法:①设有一个回归方程35y x =-,变量x 增加一个单位时,y 平均增加5个单位;②线性回归直线ˆybx a =+必过必过点(),x y ;③在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病;其中错误的个数是( ) A .0B .1C .2D .312.从8名女生4名男生中,选出3名学生组成课外小组,如果按性别比例分层抽样,则不同的抽取方法数为( ) A .112种B .100种C .90种D .80种二、填空题13.给出下列命题:①函数()π4cos 23f x x ⎛⎫=+ ⎪⎝⎭的一个对称中心为5π,012⎛⎫- ⎪⎝⎭;②若,αβ为第一象限角,且αβ>,则tan tan αβ>;③设一组样本数据12,,,n x x x ⋅⋅⋅的平均数是2,则数据1221,21,,21n x x x --⋅⋅⋅-的平均数为3;④函数sin 2y x =的图象向左平移π4个单位长度,得到πsin 24y x ⎛⎫=+ ⎪⎝⎭的图象.其中正确命题的序号是_____________(把你认为正确的序号都填上).14.对具有线性相关关系的变量x ,y 有一组观测数据()(),1,2,3,,8i i x y i =,其回归直线方程是12y x a =+,且8116i i x ==∑,8148i i y ==∑,则实数a =__________.15.通过市场调查,得到某种产品的资金投入x (单位:万元)与获得的利润y (单位:万元)的数据,如表所示:根据表格提供的数据,用最小二乘法求线性回归直线方程为0.36ˆˆybx =-,现投入资金15万元,求获得利润的估计值(单位:万元)为_____________.16.数列{}n a 是公差不为零的等差数列,其前n 项和为n S ,若记数据1a ,2a ,3a ,⋅⋅⋅,2019a 的标准差为1σ,数据11S ,22S ,33S ,⋅⋅⋅,20192019S 的标准差为2σ,则12σσ=________ 17.对具有线性相关关系的变量,x y ,有一组观测数据(,)i i x y (1,2,3,,10i =),其回归直线方程是3ˆ2ˆybx =+,且121012103()30x x x y y y +++=+++=,则b =______.18.某天有10名工人生产同一零部件,生产的件数分别是:15、17、14、10、15、17、17、16、14、12,设其平均数为a ,中位数为b ,众数为c ,则a 、b 、c 从小到大的关系依次是________19.某种产品的广告费支出x 与销售额y 之间有如下对应数据(单位:百万元),根据下表求出y 关于x 的线性回归方程为 6.517.5y x =+,x 2 4 5 68 y 304057a69则表中a 的值为__________.20.总体由编号为01,02,⋅⋅⋅,29,30的30个个体组成.利用下面的随机数表选取样本,选取方法是从随机数表第2行的第6列数字开始由左到右依次选取两个数字,则选出来的第3个个体的编号为__________.三、解答题21.某企业投资两个新型项目,投资新型项目A 的投资额m (单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m =-,投资新型项目B 的投资额x (单位:十万元)与纯利润y (单位:万元)的散点图如图所示.(1)求y 关于x 的线性回归方程;(2)根据(1)中的回归方程,若A ,B 两个项目都投资60万元,试预测哪个项目的收益更好.附:回归直线y bx a =+的斜率和截距的最小二乘估计分别为1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-.22.某地区不同身高的未成年男性的体重平均值如下表: 身高/cm6070 80 90 100 110 120 130 140 150 160 170 体重/kg 6.137.909.9012.1515.0217.5020.9226.8631.1138.8547.2555.05(1)根据散点图判断,y a bx =+与xy a b =⋅哪一个能比较近似地反映这个地区未成年男性体重kg y 与身高cm x 的回归方程类型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及下表中数据,建立y 关于x 的回归方程(表中ln i i u y =,0.66 1.93e ≈,0.22 1.02e ≈).xyu()1221ii x x =-∑()()121iii x x y y =--∑ ()()121iii x x u u =--∑11524.0532.9614200 6143.3 284参考公式:()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---⋅==--∑∑∑∑,a y b x =-⋅.23.某城市100户居民的月平均用水量(单位:吨),以[0,2)[2,4)[4,6)[6,8)[8,10)[10,12)[12,14)分组的频率分布直方图如图.(1)求直方图中x的值;并估计出月平均用水量的众数.(2)求月平均用水量的中位数及平均数;(3)在月平均用水量为[6,8),[8,10),[10,12),[12,14)的四组用户中,用分层抽样的方法抽取22户居民,则应在[10,12)这一组的用户中抽取多少户?(4)在第(3)问抽取的样本中,从[10,12)[12,14)这两组中再随机抽取2户,深入调查,则所抽取的两户不是来自同一个组的概率是多少?24.某市为了解疫情过后制造业企业的复工复产情况,随机调查了100家企业,得到这些企业4月份较3月份产值增长率x的频率分布表如下:[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80) x的分组[0.20,0)企业数13403584(1)估计制造业企业中产值增长率不低于60%的企业比例及产值负增长的企业比例;(2)求制造业企业产值增长率的平均数与方差的估计值(同一组中的数据用该组区间的中点值为代表).25.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式。

人教版高中数学必修3《统计 》全章同步测试题附答案

人教版高中数学必修3《统计 》全章同步测试题附答案

高中数学必修3《统计 》全章同步测试题第二章 统计 姓名2.1 随机抽样2.1.1简单随机抽样1.对于简单随机抽样,个体被抽到的机会( )A.相等B.不相等C.不确定D.与抽取的次数有关2.抽签法中确保样本代表性的关键是( )A.制签B.搅拌均匀C.逐一抽取D.抽取不放回3.用随机数表法从100名学生(男生25人)中抽选20人进行评教,某男学生被抽到的机率是( ) A.1001 B.251 C.51 D.41 4.对于简单随机抽样,下列说法正确的是( )A.从总体中逐个不放回地抽取样本的抽样为简单随机抽样B.从总体中抽取样本,满足每个个体被抽到的机会相等的抽样为简单随机抽样C.设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本()n m ≤,如果每次抽取时总体内各个个体被抽到的机会都相等,这种抽样方法叫简单随机抽样D.以上均不对5.从含有N 个个体的总体中抽取一个容量为30的样本,若每个个体被抽到的可能性为25%,则N 为( )A. 200B. 150C. 120D. 1006.从50个产品中抽取10个进行检查,则总体个数为________,样本容量为_______.7.一般地,设一个总体含有N 个个体,从中逐个 地抽取n 个个体作为样本()n m ≤,如果每次抽取时总体内各个个体被抽到的机会都 ,就把这种抽样方法叫简单随机抽样,它最常用的两种方法是 .8.要检查一个工厂产品的合格率,从1000件产品中抽出50件进行检查,检查者在其中随意取了50件,这种抽样方法为________.9.福利彩票的中奖号码是由1~36个号码中,选出7个号码来按规则确定中奖情况,这种从36个选7个号的抽样方法是________.10.某中学高一年级有400人,高二年级有320人,高三年级有280人,以每人被抽取的机率为0.2,向该中学抽取一个容量为n 的样本,则n = .11.高二(2)有学生53人用抽签方法抽取7名同学参加社会实践活动,写出具体过程.12.欲从全班45名学生中随机抽取10名学生参加一项社区服务活动,试用随机数表法确定这10名学生.13.1936年,美国著名的《文学摘要》杂志社,为了预测总统候选人罗斯福与兰登两个谁能当选,他们以电话簿上的地址和俱乐部成员名单上的地址发出1000万封信,收回回信200万封,在调查史上这是少有的样本容量,花费了大量的人力、物力,《文学摘要》相信自己的调查结果,即兰登将以57%对43%的比例获胜,并进行大量宣传,最后选举却是罗斯福以62%对38%的巨大优势获胜,这个调查断送了这家原本颇有名气的杂志社的前程,不久只得关门停刊,试分析这次调查失败的原因.2.1.2系统抽样与分层抽样 姓名1.为了解1200名学生的家庭情况,打算采用系统抽样方法从中抽取30名学生,则分段间隔为( )A. 40B. 30C. 20D.102.问题:①有1000个乒乓球分别装在3个箱子内,其中红色箱子内有500个,蓝色箱子内有200个,黄色箱子内有300个,现从中抽取一个容量为100的样本;②从20名学生中选出3名参加座谈会.方法:Ⅰ.随机抽样 Ⅱ.系统抽样 Ⅲ.分层抽样.其中问题与方法能配对的是A.①Ⅰ,②ⅡB.①Ⅲ,②ⅠC.①Ⅱ,②ⅢD.①Ⅲ,②Ⅱ3.为了解1253名学生某一次数学成绩,采用系统抽样方法抽取一个容量为50样本,则在总体中应随机剔除的个体数目为( )A. 2B. 3C. 4D. 54. 下列问题中,最适合用分层抽样方法抽样的是( )A .某次报告会在某会议室举行,该会议室共有30排座位,每排有30个座位,编号为1~30,报告会结束后为听取观众意见,要从中抽取一个容量为30的样本B .从12台电视机中任意抽取4台进行质量检查C .某学校有在编人员160人,其中行政人员16人,教师122人,后勤人员32人,教育部门为了解学校机构改革意见,要从中抽取一个容量为40的样本D .在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位是2709的为三等奖5.从1006名学生中选取50名组成参观团,若采用下面的方法选取:先用简单随机抽样从1006人中剔除6人,剩下的1000人再按系统抽样的方法进行,则每人入选的机会( )A .不全相等B .均不相等C .都相等D .无法确定6.简单随机抽样、系统抽样、分层抽样之间的共同点是( )A .都是从总体中逐个抽取B .将总体分成几部分,按事先确定的规则在各部分抽取C .抽样过程中每个个体被抽到的可能性相等D .没有共同点7.某工厂生产A 、B 、C 三种不同型号的产品,产品的数量之比依次为2:3:5.现在用分层抽样法抽出一个容量为n 的样本,样本中A 种型号产品有16件,则n= .8.某班有50名学生,现在采用逐一抽取的方法从中抽取5名同学参加夏令营,同学甲最后一个去抽,则他被抽到的概率为 .9. 用系统抽样方法从一个编号为01、02,…,49,50的容量为50的总体中抽取一个容量为5的样本,这时分段的间隔为10,在第一段01,02,…,10中随机抽取一个号码为0l 时,规定以后四段的号码依次为0101()l k k Z ++∈,若008l =,则所抽取的样本编号依次为 .*10.工厂生产了某种产品16800件,它们来自A,B,C三条生产线,为了检查这批产品的质量,决定采用分层抽样的方法进行抽样.已知从A,B,C三条生产线抽取的个数组成一个等差数列,则B生产线生产了件产品.11.某企业有三个车间,第一车间有x人,第二车间有300人,第三车间有y人,采用分层抽样的方法抽取一个容量为45人的样本,第一车间被抽取20人,第三车间被抽取10人,问这个企业第一车间、第三车间各有多少人?12.某网站欲调查网民对当前网页的满意程度,在登录的所有网民中,收回有效帖子共50000份,其中各种态度的份数如下表所示.为了了解网民的具体想法和意见,以便决定如何更改才能使网页更完美,打算从中抽选500份,为使样本更具有代表性,每类中各应抽选出多少份?13.某校2010年有1000名高一学生,在一次期中考试之后,学校为了了解数学中存在的问题,计划抽取一个容量为50的样本,详细进行试卷分析.问:使用哪一种抽样方法为宜?并设计出具体操作步骤.2.2用样本估计总体2.2.1用样本的频率分布估计总体分布姓名1. 在频率分布直方图中,所有矩形的面积之和是()A.0.5 B.1 C.1.5 D.不确定2.在200个人中,有80个学生,42个干部,58个工人,20个农民,则数0.29是工人的()A.频数B.频率C.累计频率D.以上都不对3.有一个容量为64的样本,已知某组样本数据的频率为0.25,则该组样本的频数为()A. 4B. 8C. 12D. 164.有一个容量为35的样本,分组后组矩与频数如下:[5,10],5;(10,15]),12;(15,20],7;(20,25],5;(25,30],4;(30,35],2;则样本在区间(-∞,20]上的频率约为()A. 0.20B. 0.69C. 0.31D.0.275. 下列叙述中正确的是()A.频数是指落在各个小组内的数据 B.组数是样本平均数除以组距C.每个小组的频数与样本容量之比是这个小组的频率D.从频率分布表可以看出样本数据对于平均数的波动大小6.对于样本频率分布直方图、折线图与总体密度曲线的关系,下列说法中正确的是()A.频率分布直方图与总体密度曲线无关 B.频率分布直方图就是总体密度曲线C.频率分布折线图就是总体密度曲线 D.如果样本容量无限增大,分组的组距无限减少,那么频率分布直方图就会无限接近于总体密度曲线7.已知容量为20的样本:9,10,8,10,6,13,8,10,12,11,7,8,9,11,9,12,10,11,11,12;则在9.5~11.5的频数是 ,频率是 .8. 一个容量为40的样本,共分成6组,第1~4组的频数分别是10,5,6,7,第5组的频率是0.10,则第6组的频率是.9. 已知样本容量为100,在样本频率分布直方图中,则第3组的频率为,第4组的频数为.10. 某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:每一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……第六组,成绩大于等于18秒且小于等于19秒.右图是按上述分组方法得到的频率分布直方图,设成绩小于17秒的学生人数占全班人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可以分析出x=,y= .11.甲、乙两个小组各有10 名学生的英语口语测试成绩如下(单位:分)甲组:76,90,84,86,81,87,86,82,85,83乙组:82,84,85,89,79,80,91,89,79,74用茎叶图表示这两个小组的成绩,判断哪个小组的成绩更整齐一些?12.为了解某地高一年级男生的身高情况,从其中的一个学校选取容量为60的样本(60名男生的身高,单位:cm),分组情况如下:(1)求出表中,的值. (2)画出频率分布直方图.13.对某电子元件进行寿命追踪调查,情况如下.(1)列出频率分布表;(2)画出频率分布直方图;(3)估计元件寿命在100~400 h以内的电子元件在总体中占的比例;(4)估计电子元件寿命在400 h以上的电子元件在总体中占的比例.。

(压轴题)高中数学必修三第一章《统计》测试题(包含答案解析)(3)

(压轴题)高中数学必修三第一章《统计》测试题(包含答案解析)(3)

一、选择题1.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元2.某教研机构随机抽取某校20个班级,调查各班关注汉字听写大赛的学生人数,根据所得数据的茎叶图,以组距为5将数据分组成[)[)[)[)[)[)[)[]0,5,5,10,10,15,15,20,20,25,25,30,30,35,35,40时,所作的频率分布直方图如图所示,则原始茎叶图可能是( )A .B .C .D .3.某班统计一次数学测验的平均分与方差,计算完毕才发现有位同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( )A .1x x =,221s s = B .1x x =,221s s < C .1x x =,221s s >D .1x x <,221s s =4.某产品的广告费用与销售额的统计数据如下表:( ) 广告费用(万元) 销售客(万元)根据上表中的数据可以求得线性回归方程中的为,据此模型预报广告费用为万元时销售额为( ) A .万元B .万元C .万元D .万元5.从两个班级各随机抽取5名学生测量身高(单位:cm ),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165.据此估计甲、乙两班学生的平均身高x 甲,x 乙及方差2s 甲,2s 乙的关系为( )A .x 甲>x 乙,2s 甲>2s 乙B .x 甲>x 乙,2s 甲<2s 乙C .x 甲<x 乙,2s 甲<2s 乙D .x 甲<x 乙,2s 甲>2s 乙6.某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是 A .8号学生B .200号学生C .616号学生D .815号学生7.某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则42x y +的值是( )A .12B .14C .16D .188.某产品的广告费用x 与销售额y 的统计数据如下表:广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元9.高二某班共有学生60名,座位号分别为01, 02, 03,···, 60.现根据座位号,用系统抽样的方法,抽取一个容量为4的样本.已知03号、18号、48号同学在样本中,则样本中还有一个同学的座位号是( ) A .31号B .32号C .33号D .34号10.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( )A .10B .11C .12D .1311.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为 A .12B .14C .16D .1812.从8名女生4名男生中,选出3名学生组成课外小组,如果按性别比例分层抽样,则不同的抽取方法数为( ) A .112种B .100种C .90种D .80种二、填空题13.用系统抽样方法从400名学生中抽取容量为20的样本,将400名学生随机地编号为1~400,按编号顺序平均分为20个组.若第1组中用抽签的方法确定抽出的号码为11,则第17组抽取的号码为________.14.东汉·王充《论衡·宜汉篇》:“且孔子所谓一世,三十年也.”,清代·段玉裁《说文解字注》:“三十年为一世.按父子相继曰世”.“一世”又叫“一代”,到了唐朝,为了避李世民的讳,“一世”方改为“一代”,当代中国学者测算“一代”平均为25年.另据美国麦肯锡公司的研究报告显示,全球家庭企业的平均寿命其实只有24年,其中只有约30%的家族企业可以传到第二代,能够传到第三代的家族企业数量为总量的13%,只有5%的家族企业在第三代后还能够继续为股东创造价值.根据上述材料,可以推断美国学者认为“一代”应为__________年.15.通过市场调查,得到某种产品的资金投入x (单位:万元)与获得的利润y (单位:万元)的数据,如表所示: 资金投入x 2 3 4 5 6 利润y0.40.611.21.8根据表格提供的数据,用最小二乘法求线性回归直线方程为0.36ˆˆybx =-,现投入资金15万元,求获得利润的估计值(单位:万元)为_____________.16.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____17.已知一组数据126,,,x x x ⋅⋅⋅的方差是2,并且()()()22212611118x x x -+-+⋅⋅⋅+-=,0x ≠,则x =______.18.已知某产品连续4个月的广告费i x (千元)与销售额i y (万元)(1,2,3,4i =)满足4115ii x==∑,4112i i y ==∑,若广告费用x 和销售额y 之间具有线性相关关系,且回归直线方程为^y bx a =+,0.6b =,那么广告费用为5千元时,可预测的销售额为___万元. 19.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b+的最小值为__________.20.能够说明“若甲班人数为m ,平均分为a ;乙班人数为n n m ≠(),平均分为b ,则甲乙两班的数学平均分为2a b+”是假命题的一组正整数a ,b 的值依次为_____. 三、解答题21.某县畜牧技术员张三和李四9年来一直对该县山羊养殖业的规模进行跟踪调查,张三提供了该县某山羊养殖场年养殖数量y (单位:万只)与相应年份x (序号)的数据表和散点图(如图所示),根据散点图,发现y 与x 有较强的线性相关关系,李四提供了该县山羊养殖场的个数z (单位:个)关于x 的回归方程ˆ230z x =-+.年份序号x 1 2 3 4 5 6 7 8 9 年养殖山羊y /万只1.21.51.61.61.82.52.52.62.7y x (2)试估计:①该县第一年养殖山羊多少万只? ②到第几年,该县养殖山羊的数量与第1年相比减少了? 参考统计量:()92160ii x x =⋅-=∑,()()9112i i i x x y y =⋅--=∑.附:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线v u βα=+的斜率和截距的最小二乘估计分别为()()()121ˆnii i ni i uu v v u u β==--=-∑∑,ˆˆv u αβ=-. 22.班主任为了对本班学生的考试成绩进行分析,决定从本班24名女同学,18名男同学中随机抽取一个容量为7的样本进行分析.(1)如果按照性别比例分层抽样,可以得到多少个不同的样本?(写出算式即可,不必计算出结果)(2)如果随机抽取的7名同学的数学,物理成绩(单位:分)对应如下表:①若规定85分以上(包括85分)为优秀,从这7名同学中抽取3名同学,记3名同学中数学和物理成绩均为优秀的人数为ξ,求ξ的分布列和数学期望;②根据上表数据,求物理成绩y 关于数学成绩x 的线性回归方程(系数精确到0.01);若班上某位同学的数学成绩为96分,预测该同学的物理成绩为多少分? 附:线性回归方程y bx a =+,其中121()()()niii nii x x y y b x x ==--=-∑∑,a y bx =-.23.潜叶蝇是南方地区水稻容易遭受的虫害之一,成虫将虫卵产在叶片里,待虫卵孵化之后幼虫会在叶片中啃叶肉,使得秧苗的叶片呈现白色的状态,进而降低水稻产量.经研究,每只潜叶蝇的平均产卵数y 和夏季平均温度x 有关,现收集了某地区以往6年的数据,得到下面数据统计表格.(Ⅰ)根据相关系数r 判断,潜叶蝇的平均产卵数y 与平均温度x 是否具有较强的线性相关关系,若有较强的线性相关关系,求出线性回归方程y bx a =+,若没有较强的线性相关关系,请说明理由(一般情况下,当0.75r >时,可认为变量有较强的线性相关关系);(Ⅱ)根据以往的统计,该地区夏季平均气温为()C ξ︒近似地服从正太分布()226.5,N σ,且()125282P ξ<≤=.当该地区某年平均温度达到28C ︒以上时,潜叶蝇快速繁殖引发虫害,需要进行一次人工治理,每次的人工治理成本为200元/公顷(其他情况均不需要人工治理),且虫害一定会导致水稻减产,对过往10次爆发虫害时的减产损失进行统计,结果如下:用样本的频率估计概率,预测未来2年,每公顷水稻可能因潜叶蝇虫害造成的经济损失Y (元)的数学期望.(经济损失=减产损失+治理成本) 参考公式和数据:()()ni i x xy yr --=∑()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-()()61700iii x x yy =--=∑,6214126ii x==∑,61240i i y ==∑,()6218816i i y y=-=∑,8.4≈786≈.24.2020年新冠肺炎疫情肆虐全球,各地医疗部门迅速进行防控意识宣传和流行病学调查.某疫区随机抽取100人调查其外出时佩戴口罩的情况,结果如下表.(1)是否有99.5%的把握认为“是否佩戴口罩与年龄有关”;(2)该疫区某新冠肺炎定点治疗医院统计了确诊患者中年龄x (单位:岁)的重症患者比例(单位:%),得到下表:若y 与x 之间具有线性相关关系,请用最小二乘法求出y 关于x 的线性回归方程y bx a =+,并预测该医院76岁确诊患者中的重症比例.参考公式和数据:用最小二乘法求线性回归方程系数公式:1221ni ii nii x y nx yb xn x=-=-=-∑∑,a y bx =-.817010.5657.5637.553 5.552 4.545 3.540 1.5320.52454i ii x y==⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=∑.82222222217065635345403223256i i x==++++++=∑.()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.25.经销商小王对其所经营的某一型号二手汽车的使用年数(010)x x <≤与销售价格y (单位:万元/辆)进行整理,得到如下的对应数据: (1)试求y 关于x 的回归直线方程;(2)已知每辆该型号汽车的收购价格为20.05 1.7517.2=-+w x x 万元,根据(1)中所求的回归方程,预测x 为何值时,小王销售一辆该型号汽车所获得的利润z 最大.附:回归方程ˆybx a =+中,1221ˆˆˆˆ,ni ii nii x ynx y b ay bx xnx -=-==--∑∑ 26.某校为“全国数学联赛”选拔人才,分初赛和复赛两个阶段进行,规定:分数不小于本次考试成绩中位数的具有复赛资格,该校有900名学生参加了初赛,所有学生的成绩均在区间(]30,150内,其频率分布直方图如图.(1)根据频率分布直方图,估计获得复赛资格应划定的最低分数线; (2)根据频率分布直方图,估计本次初赛的平均成绩.【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.2.A解析:A 【解析】由频率分布直方图可知:第一组的频数为20×0.01×5=1个, [0,5)的频数为20×0.01×5=1个, [5,10)的频数为20×0.01×5=1个, [10,15)频数为20×0.04×5=4个, [15,20)频数为20×0.02×5=2个, [20,25)频数为20×0.04×5=4个, [25,30)频数为20×0.03×5=3个, [30,35)频数为20×0.03×5=3个, [35,40]频数为20×0.02×5=2个, 则对应的茎叶图为A , 本题选择A 选项.点睛:茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.3.C解析:C 【分析】根据平均数和方差公式计算比较即可. 【详解】设这个班有n 个同学,分数分别是123,,,,n a a a a ⋅⋅⋅,假设第i 个同学的成绩没录入,这一次计算时,总分是()1n x -,方差为()()()()()222222121111i i n s a x a x a x a x a x n -+⎡⎤=-+-+⋅⋅⋅+-+-+⋅⋅⋅+-⎣⎦-; 第二次计算时,()11n nxx x -+=x =,方差为()()()()()()222222221121111++i i i n n s a x a x a x a x a x a x s n n-+-⎡⎤=-+-⋅⋅⋅-+-+-+⋅⋅⋅+-=⎣⎦故有1x x =,221s s >.故选:C 【点睛】本题主要考查样本的平均数和方差公式;属于中档题.4.B解析:B 【解析】 【分析】先求出,由样本点的中心在回归直线上,可求出,从而求出回归方程,然后令,可求出答案.【详解】 由题意,,则样本中心点在回归方程上,则,故线性回归方程为,则广告费用为万元时销售额为万元,故选B.【点睛】本题考查了线性回归方程的求法,考查了学生的计算能力,属于基础题.5.C解析:C 【解析】 【分析】利用公式求得x 甲和x 乙,从而得到x 甲和x 乙的大小,观察两组数据的波动程度,可以得到2s 甲与2s 乙的大小,从而求得结果.【详解】 甲班平均身高1691621501601591605x ++++==甲,乙班平均身高1801601501501651615x ++++==乙,所以x x <甲乙,方差表示数据的波动,当波动越大时,方差越大,甲班的身高都差不多,波动比较小,而乙班身高差距则比加大,波动比较大,所以22s s >乙甲,故选C. 【点睛】该题考查的是有关所给数据的平均数与方差的比较大小的问题,涉及到的知识点有平均数的公式,观察数据波动程度来衡量方差的大小,属于简单题目.6.C解析:C 【分析】等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案. 【详解】详解:由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{}n a ,公差10d =,所以610n a n =+()n *∈N ,若8610n =+,则15n =,不合题意;若200610n =+,则19.4n =,不合题意; 若616610n =+,则61n =,符合题意;若815610n =+,则80.9n =,不合题意.故选C .【点睛】本题主要考查系统抽样.7.A解析:A【分析】由题,中位数为12,求得4x y +=,再求得平均数,利用总体标准差最小和基本不等式求得x ,y 的值,即可求得答案.【详解】由题,因为中位数为12,所以242x y x y +=∴+= 数据的平均数为:1(22342019192021)11.410x y ++++++++++= 要使该总体的标准最小,即方差最小,所以222222.8(1011.4)(1011.4)( 1.4)( 1.4)2()0.722x y x y x y +-+-++-=-+-≥= 当且紧当 1.4 1.4x y -=-,取等号,即2x y ==时,总体标准差最小此时4212x y +=故选A【点睛】本题考查了茎叶图,熟悉茎叶图,清楚中位数、标准差的求法是解题的关键,属于中档题型.8.B解析:B【详解】 试题分析:4235492639543.5,4244x y ++++++====, ∵数据的样本中心点在线性回归直线上,回归方程ˆˆˆy bx a =+中的ˆb 为9.4, ∴42=9.4×3.5+a ,∴ˆa=9.1, ∴线性回归方程是y=9.4x+9.1,∴广告费用为6万元时销售额为9.4×6+9.1=65.5考点:线性回归方程9.C解析:C【解析】【分析】根据系统抽样知,组距为604=15÷,即可根据第一组所求编号,求出各组所抽编号.【详解】学生60名,用系统抽样的方法,抽取一个容量为4的样本,所以组距为604=15÷,已知03号,18号被抽取,所以应该抽取181533+=号,故选C.【点睛】本题主要考查了抽样,系统抽样,属于中档题.10.C解析:C【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n=30n﹣19,由401≤30n﹣21≤755,求得正整数n的个数,即可得出结论.【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列,又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,∴等差数列的通项公式为a n=11+(n﹣1)30=30n﹣19,由401≤30n﹣19≤755,n为正整数可得14≤n≤25,∴做问卷C的人数为25﹣14+1=12,故选C.【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.11.C解析:C【解析】【分析】根据分层抽样的定义求出在各层中的抽样比,即样本容量比上总体容量,按此比例求出在高三年级中抽取的人数.【详解】根据题意得,用分层抽样在各层中的抽样比为421 105020=,则在高三年级抽取的人数是14001625⨯=人,故选C.【点睛】该题所考查的是有关分层抽样的问题,在解题的过程中,需要明确无论采用哪种抽样方法,都必须保证每个个体被抽到的概率是相等的,所以注意成比例的问题.12.A解析:A【解析】分析:根据分层抽样的总体个数和样本容量,做出女生和男生各应抽取的人数,得到女生要抽取2人,男生要抽取1人,根据分步计数原理得到需要抽取的方法数.详解:∵8名女生,4名男生中选出3名学生组成课外小组,∴每个个体被抽到的概率是14, 根据分层抽样要求,应选出8×14=2名女生,4×14=1名男生, ∴有C 82•C 41=112.故答案为:A .点睛:本题主要考查分层抽样和计数原理,意在考查学生对这些知识的掌握水平.二、填空题13.331【分析】分段抽样由抽取时的分段间隔是20利用等差数列知识得解【详解】由抽取时的分段间隔是20即抽取20名同学其编号构成首项为11公差为20的等差数列第17组抽取的号码故答案为:331【点睛】本解析:331【分析】分段抽样由抽取时的分段间隔是20,利用等差数列知识得解.【详解】由抽取时的分段间隔是20.即抽取20名同学,其编号构成首项为11,公差为20的等差数列,第17组抽取的号码11(171)20331+-⨯=故答案为:331【点睛】本题考查系统抽样,属于基础题.14.20【分析】设美国学者认为的一代为年然后可得出寿命在的家族企业的频率分别为然后利用平均数公式列方程解出的值即可得出所求结果【详解】设美国学者认为的一代为年然后可得出寿命在的家族企业的频率分别为则家族 解析:20【分析】设美国学者认为的一代为x 年,然后可得出寿命在(]0,x 、(],2x x 、(]2,3x x 、(]3,4x x 的家族企业的频率分别为0.52、0.3、0.13、0.05,然后利用平均数公式列方程解出x 的值,即可得出所求结果.【详解】设美国学者认为的一代为x 年,然后可得出寿命在(]0,x 、(],2x x 、(]2,3x x 、(]3,4x x 的家族企业的频率分别为0.52、0.3、0.13、0.05,则家族企业的平均寿命为0.5(10.30.130.05) 1.50.3 2.50.13 3.50.0512.124x x x x x ⨯---+⨯+⨯+⨯==, 解得20x ≈,因此,美国学者认为“一代”应为20年,故答案为20.【点睛】本题考查平均数公式的应用,解题的关键要审清题意,将题中一些关键信息和数据收集起来,结合相应的条件或公式列等式或代数式进行求解,考查运算求解能力,属于中等题. 15.【分析】根据线性回归方程过样本数据中心点可求出b 代入即可求解【详解】由表中数据可得所以过点代入可得所以当时即获得利润大约为万元故答案为:【点睛】本题主要考查了线性回归方程样本数据中心点线性回归方程的 解析:4.74【分析】根据线性回归方程过样本数据中心点,可求出b ,代入15x =即可求解.【详解】 由表中数据可得4,1x y ==,所以0.36ˆˆybx =-过点(4,1), 代入可得0.34b =,所以ˆˆ0.340.36yx =-, 当15x =时,0.34150.34ˆ6 4.7y=⨯-=, 即获得利润大约为4.74万元.故答案为:4.74【点睛】本题主要考查了线性回归方程,样本数据中心点,线性回归方程的应用,属于中档题. 16.或【分析】利用平均数与方差公式直接求解即可【详解】由题去掉最高与最低分后的测试成绩为8284848689则平均数方差故答案为:或【点睛】本题考查茎叶图考查平均数与方差的计算是基础题解析:5.6或285【分析】利用平均数与方差公式直接求解即可【详解】由题去掉最高与最低分后的测试成绩为82,84,84,86,89,则平均数 8284848689855x ++++==方差()()()()()2222221288582858485848586858955s ⎡⎤=-+-+-+-+-=⎣⎦ 故答案为:5.6或285【点睛】本题考查茎叶图,考查平均数与方差的计算,是基础题 17.2【解析】【分析】由题意结合方差的定义整理计算即可求得最终结果【详解】由题意结合方差的定义有:①而②①-②有:③注意到将其代入③式整理可得:又故故答案为2【点睛】本题主要考查方差的计算公式整体的数学 解析:2【解析】【分析】由题意结合方差的定义整理计算即可求得最终结果.【详解】由题意结合方差的定义有:()()()22212612x x x x x x -+-++-= ①, 而()()()22212611118x x x -+-+⋅⋅⋅+-=, ②,①-②有:()()212612666226x x x x x x x x --+++++++=-, ③, 注意到1266x x x x +++=,将其代入③式整理可得:26120x x -+=, 又0x ≠,故2x =.故答案为2.【点睛】 本题主要考查方差的计算公式,整体的数学思想等知识,意在考查学生的转化能力和计算求解能力.18.75【解析】【分析】计算然后将代入回归直线得从而得回归方程然后令x =5解得y 即为所求【详解】∵∴∵∴∴样本中心点为(3)又回归直线过(3)即3=06×+解得=所以回归直线方程为y =06x+令x =5时 解析:75 【解析】【分析】计算x ,y ,然后将x ,y 代入回归直线得a ,从而得回归方程,然后令x =5解得y 即为所求.【详解】∵4115i i x ==∑,∴154x =,∵4112i i y ==∑,∴1234y ==, ∴样本中心点为(154,3), 又回归直线0.6ˆyx a =+过(154,3),即3=0.6×154+ a ,解得a =34, 所以回归直线方程为y =0.6x +34, 令x =5时,y =0.6×5+34=3.75万元 故答案为:3.75.【点睛】 本题考查线性回归方程的应用,以及利用线性回归方程进行预测,要注意回归直线必过样本中心点.19.2【解析】由茎叶图及10个班级的得分的平均数是90可得∴当且仅当即时取等号故答案为2解析:2【解析】由茎叶图及10个班级的得分的平均数是90可得8a b += ∴1911919191()()(19)(10)(1023)28888b a b a a b a b a b a b a b +=⨯++=+++=++≥+⨯=,当且仅当9b a a b=,即36b a ==时,取等号 故答案为2 20.是不相等的正整数即可【解析】∵甲班人数为平均分为乙班人数为平均分为∴甲乙两班的数学平均分为∵∴当时∴该命题是假命题时应满足是不相等的正整数故答案为:是不相等的正整数解析:,a b 是不相等的正整数即可【解析】∵甲班人数为m ,平均分为a ,乙班人数为()n n m ≠,平均分为b∴甲、乙两班的数学平均分为ma nb m n++ ∵m n ≠ ∴当a b =时,2ma nb a b m n ++=+ ∴该命题是假命题时,应满足,a b 是不相等的正整数 故答案为:,a b 是不相等的正整数三、解答题21.(1)ˆ0.21yx =+;(2)①33.6万只;②到第10年该县养殖山羊的数量相比第1年减少了.【分析】(1)由已知求得,x y ,进一步套公式求出ˆb和ˆa 的值,就求出线性回归方程; (2)由题意求得()()2ˆˆ0.212300.4430z y x x x x ⋅=+⋅-+=-++, 在①中,令x =1求解,在②中,令20.443033.6x x -++<,解不等式即可.【详解】解:(1)设y 关于x 的线性回归方程为y bx a =+,12345678959x ++++++++==, 1.2 1.5 1.6 1.6 1.8 2.5 2.5 2.6 2.729y ++++++++==, ()()()9192112ˆ0.260i ii i i x x y y b x x ==--===-∑∑, ˆ20.251a=-⨯=. 所以y 关于x 的线性回归方程为ˆ0.21yx =+. (2)估计第x 年山羊养殖的只数为()()2ˆˆ0.212300.4430z y x x x x ⋅=+⋅-+=-++ 令1x =,则0.443033.6-++=,故该县第一年养殖山羊约33.6万只.由题意,得20.443033.6x x -++<,整理得()()910x x -->,解得9x >或1x <(舍去),所以到第10年该县养殖山羊的数量相比第1年减少了.【点睛】方法点睛:求线性回归方程的步骤:(1)先求 x 、y 的平均数,x y ;(2)套公式求出ˆb和ˆa 的值:()()()91921ˆi i i i i x x y y b x x ==--=-∑∑,ˆa y b x =-⨯; (3)写出回归直线的方程. 22.(1)不同的样本的个数为432418C C .(2)①分布列见解析,()E ξ97=.②线性回归方程为0.6533.60y x =+.可预测该同学的物理成绩为96分.【分析】(1)按比例抽取即可,再用乘法原理计算不同的样本数.(2)7名学生中物理和数学都优秀的有3名学生,任取3名学生,都优秀的学生人数ξ服从超几何分布,故可得其概率分布列及其数学期望.而线性回归方程的计算可用给出的公式计算,并利用得到的回归方程预测该同学的物理成绩.【详解】(1)依据分层抽样的方法,24名女同学中应抽取的人数为724442⨯=名, 18名男同学中应抽取的人数为718342⨯=名, 故不同的样本的个数为432419C C .(2)①∵7名同学中数学和物理成绩均为优秀的人数为3名,∴ξ的取值为0,1,2,3.∴()34374035C P C ξ===,()21433711835C C C P ξ===, ()12433712235C C C P ξ===,()33375313C C P ξ===. ∴ξ的分布列为∴()0123353535357E ξ=⨯+⨯+⨯+⨯=. ②∵5260.65912b =≈,830.657633.60a y b x =-⨯=-⨯=. ∴线性回归方程为0.6533.60y x =+.当96x =时,0.659633.6096y =⨯+=.可预测该同学的物理成绩为96分.【点睛】在计算离散型随机变量的概率时,注意利用常见的概率分布列来简化计算(如二项分布、超几何分布等).23.(Ⅰ)具有较强的线性相关关系,10220y x =-;(Ⅱ)330元【分析】(Ⅰ)代入公式计算r ,再做判断,根据公式求,b a ,即得结果;(Ⅱ)先确定温度达到28C ︒以上时概率,再确定随机变量取法,分别求出对应概率,最后根据数学期望公式求结果.【详解】(Ⅰ)21232527293171121226411526,4066x y ++++++++++=======()()7000.75786n ii x x y y r --==>=>∑ 所以潜叶蝇的平均产卵数y 与平均温度x 具有较强的线性相关关系, ()()()1217001070n i i i n i i x x y yb x x ==--===-∑∑,401026220a y bx =-=-⨯=- 10220y bx a x ∴=+=-;(Ⅱ)()12528,2P ξ<≤=()C ξ︒近似地服从正太分布()226.5,N σ, ()()12528128,24P P ξξ-<≤∴>== 0,1200,1600Y = 13141163(0)1,(1200),(1600)444101041020P Y P Y P Y ==-===⨯===⨯= 313()01200140033041020E Y =⨯+⨯+⨯=(元) 【点睛】本题考查线性回归方程、数学期望公式、正态分布,考查综合分析求解能力,属中档题.24.(1)有把握;(2)1ˆ84y x =-,11%. 【分析】(1)根据列联表,利用公式计算2K ,对照附表得出结论;(2)计算x 、y ,求出回归系数,写出线性回归方程,利用方程计算76x =时ˆy的值. 【详解】(1)根据题意,计算22100(45201025)8.1297.89770305545K ⨯⨯-⨯=≈>⨯⨯⨯; 所以有99.5%的把握认为“是否佩戴口罩与年龄有关”;(2)计算1105(7065635352454032)82x =⨯+++++++=,141(10.57.57.5 5.5 4.5 3.5 1.50.5)88y =⨯+++++++=; 所以122211054124548128ˆ1054232568()2n ii i n i i x y nxyb xnx ==--⨯⨯===-⨯-∑∑; 411105ˆˆ8842a y bx =-=-⨯=-; 所以y 关于x 的线性回归方程是1ˆ84y x =-, 计算76x =时,1ˆ768114y =⨯-=, 可以预测该医院76岁确诊患者中的重症比例为11%.【点睛】本题考查了列联表与独立性检验的应用问题,也考查了线性回归方程的应用问题,是中档题.25.(1) 1.4518.7y x =-+;(2)3【分析】(1)由表中数据计算x 、y ,求出ˆb、ˆa ,即可写出回归直线方程; (2)写出利润函数z y w =-,利用二次函数的图象与性质求出3x =时z 取得最大值.【详解】解:(1)由表中数据得,1(246810)65x =⨯++++=, 1(16139.57 4.5)105y =⨯++++=, 由最小二乘法求得:22222221641369.58710 4.5561058ˆ 1.452468105640b ⨯+⨯+⨯+⨯+⨯-⨯⨯-===-++++-⨯, ˆ10(1.45)618.7a=--⨯=, 所以y 关于x 的回归直线方程为 1.4518.7y x =-+;(2)根据题意,利润函数为:22( 1.4518.7)(0.05 1.7517.2)0.050.3 1.5z y w x x x x x =-=-+--+=-++, 所以,当0.332(0.05)x =-=⨯-时,二次函数z 取得最大值为1.95; 即预测3x =时,小王销售一辆该型号汽车所获得的利润z 最大.【点睛】本题考查了回归直线方程的求法,以及二次函数的图象与性质的应用,考查计算能力. 26.(1)100分;(2)97.【分析】(1)根据题意,由频率分布直方图求出[]30,90的频率为0.35,[]90,110的频率为0.3,由0.30.350.650.5+=>知:最低分数线在(]90,110之间,进而求出中位数,即可估计出本次考试复赛资格最低分数线;(2)利用频率分布直方图计算出各组的频率,即可估计本次初赛的平均成绩.【详解】解:(1)由题意知[]30,90的频率为:()200.00250.00750.00750.35⨯++=, 由题意知[]90,110的频率为: 200.01500.3⨯=,由0.30.350.650.5+=>知:最低分数线在(]90,110之间,设最低分数线为x ,且(]90,110x ∈.由()0.35900.0150.5x +-⨯=得:100x =,故本次考试复赛资格最低分数线应划为100分.(2)由题意可知:初赛分数在区间(]30,50,(]50,70,(]70,90,(]90,110,(]110,130,(]130,150的频率分别为:0.05,0.15,0.15,0.3,0.25,0.1, 所以本次初赛的平均分为:400.05600.15800.151000.31200.251400.197⨯+⨯+⨯+⨯+⨯+⨯=.【点睛】本题考查频率分布直方图的频率、中位数、平均数的求法,考查解题分析和计算能力.。

(易错题)高中数学必修三第一章《统计》测试(含答案解析)(2)

(易错题)高中数学必修三第一章《统计》测试(含答案解析)(2)

一、选择题1.工人月工资y(元)与劳动生产率x(千元)变化的回归直线方程为=50+80x,下列判断不正确的是()A.劳动生产率为1000元时,工资约为130元B.工人月工资与劳动者生产率具有正相关关系C.劳动生产率提高1000元时,则工资约提高130元D.当月工资为210元时,劳动生产率约为2000元2.某教研机构随机抽取某校20个班级,调查各班关注汉字听写大赛的学生人数,根据所得数据的茎叶图,以组距为5将数据分组成[)[)[)[)[)[)[)[]0,5,5,10,10,15,15,20,20,25,25,30,30,35,35,40时,所作的频率分布直方图如图所示,则原始茎叶图可能是()A.B.C.D.3.在一个容量为5的样本中,数据均为整数,已测出其平均数为8,但墨水污损了后面两个数据,其中一个数据的十位数字1未污损,即5,7,8,,那么这组数据的方差2s 可能的最大值是()A.185B.18 C.36 D.64.为了了解我校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1:2:3,第2小组的频数为12,则抽取的学生总人数是()A.24 B.48 C.56 D.645.将某选手的7个得分去掉1个最高分,去掉1个最低分,5个剩余分数的平均分为21,现场作的7个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示,则5个剩余分数的方差为( )A.1167B.365C.36 D.6756.某宠物商店对30只宠物狗的体重(单位:千克)作了测量,并根据所得数据画出了频率分布直方图如下图所示,则这30只宠物狗体重(单位:千克)的平均值大约为()A.15.5 B.15.6 C.15.7 D.167.某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为()A.30 B.25 C.20 D.158.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755的人数为()A.10 B.11C.12 D.139.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是()A.90.5 B.91.5 C.90 D.9110.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位11.已知某企业上半年前5个月产品广告投入与利润额统计如下: 月份1 2 3 4 5 广告投入(x 万元) 9.5 9.3 9.1 8.9 9.7 利润(y 万元)9289898793由此所得回归方程为7.5ˆyx a =+,若6月份广告投入10(万元)估计所获利润为( ) A .97万元B .96.5万元C .95.25万元D .97.25万元12.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响.对近8年的年宣传费i x 和年销售量()1,2,...8i y i =数据作了初步处理,得到下面的散点图及一些统计量的值.有下列5个曲线类型:①ˆˆy bxa =+;②y x d =+;③ln y p q x =+;④21k xy k e =+;⑤212y c x c =+,则较适宜作为年销售量y 关于年宣传费x 的回归方程的是( ) A .①②B .②③C .②④D .③⑤二、填空题13.如图是某地区2018年12个月的空气质量指数以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述正确的是______.①2月相比去年同期变化幅度最小,3月的空气质量指数最高;②第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小;③第三季度空气质量指数相比去年同期变化幅度的方差最小;④空气质量指数涨幅从高到低居于前三位的月份为6、8、4月.14.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____15.随机抽取100名年龄在[10,20),[20,30),…,[50,60)年龄段的市民进行问卷调查,由此得到样本的频率分布直方图如图所示.从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人,则在[50,60)年龄段抽取的人数为______.16.已知一组数据126,,,x x x ⋅⋅⋅的方差是2,并且()()()22212611118x x x -+-+⋅⋅⋅+-=,0x ≠,则x =______.17.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.18.已知由样本数据集合(){}11,1,2,3,...,x y i n =,求得的回归直线方程为1.2308ˆ.0y x =+,且ˆ4x =,若去掉两个数据点 (4.1,5.7)和(3.9,4.3)后重新求得的回归直线方程l 的斜率估计值为1.2,则此回归直线l 的方程为_______.19.某学校高一年级男生人数占该年级学生人数的45%,在一次考试中,男、女生平均分数依次为72、74,则这次考试该年级学生的平均分数为__________. 20.变量X 与Y 相对应的5组数据和变量U 与V 相对应的5组数据统计如表: X 10 11.3 11.8 12.5 13 U 10 11.3 11.8 12.5 13 Y12345V54321用b 1表示变量Y 与X 之间的回归系数,b 2表示变量V 与U 之间的回归系数,则b 1与b 2的大小关系是___.三、解答题21.据了解,温带大陆性气候,干燥,日照时间长,昼夜温差大,有利于植物糖分积累.某课题研究组欲研究昼夜温差大小()/x ℃与某植物糖积累指数()/y GI 之间的关系,得到如下数据:组数 第一组 第二组第三组第四组第五组第六组昼夜温差/℃x10 11 13 12 8 6 某植物糖积累202430281815指数/y GI下的2组数据进行检验,假设这剩下的2组数据恰好是第一组与第六组数据.(1)求y关于x的线性回归方程ˆˆˆy bx a=+(2)若由线性回归方程得到的估计数据与所选出的检验数据的差的绝对值均不超过2.58,则认为得到的线性回归方程是理想的,试问(1)中所得线性回归方程是否理想?(参考公式:回归直线方程ˆˆˆy bx a=+的斜率和截距的最小二乘估计()()()211ˆˆˆ,i iininix x y yb a y bxx x==--==--∑∑22.某学校进行体验,现得到所有男生的身高数据,从中随机抽取50人进行统计(已知这50个身高介于155cm到195cm之间),现将抽取结果按如下方式分成八组:第一组[155,160),第二组[160,165),...,第八组[190,195],并按此分组绘制如图所示的频率分布直方图,其中第六组[180,185)和第七组[185,190)还没有绘制完成,已知第一组与第八组人数相同,第六组和第七组人数的比为5:2.(1)补全频率分布直方图;(2)根据频率分布直方图估计这50位男生身高的中位数;(3)用分层抽样的方法在身高为[170,180]内抽取一个容量为5的样本,从样本中任意抽取2位男生,求这两位男生身高都在[175,180]内的概率.23.某校高一年级举行“抗击新冠肺炎”在线知识问答比赛,现将60名参赛学生的成绩(满分100分)统计如下:分组频数频率[50,60)180.30[60,70)240.40[70,80) 9 0.15 [80,90) 6 0.10 [90,100]30.05(1)根据上面的统计表,作出这些数据的频率分布直方图;(2)求这60名参赛学生成绩的平均数(同一组中的数据用该组区间的中间值作代表)和中位数.24.潜叶蝇是南方地区水稻容易遭受的虫害之一,成虫将虫卵产在叶片里,待虫卵孵化之后幼虫会在叶片中啃叶肉,使得秧苗的叶片呈现白色的状态,进而降低水稻产量.经研究,每只潜叶蝇的平均产卵数y 和夏季平均温度x 有关,现收集了某地区以往6年的数据,得到下面数据统计表格. 平均温度C i x ︒ 21 23 25 27 29 31 平均产卵数i y 个711212264115(Ⅰ)根据相关系数r 判断,潜叶蝇的平均产卵数y 与平均温度x 是否具有较强的线性相关关系,若有较强的线性相关关系,求出线性回归方程y bx a =+,若没有较强的线性相关关系,请说明理由(一般情况下,当0.75r >时,可认为变量有较强的线性相关关系);(Ⅱ)根据以往的统计,该地区夏季平均气温为()C ξ︒近似地服从正太分布()226.5,N σ,且()125282P ξ<≤=.当该地区某年平均温度达到28C ︒以上时,潜叶蝇快速繁殖引发虫害,需要进行一次人工治理,每次的人工治理成本为200元/公顷(其他情况均不需要人工治理),且虫害一定会导致水稻减产,对过往10次爆发虫害时的减产损失进行统计,结果如下: 每次虫害减产损失(元/公顷)10001400用样本的频率估计概率,预测未来2年,每公顷水稻可能因潜叶蝇虫害造成的经济损失Y (元)的数学期望.(经济损失=减产损失+治理成本) 参考公式和数据:()()ni i x xy yr --=∑()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-()()61700iii x x y y =--=∑,6214126ii x==∑,61240i i y==∑,()6218816i i y y=-=∑,8.4≈786≈.25.某玻璃工艺品加工厂有2条生产线用于生产其款产品,每条生产线一天能生产200件该产品,该产品市场评级规定:评分在10分及以上的为A 等品,低于10分的为B 等品.厂家将A 等品售价定为2000元/件,B 等品售价定为1200元/件. 下面是检验员在现有生产线上随机抽取的16件产品的评分:经计算得16119.9716i i x x ===∑,()1616222211110.0451616i i i i s x x x x ===-=-=∑∑,其中i x 为抽取的第i 件产品的评分,1,2,,16i =⋅⋅⋅.该厂计划通过增加生产工序来改进生产工艺,已知对一条生产线增加生产工序每年需花费1500万元,改进后该条生产线产能不变,但生产出的每件产品评分均提高0.05.已知该厂现有一笔1500万元的资金.(1)若厂家用这1500万元改进一条生产线,根据随机抽取的16件产品的评分. (i )估计改进后该生产线生产的产品中A 等品所占的比例; (ii )估计改进后该厂生产的所有产品评分的平均数和方差.(2)某金融机构向该厂推销一款年收益率为8.2%的理财产品,请你利用所学知识分析,将这1500万元用于购买该款理财产品所获得的收益,与通过改进一条生产线使产品评分提高所增加的收益相对比,一年后哪种方案的收益更大? (一年按365天计算) 26.某企业广告费支出与销售额(单位:百万元)数据如表所示:销售额y50 40 70 30 60(1)求销售额y 关于广告费x 的线性回归方程;(2)预测当销售额为76百万元时,广告费支出为多少百万元. 回归方程y bx a =+中斜率和截距的最小二乘估计公式分别为:()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.2.A解析:A 【解析】由频率分布直方图可知:第一组的频数为20×0.01×5=1个, [0,5)的频数为20×0.01×5=1个, [5,10)的频数为20×0.01×5=1个, [10,15)频数为20×0.04×5=4个, [15,20)频数为20×0.02×5=2个, [20,25)频数为20×0.04×5=4个, [25,30)频数为20×0.03×5=3个,[30,35)频数为20×0.03×5=3个, [35,40]频数为20×0.02×5=2个, 则对应的茎叶图为A , 本题选择A 选项.点睛:茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.3.C解析:C 【分析】设出最后两个数,然后根据已知条件列方程,求得方程2s 的表达式,根据表达式的结构求得2s 的最大值. 【详解】设这组数据的最后2个分别是10x +,y 则5781085x y +++++=⨯, 得10x y +=,故10y x =-. ∴()222211910(2)(2)21855s x x x ⎡⎤=+++++-=+⎣⎦, 显然当9x =时,2s 最大,最大为36. 故选:C 【点睛】本小题主要考查平均数和方差的计算,考查方程的思想,属于基础题.4.B解析:B 【分析】根据频率分布直方图可知从左到右的前3个小组的频率之和,再根据频率之比可求出第二组频率,结合频数即可求解. 【详解】 由直方图可知,从左到右的前3个小组的频率之和为1(0.01250.0375)510.250.75-+⨯=-=, 又前3个小组的频率之比为1:2:3,所以第二组的频率为20.750.256⨯=, 所以学生总数120.2548n =÷=,故选B. 【点睛】本题主要考查了频率分布直方图,频率,频数,总体,属于中档题.5.B解析:B 【分析】由剩余5个分数的平均数为21,据茎叶图列方程求出x =4,由此能求出5个剩余分数的方差.【详解】∵将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为21, ∴由茎叶图得:1724202020215x +++++= 得x =4,∴5个分数的方差为: S 2=()()()()()222221361721242120212021242155⎡⎤-+-+-+-+-=⎣⎦ 故选B【点睛】 本题考查方差的求法,考查平均数、方差、茎叶图基础知识,考查运算求解能力,考查数形结合思想,是基础题.6.B解析:B【分析】由频率分布直方图分别计算出各组得频率、频数,然后再计算出体重的平均值【详解】由频率分布直方图可以计算出各组频率分别为:0.10.20.250.250.15,,,,,0.05 频数为:367.57.54.51.5,,,,, 则平均值为:113136157.5177.519 4.521 1.515.630⨯+⨯+⨯+⨯+⨯+⨯= 故选B【点睛】本题主要考查了由频率分布直方图计算平均数,需要注意计算不要出错 7.C解析:C【详解】 抽取比例为150130000200=, 1400020200∴⨯=, 抽取数量为20,故选C.8.C解析:C【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n =30n ﹣19,由401≤30n ﹣21≤755,求得正整数n 的个数,即可得出结论.【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列, 又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,∴等差数列的通项公式为a n =11+(n ﹣1)30=30n ﹣19,由401≤30n ﹣19≤755,n 为正整数可得14≤n ≤25,∴做问卷C 的人数为25﹣14+1=12,故选C .【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.9.A解析:A【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可.【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95, 所以中位数为90+91=90.52,故选A. 【点睛】本题主要考查了中位数,茎叶图,属于中档题. 10.C解析:C【解析】【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论.【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位,即减少1.5个单位,故选C.【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目. 11.C解析:C【解析】【分析】首先求出x y ,的平均数,将样本中心点代入回归方程中求出a 的值,然后写出回归方程,然后将10x =代入求解即可【详解】()19.59.39.18.99.79.35x =⨯++++= ()19289898793905y =⨯++++= 代入到回归方程为7.5ˆyx a =+,解得20.25a = 7.25ˆ50.2yx ∴=+ 将10x =代入7.50.5ˆ22yx =+,解得ˆ95.25y = 故选C【点睛】本题是一道关于线性回归方程的题目,解答本题的关键是求出线性回归方程,属于基础题。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章必修三统计单元测试一、选择题(本大题共12小题,每小题5分,共60分)1.从某年级1 000名学生中抽取125名学生进行体重的统计分析,就这个问题来说,下列说法正确的是()A.1 000名学生是总体B.每个被抽查的学生是个体C.抽查的125名学生的体重是一个样本D.抽取的125名学生的体重是样本容量2.由小到大排列的一组数据x1,x2,x3,x4,x5,其中每个数据都小于-1,那么对于样本1,x1,-x2,x3,-x4,x5的中位数可以表示为()A.12(1+x2) B.12(x2-x1) C.12(1+x5) D.12(x3-x4)3.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36的样本,则老年人、中年人、青年人分别应抽取的人数是()A.7,11,19 B.6,12,18C.6,13,17 D.7,12,174.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图1;对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图2.由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关5.已知一组数据x1,x2,x3,x4,x5的平均数是2,方差是13,那么另一组数3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数,方差分别是()A.2,13B.2,1C.4,23D.4,36.某学院有4个饲养房,分别养有18,54,24,48只白鼠供实验用.某项实验需抽取24只白鼠,你认为最合适的抽样方法是()A.在每个饲养房各抽取6只B.把所有白鼠都加上编有不同号码的颈圈,用随机抽样法确定24只C.从4个饲养房分别抽取3,9,4,8只D.先确定这4个饲养房应分别抽取3,9,4,8只,再由各饲养房自己加号码颈圈,用简单随机抽样的方法确定7.下列有关线性回归的说法,不正确的是()A.相关关系的两个变量不一定是因果关系B.散点图能直观地反映数据的相关程度C.回归直线最能代表线性相关的两个变量之间的关系D.任一组数据都有回归直线方程8.已知施肥量与水稻产量之间的回归直线方程为y^=4.75x+257,则施肥量x=30时,对产量y的估计值为()A.398.5 B.399.5C.400 D.400.59.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是()A.甲地:总体均值为3,中位数为4B.乙地:总体均值为1,总体方差大于0 C.丙地:中位数为2,众数为3D.丁地:总体均值为2,总体方差为3 10.某高中在校学生2 000人,高一与高二人数相同并都比高三多1人.为了响应“阳光体育运动”号召,学校举行了“元旦”跑步和登山比赛活动.每人都参加而且只参与了其中一项比赛,各年级参与比赛人数情况如下表:高一高二高三跑步 a b c登山x y z其中a∶b∶c=2∶3∶5,全校参与登山的人数占总人数的25.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则高二参与跑步的学生中应抽取() A.36人B.60人C.24人D.30人11.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们所有比赛得分的情况用如右图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为()A.19,13 B.13,19C.20,18 D.18,2012.从一堆苹果中任取了20个,并得到它们的质量(单位:克)数据分布表如下:分组[90,100)[100,110)[110,120)[120,130)[130,140)[140,150]频数1231031A.30%题号123456789101112答案二、填空题(本大题共13.甲、乙、丙、丁四名射击手在选拔赛中的平均环数x及其标准差s如下表所示,则选送决赛的最佳人选应是甲乙丙丁7887s 2.5 2.5 2.8314.一组数据23,27,20,18,x,12.15.某市居民2005~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的年份20052006200720082009收入x 11.512.11313.315支出Y 6.88.89.81012根据统计资料,出________线性相关关系.16.某单位为了了解用电量y度与气温x℃之间的关系,随机统计了某4天的用电量与当天气温.由表中数据得回归直线方程y=b x+a中b=-2,据此预测当气温为5℃时,用电量的度数约为______.三、解答题(本大题共6小题,共70分)17.(10分)一批产品中,有一级品100个,二级品60个,三级品40个,用分层抽样的方法,从这批产品中抽取一个容量为20的样本,写出抽样过程.18.(12分)为了了解学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)学生跳绳次数的中位数落在哪个小组内?(2)第二小组的频率是多少?样本容量是多少?(3)若次数在110以上(含110次)为良好,试估计该学校全体高一学生的良好率是多少?19.(12分)为了研究三月下旬的平均气温(x)与四月棉花害虫化蛹高峰日(y)的关系,某地区观察了2003年至2008年的情况,得到下面数据:已知x与y27℃,试估计2010年四月化蛹高峰日为哪天?20.(12分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)(1)(2)请根据上表提供的数据,用最小二乘法求出y关于x的回归直线方程y^=b^x+a^;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)21.(12分)农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种麦苗的试验田中各抽取6株麦苗测量麦苗的株高,数据如下:(单位:cm)甲:9,10,11,12,10,20乙:8,14,13,10,12,21.(1)在右面给出的方框内绘出所抽取的甲、乙两种麦苗株高的茎叶图;(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗的长势情况.22.(12分)从高三抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图.试利用频率分布直方图求:(1)这50名学生成绩的众数与中位数.(2)这50名学生的平均成绩.第二章统计1.C[在初中学过:“在统计中,所有考察对象的全体叫做总体,其中每一个所要考察的对象叫做个体,从总体中抽取的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本容量.”因此题中所指的对象应是体重,故A、B错误,样本容量应为125,故D错误.]2.C[由题意把样本从小到大排序为x1,x3,x5,1,-x4,-x2,因此得中位数为12(1+x5).]3.B[因27∶54∶81=1∶2∶3,16×36=6,26×36=12,36×36=18.]4.C[由点的分布知x与y负相关,u与v正相关.]5.D[因为数据x1,x2,x3,x4,x5的平均数是2,方差是1 3,所以x=2,15∑5i=1(x i-2)2=13,因此数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数为:1 5∑5i=1(3x i-2)=3×15∑5i=1x i-2=4,方差为:15∑5i=1(3x i-2-x)2=15∑5i=1(3x i-6)2=9×15∑5i=1(x i-2)2=9×13=3.]6.D[因为这24只白鼠要从4个饲养房中抽取,因此要用分层抽样决定各个饲养房应抽取的只数,再用简单随机抽样法从各个饲养房选出所需白鼠.C虽然用了分层抽样,但在每个层中没有考虑到个体的差异,也就是说在各个饲养房中抽取样本时,没有表明是否具有随机性,故选D.]7.D[根据两个变量具有相关关系的概念,可知A正确,散点图能直观地描述呈相关关系的两个变量的相关程度,且回归直线最能代表它们之间的相关关系,所以B、C正确.只有线性相关的数据才有回归直线方程,所以D不正确.]8.B[成线性相关关系的两个变量可以通过回归直线方程进行预测,本题中当x=30时,y^=4.75×30+257=399.5.]9.D[由于甲地总体均值为3,中位数为4,即中间两个数(第5、6天)人数的平均数为4,因此后面的人数可以大于7,故甲地不符合.乙地中总体均值为1,因此这10天的感染人数总和为10,又由于方差大于0,故这10天中不可能每天都是1,可以有一天大于7,故乙地不符合.丙地中中位数为2,众数为3,3出现的最多,并且可以出现8,故丙地不符合.故丁地符合.]10.A[由题意知高一、高二、高三的人数分别为667,667,666.设a=2k,b=3k,c=5k,则a +b +c =35×2 000,即k =120. ∴b =3×120=360.又2 000人中抽取200人的样本,即每10人中抽取一人,则360人中应抽取36人,故选A.]11.A [分别将甲、乙两名运动员的得分从小到大排列,中间位置的分数则为中位数.]12.B [由数据分布表可知,质量不小于120克的苹果有10+3+1=14(个),占苹果总数的1420×100%=70%.] 13.乙解析 平均数反映平均水平大小,标准差表明稳定性.标准差越小,稳定性越好. 14.2215.13 正16.40解析 ∵x =14(14+12+8+6)=10, y =14(22+26+34+38)=30, ∴a ^ =y -b ^ x =30+2×10=50.∴当x =5时,y ^ =-2×5+50=40.17.解 分层抽样方法:先将总体按其级别分为三层,一级品有100个,产品按00,01,…,99编号,二级品有60个,产品按00,01,…,59编号,三级品有40个,产品按00,01,…,39编号.因总体个数∶样本容量为10∶1,故用简单随机抽样的方法,在一级品中抽10个,二级品中抽6个,三级品中抽4个.这样就可得到一个容量为20的样本.18.解 (1)∵前三组的频率和为2+4+1750=2350<12, 前四组的频率之和为2+4+17+1550=3850>12, ∴中位数落在第四小组内.(2)频率为:42+4+17+15+9+3=0.08, 又∵频率=第二小组频数样本容量, ∴样本容量=频数频率=120.08=150. (3)由图可估计所求良好率约为:17+15+9+32+4+17+15+9+3×100%=88%.19.解 由题意知: x ≈29.13,y =7.5,∑6i =1x 2i=5 130.92, ∑6i =1x i y i=1 222.6, ∴b ^=∑6i =1x i y i -6x y ∑6i =1x 2i -6x 2≈-2.2, a ^ =y -b ^x ≈71.6, ∴回归方程为y ^ =-2.2x +71.6.当x =27时,y ^ =-2.2×27+71.6=12.2,据此,可估计该地区2010年4月12日或13日为化蛹高峰日.20.解 (1)散点图如下:(2)x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5, ∑4i =1x i y i=3×2.5+4×3+5×4+6×4.5=66.5, ∑4i =1x 2i =32+42+52+62=86, ∴b ^=∑4i =1x i y i -4x y ∑4i =1x 2i -4x 2=66.5-4×3.5×4.586-4×4.52=0.7, a ^=y -b ^ x =3.5-0.7×4.5=0.35.∴y ^=0.7x +0.35.∴所求的回归直线方程为y ^ =0.7x +0.35.(3)现在生产100吨甲产品用煤y ^ =0.7×100+0.35=70.35,∴90-70.35=19.65.∴生产能耗比技改前降低约19.65吨标准煤.21.解 (1)茎叶图如图所示:(2)x 甲=9+10+11+12+10+206=12, x 乙=8+14+13+10+12+216=13,s2甲=16×[(9-12)2+(10-12)2+(11-12)2+(12-12)2+(10-12)2+(20-12)2]≈13.67,s2乙=16×[(8-13)2+(14-13)2+(13-13)2+(10-13)2+(12-13)2+(21-13)2]≈16.67.因为x甲<x乙,所以乙种麦苗平均株高较高,又因为s2甲<s2乙,所以甲种麦苗长的较为整齐.22.解(1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形框的中间值的横坐标即为所求,所以众数应为75.由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将频率分布直方图中所有小矩形的面积一分为二的直线所对应的成绩即为所求.∵0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,∴前三个小矩形面积的和为0.3.而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,∴中位数应位于第四个小矩形内.设其底边为x,高为0.03,∴令0.03x=0.2得x≈6.7,故中位数约为70+6.7=76.7.(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积即可.∴平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.021×10)+95×(0.016×10)≈74.。

相关文档
最新文档