新版高中数学北师大版必修3习题第一章统计1.5.1含解析
北师大版高中数学必修三第一章《统计》测试卷(包含答案解析)(1)
一、选择题1.某班统计一次数学测验的平均分与方差,计算完毕才发现有位同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( )A .1x x =,221s s = B .1x x =,221s s < C .1x x =,221s s >D .1x x <,221s s =2.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,83.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18554.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差D .极差5.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( )A .26B .27C .28D .296. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日7.下图是某公司2018年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是( )A .2018年3月的销售任务是400台B .2018年月销售任务的平均值不超过600台C .2018年第一季度总销售量为830台D .2018年月销售量最大的是6月份 8.①45化为二进制数为(2)101101;②一个总体含有1000个个体(编号为0000,0001,…,0999),采用系统抽样从中抽取一个容量为50的样本,若第一个抽取的编号为0008,则第六个编号为0128; ③已知a ,b ,c 为ABC ∆三个内角A ,B ,C 的对边,其中3a =,4c =,6A π=,则这样的三角形有两个解.以上说法正确的个数是( ) A .0B .1C .2D .39.汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,下图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况. 下列叙述中正确的是( )A.消耗1升汽油,乙车最多可行驶5千米B.以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多C.甲车以80千米/小时的速度行驶1小时,消耗10升汽油D.某城市机动车最高限速80千米/小时. 相同条件下,在该市用丙车比用乙车更省油10.已知x,y的取值如表:x 2678y若x,y之间是线性相关,且线性回归直线方程为,则实数a的值是A.B.C.D.11.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为A.12 B.14 C.16 D.1812.从存放号码分别为1,2, ,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是()A.0.53 B.0.5 C.0.47 D.0.37二、填空题13.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____14.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..15.已知数据(1,2,3,4,5)i x i =的平均值为a ,数列2{()}i x a -为等差数列,且3||0.1x a -=________.16.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.17.某公司的广告费支出x 与销售额y (单位:万元)之间有下列对应数据:由资料显示y 对x 呈线性相关关系。
(常考题)北师大版高中数学必修三第一章《统计》检测题(包含答案解析)(1)
一、选择题1.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm ),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是( )A .海水稻根系深度的中位数是45.5B .普通水稻根系深度的众数是32C .海水稻根系深度的平均数大于普通水稻根系深度的平均数D .普通水稻根系深度的方差小于海水稻根系深度的方差2.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.53.图1是某学习小组学生数学考试成绩的茎叶图,1号到16号的同学的成绩依次为1A ,216,,A A ⋯,图2是统计茎叶图中成绩在一定范围内的学生情况的程序框图,那么该程序框图输出的结果是( )A .10B .6C .7D .164.有一个容量为200的样本,样本数据分组为[50,70),[70,90),[90,110),[110,130),[130,150),其频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在区间[90,110)内的频数为( )A .48B .60C .64D .725.通过实验,得到一组数据如下:2,5,8,9,x ,已知这组数据的平均数为6,则这组数据的方差为( ) A .3.2B .4C .6D .6.56.①45化为二进制数为(2)101101;②一个总体含有1000个个体(编号为0000,0001,…,0999),采用系统抽样从中抽取一个容量为50的样本,若第一个抽取的编号为0008,则第六个编号为0128; ③已知a ,b ,c 为ABC ∆三个内角A ,B ,C 的对边,其中3a =,4c =,6A π=,则这样的三角形有两个解.以上说法正确的个数是( ) A .0B .1C .2D .37.总体由编号为01,02,,29,30的30个个体组成,利用下面的随机数表选取4个个体.选取的方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的第4个个体的编号为( ).7806 6572 0802 6314 2947 1821 98003204 9234 4935 3623 4869 6938 7481A .02B .14C .18D .298.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( ) A .10B .11C .12D .139.某校高一年级有学生1800人,高二年级有学生1500人,高三年级有1200人,为了调查学生的视力状况,采用分层抽样的方法抽取学生,若在抽取的样本中,高一年级的学生有60人,则该样本中高三年级的学生人数为( )A.60 B.50 C.40 D.3010.设有一个直线回归方程为2 1.5y x=-,则变量x增加一个单位时()A.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位D.y平均减少2个单位11.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为A.12 B.14 C.16 D.1812.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是()A.0.53 B.0.5 C.0.47 D.0.37二、填空题13.福利彩票“双色球”中红色球由编号为01,02,…,33的33个个体组成,某彩民利用下面的随机数表(下表是随机数表的第一行和第二行)选取6个红色球,选取方法是从随机数表中第1行的第6列和第7列数字开始,由左到右依次选取两个数字,则选出来的第3个红色球的编号为______.49 54 43 54 82 17 37 93 23 28 87 35 20 56 43 84 26 34 91 6457 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7614.某住宅小区有居民2万户,从中随机抽取200户,调查是否安装宽带,调查结果如下表所示:宽带租户业主已安装6042未安装3662则该小区已安装宽带的居民估计有______户.15.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..16.为调查某校学生每天用于课外阅读的时间,现从该校3000名学生中随机抽取100名学生进行问卷调查,所得数据均在区间[50,100]上,其频率分布直方图如图所示,则估计该校学生中每天用于阅读的时间在[70,80)(单位:分钟)内的学生人数为____.17.一个车间为了规定工作原理,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下: 零件数x (个) 15 20 30 40 50 加工时间y (分钟)6570758090由表中数据,求得线性回归方程0.66y x a =+,则估计加工70个零件时间为__________分钟(精确到0.1).18.下表为生产A 产品过程中产量x (吨)与相应的生产耗能y (吨)的几组相对应数据:x34 5 6y 23.55 5.5根据上表提供的数据,得到y 关于x 的线性回归方程为0.7y x a =+,则a =__________. 19.某班60名学生参加普法知识竞赛,成绩都在区间[40100],上,其频率分布直方图如图所示,则成绩不低于60分的人数为___.20.总体由编号为01,02,⋅⋅⋅,29,30的30个个体组成.利用下面的随机数表选取样本,选取方法是从随机数表第2行的第6列数字开始由左到右依次选取两个数字,则选出来的第3个个体的编号为__________.三、解答题21.我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.现该企业为了了解年研发资金投入额x (单位:亿元)对年盈利额y (单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近10年年研发资金投入额i x 和年盈利额i y 的数据.通过对比分析,建立了两个函数模型:①2y x αβ=+,②x ty e λ+=,其中α,β,λ,t 均为常数,e 为自然对数的底数.令2i i u x >,()ln 1,2,,10ii v y i ==⋅⋅⋅,经计算得如下数据:xy()1021i i x x =-∑()1021i i y y =-∑ uv2621565 26805.36()1021ii uu =-∑()()101iii u u y y =--∑()1021ii v v =-∑()()101iii x x v v =--∑11250 130 2.6 12(2)(ⅰ)根据(1)的选择及表中数据,建立y 关于x 的回归方程;(系数精确到0.01) (ⅱ)若希望2021年盈利额y 为250亿元,请预测2021年的研发资金投入额x 为多少亿元?(结果精确到0.01)附:①相关系数12211()()()()niii nn iii i x x y y r x x y y ===--=--∑∑∑,回归直线ˆˆˆya bx =+中:121()()ˆ()niii nii x x yy bx x ==--=-∑∑,ˆˆay bx =- ②参考数据:ln 20.693≈,ln5 1.609≈.22.某地政府拟在该地一水库上建造一座水电站,用泄流水量发电.下图是根据该水库历年的日泄流量的水文资料画成的日泄流量X (单位:万立方米)的频率分布直方图(不完整),已知[)0,120X ∈,历年中日泄流量在区间[30,60) 的年平均天数为156,一年按364天计.(Ⅰ)请把频率分布直方图补充完整;(Ⅱ)该水电站希望安装的发电机尽可能运行,但每30万立方米的日泄流量才够运行一台发电机,如6090X ≤<时才够运行两台发电机,若运行一台发电机,每天可获利润为4000元,若不运行,则该台发电机每天亏损500元,以各段的频率作为相应段的概率,以水电站日利润的期望值为决策依据,问:为使水电站日利润的期望值最大,该水电站应安装多少台发电机?23.某养殖基地为满足市场需要,逐年加大对养殖基地的资金投入,技术分析员对4年来的年资金投入量x (单位:万元)与相应的年市场销售额y (单位:万元)作了初步的调研统计,得到数据如表:x (万元)2 3 4 5 y (万元) 26394954(1)求根据年资金投入量预报年市场销售额的的回归方程; (2)预报年资金投入量为7.5万元时年市场销售额;(3)若年市场销售额不低于100万,那么年资金投入量至少要多少?(保留两位小数)其中,()()()121nii i nii xx y yb xx==--=-∑∑,a bx y =-+.24.某学校因为今年寒假延期开学,根据教育部的停课不停学指示,该学校组织学生线上教学,高一年级在线上教学一个月后,为了了解线上教学的效果,在线上组织了学生数学学科考试,随机抽取50名学生的成绩并制成频率分布直方图如图.(1)求m 的值并估计这50名学生的平均成绩;(2)估计高一年级所有学生数学成绩在[90,100)分与[)70,100分的学生所占的百分比. 25.随着各国经贸关系的进一步加深,许多国外的热带水果进入国内市场,牛油果作为一种热带水果,越来越多的中国消费者对这种水果有了一种全新的认识,它富含多种维生素、丰富的脂肪和蛋白质,钠、钾、镁、钙等含量也高,除作生果食用外也可作菜肴和罐头.牛油果原产于墨西哥和中美洲,后在加利福尼亚州被普遍种植.因此加利福尼亚州成为世界上最大的牛油果生产地,在全世界热带和亚热带地区均有种植,但以美国南部、危地马拉、墨西哥及古巴栽培最多,并形成了墨西哥系、危地马拉系、西印度系三大种群,我国的广东、海南、福建、广西、台湾、云南及四川等地都有少量栽培.市场上的牛油果大部分都是进口的.为了调查市场上牛油果的等级代码数值x 与销售单价y 之间的关系,经统计得到如下数据: 等级代码数值x 38 48 58 68 78 88 销售单价y (元/kg )16.818.820.822.82425.8(1)已知销售单价y 与等级代码数值x 之间存在线性相关关系,利用前5组数据求出y 关于x 的线性回归方程;(2)若由(1)中线性回归方程得到的估计值与最后一组数据的实际值之间的误差不超过1,则认为所求回归方程是有效可靠的,请判断所求回归直线方程是否有效可靠? (3)若一果园估计可以收获等级代码数值为85的牛油果980kg ,求该果园估计收入为多少元.参考公式:对一组数据()11,x y ,()22,x y ,…,(),n n x y ,其回归直线y bx a =+的斜率和截距的最小二乘估计分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,b y bx =-.参考数据:516169.6i ii x y==∑,52117820i i x ==∑.26.某企业广告费支出与销售额(单位:百万元)数据如表所示:(1)求销售额y 关于广告费x 的线性回归方程;(2)预测当销售额为76百万元时,广告费支出为多少百万元. 回归方程y bx a =+中斜率和截距的最小二乘估计公式分别为:()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】选项A 求出海水稻根系深度的中位数是444745.52+=,判断选项A 正确;选项B 写出普通水稻根系深度的众数是32,判断选项B 正确;选项C 先求出海水稻根系深度的平均数,再求出普通水稻根系深度的平均数,判断选项C 正确;选项D 先求出普通水稻根系深度的方差,再求出海水稻根系深度的方差,判断选项D 错误. 【详解】解:选项A :海水稻根系深度的中位数是444745.52+=,故选项A 正确; 选项B :普通水稻根系深度的众数是32,故选项B 正确;选项C :海水稻根系深度的平均数393938434447495050514510+++++++++=,普通水稻根系深度的平均数252732323436384041453510+++++++++=,故选项C 正确;选项D :普通水稻根系深度的方差2222222211[(3845)(3945)(3945)(4345)(4445)(4745)(4945)(5045)10S =-+-+-+-+-+-+-+-+, 海水稻根系深度的方差2222222221[(2535)(2735)(3235)(3235)(3435)(3635)(3835)(4035)(10S =-+-+-+-+-+-+-+-+,故选项D 错误 故选:D. 【点睛】本题考查根据茎叶图求中位数、众数、平均数、方差,是基础题. 2.A解析:A 【分析】计算得到 4.5x =,114t y +=,代入回归方程计算得到答案. 【详解】3456 4.54x +++==, 2.54 4.51144t t y ++++==,中心点(),x y 过ˆ0.70.35yx =+, 即114.50.70.354t +=⨯+,解得3t =. 故选:A . 【点睛】本题考查了回归方程的相关问题,意在考查学生的计算能力.3.A解析:A 【分析】先弄清楚程序框图中是统计成绩不低于90分的学生人数,然后从茎叶图中将不低于90分的个数数出来,即为输出的结果. 【详解】176A =,1i =,16i ≤成立,190A ≥不成立,112i =+=; 279A =,2i =,16i ≤成立,290A ≥不成立,112i =+=;792A =,7i =,16i ≤成立,790A ≥成立,011n =+=,718i =+=;依此类推,上述程序框图是统计成绩不低于90分的学生人数,从茎叶图中可知,不低于90分的学生数为10,故选A . 【点睛】本题考查茎叶图与程序框图的综合应用,理解程序框图的意义,是解本题的关键,考查理解能力,属于中等题.4.B解析:B【分析】由(0.00500.00750.01000.0125)201a ++++⨯=,求出a ,计算出数据落在区间[90,110)内的频率,即可求解.【详解】由(0.00500.00750.01000.0125)201a ++++⨯=, 解得0.015a =,所以数据落在区间[90,110)内的频率为0.015200.3⨯=, 所以数据落在区间[90,110)内的频数2000.360⨯=, 故选B. 【点睛】本题主要考查了频率分布直方图,频率、频数,属于中档题.5.C解析:C 【解析】分析:利用平均数的公式,求得6x =,得到数据2,5,8,9,6,再利用方差的计算公式,即求解数据的方差.详解:由题意,一组数据2,5,8,9,x 的平均数为6,即258924655x xx +++++===,解得6x =,所以数据2,5,8,9,6的方差为2222221[(26)(56)(86)(96)(66)]65s =-+-+-+-+-=,故选C.点睛:本题主要考查了数据的数字特的计算,其中熟记数据的平均数的公式和数据的方差的计算公式是解答的关键,着重考查了推理与运算能力,属于基础题.6.C解析:C 【解析】分析:①根据进位制的互化可得结果;②根据系统抽样的性质可得结论;③由正弦定理可得结论.详解:①45222...1÷=,22211...0÷=,112 5...1÷=,52 2...1÷=,22 1...0÷=,120...1÷=,故()()10245101101=,①正确;②因为1000个个题抽取50个样本,∴每个样本编号间隔为20,第六个编号为8205108+⨯=,即编号为0108,故②错误;③由正弦定理可得342,1sin 32sinC C ==,,c a C >∴∠可能是锐角,也可能是钝角,三角形有两个解,③正确,故选C.点睛:本题主要考查进位制、正弦定理的应用,分层抽样的应用,意在考查综合运用所学知识解决问题的能力,属于中档题.7.D解析:D【解析】分析:根据随机数表法则取数:取两个数,不小于30的舍去,前面已取的舍去.详解:从表第1行5列,6列数字开始由左到右依次选取两个数字中小于30的编号为:08,02,14,29.∴第四个个体为29.选D.点睛:本题考查随机数表,考查对概念基本运用能力.8.C解析:C【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n=30n﹣19,由401≤30n﹣21≤755,求得正整数n的个数,即可得出结论.【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列,又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,∴等差数列的通项公式为a n=11+(n﹣1)30=30n﹣19,由401≤30n﹣19≤755,n为正整数可得14≤n≤25,∴做问卷C的人数为25﹣14+1=12,故选C.【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.9.C解析:C【分析】设该样本中高三年级的学生人数为x,则1800601200x=,解之即可【详解】设该样本中高三年级的学生人数为x,则1800601200x=,解得40x=,故选C.【点睛】本题考查了分层抽样方法的应用问题,属基础题.10.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.11.C解析:C 【解析】 【分析】根据分层抽样的定义求出在各层中的抽样比,即样本容量比上总体容量,按此比例求出在高三年级中抽取的人数. 【详解】根据题意得,用分层抽样在各层中的抽样比为421105020=, 则在高三年级抽取的人数是14001625⨯=人, 故选C. 【点睛】该题所考查的是有关分层抽样的问题,在解题的过程中,需要明确无论采用哪种抽样方法,都必须保证每个个体被抽到的概率是相等的,所以注意成比例的问题.12.A解析:A 【解析】分析:由题意结合统计表确定频数,然后确定频率即可.详解:由题意可知,取到卡片为奇数的频数为:1356181153++++=, 取卡片的次数为100次,则取到号码为奇数的频率是530.53100=. 本题选择A 选项.点睛:本题主要考查频率的定义及其应用等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.05【分析】根据给定的随机数表的读取规则从第一行第67列开始两个数字一组从左向右读取重复的或超出编号范围的跳过即可【详解】根据随机数表排除超过33及重复的编号第一个编号为21第二个编号为32第三个编解析:05【分析】根据给定的随机数表的读取规则,从第一行第6、7列开始,两个数字一组,从左向右读取,重复的或超出编号范围的跳过,即可.【详解】根据随机数表,排除超过33及重复的编号,第一个编号为21,第二个编号为32,第三个编号05,故选出来的第3个红色球的编号为05.【点睛】本题主要考查了简单随机抽样中的随机数表法,属于容易题.14.【分析】计算出抽样中已安装宽带的用户比例乘以总人数求得小区已安装宽带的居民数【详解】抽样中已安装宽带的用户比例为故小区已安装宽带的居民有户【点睛】本小题主要考查用样本估计总体考查频率的计算属于基础题解析:10200【分析】计算出抽样中已安装宽带的用户比例,乘以总人数,求得小区已安装宽带的居民数.【详解】抽样中已安装宽带的用户比例为604251200100+=,故小区已安装宽带的居民有512000010200100⨯=户.【点睛】本小题主要考查用样本估计总体,考查频率的计算,属于基础题.15.5000【分析】由题意其他年级抽取200人其他年级共有学生2000人根据题意列出等式即可求出该校学生总人数【详解】由题意其他年级抽取200人其他年级共有学生2000人则该校学生总人数为人故答案是:5解析:5000【分析】由题意,其他年级抽取200人,其他年级共有学生2000人,根据题意列出等式,即可求出该校学生总人数.【详解】由题意,其他年级抽取200人,其他年级共有学生2000人,则该校学生总人数为20005005000200⨯=人,故答案是:5000.【点睛】该题考查的是有关分层抽样的问题,涉及到的知识点有分层抽样要求每个个体被抽到的概率是相等的,属于简单题目.16.【分析】利用频率分布直方图中频率和为1求a 值根据7080)的频率求出在此区间的人数即可【详解】由1﹣005﹣035﹣02﹣01=03故a =003故阅读的时间在7080)(单位:分钟)内的学生人数为: 解析:900【分析】利用频率分布直方图中频率和为1求a 值,根据[70,80)的频率求出在此区间的人数即可. 【详解】由1﹣0.05﹣0.35﹣0.2﹣0.1=0.3, 故a =0.03,故阅读的时间在[70,80)(单位:分钟)内的学生人数为:0.3×3000=900, 故答案为900. 【点睛】本题考查频率分布直方图中的有关性质的应用,考查直方图中频率和频数的求法.17.7【解析】【分析】结合题意先求出线性回归方程然后再计算出结果【详解】由题意可得则线性回归方程为当时【点睛】本题考查了求线性回归方程然后求出估计结果需要掌握解题方法较为基础解析:7 【解析】 【分析】结合题意先求出线性回归方程,然后再计算出结果 【详解】 由题意可得1520304050315x ++++==6570758090765y ++++==,760.6631a ∴=⨯+, 55.54a =,则线性回归方程为0.66 5.4ˆ55y x =+ 当70x =时,ˆ101.7y≈ 【点睛】本题考查了求线性回归方程,然后求出估计结果,需要掌握解题方法,较为基础18.【解析】分析:首先求得样本中心点然后利用回归方程的性质求得实数a 的值即可详解:由题意可得:线性回归方程过样本中心点则:解得:点睛:本题主要考查线性回归方程的性质及其应用等知识意在考查学生的转化能力和解析:0.85【解析】分析:首先求得样本中心点,然后利用回归方程的性质求得实数a 的值即可. 详解:由题意可得:34569==42x +++,2 3.55 5.544y +++==, 线性回归方程过样本中心点9,42⎛⎫⎪⎝⎭,则:940.72a =⨯+,解得:0.85a =.点睛:本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.19.30【解析】由题意可得:则成绩不低于分的人数为人解析:30 【解析】 由题意可得:()400.0150.0300.0250.0051030⨯+++⨯=则成绩不低于60分的人数为30人20.【解析】依次选取两个数字为237593211504……所以选出来的第个个体的编号为15 解析:15【解析】依次选取两个数字为23,75,93,21,15,04,…… 所以选出来的第3个个体的编号为15.三、解答题21.(1)模型x t y e λ+=的拟合程度更好;(2)(ⅰ)0.180.56ˆx ye +=;(ⅱ)27.56. 【分析】(1)通过换元,模型①写成y u βα=+,模型②两边取对数,写成x t νλ=+,根据参考数列,求两个方程的相关系数,再比较大小;(2)(ⅰ)由(1)可知选择x ty e λ+=,化为x t νλ=+,后根据公式求ˆλ和ˆt ,再换回,x y 求回归方程;(ⅱ)根据回归方程,令250y =,求x 的值. 【详解】(1)设{}i u 和{}i y 的相关系数为1r ,{}i x 和{}i v 的相关系数为2r ,由题意,()()101130.8715iiu u y y r --===≈∑,()()102120.9213iix x v v r --===≈∑,则12r r <,因此从相关系数的角度,模型x t y e λ+=的拟合程度更好. (2)(ⅰ)先建立v 关于x 的线性回归方程, 由x ty eλ+=,得ln y t x λ=+,即v t x λ=+,()()()101102112ˆ65iii i i x x v v x x λ==--==-∑∑, 12ˆˆ 5.36260.5665tv x λ=-=-⨯=, 所以v 关于x 的线性回归方程为ˆ0.180.56v x =+, 所以ˆln 0.180.56yx =+,则0.180.56ˆx y e +=.(ⅱ)2021年盈利额250y =(亿元), 所以0.180.56250x e +=,则0.180.56ln 250x +=, 因为ln 2503ln5ln 23 1.6090.693 5.52=+≈⨯+=, 所以 5.520.5627.560.18x -≈≈.所以2021年的研发资金投入量约为27.56亿元. 【点睛】思路点睛:本题考查非线性回归方程,一般可根据换元,两边取对数的方法,变形为线性回归直线方程,再根据参考公式求系数.22.(Ⅰ)见解析;(Ⅱ)要使水电站日利润的期望值最大,该水电站应安装3台发电机. 【详解】试题分析:(Ⅰ)可利用频率分布直方图的性质,补全图像;(Ⅱ)分别计算安装1台,2台,3台的日利润的期望值,然后进行比较. (Ⅰ)在区间[30,60)的频率为15633647= 31==73070⨯频率组距, 设在区间[0,30)上,a 频率组距=, 则11130170105210a ⎛⎫+++⨯= ⎪⎝⎭,解得1210a=,补充频率分布直方图如图;(Ⅱ)记水电站日利润为Y元.由(Ⅰ)知:不能运行发电机的概率为17,恰好运行一台发电机的概率为37,恰好运行二台发电机的概率为27,恰好运行三台发电机的概率为17,①若安装1台发电机,则Y的值为-500,4000,其分布列为Y-5004000P 1767E(Y)=5004000777-⨯+⨯=;②若安装2台发电机,则Y的值为-1000,3500,8000,其分布列为Y-100035008000P 173737E(Y)=1000350080007777-⨯+⨯+⨯=;③若安装3台发电机,则Y的值为-1500,3000,7500,12000,其分布列为Y-15003000750012000P 17372717E(Y)=1500300075001200077777 -⨯+⨯+⨯+⨯=;∵345003350023500777>>∴要使水电站日利润的期望值最大,该水电站应安装3台发电机.23.(1)9.49.1y x=+;(2)79.6万元;(3)9.67万元.【分析】(1)根据表中数据分别求得ˆ,,x y b,写出回归直线方程. (2)将x =7.5代入(1)的回归直线方程求解. (3)解不等式9.49.1100x +≥即可. 【详解】(1)由表中数据得,23453.54x +++==,26394954424y +++==, ∴()()()41421ˆ9.4iii ii x x y y bx x ==--==-∑∑,429.4 3.59.1a y b x =-⋅=-⨯=,∴回归方程为9.49.1y x =+.(2)年资金投入量为7.5万元时,9.47.59.179.6y =⨯+=(万元); (3)由题意得:9.49.1100x +≥, 解得90.99.4x ≥. ∵90.99.679.4≈, ∴若年市场销售额超过100万,那么年资金投入量至少要9.67万元. 【点睛】本题主要考查回归方程的求法及应用,还考查了运算求解的能力,属于中档题. 24.(1)0.016m =;76.2;(2)16%;70%. 【分析】(1)由频率分布直方图的性质,求得m ,再利用频率分布直方图的平均数计算公式求得50名学生的平均成绩.(2)由频率分布直方图计算[90,100)这一组的频率即可;[70,100)计算三组的频率和即可. 【详解】(1)由频率分布直方图性质可得,(0.0040.0060.0200.0240.030)101m +++++⨯=,得0.016m =,设平均成绩为x ,0.04450.06550.2650.3750.24850.169576.2x =⨯+⨯+⨯+⨯+⨯+⨯=∴.(2)由频率分布直方图可估计在[90,100)分的学生所占总体百分比为0.016100.16⨯=即为16%,[70,100)分的学生所占的百分比(0.0300.0240.016)100.7++⨯=,即为70%.【点睛】本题主要考查频率分布直方图的性质.25.(1)0.1849.968y x =+;(2)所求回归直线方程是有效可靠的;(3)该果园预计收入25095.84元. 【分析】(1)求出x 的平均值x ,y 的平均值y ,再根据公式求出b 和a ,即可得出回归方程; (2)将88x =代入(1)中的回归方程,求出y ,然后用25.8y 和1比较即可判断;(3)将85x =代入回归方程估计出单价,即可计算出收入. 【详解】(1)由题意,得3848586878585x ++++==,16.818.820.822.82420.645y ++++==,则515222156169.655820.641840.1841782055810005i ii ii x y x yb xx ==-⋅-⨯⨯====-⨯-∑∑,20.640.184589.968a y bx =-=-⨯=,故所求回归方程为0.1849.968y x =+;(2)当88x =时,0.184889.96826.16y =⨯+=,所以26.1625.80.361-=<,所以所求回归直线方程是有效可靠的; (3)当85x =,0.184859.96825.608y =⨯+=, 所以25.60898025095.84⨯=(元), 所以该果园预计收入25095.84元. 【点睛】本题考查回归方程的求法以及利用回归方程估计值,属于基础题. 26.(1)17.5 6.5y x =+;(2)9百万元. 【分析】(1)由已知求得ˆb与ˆa 的值,可得销售额y 关于广告费x 的线性回归方程; (2)在(1)中求得的线性回归方程中,取76y =求得x 值即可. 【详解】 (1)6482555x ++++==,5040703060505y ++++==.61621()()10(1)(10)320(3)(20)010130ˆ 6.51199020()iii ii x x yy bx x ==--⨯+-⨯-+⨯+-⨯-+⨯====++++-∑∑,50 6.5517.5ˆˆay bx =-=-⨯=. ∴销售额y 关于广告费x 的线性回归方程为ˆ17.5 6.5yx =+;(2)当ˆ76y=时,代入回归方程ˆ17.5 6.5y x =+,求得9x =. 故预测当销售额为76百万元时,广告费支出为9百万元. 【点睛】本题考查线性回归方程的求法,考查回归方程的应用,考查了计算能力,是中档题.。
最新北师大版高中数学必修三第一章统计 估计总体的分布
§5 用样本估计总体 5.1 估计总体的分布学习 目标1.理解什么是频率分布表、频率分布直方图、频率折线图.(数学抽象)2.会列频率分布表,会画频率分布直方图和频率折线图,能根据频率分布直方图解决问题.(数据分析、直观想象)3.了解用样本估计总体的意义.(数学抽象)导思 1.频率分布直方图纵轴的含义是什么?2.频率分布直方图的制作步骤是什么?3.如何画频率折线图?1.频率分布表和频率分布直方图 (1)频率分布表编制的方法步骤:(2)频率分布表与频率分布直方图有什么不同?提示:频率分布表能使我们清楚地知道数据分布在各个小组的个数,而频率分布直方图则是从各个小组数据在样本容量中所占比例大小的角度来表示数据分布的规律.2.频率折线图(1)在频率分布直方图中,按照分组原则,在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.(2)当样本容量不断增大时,样本中落在每个区间内的样本数的频率会越来越稳定于总体在相应区间内取值的概率.也就是说,一般地,样本容量越大,用样本的频率分布去估计总体的分布就越精确.(3)随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.频率分布表、频率分布直方图与频率折线图各有什么优缺点?提示:①频率分布表:优点:频率分布表在数量表示上比较确切;缺点:不够直观、形象,分析数据分布的总体趋势不太方便;②频率分布直方图:优点:频率分布直方图能非常直观地表明数据分布的形状,使我们能够看到在分布表中看不清楚的数据模式;缺点:从直方图本身得不出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了;③频率折线图:优点是它反映了数据的变化趋势.缺点:由图本身得不到原始的数据信息.1.辨析记忆(对的打“√”,错的打“×”)(1)频率分布直方图中的纵坐标指的是频率的值.()(2)频率分布直方图的宽度没有实际意义.()(3)频率分布直方图中各小矩形的面积之和可以不为1.()(4)在画频率折线图时,可以画成与横轴相连.()提示:(1)×.纵坐标指的是频率与组距的比值.(2) ×.频率分布直方图的宽度表示组距.(3)×.各小矩形的面积之和一定为1.(4) √.为了方便看图,一般习惯把频率折线图画成与横轴相连,所以横轴上左右两端点没有实际的意义.2.已知一个容量为40的样本,把它分成6组,第一组到第四组的频数分别为5,6,7,10,第五组的频率是0.2,那么第六组的频数是________,频率是________. 【解析】第五组的频数为0.2×40=8.所以第六组的频数为40-5-6-7-10-8=4.频率为440=0.1.答案:40.13.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在[50,60)内的汽车有________.【解析】因为小长方形的面积即为对应的频率,时速在[50,60)内的频率为0.3,所以有200×0.3=60(辆).答案:60辆4.(教材例题改编)一个容量为n的样本,分成若干组,已知某组的频数和频率分别为50和0.25,则n=________.【解析】由题意得50n=0.25,所以n=200.答案:200类型一频率分布直方图的绘制(数据分析、直观想象)【典例】1.频率分布直方图中,小矩形的面积等于()A.组距B.频率C.组数D.频数2.调查某校高一年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:171 163 163 166 166 168 168 160 168 165 171 169 167 169 151 168 170 168 160 174 165 168 174 159 167 156 157 164 169 180 176 157 162 161 158 164 163 163 167 161(1)作出频率分布表;(2)画出频率分布直方图.【思路导引】1.根据频率直方图中小矩形的几何意义,即可求解. 2.极差=180-151=29,组距为3,可分为10组.【解析】1.选B.根据小矩形的宽及高的意义,可知小矩形的面积为一组样本数据的频率.2.(1)①求极差:从数据中可看出,最大值是180,最小值是151,故极差为180-151=29.②确定组距与组数:取3为组距,则极差组距 =293 =923 ,故可将样本数据分成10组.③第一组起点定为150.5,组距为3,这样分出10组:[150.5,153.5),[153.5,156.5),[156.5,159.5),[159.5,162.5),[162.5,165.5),[165.5,168.5),[168.5,171.5),[171.5,174.5),[174.5,177.5),[177.5,180.5]. ④列频率分布表174.5~177.510.025177.5~180.510.025(2)画频率分布直方图如图所示:绘制频率分布直方图的注意事项(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.1.有一个容量为45的样本数据,分组后各组的频数如下:(12.5,15.5],3;(15.5,18.5],8;(18.5,21.5],9;(21.5,24.5],11;(24.5,27.5],10;(27.5,30.5],4.由此估计,不大于27.5的数据约为总体的()A.91% B.92% C.95% D.30%【解析】选A.不大于27.5的样本数为:3+8+9+11+10=41,所以约占总体百分比为4145×100%≈91%.2.某中学同年级40名男生的体重数据如下(单位:千克):616059595958585757575756 565656565656555555555454 54545353525252525251515150504948列出样本的频率分布表,画出频率分布直方图. 【解析】①计算极差:61-48=13(千克); ②决定组距与组数,取组距为2,因为132 =612 ,所以共分7组;③决定分点,使分点比数据多一位小数.并把第1小组的分点减小0.5,即分成如下7组:47.5~49.5,49.5~51.5,51.5~53.5,53.5~55.5,55.5~57.5,57.5~59.5,59.5~61.5.④列出频率分布表如下:分组(Δx i ) 频数(n i ) 频率(f i ) 47.5~49.5 2 0.05 49.5~51.5 5 0.125 51.5~53.5 7 0.175 53.5~55.5 8 0.20 55.5~57.5 11 0.275 57.5~59.5 5 0.125 59.5~61.5 2 0.05 合计401.00⑤作出频率分布直方图如下:3.某花木公司为了调查某种树苗的生长情况,抽取了一个容量为100的样本,测得树苗的高度(cm)数据的分组及相应频数如下:107~109,3株;109~111,9株;111~113,13株;113~115,16株;115~117,26株;117~119,20株;119~121,7株;121~123,4株;123~125,2株.(1)列出频率分布表;(2)画出频率分布直方图;(3)据上述图表,估计数据在109~121范围内的可能性是百分之几.【解析】(1)频率分布表如下:分组频数频率累积频率107~10930.030.03109~11190.090.12111~113130.130.25113~115160.160.41115~117260.260.67117~119200.200.87119~12170.070.94121~12340.040.98123~12520.02 1.00合计100 1.00(2)频率分布直方图如下:(3)由上述图表可知数据落在109~121范围内的频率为:0.94-0.03=0.91,即数据落在109~121范围内的可能性是91%.类型二频率折线图的画法及应用【典例】从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:分):40~50,2;50~60,3;60~70,10;70~80,15;80~90,12;90~100,8.(1)列出样本的频率分布表;(2)画出频率分布直方图及频率折线图; (3)估计成绩在60~90分的学生比例.【思路导引】画频率分布直方图和折线图⇒制作好频率分布表⇒纵坐标表示频率与组距的比值.【解析】(1)样本的频率分布表如下:成绩分组(Δx i ) 频数(n i ) 频率(f i ) f i Δx i 40~50 2 0.04 0.004 50~60 3 0.06 0.006 60~70 10 0.2 0.02 70~80 15 0.3 0.03 80~90 12 0.24 0.024 90~10080.160.016(2)频率分布直方图及频率折线图如图所示:(3)成绩在60~90的频率为1-0.04-0.06-0.16=0.74, 所以可估计成绩在60~90分的学生比例为74%.本例条件不变,估计成绩在50~80分的学生的比例.【解析】成绩在50~60分的学生的频数为3,在60~70的学生的频数为10,在70~80分的学生的频数为15,所以成绩在50~80分的学生的频数为28,占总体的2850 =1425 .频率折线图的作法及应用(1)作法:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)应用:频率折线图也是用一个单位长度表示一定的数量,但是,它是根据数量的多少在图中描出各个点,然后把各个点用线段顺次连接成的折线,因此,它不但可以表现出数量的多少,而且能够以折线的起伏,清楚而直观地表示出数量的增减变化的情况.提醒:画图时,横轴和纵轴的单位可不一致.有一个容量为100的某校毕业生起始月薪的样本,数据的分组及各组的频数如下:起始月薪(百元)[13,14)[14,15)[15,16)[16,17) 频数7112623起始月薪(百元)[17,18)[18,19)[19,20)[20,21]频数1584 6(1)列出样本的频率分布表;(2)画出频率分布直方图和频率折线图;(3)根据频率分布估计该校毕业生起始月薪低于2 000元的频率.【解析】(1)样本的频率分布表为起始月薪(百元)频数频率[13,14)70.07[14,15)110.11[15,16)260.26[16,17)230.23[17,18)150.15[18,19)80.08[19,20)40.04[20,21]60.06总计100 1.00(2)频率分布直方图和频率折线图如图.(3)起始月薪低于2 000元的频率为0.07+0.11+…+0.04=0.94,故起始月薪低于2 000元的频率的估计值是0.94.【补偿训练】某学校随机抽取部分新生调查其上学路上所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中,上学路上所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80), [80,100].(1)求直方图中x的值;(2)如果上学路上所需时间不少于40分钟的学生可申请在学校住宿,请估计学校1 000名新生中有多少名学生可以申请住宿.【解析】(1)由(x+0.012 5+0.006 5+0.003×2)×20=1,解得x=0.025.(2)上学所需时间不少于40分钟的学生的频率为:(0.006 5+0.003×2)×20=0.25,估计学校1 000名新生中有1 000×0.25=250名学生可以申请住宿.答:估计学校1 000名新生中有250名学生可以申请住宿.类型三用样本分布估计总体分布【典例】1.(2021·全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间2.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少;(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.【思路导引】1.利用频率分布直方图,计算出低于60分的人数的频率p,利用频数除以相应的频率p 得总人数.2.利用110次以上(含110次)的矩形面积除以所有的矩形面积之和,即可估计高一学生的达标率.【解析】1.选C. 低于4.5万元的比率估计为0.02×1+0.04×1=0.06=6%,故A 正确;不低于10.5万元的比率估计为(0.04+0.02×3)×1=0.1=10%,故B 正确;平均值为:(3×0.02+4×0.04+5×0.1+6×0.14+7×0.2+8×0.2+9×0.1+10×0.1+11×0.04+12×0.02+13×0.02+14×0.02)×1=7.68万元,故C 不正确;4.5万元到8.5万元的比率为:0.1×1+0.14×1+0.2×1+0.2×1=0.64=64%,故D 正确.2.(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此,第二小组的频率为:42+4+17+15+9+3=0.08. 又因为第二小组频率=第二小组频数样本容量, 所以样本容量=第二小组频数第二小组频率=120.08 =150. (2)由图可估计该学校高一学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%. (3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.用样本估计总体的常用方法(1)用频率分布表估计总体分布.根据样本数据可以制作频率分布表,利用频率分布表中的数据,如各小组的频数、频率,可以对总体中的有关量进行估计.(2)用频率分布直方图估计总体分布.根据样本数据绘制出的频率分布直方图具有直观的特点,可以直接判断出样本中数据的分布特点和变化趋势与规律,并由此对总体进行估计.(3)用频率折线图估计总体分布.由样本频率分布直方图可以绘制出频率折线图,且样本容量越大,分组的组距不断缩小,那么折线图就越接近于总体分布,从而由频率折线图对总体估计就越精确.某幼儿园根据部分同年龄段女童的身高数据绘制了频率分布直方图,其中身高的变化范围是[96,106](单位:厘米),样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].(1)求出x 的值;(2)已知样本中身高小于100厘米的人数是36,求出样本容量N 的数值;(3)根据频率分布直方图提供的数据,求出样本中身高大于或等于98厘米并且小于104厘米的学生数.【解析】(1)由题意可知:(0.050+0.100+0.150+0.125+x )×2=1,解得:x =0.075.(2)设样本中身高小于100厘米的频率为p 1,所以,p 1=(0.050+0.100)×2=0.30,而p 1=36N ,所以N =36p 1=360.30 =120. (3)样本中身高大于或等于98厘米并且小于104厘米的频率为p 2=(0.100+0.150+0.125)×2=0.75,所以身高大于或等于98厘米并且小于104厘米的学生数n =p 2N =120×0.75=90.。
高一北师大版数学必修3第一章 统计练习题含答案解析 双基限时练4
高一年级8个班参加合唱比赛的得分茎叶图如图所示,则下列说法正确的是( )A .这8个班的最高分为9分,最低分为0分B .这8个班的最高分为96分,最低分为90分C .这8个班平均得分为91分D .这8个班的平均得分为91.5分解析 通过89+87+90×6+3+1+6+4+0+28=91.5,可知答案为D 项.答案 D2.一个容量为20的样本数据,分组后组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2,则样本数据在(-∞,30]上的频率为( )A .120B .14C .12D .710解析 样本数据共有2+3+4+5+4+2=20个,落在(-∞,30]上的有2+3=5个,故样本数据在(-∞,30]上的频率为520=14.答案 B3.甲、乙两名学生在5次数学考试中的成绩统计如图的茎叶图所示,则下列说法正确的是( )A.甲这5次考试中最低分为74,乙的最低分为72B.这5次考试中,甲最高分为95,乙最高分为92C.这5次考试中乙有两次考分在70至80分之间D.甲、乙这5次的平均分相等答案B4.某同学在统计某厂生产的工艺品加工矩形的长、宽的比值的样本100个.由于工作不慎,将部分数据丢失,已知样本在0.617~0.619的频率为0.6,则丢失的数据用x、y表示应为()组距0.6150.6160.6170.6180.6190.620频数101230x15yC.x=15,y=18 D.x=18,y=18解析∵样本容量为100,由样本在0.617~0.619的频率为0.6,知样本在0.617~0.619的频数为60,即30+x+15=60,得x=15,∴10+12+y=40,∴y=18.答案C5.如图①、②分别是甲、乙两户居民家庭全年各项支出的统计图.根据统计图,下列对两户教育支出占全年总支出的百分比作出的判断中,正确的是()A.甲户比乙户大B.乙户比甲户大C.甲、乙两户一般大D.无法确定哪一户大解析甲户教育支出占12002000+1200×2+1600=20%,乙户教育支出占25%,故选B项.答案B6.一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40和0.125,则n等于()A.640 B.320C.240 D.160解析40n=0.125,n=400.125=320.答案B二、填空题7.在2019年酷暑时节,北方承德避暑山庄不失为旅游胜地,自六、七、八月份以来,全国各地前往山庄旅游观光的人络绎不绝,某旅行社在六、七、八月期间共接待游客10万人,某导游做了频率分布图如图所示,其中六月份接待游客1万人,则七月份接待游客________万人.解析 由10.1=n0.5,n =5. 答案 58.如图表示甲、乙、丙三人单独完成某项工作所需的时间,根据统计图计算:(1)甲、乙合做这项工作,________天可以完成;(2)甲单独做3天后由丙接替,丙还需________天才能完成这项工作;(3)乙、丙合做这一项工作,________天可以完成. 解析 (1)甲、乙合作这项工作,1115+120=607天完成;(2)1-315125=20;(3)1 120+125=1009.答案(1)607(2)20(3)10099.某开发区为改善居民的住房条件,每年都要建一批新房,使人均住房面积逐年增加(人均住房面积=该地区住房总面积该地区人口总数,单位:m2).该开发区2019年至2019年,每年年底人口总数和人均住房面积的统计结果分别如图①和②所示.请根据两图所提供的信息解答下面的问题:该区2019年和2019年两年中,________年比上年增加的住房面积多,多增加________万平方米.解析由图可知2019年的住房面积为20×10=200(万平方米),2019年的住房面积为18×9.6=172.8(万平方米),2019年住房面积为9×17=153(万平方米),2019年比上一年多增加(200-172.8)-(172.8-153)=7.4.答案20197.4三、解答题10.从一堆苹果中任取了20个,并得到它们的质量(单位:克)数据分布表如下: 分组 90~100 100~110110~120120~130 130~140140~150频数1231031(1)请根据这些数据画出该样本的条形统计图;(2)求这堆苹果中,质量不小于120克的苹果数约占苹果总数的百分数.解 (1)由题可得条形图如下:(2)由图可知这堆苹果中,质量不小于120克的苹果数为20-1-3-2=14,又因为共有20个苹果,故质量不小于120克的苹果占苹果总数的1420=0.7=70%.11.某校为了解学生的课外阅读情况,随机调查了50名学生,得到了他们在某一天的课外阅读所占时间的数据,并画出条形图如图所示,求这50名学生在这一天的平均课外阅读时间.解 因为这50名学生的阅读时间共有0×5+0.5×20+1×10+1.5×10+2×5=45(小时),所以这50名学生在这一天的平均课外阅读时间为4550=0.9(小时).12.参加NBA 05~06赛季的甲、乙两支球队,统计两队队员的身高如下(单位:cm ):甲队队员:194,187,199,207,203,205,209,199,183,215,219, 206,201,208;乙队队员:179,192,218,223,187,194,205,207,185,197,199, 209,214,189.(1)用茎叶图表示两队队员的身高;(2)根据茎叶图判断哪个队队员的身高整齐一些. 解 (1)茎叶图如图所示(以十位百位为茎,个位为叶):(2)从茎叶图上可以看出,甲队队员身高有7人在200~210 cm 之间,而乙队身高却分散一些,因此甲队队员的身高更整齐一些.思 维 探 究13.下图是A 、B 两所学校艺术节期间收到的各类艺术作品情况的统计图:(1)从图中能否看出哪所学校收到的水粉画作品的数量多?为什么?(2)已知A 学校收到的剪纸作品比B 学校的多20件,收到的书法作品比B 学校的少100件,请问这两所学校收到艺术作品的总数分别是多少件?解 (1)不能.因为两所学校收到艺术作品的总数不知道. (2)设A 学校收到艺术作品的总数为x 件,B 学校收到艺术作品的总数为y 件,则⎩⎪⎨⎪⎧ 10%x -5%y =20,50%y -40%x =100.解得⎩⎪⎨⎪⎧x =500,y =600,即A 学校收到艺术作品的总数为500件,B 学校收到艺术作品的总数为600件.。
新版高中数学北师大版必修3习题第一章统计1.2.2.2含解析
第2课时系统抽样课时过关·能力提升1.从N个编号中抽取n个号码入样,若采用系统抽样方法进行抽取,则分段间隔应为()AC答案:C2.有40件产品,编号为1~40,现在从中抽取4件检验,用系统抽样的方法确定所抽取的编号可能为()A.5,10,15,20B.2,12,22,32C.2,14,26,38D.5,8,31,36解析:由系统抽样的定义知抽样距为可以在第一组1~10号样本中取k号,1≤k≤10,则抽取到的样本编号为k,k+10,k+20,k+30.答案:B3.从编号为001,002,…,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为()A.480B.481C.482D.483解析:由样本中编号最小的两个编号分别为007,032,得抽样距为32-7=25,则样本容量为每组中应抽取的号码数x=7+25(n-1)(1≤n≤20,n∈Z),当n=20时,x取得最大值为x=7+25×19=482.答案:C4.总体容量为524,采用系统抽样法抽样,若想不剔除个体,则抽样间隔可以为()A.3B.4C.5D.6解析:因为系统抽样的间隔需要能整除总体个数.故选B.答案:B5.某初级中学有学生270人,其中七年级108人,八年级、九年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按七年级、八年级、九年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270.那么关于上述样本的下列结论,正确的是()A.②③都不能为系统抽样B.②④都不能为分层抽样C.①④都可能为系统抽样D.①③都可能为分层抽样解析:由定义可知,①③可能为分层抽样也可能为系统抽样;②可能为分层抽样;④可能为简单随机抽样.故选D.答案:D6.将高三(1)班参加体检的36名学生,编号为:1,2,3,…,36,若采用系统抽样的方法抽取一个容量为4的样本,已知样本中含有编号为6号、24号、33号的学生,则样本中剩余一名学生的编号是.答案:157.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,……,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是.若用分层抽样方法,则40岁以下年龄段应抽取人.解析:由题意可知,系统抽样时共分成40组,抽样间隔为5,第5组的号码为22,则第8组的号码为22+5×3=37.在分层抽样时,由于40岁以下年龄段人数占总数的50%,故40岁以下年龄段应抽取40×50%=20(人).答案:37208.一个总体中有100个个体,随机编号为0,1,2,…,99.依编号顺序平均分成10个小组,组号依次为1,2,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是.解析:由题设知,若m=6,则在第7组中抽取的号码个位数字与13的个位数字相同,而第7组中的编号依次为60,61,62,63,…,69.故在第7组中抽取的号码是63.答案:639.某学校有学生3 000人,现在要抽取100人组成夏令营,应该怎样抽取样本?分析:因为总体中个体数较多,且无差异,所以按系统抽样的步骤来进行抽样.解:按系统抽样抽取样本,其步骤如下.第一步:把这些学生分成100个组,因为所以每个组30名学生,这时,抽样距就是30.第二步:将3 000名学生随机编号为1,2, (3000)第三步:在第1组用简单随机抽样确定起始个体的编号l(0<l≤30).第四步:按照一定的规则抽取样本,通常是将起始编号l加上分段间隔30得到第2个个体编号l+30,再加上30得到第3个个体编号l+60,这样继续下去,直到获取整个样本.比如l=15,则抽取的编号为15,45,75,105,…,2985.这些号码对应的学生组成样本.10.为了考察某校的教学水平,将抽取这个学校本学年高三年级部分学生的考试成绩,为了全面地反映实际情况,采取以下三种方式进行抽样(已知该校高三年级共有20个教学班,并且每个班的学生都已经按随机方式编好了学号,假定该校每个班的学生人数都相同).①从全年级20个班中任意抽取一个班,再从该班中任意抽取20人,考察他们的考试成绩;②每个班都抽取1人,共计20人,考察这20个学生的考试成绩;③把学生按成绩分成优秀、良好、普通三个级别,从其中抽取100名学生进行考察(已知若按成绩分,该校高三学生中优秀生共有150人,良好生共有600人,普通生共有250人).根据上面的叙述,试回答下列问题:(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式所抽取的样本中,其样本容量分别是多少?(2)上面三种抽取方式中各自采用何种方法抽取样本?(3)试分别写出上面三种抽取方式各自抽取样本的步骤.解:(1)在这三种抽取方式中,其总体都是该校本学年高三全体学生的考试成绩,个体都是本学年高三年级每个学生的考试成绩.其中第一种抽取方式中样本为所抽取的本学年20名学生的考试成绩,样本容量为20;第二种抽取方式中样本为所抽取的本学年20名学生的考试成绩,样本容量为20;第三种抽取方式中样本为所抽取的本学年100名学生的考试成绩,样本容量为100.(2)在上面三种抽取方式中,第一种方式采用的是简单随机抽样;第二种方式采用的是系统抽样和简单随机抽样;第三种方式采用的是分层抽样和简单随机抽样.(3)第一种方式抽取样本的步骤如下:首先在这20个班中用抽签法任意抽取一个班,然后从这个班中按学号用随机数法或抽签法抽取20个学生,考察其考试成绩.第二种方式抽取样本的步骤如下:首先在第一个班中,用简单随机抽样法任意抽取一个学生,记其学号为a.然后在其余的19个班中,选取学号为a的学生,共计20人.第三种方式抽取样本的步骤如下:首先分层.因为若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,所以在抽取样本时,应该把全体学生分成三层.然后确定各层抽取的人数.因为样本容量与总体的个体数之比为100∶1 000=1∶10,所以在每层抽取的个体数依次为即15,60,25.最后按层分别抽取.在优秀生中用简单随机抽样抽取15人,在良好生中用简单随机抽样抽取60人,在普通生中用简单随机抽样抽取25人.。
2018秋新版高中数学北师大版必修3习题:第一章统计 检测 含解析
第一章检测(时间:120分钟满分:150分)一、选择题:本大题共12小题,每小题5分,在每小题给出的四个选项中,只有一项是符合题目要求的.1.现从100件产品中随机抽出10件进行质量检测,下列说法正确的是()A.100件产品是总体B.10件产品是样本C.样本容量为100D.样本容量为10解析:这里考查统计的基本概念,总体是100件产品的质量;样本是抽取的10件产品的质量;总体容量为100,样本容量为10.答案:D2.下列说法中,不正确的是()A.系统抽样是先将差异明显的总体分成几个小组,再进行抽取B.分层抽样是将差异明显的几部分组成的总体分成几层,然后进行抽取C.简单随机抽样是从个体无差异且个体数较少的总体中逐个抽取个体D.系统抽样是从个体无差异且个数较多的总体中,将总体均分,再按事先确定的规则在各部分抽取解析:当总体中个体差异明显时,用分层抽样;当总体中个体无差异且个体数较多时,用系统抽样;当总体中个体无差异且个体数较少时,用简单随机抽样.所以A不正确.答案:A3.重庆市2016年各月的平均气温(单位:℃)数据的茎叶图如图所示,则这组数据的中位数是()A.19B.20C.21.5D.23答案:B4. 如图是容量为100的样本数据(质量)的频率分布直方图,已知样本质量均在[5,20]内,其分组为[5,10),[10,15),[15,20],则样本质量落在[15,20]内的频数为()A.10B.20C.30D.40解析:由题意得,组距为5,则样本质量在[5,10),[10,15)内的频率分别为0.3和0.5,所以样本质量在[15,20]内的频率为1-0.3-0.5=0.2.故频数为100×0.2=20.答案:B5.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,得到的频率分布直方图是()解析:由分组可知C,D一定不对;由题中茎叶图可知[0,5)有1人,[5,10)有1人,所以第一、二小组频率相同,频率分布直方图中矩形的高应相同,可排除B.故选A.答案:A6.已知两组数据x1,x2,…,x n与y1,y2,…,y n,它们的平均数分别是x和y,则新的一组数据2x1−5y1+ 3,2x2−5y2+3,…,2x n−5y n+3的平均数是()A.2x−5yB.2x−5y+3C.4x−25yD.4x−25y+3答案:B7.在抽查样本中,用频率分布直方图表示尺寸的过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个数在该组内的频率为m,表示该组的小矩形的高为h,则b-a等于()A.hmB.ℎmC.mℎD.与m,ℎ无关解析:b-a是组距,在频率分布直方图中,频率组距是表示该组的小矩形的高h,所以mb-a=ℎ,所以b-a=mℎ.答案:C8.某班有48名学生,在一次考试中统计出平均分为70分,方差为75分2,后来发现有2名同学的分数登错了,甲实得80分却记成了50分,乙实得70分却记成了100分,更正后平均分和方差分别为() A.70分,75分2 B.70分,50分2C.70分,1.04分2D.65分,25分2解析:注意到平均数没有变化,只是方差变动.s2=1[…+(50-70)2+(100-70)2+…]=75分2,实际上s2=1[…+(80-70)2+(70-70)2+…]=50分2,故选B.答案:B9.某校高三年级有男生500人,女生400人,为了了解该年级学生的健康状况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是()A.简单随机抽样B.抽签法C.随机数法D.分层抽样解析:样本容量n=25+20=45,男生和女生的抽样比都是1,即按抽样比为1的分层抽样方法抽取样本.答案:D10.某示范农场的鱼塘放养鱼苗8万条,根据这几年的经验知道,鱼苗的成活率为95%,一段时间后准备打捞出售,第一网捞出40条,称得平均每条鱼2.5 kg,第二网捞出25条,称得平均每条鱼2.2 kg,第三网捞出35条,称得平均每条鱼2.8 kg,估计这时鱼塘中鱼的总质量为()A.192 280 kgB.202 280 kgC.182 280 kgD.172 280 kg解析:样本平均数x=40×2.5+25×2.2+35×2.840+25+35=2.53(kg),可知样本中平均每条鱼重2.53kg,所以估计鱼塘中鱼的总质量约为80000×95%×2.53=192280(kg).答案:A11.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7例”.根据过去10天甲、乙、丙、丁四地新增疑似病例的数据,一定符合该标志的是()A.甲地:总体均值为3,中位数为4B.乙地:总体均值为1,总体方差大于0C.丙地:中位数为2,众数为3D.丁地:总体均值为2,总体方差为3解析:x=2,则s2=110[(x1−2)2+(x2−2)2+⋯+(x10-2)2],若有一天超过7人,不妨设x10=8,则s2≥1×(8−2)2=3.6>3,不合题意.故任何一天都不超过7人.答案:D12. 已知两个相关变量满足如下关系:x10 15 20 25 30y 1 003 1 005 1 010 1 011 1 014A.y=0.56x+997.4B.y=0.63x-231.2C.y=50.2x+501.4D.y=60.4x+400.7解析:因为b=x1y1+x2y2+…+x5y5-5xyx12+x22+…+x52-5x2=0.56,a=y−b x=997.4.所以线性回归方程为y=0.56x+997.4.答案:A二、填空题:本大题共4小题,每小题5分.13.某市有大型超市200家、中型超市400家、小型超市1 400家.为掌握各类超市的营业情况,现按分层抽样方法抽取一个容量为100的样本,则应抽取中型超市家.解析:本题为分层抽样,所以应抽取中型超市400×100400+200+1400=20(家).答案:2014.某考察团对全国10大城市职工人均工资水平x(单位:千元)与居民人均消费水平y(单位:千元)进行统计调查,y与x具有线性相关关系,线性回归方程为y=0.66x+1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为.解析:将y=7.675代入y=0.66x+1.562,得x=611.3.所以7.675611.366≈83%.答案:83%15.如图是一个容量为100的样本的频率分布直方图,试根据图中的数据回答下列问题:(1)样本数据落在区间[2,6)内的频率为;(2)样本数据落在区间[6,10)内的频数为.解析:由频率分布直方图可得数据落在区间[2,6)内的频率为相应的小矩形的面积,即0.02×4=0.08,数据落在区间[6,10)内的频率为0.08×4=0.32,故数据落在区间[6,10)内的频数为100×0.32=32.答案:(1)0.08(2)3216.甲、乙两个班级各随机选出15名同学进行测验,成绩的茎叶图如图所示,则甲班、乙班的最高成绩各是,从图中看班的平均成绩较高.解析:从题图可以看出乙班的成绩集中在70分以上,且在80分以上的有6人,而甲班80分以上的只有4人,甲班的最低成绩是46分,对平均分影响较大.答案:96,92乙三、解答题:解答应写出文字说明、证明过程或演算步骤.17.(本小题满分10分)小明家2016年四个季度的用电量如下表:季度用电量(单位:千瓦时)第一季度250第二季度150第三季度400第四季度200其中各种电器用电量如下表:电器类型用电量(单位:千瓦时)空调250冰箱400照明100彩电150其他100根据如图所示三幅统计图回答:(1)从哪幅统计图可看出各个季度用电量变化情况?(2)从哪幅统计图可看出冰箱用电量超过总用电量的14?(3)从哪幅统计图可以清楚地看出空调用电量?18.(本小题满分12分)农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种麦苗的试验田中各抽取6株麦苗测量麦苗的株高,数据如下(单位:cm):甲:9,10,11,12,10,20乙:8,14,13,10,12,21.(1)绘出所抽取的甲、乙两种麦苗株高的茎叶图;(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗的长势情况.解:(1)茎叶图如图所示:(2)x 甲=9+10+11+12+10+20=12,x 乙=8+14+13+10+12+216=13,s 甲2≈13.67,s 乙2≈16.67.因为x 甲<x 乙,所以乙种麦苗平均株高较高.又因为s 甲2<s 乙2,所以甲种麦苗长得较为整齐.19. (本小题满分12分)2017年春节前,公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让过往返乡的摩托车驾驶人有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍询问,询问结果如图所示:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是什么抽样方法?(2)用分层抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的抽取5人,则四川籍的应抽取几人?解:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是系统抽样法.(2)从题图可知,被询问了省籍的驾驶人员中广西籍的有5+20+25+20+30=100(人); 四川籍的有15+10+5+5+5=40(人). 设四川籍的驾驶人员应抽取x 人,依题意得5100=x40,解得x=2,即四川籍的应抽取2人.20.(本小题满分12分)某车间20名工人年龄数据如下表:年龄/岁 工人数/人 19 1 28 3 29 3 30 5 31 4 32 3 40 1 合计20(1)求这20名工人年龄的众数与极差(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图; (3)求这20名工人年龄的方差.解:(1)由题中表可知,众数为30岁.极差为40-19=21(岁).(2)(3)这20名工人年龄的平均数为(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30(岁), 所以这20名工人年龄的方差为s 2=1[(19−30)2+3(28−30)2+3(29−30)2+5(30−30)2+4(31−30)2+3(32−30)2+(40−30)2]=12.6(岁2).21.(本小题满分12分)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差;(同一组中的数据用该组区间的中点值作代表)(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解:(1)(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.22.(本小题满分12分)某种瓶装溶液,因为装瓶机的不稳定性,所以很可能使每瓶的含量都不是标准的含量,我们随机抽出了20瓶,测得它们的含量(单位:百毫升)如下:12.111.912.212.212.012.112.912.112.312.511.712.412.311.811.312.111.411.611.212.2(1)根据数据列出频率分布表,画出频率分布直方图;(2)计算出这组数据的平均数和标准差;(结果精确到0.01)(3)结合(1)(2)的结果,根据实际意义写一个简短的报告.(对总体情况作出估计)解:(1)频率分布表如下:频率分布直方图如图所示.(2)平均数x =120×(12.1+11.9+12.2+…+12.2)≈12.02(百毫升).标准差s ≈ (12.1−12.02)2+(11.9−12.02)2+⋯+(12.2−12.02)220≈0.41(百毫升).(3)标准差相对于平均数来说比较小.从频率分布直方图中可以看出,每瓶的含量大致位于1150毫升到1250毫升之间.因此可判断装瓶机工作稳定.。
2019秋新版高中数学北师大版必修3习题:第一章统计 1.2.2.1 Word版含解析.docx
2.2分层抽样与系统抽样第1课时分层抽样课时过关·能力提升1.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本,从上述各层中依次抽取的人数分别是()A.12,24,15,9B.9,12,12,7C.8,15,12,5D.8,16,10,6解析:抽样比为因此,从各层依次抽取的人数分别为160答案:D2.某商场有四类食品,其中粮食类、植物油类、膨化食品类和果蔬类分别为40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类种数之和是()A.4B.5C.6D.7解析:分层抽样的抽样比为所以应抽取的植物油类为10种),果蔬类为20种).故抽取的植物油类与果蔬类种数之和为2+4=6.答案:C3.某服装加工厂某月生产A,B,C三种产品共4 000件,为了保证产品质量,进行抽样检验,根据分层抽样的结果,由于不小心,表格中A,C A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C产品的数量是()A.80件B.800件C.90件D.900件答案:B4.某校现有高一学生210人,高二学生270人,高三学生300人,用分层抽样的方法从这三个年级的学生中随机抽取n名学生进行问卷调查,如果已知从高一学生中抽取的人数为7,那么从高三学生中抽取的人数为()A.7B.8C.9D.10解析:由题意知高一学生210人,从高一学生中抽取的人数为7可以得出抽取比例为所以从高三学生中抽取的人数应为300答案:D5. 某工厂生产A,B,C三种不同型号的产品,其数量之比依次是3∶4∶7,现在用分层抽样的方法抽出样本容量为n的样本,样本中A型号产品有15件,则n等于()A.50B.60C.70D.80答案:C6.某高校甲、乙、丙、丁四个专业分别有150,150,400,300名学生,为了解学生的就业倾向,用分层抽样的方法从该校这四个专业共抽取40名学生进行调查,应在丙专业抽取的学生人数为.解析:由分层抽样定义可知,应抽取丙专业的人数为40答案:167.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取名学生.解析:由分层抽样的方法可得,从一年级本科生中抽取学生人数为300答案:608.某报社做了一次关于“什么是新时代的雷锋精神”的调查,从A,B,C,D四个单位回收的问卷数分别为a1,a2,a3,a4,且满足a1+a3=2a2,共回收1 000份.因报道需要,再从回收的问卷中按单位分层抽取容量为150的样本.若在B单位抽取30份,则在D单位抽取的问卷是份.解析:由题意有解得a2=200.又a1+a2+a3+a4=1 000,a1+a3=2a2,即3a2+a4=1 000,∴a4=400.设在D单位抽取的问卷数为n,解得n=60.答案:609.已知某校的初中生人数、高中生人数、教师人数之比为20∶15∶2,现用分层抽样的方法从所有师生中抽取一个容量为N的样本进行调查,若应从高中生中抽取60人,则N=.解析答案:14810.在某校500名学生中,O型血有200人,A型血有125人,B型血有125人,AB型血有50人,为了研究血型与色弱的关系,需从中抽取一个容量为20的样本.应怎样抽取样本?分析:由于研究血型与色弱的关系,故按血型分层,用分层抽样的方法抽取样本.利用抽样比确定抽取各种血型的人数.解:用分层抽样抽取样本.因为即抽样比为所以200故O型血抽8人,A型血抽5人,B型血抽5人,AB型血抽2人.抽样步骤如下.第一步:确定抽样比第二步:按比例分配各层所要抽取的个体数,O型血抽8人,A型血抽5人,B型血抽5人,AB型血抽 2人.第三步:用简单随机抽样分别在各种血型的人中抽取样本,直至取出容量为20的样本.。
北师大版高中数学必修三第一章《统计》测试题(答案解析)
一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆy bx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是( )A .成绩B .视力C .智商D .阅读量3.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,84.将某选手的7个得分去掉1个最高分,去掉1个最低分,5个剩余分数的平均分为21,现场作的7个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则5个剩余分数的方差为( )A .1167B .365C .36D .675.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .6.一组数据中的每一个数据都乘2,再减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是 A .81.2,4.4 B .40.6,1.1 C .48.8,4.4D .78.8,1.17.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 父亲身高x (cm )174176176176178儿子身高y (cm )175175176177177则y 对x 的线性回归方程为 A .y = x-1B .y = x+1C .y =88+12x D .y = 1768.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用x (万元) 2 3 4 5 销售额y (万元)25374454根据上表可得回归方程ˆˆˆy bx a =+中的ˆb为9.4,据此模型预报广告费用为6万元时销售额为( ) A .61.5万元 B .62.5万元C .63.5万元D .65.0万元9.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .9110.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表: 时间周一 周二 周三周四 周五 车流量x (万辆) 100 102 108 114 116 浓度y (微克)7880848890根据上表数据,用最小二乘法求出y 与x 的线性回归方程是( )参考公式:121()()()niii ni i x x y y b x x ==--=-∑∑,a y b x =-⋅;参考数据:108x =,84y =;A .0.6274ˆ.2yx =+ B .0.7264ˆ.2y x =+ C .0.7164ˆ.1y x =+ D .0.6264ˆ.2y x =+ 11.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位 D .y 平均减少2个单位12.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是( ) A .0.53B .0.5C .0.47D .0.37二、填空题13.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位: cm ),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有_______株树木的底部周长大于110cm .14.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.15.数列{}n a 是公差不为零的等差数列,其前n 项和为n S ,若记数据1a ,2a ,3a ,⋅⋅⋅,2019a 的标准差为1σ,数据11S ,22S ,33S ,⋅⋅⋅,20192019S 的标准差为2σ,则12σσ=________ 16.一个车间为了规定工作原理,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下: 零件数x (个) 15 20 30 40 50 加工时间y (分钟)6570758090由表中数据,求得线性回归方程0.66y x a =+,则估计加工70个零件时间为__________分钟(精确到0.1). 17.已知x ,y 的取值如下表: x 2 3 4 5 y2.23.85.56.5从散点图分析,y 与x 线性相关,且回归方程为y =1.46x +a ,则实数a 的值为________.18.数据1x ,2x ,…,n x 的平均数是3,方差是1,则数据15x -,25x -,…,5n x -的平均数和方差之和是__________.19.某超市统计了一个月内每天光顾的顾客人数,得到如图所示的频率分布直方图,根据该图估计该组数据的中位数为__________.20.已知某市A 社区35岁至45岁的居民有450人,46岁至55岁的居民有750人,56岁至65岁的居民有900人.为了解该社区35岁至65岁居民的身体健康状况,社区负责人采用分层抽样技术抽取若干人进行体检调查,若从46岁至55岁的居民中随机抽取了50人,试问这次抽样调查抽取的人数是________人.三、解答题21.某同学在生物研究性学习中,对春季昼夜温差大小与黄豆种子发芽多少之间的关系进行研究,于是他在4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另三天的数据,求出y 关于x 的线性回归方程y bx a =+;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠? 附:回归直线的斜率和截距的最小二乘估计公式分别为:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.22.假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:若由资料可知y 对x 呈线性相关关系,试求: (1)回归直线方程;(2)估计使用年限为10年时,维修费用约是多少?(参考:1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-)23.经销商小王对其所经营的某一型号二手汽车的使用年数(010)x x <≤与销售价格y (单位:万元/辆)进行整理,得到如下的对应数据:售价 1613 9.5 7 4.5(1)试求y 关于x 的回归直线方程;(2)已知每辆该型号汽车的收购价格为20.05 1.7517.2=-+w x x 万元,根据(1)中所求的回归方程,预测x 为何值时,小王销售一辆该型号汽车所获得的利润z 最大.附:回归方程ˆybx a =+中,1221ˆˆˆˆ,ni ii nii x ynx y b ay bx xnx -=-==--∑∑ 24.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x (分钟)时刻的细菌个数为y 个,统计结果如下:x 1 2 3 4 5 y23445(Ⅰ)在给出的坐标系中画出x ,y 的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y 关于x 的回归直线方程ˆˆˆy bx a =+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni ii ni i x y nx yx n axby bx ====---∑∑) 25.某市举办了一次“诗词大赛”,分预赛和复赛两个环节,已知共有20000名学生参加了预赛,现从参加预赛的全体学生中随机地抽取100人的预赛成绩作为样本,得到如下的统计数据. 得分(百分[0,20)[20,40)[40,60)[60,80)[80,100]地抽取2人,求恰有1人预赛成绩优良的概率;(2)由样本数据分析可知,该市全体参加预赛学生的预赛成绩Z 服从正态分布()2,N μσ,其中μ可近似为样本中的100名学生预赛成绩的平均值(同一组数据用该组数据的中间值代替),且2361σ=.利用该正态分布,估计全市参加预赛的全体学生中预赛成绩不低于72分的人数;(3)预赛成绩不低于91分的学生将参加复赛,复赛规则如下: ①参加复赛的学生的初始分都设置为100分;②参加复赛的学生可在答题前自己决定答题数量n ,每一题都需要“花”掉一定分数来获取答题资格(即用分数来买答题资格),规定答第k 题时“花”掉的分数为()0.21,2,k k n =; ③每答对一题得2分,答错得0分;④答完n 题后参加复赛学生的最终分数即为复赛成绩.已知学生甲答对每道题的概率均为0.75,且每题答对与否都相互独立,则当他的答题数量n 为多少时,他的复赛成绩的期望值最大?参考数据:若()2~,Z N μσ,则() 6.827P Z μσμσ-<<+≈,()220.9545P Z μσμσ-<<+≈,()330.9973P Z μσμσ-<<+≈26.某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120分问卷.对收回的100份有效问卷进行统计,得到如22⨯下列联表:(1)现按女生是否能做到科学用眼进行分层,从45份女生问卷中抽取了6份问卷,从这6份问卷中再随机抽取3份,并记其中能做到科学用眼的问卷的份数X ,试求随机变量X 的分布列和数学期望;(2)若在犯错误的概率不超过P 的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P 的值应为多少?请说明理由.附:独立性检验统计量22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.独立性检验临界值表:【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】由已知求得 x , y ,进一步求得 a ,得到线性回归方程,取16x =求得y 值即可. 【详解】8.38.69.911.1512.1 10x +++=+=, 5.97.88.18.49.858y ++++==.又 0.78b =,∴ 80.78100.2a y bx --⨯===. ∴ 0.780.2y x =+.取16x =,得 0.78160.212.68y ⨯+==万元,故选A . 【点睛】本题主要考查线性回归方程的求法,考查了学生的计算能力,属于中档题.2.D解析:D 【解析】试题分析:由表中数据可得 表1:()25262210140.00916362032K ⨯⨯-⨯=≈⨯⨯⨯;表2: ()2524201216 1.76916362032K ⨯⨯-⨯=≈⨯⨯⨯;表3: ()252824128 1.316362032K ⨯⨯-⨯=≈⨯⨯⨯;表4: ()25214302623.4816362032K ⨯⨯-⨯=≈⨯⨯⨯.其中23.48最大,所以阅读量与性别有关联的可能性最大.故D 正确. 考点:独立性检验.3.D解析:D 【分析】根据平均数的性质,方差的性质直接运算可得结果. 【详解】令23(1,2,,5)i i y x i =-=1234555x x x x x x ++++==,1234523232323232310375x x x x x y x -+-+-+-+-∴==-=-=,(也可()(23)2()32537E y E x E x =-=-=⨯-=)()()()2y 232428D D x D x =-==⨯=故选:D 【点睛】本题主要考查方差及平均值的性质的简单应用,属于中档题.4.B解析:B 【分析】由剩余5个分数的平均数为21,据茎叶图列方程求出x =4,由此能求出5个剩余分数的方差. 【详解】∵将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为21, ∴由茎叶图得:1724202020215x+++++=得x =4,∴5个分数的方差为: S 2=()()()()()222221361721242120212021242155⎡⎤-+-+-+-+-=⎣⎦ 故选B 【点睛】本题考查方差的求法,考查平均数、方差、茎叶图基础知识,考查运算求解能力,考查数形结合思想,是基础题.5.D解析:D 【解析】 【分析】 先计算,代入回归直线方程,可得,从而可求得结果.【详解】 因为,所以,代入回归直线方程可求得,所以,故选D. 【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.6.B解析:B 【分析】先设出原来的数据,然后设出现在的数据,找到两组数据的联系,即可. 【详解】设原来的数据为12,,....,n x x x ,每一个数据都乘以2,再减去80,得到新数据为 12280,280,...,280n x x x --- 已知()122...80 1.2n x x x nn+++-=,则81.240.62X == 方差为:224 4.4, 1.1σσ==,故选B . 【点睛】本道题目考查的是平均数和方差之间的关系,列出等式,探寻两组数据的联系,即可.7.C解析:C 【详解】试题分析:由已知可得176,176x y ==∴中心点为()176,176, 代入回归方程验证可知,只有方程y =88+12x 成立,故选C 8.C解析:C 【分析】先求出所给数据的平均数,得到样本中心点,根据回归直线经过样本中心点,求出ˆa,得到线性回归方程,把6x =代入即可求出答案. 【详解】 由题意知4235 3.54x +++==,44253754404y +++==, 则40ˆˆ9.4 3.57.1a y bx=-=-⨯=, 所以回归方程为9.4.1ˆ7yx =+, 则广告费用为6万元时销售额为9.467.163.5⨯+=, 故答案为C. 【点睛】本题考查了线性回归方程的求法与应用,属于基础题.9.A解析:A 【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可. 【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95, 所以中位数为90+91=90.52,故选A. 【点睛】本题主要考查了中位数,茎叶图,属于中档题.10.B解析:B 【解析】 【分析】利用最小二乘法做出线性回归直线的方程的系数,写出回归直线的方程,得到结果. 【详解】 由题意,b=22222210078102801088411488116905108841001021081141165108⨯+⨯+⨯+⨯+⨯-⨯⨯++++-⨯=0.72,a=84﹣0.72×108=6.24, ∴y =0.72x+6.24, 故选:B . 【点睛】本题主要考查线性回归方程,属于难题.求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算211,,,nnii i i i x y x x y ==∑∑的值;③计算回归系数ˆˆ,ab ;④写出回归直线方程为ˆˆˆy bx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.11.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位,即减少1.5个单位,故选C.【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目. 12.A解析:A【解析】分析:由题意结合统计表确定频数,然后确定频率即可.详解:由题意可知,取到卡片为奇数的频数为:1356181153++++=,取卡片的次数为100次,则取到号码为奇数的频率是530.53 100=.本题选择A选项.点睛:本题主要考查频率的定义及其应用等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.18【分析】根据频率小矩形的面积小矩形的高组距底部求出周长大于110的频率再根据频数样本容量频率求出对应的频数【详解】由频率分布直方图知:底部周长大于110的频率为所以底部周长大于110的频数为(株解析:18【分析】根据频率=小矩形的面积=小矩形的高⨯组距底部,求出周长大于110cm的频率,再根据频数=样本容量⨯频率求出对应的频数.【详解】由频率分布直方图知:底部周长大于110cm的频率为(0.0200.010)100.3+⨯=,所以底部周长大于110cm的频数为600.318⨯=(株),故答案是:18.【点睛】该题考查的是有关频率分布直方图的应用,在解题的过程中,注意小矩形的面积表示的是对应范围内的频率,属于简单题目.14.【分析】先根据平均数计算出的值再根据方差的计算公式计算出这组数的方差【详解】依题意所以方差为故答案为【点睛】本小题主要考查平均数和方差的有关计算考查运算求解能力属于基础题解析:26 5【分析】先根据平均数计算出m的值,再根据方差的计算公式计算出这组数的方差.【详解】依题意12674,45m m ++++==.所以方差为()()()()()22222114244464745⎡⎤-+-+-+-+-⎣⎦[]126944955=+++=. 故答案为265. 【点睛】本小题主要考查平均数和方差的有关计算,考查运算求解能力,属于基础题.15.2【分析】根据等差数列性质分析两组数据之间关系再根据数据变化规律确定对应标准差变化规律即得结果【详解】因为数列是公差不为零的等差数列其前项和为所以因此即故答案为:2【点睛】本题考查等差数列和项性质以解析:2 【分析】根据等差数列性质分析两组数据之间关系,再根据数据变化规律确定对应标准差变化规律,即得结果. 【详解】因为数列{}n a 是公差不为零的等差数列,其前n 项和为n S ,所以111=+222n n n a a a a n S +=, 因此2112σσ=,即122σσ=故答案为:2 【点睛】本题考查等差数列和项性质以及数据变化对标准差的影响规律,考查综合分析求解能力,属中档题.16.7【解析】【分析】结合题意先求出线性回归方程然后再计算出结果【详解】由题意可得则线性回归方程为当时【点睛】本题考查了求线性回归方程然后求出估计结果需要掌握解题方法较为基础解析:7 【解析】 【分析】结合题意先求出线性回归方程,然后再计算出结果 【详解】 由题意可得1520304050315x ++++==6570758090765y ++++==,760.6631a ∴=⨯+,55.54a =,则线性回归方程为0.66 5.4ˆ55y x =+ 当70x =时,ˆ101.7y≈ 【点睛】本题考查了求线性回归方程,然后求出估计结果,需要掌握解题方法,较为基础17.—061【分析】根据所给条件求出把样本中心点代入回归直线方程可以得到关于的方程解出即可得到答案【详解】根据题意可得则这组数据的样本中心点是代入到回归直线方程故答案为【点睛】本题考查了线性回归方程解题解析:—0.61 【分析】根据所给条件求出x ,y ,把样本中心点()x y ,代入回归直线方程 1.4ˆ6ˆyx a +=,可以得到关于ˆa的方程,解出即可得到答案 【详解】 根据题意可得23453.54x +++== 2.2 3.8 5.5 6.54.54y +++==则这组数据的样本中心点是()3.54.5,代入到回归直线方程 1.4ˆ6ˆyx a += 4.5 1.46 3.ˆ5a∴⨯+= ˆ0.61a=- 故答案为0.61- 【点睛】本题考查了线性回归方程,解题的关键是线性回归方程一定过样本中心点,这是求解线性回归方程的步骤之一,是线性回归方程考查的常见题型,体现了回归直线方程与样本中心点的关联.18.3【解析】分析:由题意结合平均数方差的性质整理计算即可求得最终结果详解:由题意结合平均数和方差的性质可知:数据…的平均数为:方差为:则平均数和方差之和是点睛:本题主要考查均值的性质方差的性质等知识意解析:3 【解析】分析:由题意结合平均数、方差的性质整理计算即可求得最终结果. 详解:由题意结合平均数和方差的性质可知:数据15x -,25x -,…,5n x -的平均数为:532-=,方差为:()2111-⨯=, 则平均数和方差之和是213+=.点睛:本题主要考查均值的性质、方差的性质等知识,意在考查学生的转化能力和计算求解能力.19.75【解析】分析:由频率分布直方图算出各频率然后计算中位数详解:由图可知的频率为的频率为的频率为的频率为的频率为前两组频率前三组频率中位数在第三组设中位数为则解得故该组数据的中位数为点睛:本题考查了解析:75. 【解析】分析:由频率分布直方图算出各频率,然后计算中位数 详解:由图可知,10~20的频率为0.1420~30的频率为0.2430~40的频率为0.32 40~50的频率为0.2 50~60的频率为0.1前两组频率0.140.240.380.5=+=< 前三组频率0.140.240.320.70.5=++=>∴中位数在第三组设中位数为x ,则()300.380.320.510x -+⨯=解得33.75x =故该组数据的中位数为33.75点睛:本题考查了在频率分布直方图中求中位数,此类题目需要先确定中位数所在的组,然后根据公式计算求得结果,较为基础.20.【解析】根据题意可得抽样比为则这次抽样调查抽取的人数是即答案为140 解析:140【解析】根据题意可得抽样比为501,75015= 则这次抽样调查抽取的人数是()114507509002100140,1515++=⨯= 即答案为140.三、解答题21.(1)532y x =-;(2)线性回归方程是可靠的. 【分析】(1)根据最小二乘法公式,分别将数据代入计算,即可得答案;(2)选取的是4月1日与4月30日的两组数据,即10x =和8x =代入判断即可; 【详解】解:(1)由数据得12x =,27y =,3972xy =,23432x =; 又31977i i i x y ==∑,321434i i x ==∑;97797254344322b -==-,5271232a =-⨯=-;所以y 关于x 的线性回归方程为:532y x =-. (2)当10x =时,5103222y =⨯-=,22232-<; 当8x =时,583222y =⨯-=,17162-<, 所得到的线性回归方程是可靠的. 【点睛】本题考查最小二乘法求回归直线方程及利用回归方程进行判断拟合效果,考查数据处理能力,求解时注意回归直线必过样本点中心的应用.22.(1) 1.2308ˆ.0yx =+;(2)12.38万元.. 【分析】(1)由已知表格中的数据,易计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.(2)把使用年限10代入回归直线方程,即可估算出维修费用的值. 【详解】 (1)4x =,5y=,52190i i x==∑,51112.3i i i x y ==∑,12215 1.235ni ii nii x yxyb xx ==-==-∑∑,0.08a y bx =-=, 所以回归直线方程为 1.2308ˆ.0yx =+; (2) 1.23100.0812.3ˆ8y=⨯+=, 即估计用10年时维修费约为12.38万元. 【点评】本题考查回归直线的方程求解,关键是要求出回归直线方程的系数,由已知的变量x ,y 的值,我们计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.属于中等题.23.(1) 1.4518.7y x =-+;(2)3 【分析】(1)由表中数据计算x 、y ,求出ˆb、ˆa ,即可写出回归直线方程; (2)写出利润函数z y w =-,利用二次函数的图象与性质求出3x =时z 取得最大值. 【详解】解:(1)由表中数据得,1(246810)65x =⨯++++=,1(16139.57 4.5)105y =⨯++++=, 由最小二乘法求得:22222221641369.58710 4.5561058ˆ 1.452468105640b⨯+⨯+⨯+⨯+⨯-⨯⨯-===-++++-⨯, ˆ10( 1.45)618.7a=--⨯=, 所以y 关于x 的回归直线方程为 1.4518.7y x =-+; (2)根据题意,利润函数为:22(1.4518.7)(0.05 1.7517.2)0.050.3 1.5z y w x x x x x =-=-+--+=-++,所以,当0.332(0.05)x =-=⨯-时,二次函数z 取得最大值为1.95;即预测3x =时,小王销售一辆该型号汽车所获得的利润z 最大. 【点睛】本题考查了回归直线方程的求法,以及二次函数的图象与性质的应用,考查计算能力.24.(Ⅰ)图象见解析,正相关;(Ⅱ)ˆ0.7 1.5yx =+,当15x =时细菌个数为12个. 【分析】(Ⅰ)根据数据描点即得散点图,看图即判断结果; (Ⅱ)利用公式代入数据计算即可. 【详解】解:(Ⅰ)图形如下,观察图像可知细菌个数和时间是正相关.(Ⅱ)由数据计算得,()11234535x =⨯++++=,()123445 3.65y =⨯++++=,1122334445561ni ii x y==⨯+⨯+⨯+⨯+⨯=∑,22222211234555n i i x ==++++=∑122216153 3.67ˆ0.7555310ni ii ni i x y nx yxbx n ==-⨯⨯====-⨯--∑∑,ˆˆ 3.60.73 1.5a y bx =-=-⨯=, 所以ˆ0.7 1.5yx =+, 当0.7 1.512x +=时,解得15x =. 所以当15x =时细菌个数为12个. 【点睛】本题考查了散点图、线性回归方程及其应用,属于基础题. 25.(1)2552;(2)3173;(3)当他的答题数量7n =时,他的复赛成绩的期望值最大. 【分析】(1)由表可知,样本中成绩不低于60分的学生共有40人,其中成绩优良的人数为15人,再结合排列组合与古典概型即可得解;(2)先求出样本中的100名学生预赛成绩的平均值,即为μ,从而推出~(53Z N ,219),再根据正态分布的性质即可得解;(3)以随机变量ξ表示甲答对的题数,则~B ξ(,0.75)n ,记甲答完n 题所得的分数为随机变量X ,则2X ξ=,为了获取答n 道题的资格,甲需要“花”掉的分数为20.1()n n +,设甲答完n 题后的复赛成绩的期望值为()f n ,则2()1000.1()()f n n n E X =-++,最后利用配方法即可得解. 【详解】解:(1)由题意得样本中成绩不低于60分的学生共有40分,其中成绩优良的人数为15人,记“从样本中预赛成绩不低于60分的学生中随机地抽取2人,恰有1人预赛成绩优良”为事件A ,则()1125152402552C C P A C == 答:“从样本中预赛成绩不低于60分的学生中随机地抽取2人,恰有1人预赛成绩优良”的概率为2552(2)由题意知样本中的100名学生预赛成绩的平均值为:100.1300.2500.3700.25900.1533x =⨯+⨯+⨯+⨯+⨯=,则53μ=,由2361σ=得19σ=, 所以()()()()17210.158652P Z P Z P Z μσμσμσ≥=≥+=--<≤+≈, 所以,估计全市参加参赛的全体学生中,成绩不低于72分的人数为20000×0.15865=3173,即全市参赛学生中预赛成绩不低于72分的人数为3173.(3)以随机变量ξ表示甲答对的题数,则()~,0.75B n ξ,且()0.75E n ξ=, 记甲答完n 题所加的分数为随机变量X ,则2X ξ=,∴()()2 1.5E X E n ξ==, 依题意为了获取答n 道题的资格,甲需要“花”掉的分数为:()()20.2123...0.1n n n ⨯++++=+,设甲答完n 题后的复赛成绩的期望值为()f n ,则()()()221000.1 1.50.17104.9f n n n n n =-++=--+,由于*n N ∈,所以当7n =时,()f n 取最大值104.9. 即当他的答题数量7n =时,他的复赛成绩的期望值最大. 【点睛】本题考查古典概型、正态分布的性质、二项分布的性质及数学期望的实际应用,考查学生对数据的分析与处理能力,属于中档题.26.(1)分布列见解析,1;(2)0.10=P ,理由见解析. 【分析】(1)按照分层抽样计算“科学用眼”和“不科学用眼”的抽取人数,随机变量X 的取值可能为0,1,2,然后计算概率得出分布列及其数学期望; (2)按照公式计算2K 的值,然后由临界值表得出结果即可. 【详解】(1)“科学用眼”抽156245⨯=人,“不科学用眼”抽306445⨯=人,则随机变量X0=,1,2,∴343641 (0)205====CP XC,122436123(1)205C CP XC====,21243641(2)205C CP XC====,分布列为:0120121555EX=⨯+⨯+⨯=;(2)22100(45153010)3.03075255545⨯-⨯=≈⨯⨯⨯K,由表可知2.706 3.030 3.840<<,∴0.10=P.【点睛】本题考查随机变量的分布列和数学期望,考查独立性检验,考查逻辑思维能力和计算能力,考查学生分析解决问题的能力,属于常考题.。
高中数学 第一章 统计综合能力测试(含解析)北师大版必修3-北师大版高一必修3数学试题
【成才之路】2015-2016学年高中数学第一章统计综合能力测试北师大版必修3本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分.时间120分钟,满分150分.第Ⅰ卷(选择题共60分)一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.2015年的世界无烟日(5月31日)之前,小华学习小组为了了解本地区大约有多少成年人吸烟,随机调查了100个成年人,结果其中有15个成年人吸烟.对于这个关于数据收集与处理的问题,下列说法正确的是( )A.调查的方式是普查B.本地区约有15%的成年人吸烟C.样本是15个吸烟的成年人D.本地区只有85个成年人不吸烟[答案] B[解析]调查方式显然是抽样调查,∴A错误.样本是这100个成年人.∴C也错误,显然D不正确.故选B.2.某班的78名同学已编号1,2,3,…,78,为了解该班同学的作业情况,老师收取了学号能被5整除的15名同学的作业本,这里运用的抽样方法是( )A.简单随机抽样法 B.系统抽样法C.分层抽样法 D.抽签法[答案] B[解析]所抽出的编号都间隔5,故是系统抽样.3.下列问题,最适合用简单随机抽样的是( )A.某电影院有32排座位,每排有40个座位,座位号为1~40.有一次报告会坐满了听众,报告会结束后为听取意见,要留下32名听众进行座谈B.从10台冰箱中抽出3台进行质量检查C.某学校在编人员160人.其中行政人员16人,教师112人,后勤人员32人.教育部门为了解学校机构改革意见,要从中抽取一个容量为20的样本D.某乡农田有:山地8 000亩,丘陵12 000亩,平地24 000亩,洼地4 000亩. 现抽取农田480亩估计全乡农田某种作物的平均亩产量[答案] B[解析]A项的总体容量较大,用简单随机抽样法比较麻烦;B项的总体容量较小,用简单随机抽样法比较方便;C项由于学校各类人员对这一问题的看法可能差异较大,不宜采用简单随机抽样法;D 项的总体容量较大,且各类田地的产量差别很大,也不宜采用简单随机抽样法.4.一个容量为50的样本数据,分组后,组距与频数如下:[12.5,15.5),2;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),6;[30.5,33.5),4.根据分组情况估计小于30.5的数据占( )A .18% B.30% C .60% D.92%[答案] D[解析] (2+8+9+11+10+6)÷50=92%.5.如图所示的是2006年至2015年某省城镇居民百户家庭人口数的茎叶图,图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到2006年至2015年此省城镇居民百户家庭人口数的平均数为( )2 9 1 1 5 83 0 2 6 31247[答案] B[解析] 由茎叶图得到2006年至2015年城镇居民百户家庭人口数为:291,291,295,298,302,306,310,312,314,317,所以平均数为291+291+295+298+302+306+310+312+314+31710=3 03610=303.6.6.某地区共有10万户居民,该地区城市住户与农村住户之比为4∶6,根据分层抽样方法,调查了该地区1 000户居民冰箱拥有情况,调查结果如下表所示,那么可以估计该地区农村住户中无冰箱的总户数约为( )万户 C .1.76万户 D.0.24万户[答案] A[解析] 由于城市住户与农村住户之比为4∶6,城市住户有4万户,农村住户有6万户,调查的1 000户居民中共400户城市住户,有600户农村住户,其中农村住户中无冰箱的有160户,所以可估计该地区农村住户中无冰箱的总户数约为10×1601 000=1.6(万户).7.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )1 2 520 2 3 33 1 24 4 8 94 5 5 5 7 7 8 8 950 0 1 1 4 7 96 17 8A.46,45,56B.46,45,53C.47,45,56 D.45,47,53[答案] A[解析]本题考查了茎叶图的应用及其样本的中位数、众数、极差等数字特征,由茎叶图可知,中位数为46,众数为45,极差为68-12=56.在求一组数据的中位数时,一定不要忘记先将这些数据排序再判断.8.有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为( )A.18 B.36C.54 D.72[答案] B[解析]频率分布直方图中所有小矩形的面积之和为1,每个小矩形的面积表示样本数据落在该区间内的频率,故样本数据落在区间[10,12)内的频率为1-2×(0.02+0.05+0.15+0.19)=0.18,故样本数据落在区间[10,12)内的频数为0.18×200=36.9.已知两个变量x,y之间具有线性相关关系,测得(x,y)的四组值分别为(1,2),(2,4),(3,5),(4,7),则y与x之间的回归直线方程为( )A.y=0.8x+3 B.y=-1.2x+7.5C.y=1.6x+0.5 D.y=1.3x+1.2[答案] C[解析] 利用排除法. ∵x =14(1+2+3+4)= 2.5,y =14(2+4+5+7)=4.5,由于回归直线方程y =bx +a 必过定点(2.5,4.5),故排除A 、D.又由四组数值知y 随x 的增大而增大,知b >0,排除B.10.某路段检查站监控录像显示,在某时段内,有 1 000辆汽车通过该站,现在随机抽取其中的200辆汽车进行车速分析,分析的结果表示为如下图的频率分布直方图,则估计在这一时段内通过该站的汽车中速度不小于90 km/h 的约有( )A .100辆 B.200辆 C .300辆 D.400辆[答案] C[解析] 由题图可知汽车中车速在[60,90)的频率为10×(0.01+0.02+0.04)=0.7, ∴在[90,110]的频率为(1-0.7)=0.3.∴车速不小于90 km/h 的汽车数量约为0.3×1 000=300辆.11.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9,已知这组数据的平均数为10,方差为2,则|x -y |的值为( )A .1 B.2 C .3 D.4[答案] D[解析] 依题意,可得 ⎩⎪⎨⎪⎧10=x +y +10+11+95,2=15[x -102+y -102+10-102+11-102+9-102],⇒⎩⎪⎨⎪⎧x +y =20,x -102+y -102=8,⇒⎩⎪⎨⎪⎧x =12y =8,或⎩⎪⎨⎪⎧x =8y =12,所以|x-y|=4.12.甲,乙,丙三名运动员在某次测试中各射击20次,三人测试成绩的频率分布条形图分别如图1,图2和图3,若s甲,s乙,s丙分别表示他们测试成绩的标准差,则( )A.s甲<s乙<s丙 B.s甲<s丙<s乙C.s乙<s甲<s丙 D.s丙<s甲<s乙[答案] D[解析]由频率分布条形图可得甲,乙,丙三名运动员的平均成绩分别为x-甲=0.25×(7+8+9+10)=8.5;x-乙=0.3×7+8×0.2+9×0.2+10×0.3=8.5;x-丙=0.2×7+8×0.3+9×0.3+10×0.2=8.5,s2甲=0.25×(1.52+0.52+0.52+1.52)=1.25;s2乙=0.3×1.52+0.52×0.2+0.52×0.2+1.52×0.3=1.45;s2丙=0.2×1.52+0.52×0.3+0.52×0.3+1.52×0.2=1.05,∴s丙<s甲<s乙.第Ⅱ卷(非选择题共90分)二、填空题(本大题共4个小题,每小题5分,共20分,将正确答案填在题中横线上)13.一个容量为40的样本,共分成6组,第1~4组的频数分别为10,5,7,6,第5组的频率是0.10,则第6组的频率是________.[答案]0.20[解析]第5组的频数为40×0.10=4,第6组的频数为40-(10+5+7+6+4)=8,则频率为840=0.20.14.(2015·某某文,12)已知样本数据x1,x2,…,x n的均值x=5,则样本数据2x1+1,2x2+1,…,2x n+1的均值为________.[答案]11[解析]因为样本数据x1,x2,…,x n的均值x=5,所以样本数据2x1+1,2x2+1,…,2x n+1的均值为2x+1=2×5+1=11.15.(2014·某某,6)设抽测的树木的底部周长均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100cm.[答案] 24[解析] 本题考查频率分布直方图.由题意在抽测的60株树木中,底部周长小于100cm 的株数为(0.015+0.025)×10×60=24.频率分布直方图中的纵坐标为频率组距,此处经常误认为纵坐标是频率.16.下图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.0 8 9 10 3 5(注:方差s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],其中x -为x 1,x 2,…,x n 的平均数)[答案] 6.8[解析] 本题考查茎叶图、方差的概念. 由茎叶图知x -=8+9+10+13+155=11,∴s 2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.8.三、解答题(本大题共6个小题,共70分,解答应写出文字说明、证明过程或演算步骤) 17.(本小题满分10分)在同等条件下,对30辆同一型号的汽车进行耗油1升所行走路程的试验,得到如下数据(单位:km):14.1 12.3 13.7 14.0 12.8 12.9 13.1 13.6 14.4 13.8 12.6 13.8 12.6 13.2 13.3 14.2 13.9 12.7 13.0 13.2 13.5 13.6 13.4 13.6 12.1 12.5 13.1 13.5 13.2 13.4以前两位数为茎画出上面数据的茎叶图(只有单侧有数据),并找出中位数.[解析]茎叶图如图所示.1213566789130112223445566 6 788914012 4中位数为13.35.18.(本小题满分12分)某高级中学共有学生3 000名,各年级男、女人数如下表:高一年级高二年级高三年级女生523x y男生487490z已知在全校学生中随机抽取1名,抽到高二年级女生的概率是0.17.(1)问高二年级有多少名女生?(2)现对各年级用分层抽样的方法在全校抽取300名学生,问应在高三年级抽取多少名学生?[解析](1)由题设可知x3000=0.17,所以x=510.(2)高三年级人数为y+z=3000-(523+487+490+510)=990,现用分层抽样的方法在全校抽取300名学生,应在高三年级抽取的人数为:3003000×990=99名.答:(1)高二年级有510名女生;(2)在高三年级抽取99名学生.19.(本小题满分12分)为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:千克),并将所得数据分组,画出频率分布直方图(如图所示).分组频率[1.00,1.05)(1)(2)估计数据落在[1.15,1.30)中的概率为多少;(3)将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条,请根据这一情况来估计该水库中鱼的总条数.[解析] (1)根据频率分布直方图可知,频率=组距×频率组距故可得下表:(2)0.30+0.15+0.02=中的概率约为0.47. (3)120×1006=2000.所以水库中鱼的总条数约为2000条.20.(本小题满分12分)某农场为了从三种不同的西红柿品种中选出高产稳定的西红柿品种,分别在5块试验田上试种,每块试验田均为0.5公顷,产量情况如下表:问哪一种西红柿既高产又稳定?[解析] 因为x 甲=15(21.5+20.4+22.0+21.2+19.9)=21.0(kg),x 乙=15(21.3+18.9+18.9+21.4+19.8)=20.06(kg), x 丙=15(17.8+23.3+21.4+19.9+20.9)=20.66(kg),所以s 甲=15[21.5-21.02+…+19.9-21.02]≈0.756(kg);s 乙=15[21.3-21.062+…+19.8-21.062]≈1.104(kg);s 丙=15[17.8-20.662+…+20.9-20.662]≈1.807(kg).由于x 甲>x 丙>x 乙,s 甲<s 乙<s 丙,所以甲种西红柿既高产又稳定.21.(本小题满分12分)某某统计局就某地居民的月收入调查了10 000人,并根据所得数据画出了样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示收入在[1 000,1 500)).(1)求居民月收入在[3 000,3 500)的频率; (2)根据频率分布直方图算出样本数据的中位数;(3)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中用分层抽样的方法抽出100人作进一步分析,则月收入在[2 500,3 000)的这段应抽多少人?[解析] (1)月收入在[3 000,3 500)的频率为0.000 3×(3 500-3 000)=0.15. (2)∵0.000 2×(1 500-1 000)=0.1, 0.000 4×(2 000-1 500)=0.2, 0.000 5×(2 500-2 000)=0.25,0.1+0.2+0.25=0.55>0.5.∴样本数据的中位数为2 000+0.5-0.1+0.20.000 5=2 000+400=2 400(元).(3)居民月收入在[2 500,3 000)的频率为0.000 5×(3 000-2 500)=0.25, 所以10 000人中月收入在[2 500,3 000)的人数为0.25×10 000=2 500(人), 再从10 000人中分层抽样方法抽出100人,则月收入在[2 500,3 000)的这段应抽取100×2 50010 000=25(人).22.(本小题满分12分)(2015·新课标Ⅰ理,19)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w =,(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:(①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为word 11 / 11 β^=,α^=v -β^u .[解析] (1)由散点图可以判断,y =c +d x 适合作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程,由于d ^=∑i =18w i -wy i -y ∑i =18 w i -w2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6.∴y 关于w 的线性回归方程为y ^=100.6+68w ,∴y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6,年利润z 的预报值z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x )-x=-x +13.6x +20.12,∴当x =13.62=6.8,即x =46.24时,z ^取得最大值. 故年宣传费为46.24千元时,年利润的预报值最大.。
数学北师大版必修3教案: 第一章统计1.5.1 含解析 精
§5 用样本估计总体5.1 估计总体的分布整体设计教学分析教科书通过问题的探究,使学生学会列频率分布表、画频率分布直方图、频率分布折线图.教科书在这里主要介绍有关频率分布的列表和画图的方法,而关于频率分布的随机性和规律性方面则给教师留下了较大的发挥空间.教师可以通过初中有关随机事件的知识,也可以利用计算机多媒体技术,引导学生进一步体会由样本确定的频率分布表和频率分布直方图的随机性;通过初中有关频率与概率之间的关系,了解频率分布直方图的规律性,即频率分布与总体分布之间的关系,进一步体会用样本估计总体的思想.由于可以用样本频率分布直方图估计总体分布,因此可以用样本频率分布特征来估计相应的总体分布特征,这就提供了估计总体特征的另一种途径,其意义在于:在没有原始数据而仅有频率分布的情况下,此方法可以估计总体的分布特征.三维目标1.通过实例体会分布的意义和作用,通过对现实生活的探究,感知应用数学知识解决问题的方法.2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图,理解数形结合的数学思想和逻辑推理的数学方法.3.通过对样本分析和总体估计的过程,感受数学对实际生活的需要,通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地作出总体估计,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系. 重点难点教学重点:会列频率分布表,画频率分布直方图和频率折线图.教学难点:能通过样本的频率分布估计总体的分布.课时安排1课时教学过程导入新课思路1.在NBA的2006赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下:甲运动员得分:12,15,20,25,31,31,36,36,37,39,44,49,50;乙运动员得分:8,13,14,16,23,26,28,38,39,51,31,29,33.请问从上面的数据中你能否看出甲、乙两名运动员,在2006赛季中,哪一位发挥比较稳定?如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布(板书课题).思路2.如下样本是随机抽取近年来北京地区7月25日至8月24日的日最高气温.7月25日至8月10日41.9 37.5 35.7 35.4 37.2 38.1 34.7 33.7 33.3 32.5 34.6 33.0 30.8 31.0 28.6 31.5 28.8 32.58月8日至8月24日28.6 31.5 28.8 33.2 32.5 30.3 30.2 29.8 33.1 32.8 29.8 25.6 24.7 30.0 30.1 29.5 30.3 32.8怎样通过上表中的数据,分析比较两时间段内的高温(≥33 ℃)状况?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.思路3.讨论:我们要了解我校学生每月零花钱的情况, 应该怎样进行抽样?提问:学习了哪些抽样方法?一般在什么时候选取什么样的抽样方法呢?讨论:通过抽样方法收集数据的目的是什么?(从中寻找所包含的信息,用样本去估计总体)指出两种估计手段:一是用样本的频率分布估计总体的分布,二是用样本的数字特征(平均数、标准差等)估计总体的数字特征.这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.推进新课新知探究提出问题(1)我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)(2)什么是频率分布?(3)频率分布直方图的特征是什么?(4)什么是频率分布折线图?讨论结果:(1)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格来改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚地看到整个样本数据的频率分布情况. (2)频率分布是指一个样本数据在各个小范围内所占比例的大小;一般用频率分布直方图来反映样本的频率分布.(3)频率分布直方图的特征:①从频率分布直方图可以清楚地看出数据分布的总体趋势.②从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同.不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断.(4)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.应用示例思路1例1 1895年,在伦敦有106块男性头盖骨被挖掘出土.经考证,头盖骨的主人死于1665—1666年之间的大瘟疫.人类学家分别测量了这些头盖骨的宽度,数据如下所示(单位:mm):146 141 139 140 145 141 142 131 142 140 144 140138 139 147 139 141 137 141 132 140 140 141 143134 146 134 142 133 149 140 140 143 143 149 136141 143 143 141 138 136 138 144 136 145 143 137142 146 140 148 140 140 139 139 144 138 146 153148 152 143 140 141 145 148 139 136 141 140 139158 135 132 148 142 145 145 121 129 143 148 138149 146 141 142 144 137 153 148 144 138 150 148138 145 145 142 143 143 148 141 145 141请你估计在1665—1666年之间,英国男性头盖骨宽度的分布情况.解:这里,如果把总体看作是1665—1666年之间的英国男性头盖骨的宽度,那么我们就是要通过上面挖掘出土得到的样本信息,来估计总体的分布情况.但从上面的数据很难直接估计出总体的分布情况,为此,我们可以先将以上数据按每个数据出现的频数和频率汇成下表: 宽度/mm 频数 频率 宽度/mm 频数 频率 121 1 0.009 142 7 0.066129 1 0.009 143 10 0.094131 1 0.009 144 5 0.047132 2 0.019 145 8 0.075133 1 0.009 146 5 0.047134 2 0.019 147 1 0.009135 1 0.009 148 8 0.075136 4 0.038 149 3 0.028137 3 0.028 150 1 0.009138 7 0.066 152 2 0.019139 7 0.066 153 1 0.009140 12 0.113 158 1 0.009141 12 0.113从表格中,我们就能估计出总体大致的分布情况了,如在1665—1666年之间,英国男性头盖骨宽度主要在140—150 mm 之间,130 mm 以下以及150 mm 以上所占的比率相对较小等.但是,这些关于分布情况的描述仍不够形象,为了得到更为直观的信息,我们可以再将表中的数据按照下面的方式分组:宽度分组(Δx i )频数(n i ) 频率(f i ) i i x f ∆ 120—125 mm1 0.009 0.001 8 125—130 mm1 0.009 0.001 8 130—135 mm6 0.057 0.011 4 135—140 mm22 0.208 0.041 6 140—145 mm46 0.434 0.086 8 145—150 mm25 0.236 0.047 2 150—155 mm4 0.038 0.007 6 155—160 mm 1 0.009 0.001 8先画频数分布直方图(图1).进一步,我们还可以将图1中纵坐标的频数换成ii x f ∆,便可以得到图2.图1图2点评:当样本量较大时,样本中落在每个区间内的样本数的频率会稳定于总体在相应区间内取值的概率.因此,我们就可以用样本的频率分布直方图来估计总体在任意区间内取值的频率,也即总体的分布情况.变式训练1.有100名学生,每人只能参加一个运动队,其中参加足球队的有30人,参加篮球队的有27人,参加排球队的有23人,参加乒乓球队的有20人.(1)列出学生参加运动队的频率分布表.(2)画出频率分布条形图.解:(1)参加足球队记为1,参加篮球队记为2,参加排球队记为3,参加乒乓球队记为4,得频率分布表如下:试验结果频数频率参加足球队(记为1)30 0.30参加篮球队(记为2)27 0.27参加排球队(记为3)23 0.23参加乒乓球队(记为4)20 0.20合计100 1.00(2)由上表可知频率分布条形图如图3:图32.为了了解中学生的身体发育情况,对某中学17岁的60名女生的身高进行了测量,结果如下(单位cm):154 159 166 169 159 156 166 162 158156 166 160 164 160 157 151 157 161158 153 158 164 158 163 158 153 157162 159 154 165 166 157 151 146 151160 165 158 163 163 162 161 154 165162 159 157 159 149 164 168 159 153列出样本的频率分布表;绘出频率分布直方图.解:列频率分布表如下:宽度分组(Δx i) 个数累计频数(n i) 频率(f i)145.5—148.5 1 0.017148.5—151.5 3 0.050151.5—154.5 6 0.100154.5—157.58 0.133160.5—163.5 11 0.183163.5—166.510 0.167合计60 1.000 根据上述数据绘制频率分布直方图如图4:图4以上两种情况的不同之处在于,前者的频率分布表列出的是几个不同数值的频率,相应的条形图是用其高度表示取各个值的频率;后者的频率分布表列出的是在不同区间内取值的频率,相应的直方图是用图表面积的大小来表示在各个区间内取值的频率.我们在处理一个数理问题时可以采用样本的频率分布估计总体分布的方法,这是因为,频率分布随着样本容量的增大更加接近于总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布的直方图就演变成一条光滑的曲线——总体密度曲线.这条曲线是客观存在的,但是我们却很难将它准确地画出,我们只能用样本的频率分布去对它进行估计.基于频率分布与相应的总体分布有这种关系,再加上我们通常并不知道一个总体的分布,我们往往是从一个总体中抽取一个样本,用样本的频率去估计相应的总体分布.一般说来,样本的容量越大,这种估计就越精确.思路2例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位:cm).区间界限/cm 122—126 126—130 130—134 134—138 138—142人数 5 8 10 22 33区间界限/cm 142—146 146—150 150—154 154—158 人数20 11 6 5(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134 cm的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:宽度分组(Δx i) 频数(n i) 频率(f i) 122—126 5 0.04126—130 8 0.07130—134 10 0.08134—138 22 0.18138—142 33 0.28142—146 20 0.17146—150 11 0.09150—154 6 0.05154—158 5 0.04合计120 1(2)其频率分布直方图如图5:图5(3)由样本频率分布表可知身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.变式训练从某校高一年级的1 002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).168 165 171 167 170 165 170 152 175 174 165 170 168 169 171 166 164 155 164 158 170 155 166 158 155 160 160 164 156 162 160 170 168 164 174 170 165 179 163 172 180 174 173 159 163 172 167 160 164 169 151 168 158 168 176 155 165 165 169 162 177 158 175 165 169 151 163 166 163 167 178 165 158 170 169 159 155 163 153 155167 163 164 158 168 167 161 162 167 168 161 165 174 156 167 166 162 161 164 166 作出该样本的频率分布表,并估计身高不小于170(cm)的同学所占的百分率. 解:频率分布表如下:宽度分组(Δx i ) 频数累计 频数(n i ) 频率(f i ) 150.5—153.5 4 4 0.04153.5—156.5 12 8 0.08156.5—159.5 20 8 0.08159.5—162.5 31 11 0.11162.5—165.5 53 22 0.22165.5—168.5 72 19 0.19168.5—171.5 86 14 0.14171.5—174.5 93 7 0.07174.5—177.5 97 4 0.04177.5—180.5 100 3 0.03合计100 1 根据频率分布表可以估计,估计身高不小于170(cm)的同学所占的百分率为(0.14×5.1685.1711705.171--+0.07+0.04+0.03)×100%=21%. 例 2 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图6),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.图6分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为391517424+++++=0.08; 又因为频率=样本容量第二小组频数,所以样本容量=08.012=第二小组频率第二小组频数=150.(2)由图可估计该学校高一学生的达标率约为39151742391517++++++++×100%=88%. (3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组.知能训练1.有一个容量为45的样本数据,分组后各组的频数如下:(12.5,15.5],3;(15.5,18.5],8;(18.5,21.5], 9;(21.5,24.5],11;(24.5,27.5],10;(27.5,30.5],4.由此估计,不大于27.5的数据约为总体的( )A.91%B.92%C.95%D.30%答案:A2.一个容量为20的样本数据,数据的分组及各组的频数如下:(10,20),2;(20,30),3;(30,40),4;(40,50),5;(50,60),4;(60,70),2.则样本在区间(-∞,50)上的频率为( )A.0.5B.0.7C.0.25D.0.05答案:B3.一个高中研究性学习小组对本地区2000年至2002年快餐公司发展情况进行了调查,制成了该地区快餐公司个数情况的条形图和快餐公司盒饭年销售量的平均数情况条形图(如图7),根据图中提供的信息可以得出这三年中该地区每年平均销售盒饭___________万盒.快餐公司个数情况图 快餐公司盒饭年销售量的平均数情况图图7答案:85拓展提升为了了解一大片经济林生长情况,随机测量其中的100株的底部周长,得到如下数据表(单位:cm ).135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109 104 112 109 124 87 131 97 102 123 104 104 128 105 123 111 103 105 92 114 108 104 102 129 126 97 100 115 111 106 117 104 109 111 89 110 121 80 120 121 104 108 118 129 99 90 99 121 123 107 111 91 100 99 101 116 97 102 108 101 95 107 101 102 108 117 99 118 106 119 97 126 108 123 119 98 121 101 113 102 103 104 108(1)编制频率分布表;(2)绘制频率分布直方图;(3)估计该片经济林中底部周长小于100 cm 的树木约占多少?周长不小于120 cm 的树木约占多少?解:(1)这组数据的最大值为135,最小值为80, 极差为55,可将其分为11组,组距为5. 频率分布表如下:宽度分组(Δx i ) 频数(n i )频率(f i ) i i x f 80—85 10.01 0.002 85—90 20.02 0.004 90—95 40.04 0.008 95—100 140.14 0.028 100—105 240.24 0.048 105—110 150.15 0.030 110—115 120.12 0.024 115—120 90.09 0.018 120—125 110.11 0.022 125—130 60.06 0.012 130—135 20.02 0.004 合计100 1 0.2 (2)频率分布直方图如图8:图8(3)从频率分布表得,样本中小于100的频率为0.01+0.02+0.04+0.14=0.21,样本中不小于120的频率为0.11+0.06+0.02=0.19,估计该片经济林中底部周长小于100 cm 的树木约占21%,周长不小于120 cm 的树木约占19%.课堂小结总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.作业习题1—5 1、2.设计感想本节课是高一新课程必修三第二章《统计》中的第二节《用样本估计总体》的第一节课,尽管用样本估计总体是一种实用性很强,操作烦琐、麻烦的工作,但却是统计学中常用的方法,在生产、生活中应用非常广泛.用样本估计总体,其实就是一种“以偏概全”,“以部分代替全部”的思想.虽然有贬义的成分,但我们还是要认真去教好学好,而且,这也是平时考试和高考中的重点内容之一.本节要解决的问题就是:为何要用样本估计总体——社会生产、生活的实际需要(必要性),如比赛、竞技中预测结果,评判质量谁好谁差,水平谁高谁低经常要用到.如何去用样本估计总体——用样本的频率分布去估计总体的频率分布;怎样用样本估计总体——作出样本频率分布表或频率分布直方图,懂得用 “数据”语言说话.另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育并增强学生的自信心,使学生养成良好的学习态度.。
新版高中数学北师大版必修3习题:第一章统计 检测
第一章检测(时间:120分钟满分:150分)一、选择题:本大题共12小题,每小题5分,在每小题给出的四个选项中,只有一项是符合题目要求的.1.现从100件产品中随机抽出10件进行质量检测,下列说法正确的是()A.100件产品是总体B.10件产品是样本C.样本容量为100D.样本容量为10解析:这里考查统计的基本概念,总体是100件产品的质量;样本是抽取的10件产品的质量;总体容量为100,样本容量为10.答案:D2.下列说法中,不正确的是()A.系统抽样是先将差异明显的总体分成几个小组,再进行抽取B.分层抽样是将差异明显的几部分组成的总体分成几层,然后进行抽取C.简单随机抽样是从个体无差异且个体数较少的总体中逐个抽取个体D.系统抽样是从个体无差异且个数较多的总体中,将总体均分,再按事先确定的规则在各部分抽取解析:当总体中个体差异明显时,用分层抽样;当总体中个体无差异且个体数较多时,用系统抽样;当总体中个体无差异且个体数较少时,用简单随机抽样.所以A不正确.答案:A3.重庆市2016年各月的平均气温(单位:℃)数据的茎叶图如图所示,则这组数据的中位数是()A.19B.20C.21.5D.23答案:B4. 如图是容量为100的样本数据(质量)的频率分布直方图,已知样本质量均在[5,20]内,其分组为[5,10),[10,15),[15,20],则样本质量落在[15,20]内的频数为()A.10B.20C.30D.40解析:由题意得,组距为5,则样本质量在[5,10),[10,15)内的频率分别为0.3和0.5,所以样本质量在[15,20]内的频率为1-0.3-0.5=0.2.故频数为100×0.2=20.答案:B5.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,得到的频率分布直方图是()解析:由分组可知C,D一定不对;由题中茎叶图可知[0,5)有1人,[5,10)有1人,所以第一、二小组频率相同,频率分布直方图中矩形的高应相同,可排除B.故选A.答案:A6.已知两组数据x1,x2,…,x n与y1,y2,…,y n,它们的平均数分别是x和y,则新的一组数据2x1−5y1+3,2x2−5y2+3,…,2x n−5y n+3的平均数是()A.2x−5yB.2x−5y+3C.4x−25yD.4x−25y+3答案:B7.在抽查样本中,用频率分布直方图表示尺寸的过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个数在该组内的频率为m,表示该组的小矩形的高为h,则b-a等于()A.hmB.ℎmC.mℎD.与m,ℎ无关解析:b-a是组距,在频率分布直方图中,频率组距是表示该组的小矩形的高h,所以mb-a=ℎ,所以b-a=mℎ.答案:C8.某班有48名学生,在一次考试中统计出平均分为70分,方差为75分2,后来发现有2名同学的分数登错了,甲实得80分却记成了50分,乙实得70分却记成了100分,更正后平均分和方差分别为()A.70分,75分2B.70分,50分2C.70分,1.04分2D.65分,25分2解析:注意到平均数没有变化,只是方差变动.s2=148[…+(50-70)2+(100-70)2+…]=75分2,实际上s2=148[…+(80-70)2+(70-70)2+…]=50分2,故选B.答案:B9.某校高三年级有男生500人,女生400人,为了了解该年级学生的健康状况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是()A.简单随机抽样B.抽签法C.随机数法D.分层抽样解析:样本容量n=25+20=45,男生和女生的抽样比都是120,即按抽样比为120的分层抽样方法抽取样本.答案:D10.某示范农场的鱼塘放养鱼苗8万条,根据这几年的经验知道,鱼苗的成活率为95%,一段时间后准备打捞出售,第一网捞出40条,称得平均每条鱼2.5 kg,第二网捞出25条,称得平均每条鱼2.2 kg,第三网捞出35条,称得平均每条鱼2.8 kg,估计这时鱼塘中鱼的总质量为()A.192 280 kgB.202 280 kgC.182 280 kgD.172 280 kg解析:样本平均数x=40×2.5+25×2.2+35×2.840+25+35=2.53(kg),可知样本中平均每条鱼重2.53 kg,所以估计鱼塘中鱼的总质量约为80 000×95%×2.53=192 280(kg).答案:A11.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7例”.根据过去10天甲、乙、丙、丁四地新增疑似病例的数据,一定符合该标志的是()A.甲地:总体均值为3,中位数为4B.乙地:总体均值为1,总体方差大于0C.丙地:中位数为2,众数为3D.丁地:总体均值为2,总体方差为3解析:x=2,则s2=110[(x1−2)2+(x2−2)2+⋯+(x10-2)2],若有一天超过7人,不妨设x10=8,则s2≥110×(8−2)2=3.6>3,不合题意.故任何一天都不超过7人.答案:D12. 已知两个相关变量满足如下关系:A.y=0.56x+997.4B.y=0.63x-231.2C.y=50.2x+501.4D.y=60.4x+400.7解析:因为b=x1y1+x2y2+…+x5y5-5x yx12+x22+…+x52-5x2=0.56,a=y−b x=997.4.所以线性回归方程为y=0.56x+997.4.答案:A二、填空题:本大题共4小题,每小题5分.13.某市有大型超市200家、中型超市400家、小型超市1 400家.为掌握各类超市的营业情况,现按分层抽样方法抽取一个容量为100的样本,则应抽取中型超市家.解析:本题为分层抽样,所以应抽取中型超市400×100400+200+1400=20(家).答案:2014.某考察团对全国10大城市职工人均工资水平x(单位:千元)与居民人均消费水平y(单位:千元)进行统计调查,y与x具有线性相关关系,线性回归方程为y=0.66x+1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为.解析:将y=7.675代入y=0.66x+1.562,得x=611.366.所以7.675611.366≈83%.答案:83%15.如图是一个容量为100的样本的频率分布直方图,试根据图中的数据回答下列问题:(1)样本数据落在区间[2,6)内的频率为;(2)样本数据落在区间[6,10)内的频数为.解析:由频率分布直方图可得数据落在区间[2,6)内的频率为相应的小矩形的面积,即0.02×4=0.08,数据落在区间[6,10)内的频率为0.08×4=0.32,故数据落在区间[6,10)内的频数为100×0.32=32.答案:(1)0.08(2)3216.甲、乙两个班级各随机选出15名同学进行测验,成绩的茎叶图如图所示,则甲班、乙班的最高成绩各是,从图中看班的平均成绩较高.解析:从题图可以看出乙班的成绩集中在70分以上,且在80分以上的有6人,而甲班80分以上的只有4人,甲班的最低成绩是46分,对平均分影响较大.答案:96,92乙三、解答题:解答应写出文字说明、证明过程或演算步骤.17.(本小题满分10分)小明家2016年四个季度的用电量如下表:第三季度400第四季度200其中各种电器用电量如下表:根据如图所示三幅统计图回答:(1)从哪幅统计图可看出各个季度用电量变化情况??(2)从哪幅统计图可看出冰箱用电量超过总用电量的14(3)从哪幅统计图可以清楚地看出空调用电量?解:三幅统计图分别为折线统计图、扇形统计图和条形统计图,各自的优点如下:18.(本小题满分12分)农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种麦苗的试验田中各抽取6株麦苗测量麦苗的株高,数据如下(单位:cm): 甲:9,10,11,12,10,20 乙:8,14,13,10,12,21.(1)绘出所抽取的甲、乙两种麦苗株高的茎叶图;(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗的长势情况. 解:(1)茎叶图如图所示:(2)x 甲=9+10+11+12+10+206=12,x 乙=8+14+13+10+12+216=13,s 甲2≈13.67,s 乙2≈16.67.因为x 甲<x 乙,所以乙种麦苗平均株高较高.又因为s 甲2<s 乙2,所以甲种麦苗长得较为整齐.19. (本小题满分12分)2017年春节前,公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让过往返乡的摩托车驾驶人有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍询问,询问结果如图所示:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是什么抽样方法?(2)用分层抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的抽取5人,则四川籍的应抽取几人?解:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是系统抽样法.(2)从题图可知,被询问了省籍的驾驶人员中广西籍的有5+20+25+20+30=100(人); 四川籍的有15+10+5+5+5=40(人).设四川籍的驾驶人员应抽取x人,依题意得5100=x40,解得x=2,即四川籍的应抽取2人.20.(本小题满分12分)某车间20名工人年龄数据如下表:(1)求这20名工人年龄的众数与极差(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.解:(1)由题中表可知,众数为30岁.极差为40-19=21(岁).(2)(3)这20名工人年龄的平均数为(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30(岁),所以这20名工人年龄的方差为s2=120[(19−30)2+3(28−30)2+3(29−30)2+5(30−30)2+4(31−30)2+3(32−30)2+(40−30)2]=12.6(岁2).21.(本小题满分12分)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差;(同一组中的数据用该组区间的中点值作代表)(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解:(1)(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.22.(本小题满分12分)某种瓶装溶液,因为装瓶机的不稳定性,所以很可能使每瓶的含量都不是标准的含量,我们随机抽出了20瓶,测得它们的含量(单位:百毫升)如下:12.1 11.9 12.2 12.2 12.0 12.1 12.9 12.1 12.3 12.5 11.7 12.4 12.3 11.8 11.3 12.1 11.4 11.6 11.2 12.2(1)根据数据列出频率分布表,画出频率分布直方图; (2)计算出这组数据的平均数和标准差;(结果精确到0.01)(3)结合(1)(2)的结果,根据实际意义写一个简短的报告.(对总体情况作出估计) 解:(1)频率分布表如下:频率分布直方图如图所示.(2)平均数x =120×(12.1+11.9+12.2+…+12.2) ≈12.02(百毫升).标准差s ≈√(12.1−12.02)2+(11.9−12.02)2+⋯+(12.2−12.02)220≈0.41(百毫升).(3)标准差相对于平均数来说比较小.从频率分布直方图中可以看出,每瓶的含量大致位于1 150毫升到1 250毫升之间.因此可判断装瓶机工作稳定.。
数学北师大必修3备课资料 第一章统计§3 含解析
备课资料
五数概括法
五数概括法即用下面的五个数来概括数据:
(1)最小值.
(2)第1四分位数(Q 1).
(3)中位数(Q 2).
(4)第3四分位数(Q 3).
(5)最大值.
运用五数概括法的最简单的方式是首先将数据按递增顺序排列,然后很容易就能确定最小值、3个四分位数和最大值了.对12个月薪数据的样本,按照递增顺序排列如下: 2 210 2 255 2 350|2 380 2 380 2 390|2 420 2 440 2 450|2 550 2 630 2 825 Q 1=2 365 Q 2=2 405 Q 3=2 500
(中位数)
中位数2 405以及四分位数Q 1=2 365和Q 3=2 500前面已经计算出来了.对上述数据的观察可以知道最小值为2 210,最大值为2 825.因此,上述月薪数据以五数概括为:2 210,2 365,2 405,2 500,2 825.在相邻的每两个数之间,大约有4
1或25%的数据项. (设计者:林大华)。
高中数学 第一章 统计 1.2.1 简单随机抽样课时作业(含解析)北师大版必修3-北师大版高一必修3
课时作业2 简单随机抽样时间:45分钟满分:100分——基础巩固类——一、选择题(每小题5分,共40分)1.关于简单随机抽样,下列说法中不正确的是(B)A.当总体中个体数不多时,可以采用简单随机抽样B.采用简单随机抽样不会产生任何代表性差的样本C.利用随机数表抽取样本时,读数的方向可以向右,也可以向左、向下、向上等D.抽签法抽取样本对每个个体来说都是公平的解析:简单随机抽样可能产生代表性差的样本.故选B.2.抽签法中确保样本具有代表性的关键是(B)A.制签B.搅拌均匀C.逐一抽取D.抽取不放回解析:要确保样本具有代表性,用抽签法时,最重要的是要使总体“搅拌均匀”,使每个个体被抽到的可能性相等.使用抽签法制作号签后一定要搅拌均匀.3.下列说法正确的是(B)A.抽签法中可一次抽取两个个体B.随机数法中每次只取一个个体C.简单随机抽样是放回抽样D.抽签法中将号签放入箱子中,可以不搅拌直接抽取4.从总数为N的一批零件中抽取一个容量为30的样本,若每个零件被抽取的可能性为25%,则N为(D)A.150B.200C.100D.120解析:N=3025%=120.5.用随机数表法进行抽样有以下几个步骤:①将总体中的个体编号;②获取样本;③选定开始的数字.这些步骤的先后顺序应为( B )A .①②③B .①③②C .③②①D .③①②解析:用随机数表法抽样应先将个体编号,然后从随机数表中选取开始的数字读数,得到符合条件的样本,对应样本的个体为所得的样本.6.在简单随机抽样中,某一个个体被抽到的可能是( C )A .与第n 次抽样有关,第一次被抽中的可能性大些B .与第n 次抽样有关,最后一次被抽中的可能性较大C .与第n 次抽样无关,每次被抽中的可能性相等D .与第n 次抽样无关,每次都是等可能被抽取,但各次被抽取的可能性不一样解析:在总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等.7.对于简单随机抽样,下列说法中正确的命题有( D )①它要求被抽取样本的总体的个数是有限的,以便对其中每个个体被抽取的概率进行分析;②它是从总体中逐个地进行抽取,以便在抽取实践中进行操作;③它是一种不放回抽样;④它是一种等概率抽样,不仅每次从总体中抽取一个个体时,每个个体被抽取的概率相等,而且在整个抽样过程中,每个个体被抽取的概率也相等,从而保证了这种抽样方法的公平性.A .①②③B .①②④C .①③④D .①②③④解析:命题①②③④都正确.8.某校高一共有10个班,编号为1~10,现用抽签法从中抽取3个班进行调查,每次抽取一个,共抽3次,设高一(5)班第一次被抽到的可能性为a ,第二次被抽到的可能性为b ,则( D )A .a =310,b =29B .a =110,b =19C .a =310,b =310D .a =110,b =110解析:由简单随机抽样的定义,知每个个体在每次抽取中都有相同的可能性被抽到,故高一(5)班在每次抽取中被抽到的可能性都是110. 二、填空题(每小题5分,共15分)9.为了了解某班学生的身高情况,决定从50名同学中选取10名进行测量(已编号为00~49),利用随机数法进行抽取,得到如下3组编号,你认为正确的是②.(填序号)①26,94,29,27,43,99,55,19,81,06;②20,26,31,40,24,36,19,34,03,48;③04,00,45,32,44,22,04,11,08,49.解析:获取的样本应跳过不在样本编号内的,并应去掉重复.10.用随机数法从100名学生(男生25人)中抽选20人进行评教,某男学生被抽到的可能性是0.2.解析:因为样本容量为20,总体容量为100,所以总体中每一个个体被抽到的可能性都为20100=0.2. 11.用简单随机抽样的方法从含有6个个体的总体中,抽取一个容量为2的样本,某一个个体a “第一次被抽到的概率”,“第二次被抽到的概率”,“在整个抽样过程中被抽到的概率”分别是16,16,13. 解析:从6个个体中抽1个个体,每个个体被抽到的概率均为16,与抽取的次数无关,第二次被抽到的概率仍为16.但由于在整个抽样过程中是从6个个体中抽2个样本,故个体a 被抽到的概率为13. 三、解答题(共25分,解答应写出必要的文字说明、证明过程或演算步骤)12.(12分)某老现在课堂上对全班同学进行了两次模拟抽样,第一次采用抽签法,第二次采用随机数法.在这两次抽样中,小明第一次被抽到了,第二次没有被抽到,那么用这两种方法抽样时,小明被抽到的可能性一样吗?解:虽然都是简单随机抽样,但是每次抽出的结果可能会不相同,被抽到的可能性不是看最终结果,而是看在抽样前被抽到的可能性是不是相同,这主要取决于抽样是不是随机的,只要没有人为因素的干扰,在两次抽样中,小明被抽到的可能性都是一样的.13.(13分)现要从20名学生中抽取5名进行问卷调查,写出抽取样本的过程.解:简单随机抽样分两种:抽签法和随机数法.本题可采用抽签法进行抽取.(1)先将20名学生进行编号,从1编到20;(2)把写在形状、大小均相同的号签上;(3)将号签放在某个箱子中进行充分搅拌,力求均匀,然后依次从箱子中抽取5个号签,按这5个号签上的抽取对应的学生,即得样本.——能力提升类——14.(5分)从一群玩游戏的小孩中随机抽出k 人,一人分一个桃子后,让他们返回继续玩游戏,一会儿后,再从中任意抽出m 人,发现其中有n 个小孩曾分过桃子,估计一共有小孩子km n个. 解析:估计一共有小孩x 人,则有k x =n m, ∴x =km n. 15.(15分)公共汽车管理部门要考察一下其所管辖的30辆公共汽车的卫生状况,现决定从中抽取10辆进行检查.如果以抽签法做实验,请叙述具体的做法;如果该管理部门管辖的是70辆车,利用随机数法抽取一个简单随机样本,样本容量为30.解:(1)抽签法的步骤:第一步 编号.给所管辖的30辆车编号;第二步 定签.可以用各种不同的签,最简单的可以用纸条,将30辆车的编号写在纸条上;第三步 抽取.将纸条混合均匀,依次随机地抽取10个;第四步 调查.调查抽出的纸条所对应的车辆.(2)随机数法的步骤:第一步编号.将70辆车编上号:00,01,02, (69)第二步选数.由于总体是一个两位数的编号,所以从随机数表中随机选取一个位置开始,向某一方向依次选取两位数字,大于69的舍去,重复的舍去,直到取满30个数为止;第三步调查.调查抽出的数所对应的车辆.。
2018秋新版高中数学北师大版必修3习题:第一章统计 1.5.2 Word版含解析
5.2估计总体的数字特征课时过关·能力提升1.某商场买来一车苹果,从中随机抽取了10个苹果,其重量(单位:g)分别为150,152,153,149,148,146,151,150,152,147,由此估计这车苹果单个重量的平均值是() A.150.2 g B.149.8 gC.149.4 gD.147.8 g解析:x=150+152+153+149+148+146+151+150+152+14710=149.8(g).答案:B2.:s1,s2,s3()A.s3>s1>s2B.s2>s1>s3C.s1>s2>s3D.s2>s3>s1解析:甲、乙、丙的平均成绩均为8.5.s1=√120[5(7-8.5)2+5(8-8.5)2+5(9-8.5)2+5(10-8.5)2]=√2520,同理s2=√2920,S3=√2120,所以s2>s1>s3.故选B.答案:B3.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x A和x B,样本标准差分别为s A和s B,则()A.x A>x B,S A>S BB.x A<x B,S A>S BC.x A>x B,S A<S BD.x A<x B,S A<S B解析:由题图易得x A<x B,又A波动性大,B波动性小,所以s A>s B.答案:B4.某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.若日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中优秀工人的人数为.解析:因为样本均值为17+19+20+21+25+306=1326=22.所以样本中优秀工人占的比例为26=13,而12×13=4,故推断该车间12名工人中有4名优秀工人.答案:45.若10个数据的平均数是3,标准差是2,则方差是 ;这10个数据的平方和是 .解析:设这10个数分别为x 1,x 2,…,x 10,则x 1+x 2+…+x 10=30.又标准差为2,则方差为s 2=4,则x 12+x 22+⋯+x 102=4×10−9×10+6×30=130.答案:4 1306.样本数为9的一组数据,它们的平均数是5,频率条形图如图所示,则其标准差等于 .(保留根号)解析:由条形图知2与8的个数相等,且多于5的个数,于是这9个数分别为2,2,2,2,5,8,8,8,8. ∵x =5,∴s 2=19[(2−5)2+(2−5)2+(2−5)2+(2−5)2+(5−5)2+(8−5)2+(8−5)2+(8−5)2+(8−5)2]=19×8×9=8.∴s =2√2.答案:2√27.:则两人射击成绩水平更为稳定的是 .解析:因为x 甲=8,x 乙=8,而s 甲2=1.2,s 乙2=1.6,s 甲2<s 乙2,所以甲稳定性较强.答案:甲8.,满分为100分).请根据表中提供的信息,(1)参加这次演讲比赛的同学共有多少人?(2)已知成绩在91~100分的同学为优秀者,则优秀率为多少? (3)所有参赛同学的平均得分M (分)在什么范围内? (4)将下图中的成绩频率分布直方图补充完整.解:(1)参加这次比赛的同学共有2+8+6+4=20(人).(2)分数在91~100分的人数为4,故优秀率为420=20%. (3)总分数段最小值及最大值分别除以人数,得。
新北师大版高中数学必修三第一章《统计》测试卷(含答案解析)
一、选择题1.一组数据的平均数为m ,方差为n ,将这组数据的每个数都加上(0)a a >得到一组新数据,则下列说法正确的是( ) A .这组新数据的平均不变 B .这组新数据的平均数为am C .这组新数据的方差为2a nD .这组新数据的方差不变2.一组数据的平均数为x ,方差为2s ,将这组数据的每个数都乘以()0a a >得到一组新数据,则下列说法正确的是( ) A .这组新数据的平均数为x B .这组新数据的平均数为a x + C .这组新数据的方差为2asD .这组新数据的标准差为2a s3.在一个容量为5的样本中,数据均为整数,已测出其平均数为8,但墨水污损了后面两个数据,其中一个数据的十位数字1未污损,即5,7,8, ,那么这组数据的方差2s 可能的最大值是( ) A .185B .18C .36D .64.①45化为二进制数为(2)101101;②一个总体含有1000个个体(编号为0000,0001,…,0999),采用系统抽样从中抽取一个容量为50的样本,若第一个抽取的编号为0008,则第六个编号为0128; ③已知a ,b ,c 为ABC ∆三个内角A ,B ,C 的对边,其中3a =,4c =,6A π=,则这样的三角形有两个解.以上说法正确的个数是( ) A .0B .1C .2D .35.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3OP (O 为原点)的斜率的取值范围是3333(,)(,)22-∞-. A .①②③B .①③④C .①②④D .②③④6.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x (万元)8.28.610.011.311.9支出y (万元)6.27.58.0 8.59.8根据上表可得回归直线方程ˆˆˆy bx a =+,其中ˆˆˆ0.76,ba y bx ==-,据此估计,该社区一户收入为15万元家庭年支出为( ) A .11.4万元B .11.8万元C .12.0万元D .12.2万元7.某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为( ) A .30B .25C .20D .158.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程ˆˆˆy bx a =+中的ˆb为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元9.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是 A .甲地:总体均值为3,中位数为4 B .乙地:总体均值为1,总体方差大于0 C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为310.甲、乙两名选手参加歌手大赛时,5名评委打的分数用如图所示的茎叶图表示,s 1,s 2分别表示甲、乙选手分数的标准差,则s 1与s 2的关系是( ).A .s 1>s 2B .s 1=s 2C .s 1<s 2D .不确定11.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为 A .12B .14C .16D .1812.根据如下样本数据 x 3 4 5 6 7 8 y﹣4.0﹣2.50.5﹣0.52.03.0得到的回归方程为y bx a =+,则( ) A .a >0,b <0B .a >0,b >0C .a <0,b <0D .a <0,b >0二、填空题13.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.14.如图是甲、乙两人在10天中每天加工零件个数的茎叶图,若这10天甲加工零件个数的中位数为a ,乙加工零件个数的平均数为b ,则a b +=______.15.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..16.某校有高一学生n 名,其中男生数与女生数之比为6:5,为了解学生的视力情况,现要求按分层抽样的方法抽取一个样本容量为10n的样本,若样本中男生比女生多12人,则n =_______.17.已知由样本数据点集合(){},|1,2,3,,i i x y i n =,求得的回归直线方程为1.230.08y x Λ=+ ,且4x =。
北师大版高中数学必修三第一章《统计》测试题(含答案解析)
一、选择题1.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是()A.成绩B.视力C.智商D.阅读量2.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是()A.海水稻根系深度的中位数是45.5B.普通水稻根系深度的众数是32C.海水稻根系深度的平均数大于普通水稻根系深度的平均数D.普通水稻根系深度的方差小于海水稻根系深度的方差3.将某选手的7个得分去掉1个最高分,去掉1个最低分,5个剩余分数的平均分为21,现场作的7个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则5个剩余分数的方差为( )A .1167B .365C .36D .674.某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是 A .8号学生B .200号学生C .616号学生D .815号学生5. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日6.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9 C .y =1.9x +1.04 D .y =1.05x -0.97.①45化为二进制数为(2)101101;②一个总体含有1000个个体(编号为0000,0001,…,0999),采用系统抽样从中抽取一个容量为50的样本,若第一个抽取的编号为0008,则第六个编号为0128; ③已知a ,b ,c 为ABC ∆三个内角A ,B ,C 的对边,其中3a =,4c =,6A π=,则这样的三角形有两个解.以上说法正确的个数是( ) A .0B .1C .2D .38.已知某8个数的平均数为3,方差为2,现加入一个新数据3,此时这9个数的平均数为x ,方差为2s ,则( ) A .3x =,22s < B .3x =,22s > C .3x >,22s <D .3x >,22s >9.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3,则直线OP (O 为原点)的斜率的取值范围是3333(,)(,)282-∞-. A .①②③B .①③④C .①②④D .②③④10.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( ) A .10B .11C .12D .1311.已知x ,y 的取值如表: x 2 6 7 8y若x ,y 之间是线性相关,且线性回归直线方程为,则实数a 的值是A .B .C .D .12.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,则该45名学生的数学成绩的中位数为( )A .127B .128C .128.5D .129二、填空题13.某社会爱心组织面向全市征召义务宣传志愿者.现从符合条件的志愿者中随机抽取100名按年龄分组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45),得到的频率分布直方图如图所示.若从第3,4,5组中用分层抽样的方法抽取6名志愿者参与广场的宣传活动,应从第3组抽取__________名志愿者.14.通过市场调查,得到某种产品的资金投入x (单位:万元)与获得的利润y (单位:万元)的数据,如表所示: 资金投入x 2 3 4 5 6 利润y0.40.611.21.8根据表格提供的数据,用最小二乘法求线性回归直线方程为0.36ˆˆybx =-,现投入资金15万元,求获得利润的估计值(单位:万元)为_____________.15.某地区共有4所普通高中,这4所普通高中参加2018年高考的考生人数如下表所示: 学校 A 高中B 高中C 高中D 高中参考人数80012001000600现用分层抽样的方法在这4所普通高中抽取144人,则应在D 高中中抽取的学生人数为_______.16.已知一组数据126,,,x x x ⋅⋅⋅的方差是2,并且()()()22212611118x x x -+-+⋅⋅⋅+-=,0x ≠,则x =______.17.已知某8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数据的方差为______.18.某种产品的广告费支出x 与销售额y 之间有如下对应数据(单位:百万元),根据下表求出y 关于x 的线性回归方程为 6.517.5y x =+,x2 4 5 6 8 y30 40 57a69则表中a 的值为__________.19.已知某产品连续4个月的广告费i x (千元)与销售额i y (万元)(1,2,3,4i =),经过对这些数据的处理,得到如下数据信息:①441118,14ii i i xy ====∑∑;②广告费用x 和销售额y 之间具有较强的线性相关关系;③回归直线方程y bx a =+中的0.8b =. 那么广告费用为6千元时,则可预测销售额约为__________万元.20.能够说明“若甲班人数为m ,平均分为a ;乙班人数为n n m ≠(),平均分为b ,则甲乙两班的数学平均分为2a b+”是假命题的一组正整数a ,b 的值依次为_____. 三、解答题21.某大学生利用寒假参加社会实践,对机械销售公司7月份至12月份销售某种机械配件的销售量及销售单价进行了调查,销售单价x 和销售量y 之间的一组数据如表所示:(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过2件,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?(3)预计在今后的销售中,销售量与销售单价仍然服从(1)中的关系,若该种机器配件的成本是2.5元/件,那么该配件的销售单价应定为多元才能获得最大利润?(注:利润=销售收入-成本). 参考数据:51392i ii x y==∑,521502.5i i x ==∑.参考公式:回归直线方程ˆˆˆy bx a =+,其中1221ˆni ii nii x y nx ybxnx ==-=-∑∑,ˆˆa y bx=-. 22.我国北方广大农村地区、一些城镇以及部分大中城市的周边区域,还在大量采用分散燃煤和散烧煤取暖,既影响了居民基本生活的改善,也加重了北方地区冬季的雾霾天气.推进北方地区冬季清洁取暖,是重大民生工程、民心工程,关系北方地区广大群众温暖过冬,关系雾霾天能不能减少,是能源生产和消费革命、农村生活方式革命的重要内容.2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改电用户大幅度增加,下面条形图反映了某省2018年1~7月份煤改气、煤改电的用户数量.(1)在给定坐标系中作出煤改气、煤改电用户数量y 随月份t 变化的散点图,并用散点图和相关系数说明y 与t 之间具有线性相关性;(2)建立y 关于t 的回归方程(系数精确到0.01),预测11月份该省煤改气、煤改电的用户数量. 参考数据:7772111y9.24,t 7 2.646iiii i i i y=====⋅≈≈∑∑∑(y -y ).参考公式:相关系数()()()()()()11112211niinn ni i i i i i nni i i i i i i t t y y r t ty y t y t y t ty y ======⋅--=⋅--=-⋅-⋅-∑∑∑∑∑∑.回归方程ˆy a bt=+中斜率和截距的最小二乘估计公式分别为:()()()121ˆˆˆ,niii ni i t t y y bay bt t t==⋅--==-⋅-∑∑. 23.随着人民生活水平的日益提高,某小区拥有私家车的数量与日俱增,物业公司统计了近六年小区私家车的数量,数据如下:(1)若该小区私家车的数量y 与年份编号x 的关系可用线性回归模型来拟合,请求出y 关于x 的线性回归方程,并用相关指数2R 分析其拟合效果(2R 精确到0.01);(2)由于该小区没有配套停车位,车辆无序停放易造成交通拥堵,因此物业公司预在小区内划定一定数量的停车位,若要求在2022年小区停车位数量仍可满足需要,则至少需要规划多少个停车位.参考数据:61936i i y ==∑,614081i i i x y ==∑,62191ii x ==∑,()62137586i i y y=-=∑.附:回归方程中斜率和截距的最小二乘估计公式分别为:1221ni ii nii x y nx yb xnx==-⋅=-∑∑,a y bx =-,相关指数()()221211nii i n ii yy R yy==-=--∑∑,残差e y y=-.24.为研究冬季昼夜温差大小对某反季节大豆新品种发芽率的影响,某校课外兴趣小组记录了5组昼夜温差与100颗种子发芽数,得到如下资料:经分析,这组数据具有较强的线性相关关系,因此该小组确定的研究方案是:先从这五组数据中选取3组数据求出线性回归方程,再用没选取的2组数据进行检验.(1)若选取的是第2,3,4组的数据,求出y 关于x 的线性回归方程ˆˆˆy bx a =+;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?(参考公式:()()()1122211ˆnni i i i i i nn i ii i x x y y x y nxy bx x x nx====---==--∑∑∑∑,ˆˆa y bx=-) 25.某玻璃工艺品加工厂有2条生产线用于生产其款产品,每条生产线一天能生产200件该产品,该产品市场评级规定:评分在10分及以上的为A 等品,低于10分的为B 等品.厂家将A 等品售价定为2000元/件,B 等品售价定为1200元/件. 下面是检验员在现有生产线上随机抽取的16件产品的评分:经计算得16119.9716i i x x ===∑,()1616222211110.0451616i i i i s x x x x ===-=-=∑∑,其中i x 为抽取的第i 件产品的评分,1,2,,16i =⋅⋅⋅.该厂计划通过增加生产工序来改进生产工艺,已知对一条生产线增加生产工序每年需花费1500万元,改进后该条生产线产能不变,但生产出的每件产品评分均提高0.05.已知该厂现有一笔1500万元的资金.(1)若厂家用这1500万元改进一条生产线,根据随机抽取的16件产品的评分. (i )估计改进后该生产线生产的产品中A 等品所占的比例; (ii )估计改进后该厂生产的所有产品评分的平均数和方差.(2)某金融机构向该厂推销一款年收益率为8.2%的理财产品,请你利用所学知识分析,将这1500万元用于购买该款理财产品所获得的收益,与通过改进一条生产线使产品评分提高所增加的收益相对比,一年后哪种方案的收益更大? (一年按365天计算) 26.某市为了解疫情过后制造业企业的复工复产情况,随机调查了100家企业,得到这些企业4月份较3月份产值增长率x 的频率分布表如下:(1)估计制造业企业中产值增长率不低于60%的企业比例及产值负增长的企业比例; (2)求制造业企业产值增长率的平均数与方差的估计值(同一组中的数据用该组区间的中点值为代表).【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】试题分析:由表中数据可得 表1:()25262210140.00916362032K ⨯⨯-⨯=≈⨯⨯⨯;表2: ()2524201216 1.76916362032K ⨯⨯-⨯=≈⨯⨯⨯;表3: ()252824128 1.316362032K ⨯⨯-⨯=≈⨯⨯⨯;表4: ()25214302623.4816362032K ⨯⨯-⨯=≈⨯⨯⨯.其中23.48最大,所以阅读量与性别有关联的可能性最大.故D 正确. 考点:独立性检验.2.D解析:D 【分析】选项A 求出海水稻根系深度的中位数是444745.52+=,判断选项A 正确;选项B 写出普通水稻根系深度的众数是32,判断选项B 正确;选项C 先求出海水稻根系深度的平均数,再求出普通水稻根系深度的平均数,判断选项C 正确;选项D 先求出普通水稻根系深度的方差,再求出海水稻根系深度的方差,判断选项D 错误. 【详解】解:选项A :海水稻根系深度的中位数是444745.52+=,故选项A 正确; 选项B :普通水稻根系深度的众数是32,故选项B 正确; 选项C :海水稻根系深度的平均数393938434447495050514510+++++++++=,普通水稻根系深度的平均数252732323436384041453510+++++++++=,故选项C 正确;选项D :普通水稻根系深度的方差2222222211[(3845)(3945)(3945)(4345)(4445)(4745)(4945)(5045)10S =-+-+-+-+-+-+-+-+, 海水稻根系深度的方差2222222221[(2535)(2735)(3235)(3235)(3435)(3635)(3835)(4035)(10S =-+-+-+-+-+-+-+-+,故选项D 错误故选:D. 【点睛】本题考查根据茎叶图求中位数、众数、平均数、方差,是基础题.3.B解析:B 【分析】由剩余5个分数的平均数为21,据茎叶图列方程求出x =4,由此能求出5个剩余分数的方差. 【详解】∵将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为21, ∴由茎叶图得:1724202020215x+++++=得x =4,∴5个分数的方差为: S 2=()()()()()222221361721242120212021242155⎡⎤-+-+-+-+-=⎣⎦ 故选B 【点睛】本题考查方差的求法,考查平均数、方差、茎叶图基础知识,考查运算求解能力,考查数形结合思想,是基础题.4.C解析:C 【分析】等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案. 【详解】详解:由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{}n a ,公差10d =,所以610n a n =+()n *∈N ,若8610n =+,则15n =,不合题意;若200610n =+,则19.4n =,不合题意; 若616610n =+,则61n =,符合题意;若815610n =+,则80.9n =,不合题意.故选C . 【点睛】本题主要考查系统抽样.5.C解析:C 【分析】认真观察题中所给的折线图,对照选项逐一分析,求得结果. 【详解】这10天中第一天,第三天和第四天共3天空气质量为一级,所以A 正确; 从图可知从6日到9日 2.5PM 日均值逐渐降低,所以B 正确; 从图可知,这10天中 2.5PM 日均值最高的是12月6日,所以D 正确; 由图可知,这10天中 2.5PM 日均值的中位数是4145432+=,所以C 不正确; 故选C. 【点睛】该题考查的是有关利用题中所给的折线图,描述对应变量所满足的特征,在解题的过程中,需要逐一对选项进行分析,正确理解题意是解题的关键.6.B解析:B 【解析】分析:根据所给的这组数据,取出这组数据的样本中心点,把样本中心点代入所给的四个选项中验证,若能够成立的只有一个,这一个就是回归直线方程. 详解:123+4=2.54x ++=, 3 3.8 5.264.5,4y +++==∴这组数据的样本中心点是(2.5,4.5)把样本中心点代入四个选项中,只有y =1.04x +1.9成立,故选B.点睛:这是一道关于考查回归直线方程的题目,关键掌握回归直线必过样本中心点的特点,首先分析题目,由四组数据可得,x y ,进而得到样本中心点的坐标,接下来根据回归直线必过样本中心点,即可解答此题.7.C解析:C 【解析】分析:①根据进位制的互化可得结果;②根据系统抽样的性质可得结论;③由正弦定理可得结论.详解:①45222...1÷=,22211...0÷=,112 5...1÷=,52 2...1÷=,22 1...0÷=,120...1÷=,故()()10245101101=,①正确;②因为1000个个题抽取50个样本,∴每个样本编号间隔为20,第六个编号为8205108+⨯=,即编号为0108,故②错误;③由正弦定理可得342,1sin 32sinC C ==,,c a C >∴∠可能是锐角,也可能是钝角,三角形有两个解,③正确,故选C.点睛:本题主要考查进位制、正弦定理的应用,分层抽样的应用,意在考查综合运用所学知识解决问题的能力,属于中档题.8.A解析:A 【分析】由题意计算出加入新数据后的平均数,然后比较方差 【详解】()18138x x +⋯+=, ()181339x x +⋯++=, 3x ∴=,由方差的定义可知加入新数据3,样本数据会变得更加稳定 故22s < 故选A 【点睛】本题主要考查了加入数据后平均数和方差的变化,代入公式计算出结果,较为基础9.C解析:C 【分析】利用线性回归方程系数的几何意义,圆锥曲线离心率的范围,椭圆的性质,逐一判断即可. 【详解】①设某大学的女生体重y (kg )与身高x (cm )具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的线性回归方程为y ∧=0.85x ﹣85.71,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ,正确;②关于x 的方程x 2﹣mx +1=0(m >2)的两根之和大于2,两根之积等于1,故两根中,一根大于1,一根大于0小于1,故可分别作为椭圆和双曲线的离心率.正确; ③设定圆C 的方程为(x ﹣a )2+(x ﹣b )2=r 2,其上定点A (x 0,y 0),设B (a +r cosθ,b +r sinθ),P (x ,y ),由12OP =(OA OB +)得0022x a rcos x y b rsin y θθ++⎧=⎪⎪⎨++⎪=⎪⎩,消掉参数θ,得:(2x ﹣x 0﹣a )2+(2y﹣y 0﹣b )2=r 2,即动点P 的轨迹为圆, ∴故③不正确;④由22143x y +=,得a 2=4,b 2=3,∴1c ==.则F (﹣1,0),如图:过F 作垂直于x 轴的直线,交椭圆于A (x 轴上方),则x A =﹣1,代入椭圆方程可得32A y =.当P 为椭圆上顶点时,P (0FP k =32OA k =-, ∴当直线FPOP 的斜率的取值范围是32⎛⎫-∞- ⎪⎝⎭,.当P 为椭圆下顶点时,P (0,∴当直线FPOP ,32),综上,直线OP (O 为原点)的斜率的取值范围是32⎛⎫-∞- ⎪⎝⎭,∪,32). 故选C 【点睛】本题以命题真假的判断为载体,着重考查了相关系数、离心率、椭圆简单的几何性质等知识点,属于中档题.10.C解析:C 【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n =30n ﹣19,由401≤30n ﹣21≤755,求得正整数n 的个数,即可得出结论. 【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列, 又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列, ∴等差数列的通项公式为a n =11+(n ﹣1)30=30n ﹣19, 由401≤30n ﹣19≤755,n 为正整数可得14≤n ≤25, ∴做问卷C 的人数为25﹣14+1=12, 故选C . 【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.11.B解析:B 【解析】 【分析】根据所给的两组数据,做出横标和纵标的平均数,写出这组数据的样本中心点,根据线性回归方程一定过样本中心点,得到线性回归直线一定过的点的坐标. 【详解】根据题意可得,,由线性回归方程一定过样本中心点,.故选:B.【点睛】本题考查线性回归方程的意义,线性回归方程一定过样本中心点,本题解题的关键是正确求出样本中心点,题目的运算量比较小,是一个基础题.12.D解析:D【解析】分析:由茎叶图得出45名学生的数学成绩,从而求出中位数.详解:根据茎叶图得出45名学生的数学成绩,可知中位数为129.故选D.点睛:本题考查了茎叶图的应用问题,解题时应根据茎叶图中的数据,进行解答,属基础题..二、填空题13.【分析】先分别求出这3组的人数再利用分层抽样的方法即可得出答案【详解】第3组的人数为第4组的人数为第5组的人数为所以这三组共有60名志愿者所以利用分层抽样的方法在60名志愿者中抽取6名志愿者第三组应解析:3【分析】先分别求出这3组的人数,再利用分层抽样的方法即可得出答案.【详解】第3组的人数为10050.0630⨯⨯=,第4组的人数为10050.0420⨯⨯=,第5组的人数为1000.02510⨯⨯=,所以这三组共有60名志愿者,所以利用分层抽样的方法在60名志愿者中抽取6名志愿者,第三组应抽取306360⨯=名,故答案为:3.【点睛】关键点点睛:该题考查的是有关频率分布直方图的识别以及分层抽样某层抽取个数的问题,正确解题的关键是掌握在抽取过程中每个个题被抽到的机会均等.14.【分析】根据线性回归方程过样本数据中心点可求出b代入即可求解【详解】由表中数据可得所以过点代入可得所以当时即获得利润大约为万元故答案为:【点睛】本题主要考查了线性回归方程样本数据中心点线性回归方程的 解析:4.74【分析】根据线性回归方程过样本数据中心点,可求出b ,代入15x =即可求解. 【详解】由表中数据可得4,1x y ==,所以0.36ˆˆybx =-过点(4,1), 代入可得0.34b =,所以ˆˆ0.340.36yx =-, 当15x =时,0.34150.34ˆ6 4.7y=⨯-=, 即获得利润大约为4.74万元. 故答案为:4.74 【点睛】本题主要考查了线性回归方程,样本数据中心点,线性回归方程的应用,属于中档题.15.24【分析】计算出高中人数占总人数的比例乘以得到在高中抽取的学生人数【详解】应在高中抽取的学生人数为【点睛】本小题主要考查分层抽样考查频率的计算属于基础题解析:24 【分析】计算出D 高中人数占总人数的比例,乘以144得到在D 高中抽取的学生人数. 【详解】应在D 高中抽取的学生人数为6001442480012001000600⨯=+++.【点睛】本小题主要考查分层抽样,考查频率的计算,属于基础题.16.2【解析】【分析】由题意结合方差的定义整理计算即可求得最终结果【详解】由题意结合方差的定义有:①而②①-②有:③注意到将其代入③式整理可得:又故故答案为2【点睛】本题主要考查方差的计算公式整体的数学解析:2 【解析】 【分析】由题意结合方差的定义整理计算即可求得最终结果. 【详解】由题意结合方差的定义有:()()()22212612x x x x x x -+-++-= ①,而()()()22212611118x x x -+-+⋅⋅⋅+-=, ②, ①-②有:()()212612666226x x x x x x x x --+++++++=-, ③,注意到1266x x x x +++=,将其代入③式整理可得:26120x x -+=,又0x ≠,故2x =.故答案为2. 【点睛】本题主要考查方差的计算公式,整体的数学思想等知识,意在考查学生的转化能力和计算求解能力.17.【解析】【分析】先求出这个数据的平均数为此时这个数据的方差为由此求出结果【详解】某个数据的平均数为方差为现又加入一个新数据则这个数据的平均数为此时这个数据的方差为故答案为【点睛】本题主要考查了平均数解析:83【解析】 【分析】先求出这9个数据的平均数为5,此时这9个数据的方差为()22183559S ⎡⎤=⨯+-⎣⎦,由此求出结果 【详解】某8个数据的平均数为5,方差为3,现又加入一个新数据5, 则这9个数据的平均数为85559⨯+= ∴此时这9个数据的方差为()2218835593S ⎡⎤=⨯+-=⎣⎦故答案为83【点睛】本题主要考查了平均数和方差的计算公式,属于基础题。
2022年高中数学北师大版必修三第1章5§3统计图表含解析
2022年高中数学北师大版必修三第1章5§3统计图表含解析[A基础达标]1.如图所示是甲、乙、丙、丁四组人数扇形统计图部分结果,根据扇形统道丙、丁两组人数和为()A。
250C。
400B。
150D。
300计图情况可以知120解析:选A.甲组人数是120,占30%,则总人数为=400;乙组人数是400某7.5%=30,则丙、丁两组30%人数和为400-120-30=250.2。
一次中学生田径运动会上,参加男子跳高15名运动员成绩如下条形统计图所示,则这些运动员成绩在1.75米及以上人数为()A。
10人C。
8人B。
9人D。
3人解析:选C.由题图可知,成绩在1.75米及以上共有5+2+1=8(人)。
3。
某支股票近10个交易日价格如下:天数股价/元14.3224.1834.2844.3454.3064.4574.5184.4894.52104.55下列几种统计图中,表示上面数据较合适是()A。
条形统计图B。
扇形统计图C。
折线统计图D。
茎叶图解析:选C.通过如图所示折线统计图,我们比较直观地看出此股票在这10天中,其价格总体是一个上升趋势,也可以看出每天变化,所以用折线统计图表示不断变化数据,是有其优越性,选C.4。
已知某地区中小学生人数和近视情况分别如图①和图②所示,为了解该地区中小学生近视形成原因,用分层抽样方法抽取2%学生进行调查,则样本容量和抽取高中生近视人数分别为()A。
200,20C。
200,10B。
100,20D。
100,10解析:选A.样本容量n=(3500+4500+2000)某2%=200,所以应抽取高中生2000某2%=40人,近视人数为40某50%=20.5.如图所示是甲、乙两名运动员某赛季一些场次得分茎叶图,据图可知()A。
甲运动员成绩好于乙运动员B。
乙运动员成绩好于甲运动员C。
甲、乙两名运动员成绩没有明显差异D。
甲运动员最低得分为0分解析:选A.从这个茎叶图可以看出甲运动员得分大致对称;乙运动员得分除一个52外,也大致对称。
高中数学北师大版必修3习题:第一章统计1.5.1
§5用样本估计总体5.1估计总体的分布课时过关·能力提升1.“样本的频率分布”与“相应的总体分布”的关系是()A.“样本的频率分布”与“相应的总体分布”是同样的分布B.“样本的频率分布”与“相应的总体分布”是互不相关的两种分布C.“样本的频率分布”将随着样本容量的增大更加接近“总体分布”D.“样本的频率分布”的样本容量增大到某一定值时就变成了“总体分布”答案:C2.容量为100的样本数据,按从小到大的顺序分为8组,如下表:A.14和0.14B.0.14和14C.114和0.14D.13和114答案:A3.已知一个容量为10的样本,其分组与频数如下表,则样本落在区间[1,5)内的频率为()A.0.70C.0.50D.0.20解析:根据频率分布的概念,样本落在区间[1,5)内的频数为7,则样本落在区间[1,5)内的频率为0.70,故选A.4.某商场在庆元宵促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为()A.6万元B.8万元C.10万元D.12万元=25(万元),故11时至12时的销售额为0.4×25=10(万元).解析:总销售额为2.50.1答案:C5.如图是一次数学考试结果的频率分布直方图,若规定60分以上(含60分)为考试合格,则这次考试的合格率为.解析:由频率分布直方图可得考试的合格率为(0.024+0.012)×20=0.72=72%.答案:72%6. 一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人做进一步调查,则月收入在[2 500,3 000)(单位:元)段应抽出人.解析:因为月收入在[2 500,3 000)段的频率为0.000 5×500=0.25,所以应抽出100×0.25=25(人).7.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95],由此得到频率分布直方图如图所示,则这20位工人中一天生产该产品数量在[55,75)内的人数是.解析:由频率分布直方图可知,组距为10,所以该产品数量在[55,75)内的频率为(0.040+0.025)×10=0.650,故这20位工人中一天生产该产品数量在[55,75)内的人数是20×0.650=13.答案:138.某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩低于60分的学生人数.解:由频率分布直方图易得,成绩低于60分的频率为0.002×10+0.006×10+0.012×10=0.2,故推测这3 000名学生中成绩低于60分的学生人数为3 000×0.2=600.9.100名学生在一次百米测试中,成绩全部介于13 s与19 s之间(含13 s且不含19 s),将测试结果按如下方式分成六组:第一组,成绩大于等于13 s且小于14 s;第二组,成绩大于等于14 s且小于15 s;……;第六组,成绩大于等于18 s且小于19 s.如图是按上述分组方法得到的频率分布直方图的一部分.(1)求成绩大于等于13 s且小于14 s的频率,并补全这个频率分布直方图;(2)规定成绩在[13,14)内为优秀,成绩在[13,18)内为合格,成绩在[18,19)内为不合格,求这100名同学在这次百米测试中的优秀人数、合格人数和不合格人数.解:(1)组距为1,设成绩在[13,14)范围内的频率为x,则x+0.02+0.06+0.18+0.34+0.36=1,所以x=0.04.补全的频率分布直方图如图所示.(2)成绩在[13,14),[13,18),[18,19)内的频率分别为0.04,0.04+0.34+0.36+0.18+0.06=0.98,0.02,所以优秀人数为0.04×100=4,合格人数为0.98×100=98,不合格人数为0.02×100=2.10.对某种电子元件进行寿命追踪调查,结果如下:(1)(2)画出频率分布直方图;(3)估计电子元件寿命在[100,400)内的频率;(4)估计电子元件寿命在400 h以上(包括400 h)的频率.解:(1)频率分布表如下:(2)频率分布直方图如图所示.(3)由频率分布表可知,估计寿命在[100,400)内的电子元件出现的频率为0.10+0.15+0.40=0.65.(4)由频率分布表可知,寿命在400 h以上(包括400 h)的电子元件出现的频率为0.20+0.15=0.35.故我们估计电子元件寿命在400 h以上(包括400 h)的频率为0.35.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§5用样本估计总体
5.1估计总体的分布
课时过关·能力提升
1.“样本的频率分布”与“相应的总体分布”的关系是()
A.“样本的频率分布”与“相应的总体分布”是同样的分布
B.“样本的频率分布”与“相应的总体分布”是互不相关的两种分布
C.“样本的频率分布”将随着样本容量的增大更加接近“总体分布”
D.“样本的频率分布”的样本容量增大到某一定值时就变成了“总体分布”
答案:C
2.容量为100
A.14和0.14
B.0.14和14
C和
D和
答案:A
3.已知一个容量为()
A.0.70
C.0.50
D.0.20
解析:根据频率分布的概念,样本落在区间[1,5)内的频数为7,则样本落在区间[1,5)内的频率为0.70,故选A.
答案:A
4.某商场在庆元宵促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为()
A.6万元
B.8万元
C.10万元
D.12万元
解析:总销售额为.
.万元),故11时至12时的销售额为0.4×25=10(万元).
答案:C
5.如图是一次数学考试结果的频率分布直方图,若规定60分以上(含60分)为考试合格,则这次考试的合格率为.
解析:由频率分布直方图可得考试的合格率为(0.024+0.012)×20=0.72=72%.
答案:72%
6. 一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人做进一步调查,则月收入在[2 500,3 000)(单位:元)段应抽出人.
解析:因为月收入在[2 500,3 000)段的频率为0.000 5×500=0.25,所以应抽出100×0.25=25(人).
答案:25
7.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95],由此得到频率分布直方图如图所示,则这20位工人中一天生产该产品数量在[55,75)内的人数是.
解析:由频率分布直方图可知,组距为10,所以该产品数量在[55,75)内的频率为
(0.040+0.025)×10=0.650,故这20位工人中一天生产该产品数量在[55,75)内的人数是20×0.650=13.答案:13
8.某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩低于60分的学生人数.
解:由频率分布直方图易得,成绩低于60分的频率为0.002×10+0.006×10+0.012×10=0.2,故推测这3 000名学生中成绩低于60分的学生人数为3 000×0.2=600.
9.100名学生在一次百米测试中,成绩全部介于13 s与19 s之间(含13 s且不含19 s),将测试结果按如下方式分成六组:第一组,成绩大于等于13 s且小于14 s;第二组,成绩大于等于14 s且小于15 s;……;第六组,成绩大于等于18 s且小于19 s.如图是按上述分组方法得到的频率分布直方图的一部分.
(1)求成绩大于等于13 s且小于14 s的频率,并补全这个频率分布直方图;
(2)规定成绩在[13,14)内为优秀,成绩在[13,18)内为合格,成绩在[18,19)内为不合格,求这100名同学在这次百米测试中的优秀人数、合格人数和不合格人数.
解:(1)组距为1,设成绩在[13,14)范围内的频率为x,则x+0.02+0.06+0.18+0.34+0.36=1,所以x=0.04.补全的频率分布直方图如图所示.
(2)成绩在[13,14),[13,18),[18,19)内的频率分别为0.04,0.04+0.34+0.36+0.18+0.06=0.98,0.02,
所以优秀人数为0.04×100=4,合格人数为0.98×100=98,不合格人数为0.02×100=2.
10.
(1)
(2)画出频率分布直方图;
(3)估计电子元件寿命在[100,400)内的频率;
(4)估计电子元件寿命在400 h以上(包括400 h)的频率.
解:(1)频率分布表如下:
(2)
(3)由频率分布表可知,估计寿命在[100,400)内的电子元件出现的频率为0.10+0.15+0.40=0.65.
(4)由频率分布表可知,寿命在400 h以上(包括400 h)的电子元件出现的频率为0.20+0.15=0.35.故我们估计电子元件寿命在400 h以上(包括400 h)的频率为0.35.。