2018秋新版高中数学北师大版必修3习题:第一章统计 检测
北师大版高中数学必修3第1章《平均数、中位数、众数、极差、方差、标准差》练习
学业分层测评(建议用时:45分钟)[学业达标]一、选择题1.下列说法正确的是( )A .在两组数据中,平均值较大的一组方差较大B .平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小C .方差的求法是求出各个数据与平均值的差的平方后再求和D .在记录两个人射击环数的两组数据中,方差大的表示射击水平高 【解析】 平均值的大小与方差的大小无任何联系,故A 错,由方差的公式s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]知C 错.对于D ,方差大的表示其射击环数比较分散,而非射击水平高,故D 错.【答案】 B2.一个样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,其中位数为22,则x 为 ( )A .21B .22C .20D .23【解析】 由中位数的概念知x +232=22,所以x =21. 【答案】 A3.(2016·长沙四校联考)为了了解某同学的数学学习情况,对他的6次数学测试成绩(满分100分)进行统计,作出的茎叶图如图1-4-3所示,则下列关于该同学数学成绩的说法正确的是( )图1-4-3A .中位数为83B .众数为85C .平均数为85D .方差为19【解析】易知该同学的6次数学测试成绩的中位数为84,众数为83,平均数为85.【答案】 C4.为了了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高为1.60 m;从南方抽取了200个男孩,平均身高为1.50 m.由此可推断我国13岁男孩的平均身高为()A.1.54 m B.1.55 mC.1.56 m D.1.57 m【解析】x=300×1.60+200×1.50300+200=1.56(m).【答案】 C5.为了普及环保知识,增强环境意识,某大学随机抽取30名学生参加环保知识测试,得分(10分制)如图1-4-4所示,假设得分值的中位数为m e,众数为m0,平均值为x,则()图1-4-4A.m e=m0=xB.m e=m0<xC.m e<m0<xD.m0<m e<x【解析】由图知30名学生的得分情况依次为2个人得3分,3个人得4分、10个人得5分、6个人得6分、3个人得7分,2个人得8分、2个人得9分、2个人得10分,中位数为第15、16个数的平均数,即m e=5+62=5.5,5出现次数最多,故m0=5.x=130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97.于是m 0<m e <x . 【答案】 D 二、填空题6.某年级举行校园歌曲演唱比赛,七位评委为学生甲打出的演唱分数的茎叶图如右图1-4-5所示,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为________.图1-4-5【解析】 由茎叶图可知,学生甲的演唱分数分别为79,83,84,86,84,88,93,去掉一个最高分和一个最低分后,得分如下:83,84,84,86,88,则平均数为85,方差为s 2=15×[(-2)2+(-1)2+(-1)2+12+32]=3.2.【答案】 85,3.27.一组数据的方差为s 2,将这一组数据中的每个数都乘2,所得到的一组新数据的方差为________.【解析】 每个数都乘以2,则x =2x , S =1n [(2x 1-2x )2+…+(2x n -2x )2] =4n [(x 1-x )2+…+(x n -x )2]=4s 2. 【答案】 4s 28.由正整数组成的一组数据x 1,x 2,x 3,x 4其平均数和中位数都是2,且标准差等于1,则这组数据为________(从小到大排列).【解析】 不妨设x 1≤x 2≤x 3≤x 4且x 1,x 2,x 3,x 4为正整数. 由条件知⎩⎪⎨⎪⎧x 1+x 2+x 3+x 44=2,x 2+x 32=2,即⎩⎨⎧x 1+x 2+x 3+x 4=8,x 2+x 3=4,又x1、x2、x3、x4为正整数,∴x1=x2=x3=x4=2或x1=1,x2=x3=2,x4=3或x1=x2=1,x3=x4=3. ∵s=1 4[](x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2=1,∴x1=x2=1,x3=x4=3.由此可得4个数分别为1,1,3,3.【答案】1,1,3,3三、解答题9.为了了解市民的环保意识,某校高一(1)班50名学生在6月5日(世界环境日)这一天调查了各自家庭丢弃旧塑料袋的情况,有关数据如下表:(1)求这50(2)求这50户居民每天丢弃旧塑料袋的标准差.【解】(1)平均数x=150×(2×6+3×16+4×15+5×13)=18550=3.7.众数是3,中位数是4.(2)这50户居民每天丢弃旧塑料袋的方差为s2=150×[6×(2-3.7)2+16×(3-3.7)2+15×(4-3.7)2+13×(5-3.7)2]=150×48.5=0.97.所以标准差s≈0.985.10.(2014·广东高考)某车间20名工人年龄数据如下表:(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图; (3)求这20名工人年龄的方差.【解】 (1)这20名工人年龄的众数为:30;这20名工人年龄的极差为:40-19=21.(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图如下:(3)这20名工人年龄的平均数为:(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30;所以这20名工人年龄的方差为:120(30-19)2+320(30-28)2+320(30-29)2+520(30-30)2+420(30-31)2+320(30-32)2+120(30-40)2=12.6.[能力提升]1.(2015·山东高考)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图1-4-5所示的茎叶图.考虑以下结论:图1-4-5①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的平均气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的平均气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的序号为()A.①③B.①④C.②③D.②④【解析】甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论①④正确,故选B.【答案】 B2.对“小康县”的经济评价标准:①年人均收入不小于7 000元;②年人均食品支出不大于收入的35%.某县有40万人口,年人均收入如下表所示,年人均食品支出如图1-4-6所示.则该县()图1-4-6A.是小康县B.达到标准①,未达到标准②,不是小康县C.达到标准②,未达到标准①,不是小康县D.两个标准都未达到,不是小康县【解析】 由图表可知年人均收入为(2 000×3+4 000×5+6 000×5+8 000×6+10 000×7+12 000×5+16 000×3)÷40=7 050(元)>7 000元,达到了标准①;年人均食品支出为(1 400×3+2 000×5+2 400×13+3 000×10+3 600×9)÷40=2 695(元),则年人均食品支出占收入的2 6957 050×100%≈38.2%>35%,未达到标准②.所以不是小康县.【答案】 B3.已知样本9,10,11,x ,y 的平均数为10,方差为4,则xy =________. 【解析】 由题意得⎩⎪⎨⎪⎧9+10+11+x +y5=10,15[(9-10)2+(10-10)2+(11-10)2+(x -10)2+(y -10)2]=4.化简得x +y =20, ① (x -10)2+(y -10)2=18, ② 由①得x 2+y 2+2xy =400, ③ 代入②化简得xy =91. 【答案】 914.某校甲班、乙班各有49名学生,两班在一次数学测验中的成绩(满分100分)统计如下表:(1)甲班的小刚回家对妈妈说:“昨天的数学测验,全班平均79分,得70分的人最多,我得了85分,在班里算是上游了!”(2)请你根据表中数据,对这两个班的测验情况进行简要分析,并提出教学建议.【解】 (1)由中位数可知,85分排在第25名之后,从名次上讲,85分不算是上游.但也不能单以名次来判断学习成绩的好坏,小刚得了85分,说明他对本阶段的学习内容掌握较好.(2)甲班学生成绩的中位数为87分,说明高于或等于87分的学生占一半以上,而平均分为79分,标准差很大,说明低分也多,两极分化严重,建议对学习有困难的同学多给一些帮助;乙班学生成绩的中位数和平均分均为79分,标准差小,说明学生成绩之间差别较小,成绩很差的学生少,但成绩优异的学生也很少,建议采取措施提高优秀率.。
北师大版高中数学必修三第一章《统计》测试卷(包含答案解析)(1)
一、选择题1.某班统计一次数学测验的平均分与方差,计算完毕才发现有位同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( )A .1x x =,221s s = B .1x x =,221s s < C .1x x =,221s s >D .1x x <,221s s =2.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,83.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18554.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差D .极差5.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( )A .26B .27C .28D .296. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日7.下图是某公司2018年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是( )A .2018年3月的销售任务是400台B .2018年月销售任务的平均值不超过600台C .2018年第一季度总销售量为830台D .2018年月销售量最大的是6月份 8.①45化为二进制数为(2)101101;②一个总体含有1000个个体(编号为0000,0001,…,0999),采用系统抽样从中抽取一个容量为50的样本,若第一个抽取的编号为0008,则第六个编号为0128; ③已知a ,b ,c 为ABC ∆三个内角A ,B ,C 的对边,其中3a =,4c =,6A π=,则这样的三角形有两个解.以上说法正确的个数是( ) A .0B .1C .2D .39.汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,下图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况. 下列叙述中正确的是( )A.消耗1升汽油,乙车最多可行驶5千米B.以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多C.甲车以80千米/小时的速度行驶1小时,消耗10升汽油D.某城市机动车最高限速80千米/小时. 相同条件下,在该市用丙车比用乙车更省油10.已知x,y的取值如表:x 2678y若x,y之间是线性相关,且线性回归直线方程为,则实数a的值是A.B.C.D.11.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为A.12 B.14 C.16 D.1812.从存放号码分别为1,2, ,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是()A.0.53 B.0.5 C.0.47 D.0.37二、填空题13.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____14.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..15.已知数据(1,2,3,4,5)i x i =的平均值为a ,数列2{()}i x a -为等差数列,且3||0.1x a -=________.16.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.17.某公司的广告费支出x 与销售额y (单位:万元)之间有下列对应数据:由资料显示y 对x 呈线性相关关系。
北师大版高中数学必修3课后习题答案
第一章 算法初步 1.1算法与程序框图练习(P5) 1、算法步骤:第一步,给定一个正实数r .第二步,计算以r 为半径的圆的面积2S r π=.第三步,得到圆的面积S .2、算法步骤:第一步,给定一个大于1的正整数n .第二步,令1i =.第三步,用i 除n ,等到余数r .第四步,判断“0r =”是否成立. 若是,则i 是n 的因数;否则,i 不是n 的因数.第五步,使i 的值增加1,仍用i 表示.第六步,判断“i n >”是否成立. 若是,则结束算法;否则,返回第三步.练习(P19)算法步骤:第一步,给定精确度d ,令1i =.第二步,i 位的不足近似值,赋给a ;小数点后第i 位的过剩近似值,赋给b . 第三步,计算55bam =-.第四步,若m d <,则得到5a;否则,将i 的值增加1,仍用i 表示.返回第二步. 第五步,输出5a.程序框图:习题1.1 A 组(P20)1、下面是关于城市居民生活用水收费的问题.为了加强居民的节水意识,某市制订了以下生活用水收费标准:每户每月用水未超过7 m 3时,每立方米收费1.0元,并加收0.2元的城市污水处理费;超过7m 3的部分,每立方收费1.5元,并加收0.4元的城市污水处理费. 设某户每月用水量为x m 3,应交纳水费y 元,那么y 与x 之间的函数关系为 1.2,071.9 4.9,7x x y x x ≤≤⎧=⎨->⎩我们设计一个算法来求上述分段函数的值.算法步骤:第一步:输入用户每月用水量x .第二步:判断输入的x 是否不超过7. 若是,则计算 1.2y x =;若不是,则计算 1.9 4.9y x =-.第三步:输出用户应交纳的水费y .程序框图:2、算法步骤:第一步,令i =1,S=0.第二步:若i ≤100成立,则执行第三步;否则输出S. 第三步:计算S=S+i 2.第四步:i = i +1,返回第二步.程序框图:3、算法步骤:第一步,输入人数x ,设收取的卫生费为m 元.第二步:判断x 与3的大小. 若x >3,则费用为5(3) 1.2m x =+-⨯;若x ≤3,则费用为5m =.第三步:输出m .程序框图:B 组 1、算法步骤:第一步,输入111222,,,,,a b c a b c ..第二步:计算21121221b c b c x a b a b -=-.第三步:计算12211221a c a c y ab a b -=-.第四步:输出,x y .程序框图:2、算法步骤:第一步,令n=1第二步:输入一个成绩r,判断r与6.8的大小. 若r≥6.8,则执行下一步;若r<6.8,则输出r,并执行下一步.第三步:使n的值增加1,仍用n表示.第四步:判断n与成绩个数9的大小. 若n≤9,则返回第二步;若n>9,则结束算法.程序框图:说明:本题在循环结构的循环体中包含了一个条件结构.1.2基本算法语句练习(P24) 123练习(P29) 12、本程序的运行过程为:输入整数x . 若x 是满足9<x <100的两位整数,则先取出x 的十位,记作a ,再取出x 的个位,记作b ,把a ,b 调换位置,分别作两位数的个位数与十位数,然后输出新的两位数. 如输入25,则输出52. 34、4练习(P32)12习题1.2 A组(P33)1、1(0)0(0)1(0)x xy xx x-+<⎧⎪==⎨⎪+>⎩23、程序:习题1.2 B组(P33)1、程序:23、 4、1.3算法案例 练习(P45) 1、(1)45; (2)98; (3)24; (4)17. 2、2881.75.3、2200811111011000=() ,820083730=() 习题1.3 A 组(P48) 1、(1)57; (2)55. 2、21324.3、(1)104; (2)7212() (3)1278; (4)6315().4、习题1.3 B 组(P48)1、算法步骤:第一步,令45n =,1i =,0a =,0b =,0c =.第二步,输入()a i .第三步,判断是否0()60a i ≤<. 若是,则1a a =+,并执行第六步. 第四步,判断是否60()80a i ≤<. 若是,则1b b =+,并执行第六步. 第五步,判断是否80()100a i ≤≤. 若是,则1c c =+,并执行第六步. 第六步,1i i =+. 判断是否45i ≤. 若是,则返回第二步.第七步,输出成绩分别在区间[0,60),[60,80),[80,100]的人数,,a b c .2、如“出入相补”——计算面积的方法,“垛积术”——高阶等差数列的求和方法,等等.第二章复习参考题A组(P50)1、(1)程序框图:程序:1、(2)程序框图:程序:INPUT “x=”;x IF x<0 THENy=0ELSEIF x<1 THENy=1ELSEy=xEND IFEND IFPRINT “y=”;y ENDINPUT “x=”;x IF x<0 THENy=(x+2)^2 ELSEIF x=0 THENy=4ELSEy=(x-2)^2 END IFEND IFPRINT “y=”;y END2、见习题1.2 B组第1题解答. 34、程序框图: 程序:5、 (1)向下的运动共经过约199.805 m (2)第10次着地后反弹约0.098 m (3)全程共经过约299.609 m 第二章 复习参考题B 组(P35)1、 2、 INPUT “n=”;n i=1 S=0WHILE i<=n S=S+1/i i=i+1 WENDPRINT “S=”;S ENDi=100 sum=0 k=1 WHILE k<=10 sum=sum+i i=i /2 k=k+1 WEND PRINT “(1)”;sum PRINT “(2)”;i PRINT “(3)”;2*sum -100 ENDINPUT “n=”;n IF n MOD 7=0 THENPRINT “Sunday ”3、算法步骤:第一步,输入一个正整数x 和它的位数n . 第二步,判断n 是不是偶数,如果n 是偶数,令2nm =;如果n 是奇数,令12n m -=. 第三步,令1i =第四步,判断x 的第i 位与第(1)n i +-位上的数字是否相等. 若是,则使i 的值增加1,仍用i 表示;否则,x 不是回文数,结束算法.第五步,判断“i m >”是否成立. 若是,则n 是回文数,结束算法;否则,返回第四步.第二章 统计 2.1随机抽样 练习(P57)抽样调查的好处是可以节省人力、物力和财力,可能出现的问题是推断的结果与实际情况之间有误差. 如抽取的部分个体不能很好地代表总体,那么我们分析出的结果就会有偏差.2、(1)抽签法:对高一年级全体学生450人进行编号,将学生的名字和对应的编号分别写在卡片上,并把450张卡片放入一个容器中,搅拌均匀后,每次不放回地从中抽取一张卡片,连续抽取50次,就得到参加这项活动的50名学生的编号.(2)随机数表法:第一步,先将450名学生编号,可以编为000,001, (449)第二步,在随机数表中任选一个数. 例如选出第7行第5列的数1(为了便于说明,下面摘取了附表的第6~10行).16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 6484 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 5457 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28第三步,从选定的数1开始向右读,得到一个三位数175,由于175<450,说明号码175在总体内,将它取出;继续向右读,得到331,由于331<450,说明号码331在总体内,将它取出;继续向右读,得到572,由于572>450,将它去掉. 按照这种方法继续向右读,依次下去,直到样本的50个号码全部取出,这样我们就得到了参加这项活动的50名学生.3、用抽签法抽取样本的例子:为检查某班同学的学习情况,可用抽签法取出容量为5的样本. 用随机数表法抽取样本的例子:部分学生的心理调查等.抽签法能够保证总体中任何个体都以相同的机会被选到样本之中,因此保证了样本的代表性.4、与抽签法相比,随机数表法抽取样本的主要优点是节省人力、物力、财力和时间,缺点是所产生的样本不是真正的简单样本.练习(P59)1、系统抽样的优点是:(1)简便易行;(2)当对总体结构有一定了解时,充分利用已有信息对总体中的个体进行排队后再抽样,可提高抽样调查;(3)当总体中的个体存在一种自然编号(如生产线上产品的质量控制)时,便于施行系统抽样法.系统抽样的缺点是:在不了解样本总体的情况下,所抽出的样本可能有一定的偏差.2、(1)对这118名教师进行编号;(2)计算间隔1187.37516k==,由于k不是一个整数,我们从总体中随机剔除6个样本,再来进行系统抽样. 例如我们随机剔除了3,46,59,57,112,93这6名教师,然后再对剩余的112位教师进行编号,计算间隔7k=;(3)在1~7之间随机选取一个数字,例如选5,将5加上间隔7得到第2个个体编号12,再加7得到第3个个体编号19,依次进行下去,直到获取整个样本.3、由于身份证(18位)的倒数第二位表示性别,后三位是632的观众全部都是男性,所以这样获得的调查结果不能代表女性观众的意见,因此缺乏代表性.练习(P62)1、略2、这种说法有道理,因为一个好的抽样方法应该能够保证随着样本容量的增加,抽样调查结果会接近于普查的结果. 因此只要根据误差的要求取相应容量的样本进行调查,就可以节省人力、物力和财力.3、可以用分层抽样的方法进行抽样. 将麦田按照气候、土质、田间管理水平的不同而分成不同的层,然后按照各层麦田的面积比例及样本容量确定各层抽取的面积,再在各层中抽取个体(这里的个体是单位面积的一块地). 习题2.1 A 组(P63)1、产生随机样本的困难:(1)很难确定总体中所有个体的数目,例如调查对象是生产线上生产的产品. (2)成本高,要产生真正的简单随机样本,需要利用类似于抽签法中的抽签试验来产生非负整值随机数.(3)耗时多,产生非负整数值随机数和从总体中挑选出随机数所对的个体都需要时间.2、调查的总体是所有可能看电视的人群.学生A 的设计方案考虑的人数是:上网而且登录某网址的人群,那些不能上网的人群,或者不登录某网址的人群就被排除在外了. 因此A 方案抽取的样本的代表性差.学生B 的设计方案考虑的人群是小区内的居民,有一定的片面性. 因此B 方案抽取的样本的代表性差.学生C 的设计方案考虑的人群是那些有电话的人群,也有一定的片面性. 因此C 方案抽取的样本的代表性.所以,这三种调查方案都有一定的片面性,不能得到比较准确的收视率. 3、(1)因为各个年级学习任务和学生年龄等因素的不同,影响各年级学生对学生活动的看法,所以按年级分层进行抽样调查,可以得到更有代表性的样本.(2)在抽样的过程中可能遇到的问题如敏感性问题:有些学生担心提出意见对自己不利;又如不响应问题:由于种种原因,有些学生不能发表意见;等等. (3)前面列举的两个问题都可能导致样本的统计推断结果的误差.(4)为解决敏感性问题,可以采用阅读与思考栏目“如何得到敏感性问题的诚实反应”中的方法设计调查问卷;为解决不响应问题,可以事先向全体学生宣传调查的意义,并安排专人负责发放和催收调查问卷,最大程度地回收有效调查问卷. 4、将每一天看作一个个体,则总体由365天组成. 假设要抽取50个样本,将一年中的各天按先后次序编号为0~364天用简单随机抽样设计方案:制作365个号签,依次标上0~364. 将号签放到容器内充分搅拌均匀,从容器中任意不放回取出50个号签. 以签上的号码所对应的那些天构成样本,检测样本中所有个体的空气质量. 用系统抽样设计抽样方案:先通过简单随机抽样方法从365天中随机抽出15天,再把剩下的350天重新按先后次序编号为0~349. 制作7个分别标有0~7的号签,放在容器中充分搅拌均匀. 从容器中任意取出一个号签,设取出的号签的编号为a ,则编号为7(050)a k k +≤<所对应的那些天构成样本,检测样本中所有个体的空气质量.显然,系统抽样方案抽出的样本中个体在一年中排列的次序更规律,因此更好实施,更受方案的实施者欢迎.5、田径队运动员的总人数是564298+=(人),要得到28人的样本,占总体的比例为27.于是,应该在男运动员中随机抽取256167⨯=(人),在女运动员中随机抽取281612-=(人).这样我们就可以得到一个容量为28的样本.6、以10为分段间隔,首先在1~10的编号中,随机地选取一个编号,如6,那么这个获奖者奖品的编号是:6,16,26,36,46.7、说明:可以按年级分层抽样的方法设计方案. 习题2.1 B 组(P64)1、说明:可以按年级分层抽样的方法设计方案,调查问卷由学生所关心的问题组成.例如:(1)你最喜欢哪一门课程? (2)你每月的零花钱平均是多少? (3)你最喜欢看《新闻联播》吗? (4)你每天早上几点起床? (5)你每天晚上几点睡觉?要根据统计的结果和具体的情况解释结论,主要从引起结论的可能原因及结论本身含义来解释.2、说明:这是一个开放性的题目,没有一个标准的答案. 2.2用样本估计总体 练习(P71)1、说明:由于样本的极差为364.41362.51 1.90-=,取组距为0.19,将样本分为10组. 可以按照书上的方法制作频率分布表、频率分布直观图和频率折线图.2、说明:此题目属于应用题,没有标准的答案.3、茎叶图为:由该图可以看出30名工人的日加工零件个数稳定在120件左右. 练习(P74)这里应该采用平均数来表示每一个国家项目的平均金额,因为它能反应所有项目的信息. 但平均数会受到极端数据2000万元的影响,所以大多数项目投资金额都和平均数相差比较大. 练习(P79)1、甲乙两种水稻6年平均产量的平均数都是900,但甲的标准差约等于23.8,乙的标准差约等于41.6,所以甲的产量比较稳定.2、(1)平均重量496.86x ≈,标准差 6.55s ≈.(2)重量位于(,)x s x s -+之间有14袋白糖,所占的百分比约为66.67%. 3、(1)略. (2)平均分19.25x ≈,中位数为15.2,标准差12.50s ≈.这些数据表明这些国家男性患该病的平均死亡率约为19.25,有一半国家的死亡率不超过15.2,15.2x >说明存在大的异常数据,值得关注. 这些异常数据使标准差增大. 习题2.2 A 组(P81)。
(压轴题)高中数学必修三第一章《统计》测试题(有答案解析)(1)
一、选择题1.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元2.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,83.已知变量x ,y 的关系可以用模型kx y ce =拟合,设ln z y =,其变换后得到一组数据下:x 16 17 18 19 z50344131由上表可得线性回归方程4z x a =-+,则( ) A .4-B .4e -C .109D .109e4.如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,苹果销量约占20%,三星销量约占30%).根据该图,以下结论中一定正确的是( )A .华为的全年销量最大B .苹果第二季度的销量大于第三季度的销量C .华为销量最大的是第四季度D .三星销量最小的是第四季度5.有一个容量为200的样本,样本数据分组为[50,70),[70,90),[90,110),[110,130),[130,150),其频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在区间[90,110)内的频数为( )A .48B .60C .64D .726.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是( )A .45B .47C .48D .637.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795B .0780C .0810D .08158.如图是两组各7名同学体重(单位:kg )数据的茎叶图,设1、2两组数据的平均数依次为1x 和2x ,标准差依次为12s s 、,那么( )(注:标准差222121[()()...()]n s x x x x x x n=-+-++-A .1212,x x s s >>B .1212,x x s s ><C .1212,x x s s <<D .1212,x x s s9.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )A .2,5B .5,5C .5,8D .8,810.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数( )A .40B .45C .48D .5011.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位 D .y 平均减少2个单位12.已知一组数据12,,,n x x x 的平均数3x =,则数据1232,32,,32n x x x +++的平均数为( ) A .3B .5C .9D .11二、填空题13.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高[)120130,,[)130140,,[]140,150三组内的学生中,用分层抽样的方法抽取18人参加一项活动,则从身高在[]140,150内的学生中抽取的人数应为________.14.随机抽取100名年龄在[10,20),[20,30),…,[50,60)年龄段的市民进行问卷调查,由此得到样本的频率分布直方图如图所示.从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人,则在[50,60)年龄段抽取的人数为______.15.某市有A 、B 、C 三所学校,各校有高三文科学生分别为650人,500人,350人,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B 校学生中抽取______人. 16.给出下列命题:①若函数()y f x =满足(1)(1)f x f x -=+,则函数()f x 的图象关于直线1x =对称; ②点(2,1)关于直线10x y -+=的对称点为(0,3);③通过回归方程y bx a =+可以估计和观测变量的取值和变化趋势;④正弦函数是奇函数,2()sin(1)f x x =+是正弦函数,所以2()sin(1)f x x =+是奇函数,上述推理错误的原因是大前提不正确. 其中真命题的序号是__________. 17.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,若变量x 增加一个单位时,则y 平均增加5个单位; ③线性回归方程^^^y b x a =+所在直线必过(),x y ; ④曲线上的点与该点的坐标之间具有相关关系;⑤在一个22⨯列联表中,由计算得213.079K =,则其两个变量之间有关系的可能性是0090.其中错误的是________.18.某学校高一年级男生人数占该年级学生人数的45%,在一次考试中,男、女生平均分数依次为72、74,则这次考试该年级学生的平均分数为__________.19.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组没有疗效的有6人,则第三组中有疗效的人数为__________.20.为弘扬我国优秀的传统文化,某小学六年级从甲、乙两个班各选出7名学生参加成语知识竞赛,他们取得的成绩的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则的值为__________.三、解答题21.某大学生利用寒假参加社会实践,对机械销售公司7月份至12月份销售某种机械配件的销售量及销售单价进行了调查,销售单价x 和销售量y 之间的一组数据如表所示:月份i 7 8 9 10 11 12 销售单价i x (元) 9 9.5 10 10.5 11 8.5 销售量i y (元)111086514y x (2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过2件,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?(3)预计在今后的销售中,销售量与销售单价仍然服从(1)中的关系,若该种机器配件的成本是2.5元/件,那么该配件的销售单价应定为多元才能获得最大利润?(注:利润=销售收入-成本). 参考数据:51392i ii x y==∑,521502.5i i x ==∑.参考公式:回归直线方程ˆˆˆybx a =+,其中1221ˆni ii nii x y nx yb xnx ==-=-∑∑,ˆˆay bx =-. 22.我国北方广大农村地区、一些城镇以及部分大中城市的周边区域,还在大量采用分散燃煤和散烧煤取暖,既影响了居民基本生活的改善,也加重了北方地区冬季的雾霾天气.推进北方地区冬季清洁取暖,是重大民生工程、民心工程,关系北方地区广大群众温暖过冬,关系雾霾天能不能减少,是能源生产和消费革命、农村生活方式革命的重要内容.2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改电用户大幅度增加,下面条形图反映了某省2018年1~7月份煤改气、煤改电的用户数量.(1)在给定坐标系中作出煤改气、煤改电用户数量y 随月份t 变化的散点图,并用散点图和相关系数说明y 与t 之间具有线性相关性;(2)建立y 关于t 的回归方程(系数精确到0.01),预测11月份该省煤改气、煤改电的用户数量.参考数据:7772111y9.24,t39.75,0.53,7 2.646i i ii i iiy=====⋅≈≈∑∑∑(y-y).参考公式:相关系数()()()()()()11112211,ni i n n nii i i i in ni i ii ii it t y yr t t y y t y t yt t y y======⋅--=⋅--=-⋅-⋅-∑∑∑∑∑∑.回归方程ˆy a bt=+中斜率和截距的最小二乘估计公式分别为:()()()121ˆˆˆ,ni iiniit t y yb a y btt t==⋅--==-⋅-∑∑.23.某城市100户居民的月平均用水量(单位:吨),以[0,2)[2,4)[4,6)[6,8)[8,10)[10,12)[12,14)分组的频率分布直方图如图.(1)求直方图中x的值;并估计出月平均用水量的众数.(2)求月平均用水量的中位数及平均数;(3)在月平均用水量为[6,8),[8,10),[10,12),[12,14)的四组用户中,用分层抽样的方法抽取22户居民,则应在[10,12)这一组的用户中抽取多少户?(4)在第(3)问抽取的样本中,从[10,12)[12,14)这两组中再随机抽取2户,深入调查,则所抽取的两户不是来自同一个组的概率是多少?24.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x(分钟)时刻的细菌个数为y个,统计结果如下:x12345y23445(Ⅰ)在给出的坐标系中画出x,y的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y关于x的回归直线方程ˆˆˆy bx a=+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni iiniix y nx yx naxb y bx====---∑∑)25.为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2017年种植的一批试验紫甘薯在温度升高时6组死亡的株数:温度(单位:C︒)212324272932死亡数y(单位:株)61120275777经计算:611266iix x===∑,611336iiy y===∑,()()61557i iix x y y=--=∑,()62184iix x=-=∑,()6213930iiy y=-=∑,()621ˆ236.64iiy y=-=∑,8.0653167e≈,其中ix,iy分别为试验数据中的温度和死亡株数,1,2,3,4,5,6i=.(1)若用线性回归模型,求y关于x的回归方程ˆˆˆy bx a=+(结果精确到0.1);(2)若用非线性回归模型求得y关于x的回归方程0.2303ˆ0.06xy e=,且相关指数为20.9522R =.(i )试与(1)中的回归模型相比,用2R 说明哪种模型的拟合效果更好; (ii )用拟合效果好的模型预测温度为35C ︒时该紫甘薯死亡株数(结果取整数). 附:对于一组数据()11,u v ,()22,u v ,,(),n n u v ,其回归直线ˆˆˆvu αβ=+的斜率和截距的最小二乘估计分别为:()()()121ˆnii i nii uu v v uu β==--=-∑∑,ˆˆav u β=-;相关指数为:()()22121ˆ1ni i i niii v vR v v ==-=--∑∑.26.某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x ,已知这10个分数的平均数90x =,标准差6s =,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:221nii xnx s n=-=∑(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.2.D解析:D 【分析】根据平均数的性质,方差的性质直接运算可得结果. 【详解】令23(1,2,,5)i i y x i =-=1234555x x x x x x ++++==,1234523232323232310375x x x x x y x -+-+-+-+-∴==-=-=,(也可()(23)2()32537E y E x E x =-=-=⨯-=) ()()()2y 232428D D x D x =-==⨯=故选:D 【点睛】本题主要考查方差及平均值的性质的简单应用,属于中档题.3.D解析:D由已知求得x 与z 的值,代入线性回归方程求得a ,再由kxy ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+,结合z lny =,得z lnc kx =+,则109lnc =,由此求得c 值.【详解】 解:1617181917.54x +++==,50344131394z +++==. 代入4z x a =-+,得39417.5a =-⨯+,则109a =.∴4109z x =-+,由kx y ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+, 令z lny =,则z lnc kx =+,109lnc ∴=,则109c e =. 故选:D . 【点睛】本题考查回归方程的求法,考查数学转化思想方法,考查计算能力,属于中档题.4.A解析:A 【分析】根据图象即可看出,华为在每个季度的销量都最大,从而得出华为的全年销量最大,从而得出A 正确;由于不知每个季度的销量多少,从而苹果、华为和三星在哪个季度的销量大或小是没法判断的,从而得出选项B ,C ,D 都错误. 【详解】根据图象可看出,华为在每个季度的销量都最大,所以华为的全年销量最大;每个季度的销量不知道,根据每个季度的百分比是不能比较苹果在第二季度和第三季度销量多少的,同样不能判断华为在哪个季度销量最大,三星在哪个季度销量最小;B ∴,C ,D 都错误,故选A .【点睛】本题主要考查对销量百分比堆积图的理解.5.B解析:B 【分析】由(0.00500.00750.01000.0125)201a ++++⨯=,求出a ,计算出数据落在区间[90,110)内的频率,即可求解.【详解】由(0.00500.00750.01000.0125)201a ++++⨯=, 解得0.015a =,所以数据落在区间[90,110)内的频率为0.015200.3⨯=, 所以数据落在区间[90,110)内的频数2000.360⨯=,【点睛】本题主要考查了频率分布直方图,频率、频数,属于中档题.6.A解析:A 【解析】 【分析】由茎叶图确定所给的所有数据,然后确定中位数即可. 【详解】各数据为:12 20 31 32 34 45 45 45 47 47 48 50 50 61 63, 最中间的数为:45,所以,中位数为45. 本题选择A 选项. 【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.7.A解析:A 【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为10002050= 所以抽取的第40个数为1520(401)795+⨯-=选A.点睛:本题考查系统抽样概念,考查基本求解能力.8.C解析:C 【分析】由茎叶图分别计算出两组数的平均数和标准差,然后比较大小 【详解】读取茎叶图得到两组数据分别为: (1)53565758617072,,,,,, (2)54565860617273,,,,,,()()11503678112022617x kg =+⨯++++++=,()()215046810112223627x kg =+⨯++++++=,1s ==,2s == 则1212,x x s s << 故选C 【点睛】本题给出茎叶图,需要求出数据的平均数和方差,着重考查了茎叶图的认识,样本特征数的计算等知识,属于基础题.9.C解析:C 【解析】试题分析:由题意得5x =,116.8(915101824)85y y =+++++⇒=,选C. 考点:茎叶图10.C解析:C 【分析】根据频数关系,求出前三段每段的频数,由直方图求出四五组的频率,进而求出前三组的频率和,从而可求该校报名学生的总人数. 【详解】从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,∴从左到右3个小组的频数分别为6,12,18,共有36人,第4,5小组的频率之和为()0.03750.012550.25+⨯=, 则前3小组的频率之和为10.250.75-=, 则该校报名学生的总人数为360.7548÷=,故选C. 【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标相乘后求和可得平均值;(4)直观图左右两边面积相等处横坐标表示中位数.11.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.12.D解析:D 【解析】分析:一组数据中的每一个数加或减一个数,它的平均数也加或减这个数;;依此规律求解即可.详解::∵一组数据12,,,n x x x 的平均数为3, ∴另一组数据1232,32,,32n x x x +++的平均数121211323232[32]33211n n x x x x x x n n n=++++⋯++=++⋯++=⨯+=()(), 故选D.点睛:本题考查了平均数,平均数是指在一组数据中所有数据之和再除以数据的个数.它是反映数据集中趋势的一项指标.二、填空题13.3【分析】先由频率之和等于1得出的值计算身高在的频率之比根据比例得出身高在内的学生中抽取的人数【详解】身高在的频率之比为所以从身高在内的学生中抽取的人数应为故答案为:【点睛】本题主要考查了根据频率分解析:3 【分析】先由频率之和等于1得出a 的值,计算身高在[)120,130,[)130,140,[]140,150的频率之比,根据比例得出身高在[]140,150内的学生中抽取的人数. 【详解】(0.0050.010.020.035)101a ++++⨯=0.03a ∴=身高在[)120,130,[)130,140,[]140,150的频率之比为0.03:0.02:0.013:2:1= 所以从身高在[]140,150内的学生中抽取的人数应为11836⨯= 故答案为:3 【点睛】本题主要考查了根据频率分布直方图求参数的值以及分层抽样计算各层总数,属于中档题.14.3【分析】根据频率分布直方图求得不小于40岁的人的频率及人数再利用分层抽样的方法即可求解得到答案【详解】根据频率分布直方图得样本中不小于40岁的人的频率是0015×10+0005×10=02所以不小解析:3 【分析】根据频率分布直方图,求得不小于40岁的人的频率及人数,再利用分层抽样的方法,即可求解,得到答案. 【详解】根据频率分布直方图,得样本中不小于40岁的人的频率是0.015×10+0.005×10=0.2, 所以不小于40岁的人的频数是100×0.2=20;从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人, 在[50,60)年龄段抽取的人数为0.0051010012320⨯⨯⨯=.【点睛】本题主要考查了频率分布直方图的应用,其中解答中熟记频率分布直方图的性质,以及频率分布直方图中概率的计算方法是解答的关键,着重考查了推理与运算能力,属于基础题.15.40【分析】设应从B 校抽取n 人利用分层抽样的性质列出方程组能求出结果【详解】设应从B 校抽取n 人某市有ABC 三所学校各校有高三文科学生分别为650人500人350人在三月进行全市联考后准备用分层抽样的解析:40 【分析】设应从B 校抽取n 人,利用分层抽样的性质列出方程组,能求出结果. 【详解】设应从B 校抽取n 人,某市有A 、B 、C 三所学校,各校有高三文科学生分别为650人,500人,350人, 在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,120n650500350500∴=++,解得n 40=.故答案为40. 【点睛】本题考查应从B 校学生中抽取人数的求法,考查分层抽样的性质等基础知识,考查运算求解能力,是基础题.16.②③【解析】分析:根据函数的周期性可判断①;根据垂直平分线的几何特征可判断②;根据回归直线的实际意义可判断③;根据演绎推理及正弦函数的定义可判断④详解:①若函数满足则函数是周期为2的周期函数但不一定解析:②③ 【解析】分析:根据函数的周期性,可判断① ;根据垂直平分线的几何特征,可判断②;根据回归直线的实际意义,可判断③;根据演绎推理及正弦函数的定义,可判断④.详解:①若函数()y f x =满足()()11f x f x -=+,则函数()f x 是周期为2的周期函数,但不一定具有对称性,①错误;②点()()2,1?0,3确定直线的斜率为1-,与直线 10x y -+=垂直,且中点()1,2在直线10x y -+=上,故点()()2,1?0,3关于直线10x y -+=的对称,②正确; ③通过回归方程ˆˆˆy bx a =+可以估计和观测变量的取值和变化趋势,③正确;④正弦函数是奇函数,()()2sin 1f x x =+是正弦函数,所以()()2sin 1f x x =+是奇函数,上述推理错误的原因是小前提不正确,④错误,故答案为②③.点睛:本题主要通过对多个命题真假的判断,主要综合考查函数的周期性、点关于直线对称、以及回归分析与“三段论”,属于难题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.17.②④⑤【解析】分析:根据方程性质回归方程性质及其含义卡方含义确定命题真假详解:由方差的性质知①正确;由线性回归方程的特点知③正确;回归方程若变量增加一个单位时则平均减少5个单位;曲线上的点与该点的坐解析:②④⑤ 【解析】分析:根据方程性质、回归方程性质及其含义、卡方含义确定命题真假. 详解:由方差的性质知①正确;由线性回归方程的特点知③正确;回归方程ˆ35yx =-中若变量x 增加一个单位时,则y 平均减少5个单位; 曲线上的点与该点的坐标之间不一定具有相关关系;在一个22⨯列联表中,由计算得213.079K =,只能确定两个变量之间有相关关系的可能性,所以②④⑤均错误.点睛:本题考查方程性质、回归方程性质及其含义、卡方含义,考查对基本概念理解与简单应用能力.18.1【解析】分析:根据平均数与对应概率乘积的和得总平均数计算结果详解:点睛:本题考查平均数考查基本求解能力解析:1 【解析】分析:根据平均数与对应概率乘积的和得总平均数,计算结果.详解:7245%74(145%)72.1⨯+⨯-=. 点睛:本题考查平均数,考查基本求解能力.19.12【解析】分析:由频率=以及直方图可得分布在区间第一组与第二组共有20人的频率即可求出第三组中有疗效的人数得到答案详解:由直方图可得分布在区间第一组和第二组共有20人分布唉区间第一组与第二组的频率解析:12 【解析】 分析:由频率=频数样本容量,以及直方图可得分布在区间第一组与第二组共有20人的频率,即可求出第三组中有疗效的人数得到答案.详解:由直方图可得分布在区间第一组和第二组共有20人,分布唉区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人第三组的频率为0.36,所以第三组的人数为18人,第三组中没有疗效的有6人,第三组由疗效的有12人.点睛:1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法,分布表在数量表示上比较准确,直方图比较直观.2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.20.35【解析】79+78+80+80+x+85+92+967=85解得x=5根据中位数为83可知y=3故yx=35 解析:【解析】,解得,根据中位数为,可知,故.三、解答题21.(1) 3.240ˆyx =-+;(2)可以认为所得的回归直线方程是理想的;(3)该产品的销售单价为7.5元/件时,获得的利润最大. 【分析】(1)计算x 、y ,求出回归系数,写出回归直线方程;(2)根据回归直线方程,计算对应的数值,判断回归直线方程是否理想; (3)求销售利润函数W ,根据二次函数的图象与性质求最大值即可. 【详解】 (1)因为1(99.51010.511)105x =++++=,1(1110865)85y =++++=,所以23925108ˆ 3.2502.5510b -⨯⨯==--⨯,则8( 3.2)00ˆ14a =--⨯=, ∴y 关于x 的回归直线方程为 3.240ˆyx =-+ (2)剩余数据为12月份,此时8.5x =,14y =,现进行检测,当8.5x =时,ˆ 3.28.54012.8y=-⨯+=,则ˆ||12.814 1.22y y -=-=<,所以可以认为所得的回归直线方程是理想的. (3)令销售利润为W ,则22( 2.5)( 3.240) 3.248100 3.2(7.5)80W x x x x x =--+=-+-=--+.∴当7.5x =时,W 取最大值.所以该产品的销售单价为7.5元/件时,获得的利润最大. 【点睛】函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系,如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .22.(1)散点图见解析,y 与t 的线性相关性相当高,理由见解析;(2)0.920.1011 2.02y =+⨯=,2.02万户.【分析】(1)根据表格中对应的t 与y 的关系,描绘散点图,并根据参考数据求r ,说明相关性;(2)根据参考数据求ˆb和ˆa ,求回归直线方程,并令11t =,求y 的预测值.【详解】(1)作出散点图如图所示:由条形图数据和参考数据得()()7722114,0.53iii i t t t y y ===⋅-=⋅-≈∑∑,()()77711139.7549.24 2.79ii i i i i i i tty y t y t y ===⋅--=-=-⨯=∑∑∑,2.790.990.532 2.646r ≈≈⨯⨯.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关性相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由9.24 1.327y ==及(1)得()()()717212.79ˆ0.1028iii i i t t y y b t t==⋅--==≈⋅-∑∑, ˆˆ 1.320.1040.92ay bt =-≈-⨯=,所以,y 关于t 的回归方程为:0.920.10y t =+. 将11t=代入回归方程得:0.920.1011 2.02y =+⨯=,所以预测11月份该省煤改气、煤改电的用户数量达到2.02万户. 【点睛】关键点点睛:本题考查回归直线方程,此类问题的关键是根据参考数据和公式相结合,求ˆb和ˆa ,一般计算量较大,需计算严谨,准确. 23.(1) x =0.075,7;(2) 6.4,5.36;(3) 2;(4)23. 【分析】(1)根据频率和为1,列方程求出x 的值;(2)根据频率分布直方图中,每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均值,由最高矩形的数据组中点为众数;中位数两边的频率相等,由此求出中位数;(3)求出抽取比例数,计算应抽取的户数; (4)利用列举法,由古典概型概率公式可得结果. 【详解】(1)根据频率和为1,得2×(0.02+0.095+0.11+0.125+x +0.05+0.025)=1, 解得x =0.075;由图可知,最高矩形的数据组为[6,8),所以众数为()16872+=; (2) [2,6)内的频率之和为 (0.02+0.095+0.11)×2=0.45;设中位数为y ,则0.45+(y −6)×0.125=0.5, 解得y =6.4,∴中位数为6.4;平均数为()210.0230.09550.1170.12590.075110.025 5.36⨯+⨯+⨯+⨯+⨯+⨯= (3)月平均用电量为[10,12)的用户在四组用户中所占的比例为0.0520.1250.0750.050.02511=+++,∴月平均用电量在[10,12)的用户中应抽取11×211=2(户). (4)月平均用电量在[12,14)的用户中应抽取11×111=1(户), 月平均用电量在[10,12)的用户设为A 、B , 月平均用电量在[12,14)的用户设为C ,从[10,12),[12,14)这两组中随机抽取2户共有 ,,AB AC BC ,3种情况, 其中,抽取的两户不是来自同一个组的有,,AC BC ,2种情况, 所以,抽取的两户不是来自同一个组的概率为23. 【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均值;(4)直方图左右两边面积相等处横坐标表示中位数.24.(Ⅰ)图象见解析,正相关;(Ⅱ)ˆ0.7 1.5yx =+,当15x =时细菌个数为12个. 【分析】(Ⅰ)根据数据描点即得散点图,看图即判断结果; (Ⅱ)利用公式代入数据计算即可. 【详解】解:(Ⅰ)图形如下,观察图像可知细菌个数和时间是正相关.(Ⅱ)由数据计算得,()11234535x =⨯++++=,()123445 3.65y =⨯++++=,1122334445561ni ii x y==⨯+⨯+⨯+⨯+⨯=∑,22222211234555n i i x ==++++=∑。
高中数学必修3第一章(统计)测试题(北师大版).doc
高中数学必修3第一章(统计)检测题班级姓名得分一、选择题:(本题共10小题,每小题3分,共30分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.某单位有老年人28人,中年人54人,青年人81人.为了调查他们的身体状况,需从他们中抽取一个容量为36的样本,最适合抽取样本的方法是( ).A.简单随机抽样B.系统抽样C.分层抽样D.先从老年人中剔除一人,然后分层抽样2.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12.设其平均数为a,中位数为b,众数为c,则有( ).A.a>b>c B.b>c>a C.c>a>b D.c>b>a3.下列说法错误的是( ).A.在统计里,把所需考察对象的全体叫作总体B.一组数据的平均数一定大于这组数据中的每个数据C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D.一组数据的方差越大,说明这组数据的波动越大4.下列说法中,正确的是( ).A.数据5,4,4,3,5,2的众数是4B.一组数据的标准差是这组数据的方差的平方C.数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半D.频率分布直方图中各小长方形的面积等于相应各组的频数5.从甲、乙两班分别任意抽出10名学生进行英语口语测验,其测验成绩的方差分别为S12= 13.2,S22=26.26,则( ).A.甲班10名学生的成绩比乙班10名学生的成绩整齐B.乙班10名学生的成绩比甲班10名学生的成绩整齐C.甲、乙两班10名学生的成绩一样整齐D.不能比较甲、乙两班10名学生成绩的整齐程度6.下列说法正确的是( ).A.根据样本估计总体,其误差与所选择的样本容量无关B.方差和标准差具有相同的单位C.从总体中可以抽取不同的几个样本D.如果容量相同的两个样本的方差满足S12<S22,那么推得总体也满足S12<S22是错的7.右图是根据《湖南统计年整2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为()29 1 1 5 8 (A)304.6(B)303.63 0 2 63 1 0 24 7 (C)302.6 (D)301.68.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为(1);在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为(2)。
高中数学北师大版必修3一课三测:1.4.1 平均数、中位数、众数
§4数据的数字特征第1课时平均数、中位数、众数填一填平均数、中位数、众数(1)平均数如果有n个数x1,x2,…,x n,那么x=____________,叫作这n 个数的平均数.(2)中位数把一组数据按从小到大的顺序排列,把处于________位置的那个数(或中间两数的平均数)称为这组数据的中位数.(3)众数一组数据中重复出现次数________的数称为这组数的众数,一组数据的众数可以是判一判1.会引起平均数的变化.()2.一组数据中,有一半的数据不大于中位数,而另一半则不小于中位数,中位数反映了一组数据的中心的情况.中位数不受极端值的影响.()3.一组数据的众数的大小只与这组数据中的部分数据有关.() 4.中位数是一组数据中间的数.()5.众数是一组数据中出现次数最多的数.()6.一个样本的众数、平均数和中位数都是唯一的.()7.若改变一组数据中其中的一个数,则这组数据的平均数、中位数、众数都会发生改变.()8想一想1.刻画一组数据集中趋势的统计量有哪些?提示:刻画一组数据集中趋势的统计量有平均数、中位数和众数等,它们作为一组数据的代表各有优缺点,也各有各的用处,从不同的角度出发,不同的人会选取不同的统计量来表达同一组数据的信息,不同的统计量会侧重突出某一方面的信息.2.怎样理解茎叶图?提示:由于茎叶图保留了原始数据,因此根据茎叶图进行有关数据计算可以直接进行;另外,在茎叶图中,数据的分布能直观体现数据的平均水平和离散程度,因此给出茎叶图解决与平均数和方差有关的统计问题时,我们也可以直观观察来完成.3.怎样理解折线统计图?提示:折线统计图研究样本数据的数字特征与横坐标和纵坐标的意义有关,一般情况下,整体分布位置较高的平均数大,波动性小的方差小.4.条形统计图中怎样近似估计各数字特征?提示:(1)中位数:条形统计图(直方图)中,中位数左边和右边的各矩形的面积和应该相等,由此可以估计中位数的值.(2)平均数:平均数的估计值等于条形统计图(直方图)中每个小矩形的高度(面积)乘小矩形底边中点的横坐标之积的总和.(3)众数:在条形统计图(直方图)中,众数是最高的矩形的中点的横坐标.思考感悟练一练1.某商场对一个月内每天的顾客人数进行统计得到如图所示的样本茎叶图,则该样本的中位数和众数分别是()A.46,45 B.45,46C.46,47 D.47,452.从某中学高三年级甲、乙两个班各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生成绩的平均分和乙班学生成绩的中位数都是85,则x+y的值为() A.7 B.8C.9 D.103.已知一组数据按从小到大排列为-1,0,4,x,6,15,且这组数据的中位数是5,那么数据的众数是________,平均数是________.4.甲、乙两个小组各8名同学的英语口语测试成绩的茎叶图如图所示,则甲、乙两组的平均数与中位数之差较大的组是________.知识点一中位数、众数、平均数的计算及应用1.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各1人,则该小组成绩的平均分、众数、中位数分别是()A.85分、85分、85分B.87分、85分、86分C.87分、85分、85分D.87分、85分、90分2.如果5个数x1,x2,x3,x4,x5的平均数是7,那么x1+1,x2+1,x3+1,x4+1,x5+1这5个数的平均数是()A.5 B.6知识点二数字特征与统计图表的综合问题中的成绩(单位:分).已知甲组数据的平均数为17,乙组数据的中位数为17,则x,y的值分别为()A.2,6 B.2,7C.综合知识平均数、中位数、众数4.职务董事长副董事长董事总经理经理管理员职员人数11215320工资 5 500 5 000 3 500 3 000 2 500 2 000 1 500(2)假设副董事长的工资从5 000元提升到20 000元,董事长的工资从5 500元提升到30 000元,那么新的平均数、中位数、众数又是什么?(精确到元)(3)你认为哪个统计量更能反映这个公司员工的工资水平,结合此问题谈一谈你的看法.基础达标1.已知一组数据为-3,5,7,x,11,且这组数据的众数为5,那么该组数据的中位数是()A.7 B.5C.6 D.112.若样本数据x1,x2,x3,x4,x5的平均数为2,则数据2x1+3,2x2+3,2x3+3,2x4+3,2x5+3的平均数为()A.25B.75C .2D .73.10名工人生产同一零件的件数是5,8,4,10,7,6,8,8,5,9,设其平均数为a ,中位数为b ,众数为c ,则有( )A .c >b >aB .b >c >aC .a >b >cD .c >a >b4.在一次射击训练中,一小组的成绩如下表所示:环数 7 8 9人数 2 38环的人数是( )A .5B .6C .4D .75.某学校为了了解学生课外阅读情况,随机调查了50名学生,得到他们在每一天各自课外阅读所用时间的数据,结果用条形统计图表示如图所示,根据条形统计图估计该校全体学生这一天平均每人的课外阅读时间为( )A .0.6 hB .0.9 hC .1.0 hD .1.5 h 6.如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a 1,a 2,则一定有( )A .a 1>a 2B .a 2>a 1C .a 1=a 2D .a 1,a 2的大小与m 的值有关7.期中考试后,班长算出了全班40个人数学成绩的平均分为M ,如果把M 当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均数为N ,那么M N 为( )A.4041 B .1C.4140 D .28.某高校有甲、乙两个数学建模兴趣班.其中甲班有40人,乙班有50人.现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是________分.9.某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A 给出的分数的茎叶图如图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91.复核员在复核时,发现有一个数字(茎叶图中的x )无法看清.若记分员计算无误,则数字x 应该是________.89⎪⎪⎪8 9 92 3 x 2 1 410.某中学高三年级从甲、乙两个班级各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则x +y 的值为________.11.如图茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,若乙的平均分是89,则污损的数字是________.12.青年歌手大奖赛共有10名选手参赛,并请了7名评委.如图所示的茎叶图是7名评委给参加最后决赛的两位选手甲、乙评定的成绩,去掉一个最高分和一个最低分后,甲、乙选手剩余数据的平均成绩分别为__________、________.13.某工厂人员及工资构成如下:人员 经理 管理人员 高级技工 工人 学徒 合计周工资2 200250220200100 2 970(元)人数16510123合计 2 200 1 500 1 100 2 000100 6 900(2)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?14.小王到一家公司参加应聘,公司的经理告诉他说:“我们公司的收入水平很高,去年在50名员工中,最高年收入达到了110万元,他们年收入的平均数是3.8万元.”小王希望获得年薪2.5万元.(1)请问小王可能成为此公司的一名高收入者吗?(2)如果经理继续告诉小王:“员工年收入的变化范围是0.5万元到100万元”这个信息是否足以使小王做出是否受聘的决定?(3)如果经理继续给小王提供如下信息,员工年收入的中间60%(即去掉最少的20%和最多的20%后所剩下的)变化范围是1万元到3万元.小王应如何使用这条信息做出是否受聘的决定?(4)你能估计出年收入的中位数是多少吗?为什么均值比估计出的中位数高很多?15.销售定额,统计了这15人某月的销售量如下:(1)(2)假设销售部负责人把每位销售人员的月销售额定为320件,你认为是否合理,为什么?如不合理,请你制定一个较为合理的销售定额.16.某学校高一(1)班和高一(2)班各有49名学生,两班在一次数学测验中的成绩统计如下:(1)高一(1)班的小刚回家对妈妈说:“昨天的数学测验,全班平均分为79分,得70分的人最多,我得了85分,在班里算上游了!”(2)请你根据表中的数据,对这两个班的数学测验情况进行简要分析,并提出建议.第1课时 平均数、中位数、众数一测 基础过关填一填1.(1)x 1+x 2+…+x n n(2)最中间 (3)最多 一个 多个 判一判1.√ 2.√ 3.√ 4.× 5.√ 6.× 7.× 8.×练一练1.A 2.D 3.6 5 4.乙二测 考点落实1.解析:由题意知,该学习小组共有10人,因此众数和中位数都是85,平均数为100+95+2×90+4×85+80+7510=87. 答案:C2.解析:(性质法):显然新数据(记为y i )与原有数据的关系为y i =x i +1(i =1,2,3,4,5),故新数据的平均数为x +1=8.答案:D3.解析:由题可知9+12+24+27+10+x 5=17,所以x =3,由乙组数据的中位数为17可得y =7,选D.答案:D4.解析:(1)平均数是 x =1 500+133(4 000+3 500+2 000×2+1 500+1 000×5+500×3+0×20)≈1 500+591=2 091(元),中位数是1 500元,众数是1 500元.(2)平均数是x-′=1 500+133(28 500+18 500+2 000×2+1 500+1 000×5+500×3+0×20)≈1 500+1 788=3 288(元).中位数是1 500元,众数是1 500元.(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.三测学业达标1.解析:由这组数据的众数为5,可知x=5.把这组数据由小到大排列为-3,5,5,7,11,则可知中位数为5.答案:B2.答案:D3.解析:平均数为7,中位数为7.5,众数为8,故c>b>a.答案:A4.解析:设8环的人数为x人.7×2+8x+9×3=8.1×(x+5),14+8x+27=8.1x+40.5,8.1x-8x=-14+27-40.5,∴x=5.故选A.答案:A5.解析:由条形统计图可得,这50名学生这一天平均每人的课外阅读时间为5×0+20×0.5+10×1.0+10×1.5+5×2.050=0.9(h),因此估计该校全体学生这一天平均每人的课外阅读时间为0.9 h.答案:B6.解析:去掉的最低分和最高分就是第一行和第三行的数据,剩下的数据我们只要计算其叶上数字之和即可.此时甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a2>a1.答案:B7.解析:设40位同学的成绩为x i(i=1,2,…,40),则M=x 1+x 2+…+x 4040,N =x 1+x 2+…+x 40+M 41=40M +M 41=M . 故M N =1.答案:B8.解析:由题意得,该校数学建模兴趣班的平均成绩是40×90+50×8190=85(分). 答案:859.解析:由茎叶图可知最低分为88.若90+x 为最高分,则平均分为89+89+91+92+92+93+947≈91.4≠91. 故最高分为94.则去掉最高分94和最低分88,平均分为89+89+91+92+92+93+(90+x )7=91,解得x =1. 答案:110.解析:因为甲班学生的平均分是85,所以78+79+85+80+x +80+96+927=85,解得x =5,又因为乙班学生成绩的中位数是83,所以y =3,所以x +y =8.答案:811.解析:设污损的叶对应的成绩是x ,由茎叶图可得89×5=83+83+87+x +99,所以x =93,故污损的数字是3.答案:312.解析:甲的成绩去掉一个最高分92分和一个最低分75分后,甲的剩余数据的平均成绩为84.2分;乙的成绩去掉一个最高分93分和一个最低分79分后,乙的剩余数据的平均成绩为85分.答案:84.2分 85分13.解析:(1)由表格可知:众数为200元.因为23个数据按从小到大(或从大到小)的顺序排列,排在中间的数应是第12个数,其值为220,所以中位数为220元.平均数为(2 200+1 500+1 100+2 000+100)÷23=6 900÷23=300(元).(2)虽然平均数为300元/周,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.14.解析:(1)不能,因为平均收入和最高收入差别很大,说明高收入的职工只占极少数,现在已经知道至少有一个人的年收入为110万元,则其他员工的年收入和为3.8×50-110=80(万元).其余49人每人平均年收入约只有1.63万元,如果再有几个收入特别高的,那么初进公司的员工收入会很低.(2)不能,要看中位数是多少.(3)可以确定80%的员工的年收入在1万元以上,20%的员工年收入在3万元以上,可以考虑进入此公司.(4)年收入的中位数大约在2万元,因为有年收入110万元这个极端值的影响,使得年平均收入比中位数高许多.15.解析:(1)平均数是1 800+510+250×3+210×5+150×3+120×215=320(件) 表中的数据是按从大到小的顺序排列的.处于中间位置的是210,因而中位数是210.210出现了5次最多,所以众数是210.(2)不合理.因为15人中有13人的销售额不到320件,320件虽是所给一组数据的平均数,它却不能很好地反映销售人员的一般水平.销售额定为210件合适些,因为210件既是中位数,又是众数,且大部分人能达到的定额.16.解析:(1)由于(1)班49名学生数学测验成绩的中位数是87,则85分排在全班第25名之后,所以从位次上看,不能说85分是上游,成绩应该属于中游.但也不能以位次来判断学习的好坏,小刚得了85分,说明他对这段的学习内容掌握得较好,从掌握学习的内容上讲,也可以说属于上游.(2)(1)班成绩的中位数是87分,说明高于87分(含87)的人数占一半以上,而平均分为79分,标准差又很大,说明低分也多,两极分化严重,建议加强对学习困难的学生的帮助.(2)班的中位数和平均数都是79分,标准差又小,说明学生之间差别较小,学习很差的学生少,但学习优异的也很少,建议采取措施提高优秀率.由Ruize收集整理。
高中数学 第一章 统计综合能力测试(含解析)北师大版必修3-北师大版高一必修3数学试题
【成才之路】2015-2016学年高中数学第一章统计综合能力测试北师大版必修3本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分.时间120分钟,满分150分.第Ⅰ卷(选择题共60分)一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.2015年的世界无烟日(5月31日)之前,小华学习小组为了了解本地区大约有多少成年人吸烟,随机调查了100个成年人,结果其中有15个成年人吸烟.对于这个关于数据收集与处理的问题,下列说法正确的是( )A.调查的方式是普查B.本地区约有15%的成年人吸烟C.样本是15个吸烟的成年人D.本地区只有85个成年人不吸烟[答案] B[解析]调查方式显然是抽样调查,∴A错误.样本是这100个成年人.∴C也错误,显然D不正确.故选B.2.某班的78名同学已编号1,2,3,…,78,为了解该班同学的作业情况,老师收取了学号能被5整除的15名同学的作业本,这里运用的抽样方法是( )A.简单随机抽样法 B.系统抽样法C.分层抽样法 D.抽签法[答案] B[解析]所抽出的编号都间隔5,故是系统抽样.3.下列问题,最适合用简单随机抽样的是( )A.某电影院有32排座位,每排有40个座位,座位号为1~40.有一次报告会坐满了听众,报告会结束后为听取意见,要留下32名听众进行座谈B.从10台冰箱中抽出3台进行质量检查C.某学校在编人员160人.其中行政人员16人,教师112人,后勤人员32人.教育部门为了解学校机构改革意见,要从中抽取一个容量为20的样本D.某乡农田有:山地8 000亩,丘陵12 000亩,平地24 000亩,洼地4 000亩. 现抽取农田480亩估计全乡农田某种作物的平均亩产量[答案] B[解析]A项的总体容量较大,用简单随机抽样法比较麻烦;B项的总体容量较小,用简单随机抽样法比较方便;C项由于学校各类人员对这一问题的看法可能差异较大,不宜采用简单随机抽样法;D 项的总体容量较大,且各类田地的产量差别很大,也不宜采用简单随机抽样法.4.一个容量为50的样本数据,分组后,组距与频数如下:[12.5,15.5),2;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),6;[30.5,33.5),4.根据分组情况估计小于30.5的数据占( )A .18% B.30% C .60% D.92%[答案] D[解析] (2+8+9+11+10+6)÷50=92%.5.如图所示的是2006年至2015年某省城镇居民百户家庭人口数的茎叶图,图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到2006年至2015年此省城镇居民百户家庭人口数的平均数为( )2 9 1 1 5 83 0 2 6 31247[答案] B[解析] 由茎叶图得到2006年至2015年城镇居民百户家庭人口数为:291,291,295,298,302,306,310,312,314,317,所以平均数为291+291+295+298+302+306+310+312+314+31710=3 03610=303.6.6.某地区共有10万户居民,该地区城市住户与农村住户之比为4∶6,根据分层抽样方法,调查了该地区1 000户居民冰箱拥有情况,调查结果如下表所示,那么可以估计该地区农村住户中无冰箱的总户数约为( )万户 C .1.76万户 D.0.24万户[答案] A[解析] 由于城市住户与农村住户之比为4∶6,城市住户有4万户,农村住户有6万户,调查的1 000户居民中共400户城市住户,有600户农村住户,其中农村住户中无冰箱的有160户,所以可估计该地区农村住户中无冰箱的总户数约为10×1601 000=1.6(万户).7.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )1 2 520 2 3 33 1 24 4 8 94 5 5 5 7 7 8 8 950 0 1 1 4 7 96 17 8A.46,45,56B.46,45,53C.47,45,56 D.45,47,53[答案] A[解析]本题考查了茎叶图的应用及其样本的中位数、众数、极差等数字特征,由茎叶图可知,中位数为46,众数为45,极差为68-12=56.在求一组数据的中位数时,一定不要忘记先将这些数据排序再判断.8.有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为( )A.18 B.36C.54 D.72[答案] B[解析]频率分布直方图中所有小矩形的面积之和为1,每个小矩形的面积表示样本数据落在该区间内的频率,故样本数据落在区间[10,12)内的频率为1-2×(0.02+0.05+0.15+0.19)=0.18,故样本数据落在区间[10,12)内的频数为0.18×200=36.9.已知两个变量x,y之间具有线性相关关系,测得(x,y)的四组值分别为(1,2),(2,4),(3,5),(4,7),则y与x之间的回归直线方程为( )A.y=0.8x+3 B.y=-1.2x+7.5C.y=1.6x+0.5 D.y=1.3x+1.2[答案] C[解析] 利用排除法. ∵x =14(1+2+3+4)= 2.5,y =14(2+4+5+7)=4.5,由于回归直线方程y =bx +a 必过定点(2.5,4.5),故排除A 、D.又由四组数值知y 随x 的增大而增大,知b >0,排除B.10.某路段检查站监控录像显示,在某时段内,有 1 000辆汽车通过该站,现在随机抽取其中的200辆汽车进行车速分析,分析的结果表示为如下图的频率分布直方图,则估计在这一时段内通过该站的汽车中速度不小于90 km/h 的约有( )A .100辆 B.200辆 C .300辆 D.400辆[答案] C[解析] 由题图可知汽车中车速在[60,90)的频率为10×(0.01+0.02+0.04)=0.7, ∴在[90,110]的频率为(1-0.7)=0.3.∴车速不小于90 km/h 的汽车数量约为0.3×1 000=300辆.11.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9,已知这组数据的平均数为10,方差为2,则|x -y |的值为( )A .1 B.2 C .3 D.4[答案] D[解析] 依题意,可得 ⎩⎪⎨⎪⎧10=x +y +10+11+95,2=15[x -102+y -102+10-102+11-102+9-102],⇒⎩⎪⎨⎪⎧x +y =20,x -102+y -102=8,⇒⎩⎪⎨⎪⎧x =12y =8,或⎩⎪⎨⎪⎧x =8y =12,所以|x-y|=4.12.甲,乙,丙三名运动员在某次测试中各射击20次,三人测试成绩的频率分布条形图分别如图1,图2和图3,若s甲,s乙,s丙分别表示他们测试成绩的标准差,则( )A.s甲<s乙<s丙 B.s甲<s丙<s乙C.s乙<s甲<s丙 D.s丙<s甲<s乙[答案] D[解析]由频率分布条形图可得甲,乙,丙三名运动员的平均成绩分别为x-甲=0.25×(7+8+9+10)=8.5;x-乙=0.3×7+8×0.2+9×0.2+10×0.3=8.5;x-丙=0.2×7+8×0.3+9×0.3+10×0.2=8.5,s2甲=0.25×(1.52+0.52+0.52+1.52)=1.25;s2乙=0.3×1.52+0.52×0.2+0.52×0.2+1.52×0.3=1.45;s2丙=0.2×1.52+0.52×0.3+0.52×0.3+1.52×0.2=1.05,∴s丙<s甲<s乙.第Ⅱ卷(非选择题共90分)二、填空题(本大题共4个小题,每小题5分,共20分,将正确答案填在题中横线上)13.一个容量为40的样本,共分成6组,第1~4组的频数分别为10,5,7,6,第5组的频率是0.10,则第6组的频率是________.[答案]0.20[解析]第5组的频数为40×0.10=4,第6组的频数为40-(10+5+7+6+4)=8,则频率为840=0.20.14.(2015·某某文,12)已知样本数据x1,x2,…,x n的均值x=5,则样本数据2x1+1,2x2+1,…,2x n+1的均值为________.[答案]11[解析]因为样本数据x1,x2,…,x n的均值x=5,所以样本数据2x1+1,2x2+1,…,2x n+1的均值为2x+1=2×5+1=11.15.(2014·某某,6)设抽测的树木的底部周长均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100cm.[答案] 24[解析] 本题考查频率分布直方图.由题意在抽测的60株树木中,底部周长小于100cm 的株数为(0.015+0.025)×10×60=24.频率分布直方图中的纵坐标为频率组距,此处经常误认为纵坐标是频率.16.下图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.0 8 9 10 3 5(注:方差s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],其中x -为x 1,x 2,…,x n 的平均数)[答案] 6.8[解析] 本题考查茎叶图、方差的概念. 由茎叶图知x -=8+9+10+13+155=11,∴s 2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.8.三、解答题(本大题共6个小题,共70分,解答应写出文字说明、证明过程或演算步骤) 17.(本小题满分10分)在同等条件下,对30辆同一型号的汽车进行耗油1升所行走路程的试验,得到如下数据(单位:km):14.1 12.3 13.7 14.0 12.8 12.9 13.1 13.6 14.4 13.8 12.6 13.8 12.6 13.2 13.3 14.2 13.9 12.7 13.0 13.2 13.5 13.6 13.4 13.6 12.1 12.5 13.1 13.5 13.2 13.4以前两位数为茎画出上面数据的茎叶图(只有单侧有数据),并找出中位数.[解析]茎叶图如图所示.1213566789130112223445566 6 788914012 4中位数为13.35.18.(本小题满分12分)某高级中学共有学生3 000名,各年级男、女人数如下表:高一年级高二年级高三年级女生523x y男生487490z已知在全校学生中随机抽取1名,抽到高二年级女生的概率是0.17.(1)问高二年级有多少名女生?(2)现对各年级用分层抽样的方法在全校抽取300名学生,问应在高三年级抽取多少名学生?[解析](1)由题设可知x3000=0.17,所以x=510.(2)高三年级人数为y+z=3000-(523+487+490+510)=990,现用分层抽样的方法在全校抽取300名学生,应在高三年级抽取的人数为:3003000×990=99名.答:(1)高二年级有510名女生;(2)在高三年级抽取99名学生.19.(本小题满分12分)为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:千克),并将所得数据分组,画出频率分布直方图(如图所示).分组频率[1.00,1.05)(1)(2)估计数据落在[1.15,1.30)中的概率为多少;(3)将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条,请根据这一情况来估计该水库中鱼的总条数.[解析] (1)根据频率分布直方图可知,频率=组距×频率组距故可得下表:(2)0.30+0.15+0.02=中的概率约为0.47. (3)120×1006=2000.所以水库中鱼的总条数约为2000条.20.(本小题满分12分)某农场为了从三种不同的西红柿品种中选出高产稳定的西红柿品种,分别在5块试验田上试种,每块试验田均为0.5公顷,产量情况如下表:问哪一种西红柿既高产又稳定?[解析] 因为x 甲=15(21.5+20.4+22.0+21.2+19.9)=21.0(kg),x 乙=15(21.3+18.9+18.9+21.4+19.8)=20.06(kg), x 丙=15(17.8+23.3+21.4+19.9+20.9)=20.66(kg),所以s 甲=15[21.5-21.02+…+19.9-21.02]≈0.756(kg);s 乙=15[21.3-21.062+…+19.8-21.062]≈1.104(kg);s 丙=15[17.8-20.662+…+20.9-20.662]≈1.807(kg).由于x 甲>x 丙>x 乙,s 甲<s 乙<s 丙,所以甲种西红柿既高产又稳定.21.(本小题满分12分)某某统计局就某地居民的月收入调查了10 000人,并根据所得数据画出了样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示收入在[1 000,1 500)).(1)求居民月收入在[3 000,3 500)的频率; (2)根据频率分布直方图算出样本数据的中位数;(3)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中用分层抽样的方法抽出100人作进一步分析,则月收入在[2 500,3 000)的这段应抽多少人?[解析] (1)月收入在[3 000,3 500)的频率为0.000 3×(3 500-3 000)=0.15. (2)∵0.000 2×(1 500-1 000)=0.1, 0.000 4×(2 000-1 500)=0.2, 0.000 5×(2 500-2 000)=0.25,0.1+0.2+0.25=0.55>0.5.∴样本数据的中位数为2 000+0.5-0.1+0.20.000 5=2 000+400=2 400(元).(3)居民月收入在[2 500,3 000)的频率为0.000 5×(3 000-2 500)=0.25, 所以10 000人中月收入在[2 500,3 000)的人数为0.25×10 000=2 500(人), 再从10 000人中分层抽样方法抽出100人,则月收入在[2 500,3 000)的这段应抽取100×2 50010 000=25(人).22.(本小题满分12分)(2015·新课标Ⅰ理,19)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w =,(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:(①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为word 11 / 11 β^=,α^=v -β^u .[解析] (1)由散点图可以判断,y =c +d x 适合作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程,由于d ^=∑i =18w i -wy i -y ∑i =18 w i -w2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6.∴y 关于w 的线性回归方程为y ^=100.6+68w ,∴y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6,年利润z 的预报值z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x )-x=-x +13.6x +20.12,∴当x =13.62=6.8,即x =46.24时,z ^取得最大值. 故年宣传费为46.24千元时,年利润的预报值最大.。
[推荐学习]高中数学北师大版必修3习题:第一章统计1.5.2
5.2估计总体的数字特征课时过关·能力提升1.某商场买来一车苹果,从中随机抽取了10个苹果,其重量(单位:g)分别为150,152,153,149,148,146,151,150,152,147,由此估计这车苹果单个重量的平均值是() A.150.2 g B.149.8 gC.149.4 gD.147.8 g解析:x=150+152+153+149+148+146+151+150+152+14710=149.8(g).答案:B2.甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表:s1,s2,s3()A.s3>s1>s2B.s2>s1>s3C.s1>s2>s3D.s2>s3>s1解析:甲、乙、丙的平均成绩均为8.5.s1=√120[5(7-8.5)2+5(8-8.5)2+5(9-8.5)2+5(10-8.5)2]=√2520,同理s2=√2920,S3=√2120,所以s2>s1>s3.故选B.答案:B3.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x A和x B,样本标准差分别为s A和s B,则()A.x A>x B,S A>S BB.x A<x B,S A>S BC.x A>x B,S A<S BD.x A<x B,S A<S B解析:由题图易得x A<x B,又A波动性大,B波动性小,所以s A>s B.答案:B4.某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.若日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中优秀工人的人数为.解析:因为样本均值为17+19+20+21+25+306=1326=22.所以样本中优秀工人占的比例为26=13,而12×13=4,故推断该车间12名工人中有4名优秀工人.答案:45.若10个数据的平均数是3,标准差是2,则方差是;这10个数据的平方和是.解析:设这10个数分别为x1,x2, (x10)则x1+x2+…+x10=30.又标准差为2,则方差为s2=4,则x12+x22+⋯+x102=4×10−9×10+6×30=130.答案:41306.样本数为9的一组数据,它们的平均数是5,频率条形图如图所示,则其标准差等于.(保留根号)解析:由条形图知2与8的个数相等,且多于5的个数,于是这9个数分别为2,2,2,2,5,8,8,8,8.∵x=5,∴s2=19[(2−5)2+(2−5)2+(2−5)2+(2−5)2+(5−5)2+(8−5)2+(8−5)2 +(8−5)2+(8−5)2]=19×8×9=8.∴s=2√2.答案:2√27.已知甲、乙两人在相同的条件下练习射击,每人打5发子弹,命中环数如下表:则两人射击成绩水平更为稳定的是.解析:因为x甲=8,x乙=8,而s甲2=1.2,s乙2=1.6,s甲2<s乙2,所以甲稳定性较强.答案:甲8.某中学举行了一次演讲比赛,分段统计参赛同学的成绩,结果如下表(分数均为整数,满分为100分).请根据表中提供的信息,(1)参加这次演讲比赛的同学共有多少人?(2)已知成绩在91~100分的同学为优秀者,则优秀率为多少?(3)所有参赛同学的平均得分M(分)在什么范围内?(4)将下图中的成绩频率分布直方图补充完整.解:(1)参加这次比赛的同学共有2+8+6+4=20(人).(2)分数在91~100分的人数为4,故优秀率为420=20%.(3)总分数段最小值及最大值分别除以人数,得120×(61×2+71×8+81×6+91×4)=77,120×(70×2+80×8+90×6+100×4)=86,故平均得分M的取值范围是77<M<86.(4)根据第三组的人数得其频率为620=0.3,f iΔx i=0.310=0.03,则频率分布直方图如下:9.为了了解汽车在某一路段上的速度,交警对这段路上连续驶过的50辆汽车的速度(单位:km/h)进行了统计,得到的数据如下表所示:(1)(2)试估计在这段路上,汽车行驶速度的标准差.(提示利用组中值估计)解:(1)用各速度区间的组中值作为汽车在这一区间行驶的平均速度,各区间速度的平均值分别为45,55,65,75,85,95,105.故样本的平均数为x=150(45×1+55×4+65×10+75×15+85×12+95×6+105×2)=76.8(km/h).即这一路段汽车行驶的平均速度约为76.8 km/h.(2)由上面各小区间的平均数和样本的平均数,可求得这一段路上汽车行驶的方差s 2=150[1×(45−76.8)2+4×(55−76.8)2+10×(65−76.8)2+⋯+6×(95-76.8)2+2×(105-76.8)2]=174.76(km 2/h 2),从而,标准差s ≈13.2(km/h).故在这段路上,汽车行驶速度的标准差约为13.2 km/h .10.甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.(1)分别求出两人得分的平均数与方差;(2)根据图和(1)中的结果,对两人的训练成绩作出评价. 解:(1)由题图可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分. x 甲=10+13+12+14+165=13(分), x 乙=13+14+12+12+145=13(分),s 甲2=15[(10−13)2+(13−13)2+(12−13)2+(14−13)2+(16−13)2]=4(分2), s 乙2=15[(13−13)2+(14−13)2+(12−13)2+(12−13)2+(14−13)2]=0.8(分2). (2)由s 甲2>s 乙2可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.11.在一次科技知识竞赛中,两组学生成绩如下表:中成绩谁优谁次,并说明理由.解:(1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较,甲组的成绩好一些.(2)s 甲2=12+5+10+13+14+6[2×(50−80)2+5×(60−80)2+10×(70−80)2+13×(80−80)2+14×(90−80)2+6×(100−80)2]=172(分2).s 乙2=150(4×900+4×400+16×100+2×0+12×100+12×400)=256(分2). 因为s 甲2<s 乙2,所以甲组的成绩比乙组的成绩好.(3)甲、乙两组成绩的中位数、平均数都是80分,其中,甲组成绩在80分以上的有33人,乙组成绩在80分以上的有26人,从这一角度来看甲组的成绩总体较好.(4)从成绩统计表来看,甲组的成绩高于90分的人数为14+6=20,乙组的成绩高于90分的人数为12+12=24.所以乙组成绩集中在高分段的人数多,同时乙组得满分的人数比甲组得满分的人数多6,从这一角度来看,乙组的成绩较好.。
(常考题)北师大版高中数学必修三第一章《统计》检测卷(有答案解析)(4)
一、选择题1.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,82.图1是某学习小组学生数学考试成绩的茎叶图,1号到16号的同学的成绩依次为1A ,216,,A A ⋯,图2是统计茎叶图中成绩在一定范围内的学生情况的程序框图,那么该程序框图输出的结果是( )A .10B .6C .7D .163.某产品的广告费用与销售额的统计数据如下表:( ) 广告费用(万元) 销售客(万元)根据上表中的数据可以求得线性回归方程中的为,据此模型预报广告费用为万元时销售额为( ) A .万元B .万元C .万元D .万元4.从两个班级各随机抽取5名学生测量身高(单位:cm ),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165.据此估计甲、乙两班学生的平均身高x 甲,x 乙及方差2s 甲,2s 乙的关系为( )A .x 甲>x 乙,2s 甲>2s 乙B .x 甲>x 乙,2s 甲<2s 乙C .x 甲<x 乙,2s 甲<2s 乙D .x 甲<x 乙,2s 甲>2s 乙5.有200人参加了一次会议,为了了解这200人参加会议的体会,将这200人随机号为001,002,003,…,200,用系统抽样的方法(等距离)抽出20人,若编号为006,036,041,176, 196的5个人中有1个没有抽到,则这个编号是( ) A .006B .041C .176D .1966.在一段时间内,某种商品的价格x (元)和销售量y (件)之间的一组数据如下表: 价格x (元) 4 6 8 10 12 销售量y (件)358910若y 与x 呈线性相关关系,且解得回归直线ˆˆˆybx a =+的斜率0.9b ∧=,则a ∧的值为( ) A .0.2B .-0.7C .-0.2D .0.77. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日8.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( ) A .70和50 B .70和67C .75和50D .75和679.通过实验,得到一组数据如下:2,5,8,9,x ,已知这组数据的平均数为6,则这组数据的方差为( ) A .3.2B .4C .6D .6.510.总体由编号为01,02,,29,30的30个个体组成,利用下面的随机数表选取4个个体.选取的方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的第4个个体的编号为( ).7806 6572 0802 6314 2947 1821 98003204 9234 4935 3623 4869 6938 7481A .02B .14C .18D .2911.如图是两组各7名同学体重(单位:kg )数据的茎叶图,设1、2两组数据的平均数依次为1x 和2x ,标准差依次为12s s 、,那么( )(注:标准差222121[()()...()]n s x x x x x x n=-+-++-A .1212,x x s s >>B .1212,x x s s ><C .1212,x x s s <<D .1212,x x s s12.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .91二、填空题13.对两个变量y 和x 进行回归分析,得到一组样本数据()11,x y ,()22,x y ,…,(),n n x y ,则下列说法中正确的序号是______.①由样本数据得到的回归直线方程y bx a =+必过样本点的中心 ②残差平方和越小的模型,拟合的效果越好③用相关指数2R 来刻画回归效果,2R 越小说明拟合效果越好④若变量y 和x 之间的相关系数为0.946r =-,则变量y 和x 之间线性相关性强 14.已知一组数据6,7,8,x ,y 的平均数是8,且90xy =,则该组数据的方差为_______. 15.上海市普通高中学业水平等级考成绩共分为五等十一级,各等级换算成分数如表所示: 等级A + AB + BB -C + CC -D + DE 分数 7067646158555249464340上海某高中2018届高三()1班选考物理学业水平等级考的学生中,有5人取得A +成绩,其他人的成绩至少是B级及以上,平均分是64分,这个班级选考物理学业水平等级考的.人数至少为______人16.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.17.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:^y=0.245x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_______万元.18.某高中有高一学生320人,高二学生400人,高三学生360人.现采用分层抽样调查学生的视力情况.已知从高一学生中抽取了8人,则三个年级一共抽取了__________人。
新版高中数学北师大版必修3习题:第一章统计 检测
第一章检测(时间:120分钟满分:150分)一、选择题:本大题共12小题,每小题5分,在每小题给出的四个选项中,只有一项是符合题目要求的.1.现从100件产品中随机抽出10件进行质量检测,下列说法正确的是()A.100件产品是总体B.10件产品是样本C.样本容量为100D.样本容量为10解析:这里考查统计的基本概念,总体是100件产品的质量;样本是抽取的10件产品的质量;总体容量为100,样本容量为10.答案:D2.下列说法中,不正确的是()A.系统抽样是先将差异明显的总体分成几个小组,再进行抽取B.分层抽样是将差异明显的几部分组成的总体分成几层,然后进行抽取C.简单随机抽样是从个体无差异且个体数较少的总体中逐个抽取个体D.系统抽样是从个体无差异且个数较多的总体中,将总体均分,再按事先确定的规则在各部分抽取解析:当总体中个体差异明显时,用分层抽样;当总体中个体无差异且个体数较多时,用系统抽样;当总体中个体无差异且个体数较少时,用简单随机抽样.所以A不正确.答案:A3.重庆市2016年各月的平均气温(单位:℃)数据的茎叶图如图所示,则这组数据的中位数是()A.19B.20C.21.5D.23答案:B4. 如图是容量为100的样本数据(质量)的频率分布直方图,已知样本质量均在[5,20]内,其分组为[5,10),[10,15),[15,20],则样本质量落在[15,20]内的频数为()A.10B.20C.30D.40解析:由题意得,组距为5,则样本质量在[5,10),[10,15)内的频率分别为0.3和0.5,所以样本质量在[15,20]内的频率为1-0.3-0.5=0.2.故频数为100×0.2=20.答案:B5.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,得到的频率分布直方图是()解析:由分组可知C,D一定不对;由题中茎叶图可知[0,5)有1人,[5,10)有1人,所以第一、二小组频率相同,频率分布直方图中矩形的高应相同,可排除B.故选A.答案:A6.已知两组数据x1,x2,…,x n与y1,y2,…,y n,它们的平均数分别是x和y,则新的一组数据2x1−5y1+3,2x2−5y2+3,…,2x n−5y n+3的平均数是()A.2x−5yB.2x−5y+3C.4x−25yD.4x−25y+3答案:B7.在抽查样本中,用频率分布直方图表示尺寸的过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个数在该组内的频率为m,表示该组的小矩形的高为h,则b-a等于()A.hmB.ℎmC.mℎD.与m,ℎ无关解析:b-a是组距,在频率分布直方图中,频率组距是表示该组的小矩形的高h,所以mb-a=ℎ,所以b-a=mℎ.答案:C8.某班有48名学生,在一次考试中统计出平均分为70分,方差为75分2,后来发现有2名同学的分数登错了,甲实得80分却记成了50分,乙实得70分却记成了100分,更正后平均分和方差分别为()A.70分,75分2B.70分,50分2C.70分,1.04分2D.65分,25分2解析:注意到平均数没有变化,只是方差变动.s2=148[…+(50-70)2+(100-70)2+…]=75分2,实际上s2=148[…+(80-70)2+(70-70)2+…]=50分2,故选B.答案:B9.某校高三年级有男生500人,女生400人,为了了解该年级学生的健康状况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是()A.简单随机抽样B.抽签法C.随机数法D.分层抽样解析:样本容量n=25+20=45,男生和女生的抽样比都是120,即按抽样比为120的分层抽样方法抽取样本.答案:D10.某示范农场的鱼塘放养鱼苗8万条,根据这几年的经验知道,鱼苗的成活率为95%,一段时间后准备打捞出售,第一网捞出40条,称得平均每条鱼2.5 kg,第二网捞出25条,称得平均每条鱼2.2 kg,第三网捞出35条,称得平均每条鱼2.8 kg,估计这时鱼塘中鱼的总质量为()A.192 280 kgB.202 280 kgC.182 280 kgD.172 280 kg解析:样本平均数x=40×2.5+25×2.2+35×2.840+25+35=2.53(kg),可知样本中平均每条鱼重2.53 kg,所以估计鱼塘中鱼的总质量约为80 000×95%×2.53=192 280(kg).答案:A11.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7例”.根据过去10天甲、乙、丙、丁四地新增疑似病例的数据,一定符合该标志的是()A.甲地:总体均值为3,中位数为4B.乙地:总体均值为1,总体方差大于0C.丙地:中位数为2,众数为3D.丁地:总体均值为2,总体方差为3解析:x=2,则s2=110[(x1−2)2+(x2−2)2+⋯+(x10-2)2],若有一天超过7人,不妨设x10=8,则s2≥110×(8−2)2=3.6>3,不合题意.故任何一天都不超过7人.答案:D12. 已知两个相关变量满足如下关系:A.y=0.56x+997.4B.y=0.63x-231.2C.y=50.2x+501.4D.y=60.4x+400.7解析:因为b=x1y1+x2y2+…+x5y5-5x yx12+x22+…+x52-5x2=0.56,a=y−b x=997.4.所以线性回归方程为y=0.56x+997.4.答案:A二、填空题:本大题共4小题,每小题5分.13.某市有大型超市200家、中型超市400家、小型超市1 400家.为掌握各类超市的营业情况,现按分层抽样方法抽取一个容量为100的样本,则应抽取中型超市家.解析:本题为分层抽样,所以应抽取中型超市400×100400+200+1400=20(家).答案:2014.某考察团对全国10大城市职工人均工资水平x(单位:千元)与居民人均消费水平y(单位:千元)进行统计调查,y与x具有线性相关关系,线性回归方程为y=0.66x+1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为.解析:将y=7.675代入y=0.66x+1.562,得x=611.366.所以7.675611.366≈83%.答案:83%15.如图是一个容量为100的样本的频率分布直方图,试根据图中的数据回答下列问题:(1)样本数据落在区间[2,6)内的频率为;(2)样本数据落在区间[6,10)内的频数为.解析:由频率分布直方图可得数据落在区间[2,6)内的频率为相应的小矩形的面积,即0.02×4=0.08,数据落在区间[6,10)内的频率为0.08×4=0.32,故数据落在区间[6,10)内的频数为100×0.32=32.答案:(1)0.08(2)3216.甲、乙两个班级各随机选出15名同学进行测验,成绩的茎叶图如图所示,则甲班、乙班的最高成绩各是,从图中看班的平均成绩较高.解析:从题图可以看出乙班的成绩集中在70分以上,且在80分以上的有6人,而甲班80分以上的只有4人,甲班的最低成绩是46分,对平均分影响较大.答案:96,92乙三、解答题:解答应写出文字说明、证明过程或演算步骤.17.(本小题满分10分)小明家2016年四个季度的用电量如下表:第三季度400第四季度200其中各种电器用电量如下表:根据如图所示三幅统计图回答:(1)从哪幅统计图可看出各个季度用电量变化情况??(2)从哪幅统计图可看出冰箱用电量超过总用电量的14(3)从哪幅统计图可以清楚地看出空调用电量?解:三幅统计图分别为折线统计图、扇形统计图和条形统计图,各自的优点如下:18.(本小题满分12分)农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种麦苗的试验田中各抽取6株麦苗测量麦苗的株高,数据如下(单位:cm): 甲:9,10,11,12,10,20 乙:8,14,13,10,12,21.(1)绘出所抽取的甲、乙两种麦苗株高的茎叶图;(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗的长势情况. 解:(1)茎叶图如图所示:(2)x 甲=9+10+11+12+10+206=12,x 乙=8+14+13+10+12+216=13,s 甲2≈13.67,s 乙2≈16.67.因为x 甲<x 乙,所以乙种麦苗平均株高较高.又因为s 甲2<s 乙2,所以甲种麦苗长得较为整齐.19. (本小题满分12分)2017年春节前,公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让过往返乡的摩托车驾驶人有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍询问,询问结果如图所示:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是什么抽样方法?(2)用分层抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的抽取5人,则四川籍的应抽取几人?解:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是系统抽样法.(2)从题图可知,被询问了省籍的驾驶人员中广西籍的有5+20+25+20+30=100(人); 四川籍的有15+10+5+5+5=40(人).设四川籍的驾驶人员应抽取x人,依题意得5100=x40,解得x=2,即四川籍的应抽取2人.20.(本小题满分12分)某车间20名工人年龄数据如下表:(1)求这20名工人年龄的众数与极差(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.解:(1)由题中表可知,众数为30岁.极差为40-19=21(岁).(2)(3)这20名工人年龄的平均数为(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30(岁),所以这20名工人年龄的方差为s2=120[(19−30)2+3(28−30)2+3(29−30)2+5(30−30)2+4(31−30)2+3(32−30)2+(40−30)2]=12.6(岁2).21.(本小题满分12分)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差;(同一组中的数据用该组区间的中点值作代表)(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解:(1)(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.22.(本小题满分12分)某种瓶装溶液,因为装瓶机的不稳定性,所以很可能使每瓶的含量都不是标准的含量,我们随机抽出了20瓶,测得它们的含量(单位:百毫升)如下:12.1 11.9 12.2 12.2 12.0 12.1 12.9 12.1 12.3 12.5 11.7 12.4 12.3 11.8 11.3 12.1 11.4 11.6 11.2 12.2(1)根据数据列出频率分布表,画出频率分布直方图; (2)计算出这组数据的平均数和标准差;(结果精确到0.01)(3)结合(1)(2)的结果,根据实际意义写一个简短的报告.(对总体情况作出估计) 解:(1)频率分布表如下:频率分布直方图如图所示.(2)平均数x =120×(12.1+11.9+12.2+…+12.2) ≈12.02(百毫升).标准差s ≈√(12.1−12.02)2+(11.9−12.02)2+⋯+(12.2−12.02)220≈0.41(百毫升).(3)标准差相对于平均数来说比较小.从频率分布直方图中可以看出,每瓶的含量大致位于1 150毫升到1 250毫升之间.因此可判断装瓶机工作稳定.。
(常考题)北师大版高中数学必修三第一章《统计》检测卷(含答案解析)(2)
一、选择题1.某商场为了了解毛衣的月销售量y (件)与月平均气温x (C ︒)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: 月平均气温x C ︒171382月销售量y (件)24334055由表中数据算出线性回归方程y bx a =+中的2b =-,气象部门预测下个月的平均气温为6C ︒,据此估计该商场下个月毛衣销售量约为( )A .58件B .40件C .38件D .46件2.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .3.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( ) A .70和50B .70和67C .75和50D .75和674.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3OP (O 为原点)的斜率的取值范围是3333(,)(,)282-∞-. A .①②③B .①③④C .①②④D .②③④5.某宠物商店对30只宠物狗的体重(单位:千克)作了测量,并根据所得数据画出了频率分布直方图如下图所示,则这30只宠物狗体重(单位:千克)的平均值大约为( )A.15.5 B.15.6 C.15.7 D.166.某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为()A.30 B.25 C.20 D.157.高二某班共有学生60名,座位号分别为01, 02, 03,···, 60.现根据座位号,用系统抽样的方法,抽取一个容量为4的样本.已知03号、18号、48号同学在样本中,则样本中还有一个同学的座位号是()A.31号B.32号C.33号D.34号8.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x为()A.64 B.96 C.144 D.1609.已知x,y的取值如表:x2678y若x,y之间是线性相关,且线性回归直线方程为,则实数a的值是A.B.C.D.10.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数()A .40B .45C .48D .5011.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是( )A .4B .5C .6D .712.已知一组数据12,,,n x x x 的平均数3x =,则数据1232,32,,32n x x x +++的平均数为( ) A .3B .5C .9D .11二、填空题13.随机抽取100名年龄在[10,20),[20,30),…,[50,60)年龄段的市民进行问卷调查,由此得到样本的频率分布直方图如图所示.从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人,则在[50,60)年龄段抽取的人数为______.14.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.15.已知x ,y 的取值如下表: x 2 3 4 5 y2.23.85.56.5从散点图分析,y 与x 线性相关,且回归方程为y =1.46x +a ,则实数a 的值为________.16.某学校高一年级男生人数占该年级学生人数的45%,在一次考试中,男、女生平均分数依次为72、74,则这次考试该年级学生的平均分数为__________.17.下表为生产A 产品过程中产量x (吨)与相应的生产耗能y (吨)的几组相对应数据:x3 4 5 6y23.5 55.5根据上表提供的数据,得到y 关于x 的线性回归方程为0.7y x a =+,则a =__________. 18.已知某人连续5次射击的环数分别是8,9,10,x ,8,若这组数据的平均数是9,则这组数据的方差为 .19.某班60名学生参加普法知识竞赛,成绩都在区间[40100],上,其频率分布直方图如图所示,则成绩不低于60分的人数为___.20.某校对全校1200名男女学生进行健康调查,采用分层抽样法抽取一个容量为200的样本,已知女生抽了95人,则该校的男生数是__________.三、解答题21.某食品厂为了检测某批袋装食品的质量,从该批食品中抽取了一个容量为100的样本,测量它们的质量(单位:克).根据数据分为[)92,94,[)94,96,[)96,98,[)99,100,[)100,102,[)102,104,[]104,106七组,其频率分布直方图如图所示.(1)根据频率分布直方图,估计这批袋装食品质量的中位数.(保留一位小数) (2)记产品质量在[)98,102内为优等品,每袋可获利5元;产品质量在[)92,94内为不合格品,每袋亏损2元;其余的为合格品,每袋可获利3元.若该批食品共有10000袋,以样本的频率代替总体在各组的频率,求该批袋装食品的总利润.22.学校食堂统计了最近5天到餐厅就餐的人数x (百人)与食堂向食材公司购买所需食材(原材料)的数量y (袋),得到如下统计表:第一天 第二天 第三天 第四天 第五天 就餐人数x (百人) 13 9 8 10 12 原材料y (袋)3223182428(1)根据所给的5组数据,求出关于的线性回归方程ˆˆˆy bx a =+;(2)已知购买食材的费用C (元)与数量y (袋)的关系为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩,投入使用的每袋食材相应的销售单价为700元,多余的食材必须无偿退还食材公司,据悉下周一大约有1500人到食堂餐厅就餐,根据(1)中求出的线性回归方程,预测食堂应购买多少袋食材,才能获得最大利润,最大利润是多少?(注:利润L =销售收入-原材料费用)参考公式:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-参考数据:511343i ii x y==∑,521558i i x ==∑,5213237i i y ==∑23.为了了解高中新生的体能情况,某学校抽取部分高一学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从 左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12﹒(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.24.某校2011年到2019年参加“北约”“华约”考试而获得加分的学生人数(每位学生只能参加“北约”“华约”中的一种考试)可以通过以下表格反映出来.(为了方便计算,将2011年编号为1,2012年编号为2,依此类推) 年份x 1 2 3 4 5 6 7 8 9 人数y23545781010(1)求这九年来,该校参加“北约”“华约”考试而获得加分的学生人数的平均数和方差; (2)根据最近五年的数据,利用最小二乘法求出y 与x 的线性回归方程,并依此预测该校2020年参加“北约”“华约”考试而获得加分的学生人数.(最终结果精确至个位) 参考数据:回归直线的方程是y bx a =+,其中()()()1221121niii nnin i i ii ii x y nx y b n x x x xy x xy ====-=---=-∑∑∑∑,a y bx =-.95293i ii x y==∑,925255i i x ==∑.25.新能源汽车的春天来了!2018年3月5日上午,李克强总理做政府工作报告时表示,将新能源汽车车辆购置税优惠政策再延长三年,自2018年1月1日至2020年12月31日,对购置的新能源汽车免征车辆购置税.某人计划于2018年5月购买一辆某品牌新能源汽车,他从当地该品牌销售网站了解到近五个月实际销量如下表:(1)经分析,可用线性回归模型拟合当地该品牌新能源汽车实际销量y(万辆)与月份编号t之间的相关关系.请用最小二乘法求y关于t的线性回归方程y bt a=+,并预测2018年5月份当地该品牌新能源汽车的销量;(2)2018年6月12日,中央财政和地方财政将根据新能源汽车的最大续航里程(新能源汽车的最大续航里程是指理论上新能源汽车所装的燃料或电池所能够提供给车跑的最远里程)对购车补贴进行新一轮调整.已知某地拟购买新能源汽车的消费群体十分庞大,某调研机构对其中的200名消费者的购车补贴金额的心理预期值进行了一个抽样调查,得到如下一份频数表:将频率视为概率,现用随机抽样方法从该地区拟购买新能源汽车的所有消费者中随机抽取3人,记被抽取3人中对补贴金额的心理预期值不低于3万元的人数为ξ,求ξ的分布列及数学期望()Eξ.参考公式及数据:①回归方程y bx a=+,其中()()()1122211ˆn ni i i ii in ni ii ix x y y x y nxybx x x nx====---==--∑∑∑∑,a y bx=-,②5118.8i iit y ==∑.26.随着各国经贸关系的进一步加深,许多国外的热带水果进入国内市场,牛油果作为一种热带水果,越来越多的中国消费者对这种水果有了一种全新的认识,它富含多种维生素、丰富的脂肪和蛋白质,钠、钾、镁、钙等含量也高,除作生果食用外也可作菜肴和罐头.牛油果原产于墨西哥和中美洲,后在加利福尼亚州被普遍种植.因此加利福尼亚州成为世界上最大的牛油果生产地,在全世界热带和亚热带地区均有种植,但以美国南部、危地马拉、墨西哥及古巴栽培最多,并形成了墨西哥系、危地马拉系、西印度系三大种群,我国的广东、海南、福建、广西、台湾、云南及四川等地都有少量栽培.市场上的牛油果大部分都是进口的.为了调查市场上牛油果的等级代码数值x与销售单价y之间的关系,经统计得到如下数据:等级代码数值x 38 48 58 68 78 88 销售单价y (元/kg )16.818.820.822.82425.8(1)已知销售单价y 与等级代码数值x 之间存在线性相关关系,利用前5组数据求出y 关于x 的线性回归方程;(2)若由(1)中线性回归方程得到的估计值与最后一组数据的实际值之间的误差不超过1,则认为所求回归方程是有效可靠的,请判断所求回归直线方程是否有效可靠? (3)若一果园估计可以收获等级代码数值为85的牛油果980kg ,求该果园估计收入为多少元.参考公式:对一组数据()11,x y ,()22,x y ,…,(),n n x y ,其回归直线y bx a =+的斜率和截距的最小二乘估计分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,b y bx =-.参考数据:516169.6i ii x y==∑,52117820i i x ==∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】试题分析:由表格得(),x y 为:()10,38,因为(),x y 在回归方程y bx a =+上且2b =-,()38102a ∴=⨯-+,解得58a =∴2ˆ58y x =-+,当6x =时,26ˆ5846y=-⨯+=,故选D. 考点:1、线性回归方程的性质;2、回归方程的应用.2.D解析:D 【解析】 【分析】 先计算,代入回归直线方程,可得,从而可求得结果.【详解】因为,所以,代入回归直线方程可求得,所以,故选D.【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.3.B解析:B【解析】【分析】根据平均数、方差的概念表示出更正前的平均数、方差和更正后的平均数、方差,比较其异同,然后整体代入即可求解.【详解】设更正前甲,乙,…的成绩依次为a1,a2,…,a50,则a1+a2+…+a50=50×70,即60+90+a3+…+a50=50×70,(a1﹣70)2+(a2﹣70)2+…+(a50﹣70)2=50×75,即102+202+(a3﹣70)2+…+(a50﹣70)2=50×75.更正后平均分为x=150×(80+70+a3+…+a50)=70;方差为s2=150×[(80﹣70)2+(70﹣70)2+(a3﹣70)2+…+(a50﹣70)2]=150×[100+(a3﹣70)2+…+(a50﹣70)2]=150×[100+50×75﹣102﹣202]=67.故选B.【点睛】本题考查平均数与方差的概念与应用问题,是基础题.4.C解析:C【分析】利用线性回归方程系数的几何意义,圆锥曲线离心率的范围,椭圆的性质,逐一判断即可.【详解】①设某大学的女生体重y(kg)与身高x(cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的线性回归方程为y∧=0.85x﹣85.71,则若该大学某女生身高增加1cm,则其体重约增加0.85kg,正确;②关于x的方程x2﹣mx+1=0(m>2)的两根之和大于2,两根之积等于1,故两根中,一根大于1,一根大于0小于1,故可分别作为椭圆和双曲线的离心率.正确;③设定圆C的方程为(x﹣a)2+(x﹣b)2=r2,其上定点A(x0,y0),设B(a+r cosθ,b+r sinθ),P(x,y),由12OP =(OA OB+)得22x a rcosxy b rsinyθθ++⎧=⎪⎪⎨++⎪=⎪⎩,消掉参数θ,得:(2x﹣x0﹣a)2+(2y﹣y0﹣b)2=r2,即动点P的轨迹为圆,∴故③不正确;④由22143x y+=,得a2=4,b2=3,∴1c==.则F(﹣1,0),如图:过F作垂直于x轴的直线,交椭圆于A(x轴上方),则x A=﹣1,代入椭圆方程可得32Ay=.当P为椭圆上顶点时,P(0FPk=32OAk=-,∴当直线FPOP的斜率的取值范围是32⎛⎫-∞-⎪⎝⎭,.当P为椭圆下顶点时,P(0,∴当直线FPOP,32),综上,直线OP(O为原点)的斜率的取值范围是32⎛⎫-∞-⎪⎝⎭,∪,32).故选C【点睛】本题以命题真假的判断为载体,着重考查了相关系数、离心率、椭圆简单的几何性质等知识点,属于中档题.5.B解析:B【分析】由频率分布直方图分别计算出各组得频率、频数,然后再计算出体重的平均值【详解】由频率分布直方图可以计算出各组频率分别为:0.10.20.250.250.15,,,,,0.05频数为:367.57.54.51.5,,,,,则平均值为:113136157.5177.519 4.521 1.515.630⨯+⨯+⨯+⨯+⨯+⨯=故选B 【点睛】本题主要考查了由频率分布直方图计算平均数,需要注意计算不要出错6.C解析:C【详解】抽取比例为1501 30000200=,1400020200∴⨯=,抽取数量为20,故选C.7.C解析:C【解析】【分析】根据系统抽样知,组距为604=15÷,即可根据第一组所求编号,求出各组所抽编号.【详解】学生60名,用系统抽样的方法,抽取一个容量为4的样本,所以组距为604=15÷,已知03号,18号被抽取,所以应该抽取181533+=号,故选C.【点睛】本题主要考查了抽样,系统抽样,属于中档题.8.D解析:D【解析】【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81= 12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数.【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81= 12816,因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D.【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题9.B解析:B【解析】【分析】根据所给的两组数据,做出横标和纵标的平均数,写出这组数据的样本中心点,根据线性回归方程一定过样本中心点,得到线性回归直线一定过的点的坐标. 【详解】 根据题意可得,,由线性回归方程一定过样本中心点,.故选:B . 【点睛】本题考查线性回归方程的意义,线性回归方程一定过样本中心点,本题解题的关键是正确求出样本中心点,题目的运算量比较小,是一个基础题.10.C解析:C 【分析】根据频数关系,求出前三段每段的频数,由直方图求出四五组的频率,进而求出前三组的频率和,从而可求该校报名学生的总人数. 【详解】从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,∴从左到右3个小组的频数分别为6,12,18,共有36人,第4,5小组的频率之和为()0.03750.012550.25+⨯=, 则前3小组的频率之和为10.250.75-=, 则该校报名学生的总人数为360.7548÷=,故选C. 【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标相乘后求和可得平均值;(4)直观图左右两边面积相等处横坐标表示中位数.11.B解析:B 【解析】分析:首先写出所有学生的乘积,然后结合系统抽样的方法整理计算即可求得最终结果. 详解:由题意可知,学生的成绩如下:111,111,112,113,113; 116,117,117,118,118; 120,120,121,122,122; 123,124,124,126127; 128,128,129,129,129; 131,131,131,132,132; 132,133,134,134,135; 137,138,138,138,139;140,142,142,143,144.用系统抽样方法从中抽取9人,则每5人中抽取一人,即上述分组中每组抽取一人, 则所抽取的学生的成绩在区间[]120,135上的学生人数为5. 本题选择B 选项.点睛:本题主要考查系统抽样的概念及其应用,茎叶图的识别等知识,意在考查学生的转化能力和计算求解能力.12.D解析:D 【解析】分析:一组数据中的每一个数加或减一个数,它的平均数也加或减这个数;;依此规律求解即可.详解::∵一组数据12,,,n x x x 的平均数为3, ∴另一组数据1232,32,,32n x x x +++的平均数121211323232[32]33211n n x x x x x x n n n=++++⋯++=++⋯++=⨯+=()(), 故选D.点睛:本题考查了平均数,平均数是指在一组数据中所有数据之和再除以数据的个数.它是反映数据集中趋势的一项指标.二、填空题13.3【分析】根据频率分布直方图求得不小于40岁的人的频率及人数再利用分层抽样的方法即可求解得到答案【详解】根据频率分布直方图得样本中不小于40岁的人的频率是0015×10+0005×10=02所以不小解析:3 【分析】根据频率分布直方图,求得不小于40岁的人的频率及人数,再利用分层抽样的方法,即可求解,得到答案. 【详解】根据频率分布直方图,得样本中不小于40岁的人的频率是0.015×10+0.005×10=0.2, 所以不小于40岁的人的频数是100×0.2=20;从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人, 在[50,60)年龄段抽取的人数为0.0051010012320⨯⨯⨯=.【点睛】本题主要考查了频率分布直方图的应用,其中解答中熟记频率分布直方图的性质,以及频率分布直方图中概率的计算方法是解答的关键,着重考查了推理与运算能力,属于基础题.14.2【解析】【分析】根据系统抽样的概念结合可得最后结果为2【详解】学生总数不能被容量整除根据系统抽样的方法应从总体中随机剔除个体保证整除∵故应从总体中随机剔除个体的数目是2故答案为2【点睛】本题主要考解析:2 【解析】 【分析】根据系统抽样的概念结合2544262=⨯+,可得最后结果为2. 【详解】学生总数不能被容量整除,根据系统抽样的方法,应从总体中随机剔除个体,保证整除. ∵2544262=⨯+,故应从总体中随机剔除个体的数目是2,故答案为2. 【点睛】本题主要考查系统抽样,属于基础题;从容量为N 的总体中抽取容量为n 的样本,系统抽样的前面两个步骤是:(1)将总体中的N 个个体进行编号;(2)当Nn为整数时,抽样距即为N n ;当N n不是整数时,从总体中剔除一些个体,使剩下的总体中的个体的个数N '能被n 整除.15.—061【分析】根据所给条件求出把样本中心点代入回归直线方程可以得到关于的方程解出即可得到答案【详解】根据题意可得则这组数据的样本中心点是代入到回归直线方程故答案为【点睛】本题考查了线性回归方程解题解析:—0.61 【分析】根据所给条件求出x ,y ,把样本中心点()x y ,代入回归直线方程 1.4ˆ6ˆyx a +=,可以得到关于ˆa的方程,解出即可得到答案 【详解】 根据题意可得23453.54x +++== 2.2 3.8 5.5 6.54.54y +++==则这组数据的样本中心点是()3.54.5,代入到回归直线方程 1.4ˆ6ˆyx a += 4.5 1.46 3.ˆ5a ∴⨯+= ˆ0.61a=- 故答案为0.61- 【点睛】本题考查了线性回归方程,解题的关键是线性回归方程一定过样本中心点,这是求解线性回归方程的步骤之一,是线性回归方程考查的常见题型,体现了回归直线方程与样本中心点的关联.16.1【解析】分析:根据平均数与对应概率乘积的和得总平均数计算结果详解:点睛:本题考查平均数考查基本求解能力解析:1 【解析】分析:根据平均数与对应概率乘积的和得总平均数,计算结果. 详解:7245%74(145%)72.1⨯+⨯-=. 点睛:本题考查平均数,考查基本求解能力.17.【解析】分析:首先求得样本中心点然后利用回归方程的性质求得实数a 的值即可详解:由题意可得:线性回归方程过样本中心点则:解得:点睛:本题主要考查线性回归方程的性质及其应用等知识意在考查学生的转化能力和 解析:0.85【解析】分析:首先求得样本中心点,然后利用回归方程的性质求得实数a 的值即可. 详解:由题意可得:34569==42x +++,2 3.55 5.544y +++==, 线性回归方程过样本中心点9,42⎛⎫⎪⎝⎭,则:940.72a =⨯+,解得:0.85a =.点睛:本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.18.【解析】分析:先根据平均数求x 的值再求数据的方差详解:由题得所以数据的方差为故答案为点睛:(1)本题主要考查平均数和方差的计算意在考查学生对这些基础知识的掌握水平(2)方差公式为解析:45【解析】分析:先根据平均数求x 的值,再求数据的方差. 详解:由题得8+9+8109,10.5x x ++=∴=所以数据的方差为22222214[(89)(99)(109)(109)(89)]55S =-+-+-+-+-=.故答案为45. 点睛:(1)本题主要考查平均数和方差的计算,意在考查学生对这些基础知识的掌握水平.(2) 方差公式为222121[()()()]n S x x x x x x n=-+-+⋅⋅⋅+-. 19.30【解析】由题意可得:则成绩不低于分的人数为人解析:30 【解析】 由题意可得:()400.0150.0300.0250.0051030⨯+++⨯=则成绩不低于60分的人数为30人20.630【解析】每层的抽样比为女生抽了95人所以男生抽取105人因此共有男生人故填630解析:630 【解析】 每层的抽样比为200112006=,女生抽了95人,所以男生抽取105人,因此共有男生1056630⨯=人,故填630.三、解答题21.(1)99.6;(2)35600元. 【分析】(1)根据频率分布直方图中的中位数在长方形面积为0.5的地方取得得解. (2)求出批食品中优等品、不合格品、合格品的袋数得总利润. 【详解】(1)因为(0.020.040.12)20.360.5,0.360.0920.540.5++⨯=<+⨯=>, 所以样本质量的中位数在[98,100)内.设样本质量的中位数为m ,则980.0920.360.52m -⨯⨯+=, 解得99.6m ≈,故这批袋装食品质量的中位数为99.6.(2)由题意可得,这批食品中优等品有10000(0.090.10)23800⨯+⨯=袋, 这批食品中不合格品有100000.022400⨯⨯=袋, 这批食品中合格品有1000038004005800--=袋.故该批袋装食品的总利润为3800558003400235600⨯+⨯-⨯=元. 【点睛】频率分布直方图中的中位数求法在长方形面积为0.5的地方取得是解题关键,属于基础题. 22.(1) 2.51y x =-;(2)食堂购买36袋食,能获得最大利润,最大利润为11520元. 【分析】(1)本题首先可根据题中所给数据求出x 、y ,然后根据51522155i ii ii x y x yb xx==-⋅=-∑∑求出b ,最后根据a y bx =-求出a ,即可得出结果;(2)本题首先可根据 2.51y x =-得出预计需要购买食材36.5袋,然后分为36y <、36y ≥两种情况进行讨论,分别求出最大值后进行比较,即可得出结果.【详解】(1)由所给数据可得:1398101210.45x ++++==,3223182428255y ++++==,515222151343510.4252.5558510.45i ii i i x y x yb x x==-⋅-⨯⨯===-⨯-∑∑,25 2.510.41a y bx =-=-⨯=-,故y 关于x 的线性回归方程为 2.51y x =-.(2)因为 2.51y x =-,所以当15x =时36.5y =,即预计需要购买食材36.5袋,因为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩, 所以当36y <时,利润()7004002030020L y y y =--=+, 此时当35y =时,max 300352010520L =⨯+=, 当36y ≥时,由题意可知,剩余的食材只能无偿退还, 此时当36y时,700363803611520L =⨯-⨯=,当37y =时,利润70036.53803711490L =⨯-⨯=,综上所述,食堂应购买36袋食,才能获得最大利润,最大利润为11520元. 【点睛】本题考查线性回归直线方程,考查回归方程的应用,考查学生的数据处理能力以及运算求解能力.考查分类讨论思想,属于中档题.23.(1)0.08,150;(2)88%;(3)第四小组,理由见解析 【解析】试题分析:(1)由频率分布直方图中各小矩形面积之和为1结合面积之比得到第二小组的频率,从而求得样本容量;(2)由频率分布直方图中各小矩形的面积和为1与面积之比可求出达标的频率即达标率;(3)求出前四组的频数即可得到中位数所在的区间. 试题(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为: 又因为频率=所以(2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内. 考点:频率分布直方图 24.(1)6;689;(2) 1.3 1.1y x =-,12人. 【分析】(1)由表格中的数据,利用平均数和方差的公式,即可求解;(2)由表中近五年的数据,利用公式,求得ˆˆ,b a ,求得回归直线方程,代入10x =,即可作出结论. 【详解】(1)由表格中的数据,利用平均数的计算公式,可得2354578101069++++++++=.由方差的公式,可得()()()2222168263610699s ⎡⎤=-+-++-=⎣⎦.(2)由表中近五年的数据知,7x =,8y =,95293i ii x y ==∑,925255i i x ==∑,9592255293578ˆ 1.32555495i ii i i x y xybx x==--⨯⨯===-⨯-∑∑,又a y bx =-,所以8 1.37 1.1a =-⨯=-, 故y 与x 的线性回归方程为 1.3 1.1y x =-, 当10x =时, 1.310 1.111.912y =⨯-=≈,故估计该校2020年参加“北约”“华约”考试而获得加分的学生有12人. 【点睛】本题主要考查了平均数与方差的计算,以及回归直线方程的求解及应用,其中解答中认真审题,根据公式准确计算是解答的关键,着重考查运算与求解能力. 25.(1)约为2万辆;(2)见解析 【分析】(1)利用最小二乘法求y 得关于t 的线性回归方程为0.3208ˆ.0yt =+,再令6t =得到2018年5月份当地该品牌新能源汽车的销量.(2)先分析得到ξ~33,5B ⎛⎫ ⎪⎝⎭,再根据二项分布求ξ的分布列及数学期望()E ξ. 【详解】 (1)易知1234535t ++++==,0.50.61 1.4 1.71.045y ++++==,522222211234555ii t ==++++=∑,218.853 1.040.32555ˆ3b -⨯⨯==-⨯,1.040.320ˆ3.08a=-⨯= 则y 关于t 的线性回归方程为0.3208ˆ.0yt =+, 当6t =时,ˆ 2.00y=,即2018年5月份当地该品牌新能源汽车的销量约为2万辆. (2)根据给定的频数表可知,任意抽取1名拟购买新能源汽车的消费者,对补贴金额的心理预期值不低于3万元的概率为12032005=,由题意可知ξ~33,5B ⎛⎫⎪⎝⎭,ξ的所有可能取值为0,1,2,3ξ的分布列为:()0303328055125P C ξ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭, ()12133236155125P C ξ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭ ()21233254255125P C ξ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭, ()30333227355125P C ξ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭所以()5E ξ= 【点睛】(1)本题主要考查回归方程的求法,考查二项分布,意在考查学生对这些知识的掌握水平和分析推理能力.(2) 如果在一次试验中某事件发生的概率是P ,那么在n 次独立重复试验中这个事件恰好发生K 次的概率是()(1)kkn kn n P k C p p ξ-==-,(0,1,2,3,...k n =).正好是二项式[(1)]n p p -+的展开式的第1k +项.所以记作ξ~(,)B n p ,读作ξ服从二项分布,其中,n p 为参数.26.(1)0.1849.968y x =+;(2)所求回归直线方程是有效可靠的;(3)该果园预计收入25095.84元. 【分析】(1)求出x 的平均值x ,y 的平均值y ,再根据公式求出b 和a ,即可得出回归方程;。
高中数学 第1章 统计 §2 2.2 分层抽样与系统抽样(教师用书)教案 北师大版必修3-北师大版高
2.2 分层抽样与系统抽样 学 习 目 标核 心 素 养,准确把握分层抽样、系统抽样的概念.(重点)2.会用分层抽样、系统抽样解决实际问题.(难点)3.了解各种抽样方法的适用X 围,能根据具体情况选择恰当的抽样方法.(难点) 、系统抽样的概念,培养数学抽象素养.2.通过运用分层抽样、系统抽样解决实际问题,提升数据分析素养.一、分层抽样1.分层抽样的概念将总体按其属性特征分成假设干类型(有时称为层),然后在每个类型中按照所占比例随机抽取一定的样本,这种抽样方法通常叫作分层抽样,有时也称为类型抽样.2.对分层抽样的公平性的理解在分层抽样的过程中,每个个体被抽到的概率是相同的,与分层的情况无关.如果总体的个体数是N ,共分k 层,n 为样本容量,N i (i =1,2,3,…,k )是第i 层中的个体数,那么第i 层中所要抽取的个体数n i =n ×N i N ,而每一个个体被抽取的可能性是n i N i =n N,与层数无关,所以对所有个体而言,其被抽到的概率是相同的,也就是说分层抽样是公平的.二、系统抽样的概念将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按分组的间隔(称为抽样距)抽取其他样本.这种抽样方法叫系统抽样,有时也叫等距抽样或机械抽样.思考:系统抽样一般适用于具有怎样特征的样本?[提示]系统抽样的实质是“分组〞抽样,适用于总体中的个体数较大的情况.1.以下问题中,最适合用分层抽样抽取样本的是( )A .从10名同学中抽取3人参加座谈会B .某社区有500个家庭,其中高收入的家庭125个,中等收入的家庭280个,低收入的家庭95个,为了了解生活购买力的某项指标,要从中抽取一个容量为100的样本C .从1 000名工人中,抽取100名调查上班途中所用时间D .从生产流水线上,抽取样本检查产品质量B [A 中总体个体无明显差异且个数较少,适合用简单随机抽样;C 和D 中总体个体无明显差异且个数较多,不适合用分层抽样;B 中总体中的个体差异明显,适合用分层抽样.]2.为了解1 200名学生对学校食堂饭菜的意见,打算从中抽取一个样本容量为40的样本,考虑采用系统抽样,那么分段间隔k 为( )A .10B .20C .30D .40C [分段间隔k =1 20040=30.] 3.甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生,为统计三校学生某方面的情况,计划采用分层抽样法抽取一个容量为90的样本,应在这三校分别抽取学生( )A .30人,30人,30人B .30人,45人,15人C .20人,30人,10人D .30人,50人,10人B [先求抽样比n N =903 600+5 400+1 800=1120,再各层按抽样比分别抽取,甲校抽取 3 600×1120=30(人),乙校抽取5 400×1120=45(人),丙校抽取1 800×1120=15(人),应选B.] 4.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,那么应从一年级本科生中抽取________名学生.60[根据题意,应从一年级本科生中抽取的人数为44+5+5+6×300=60.]分层抽样用哪种抽样方法更合理?青、中、老年职工应分别抽取多少人?每人被抽到的可能性相同吗?[解]因为总体由差异明显的三部分(青、中、老年)组成,所以采用分层抽样的方法更合理. 因为青、中、老年职工的比例是3∶5∶2,所以应分别抽取:青年职工400×310=120(人); 中年职工400×510=200(人); 老年职工400×210=80(人). 由样本容量为400,总体容量为3 200可知,抽样比是4003 200=18,所以每人被抽到的可能性相同,均为18.1.分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占的比例抽取.2.用分层抽样抽取样本时,需照顾到各层中的个体,所以每层抽取的比例应等于样本容量在总体中的比例.3.在分层抽样中,确定抽样比k 是抽样的关键.一般地,抽样比k =n N(N 为总体容量,n 为样本容量),按抽样比k 在各层中抽取个体,就能确保抽样的公平性.4.在每层抽样时,应采用简单随机抽样或系统抽样的方法进行.[跟进训练]1.,按地域把48个城市分成大型、中型、小型三组,,那么应抽取的中型城市数为 ( )A .3B .4C .5D .6(2)我国古代数学名著《数书九章》有“米谷粒分〞题:粮仓开仓收粮,有人送来米1 534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,那么这批米内夹谷约为( )A .134石B .169石C .338石D .1 365石(1)B (2)B [(1)根据分层抽样的特点可知,抽样比例为1248=14,那么应抽取的中型城市数为16×14=4.(2)设1 534石米内夹谷x 石,那么由题意知x 1 534=28254,解得x ≈.]系统抽样【例2】 某单位共有在岗职工624人,为了调查职工上班时从离开家到来到单位的平均用时,决定抽取10%的工人进行调查,如何采用系统抽样完成这一抽样?[解]第一步:由题意知,应抽取在岗职工62人作为样本,即分成62组,由于62462的商是10,余数是4,所以每组有10人,还剩4人.这时,抽样距是10;第二步:用随机数法从这些职工中抽取4人并剔除,不进行调查;第三步:将余下的在岗职工620人进行编号,编号分别为000,001,002,…,619; 第四步:在第一组000,001,002,…,009这10个编号中,随机选定一个起始编号,每间隔10抽取一个编号,共抽62个编号,这样就抽取了容量为62的一个样本.1.解决此题时,对总体、个体先进行编号,然后依据样本容量确定分段数及每段间隔长度,再利用简单随机抽样法在第1段中抽取一个作为起始,并依次加间隔长度即可获取样本.2.系统抽样又称等距抽样,当给出总体数和样本容量后,应先确定组数和组距(注意一般组数等于样本容量/组距),在第一组抽取起始后,只需依次加间隔长度即可得到样本.[跟进训练]2.(1)某影院有40排座位,每排有46个座位,一个报告会上坐满了听众,会后留下座号为20的所有听众进行座谈,这是运用了( )A .抽签法B .随机数法C .系统抽样法D .放回抽样法 (2)为了解1 200名学生对学校某项教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,那么分段的间隔k =________.(1)C (2)40[(1)此抽样方法将座位分成40组,每组46个个体,会后留下座号为20的相当于第一组抽20号,以后各组抽取20+46n ,n =1,2,3,…,符合系统抽样特点.(2)根据样本容量为30,将1 200名学生分为30段,每段人数即间隔k =1 20030=40.]三种抽样方法的综合应用[探究问题]1.简单随机抽样是不放回抽样吗?提示:是不放回抽样.2.分层抽样时为什么要将总体分成互不重叠的层?提示:在总体中由于个体之间存在着明显的差异,为了使抽取的样本更合理、更具代表性,故将总体分成互不重叠的层,而后独立地抽取一定数量的个体.3.系统抽样的第二步中,当Nn不是整数时,从总体中剔除一些个体采用的方法是什么?影响系统抽样的公平性吗?提示:剔除一些个体可以用简单随机抽样的方法抽取,不影响系统抽样的公平性.【例3】①某学校为了了解高一学生的情况,从每班抽2人进行座谈;②一次数学竞赛中,某班有10人的成绩在110分以上,10人的成绩在100~110分,30人的成绩在90~100分,12人的成绩低于90分,现在从中抽取12人了解有关情况;③运动会服务人员为参加400 m决赛的6名同学安排跑道.就这三件事,合适的抽样方法分别为________、________、________.系统抽样分层抽样简单随机抽样[系统抽样适合总体中个体数量比较大的情况.分层抽样适合总体由差异明显的几部分组成的情况.总体中个体数比较少的时候,选用简单随机抽样.]三种抽样方法的比较类别共同点各自特点相互联系适用X围简单随机抽样(1)抽样过程中每个个体被抽取的概率相等;(2)均属于不放从总体中逐个抽取总体中的个体数较少系统抽样将总体均分成几部分,按事先确定的规那么在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多分层 抽样 回抽样将总体分成几层,分层进行抽取 各层抽样时采用简单随机抽样或系统抽样 总体由差异明显的几部分组成[跟进训练] 3.某社区有700户家庭,其中高收入家庭有225户,中收入家庭有400户,低收入家庭有75户,为了调查社会购买力的某项指标,要从中抽取一个容量为100户的样本,记作①;某中学高二年级有12名篮球运动员,要从中选出3人调查投篮命中率情况,记作②;从某厂生产的802辆轿车中抽取40辆测试某项性能,记作③.为完成上述三项抽样,那么应采取的抽样方法是( )A .①简单随机抽样,②系统抽样,③分层抽样B .①分层抽样,②简单随机抽样,③系统抽样C .①简单随机抽样,②分层抽样.③系统抽样D .①分层抽样,②系统抽样,③简单随机抽样B [对于①.总体由差异明显的高收入家庭、中收入家庭和低收入家庭三部分组成,而所调查的指标与收入情况密切相关,所以应采用分层抽样;对于②,总体中的个体数较少,而且所调查内容对12名调查对象是平等的,应采用简单随机抽样;对于③,总体中的个体数较多,且个体之间差异不明显,样本中个体数也较多,应采用系统抽样.]1.对于分层抽样中的比值问题,常利用以下关系式解:(1)样本容量n 总体容量N =各层抽取的样本数该层的容量; (2)总体中各层容量之比=对应层抽取的样本数之比.2.选择抽样方法的规律:(1)当总体容量较小,样本容量也较小时,制签简单,号签容易搅匀,可采用抽签法.(2)当总体容量较大,样本容量较小时,可采用随机数法.(3)当总体容量较大,样本容量也较大时,可采用系统抽样法.(4)当总体是由差异明显的几部分组成时,可采用分层抽样法.1.思考辨析(1)分层抽样中每层抽样的可能性是不相等的.()(2)分层抽样时,样本是在各层中分别抽取.()(3)分层抽样时,如果总体个数不能被样本容量整除,那么应先剔除部分个体.()(4)系统抽样的分段段数与所抽取的样本容量的关系是相等.()(5)系统抽样时每个个体被抽到的机会不同.()(6)系统抽样时,如果总体个数不能被样本容量整除,那么应先剔除部分个体.()[解析](1)×,每个个体被抽到的可能性相同.(2)√,由分层抽样的概念知正确.(3)√,由于考虑到实际意义,需剔除部分个体.(4)√,系统抽样时,分段的段数由所抽样本容量确定.(5)×,无论是系统抽样还是分层抽样,每个个体被抽到的机会都相等.(6)√,系统抽样时为了保证间隔k为整数,应先剔除一部分个体.[答案](1)×(2)√(3)√(4)√(5)×(6)√2.为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样C[由于该地区的中小学生人数比较多,不能采用简单随机抽样,排除选项A;由于小学、初中、高中三个学段的学生视力差异性比较大,可采取按照学段进行分层抽样,而男女生视力情况差异性不大,不能按照性别进行分层抽样,排除B和D.应选C.]3.某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况.用分层抽样的方法从该学生中抽取一个容量为n的样本.高中学生抽取70人,那么n的值为________.100[由题意,得703 500=n3 500+1 500,解得n=100.]4.从编号为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量是5的样本,假设编号为28的产品在样本中,那么该样本中产品的最大编号为________.76[根据系统抽样的定义可得,样本中产品的编号间隔为16,再根据编号为28的产品在样本中,可得样本中产品的编号为12,28,44,60,76,故该样本中产品的最大编号为76.]。
高中数学 第一章 统计 1.2.1 简单随机抽样课时作业(含解析)北师大版必修3-北师大版高一必修3
课时作业2 简单随机抽样时间:45分钟满分:100分——基础巩固类——一、选择题(每小题5分,共40分)1.关于简单随机抽样,下列说法中不正确的是(B)A.当总体中个体数不多时,可以采用简单随机抽样B.采用简单随机抽样不会产生任何代表性差的样本C.利用随机数表抽取样本时,读数的方向可以向右,也可以向左、向下、向上等D.抽签法抽取样本对每个个体来说都是公平的解析:简单随机抽样可能产生代表性差的样本.故选B.2.抽签法中确保样本具有代表性的关键是(B)A.制签B.搅拌均匀C.逐一抽取D.抽取不放回解析:要确保样本具有代表性,用抽签法时,最重要的是要使总体“搅拌均匀”,使每个个体被抽到的可能性相等.使用抽签法制作号签后一定要搅拌均匀.3.下列说法正确的是(B)A.抽签法中可一次抽取两个个体B.随机数法中每次只取一个个体C.简单随机抽样是放回抽样D.抽签法中将号签放入箱子中,可以不搅拌直接抽取4.从总数为N的一批零件中抽取一个容量为30的样本,若每个零件被抽取的可能性为25%,则N为(D)A.150B.200C.100D.120解析:N=3025%=120.5.用随机数表法进行抽样有以下几个步骤:①将总体中的个体编号;②获取样本;③选定开始的数字.这些步骤的先后顺序应为( B )A .①②③B .①③②C .③②①D .③①②解析:用随机数表法抽样应先将个体编号,然后从随机数表中选取开始的数字读数,得到符合条件的样本,对应样本的个体为所得的样本.6.在简单随机抽样中,某一个个体被抽到的可能是( C )A .与第n 次抽样有关,第一次被抽中的可能性大些B .与第n 次抽样有关,最后一次被抽中的可能性较大C .与第n 次抽样无关,每次被抽中的可能性相等D .与第n 次抽样无关,每次都是等可能被抽取,但各次被抽取的可能性不一样解析:在总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等.7.对于简单随机抽样,下列说法中正确的命题有( D )①它要求被抽取样本的总体的个数是有限的,以便对其中每个个体被抽取的概率进行分析;②它是从总体中逐个地进行抽取,以便在抽取实践中进行操作;③它是一种不放回抽样;④它是一种等概率抽样,不仅每次从总体中抽取一个个体时,每个个体被抽取的概率相等,而且在整个抽样过程中,每个个体被抽取的概率也相等,从而保证了这种抽样方法的公平性.A .①②③B .①②④C .①③④D .①②③④解析:命题①②③④都正确.8.某校高一共有10个班,编号为1~10,现用抽签法从中抽取3个班进行调查,每次抽取一个,共抽3次,设高一(5)班第一次被抽到的可能性为a ,第二次被抽到的可能性为b ,则( D )A .a =310,b =29B .a =110,b =19C .a =310,b =310D .a =110,b =110解析:由简单随机抽样的定义,知每个个体在每次抽取中都有相同的可能性被抽到,故高一(5)班在每次抽取中被抽到的可能性都是110. 二、填空题(每小题5分,共15分)9.为了了解某班学生的身高情况,决定从50名同学中选取10名进行测量(已编号为00~49),利用随机数法进行抽取,得到如下3组编号,你认为正确的是②.(填序号)①26,94,29,27,43,99,55,19,81,06;②20,26,31,40,24,36,19,34,03,48;③04,00,45,32,44,22,04,11,08,49.解析:获取的样本应跳过不在样本编号内的,并应去掉重复.10.用随机数法从100名学生(男生25人)中抽选20人进行评教,某男学生被抽到的可能性是0.2.解析:因为样本容量为20,总体容量为100,所以总体中每一个个体被抽到的可能性都为20100=0.2. 11.用简单随机抽样的方法从含有6个个体的总体中,抽取一个容量为2的样本,某一个个体a “第一次被抽到的概率”,“第二次被抽到的概率”,“在整个抽样过程中被抽到的概率”分别是16,16,13. 解析:从6个个体中抽1个个体,每个个体被抽到的概率均为16,与抽取的次数无关,第二次被抽到的概率仍为16.但由于在整个抽样过程中是从6个个体中抽2个样本,故个体a 被抽到的概率为13. 三、解答题(共25分,解答应写出必要的文字说明、证明过程或演算步骤)12.(12分)某老现在课堂上对全班同学进行了两次模拟抽样,第一次采用抽签法,第二次采用随机数法.在这两次抽样中,小明第一次被抽到了,第二次没有被抽到,那么用这两种方法抽样时,小明被抽到的可能性一样吗?解:虽然都是简单随机抽样,但是每次抽出的结果可能会不相同,被抽到的可能性不是看最终结果,而是看在抽样前被抽到的可能性是不是相同,这主要取决于抽样是不是随机的,只要没有人为因素的干扰,在两次抽样中,小明被抽到的可能性都是一样的.13.(13分)现要从20名学生中抽取5名进行问卷调查,写出抽取样本的过程.解:简单随机抽样分两种:抽签法和随机数法.本题可采用抽签法进行抽取.(1)先将20名学生进行编号,从1编到20;(2)把写在形状、大小均相同的号签上;(3)将号签放在某个箱子中进行充分搅拌,力求均匀,然后依次从箱子中抽取5个号签,按这5个号签上的抽取对应的学生,即得样本.——能力提升类——14.(5分)从一群玩游戏的小孩中随机抽出k 人,一人分一个桃子后,让他们返回继续玩游戏,一会儿后,再从中任意抽出m 人,发现其中有n 个小孩曾分过桃子,估计一共有小孩子km n个. 解析:估计一共有小孩x 人,则有k x =n m, ∴x =km n. 15.(15分)公共汽车管理部门要考察一下其所管辖的30辆公共汽车的卫生状况,现决定从中抽取10辆进行检查.如果以抽签法做实验,请叙述具体的做法;如果该管理部门管辖的是70辆车,利用随机数法抽取一个简单随机样本,样本容量为30.解:(1)抽签法的步骤:第一步 编号.给所管辖的30辆车编号;第二步 定签.可以用各种不同的签,最简单的可以用纸条,将30辆车的编号写在纸条上;第三步 抽取.将纸条混合均匀,依次随机地抽取10个;第四步 调查.调查抽出的纸条所对应的车辆.(2)随机数法的步骤:第一步编号.将70辆车编上号:00,01,02, (69)第二步选数.由于总体是一个两位数的编号,所以从随机数表中随机选取一个位置开始,向某一方向依次选取两位数字,大于69的舍去,重复的舍去,直到取满30个数为止;第三步调查.调查抽出的数所对应的车辆.。
(必考题)高中数学必修三第一章《统计》测试(包含答案解析)(1)
一、选择题1.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元2.2020年2月,受新冠肺炎的影响,医卫市场上出现了“一罩难求”的现象.在政府部门的牵头下,部分工厂转业生产口罩,下表为某小型工厂2-5月份生产的口罩数(单位:万) 月份x 2 3 4 5 口罩数y4.5432.5口罩数y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 的值为( ) A .6.1B .5.8C .5.95D .6.753.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.54.已知一组数据的茎叶图如图所示,则该组数据的平均数为( )A .85B .84C .83D .815. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日6.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系 价格(万元) 25 23.5 22 20.5 销售量(辆)30333639已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆybx =+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39 B .42C .45D .507.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和928.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64 B .96C .144D .1609.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .9110.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变11.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位12.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经统计,得到一个卖出的热饮杯数与当天气温的对比表: 温度℃ -5 0 4 7 12 15 19 23 27 31 36 热饮杯数15615013212813011610489937654根据上表数据确定的线性回归方程应该是( )A .ˆ 2.352147.767yx =-+ B .ˆ 2.352127.765yx =-+ C .ˆ 2.35275.501yx =+D .ˆ 2.35263.674yx =+ 二、填空题13.已知某产品连续4个月的广告费i x (千元)与销售额i y (万元)(1,2,3,4i =)满足4115ii x==∑,4112i i y ==∑,若广告费用x 和销售额y 之间具有线性相关关系,且回归直线方程为^y bx a =+,0.6b =,那么广告费用为5千元时,可预测的销售额为___万元. 14.某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~1000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为_________15.某次测试共有100名考生参加,测试成绩的频率分布直方图如下图所示,则成绩在80分以上的人数为__________.16.已知一组数据为2,3,4,5,6,则这组数据的方差为______.17.已知一组数据:5.7,5.8,6.1,6.4,6.5,则该数据的方差是__________. 18.变量X 与Y 相对应的5组数据和变量U 与V 相对应的5组数据统计如表:X 1011.3 11.8 12.5 13 U 10 11.3 11.8 12.5 13 Y12345V54321用b 1表示变量Y 与X 之间的回归系数,b 2表示变量V 与U 之间的回归系数,则b 1与b 2的大小关系是___.19.某中学调查了400名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[]17.5,30,样本数据分组为[)17.5,20,[)20,22.5,[)22.5,25,[)25,27.5,[]27.5,30.根据直方图,这400名学生中每周的自习时间不少于22.5小时的人数是__________人.20.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b+的最小值为__________.三、解答题21.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9x (2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-22.随着人民生活水平的日益提高,某小区拥有私家车的数量与日俱增,物业公司统计了近六年小区私家车的数量,数据如下: 年份 2014 2015 20162017 2018 2019 编号x 1 2 3 4 5 6 数量y (辆)4196116190218275(1)若该小区私家车的数量y 与年份编号x 的关系可用线性回归模型来拟合,请求出y 关于x 的线性回归方程,并用相关指数2R 分析其拟合效果(2R 精确到0.01);(2)由于该小区没有配套停车位,车辆无序停放易造成交通拥堵,因此物业公司预在小区内划定一定数量的停车位,若要求在2022年小区停车位数量仍可满足需要,则至少需要规划多少个停车位. 参考数据:61936ii y==∑,614081i i i x y ==∑,62191ii x ==∑,()62137586i i y y=-=∑.附:回归方程中斜率和截距的最小二乘估计公式分别为:1221ni ii nii x y nx yb xnx==-⋅=-∑∑,a y bx =-,相关指数()()221211ni ii n ii y y R yy==-=--∑∑,残差e y y =-.23.2018年,依托用户碎片化时间的娱乐需求、分享需求以及视频态的信息负载力,短视频快速崛起;与此同时,移动阅读方兴未艾,从侧面反应了人们对精神富足的一种追求,在习惯了大众娱乐所带来的短暂愉悦后,部分用户依旧对有着传统文学底蕴的严肃阅读青睐有加.某读书APP 抽样调查了非一线城市M 和一线城市N 各100名用户的日使用时长(单位:分钟),绘制成频率分布直方图如下,其中日使用时长不低于60分钟的用户记为“活跃用户”.(1)请填写以下22⨯列联表,并判断是否有99.5%的把握认为用户活跃与否与所在城市有关?活跃用户 不活跃用户 合计城市M 城市N 合计(2)以频率估计概率,从城市M 中任选2名用户,从城市N 中任选1名用户,设这3名用户中活跃用户的人数为ξ,求ξ的分布列和数学期望.(3)该读书APP 还统计了2018年4个季度的用户使用时长y (单位:百万小时),发现y 与季度(x )线性相关,得到回归直线为ˆ4ˆyx a =+,已知这4个季度的用户平均使用时长为12.3百万小时,试以此回归方程估计2019年第一季度(5x =)该读书APP 用户使用时长约为多少百万小时. 附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥ 0.025 0.010 0.005 0.001 0k5.0246.6357.87910.82824.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x (分钟)时刻的细菌个数为y 个,统计结果如下:x 1 2 3 4 5 y23445(Ⅰ)在给出的坐标系中画出x ,y 的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y 关于x 的回归直线方程ˆˆˆybx a =+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni ii ni i x y nx yx n axby bx ====---∑∑) 25.某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x ,已知这10个分数的平均数90x =,标准差6s =,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:s =(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)26.某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120分问卷.对收回的100份有效问卷进行统计,得到如22⨯下列联表:(1)现按女生是否能做到科学用眼进行分层,从45份女生问卷中抽取了6份问卷,从这6份问卷中再随机抽取3份,并记其中能做到科学用眼的问卷的份数X ,试求随机变量X 的分布列和数学期望;(2)若在犯错误的概率不超过P 的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P 的值应为多少?请说明理由.附:独立性检验统计量22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b cd =+++.独立性检验临界值表:【参考答案】***试卷处理标记,请不要删除一、选择题 1.C【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.2.C解析:C 【分析】求得 3.5x y ==,得到样本中心点(3.5,3.5),再把样本中心点代入回归直线方程得解. 【详解】由表可得 3.5x y ==,带入线性回归方程中有 3.50.7 3.5 5.95=+⨯=a , 故选:C . 【点睛】本题考查利用线性相关关系求回归直线方程,属于基础题.3.A解析:A 【分析】计算得到 4.5x =,114t y +=,代入回归方程计算得到答案. 【详解】3456 4.54x +++==, 2.54 4.51144t t y ++++==,中心点(),x y 过ˆ0.70.35yx =+, 即114.50.70.354t +=⨯+,解得3t =. 故选:A . 【点睛】本题考查了回归方程的相关问题,意在考查学生的计算能力.4.A解析:A 【解析】利用茎叶图、平均数的性质直接求解. 【详解】由一组数据的茎叶图得: 该组数据的平均数为:1(7581858995)855++++=. 故选:A . 【点睛】本题考查平均数的求法,考查茎叶图、平均数的性质等基础知识,考查运算求解能力,是基础题.5.C解析:C 【分析】认真观察题中所给的折线图,对照选项逐一分析,求得结果. 【详解】这10天中第一天,第三天和第四天共3天空气质量为一级,所以A 正确; 从图可知从6日到9日 2.5PM 日均值逐渐降低,所以B 正确; 从图可知,这10天中 2.5PM 日均值最高的是12月6日,所以D 正确; 由图可知,这10天中 2.5PM 日均值的中位数是4145432+=,所以C 不正确; 故选C. 【点睛】该题考查的是有关利用题中所给的折线图,描述对应变量所满足的特征,在解题的过程中,需要逐一对选项进行分析,正确理解题意是解题的关键.6.B解析:B 【解析】分析:先求均值,确定ˆb,再求自变量为19对应函数值得结果. 详解:因为2523.52220.5330333639122,344442x y ++++++====,所以1348022,3224ˆb-==- 所以19(2)8042y =⨯-+=选B.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .7.A解析:A 【解析】8个班参加合唱比赛的得分从小到大排列分别是87,89,90,91,92,93,94,96,中位数是91,92,的平均数91.5,平均数是87+89+90+91+92+93+94+968=91.58.D解析:D 【解析】 【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数. 【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816, 因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D. 【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题9.A解析:A 【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可. 【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95, 所以中位数为90+91=90.52,故选A. 【点睛】本题主要考查了中位数,茎叶图,属于中档题.10.A解析:A 【分析】可以通过n P 与0P 之间的大小关系进行判断. 【详解】当10k -<<时,()011011nk k <+<<+<,,所以()001nn P P k P =+<,呈下降趋势. 【点睛】判断变化率可以通过比较初始值与变化之后的数值之间的大小来判断.11.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.12.A解析:A 【解析】分析:先观察表中数据的规律,确定回归系数b 的符号,再计算x 和y ,代入选项确定正确答案.详解:由表中数据规律发现:热饮杯数y 随当天气温x 升高而减少,则0b <,排除C 、D. 计算1169=(504712151923273136)1111x -++++++++++= 11228=(15615013212813011610489937654)111.641111y ++++++++++=≈ 将x 代入选项A ,得1692.352147.767111.6311ˆy=-⨯+= 将x 代入选项B ,得1692.352127.76591.6311ˆy=-⨯+= 所以选项A 正确. 故选A.点睛:本题考查线性回归方程的求法与应用,一次项系数b 符号的判断和回归直线过样本中心点(,)x y 是解题关键.二、填空题13.75【解析】【分析】计算然后将代入回归直线得从而得回归方程然后令x=5解得y 即为所求【详解】∵∴∵∴∴样本中心点为(3)又回归直线过(3)即3=06×+解得=所以回归直线方程为y =06x+令x =5时解析:75 【解析】 【分析】计算x ,y ,然后将x ,y 代入回归直线得a ,从而得回归方程,然后令x =5解得y 即为所求. 【详解】 ∵4115i i x ==∑,∴154x =, ∵4112i i y ==∑,∴1234y ==, ∴样本中心点为(154,3), 又回归直线0.6ˆyx a =+过(154,3),即3=0.6×154+a ,解得a =34, 所以回归直线方程为y =0.6x +34, 令x =5时,y =0.6×5+34=3.75万元 故答案为:3.75. 【点睛】本题考查线性回归方程的应用,以及利用线性回归方程进行预测,要注意回归直线必过样本中心点.14.18【解析】【分析】由题意知抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为即可解得【详解】因为抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为解得【点睛】本题主要考解析:18 【解析】 【分析】由题意知,抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,即可解得. 【详解】因为抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,解得18x =. 【点睛】本题主要考查了系统抽样,属于中档题.15.25【解析】分析:先求成绩在80分以上的概率再根据频数等于总数与对应概率乘积求结果详解:因为成绩在80分以下的概率为所以成绩在80分以上的概率为因此成绩在80分以上的人数为点睛:频率分布直方图中小长解析:25 【解析】分析:先求成绩在80分以上的概率,再根据频数等于总数与对应概率乘积求结果.详解:因为成绩在80分以下的概率为(0.0050.03+0.0410=0.75+⨯),所以成绩在80分以上的概率为10.750.25-=,因此成绩在80分以上的人数为0.25100=25.⨯点睛:频率分布直方图中小长方形面积等于对应区间的概率,所有小长方形面积之和为1; 频率分布直方图中组中值与对应区间概率乘积的和为平均数; 频率分布直方图中小长方形面积之比等于对应概率之比,也等于对应频数之比.16.2【解析】分析:根据方差的计算公式先算出数据的平均数然后代入公式计算即可得到结果详解:平均数为:即答案为2点睛:本题考查了方差的计算解题的关键是方差的计算公式的识记它反映了一组数据的波动大小方差越大解析:2 【解析】分析:根据方差的计算公式,先算出数据的平均数,然后代入公式计算即可得到结果. 详解:平均数为:2345645+++++=,()22222211[2434445464]4114255s =⨯-+-+-+-+-=⨯+++=()()()()().即答案为2.点睛:本题考查了方差的计算,解题的关键是方差的计算公式的识记.它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.17.1【解析】分析:先利用平均数公式求出平均数再利用方差公式即可得结果详解:的平均数为的方差为故答案为点睛:本题考查主要考查平均数公式与方差公式属于基础题样本数据的算术平均数公式;样本方差公式标准差解析:1 【解析】分析:先利用平均数公式求出平均数,再利用方差公式即可得结果. 详解:5.7,5.8,6.1,6.4,6.5的平均数为5.7+5.8+6.1+6.4+6.56.15=,5.7,5.8,6.1,6.4,6.5∴的方差为()()()()()222225.76.1+5.8 6.1+6.1 6.1+6.4 6.1+6.5 6.10.15-----=,故答案为0.1.点睛:本题考查主要考查平均数公式与方差公式,属于基础题. 样本数据的算术平均数公式12n 1(x +x +...+x )x n =;样本方差公式2222121[()()...()]n s x x x x x x n =-+-++-,标准差s =18.【解析】分析:根据回归系数几何意义得详解:因为Y 与X 之间正增长所以因为V 与U 之间负增长所以因此点睛:函数关系是一种确定的关系相关关系是一种非确定的关系事实上函数关系是两个非随机变量的关系而相关关系是解析:12b b >. 【解析】分析:根据回归系数几何意义得120b b >> 详解:因为Y 与X 之间正增长,所以10b > 因为V 与U 之间负增长,所以20b < 因此120b b >>,点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .b 的正负,决定正相关与负相关.19.280【解析】由频率分布直方图得这名大学生中每周的自习时间不少于小时的频率为这名大学生中每周的自习时间不少于小时的人数为故答案为解析:280 【解析】由频率分布直方图得这400名大学生中每周的自习时间不少于22.5小时的频率为()0.16+0.080.04 2.50.7,+⨯=∴这400名大学生中每周的自习时间不少于22.5小时的人数为4000.7280⨯=,故答案为280.20.2【解析】由茎叶图及10个班级的得分的平均数是90可得∴当且仅当即时取等号故答案为2解析:2 【解析】由茎叶图及10个班级的得分的平均数是90可得8a b += ∴1911919191()()(19)(10)(1023)28888b a b a a b a b a b a b a b +=⨯++=+++=++≥+⨯=,当且仅当9b aa b=,即36b a ==时,取等号 故答案为2三、解答题21.(1)0.5 2.3y x =+;(2)6800元. 【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程; (2)将9x =代入即可预测. 【详解】解:(1)由表可得:123456747++++++==x ,2.93.3 3.64.4 4.85.2 5.9 4.37y ++++++==,又77211134.4,140i ii i i x yx ====∑∑,71722217134.474 4.30.5140747i ii i i x y x yb x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元. 【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题. 22.(1)ˆ465yx =-;拟合效果较好;(2)至少需要规划409个停车位 【分析】(1)由已知数据求得ˆb与ˆa 的值,则线性回归方程可求,再求出残差平方和,代入相关指数公式求得2R ,根据与1的接近程度分析拟合效果;(2)在(1)中求得的线性回归方程中,取9x =求得y 值即可. 【详解】 解:(1)1(123456) 3.56x =+++++=,19361566y =⨯=.6162221640816 3.5156ˆ46916356i ii ii x yxy bxx ==--⨯⨯===-⨯-∑∑,ˆˆ15646 3.55ay bx =-=-⨯=-. y ∴关于x 的线性回归方程为ˆ465y x =-.1x =时,ˆ41y=,2x =时,ˆ87y =,3x =时,ˆ133y =, 4x =时,ˆ179y=,5x =时,ˆ225y =,6x =时,ˆ271y =. 621()556ii i yy =-=∑.6221621()556110.9737586()ii i ii yy R yy ==-=-=-≈-∑∑, 相关指数2R 近似为0.97,接近1,说明拟合效果较好; (2)在(1)中求得的线性回归方程中,取9x =, 可得ˆ4695409y=⨯-=. 故若要求在2022年小区停车位数量仍可满足需要,则至少需要规划409个停车位. 【点睛】本题考查线性回归方程与相关指数的求法,考查运算求解能力,属于中档题. 23.(1)见解析;(2)见解析;(3) 22.3百万小时 【分析】(1)根据频率分布直方图求数据填入对应表格,再根据卡方公式求2K ,最后对照数据作判断,(2)先确定随机变量取法,再判断从M 城市中任选的2名用户中活跃用户数服从二项分布,从N 城市中任选的1名用户中活跃用户数服从两点分布,进而求得对应概率,列表得分布列,最后根据数学期望公式得期望,(3)先求均值,解得ˆa,再估计5x =对应函数值. 【详解】(1)由已知可得以下22⨯列联表:计算()2220060208040200K 9.5247.8791001001406021⨯⨯-⨯==≈>⨯⨯⨯ , 所以有99.5%的把握认为用户是否活跃与所在城市有关. (2)由统计数据可知,城市M 中活跃用户占35,城市N 中活跃用户占45, 设从M 城市中任选的2名用户中活跃用户数为X ,则3~2,5X B ⎛⎫ ⎪⎝⎭设从N 城市中任选的1名用户中活跃用户数为Y ,则Y 服从两点分布,其中()415P Y ==. 故0,1,2,3ξ=,()()()20221400055125P P X P Y C ξ⎛⎫===⋅==⋅=⎪⎝⎭; ()()()()()2012224321*********555125P P X P Y P X P Y C C ξ⎛⎫===⋅=+=⋅==⋅+⋅⋅⋅=⎪⎝⎭;()()()()()2122223431572112055555125P P X P Y P X P Y C C ξ⎛⎫===⋅=+=⋅==⋅⋅+⋅⋅=⎪⎝⎭;()()()222343632155125P P X P Y C ξ⎛⎫===⋅==⋅= ⎪⎝⎭. 故所求ξ的分布列为()428573601232125125125125E ξ=⨯+⨯+⨯+⨯=. (3)由已知可得 2.5x =,又12.3y =,可得12.34ˆ2.5a=⨯+,所以ˆ 2.3a =,所以4 2.3ˆy x =+. 以5x =代入可得ˆ22.3y=(百万小时), 即2019年第一季度该读书APP 用户使用时长约为22.3百万小时. 【点睛】本题考查频率分布直方图、回归直线方程以及分布列和数学期望,考查基本分析求解能力,属中档题.24.(Ⅰ)图象见解析,正相关;(Ⅱ)ˆ0.7 1.5yx =+,当15x =时细菌个数为12个. 【分析】(Ⅰ)根据数据描点即得散点图,看图即判断结果; (Ⅱ)利用公式代入数据计算即可. 【详解】解:(Ⅰ)图形如下,观察图像可知细菌个数和时间是正相关.(Ⅱ)由数据计算得,()11234535x =⨯++++=,()123445 3.65y =⨯++++=,1122334445561ni ii x y==⨯+⨯+⨯+⨯+⨯=∑,22222211234555n i i x ==++++=∑122216153 3.67ˆ0.7555310ni ii ni i x y nx yxbx n ==-⨯⨯====-⨯--∑∑,ˆˆ 3.60.73 1.5a y bx =-=-⨯=, 所以ˆ0.7 1.5yx =+, 当0.7 1.512x +=时,解得15x =. 所以当15x =时细菌个数为12个. 【点睛】本题考查了散点图、线性回归方程及其应用,属于基础题.25.(1)中位数为71.4;平均数为71;(2)平均数为90;标准差为53)3700元.【分析】(1)利用频率分布直方图能求出中位数、平均分;(2)由题意,求出剩余8个分数的平均值,由10个分数的标准差,能求出剩余8个分数的标准差;(3)求出将3座教学楼完全包裹的球的最小直径、将一座教学楼完全包裹的球的最小直径和将1号教学楼与2号教学楼完全包裹的球的最小直径,由此能求出让各教学楼均被屏蔽仪信号完全覆盖的最小花费. 【详解】(1)因为0.050.150.250.450.5++=<0.050.150.250.350.80.5+++=> 所以中位数为x 满足7080x <<由80()0.350.10.10.510x -⨯++=,解得608071.47x =-≈ 设平均分为y ,则0.05450.15550.25650.35750.1850.19571y =⨯+⨯+⨯+⨯+⨯+⨯=(2)由题意,剩余8个分数的平均值为01010080908x x --==因为10个分数的标准差6s ==所以2222110...10(6)10(90)81360x x ++=⨯+⨯=所以剩余8个分数的标准差为0s ===(3)将3座教学楼完全包裹的球的最小直径为:210=<=因此若用一个覆盖半径为105米的屏蔽仪则总费用为4100元;70<= 因此若用3个覆盖半径为35米的屏蔽仪则总费用为4800元; 将1号教学楼与2号教学楼完全包裹的球的最小直径为:110=<=70>=因此若用1个覆盖半径为55米和1个覆盖半径为35米的屏蔽仪则总费用为3700元; 所以,让各教学楼均被屏蔽仪信号完全覆盖的最小花费为3700元. 【点睛】本题考查中位数、平均数、标准差、最小费用的求法,考查频率分布直方图的性质等基础知识,考查运算求解能力,是中档题.26.(1)分布列见解析,1;(2)0.10=P ,理由见解析. 【分析】(1)按照分层抽样计算“科学用眼”和“不科学用眼”的抽取人数,随机变量X 的取值可能为0,1,2,然后计算概率得出分布列及其数学期望; (2)按照公式计算2K 的值,然后由临界值表得出结果即可. 【详解】(1)“科学用眼”抽156245⨯=人,“不科学用眼”抽306445⨯=人,则随机变量X0=,1,2,∴343641(0)205====CP XC,122436123(1)205C CP XC====,21243641(2)205C CP XC====,分布列为:0120121555EX=⨯+⨯+⨯=;(2)22100(45153010)3.03075255545⨯-⨯=≈⨯⨯⨯K,由表可知2.706 3.030 3.840<<,∴0.10=P.【点睛】本题考查随机变量的分布列和数学期望,考查独立性检验,考查逻辑思维能力和计算能力,考查学生分析解决问题的能力,属于常考题.。
2019-2020学年高中数学 第一章 统计 4.2 极差、方差、标准差练习(含解析)北师大版必修3
第2课时极差、方差、标准差填一填极差、方差、标准差(1)极差一组数据中________________称为这组数据的极差.(2)方差标准差的平方s2叫作方差.s2=________________.其中,x n是样本数据,n是样本容量,错误!是样本平均数.(3)标准差标准差是样本数据到平均数的一种平均距离,一般用s表示.s=________________。
判一判1.数据极差越小,样本数据分布越集中、稳定.()2.数据方差越小,样本数据分布越集中、稳定.()3.一组数据的标准差越小,数据越稳定,且稳定在平均数附近.( ) 4.一组数据的标准差就是这组数据方差的平方根()5.方差、标准差越大,数据越分散.()6.方差、标准差越小,数据越分散.( )7.极差表示了一组数据变化范围的大小.( )8.方差反映的是一组数据与平均值的离散程度或一组数据的稳定程度.( )想一想1.提示:用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围,用这种方法得到的差称为极差.2.方差的作用是什么?提示:①方差描述了一组数据波动的大小.②方差的值越小,数据波动越小,越整齐.3.样本数据的分散程度是计算样本数据的什么值?提示:样本数据的分散程度是样本数据到平均数的平均距离.4.极差、方差和标准差的联系是什么?提示:都是衡量(或描述)一组数据偏离平均数的大小(即波动大小)的指标,常用来比较两组数据的波动情况.思考感悟练一练1.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()A.46,45,56B.46,45,53C.47,45,56D.45,47,532.某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的分数登记错了,甲实得80分,却记了50分,乙实得70分,却记了100分,更正后平均分和方差分别是()A.70,75 B.70,50C.75,1.04 D.62,2.353.PM2。
北师大版必修3高中数学第1章统计44.1平均数中位数众数极差方差4.2标准差
(2)方差的求法: 标准差的平方 s2 叫作方差. s2= 1n[(x1- x )2+(x2- x )2+…+(xn- x )2] 其中,xn 是样本数据,n 是样本容量, x 是样本均值. (3)方差的简化计算公式:
s2=1n[(x21+x22+…+x2n)-n x 2] =1n(x21+x22+…+xn2)- x 2.
数为 1,则样本方差为( )
6
6
A. 5
B.5
C. 2
D.2
D [∵样本的平均数为 1,即51×(a+0+1+2+3)=1,∴a=-1,
∴样本方差 s2=15×[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2] =2.]
3.一次选拔运动员的测试中,测得 7 名选手中的身高(单位:cm)
(2)确定众数的关键是统计各数据出现的频数,频数最大的数据 就是众数.当一组数据中有不少数据多次重复出现时,众数往往更能 反映数据的集中趋势.
(3)平均数与每一个样本数据都有关,受个别极端数据(比其他数 据大很多或小很多的数据)的影响较大,因此若在数据中存在少量极 端数据,平均数对总体估计的可靠性较差,这时往往用众数或中位数 去估计总体.有时也采用剔除最大值与最小值后所得的平均数去估计 总体.
第一章 统计
§4 数据的数字特征
4.1 平均数、中位数、众数、极差、方差
4.2 标准差
学习目标
核心素养
1.通过求一组数据的平均数、中 1.会求一组数据的平均数、中位
位数、众数、极差、方差、标 数、众数、极差、方差、标准差.(重
准差,培养数学运算素养. 点)
2.通过方差、标准差在实际问 2.方差、标准差在实际问题中的
1.已知一组数据为 20,30,40,50,50,60,70,80,其中平均数,中位 数和众数的大小关系是( )
数学北师大版必修3自我小测:1.3统计图表 含解析
自我小测1.下面哪种统计图没有数据信息的缺失,所有的原始数据都可以从该图中得到().A.条形统计图B.茎叶图C.扇形统计图 D.折线统计图2. 如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人这几场比赛得的最高分分别为().A.51,83 B.41,47 C.51,47 D.41,833.张佳同学对高一(1)班和高一(2)班两个班级今年的获奖情况进行了统计,制成两个统计图(如图所示),你认为哪个图比较恰当().A.①恰当B.②恰当C.①②都恰当D.①②都不恰当4. 某校开展“爱我海西、爱我家乡”摄影比赛,9位评委对参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91.复核员在复核时,发现有一个数字(茎叶图中的x)无法看清.若记分员计算无误,则数字x应该是().A.1 B.2 C.4 D.65.为了了解“预防禽流感疫苗”的使用情况,温州市卫生部门对本地区9月份至11月份使用疫苗的所有养鸡场进行了调查,根据下列图表(如图)提供的信息,可以得出这三个月本地区每月注射了疫苗的鸡的数量平均为________万只.6. 青年歌手大奖赛共有10名选手参赛,并请了7名评委,如图所示的茎叶图是7名评委给参加最后决赛的两位选手甲、乙评定的成绩,去掉一个最高分和一个最低分后,甲、乙选手剩余数据的平均成绩分别为____________.7.在某电脑杂志的一篇文章中,每个句子中所含字的个数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子中所含字的个数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,能得到什么结论?8. 某中学部分学生参加全国高中数学竞赛,取得了优异成绩,指导老师统计了所有参赛同学的成绩(成绩都为整数,试题满分120分),并且绘制了条形统计图(如图),请回答:(1)该中学参加本次数学竞赛的有多少人?(2)如果90分以上(含90分)获奖,那么获奖率是多少?(3)题图还提供了其他信息,再写出两条.参考答案1.解析:所有的统计图中,仅有茎叶图完好无损地保存着所有的数据信息. 答案:B2.答案:B3.解析:图②较恰当.由图②我们可以很清楚地看出运动类的获奖次数(1)班比(2)班多一些,而学习类的获奖次数(1)班比(2)班少一些.答案:B4.解析:若x ≤4,∵平均分为91,∴总分应为637,∴637=89+89+92+93+92+91+90+x ,∴x =1.若x >4,637≠89+89+92+93+92+91+94=640,不合题意.答案:A5.解析:20×1+50×2+100×1.53=90(万只/月). 答案:906.解析:甲的成绩是75,78,84,85,86,88,92,去掉一个最高分92和一个最低分75后,则甲剩余数据的平均成绩为84.2;乙的成绩是79,84,84,84,86,87,93,去掉一个最高分93和一个最低分79后,则乙剩余数据的平均成绩为85.答案:84.2,857.解:(1)茎叶图如图:(2)从茎叶图中可以看出电脑杂志上每个句子的字数集中在10~30之间;报纸上每个句子的字数集中在20~40之间,还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少,说明电脑杂志作为科普读物需要通俗易懂、简明扼要.8.解:(1)由条形统计图可知:4+6+8+7+5+2=32(人).(2)90分(含90分)以上的人数为7+5+2=14,∴1432×100%=43.75%. (3)(只要符合要求即可)①成绩落在80~90段内的人数最多,有8人;②参赛同学的成绩均不低于60分.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章检测(时间:120分钟 满分:150分)一、选择题:本大题共12小题,每小题5分,在每小题给出的四个选项中,只有一项是符合题目要求的.1.现从100件产品中随机抽出10件进行质量检测,下列说法正确的是( )A.100件产品是总体B.10件产品是样本C.样本容量为100D.样本容量为10解析:这里考查统计的基本概念,总体是100件产品的质量;样本是抽取的10件产品的质量;总体容量为100,样本容量为10.答案:D2.下列说法中,不正确的是( )A.系统抽样是先将差异明显的总体分成几个小组,再进行抽取B.分层抽样是将差异明显的几部分组成的总体分成几层,然后进行抽取C.简单随机抽样是从个体无差异且个体数较少的总体中逐个抽取个体D.系统抽样是从个体无差异且个数较多的总体中,将总体均分,再按事先确定的规则在各部分抽取解析:当总体中个体差异明显时,用分层抽样;当总体中个体无差异且个体数较多时,用系统抽样;当总体中个体无差异且个体数较少时,用简单随机抽样.所以A不正确.答案:A3.重庆市2016年各月的平均气温(单位:℃)数据的茎叶图如图所示,则这组数据的中位数是( )A.19B.20C.21.5D.23答案:B4. 如图是容量为100的样本数据(质量)的频率分布直方图,已知样本质量均在[5,20]内,其分组为[5,10), [10,15),[15,20],则样本质量落在[15,20]内的频数为( )A.10B.20C.30D.40解析:由题意得,组距为5,则样本质量在[5,10),[10,15)内的频率分别为0.3和0.5,所以样本质量在[15,20]内的频率为1-0.3-0.5=0.2.故频数为100×0.2=20.答案:B5.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,得到的频率分布直方图是( )解析:由分组可知C,D 一定不对;由题中茎叶图可知[0,5)有1人,[5,10)有1人,所以第一、二小组频率相同,频率分布直方图中矩形的高应相同,可排除B .故选A .答案:A6.已知两组数据x 1,x 2,…,x n 与y 1,y 2,…,y n ,它们的平均数分别是x 和y ,则新的一组数据2x 1‒5y 1+3,2x 2‒5y 2+3,…,2x n ‒5y n +3的平均数是( )A.2x ‒5yB .2x ‒5y +3C.4x ‒25yD .4x ‒25y +3答案:B7.在抽查样本中,用频率分布直方图表示尺寸的过程中,将其尺寸分成若干组,[a ,b )是其中的一组,抽查出的个数在该组内的频率为m ,表示该组的小矩形的高为h ,则b-a 等于( )A.hm B .ℎmC .mℎD .与m ,ℎ无关解析:b-a 是组距,在频率分布直方图h ,所b-a 中,频率组距是表示该组的小矩形的高以m b -a =ℎ,所以=mℎ.答案:C8.某班有48名学生,在一次考试中统计出平均分为70分,方差为75分2,后来发现有2名同学的分数登错了,甲实得80分却记成了50分,乙实得70分却记成了100分,更正后平均分和方差分别为( )A.70分,75分2 B.70分,50分2C.70分,1.04分2 D.65分,25分2解析:注意到平均数没有变化,只是方差变动.s 2+(50-70)2+(100-70)2+…]=75分2,实际上s 2+(80-70)2+(70-70)2+…]=50分2,故=148[…=148[…选B .答案:B9.某校高三年级有男生500人,女生400人,为了了解该年级学生的健康状况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是( )A.简单随机抽样 B.抽签法C.随机数法 D.分层抽样解析:样本容量n=25+20=45,男生和女生的抽样比都.是120,即按抽样比为120的分层抽样方法抽取样本答案:D10.某示范农场的鱼塘放养鱼苗8万条,根据这几年的经验知道,鱼苗的成活率为95%,一段时间后准备打捞出售,第一网捞出40条,称得平均每条鱼2.5 kg,第二网捞出25条,称得平均每条鱼2.2 kg,第三网捞出35条,称得平均每条鱼2.8 kg,估计这时鱼塘中鱼的总质量为( )A.192 280 kg B.202 280 kg C.182 280 kg D.172 280 kg 解析:样本平均2.53 kg,所以估数x =40×2.5+25×2.2+35×2.840+25+35=2.53(kg),可知样本中平均每条鱼重计鱼塘中鱼的总质量约为80 000×95%×2.53=192 280(kg).答案:A11.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7例”.根据过去10天甲、乙、丙、丁四地新增疑似病例的数据,一定符合该标志的是( )A.甲地:总体均值为3,中位数为4B.乙地:总体均值为1,总体方差大于0C.丙地:中位数为2,众数为3D.丁地:总体均值为2,总体方差为3解析s 2+(x 10-2)2],若有一天超过7人,不妨设x 10=8,则s 2≥:x =2,则=110[(x 1‒2)2+(x 2‒2)2+….故任何一天都不超过7人.110×(8‒2)2=3.6>3,不合题意答案:D12. 已知两个相关变量满足如下关系:x 1015202530y1 0031 0051 0101 0111 014则两变量间的线性回归方程为( )A.y=0.56x+997.4B.y=0.63x-231.2C.y=50.2x+501.4 D.y=60.4x+400.7解析: 因为by=0.56x+997.4.=x 1y 1+x 2y 2+…+x 5y 5-5x yx 21+x 22+…+x 25-5x2=0.56,a =y ‒b x =997.4.所以线性回归方程为答案:A 二、填空题:本大题共4小题,每小题5分.13.某市有大型超市200家、中型超市400家、小型超市1 400家.为掌握各类超市的营业情况,现按分层抽样方法抽取一个容量为100的样本,则应抽取中型超市 家.解析:本题为分层抽样,所以应抽取中型超市400).×100400+200+1 400=20(家答案:2014.某考察团对全国10大城市职工人均工资水平x (单位:千元)与居民人均消费水平y (单位:千元)进行统计调查,y 与x 具有线性相关关系,线性回归方程为y=0.66x+1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为 .解析:将y=7.675代入y=0.66x+1.562,得x≈83%.=611.366.所以7.675611.366答案:83%15.如图是一个容量为100的样本的频率分布直方图,试根据图中的数据回答下列问题:(1)样本数据落在区间[2,6)内的频率为 ; (2)样本数据落在区间[6,10)内的频数为 .解析:由频率分布直方图可得数据落在区间[2,6)内的频率为相应的小矩形的面积,即0.02×4=0.08,数据落在区间[6,10)内的频率为0.08×4=0.32,故数据落在区间[6,10)内的频数为100×0.32=32.答案:(1)0.08 (2)3216.甲、乙两个班级各随机选出15名同学进行测验,成绩的茎叶图如图所示,则甲班、乙班的最高成绩各是 ,从图中看 班的平均成绩较高.解析:从题图可以看出乙班的成绩集中在70分以上,且在80分以上的有6人,而甲班80分以上的只有4人,甲班的最低成绩是46分,对平均分影响较大.答案:96,92 乙三、解答题:解答应写出文字说明、证明过程或演算步骤.17.(本小题满分10分)小明家2016年四个季度的用电量如下表:季度用电量(单位:千瓦时)第一季度250第二季度150第三季度400第四季度200其中各种电器用电量如下表:电器类型用电量(单位:千瓦时)空调250冰箱400照明100彩电150其他100根据如图所示三幅统计图回答:(1)从哪幅统计图可看出各个季度用电量变化情况?(2)从哪幅统计图可看出冰箱用电量超过总用电量的14?(3)从哪幅统计图可以清楚地看出空调用电量?解:三幅统计图分别为折线统计图、扇形统计图和条形统计图,各自的优点如下:折线统计图可以表示数量的多少,直观地反映数量的增减情况,即变化趋势扇形统计图能直观显示总体中各部分的分布情况条形统计图当数据量很大时,能够直观地反映数据分布的大致情况,并且能清晰地反映各个部分的具体数目综上可得:(1)折线统计图;(2)扇形统计图;(3)条形统计图.18.(本小题满分12分)农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种麦苗的试验田中各抽取6株麦苗测量麦苗的株高,数据如下(单位:cm):甲:9,10,11,12,10,20乙:8,14,13,10,12,21.(1)绘出所抽取的甲、乙两种麦苗株高的茎叶图;(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗的长势情况.解:(1)茎叶图如图所示:(2)x 甲=9+10+11+12+10+206=12,x 乙=8+14+13+10+12+216=13,≈13.67≈16.67.s 2甲,s 2乙因.为x 甲<x 乙,所以乙种麦苗平均株高较高又因.为s 2甲<s 2乙,所以甲种麦苗长得较为整齐19. (本小题满分12分)2017年春节前,公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让过往返乡的摩托车驾驶人有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍询问,询问结果如图所示:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是什么抽样方法?(2)用分层抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的抽取5人,则四川籍的应抽取几人?解:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是系统抽样法.(2)从题图可知,被询问了省籍的驾驶人员中广西籍的有5+20+25+20+30=100(人);四川籍的有15+10+5+5+5=40(人).设四川籍的驾驶人员应抽取x 人,依题意x=2,即四川籍的应抽取2人.得5100=x40,解得20.(本小题满分12分)某车间20名工人年龄数据如下表:年龄/岁工人数/人191283293305314323401合计20(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.解:(1)由题中表可知,众数为30岁.极差为40-19=21(岁).(2)(3)这20名工人年龄的平均数为(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30(岁),所以这20名工人年龄的方差为s 2=120[(19‒30)2+3(28‒30)2+3(29‒30)2+5(30‒30)2+4(31‒30)2+3(32‒30)22]=12.6(岁2).21.(本小题满分12分)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125)频数62638228(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差;(同一组中的数据用该组区间的中点值作代表)(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解:(1)(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.22.(本小题满分12分)某种瓶装溶液,因为装瓶机的不稳定性,所以很可能使每瓶的含量都不是标准的含量,我们随机抽出了20瓶,测得它们的含量(单位:百毫升)如下:12.1 11.9 12.2 12.2 12.0 12.1 12.9 12.112.3 12.5 11.7 12.4 12.3 11.8 11.3 12.111.4 11.6 11.2 12.2(1)根据数据列出频率分布表,画出频率分布直方图;(2)计算出这组数据的平均数和标准差;(结果精确到0.01)(3)结合(1)(2)的结果,根据实际意义写一个简短的报告.(对总体情况作出估计)解:(1)频率分布表如下:分组频数频率[11.0,11.5)30.15[11.5,12.0)40.20[12.0,12.5)110.55[12.5,13.0]20.10频率分布直方图如图所示.(2)平均.1+11.9+12.2+…+12.2)数x =120×(12≈12.02(百毫升).标准差s ≈(12.1‒12.02)2+(11.9‒12.02)2+…+(12.2‒12.02)220≈0.41(百毫升).(3)标准差相对于平均数来说比较小.从频率分布直方图中可以看出,每瓶的含量大致位于1 150毫升到1 250毫升之间.因此可判断装瓶机工作稳定.。