北师大 概论统计 作业
2020届一轮复习北师大版统计知识及统计案例大题部分作业
1、如图,从参加环保知识竞赛的学生中抽出名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:(1)这一组的频数、频率分别是多少?(2)估计这次环保知识竞赛成绩的平均数、众数、中位数;(不要求写过程)(3)从成绩是分以上(包括分)的学生中选两人,求他们在同一分数段的概率.【答案】(1)4 (2)68.5、75、70 (3).⨯=,设为,(3)记“取出的2人在同一分数段”为事件,因为之间的人数为400.14之间有人,设为,从这6人中选出2人,有,,,,共15个基本事件,其中事件A包括,,,,共7个基本事件,则.2、2018年为我国改革开放40周年,某事业单位共有职工600人,其年龄与人数分布表如下:年龄段[)55,5945,55[)35,45[)22,35[)人数(单位:人)180 180 160 80约定:此单位45岁—59岁为中年人,其余为青年人,现按照分层抽样抽取30人作为全市庆祝晚会的观众.(1)抽出的青年观众与中年观众分别为多少人?(2)若所抽取出的青年观众与中年观众中分别有12人和5人不热衷关心民生大事,其余人热衷关心民生大事.完成下列2×2列联表,并回答能否有90%的把握认为年龄层与热衷关心民生大事有关?热衷关心民生大事不热衷关心民生大事总计青年12中年 5总计30(3)若从热衷关心民生大事的青年观众(其中1人擅长歌舞,3人擅长乐器)中,随机抽取2人上台表演节目,则抽出的2人能胜任才艺表演的概率是多少?【答案】(1)18,12 (2)否(3)2 5【解析】(1)根据分层抽样可知抽出的青年观众为18人,中年观众12人;(2)2×2列联表如下:热衷关心民生大事不热衷关心民生大事总计青年 6 12 18 中年7 5 12总计13 17 30,∴没有90%的把握认为年龄层与热衷关心民生大事有关;3、随着网络的发展,人们可以在网络上购物、玩游戏、聊天、导航等,所以人们对上网流量的需求越来越大。
北师大版八年级下册统计与统计方程练习题
北师大版八年级下册统计与统计方程练习
题
综述
本文档是针对北师大版八年级下册统计与统计方程章节的练题,旨在提供学生进行相关知识巩固和实践的机会。
统计题练
1. 下面是一个小组成员的年龄(单位:岁):
- 12, 13, 11, 13, 14, 12, 13, 12, 15, 10
请计算该小组成员的平均年龄。
2. 以下是五位学生的数学成绩(单位:分):
- 90, 85, 92, 95, 87
请计算他们的平均数学成绩。
3. 一份调查显示一所中学的学生家庭成员数分布如下:
- 0, 0, 1, 2, 1, 3, 1, 0, 2, 4
请绘制该中学学生家庭成员数的频数分布表。
4. 以下是一个班级的学生人数统计(单位:人):
- 25, 27, 29, 26, 28, 25, 30, 31
请计算该班级的中位数。
5. 一份问卷调查显示,一个城市的居民月收入分布如下(单位:万元):
- 5, 6, 7, 8, 6, 7, 9, 5, 6
请计算该城市居民月收入的众数。
统计方程练
1. 解方程:2x + 3 = 11.
2. 解方程:4y - 7 = 9.
3. 解方程:3z + 8 = 23.
4. 解方程:5p - 2 = 13.
5. 解方程:6q + 4 = 58.
以上是北师大版八年级下册统计与统计方程章节的练题,希望能对学生巩固相关知识有所帮助。
北京师范大学统计学导论答案整理版
40
练习2.2.11
P
(A1)
N N
1
n
P
( A1 A 2 )
N
N
2
n
P (A1A2
A N 1 )
1 N
n
P ( A 1 A 2 A N 1 A N ) 0
41
练习2.2.11
P(B)
1C1NNN1n
CN2NN2n
(1)N1 1n N
N k01(1)kCNk NNkn
42
练习1.4.1 比如,北京某交通路口某个方向共有4条 汽车道,要研究应设几个直行道、几个 左转弯道、几个右转弯道才能有利于交 通畅通?应调查的变量是每天开往各个 方向的车流量,根据各个时段的车流量 情况设计车道。
1
练习1.4.2 解:不可取。因为这里检查的苹果是方 便样本,不是随机样本,方便样本的代 表性差。 第二页:例1.1.3 注:收集有代表性的数据,是得到正确 结论的基础。
AA 12A 13A23
且A12,A13,A23两两互不相 . 容
37
练习2.2.10 A12 A13={边长为l1的边与某直线相交} A12 A23={边长为l2的边与某直线相交} A23 A13 ={边长为l3的边与某直线相交}
P ( A 1 2 U A 1 3 ) 2 l a 1 ,P ( A 1 2 U A 2 3 ) 2 l a 2 ,P ( A 1 3 U A 2 3 ) 2 l a 3
证明: A B A (B A ) A (B A )B
且 A (B A) B ,A B B
PABP(A)P(BA)B
P(A)P(B)(A)B
25
练习2.2.4 解:A={1,2,3至少出现一个},
北师大统计学作业答案
《统计学》作业本课程作业由两部分组成。
第一部分为“客观题部分”,由15个选择题组成,每题1分,共15分。
第二部分为“主观题部分”,由简答题和论述题组成,共15分。
作业总分30分,将作为平时成绩记入课程总成绩。
客观题部分:一、选择题(每题1分,共15题)1、对于非专业人员而言,统计学原理可以分为( AB CD)。
A.调查与实验设计B. 描述统计C. 推断统计D. 多元统计分析2、( ABC )是统计总体的特征。
A. 差异性B. 大量性C. 同质性D. 不可知性3、说明总体单位名称的是( A )。
A. 指标B. 标志C. 计量单位D. 标识4、统计学上一般用( D )来衡量标志。
A.列名尺度B. 顺序尺度C.间隔尺度D. 比率尺度5、统计调查按范围可分为( ABD )。
A.典型调查B. 重点调查C. 问卷调查D. 抽样调查6、下列抽样调查方法中属于概率抽样的有( CD )。
A. 配额抽样B. 判断抽样C. 简单随机抽样D.等距抽样7、缺失值处理的方法有( ABCD )。
A. 就近插值B. 删除对应记录C. 随机插值D.分类插值8、反映社会经济现象总体规模或水平的指标是( AD )。
A. 绝对数B. 相对数C. 相对指标D.总量指标9、常用的平均指标有( ABCD )。
A.调和平均数B.算术平均数C.众数D.中位数10、数据最大值与最小值之差称为( B )。
A.内距B.极差C.方差D.绝对差11、探索性数据分析的主题有( ABCD )。
A.耐抗性B.残差C.重新表达D.图示12、影响时间数列的因素有( ABCD )。
A.不规则变动B.循环变动C.长期趋势D.季节变动13、测定趋势变动的方法中,修匀方法主要有( AB )。
A.时距扩大法B.移动平均法C.最小二乘法D.分段平均法14、影响抽样误差的因素有( ABCD )。
A.抽样的组织形式B.抽样方式C.目标总体的变异程度D.样本容量15、相关系数( AD )。
北京师范大学2021年9月《统计学》作业考核试题及答案参考5
北京师范大学2021年9月《统计学》作业考核试题及答案参考1.抽样估计的优良指标有三个:无偏性、可靠性、一致性。
()A.正确B.错误参考答案:B2.采用组距分组时,用组中值作为该组数据的代表值,其假定条件是()A.各组的频数相等B.各组的组距均相等C.各组的变量值均相等D.各组数据在本组内呈均匀分布或在组中值两侧呈对称分布参考答案:D3.偏态分布资料宜用()描述其分布的集中趋势A.算术均数B.标准差C.中位数D.四分位数间距参考答案:C4.两变量x与y的相关系数为0.8,则其回归直线的判定系数为()A.0.80B.0.90C.0.64D.0.50参考答案:C5.区间估计的置信度是指()A.概率度B.概率保证程度C.抽样允许误差的大小D.抽样平均误差的大小参考答案:B6.组中值是根据各组上限和下限计算的平均值,所以它代表了每一组的平均分配次数。
()A.错误B.正确参考答案:A7.将所有变量值都减去10,那么()。
A.均值不变B.均值减少10C.方差不变D.标准差不变参考答案:BCD8.检查长期计划的完成程度时,若计划任务规定的是长期计划期末应达到的水平,检查计划完成程度应采用()A.水平法B.总体法C.平均法D.样本法参考答案:A9.由反映总体各单位数量特征的标志值汇总得出的指标是()。
A.质量指标B.相对指标C.总体标志总量D.总体单位总量参考答案:C10.调查单位是调查项目的承担者,填报单位是提交调查资料的单位。
()A.错误B.正确参考答案:B11.一个统计总体()。
A.可以有多个标志B.可以有多个指标C.只能有一个标志D.只能有一个指标参考答案:B12.平均发展速度是环比发展速度的平均数,也是一种序时平均数。
()A.错误B.正确参考答案:B13.统计分组的关键在于分组标志的选择。
()A.正确B.错误参考答案:A14.2017年中国31个省市自治区的城镇家庭平均可支配收入数据属于()。
A.定类数据B.定序数据C.截面数据D.时间序列数据参考答案:C15.定量数据的整理方法同样适用于定性数据。
北师大版 高考数学 统计-估计总体的分布 课时作业6
课时作业(六)一、选择题1.在抽查某产品的尺寸过程中,将其尺寸分成若干组,[a ,b )是其中一组,抽查出的个体数在该组上的频率为m ,该组上的直方图的高为h ,则|a -b |等于( )A .h ·m B.h m C.mh D .与m 无关解析:矩形的高=频率分组的宽度,∴|a -b |=m h ,故选C.答案:C2.一个容量为10的样本,其分组与频数如下表,则样本落在区间(-∞,5]内的频率为( )解析:根据频率分布的概念,样本落在区间(-∞,5]内的频数为7,则样本落在区间(-∞,5]内的频率为0.70,故选A.答案:A3.在抽查某批产品尺寸的过程中,样本尺寸数据的频率分布表如下,则b 等于( )频数1030408020m 频率0.050.150.20.4 a b解析:样本容量n=100.05=200,又20200=a,∴a=0.1.则b=1-(0.05+0.15+0.2+0.4+0.1)=0.1.答案:A4.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480 C.450 D.120解析:由频率分布直方图可得,该模块测试成绩不少于60分的学生人数为600-(0.005+0.015)×10×600=480.答案:B5.为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6 B.8 C.12 D.18解析:第一组和第二组的频率之和为0.4,故样本容量为200.4=50,第三组的频率为0.36,故第三组的人数为50×0.36=18,故第三组中有疗效的人数为18-6=12.答案:C6.如图所示是一批电子产品中抽样得到数据的频率分布直方图,由图可以看出数据落在下列哪个范围的频率最大()A.[8.1,8.3) B.[8.2,8.4)C.[8.4,8.5) D.[8.5,8.7)解析:在频率分布直方图中,每个矩形的面积就等于相应组的频率,即矩形的面积大,相应的频率就大.由图可以看出数据落在范围的频率最大的是[8.2,8.4).故选择B.答案:B二、填空题7.如图是一次数学考试结果的频率分布直方图,若规定60分以上(含60分)为考试合格,则这次考试的合格率为________.解析:由频率分布直方图可得考试的合格率为(0.024+0.012)×20=0.72=72%.答案:72%8.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.()(1)直方图中x的值为________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.解析:(1)根据频率和为1,得(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,解得x=0.004 4;(2)(0.003 6+0.006 0+0.004 4)×50×100=70.答案:(1)0.004 4(2)709.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样的方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出________人.解析:首先处理频率分布直方图得,月收入出现在[2 500,3 000)(元)内居民频率是500×0.000 5=0.25,这就是分层抽样的抽样比.故100个居民样本中月收入在[2 500,3 000)(元)内抽取的人数为100×0.25=25.答案:25三、解答题10.已知50个数据的分组以及各组的频数如下:153.5~155.5 2155.5~157.57157.5~159.59159.5~161.511161.5~163.510163.5~165.5 6165.5~167.5 4167.5~169.5 1(1)列出频率分布表;(2)画出频率分布的条形图和直方图及折线图.解:频率分布表列出的是在各个不同区间内取值的频率,相应的直方图用面积表示各个区间内取值的频率.(1)如下表:(2)频率分布条形图如下图(1),频率分布直方图及折线图如图(2):11.在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示).已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?解:(1)依题意知第三组的频率为42+3+4+6+4+1=15.又∵第三组频数为12,∴本次活动的参评作品数为1215=60(件).(2)由频率分布直方图,可以看出第四组上交的作品数量最多,共有60×62+3+4+6+4+1=18(件).(3)第四组获奖率是1018=59.第六组上交的作品数为60×12+3+4+6+4+1=3(件).∴第六组的获奖率为23,显然第六组的获奖率较高.12.某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分; (3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.解:(1)由(2a+0.02+0.03+0.04)×10=1,解得a=0.005.(2)0.05×55+0.4×65+0.3×75+0.2×85+0.05×95=73.(3)这100名学生语文成绩在[50,60)、[60,70)、[70,80)、[80,90)的分别有5人、40人、30人、20人,按照表中所给比例,数学成绩在[50,60)、[60,70)、[70,80)、[80,90)的分别有5人、20人、40人、25人,共90人,所以数学成绩在[50,90)之外的人数有10人.。
(完整版)北师大版五年级下册解统计习题
(完整版)北师大版五年级下册解统计习题第一题在这个题中,我们将解决一个有关统计学的问题。
该问题要求我们统计五年级下册的数研究题。
我们将按照北师大版教材的要求进行统计。
第二题首先,我们需要将五年级下册的数研究题进行分类。
根据教材的章节,我们将题分为以下几类:- 第一章:数的认识- 第二章:加减法- 第三章:乘法- 第四章:除法- 第五章:分数- 第六章:小数- 第七章:几何- 第八章:解方程- 第九章:单位换算- 第十章:统计第三题然后,我们将每个章节的题数量进行统计。
以下是每个章节的题数量和题目范围:- 第一章:数的认识(10道题)- 数的认识和拓展- 第二章:加减法(15道题)- 加法和减法的计算- 加法和减法的应用- 第三章:乘法(20道题)- 乘法的计算和应用- 第四章:除法(15道题)- 除法的计算和应用- 第五章:分数(25道题)- 基本分数概念和计算- 分数的应用- 第六章:小数(20道题)- 小数的认识和计算- 第七章:几何(30道题)- 图形的认识和性质- 图形的分类和判断- 第八章:解方程(20道题)- 一元一次方程- 一元一次方程的应用- 第九章:单位换算(15道题)- 长度的换算- 重量的换算- 容量的换算- 第十章:统计(25道题)- 数据的收集和整理- 数据的表示和分析第四题最后,我们将汇总每个章节的题数量,并给出整个五年级下册数研究题的总数。
根据以上统计,五年级下册解统计题总共有215道题目。
这就是关于北师大版五年级下册解统计习题的完整版文档。
希望对您有所帮助!。
北师大版 高考数学 统计-数据的数字特征 课时作业5
课时作业(五)一、选择题1.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x 、y 的值分别为( )A .2,5B .5,5C .5,8D .8,8解析:由于甲组的中位数是15,可得x =5,由于乙组数据的平均数为16.8,得y =8.答案:C2.甲、乙两台机床同时生产一种零件,现要检验它们的运行情况,统计10天中两台机床每天出的次品数分别为甲:0,1,0,2,2,0,3,1,2,4;乙:2,3,1,1,0,2,1,1,0,1.则出次品数较少的为( )A .甲B .乙C .相同D .不能比较 解析:x -甲=1.5,x -乙=1.2. 答案:B3.在某次测量中得到的A 样本数据如下:82,84,94,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差解析:由s =(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2n,可知B 样本数据每个变量增加2,平均数也增加2,但(x n -x -)2不变,故选D.答案:D4.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为( )A.65 B.65 C. 2 D .2解析:由题意知15(a +0+1+2+3)=1,解得a =-1,所以样本方差为s 2=15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2,故选D.答案:D5.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为( )A .1B .2C .3D .4解析:由题意可得:x +y =20,(x -10)2+(y -10)2=8,解这个方程组需要用一些技巧,因为不要直接求出x 、y ,只要求出|x -y |,设x =10+t ,y =10-t ,则t 2=4,|x -y |=2|t |=4.故选择D.答案:D6.如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x -A 和x -B ,样本标准差分别为s A 和s B ,则( )A.x -A >x -B ,s A >s BB.x -A <x -B ,s A >s BC.x -A >x -B ,s A <s BD.x -A <x -B ,s A <s B解析:由所给的图知样本A 分别在[2.5,10]之间,且波动大;而样本B 分布在[10,15]之间,且波动小,故x -A <x -B ,s A >s B ,应选B.答案:B 二、填空题7.抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员 第1次 第2次 第3次 第4次 第5次 甲 87 91 90 89 93 乙8990918892________.解析:对于甲,平均成绩为x =90,所以方差为s 2=15×[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4,对于乙,平均成绩为x =90,方差为s 2=15×[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.由于2<4,所以乙的平均成绩较为稳定.答案:28.有10个数据的平均数为12,另20个数的平均数为15,那么所有这30个数的平均数为________.解析:x =10×12+20×1530=14. 答案:149.由正整数组成的一组数据x 1,x 2,x 3,x 4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)解析:设该组数据依次为x 1≤x 2≤x 3≤x 4, 则x 1+x 2+x 3+x 44=2,x 2+x 32=2, ∴x 1+x 4=4,x 2+x 3=4.∵x 1,x 2,x 3,x 4∈N +,∴⎩⎪⎨⎪⎧ x 1=1,x 2=1,x 3=3,x 4=3,或⎩⎪⎨⎪⎧x 1=2,x 2=2,x 3=2,x 4=2.又∵标准差为1,∴x 1=1,x 2=1,x 3=3,x 4=3. 答案:1,1,3,3 三、解答题10.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差.解:(1)由茎叶图可知:甲班身高集中于160~179之间,而乙班身高集中于170~180之间.因此乙班平均身高高于甲班.-=(2)x158+162+163+168+168+170+171+179+179+18210=170,甲班的样本方差s2=12+(162-170)2+(163-170)210[(158-170)+(168-170)2+(168-170)2+(170-170)2+(171-170)2+(179-170)2+(179-170)2+(182-170)2]=57.2.11.从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下(单位:cm):甲:25,41,40,37,22,14,19,39,21,42;乙:27,16,44,27,44,16,40,40,16,40.问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?解:(1)x -甲=110×(25+41+40+37+22+14+19+39+21+42)=110×300=30(cm),x -乙=110×(27+16+44+27+44+16+40+40+16+40)=110×310=31(cm),所以x -甲<x -乙,即乙种玉米的苗长得高.(2)s 2甲=110×[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=110×1 042=104.2(cm 2), s 2乙=110×[(27-31)2×2+(16-31)2×3+(44-31)2×2+(40-31)2×3]=110×1 288=128.8 (cm 2),所以s 2甲<s 2乙,即甲种玉米的苗长得齐.12.某农场计划种植某种新作物,为此对这种作物的两个品种(分别称为品种甲和品种乙)进行田间试验.选取两大块地,每大块地分成n 小块地,在总共2n 小块地中,随机选n 小块地种植品种甲,另外n 小块地种植品种乙.试验时每大块地分成8小块,即n =8,试验结束后得到品种甲和品种乙在各小块地上的每公顷产量(单位:kg/hm 2)如下表:根据试验结果,你认为应该种植哪一品种?解:品种甲的每公顷产量的样本平均数和样本方差分别为: x -甲=18(403+397+390+404+388+400+412+406)=400, s 2甲=18[32+(-3)2+(-10)2+42+(-12)2+02+122+62]=57.25. 品种乙的每公顷产量的样本平均数和样本方差分别为: x -乙=18(419+403+412+418+408+423+400+413)=412, s 2乙=18[72+(-9)2+02+62+(-4)2+112+(-12)2+12]=56. 由以上结果可以看出,品种乙的样本平均数大于品种甲的样本平均数,且两品种的样本方差差异不大,故应该选择种植品种乙.。
2020届一轮复习北师大版统计知识及统计案例小题部分作业
1、气象意义上从春季进入夏季的标志为:“连续5天的日平均温度均不低于”.现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数):①甲地:5个数据的中位数为24,众数为22;②乙地:5个数据的中位数为27,总体均值为24;③丙地:5个数据中有一个数据是32,总体均值为26,总体方差为.则肯定进入夏季的地区有()A.①②③B.①③C.②③D.①【答案】B2、某工厂一年中各月份的收入、支出情况的统计如图所示,下列说法中错误的是(说明:结余=收入-支出)()A.收入最高值与收入最低值的比是B.结余最高的月份是月C.至月份的收入的变化率与至月份的收入的变化率相同D.前个月的平均收入为万元【答案】D3、某公司将职员每月的工作业绩用的自然数表示,甲、乙两职员在2018年月份的工作业绩的茎叶图如图,则下列说法正确的是()A.两职员的平均业绩相同,甲职员的业绩比乙职员的业绩稳定B.两职员的平均业绩不同,甲职员的业绩比乙职员的业绩稳定C.两职员的平均业绩相同,乙职员的业绩比甲职员的业绩稳定D.两职员的平均业绩不同,乙职员的业绩比甲职员的业绩稳定【答案】C【解析】设甲、乙两职员的平均业绩分别为,方差分别为.由茎叶图可得:,,由平均数和方差可知,两职员的平均业绩相同,乙职员的业绩比甲职员的业绩稳定.4、如图是一名篮球运动员在最近5场比赛中所得分数的茎叶图,若该运动员在这5场比赛中的得分的中位数为12,则该运动员这5场比赛得分的平均数不可能为()A. B. C.14 D.【答案】D5、等差数列的公差为1,这组数据的方差为()A. B. C. D.【答案】B【解析】∵是等差数列,∴,∵公差为1,∴,故选B.6、为了了解某校九年级名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是( )A.该校九年级学生分钟仰卧起坐的次数的中位数为次B.该校九年级学生分钟仰卧起坐的次数的众数为次C.该校九年级学生分钟仰卧起坐的次数超过次的人数约有人D.该校九年级学生分钟仰卧起坐的次数少于次的人数约有人【答案】D7、总体由编号为00,01,02,…48,49的50个个体组成,利用下面的随机数表选取8个个体,选取方法是从随机数表第6行的第9列和第10列数字开始由左到右依次选取两个数字,则选出来的第8个个体的编号为()附:第6行至第9行的随机数表2635 7900 3370 9160 1620 3882 7757 49503211 4919 7306 4916 7677 8733 9974 67322748 6198 7164 4148 7086 2888 8519 16207477 0111 1630 2404 2979 7991 9683 5125A.16B.19C.20D.38【答案】B【解析】从随机数表第行的第列和第列数字开始由左到右依次选取两个数字,符合条件依次为:,故第个数为.8、如图是某位篮球运动员场比赛得分的茎叶图,其中一个数据上污渍用代替,那么这位运动员这场比赛的得分平均数不小于得分中位数的概率为()A. B. C. D.【答案】B9、某工厂采用系统抽样方法,从一车间全体名职工中抽取名职工进行一项安全生产调查,现将名职工从到进行编号,已知从到这个编号中抽到的编号是,则在到中随机抽到的编号应是()A. B. C.6 D.7【答案】C【解析】某工厂采用系统抽样方法,从一车间全体名职工中抽取名职工进行一项安全生产调查,∴抽样间隔为:,现将名职工从到进行编号,从到这个编号中抽到的编号是,则在到中随机抽到的编号应是:.10、为了调查某重点高校年大学生就业质量,一调查公司从该校的本科毕业生、硕士毕业生、博士毕业生中共分层抽取了人作为样本研究,已知该校本科毕业生比硕士毕业生多人,其中本科生抽取了人,硕士毕业生抽取了人,则该校共有毕业生人数为()A. B. C. D.【答案】A11、若的平均数为3,标准差为4,且,,则新数据的平均数和标准差分别为()A.、B.、C.、D.、【答案】D【解析】由平均数和标准差的性质可知,若的平均数为,标准差为,则:的平均数为,标准差为,据此结合题意可得:的平均数为:,标准差分别为12、名工人某天生产同一零件,生产的件数是,设其平均数为,中位数为,众数为,则有()A. B. C. D.【答案】D13、将参加夏令营的名学生编号为:,采用系统抽样的方法抽取一个容量为的样本,且随机抽得的号码为,这名学生分住在三个营区,从到在第一营区,从到在第二营区,从到在第三营区,三个营区被抽中的人数为()A. B. C. D.【答案】B【解析】根据系统抽样特点,被抽到号码.第号被抽到,因此第二营区应有人,所以三个营区被抽中的人数为.14、从2007名学生中选取50名参加全国数学联赛,若采用下面的方法选取:先用简单随机抽样从2007人中剔除7人,剩下的2000人再按系统抽样的方法抽取,则每人入选的可能性()A.不全相等B.均不相等C.都相等,且为D.都相等,且为【答案】D【解析】用简单随机抽样从2007人中剔除7人,每个人被剔除的概率相等,剩下的人再按系统抽样的方法抽取,每个人被抽取的概率也相等,∴这种方法下,每人入选的概率是相等的,为,故选D.15、某公司新研发了两种不同型号的平板电脑,公司统计了消费者对这两种型号平板电脑的评分情况,如下图,则下列说法不正确的是( )A.甲、乙型号平板电脑的综合得分相同B.乙型号平板电脑的拍照功能比较好C.在性能方面,乙型号平板电脑做得比较好D.消费者比较喜欢乙型号平板电脑的屏幕【答案】D16、某产品的广告费用与销售额的统计数据如下表:根据上表可得回归方程中的为,据此模型预报广告费用为万元时销售额为()A.万元B.万元C.万元D.万元【答案】B【解析】回归方程为,中心点为,代入回归方程得,回归方程为,当时.17、观测一组的数据,利用两种回归模型计算得.①与②,经计算得模型①的,模型②的,下列说法中正确的是()A.模型①拟合效果好B.模型①与②的拟合效果一样好C.模型②拟合效果好D.模型①负相关【答案】C【解析】系数反映了回归模型的拟合度,一个是,一个是,相关指数的值越大,模型拟合的效果越好.故选C.18、以下四个命题中:①在回归分析中,可用相关指数的值判断模型的拟合效果,越大,模拟的拟合效果越好;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于;③若数据的方差为,则的方差为;④对分类变量与的随机变量的观测值来说,越小,判断“与有关系”的把握程度越大.其中真命题的个数为()A. B. C. D.【答案】B19、一位母亲记录了儿子岁的身高,由此建立的身高与年龄的回归模型为,用这个模型预测这孩子岁时的身高,则正确的叙述是( )A.身高一定是B.身高在以上C.身高在以下D.身高在左右【答案】D【解析】由回归直线方程可得当,时,但回归分析是对实际生产和生活问题的估测,还要受其它一些因素的影响,可能大于估算值,也可能小于估算值,故应选D.20、给出下列四个命题:①使用统计量作列联表的独立性检验时,要求表中的个数据都要大于;②使用统计量进行独立性检验时,若,则有的把握认为两个事件有关;③回归直线就是散点图中经过样本数据点最多的那条直线④在线性回归分析中,如果两个变量的相关性越强,则相关系数就越接近于.其中真命题的个数为()A.个B.个C.个D.个【答案】A21、在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁.为了考察某种埃博拉病毒疫苗的效果,现随机抽取只小鼠进行试验,得到如下列联表:参照附表,下列结论正确的是()A.在犯错误的概率不超过的前提下,认为“小动物是否被感染与有没有服用疫苗有关”B.在犯错误的概率不超过的前提下,认为“小动物是否被感染与有没有服用疫苗无关”C.有的把握认为“小动物是否被感染与有没有服用疫苗有关”D.有的把握认为“小动物是否被感染与有没有服用疫苗无关”【答案】A【解析】由公式可得,所以在犯错误的概率不超过的前提下,认为“小动物是否被感染与有没有服用疫苗有关”.故A正确.22、如图是一容量为100的样本的质量的频率分布直方图,样本质量均在内,其分组为,则样本质量落在内的频数为______.【答案】2023、一组数据共有7个数,记得其中有,还有一个数没记清,但知道这组数的平均数、中位数、众数依次成等差数列,这个数的所有可能值的和为_______.【答案】9【解析】设这个数为,则平均数为,众数为,若,则中位数为,此时;若,则中位数为,此时,;若,则中位数为,,.所有可能值为,故其和为.24、某高校有教授120人,副教授100人,讲师80人,助教60人,现用分层抽样的方法从以上所有老师中抽取一个容量为的样本.已知从讲师中抽取的人数为16,那么_______.【答案】72【解析】依题意得,,由此解得.25、某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程,现发现表中有一个数据模糊看不清,请你推断出该数据的值为_______.【答案】26、为了检验某套眼保健操预防学生的作用,把名做该套眼保健操的学生与另外名未做该套眼保健操的学生的视力情况作记录并比较,提出假设:“这套眼保健操不能起到预防近视的作用”,利用列联表计算所得的.经查对临界表知.对此,四名同学得出了以下结论:①有的把握认为“这套眼保健操能起到预防近视的作用”;②若某人未做该套眼保健操,那么他有的可能近视;③这套眼保健操预防近视的有效率为;④这套眼保健操预防近视的有效率为.其中所有正确结论的序号是_________.【答案】①【解析】根据查对临界表知,故有的把握认为“这套眼保健操能起到预防近视的作用”,即①正确;仅指“这套眼保健操能起到预防近视的作用”的可信程度,所以②③④错误.27、某报考音乐专业的学生在次音乐测试中,音乐成绩如下表所示:根据上表得到音乐成绩与考次的回归方程为,若直线:与直线:垂直,则________.【答案】28、下表为“民生生鲜超市”的员工工作年限(单位:年)与平均月薪(单位:千元)的对照表.利用最小二乘法求得关于的线性回归方程为,则,,这三个样本点中落在回归直线上方的个数为_________.【答案】【解析】由表中数据得,,,样本中心点一定在回归直线上, ,解得.当时, ,点在回归直线下方;当时, ,点在回归直线上方;当时, ,点在回归直线下方.29、已知下列命题:①在线性回归模型中,相关指数表示解释变量对于预报变量的贡献率,越接近于,表示回归效果越好;②两个变量相关性越强,则相关系数的绝对值就越接近于;③在回归直线方程中,当解释变量每增加一个单位时,预报变量平均减少个单位;④对分类变量与,它们的随机变量的观测值来说,越小,“与有关系”的把握程度越大.其中正确命题的序号是________.【答案】①②③【解析】根据统计的相关知识易得①②③均正确,对于④,观测值越大,“与有关系”的把握程度越大,④错误,所以正确命题的序号是①②③.30、某校中午采取回宿舍午休制度以来,学生睡眠质量得到提高,全校人的下午上课的精神状态有了较大提升但仍需改进。
(常考题)北师大版高中数学必修三第一章《统计》检测(含答案解析)(5)
一、选择题1.为了了解某同学的数学学习情况,对他的6次数学测试成绩进行统计,作出的茎叶图如图所示,则下列关于该同学数学成绩的说法正确的是( )A .中位数为83B .众数为85C .平均数为85D .方差为192.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.53.图1是某学习小组学生数学考试成绩的茎叶图,1号到16号的同学的成绩依次为1A ,216,,A A ⋯,图2是统计茎叶图中成绩在一定范围内的学生情况的程序框图,那么该程序框图输出的结果是( )A .10B .6C .7D .164.有一个容量为200的样本,样本数据分组为[50,70),[70,90),[90,110),[110,130),[130,150),其频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在区间[90,110)内的频数为( )A .48B .60C .64D .725. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日 6.总体由编号为01,02,,29,30的30个个体组成,利用下面的随机数表选取4个个体.选取的方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的第4个个体的编号为( ).7806 6572 0802 6314 2947 1821 98003204 9234 4935 3623 4869 6938 7481A .02B .14C .18D .297.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元8.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( ) A .10B .11C .12D .139.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64B .96C .144D .16010.为了考察两个变量x 和y 之间的线性相关性,甲.乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2.已知在两个人的试验中发现对变量x 的观测数据的平均值恰好相等,都为s ,对变量y 的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是( ) A .直线l 1和l 2有交点(s ,t)B .直线l 1和l 2相交,但是交点未必是点(s ,t)C .直线l 1和l 2由于斜率相等,所以必定平行D .直线l 1和l 2必定重合11.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为 A .12B .14C .16D .1812.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是( ) A .0.53B .0.5C .0.47D .0.37二、填空题13.某社会爱心组织面向全市征召义务宣传志愿者.现从符合条件的志愿者中随机抽取100名按年龄分组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45),得到的频率分布直方图如图所示.若从第3,4,5组中用分层抽样的方法抽取6名志愿者参与广场的宣传活动,应从第3组抽取__________名志愿者.14.上海市普通高中学业水平等级考成绩共分为五等十一级,各等级换算成分数如表所示:等级A+A B+B B-C+C C-D+D E分数7067646158555249464340上海某高中2018届高三()1班选考物理学业水平等级考的学生中,有5人取得A+成绩,其他人的成绩至少是B级及以上,平均分是64分,这个班级选考物理学业水平等级考的.人数至少为______人15.某学校高一年级男生人数占该年级学生人数的45%,在一次考试中,男、女生平均分数依次为72、74,则这次考试该年级学生的平均分数为__________.16.某次测试共有100名考生参加,测试成绩的频率分布直方图如下图所示,则成绩在80分以上的人数为__________.17.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组没有疗效的有6人,则第三组中有疗效的人数为__________.18.已知某市A 社区35岁至45岁的居民有450人,46岁至55岁的居民有750人,56岁至65岁的居民有900人.为了解该社区35岁至65岁居民的身体健康状况,社区负责人采用分层抽样技术抽取若干人进行体检调查,若从46岁至55岁的居民中随机抽取了50人,试问这次抽样调查抽取的人数是________人.19.某班60名学生参加普法知识竞赛,成绩都在区间[40100],上,其频率分布直方图如图所示,则成绩不低于60分的人数为___.20.一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,…,10.现用系统抽样方法抽取一个容量为10的样本,如果在第一组随机抽取的号码为6,那么在第7组中抽取的号码是_________.三、解答题21.据了解,温带大陆性气候,干燥,日照时间长,昼夜温差大,有利于植物糖分积累.某课题研究组欲研究昼夜温差大小()/x ℃与某植物糖积累指数()/y GI 之间的关系,得到如下数据:组数 第一组 第二组第三组第四组第五组第六组昼夜温差/℃x1011 13 12 8 6某植物糖积累指数/y GI20 24 30 28 18 15下的2组数据进行检验,假设这剩下的2组数据恰好是第一组与第六组数据.(1)求y 关于x 的线性回归方程ˆˆˆybx a =+ (2)若由线性回归方程得到的估计数据与所选出的检验数据的差的绝对值均不超过2.58,则认为得到的线性回归方程是理想的,试问(1)中所得线性回归方程是否理想?(参考公式:回归直线方程ˆˆˆybx a =+的斜率和截距的最小二乘估计()()()211ˆˆˆ,iii ni ni x x y y bay bx x x ==--==--∑∑22.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:(1)求y 关于x 的线性回归直线方程;(2)如果某天的气温是–10C ︒,预测这天卖出的热饮杯数(四舍五入,取整数).附:对于线性回归直线方程ˆˆˆybx a =+,其中1122211()()ˆ()nnii i ii i nniii i xx y y x ynx yb xx xnx ====---==--∑∑∑∑,ˆˆay bx =-, 23.为提高某作物产量,种植基地对单位面积播种数与每棵作物的产量之间的关系进行了研究,收集了10块试验田的数据,得到下表:技术人员选择模型21y a bx =+作为y 与x 的回归方程类型,令2i i u x =,1ii v y =. (1)由最小二乘法得到线性回归方程v uβα=+,求y 关于x 的回归方程; (2)利用(1)得出的结果,计算当单位面积播种数x 为何值时,单位面积的总产量w xy =的预报值最大?(计算结果精确到0.01)附:对于一组数据()11,u v ,()22,u v …(),n n u v 其回归直线v u βα=+的斜率和截距的最小二乘法估计分别为1221ni i i nii u v nu vunuβ==-⋅=-∑∑,v u αβ=-.参考数据:1500nii u==∑,140ni i v ==∑,12321n i i i u v ==∑,2135642ni i u ==∑ 5.48≈.24.某大学为了了解数学专业研究生招生的情况,对近五年的报考人数进行了统计,得到如下统计数据:(1)经分析,y 与x 存在显著的线性相关性,求y 关于x 的线性回归方程ˆˆˆybx a =+并预测2020年(按6x =计算)的报考人数;(2)每年报考该专业研究生的考试成绩大致符合正态分布()2,Nμσ,根据往年统计数据385μ=,2225σ=,录取方案:总分在400分以上的直接录取,总分在[]385,400之间的进入面试环节,录取其中的80%,低于385分的不予录取,请预测2020年该专业录取的大约人数(最后结果四舍五入,保留整数).参考公式和数据:()()()121ˆniii nii x x y y bx x ==--=-∑∑,ˆˆay bx =-,()()51360iii x x y y =--=∑.若随机变量()2~,X Nμσ,则()0.6826P X μσμσ-<<+=,()220.9544P X μσμσ-<<+=,()330.9974P X μσμσ-<<+=.25.假设关于某设备的使用年限x 和所支出的维修费用y(万元),有如下的统计资料:若由资料可知y 对x 呈线性相关关系,试求: (1)回归直线方程;(2)估计使用年限为10年时,维修费用约是多少?(参考:1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-)26.随着各国经贸关系的进一步加深,许多国外的热带水果进入国内市场,牛油果作为一种热带水果,越来越多的中国消费者对这种水果有了一种全新的认识,它富含多种维生素、丰富的脂肪和蛋白质,钠、钾、镁、钙等含量也高,除作生果食用外也可作菜肴和罐头.牛油果原产于墨西哥和中美洲,后在加利福尼亚州被普遍种植.因此加利福尼亚州成为世界上最大的牛油果生产地,在全世界热带和亚热带地区均有种植,但以美国南部、危地马拉、墨西哥及古巴栽培最多,并形成了墨西哥系、危地马拉系、西印度系三大种群,我国的广东、海南、福建、广西、台湾、云南及四川等地都有少量栽培.市场上的牛油果大部分都是进口的.为了调查市场上牛油果的等级代码数值x 与销售单价y 之间的关系,经统计得到如下数据:等级代码数值x 38 48 58 68 78 88 销售单价y (元/kg )16.818.820.822.82425.8(1)已知销售单价y 与等级代码数值x 之间存在线性相关关系,利用前5组数据求出y 关于x 的线性回归方程;(2)若由(1)中线性回归方程得到的估计值与最后一组数据的实际值之间的误差不超过1,则认为所求回归方程是有效可靠的,请判断所求回归直线方程是否有效可靠? (3)若一果园估计可以收获等级代码数值为85的牛油果980kg ,求该果园估计收入为多少元.参考公式:对一组数据()11,x y ,()22,x y ,…,(),n n x y ,其回归直线y bx a =+的斜率和截距的最小二乘估计分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,b y bx =-.参考数据:516169.6i ii x y==∑,52117820i i x ==∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】试题分析:A 选项,中位数是84;B 选项,众数是出现最多的数,故是83;C 选项,平均数是85,正确;D 选项,方差是,错误.考点:•茎叶图的识别 相关量的定义2.A解析:A 【分析】计算得到 4.5x =,114t y +=,代入回归方程计算得到答案. 【详解】3456 4.54x +++==, 2.54 4.51144t t y ++++==,中心点(),x y 过ˆ0.70.35yx =+, 即114.50.70.354t +=⨯+,解得3t =. 故选:A . 【点睛】本题考查了回归方程的相关问题,意在考查学生的计算能力.3.A解析:A 【分析】先弄清楚程序框图中是统计成绩不低于90分的学生人数,然后从茎叶图中将不低于90分的个数数出来,即为输出的结果. 【详解】176A =,1i =,16i ≤成立,190A ≥不成立,112i =+=; 279A =,2i =,16i ≤成立,290A ≥不成立,112i =+=;792A =,7i =,16i ≤成立,790A ≥成立,011n =+=,718i =+=;依此类推,上述程序框图是统计成绩不低于90分的学生人数,从茎叶图中可知,不低于90分的学生数为10,故选A . 【点睛】本题考查茎叶图与程序框图的综合应用,理解程序框图的意义,是解本题的关键,考查理解能力,属于中等题.4.B解析:B 【分析】由(0.00500.00750.01000.0125)201a ++++⨯=,求出a ,计算出数据落在区间[90,110)内的频率,即可求解.【详解】由(0.00500.00750.01000.0125)201a ++++⨯=, 解得0.015a =,所以数据落在区间[90,110)内的频率为0.015200.3⨯=, 所以数据落在区间[90,110)内的频数2000.360⨯=, 故选B. 【点睛】本题主要考查了频率分布直方图,频率、频数,属于中档题.5.C解析:C 【分析】认真观察题中所给的折线图,对照选项逐一分析,求得结果. 【详解】这10天中第一天,第三天和第四天共3天空气质量为一级,所以A 正确; 从图可知从6日到9日 2.5PM 日均值逐渐降低,所以B 正确; 从图可知,这10天中 2.5PM 日均值最高的是12月6日,所以D 正确; 由图可知,这10天中 2.5PM 日均值的中位数是4145432+=,所以C 不正确; 故选C. 【点睛】该题考查的是有关利用题中所给的折线图,描述对应变量所满足的特征,在解题的过程中,需要逐一对选项进行分析,正确理解题意是解题的关键.6.D解析:D 【解析】分析:根据随机数表法则取数:取两个数,不小于30的舍去,前面已取的舍去. 详解:从表第1行5列,6列数字开始由左到右依次选取两个数字中小于30的编号为:08,02,14,29.∴第四个个体为29. 选D .点睛:本题考查随机数表,考查对概念基本运用能力.7.B解析:B 【详解】试题分析:4235492639543.5,4244x y ++++++====, ∵数据的样本中心点在线性回归直线上,回归方程ˆˆˆybx a =+中的ˆb 为9.4, ∴42=9.4×3.5+a ,∴ˆa=9.1, ∴线性回归方程是y=9.4x+9.1,∴广告费用为6万元时销售额为9.4×6+9.1=65.5 考点:线性回归方程8.C解析:C 【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n=30n﹣19,由401≤30n﹣21≤755,求得正整数n的个数,即可得出结论.【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列,又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,∴等差数列的通项公式为a n=11+(n﹣1)30=30n﹣19,由401≤30n﹣19≤755,n为正整数可得14≤n≤25,∴做问卷C的人数为25﹣14+1=12,故选C.【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.9.D解析:D【解析】【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81= 12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数.【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81= 12816,因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D.【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题10.A解析:A【分析】由题意知,两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,所以两组数据的样本中心点是(s,t),回归直线经过样本的中心点,得到直线l1和l2都过(s,t).【详解】∵两组数据变量x的观测值的平均值都是s,对变量y的观测值的平均值都是t,∴两组数据的样本中心点都是(s,t)∵数据的样本中心点一定在线性回归直线上,∴回归直线l1和l2都过点(s,t)∴两条直线有公共点(s,t)故选A.【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x与Y之间的关系,这条直线过样本中心点.11.C解析:C【解析】【分析】根据分层抽样的定义求出在各层中的抽样比,即样本容量比上总体容量,按此比例求出在高三年级中抽取的人数.【详解】根据题意得,用分层抽样在各层中的抽样比为421 105020=,则在高三年级抽取的人数是14001625⨯=人,故选C.【点睛】该题所考查的是有关分层抽样的问题,在解题的过程中,需要明确无论采用哪种抽样方法,都必须保证每个个体被抽到的概率是相等的,所以注意成比例的问题.12.A解析:A【解析】分析:由题意结合统计表确定频数,然后确定频率即可.详解:由题意可知,取到卡片为奇数的频数为:1356181153++++=,取卡片的次数为100次,则取到号码为奇数的频率是530.53 100=.本题选择A选项.点睛:本题主要考查频率的定义及其应用等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.【分析】先分别求出这3组的人数再利用分层抽样的方法即可得出答案【详解】第3组的人数为第4组的人数为第5组的人数为所以这三组共有60名志愿者所以利用分层抽样的方法在60名志愿者中抽取6名志愿者第三组应解析:3【分析】先分别求出这3组的人数,再利用分层抽样的方法即可得出答案.【详解】第3组的人数为10050.0630⨯⨯=,第4组的人数为10050.0420⨯⨯=,第5组的人数为1000.02510⨯⨯=,所以这三组共有60名志愿者,所以利用分层抽样的方法在60名志愿者中抽取6名志愿者,第三组应抽取306360⨯=名, 故答案为:3.【点睛】关键点点睛:该题考查的是有关频率分布直方图的识别以及分层抽样某层抽取个数的问题,正确解题的关键是掌握在抽取过程中每个个题被抽到的机会均等. 14.15【解析】【分析】设取得A 成绩的x 人取得成绩的y 人取得B 成绩的z 人由题意可得:解得:结合xy 可求的最【详解】设取得A 成绩的x 人取得成绩的y 人取得B 成绩的z 人则即又xy 即当且仅当时取得最小值15取得解析:15【解析】【分析】设取得A 成绩的x 人,取得B +成绩的y 人,取得B 成绩的z 人,由题意可得:()70567x 64y 61z 645x y z ⨯+++=⨯+++,解得:z x 10-=,结合x ,y ,z N ∈,可求5x y z +++的最.【详解】设取得A 成绩的x 人,取得B +成绩的y 人,取得B 成绩的z 人,则()70567x 64y 61z 645x y z ⨯+++=⨯+++,即z x 10-=,又x ,y ,z N ∈,即当且仅当x 0=,y 0=,z 10=时,5x y z +++取得最小值15,取得A 成绩的0人,取得B +成绩的0人,取得B 成绩的10人,这个班级选考物理学业水平等级考的人数至少为15人,故答案为15【点睛】本题考查了实际问题通过数学问题解决,考查了阅读理解及数学建模的能力,属中档题. 15.1【解析】分析:根据平均数与对应概率乘积的和得总平均数计算结果详解:点睛:本题考查平均数考查基本求解能力解析:1【解析】分析:根据平均数与对应概率乘积的和得总平均数,计算结果.详解:7245%74(145%)72.1⨯+⨯-=.点睛:本题考查平均数,考查基本求解能力.16.25【解析】分析:先求成绩在80分以上的概率再根据频数等于总数与对应概率乘积求结果详解:因为成绩在80分以下的概率为所以成绩在80分以上的概率为因此成绩在80分以上的人数为点睛:频率分布直方图中小长解析:25【解析】分析:先求成绩在80分以上的概率,再根据频数等于总数与对应概率乘积求结果.详解:因为成绩在80分以下的概率为(0.0050.03+0.0410=0.75+⨯),所以成绩在80分以上的概率为10.750.25-=,因此成绩在80分以上的人数为0.25100=25.⨯点睛:频率分布直方图中小长方形面积等于对应区间的概率,所有小长方形面积之和为1; 频率分布直方图中组中值与对应区间概率乘积的和为平均数; 频率分布直方图中小长方形面积之比等于对应概率之比,也等于对应频数之比.17.12【解析】分析:由频率=以及直方图可得分布在区间第一组与第二组共有20人的频率即可求出第三组中有疗效的人数得到答案详解:由直方图可得分布在区间第一组和第二组共有20人分布唉区间第一组与第二组的频率解析:12【解析】分析:由频率=频数样本容量,以及直方图可得分布在区间第一组与第二组共有20人的频率,即可求出第三组中有疗效的人数得到答案.详解:由直方图可得分布在区间第一组和第二组共有20人,分布唉区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人第三组的频率为0.36,所以第三组的人数为18人,第三组中没有疗效的有6人,第三组由疗效的有12人.点睛:1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法,分布表在数量表示上比较准确,直方图比较直观.2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.18.【解析】根据题意可得抽样比为则这次抽样调查抽取的人数是即答案为140解析:140【解析】 根据题意可得抽样比为501,75015= 则这次抽样调查抽取的人数是()114507509002100140,1515++=⨯= 即答案为140.19.30【解析】由题意可得:则成绩不低于分的人数为人解析:30【解析】由题意可得:()400.0150.0300.0250.0051030⨯+++⨯=则成绩不低于60分的人数为30人20.66【解析】因为系统抽样第一组抽取的号码为6所以第k 组抽取号码应该为故第7组抽取号码为66填66解析:66【解析】因为系统抽样第一组抽取的号码为6,所以第k 组抽取号码应该为6+10k-11,2,10k ⨯=(),,故第7组抽取号码为66,填66.三、解答题21.(1)171277y =⨯;(2)该小组所得线性回归方程是理想的. 【分析】 (1)根据数据求出ˆb与ˆa 的值,即可求出y 关于x 的线性回归方程; (2)分别计算出1月份和6月份对应的预测值,与检验数据作差取绝对值,再与2.58进行比较即可得到结论.【详解】(1)由表中2月至5月份的数据, 得11(1113128)11,(24302818)2544x y =+++==+++=, 故有()()520(1)2513(3)(7)34i i i x x y y =--=⨯-+⨯+⨯+-⨯-=∑, ()5222222021(3)14i i x x =-=+++-=∑, 34171712,251114777b a y bx ∴===-=-⨯=-, 即y 关于x 的线性回归方程为171277y =⨯; (2)由171277y =⨯,当10x =时,171215810777y =⨯-=,1581820 2.5877-=<, 当6x =时,1712906777y =⨯=, 901515 2.5877-=<, 则该小组所得线性回归方程是理想的.【点睛】方法点睛:该题考查的是有关回归分析的问题,解题方法如下:(1)结合题中所给的数据,根据最小二乘法系数公式起的ˆb与ˆa 的值,得到回归直线方程;(2)将相应的变量代入,得到的值域题中条件比较,得到结论.22.(1)ˆ 5.9129.5yx =-+;(2)189杯. 【分析】(1)根据表中数据计算可得所需数据,利用最小二乘法可求得回归直线方程; (2)代入10x =-即可求得预测值.【详解】(1)由表中数据得:505101555x -++++==,15712710772371005y ++++==, 517855357205551025i ii x y==-+++=∑,5212525100225375i i x ==+++=∑, 102555100ˆ 5.9375525b -⨯⨯∴==--⨯,ˆ100 5.95129.5a ∴=+⨯=, y ∴关于x 的线性回归直线方程为:ˆ 5.9129.5y x =-+.(2)令10x =-,解得:188.5189y =≈,∴如果某天的气温是–10C ︒,预测这天卖出的热饮杯数为189杯.【点睛】本题考查利用最小二乘法求解回归直线、利用回归直线求解预测值的问题;关键是熟练掌握最小二乘法,考查学生的计算能力.23.(1)212.50.03y x=+;(1)9.13x =棵2/m . 【分析】(1)先利用公式和数据计算,αβ,即得v 关于u 的线性回归方程,再代入得到y 关于x 的回归方程即可;(2)先利用(1)的结果计算w xy =,再利用基本不等式求其最大值即可.【详解】解:(1)由题意得115010n i i u u ===∑,11410ni i v v ===∑, ∴1011022212321105040.0335*******1010i ii i i u v u v u uβ==-⨯⨯=⨯⋅--≈=-∑∑, 2.5v u αβ=-=. 所以v 关于u 的线性回归方程为0.03 2.5v u =+.则y 关于x 的回归方程为212.503ˆ0.y x =+. (2)根据(1)的结果并结合条件,单位面积的总产量的预报值21252.50.030.03x w x x x==++ 1.833≤=≈. 当且仅当2.50.03x x =时,等号成立,此时9.13x =≈. 即当9.13x =棵2/m 时,单位面积的总产量w 的预报值最大,最大值是1.83. 【点睛】本题考查了非线性回归方程的求法以及方程的应用,属于中档题.24.(1)ˆ368yx =-;208人;(2)90. 【分析】(1)由已知表格中的数据求得ˆb与ˆa 的值,则线性回归方程可求,取6x =求得y 值即可;(2)研究生的考试成绩大致符合正态分布(385N ,215),求出(400)P X >,乘以208可得直接录取人数,再求出[385,400]之间的录取人数,则答案可求.【详解】解:(1)()11234535x =++++= ()130601001401701005y =++++= 可求:()25110i i x x =-=∑, 由()()()121360ˆ3610niii n i i x x y y b x x ==--===-∑∑, ˆˆ1003638ay bx =-=-⨯=- ∴y 关于x 的线性回归方程是ˆ368yx =-. 当2020年即6x =时,ˆ3668208y=⨯-=人即2020年的报考人数大约为208人(2)研究生的考试成绩大致符合正态分布()2385,15N , 则400=385+15,()10.68264000.15872P x ->==, 直接录取人数为2800.158733.0133⨯=≈人[]385,400之间的录取人数为0.68262800.856.8572⨯⨯=≈ 所以2020年该专业录取的大约为33+57=90人【点睛】本题考查线性回归方程的求法,考查正态分布曲线的特点及所表示的意义,考查运算求解能力,属于中档题.25.(1) 1.2308ˆ.0yx =+;(2)12.38万元.. 【分析】(1)由已知表格中的数据,易计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221n ii i n i i x y nxy b xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.(2)把使用年限10代入回归直线方程,即可估算出维修费用的值.【详解】(1)4x =,5y =,52190ii x==∑,51112.3i i i x y ==∑, 12215 1.235n ii i n ii x y xy b xx ==-==-∑∑,0.08a y bx =-=,所以回归直线方程为 1.2308ˆ.0yx =+; (2) 1.23100.0812.3ˆ8y=⨯+=, 即估计用10年时维修费约为12.38万元.【点评】本题考查回归直线的方程求解,关键是要求出回归直线方程的系数,由已知的变量x ,y 的值,我们计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221n ii i nii x y nxy b x nx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.属于中等题.26.(1)0.1849.968y x =+;(2)所求回归直线方程是有效可靠的;(3)该果园预计收入25095.84元.【分析】(1)求出x 的平均值x ,y 的平均值y ,再根据公式求出b 和a ,即可得出回归方程; (2)将88x =代入(1)中的回归方程,求出y ,然后用25.8y和1比较即可判断; (3)将85x =代入回归方程估计出单价,即可计算出收入.【详解】(1)由题意,得3848586878585x ++++==, 16.818.820.822.82420.645y ++++==, 则515222156169.655820.641840.1841782055810005i i i i i x y x y b xx ==-⋅-⨯⨯====-⨯-∑∑, 20.640.184589.968a y bx =-=-⨯=,故所求回归方程为0.1849.968y x =+;(2)当88x =时,0.184889.96826.16y =⨯+=,所以26.1625.80.361-=<,所以所求回归直线方程是有效可靠的;(3)当85x =,0.184859.96825.608y =⨯+=,所以25.60898025095.84⨯=(元),所以该果园预计收入25095.84元.【点睛】本题考查回归方程的求法以及利用回归方程估计值,属于基础题.。
2020届一轮复习北师大版 统计 作业
一、选择题(本大题共12小题,每小题5分,共60分)1.某公司从代理的A,B,C,D四种产品中,按分层抽样的方法抽取容量为110的样本,已知A,B,C,D四种产品的数量比是2∶3∶2∶4,则该样本中D类产品的数量为() A.22 B.33C.40 D.55答案 C解析根据分层抽样,总体中产品数量比与抽取的样本中产品数量比相等,∴样本中D类产品的数量为110×42+3+2+4=40.2.已知总体容量为106,若用随机数法抽取一个容量为10的样本,下面对总体的编号最方便的是()A.1,2,…,106 B.0,1,2,…,105C.00,01,…,105 D.000,001,…,105答案 D解析由随机数抽取原则可知选D.3.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的线性回归方程为y=7.19x +73.93,用这个方程预测这个孩子10岁时的身高,正确的叙述是()A.身高一定是145.83 cmB.身高在145.83 cm以上C.身高在145.83 cm以下D.身高在145.83 cm左右答案 D解析回归直线是用来估计总体的,所以我们求的值都是估计值,所以我们得到的结果也是近似的,只要把自变量的值代入线性回归方程即可求得结果为145.83 cm.4.我市对上下班交通情况作抽样调查,上、下班时间各抽取12辆机动车测其行驶速度(单位:km/h),并作出茎叶图(如图):则上、下班时间行驶时速的中位数分别为()A.28与28.5 B.29与28.5C.28与27.5 D.29与27.5答案 D5.某农科所种植的甲、乙两种水稻,连续六年在面积相等的两块稻田中作对比试验,试验得出平均产量是x 甲=x 乙=415 kg ,方差是s 2甲=794,s 2乙=958,那么这两种水稻中产量比较稳定的是( ) A .甲B .乙C .甲、乙一样稳定D .无法确定答案 A解析 ∵s 2甲<s 2乙,∴产量比较稳定的是甲,故选A.6.现要完成下列3项抽样调查:①从10盒酸奶中抽取3盒进行食品卫生检查;②科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请32名听众进行座谈;③东方中学共有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名.为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本. 较为合理的抽样方法是( )A .①简单随机抽样,②系统抽样,③分层抽样B .①简单随机抽样,②分层抽样,③系统抽样C .①系统抽样,②简单随机抽样,③分层抽样D .①分层抽样,②系统抽样,③简单随机抽样 答案 A解析 ①总体较少,宜用简单随机抽样;②已分段,宜用系统抽样;③各层间差异明显,宜用分层抽样.故选A.7.一组数据中的每一个数据都乘2,再减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是( ) A .40.6,1.1 B .48.8,4.4 C .81.2,44.4 D .78.8,75.6答案 A解析 设原来数据的平均数和方差分别为x 和s 2,则⎩⎨⎧4.4=22s 2,2x -80=1.2,得⎩⎨⎧s 2=1.1,x =40.6.8.某校为了对初三学生的体重进行摸底调查,随机抽取了50名学生的体重(kg),将所得数据整理后,画出了频率分布直方图,如图所示,体重在[45,50)内适合跑步训练,体重在[50,55)内适合跳远训练,体重在[55,60)内适合投掷相关方面训练,估计该校初三学生适合参加跑步、跳远、投掷三项训练的集训人数之比为( )A .4∶3∶1B .5∶3∶1C .5∶3∶2D .3∶2∶1考点 频率分布直方图 题点 求频数 答案 B解析 体重在[45,50)内的频率为0.1×5=0.5,体重在[50,55)内的频率为0.06×5=0.3,体重在[55,60)内的频率为0.02×5=0.1, ∵0.5∶0.3∶0.1=5∶3∶1,∴可估计该校初三学生适合参加跑步、跳远、投掷三项训练的集训人数之比为5∶3∶1,故选B.9.从存放号码分别为1,2,…,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是( ) A .0.53 B .0.5 C .0.47 D .0.37 答案 A解析 频率为1100(13+5+6+18+11)=0.53.10.某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是( ) A .这种抽样方法是一种分层抽样 B .这种抽样方法是一种系统抽样C .这五名男生成绩的方差大于这五名女生成绩的方差D .该班男生成绩的平均数小于该班女生成绩的平均数 答案 C解析 x 男=15(86+94+88+92+90)=90,x 女=15(88+93+93+88+93)=91,s 2男=15[(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8, s 2女=15[(88-91)2+(93-91)2+(93-91)2+(88-91)2+(93-91)2]=6. 11.从一堆苹果中任取了20个,并得到它们的质量(单位:克)数据分布表如下:则这堆苹果中,质量不小于120克的苹果数约占苹果总数的( ) A .30% B .70% C .60% D .50% 答案 B解析 由数据分布表可知,质量不小于120克的苹果有10+3+1=14(个),占苹果总数的1420×100%=70%.12.对一组数据x i (i =1,2,3,…,n ),如果将它们改变为x i +c (i =1,2,3,…,n ),其中c ≠0,则下面结论中正确的是( ) A .平均数与方差均不变 B .平均数变了,而方差保持不变 C .平均数不变,而方差变了 D .平均数与方差均发生了变化 答案 B解析 设原来数据的平均数为x ,将它们改变为x i +c 后平均数为x ′,则x ′=x +c ,而方差s ′2=1n [(x 1+c -x -c )2+…+(x n +c -x -c )2]=s 2.二、填空题(本大题共4小题,每小题5分,共20分)13.将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是______________. 答案 16,28,40,52解析 编号组数为5,间隔为605=12,因为在第一组抽得04号,且4+12=16,16+12=28,28+12=40,40+12=52, 所以其余4个号码为16,28,40,52.14.从甲、乙、丙三个厂家生产的同一种产品中各抽取8件产品,对其使用寿命(单位:年)跟踪调查结果如下: 甲:3,4,5,6,8,8,8,10; 乙:4,6,6,6,8,9,12,13; 丙:3,3,4,7,9,10,11,12.三个厂家在广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数:甲________,乙________,丙________. 答案 众数 平均数 中位数解析 甲、乙、丙三个厂家从不同角度描述了一组数据的特征.甲:该组数据8出现的次数最多;乙:该组数据的平均数x =4+6×3+8+9+12+138=8;丙:该组数据的中位数是7+92=8.15.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球的时间x (单位:小时)与当天投篮命中率y 之间的关系:小李这5天的平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为________. 答案 0.5 0.53解析 小李这5天的平均投篮命中率y =0.4+0.5+0.6+0.6+0.45=0.5,可求得小李这5天的平均打篮球时间x =3.根据表中数据可求得b =0.01,a =0.47,故线性回归方程为y =0.01x +0.47,将x =6代入,得6号打6小时篮球的投篮命中率约为0.53.16.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温的数据如下表.由表中数据得线性回归方程y =bx +a 中b =-2,据此预测当气温为5℃时,用电量的度数约为________. 答案 40解析 ∵x =14(14+12+8+6)=10,y =14(22+26+34+38)=30,∴a =y -b x =30+2×10=50, ∴线性回归方程为y =-2x +50. ∴当x =5时,y =-2×5+50=40. 三、解答题(本大题共6小题,共70分)17.(10分)设某校共有118名教师,为了支援西部的教育事业,现要从中随机地抽出16名教师组成暑期西部讲师团.请用系统抽样法选出讲师团成员. 解 (1)对118名老师编号;(2)计算间隔k =11816=7.375,不是整数.从总体中随机剔除6个个体,然后再对余下112名教师重新编号,计算间隔k =7,分成16组,每组7人;(3)在1~7之间随机取一个数字,如选5,将5加上间隔7得到第二个个体编号12,再加7得到第三个个体编号19,依次进行下去,直到获取整个样本5,12,19,26,33,40,47,54,61,68,75, 82,89,96,103,110.这些编号所对应的教师便是讲师团成员.18.(12分)某市化工厂三个车间共有工人1 000名,各车间男、女工人数如下表:已知在全厂工人中随机抽取1名,抽到第二车间男工的可能性是0.15. (1)求x 的值;(2)现用分层抽样的方法在全厂抽取50名工人,则应在第三车间抽取多少名工人? 考点 分层抽样的方法题点 由各层比例关系求每层抽取个数. 解 (1)依题意有x1 000=0.15,解得x =150.(2)∵第一车间的工人数是173+177=350,第二车间的工人数是100+150=250, ∴第三车间的工人数是1 000-350-250=400. 设应从第三车间抽取m 名工人,则有m 400=501 000,解得m =20,∴应在第三车间抽取20名工人.19.(12分)为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩x 、物理成绩y 进行分析.下表是该学生7次考试的成绩.(1)他的数学成绩与物理成绩哪个更稳定?请给出你的证明;(2)已知该学生的物理成绩y 与数学成绩x 是线性相关的,若该学生的物理成绩达到115分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该学生在学习数学、物理上的合理建议.解 (1)x =100+-12-17+17-8+8+127=100,y =100+-6-9+8-4+4+1+67=100,∴s 2数学=142,s 2物理=2507,从而s 2数学>s 2物理, ∴物理成绩更稳定.(2)∵x 与y 之间具有线性相关关系, ∴b =0.5,a =100-0.5×100=50. ∴线性回归方程为y =0.5x +50. 当y =115时,x =130.估计他的数学成绩大约是130分.建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高. 20.(12分)为了研究三月下旬的平均气温(x )与四月棉花害虫化蛹高峰日(y )的关系,某地区观察了2012年至2017年的情况,得到下面数据:已知x 与y 之间具有线性相关关系,据气象预测该地区在2018年三月下旬平均气温为27℃,试估计2018年四月化蛹高峰日为哪天? 解 由题意知,x ≈29.13,y =7.5,∑6i =1x 2i =5 130.92, ∑6i =1x i y i =1 222.6,∴b=∑6i=1x i y i-6x y∑6i=1x2i-6x2≈-2.2,a=y-b x≈71.6,∴线性回归方程为y=-2.2x+71.6.当x=27时,y=-2.2×27+71.6=12.2,据此,可估计该地区2018年4月12日或13日为化蛹高峰日.21.(12分)某中学高一女生共有450人,为了了解高一女生的身高(单位:cm)情况,随机抽取部分高一女生测量身高,所得数据整理后列出频率分布表如下:(1)求出表中字母m,n,M,N所对应的数值;(2)画出频率分布直方图;(3)估计该校高一女生身高在[149.5,165.5)范围内的有多少人?解(1)由题意得M=80.16=50,落在区间[165.5,169.5)内的数据频数m=50-(8+6+14+10+8)=4,频率为n=0.08,总频率N=1.00.(2)频率分布直方图如图:(3)该校高一女生身高在[149.5,165.5)之间的比例为0.12+0.28+0.20+0.16=0.76,则该校高一女生在此范围内的人数为450×0.76=342.22.(12分)为了比较两种治疗失眠症的药(分别称为A 药、B 药)的疗效,随机地选取20位患者服用A 药,20位患者服用B 药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下: 服用A 药的20位患者日平均增加的睡眠时间: 0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)根据两组数据完成如图所示的茎叶图,从茎叶图看,哪种药的疗效更好?(2)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? 解 (1)由观测结果可绘制茎叶图如图.从以上茎叶图可以看出,A 药疗效的试验结果有710的叶集中在茎“2.”,“3.”上,而B 药疗效的试验结果有710的叶集中在茎“0.”,“1.”上,由此可看出A 药的疗效更好.(2)设A 药观测数据的平均数为x ,B 药观测数据的平均数为y . 由观测结果可得:x =120×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,y =120×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6,由以上计算结果可得x >y ,因此可看出A 药的疗效更好.。
2020届一轮复习北师大版 统计 作业
一、选择题(本大题共12个小题,每小题5分,共60分)1.对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2<p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p3解析在简单随机抽样、系统抽样和分层抽样中,每个个体被抽中的概率均为n N,所以p1=p2=p3,故选D.答案D2.一支田径队共有运动员98人,其中女运动员42人,用分层抽样的方法抽取一个样本,每名运动员被抽到的概率都是27,则男运动员应抽取()A.12人B.14人C.16人D.18人解析设男运动员应抽取x人,则x98-42=27,解得x=16.答案C3.在抽查产品尺寸的过程中,将其尺寸分成若干组,[a,b]是其中的一组.已知该组的频率为m,该组上的频率分布直方图的高为h,则|a-b|等于()A.mhB.h mC.mh D.m+h解析在频率分布直方图中小长方形的高等于频率组距,所以h=m|a-b|,|a-b|=mh,故选C.答案C4.有20位同学,编号从1至20,现在从中抽取4人作问卷调查,用系统抽样方法确定所抽的编号为()A.2,6,10,14B.5,10,15,20C.2,4,6,8D.5.8,11,14解析由系统抽样的概念可知抽样间隔为:204=5,故选B.答案B5.观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重在[2 700, 3 000]内的频率为()A.0.001B.0.1C.0.2D.0.3解析新生婴儿体重在[2 700,3 000]内的频率为300×0.001=0.3,故选D.答案D6.已知七位评委为某民族舞蹈参赛演员评定分数的茎叶图如图,左边为十位数,右边为个位数,去掉一个最高分和一个最低分,所剩数据的平均数和方差分别为()A.84,4.84B.84,1.6C.85,1.6D.85,4解析去掉一个最高分93,去掉一个最低分79,还剩下5个数据:84,84,84,86,87,平均数为85,方差为1.6.故选C.答案C7.某产品的广告费用x与销售额y的统计数据如下表6万元时销售额为()A.63.6万元B.65.5万元C.67.7万元D.72.0万元解析由表可计算x-=4+2+3+54=72,y-=49+26+39+544=42,因为点(72,42)在回归直线y=bx+a上,且b为9.4,所以42=9.4×72+a,解得a=9.1,故回归方程为y=9.4x+9.1,令x=6得y=65.5.故选B.答案B8.某工厂生产A.B.C三种不同型号的产品,产品数量之比依次为x∶3∶5.现用分层抽样的方法抽出一个容量为n的样本,样本中A种型号产品有16件,C种型号产品有40件,则()A.x=2,n=24B.x=16,n=24C.x=2,n=80D.x=16,n=80解析由题意可知,xx+3+5×n=16①5x+3+5×n=40②由①②可解得x=2,n=80,故选C.答案C9.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是()A.y=1.23x+4B.y=1.23x+5C.y=1.23x+0.08D.y=0.08x+1.23解析样本点的中心为(x-,y-),即x-=4,y-=5,又b=1.23,所以a=y--bx-=5-1.23×4=0.08,回归方程为y=1.23x+0.08.故选C.答案C10.数据8,51,33,39,38,23,26,28,13,16,14的茎叶图是()解析由茎叶图的定义易知.选A.答案A11.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为()A.64B.54C.48D.27解析前两组中的频数为100×(0.05+0.11)=16.因为后五组频数和为62,所以前三组频数和为38.所以第三组频数为38-16=22.又最大频率为0.32,故第四组频数为0.32×100=32.所以a=22+32=54.故选B.答案B12.某研究小组在一项试验中获得一组数据,将其整理得到如图所示的散点图,下列函数中,最能近似刻画y与t之间关系的是()A.y=2tB.y=2t2C.y=t3D.y=log2t解析由散点图可知,点的分布近似于对数函数,故选D.答案D二、填空题(本大题共4个小题,每小题5分,共20分)13.一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.解析2148+36×48=14×48=12.答案1214.已知某商场新进3 000袋奶粉,为检查其三聚氰胺是否超标,现采用系统抽样的方法从中抽取200袋检查,若第一组抽出的号码是7,则第六十一组抽出的号码为________.解析 3 000÷200=15,所以第六十一组抽出的号码为7+60×15=907. 答案 90715.期末考试后,班长算出了全班50名同学的数学成绩的平均分为x -,方差为s 21.如果把x -当成一个同学的分数,与原来的50个分数一起,算出这51个分数的方差为s 22,那么s 21s 22=________.解析 平均数没变还是x -,s 21=150[(x 1-x -)2+(x 2-x -)2+…+(x 50-x -)2] s 22=151[(x 1-x -)2+(x 2-x -)2+…+(x 50-x -)2+(x 51-x -)2] =151[(x 1-x -)2+(x 2-x -)2+…+(x 50-x -)2] 所以s 21s 22=5150.答案 515016.调查某移动公司的三名推销员,其工作年限与年推销金额数据如表所示.由表中数据算出线性回归方程y =bx +a 中的b =726.若该公司第四名推销员的工作年限为6年,则估计他的年推销金额为________万元. 解析 x -=6,y -=3,代入y =bx +a 得a =1813, 所以y =726×6+1813=3(万元). 答案 3三、解答题(本大题共6个小题,共70分)17.(10分)假定某市第一中学有在编人员160人,其中行政人员16人,教师112人,后勤人员32人.学校为了了解机构改革意见,要从中抽取一个容量为20的样本,请你写出具体的抽样过程.解先采用分层抽样确定应抽取的人数,行政人员、教师、后勤人员的人数之比为16∶112∶32=1∶7∶2,所以行政人员应抽110×20=2(人),教师应抽710×20=14(人),后勤人员应抽210×20=4(人).所以分别抽取2,14,4人,然后在2人的抽取中用抽签法,14人的抽取中用系统抽样法,4人的抽取中用抽签法.18.(12分)某酒厂有甲、乙两条生产线生产同一种型号的白酒,产品在自动传输带上包装传送,每15分钟抽一瓶测定其质量是否合格,分别记录抽查的数据如下(单位:毫升):甲生产线:508,504,496,510,492,496乙生产线:515,520,480,485,497,503问:(1)这种抽样是何种抽样方法?(2)分别计算甲、乙两条生产线的平均值与方差,并说明哪条生产线的产品较稳定,解(1)是系统抽样.(2)x-甲=501,s2甲=45x-乙=500,s2乙≈211.3因为s2甲<s2乙,所以,甲生产线的产品稳定.19.(12分)某电视台为宣传本省,随机对本省内15~65岁的人群抽取了n人,回答问题“本省内著名旅游景点有哪些”统计结果如图表所示.(1)分别求出a ,b ,x ,y 的值;(2)从第2,3,4组回答正确的人中用分层抽样的方法抽取6人,求第2,3,4组每组各抽取多少人?解 (1)由频率表中第4组数据可知,第4组总人数为90.36=25,再结合频率分布直方图可知n =250.025×10=100, ∴a =100×0.01×10×0.5=5, b =100×0.03×10×0.9=27, x =1820=0.9,y =315=0.2.(2)第2,3,4组回答正确的共有54人,∴利用分层抽样在54人中抽取6人,每组分别抽取的人数为;第2组:1854×6=2(人),第3组:2754×6=3(人),第4组:954×6=1(人).20.(12分)在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率丹布直方图(如图所示),已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题: (1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数量最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率高?解(1)依题意知第三组的频率为42+3+4+6+4+1=1 5,又因为第三组的频数为12,∴本次活动的参评作品数为1215=60(件).(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×62+3+4+6+4+1=18(件).(3)第四组的获奖率是1018=59,第六组上交的作品数量为60×12+3+4+6+4+1=3(件),∴第六组的获奖率为23=69,显然第六组的获奖率高.21.(12分)甲、乙两位学生参加数学竞赛培训,现分别从他们的培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲:8281797895889384乙:9295807583809085(1)画出甲、乙两位学生成绩的茎叶图,并指出中位数;(2)现要从中选派一人参加数学竞赛,从平均状况和方差的角度考虑,你认为派哪位学生参加合适?请说明理由.解(1)茎叶图如图,甲的中位数是86,乙的中位数是84.(2)派甲,理由是:甲的平均数是85,乙的平均数是85,甲的方差是35.5,乙的方差是41,甲成绩更稳定.22.(12分)从某大学中随机选取7名女大学生,其身高x(单位:cm)和体重y(单位:kg)数据如下表:(1)求y (2)利用(1)中的回归方程,分析这7名女大学生的身高和体重的变化,并预报一名身高为172 cm 的女大学生的体重.解 (1)因为x -=163+164+165+166+167+168+1697=166,y -=52+52+53+55+54+56+567=54.设回归方程为y =bx +a ,代入公式,经计算得 b =6+4+1+0+0+4+6(9+4+1)×2=2114×2=34,a =y --bx -=54-34×166=-70.5.所以y 关于x 的回归方程为y =34x -70.5.(2)b =34=0.75>0,说明身高x 每增加一个单位时,体重y 就大约增加0.75个单位,这表明体重与身高具有正的线性相关关系.因此,对于身高172 cm 的女大学生,由回归方程可以预报其体重为y =34×172-70.5=58.5(kg).。
北师大版高一寒假作业5:统计
北师大版高一寒假作业5:统计【基础巩固】1.(2023·江西省·同步练习)下列方法获取的数据,是一手数据的是()A.普查方式B.试验方式C.上网D.通过抽样2.(2023·江西省·单元测试)在以下调査中,适合用全面调查的是()A.调查一个班级学生每周的体育锻炼时间B.调查一个地区结核病的发病率C.调查一批炮弹的杀伤半径D.调查一个水库所有鱼中草鱼所占的比例3.(2022·河北省邯郸市·期末考试)为了研究某种病毒与血型之间的关系,决定从被感染的人群中抽取样本进行调查,这些感染人群中型血、型血、型血、型血的人数比为:::,现用比例分配的分层随机抽样方法抽取一个样本量为的样本,已知样本中型血的人数比型血的人数多,则()A. B. C. D.4.(2023·福建省宁德市·期末考试)某学校高年级有名男生,名女生,现采用分层随机抽样的方法调查数学考试成绩,抽取一个容量为的样本,男生平均成绩为分,女生平均成绩为分,那么可以推测高一年级学生的数学平均成绩约为()A.分B.分C.分D.分5.(2023·江西省·同步练习)某市模考共有多名学生参加,教科室为了了解本校名考生的数学成绩,从中抽取名考生的数学成绩进行统计分析,在这个问题中有以下说法,其中正确的是()A.名考生是总体的一个样本B.名考生的数学成绩是总体C.样本容量是D.多名考生的数学成绩是总体6.(2022·重庆市·月考试卷)某工厂生产小、中、大三种型号的客车,产品数量之比为,为检验生产车辆是否合格,现打算抽取一个样本进行调查,若样本中的小型客车有辆,则下列说法正确的是()A.此样本量为B.此样本中,大型车辆比中型车辆多辆C.此样本中,大型车辆有辆D.应采用的抽样方法为分层随机抽样7.(2023·浙江省嘉兴市·期末考试)树德中学举行高中数学素养测试,对名考生的参赛成绩进行统计,得到如下图所示的频率分布直方图,则()A.成绩的极差一定大于,不超过B.成绩在的考生人数为人C.成绩的众数一定落在区间内D.成绩的中位数一定落在区间内8.(2023·江西省·单元测试)某高校调查了名学生每周的自习时间单位:小时,制成了如图所示的频率分布直方图,其中自习时间的范围是,样本数据分组为,,,,根据直方图,这名学生中每周的自习时间不少于小时的人数是.9.(2023·江西省·阶段测试)某校组织全体学生参加了主题为“创新实践、快乐成长”的科技知识竞赛,随机抽取了名学生进行成绩统计,发现抽取的学生的成绩都在分至分之间,进行适当分组后每组为左闭右开的区间,画出频率分布直方图如图所示:则的值为;用样本估计总体,则全校学生成绩的第百分位数为.10.(2023·浙江省宁波市·月考试卷)某校高一有两个实验班,某次数学考试成绩如下:一班人平均分分,方差为,二班人平均分分,方差为,求全体实验班学生的平均分和方差.【拓展提升】11.(2023·河北省石家庄市·期末考试)某地区为了解最近天该地区的空气质量,调查了该地区过去天的浓度单位:,数据依次为,,,,,,,,,,已知这组数据的极差为,则这组数据的第百分位数为()A.B.C.D.12.(2023·河南省·月考试卷)某校有高一学生名,其中男生数与女生数之比为,为了解学生的视力情况,现要求按分层随机抽样的方法抽取一个样本容量为的样本,若样本中男生比女生多人,则()A.B.C.D.13.(2023·湖北省襄阳市·月考试卷)为了落实习主席提出“绿水青山就是金山银山”的环境治理要求,某市政府积极鼓励居民节约用水.计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准吨,一位居民的月用水量不超过的部分按平价收费,超出的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年位居民每人的月均用水量单位:吨,将数据按照,,,分成组,制成了如图所示的频率分布直方图,其中.求直方图中,的值,并由频率分布直方图估计该市居民用水的平均数每组数据用该组区间中点值作为代表;设该市有万居民,估计全市居民中月均用水量不低于吨的人数,并说明理由;若该市政府希望使的居民每月的用水量不超过标准吨,估计的值,并说明理由.14.(2023·四川省成都市·联考题)某稻谷试验田试种了,两个品种的水稻各亩,并在稻谷成熟后统计了这亩地的稻谷产量如下表,记,两个品种各亩产量的平均数分别为和,方差分别为和.单位:单位:分别求这两个品种产量的极差和中位数求,,,依据以上计算结果进行分析,推广种植品种还是品种水稻更合适.15.(2023·江西省·联考题)高一年级有男生人,女生人,先把男生、女生进行分层,通过分层随机抽样的方法,得到男生、女生的平均身高分别为、,方差分别为、如果从男生、女生抽取的样本量分别为,,请合理估计高一年级全体学生的平均身高如果采用样本量比例分配的分层随机抽样,试由上面数据计算出总样本的方差,并据此对高一年级全体学生的身高方差做出估计.1.【答案】【解析】【分析】本题考查了获取数据的途径,属于基础题.逐项分析即可.【解答】解:由获取数据的过程可知选ABD.2.【答案】【解析】【分析】本题考查了普查与抽样调查,是基础题.根据普查和抽样调查的特点逐一判断即可.【解答】解:对于,调查一个班级学生每周的体育锻炼时间,应适用普查;对于,调查一个地区结核病的发病率,总体数量大,应适合抽样调查.对于,调查一批炮弹的杀伤半径,具有破坏性,应适合抽样调查;对于,调查水库所有鱼中草鱼的比例,总体数量大,应适合抽样调查.3.【答案】【解析】【分析】本题考查分层随机抽样,属于基础题.根据已知条件,结合分层抽样的定义即可求解.【解答】解:用比例分配的分层随机抽样方法抽取一个样本量为的样本,已知感染人群中型血、型血、型血、型血的人数比为:::,则样本中抽取型血、型血、型血、型血的人数比为:::,又因为样本总人数为,其中型血的人数比型血的人数多,则,解得.故答案为:.4.【答案】【解析】【分析】本题考查分层随机抽样的样本均值.求出应抽取男生和女生的人数,根据按比例分配分层抽样总样本平均数的公式计算即可.【解答】解:由题意,应抽取男生人,女生人,所以推测高一年级学生的数学平均成绩约为分.故选:.5.【答案】【解析】【分析】本题考查总体、个体、样本、样本容量,理解样本容量的意义是正确判断的关键.根据总体、个体、样本、样本容量的意义进行判断即可.【解答】解:总体是名考生的数学成绩,样本是抽取的名考生的数学成绩,样本容量是.故选BC.6.【答案】【解析】【分析】本题考查了分层随机抽样,是基础题.A.根据样本中的小型客车有辆求解判断;分别求得大型车辆和中型车辆判断;根据比例求解判断;根据车辆有明显的差异判断.【解答】解:设样本量为,由题意得:,解得,故A正确;B.由题意得:大型车辆为辆,中型车辆为辆,大型车辆比中型车辆少,故B错误;C.由题意得:大型车辆为辆,故C错误;D.因为车辆有明显的差异,所以应采用的抽样方法为分层随机抽样,故D正确.故选AD.7.【答案】【解析】【分析】本题考查了频率分布直方图,以及平均数、中位数、众数,属于基础题.利用频率分布直方图逐个分析各个选项即可.【解答】解:由频率分布直方图可知,成绩的极差一定大于,不超过,故A正确;成绩在的考生人数为人,故B正确;最高频率的区间中点值估计众数,但不能说众数一定落在区间内,故C错误;因为,,所以成绩的中位数一定落在区间内,故D正确.故选:8.【答案】【解析】【分析】本题考查频数的求法,考查频率分布直方图等基础知识,是基础题.根据直方图,先求出这名学生中每周的自习时间不少于小时的频率,由此能求出这名学生中每周的自习时间不少于小时的人数.【解答】解:根据直方图,得这名学生中每周的自习时间不少于小时的频率为.这名学生中每周的自习时间不少于小时的人数是人.故答案为:.9.【答案】【解析】【分析】本题考查频率分布直方图,百分位数,属于基础题.由频率之和为,即可求得;由百分位数的定义即可求得第百分位数.【解答】解:由,得;低于分的频率为,低于分的频率为,第百分位数在内,设为,则,解得,即第百分位数为.故答案为:,.10.【答案】解:全体实验班的平均分为,方差为.【解析】本题考查分层随机抽样的样本方差的计算问题,属于基础题.根据题意利用题干数据直接求解即可.11.【答案】【解析】【分析】本题考查了百分位数的计算,属于基础题.利用极差以及可判断为最大值,可求,再利用百分位数定义可解.【解答】解:数据依次为,,,,,,,,,,.而这组数据的极差为,数据中最小值为,故应为最大值,则,将数据从小到大排列:,,,,,,,,,,,故这组数据的第百分位数为,故选:.12.【答案】【解析】【分析】本题主要考查分层抽样等基础知识,考查运算求解能力,是基础题.设男生数为,女生数为,利用分层抽样列出方程组,由此能求出结果.【解答】解:某校有高一学生名,其中男生数与女生数之比为:,按分层抽样的方法抽取一个样本容量为的样本,样本中男生比女生多人,设男生数为,女生数为,则解得,..故选D.13.【答案】解:由频率分布直方图可得,又,则,,该市居民用水的平均数估计为:;全市居民中月均用水量不低于吨的频率,故万;由频率分布直方图知月均用水量不超过吨的频率为:,月均用水量不超过吨的频率为,则的居民每月的用水量不超过的标准吨,,,解得吨,即标准为吨.【解析】本题考查频率分布直方图的应用,求平均数,计算频率,总体百分位数的估计,考查了数据处理能力和运算能力,属于中档题.由频率之和为以及列方程组求得的值,并由频率分布直方图中间值作为代表,计算出平均数;全市居民中月均用水量不低于吨的频率,再进行计算;由频率分布直方图计算频率,可判断,再根据频率列出方程,求出的值.14.【答案】解:由题目中表格给出的数值,极差:产品为,产品为,中位数:产品为,产品为由题意:,,,结合第问可知,两个品种水稻的产量平均数一样,但是的方差较小,较稳定,所以推广品种水稻更合适.【解析】本题考查平均数、中位数、众数,方差、标准差,属于中档题.利用极差和中位数定义即可求得这两个品种产量的极差和中位数;利用平均数和方差定义即可求得,,,;从平均产量和产量的稳定程度综合考虑即可.15.【答案】解:设男生样本平均数记为,方差记为,女生样本平均数记为,方差记为,总样本数据的平均数记为,方差记为,高一年级男生人,女生人,则,,,,由,,根据按比例分配分层随机抽样总体平均数与各层样本平均数的关系,可得总样本平均数为由已知的男生、女生样本平均数和方差的取值,可得第11页,共11页所以总样本的方差为,并据此估计高一年级全体学生的身高方差为.【解析】本题考查了分层随机抽样,考查了样本估计总体的均值和方差,属于中档题.根据按比例分配分层随机抽样总体平均数与各层样本平均数的关系,可得总样本平均数;根据分层抽样的方差公式可得答案.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《概率统计》作业
本课程作业由二部分组成:第一部分为“客观题部分”,由15个选择题组成,每题1分,共15分; 第二部分为“主观题部分”,由4个解答题组成,第1、2题每题2.5分,第3、4题每题5分,共15分。
作业总分30分,将作为平时成绩记入课程总成绩。
客观题部分
一、选择题(每题1分,共15分)
1. A , B , C 三个事件中至少有两个事件,可表示为( C )
A 、 ABC
B 、AB
C ABC ABC ++
C 、 _______
ABC D 、ABC BC A C B A C AB +++
2.设A , B , C 为任意三个事件,则_____________
A B C ++=( B )
A 、ABC
B 、ABC
C 、ABC ABC ABC ++
D 、A B C ++
3.设A,B为任意两个事件,则( A )
A、()()()()P A B P A P B P AB +=+-
B、()()()()P A B P A P B P AB -=--
C、()()()()P A B P A P B P AB +=++
D、()()()()P A B P A P B P AB -=-+
4.设随机变量ξ服从参数为5的指数分布,则它的数学期望值为( B ) A5 B、1
5 C、25 D、1
25
5.设,[0,1],
()0,
[0,1].cx x p x x ∈⎧=⎨∉⎩若p(x)是一随机变量的概率密度函数,则c = ( C )
A 、0
B 、1
C 、 2
D 、3
6.设随机变量ξ服从参数为5的指数分布,则它的方差为( A ) A、125
B、25 C、15 D、5 7.设A, B 为任意两个事件,则________
A B +=( B )
A 、A
B B 、AB
C 、A B
D 、A B +
8.设a <b , 则1,()b-a 0,a x b p x ⎧≤≤⎪=⎨⎪⎩其它
是( C )分布的密度函数。
A 、指数
B 、二项
C 、均匀
D 、泊松
9.设总体X的均值μ与方差2
σ都存在但均为未知参数,12,,,n X X X 为来自总体X的简单随机样本,记1
1n
i i X X n ==∑,则μ的矩估计为( A ) A 、X B 、1max{}i i n X ≤≤ C 、1min{}i i n X ≤≤ D 、2n 1
1(X )n i i X n =-∑ 10.已知事件A 与B 相互独立,且()P A B a ⋃=(a <1),P (A )=b , 则P (B ) = ( C )
A 、a-b
B 、1-a
C 、b
b a --1 D 、1-b 11.当ξ服从( B )分布时,必有E D ξξ=
A、指数 B、泊松 C、正态 D、均匀
12.设123,,X X X 为来自正态总体(,1)N μ的容量为3的简单随机样本,则( B )是关 于μ得最有效的无偏估计量。
A 、123111X X X 236++
B 、123111X X X 333
++ C 、1230.1X 0.2X 0.7X ++ D 、1230.3X 0.3X 0.4X ++
13.设(,ξη)是二维离散型随机向量,则ξ与η独立的充要条件是( D ) A、()()()E E E ξηξη⋅=⋅ B、()()()D D D ξηξη+=+ C、ξ与η不相关 D、对(,ξη)的任何可能的取值(,i j x y ),都有
}{}{},{j i j i y P x P y x P =⨯====ηξηξ
14.设12,,,n X X X 为来自总体2(,)N μσ的简单随机样本,2σ未知,则μ的置 信区间是( B )
A
、/2/2(X Z X Z αα-+
B
、/2/2(X Z X Z αα-+ C 、()()
⎪⎪⎭
⎫ ⎝⎛-+----n S n t X n S n t X 1,12121αα D
、/2/2(((X t n X t n αα--+- 15.若12,,,n X X X 为来自总体2(,)N μσ的简单随机样本,则统计量
2211
()n i i X μσ=-∑服从自由度为( B )的2χ-分布。
A、n B、n-1 C、n-2 D、n-3
主观题部分
二、解答题(第1、2题每题2.5分,第3、4题每题5分,共15分)
1. 简述事件独立与互斥之间的关系。
一般来讲两者之间没有什么必然联系。
两个事件A,B 互斥指的是A B φ⋂=,此时必然有P(A+B)=P(A)+P(B)。
而相互独立指的是P(AB)=P(A)P(B). 由加法公式P(A+B)=P(A)+P(B)-P(AB),可知除非A ,B 中有一个的概率为零,否则互斥不会独立,独立不会互斥。
2. 简述连续型随机变量的分布密度和分布函数之间的关系。
分布函数是对所有随机变量取值的概率的讨论,包括连续性和离散型,已知连续型随机变量的密度函数,可以通过讨论及定积分的计算求出其分布函数;当已知连续型随机变量的分布函数时,对其求导就可得到密度函数。
对离散型随机变量而言,如果知道其概率分布,也可求出其分布函数;当知道其分布函数时也可求出概率分布,分布密度刻画了随机变量在单位长度内的大小,分布函数则是小于某点的整个事件的概率,分布密度由分布函数求导而得。
3. 两台机床加工同样的零件,第一台出现废品的概率为0.04,第二台出现废品的概率为0.03,加工出来的零件放在一起。
并且已知第一台加工的零件比第二台加工的零件多两倍,求任意取出的一个零件是合格品的概率。
设第二台加工的零件为x个,因第一台加工的比第二台的多两倍,则第一台加工的零件为3x个
混合起来的废品数:0.04*3x+0.03*x=0.15x 所以,抽出废品的概率为0.15x/4x=3/80
因抽出的合格品与废品两个事件为互斥事件,所以抽出的为合格品的概率:1-3/80=77/80=0.9625
4.某仪器有3个独立工作的元件,它们损坏的概率均为0.1。
当一个元件损坏时仪器发生故障的概率为0.25;当两个元件损坏时仪器发生故障的概率为0.6;当三个元件损坏时仪器发生故障的概率为0.95,求仪器发生故障的概率。
P1:3*0.1*0.9*0.9*0.25= 0.06075
P2:3*0.1*0.1*0.6*0.9= 0.0162
P3:0.1*0.1*0.1*0.95=0.00095
所以,P=P1+P2+P3=0.06075+0.0162+0.00095=0.0779。