学习探究诊断必修三单元测试三 统计

合集下载

(常考题)北师大版高中数学必修三第一章《统计》检测题(含答案解析)(3)

(常考题)北师大版高中数学必修三第一章《统计》检测题(含答案解析)(3)

一、选择题1.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+2.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示: 价格99.510.5 11销售量 1186 5由散点图可知,销售量与价格之间有较强的线性相关关系,其线性回归方程是,且,则其中的( ) A .10B .11C .12D .10.53.将某选手的7个得分去掉1个最高分,去掉1个最低分,5个剩余分数的平均分为21,现场作的7个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则5个剩余分数的方差为( )A .1167B .365C .36D 674.通过实验,得到一组数据如下:2,5,8,9,x ,已知这组数据的平均数为6,则这组数据的方差为( )A.3.2 B.4 C.6 D.6.55.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为()A.0795 B.0780 C.0810 D.08156.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x (万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程ˆˆˆy bx a=+,其中ˆˆˆ0.76,b a y bx==-,据此估计,该社区一户收入为15万元家庭年支出为()A.11.4万元B.11.8万元C.12.0万元D.12.2万元7.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x为()A.64 B.96 C.144 D.1608.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是()A.90.5 B.91.5 C.90 D.919.已知x,y的取值如表:x2678y若x,y之间是线性相关,且线性回归直线方程为,则实数a的值是A.B.C.D.10.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位11.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据:11(,)x y ,22(,)x y ,33(,)x y ,44(,)x y ,55(,)x y .根据收集到的数据可知12345150x x x x x ++++=,由最小二乘法求得回归直线方程为0.6754.9y x =+,则12345y y y y y ++++的值为( )A .75B .155.4C .375D .466.212.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是( )A .4B .5C .6D .7二、填空题13.如图是某地区2018年12个月的空气质量指数以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述正确的是______.①2月相比去年同期变化幅度最小,3月的空气质量指数最高;②第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小; ③第三季度空气质量指数相比去年同期变化幅度的方差最小; ④空气质量指数涨幅从高到低居于前三位的月份为6、8、4月.14.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高[)120130,,[)130140,,[]140,150三组内的学生中,用分层抽样的方法抽取18人参加一项活动,则从身高在[]140,150内的学生中抽取的人数应为________.15.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.16.《数术记遗》相传是汉末徐岳(约公元2世纪)所著.该书主要记述了:积算(即筹算)、太乙算、两仪算、三才算、五行算、八卦算、九宫算、运筹算、了知算、成数算、把头算、龟算、珠算、计数共14种计算方法.某研究学习小组共6人,他们搜集整理该14种算法的相关资料所花费的时间(单位:min )分别为:93,93,88,81,94,91则这组时间数据的标准差为___________.17.下图是华师一附中数学讲故事大赛7位评委给某位学生的表演打出的分数的茎叶图.记分员在去掉一个最高分和一个最低分后,算得平均分为91分,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若记分员计算无误,则数字x 应该是____________.18.某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~1000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为_________19.为了了解2100名学生早晨到校时间,计划采用系统抽样的方法从全体学生中抽取容量为100栋样本,则分段间隔为__________.20.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组没有疗效的有6人,则第三组中有疗效的人数为__________.三、解答题21.据了解,温带大陆性气候,干燥,日照时间长,昼夜温差大,有利于植物糖分积累.某课题研究组欲研究昼夜温差大小()/x ℃与某植物糖积累指数()/y GI 之间的关系,得到如下数据:组数 第一组 第二组第三组第四组第五组第六组昼夜温差/℃x1011 13 12 8 6某植物糖积累指数/y GI20 24 30 28 18 15下的2组数据进行检验,假设这剩下的2组数据恰好是第一组与第六组数据.(1)求y 关于x 的线性回归方程ˆˆˆybx a =+ (2)若由线性回归方程得到的估计数据与所选出的检验数据的差的绝对值均不超过2.58,则认为得到的线性回归方程是理想的,试问(1)中所得线性回归方程是否理想?(参考公式:回归直线方程ˆˆˆybx a =+的斜率和截距的最小二乘估计()()()211ˆˆˆ,iii ni ni x x y y bay bx x x ==--==--∑∑ 22.某北方村庄4个草莓基地,采用水培阳光栽培方式种植的草莓个大味美,一上市便成为消费者争相购买的对象.光照是影响草莓生长的关键因素,过去50年的资料显示,该村庄一年当中12个月份的月光照量X (小时)的频率分布直方图如下图所示(注:月光照量指的是当月阳光照射总时长).(1)求月光照量X (小时)的平均数和中位数;(2)现准备按照月光照量来分层抽样,抽取一年中的4个月份来比较草莓的生长状况,问:应在月光照量[160,240)X ∈,[240,320)X ∈,[320,400]X ∈的区间内各抽取多少个月份?(3)假设每年中最热的5,6,7,8,9,10月的月光照量X 是大于等于240小时,且6,7,8月的月光照量X 是大于等于320小时,那么,从该村庄2018年的5,6,7,8,9,10这6个月份之中随机抽取2个月份的月光照量进行调查,求抽取到的2个月份的月光照量X (小时)都不低于320的概率.23.假设关于某设备的使用年限x (年)和所支出的维修费用y (万元),有如下的统计资料:x (年)1 2 3 4 5y (万元) 5 6 7 8 10由资料可知y 对x 呈线性相关关系. (1)求y 关于x 的线性回归方程;(2)请估计该设备使用年限为15年时的维修费用.参考公式:线性回归方程y bx a =+的最小二乘法计算公式:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-,参考数据:5115263748510120i ii x y==⨯+⨯+⨯+⨯+⨯=∑24.某市为了解疫情过后制造业企业的复工复产情况,随机调查了100家企业,得到这些企业4月份较3月份产值增长率x 的频率分布表如下: x 的分组 [0.20,0)-[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数13403584(1)估计制造业企业中产值增长率不低于60%的企业比例及产值负增长的企业比例; (2)求制造业企业产值增长率的平均数与方差的估计值(同一组中的数据用该组区间的中点值为代表).25.某校为了了解甲、乙两班的数学学习情况,从两班各抽出10名学生进行数学水平测试,成绩如下(单位:分):甲班:82 84 85 89 79 80 91 89 79 74 乙班:90 76 86 81 84 87 86 82 85 83 (1)求两个样本的平均数; (2)求两个样本的方差和标准差; (3)试分析比较两个班的学习情况.26.某市举办了一次“诗词大赛”,分预赛和复赛两个环节,已知共有20000名学生参加了预赛,现从参加预赛的全体学生中随机地抽取100人的预赛成绩作为样本,得到如下的统计数据.地抽取2人,求恰有1人预赛成绩优良的概率;(2)由样本数据分析可知,该市全体参加预赛学生的预赛成绩Z 服从正态分布()2,N μσ,其中μ可近似为样本中的100名学生预赛成绩的平均值(同一组数据用该组数据的中间值代替),且2361σ=.利用该正态分布,估计全市参加预赛的全体学生中预赛成绩不低于72分的人数;(3)预赛成绩不低于91分的学生将参加复赛,复赛规则如下: ①参加复赛的学生的初始分都设置为100分;②参加复赛的学生可在答题前自己决定答题数量n ,每一题都需要“花”掉一定分数来获取答题资格(即用分数来买答题资格),规定答第k 题时“花”掉的分数为()0.21,2,k k n =; ③每答对一题得2分,答错得0分;④答完n 题后参加复赛学生的最终分数即为复赛成绩.已知学生甲答对每道题的概率均为0.75,且每题答对与否都相互独立,则当他的答题数量n 为多少时,他的复赛成绩的期望值最大?参考数据:若()2~,Z Nμσ,则() 6.827P Z μσμσ-<<+≈,()220.9545P Z μσμσ-<<+≈,()330.9973P Z μσμσ-<<+≈【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】根据散点图的分布可选择合适的函数模型. 【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+. 故选:D. 【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.2.A解析:A 【解析】 【分析】由表求得,,代入回归直线方程,联立方程组,即可求解,得到答案.【详解】由题意,5家商场的售价元和销售量件之间的一组数据, 可得,,又由回归直线的方程,则,即,又因为,解得,故选A. 【点睛】本题主要考查了回归直线方程的特征及其应用,其中解答中熟记回归直线方程的特征,准确计算是解答的关键,着重考查了推理与运算能力,属于基础题.3.B解析:B 【分析】由剩余5个分数的平均数为21,据茎叶图列方程求出x =4,由此能求出5个剩余分数的方差. 【详解】∵将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为21, ∴由茎叶图得:1724202020215x+++++=得x =4,∴5个分数的方差为:S 2=()()()()()222221361721242120212021242155⎡⎤-+-+-+-+-=⎣⎦ 故选B 【点睛】本题考查方差的求法,考查平均数、方差、茎叶图基础知识,考查运算求解能力,考查数形结合思想,是基础题.4.C解析:C 【解析】分析:利用平均数的公式,求得6x =,得到数据2,5,8,9,6,再利用方差的计算公式,即求解数据的方差.详解:由题意,一组数据2,5,8,9,x 的平均数为6,即258924655x xx +++++===,解得6x =,所以数据2,5,8,9,6的方差为2222221[(26)(56)(86)(96)(66)]65s =-+-+-+-+-=,故选C.点睛:本题主要考查了数据的数字特的计算,其中熟记数据的平均数的公式和数据的方差的计算公式是解答的关键,着重考查了推理与运算能力,属于基础题.5.A解析:A 【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为10002050= 所以抽取的第40个数为1520(401)795+⨯-=选A.点睛:本题考查系统抽样概念,考查基本求解能力.6.B解析:B 【解析】 试题分析:由题,,所以.试题 由已知,又因为ˆˆˆybx a =+,ˆˆˆ0.76,b a y bx ==- 所以,即该家庭支出为万元.考点:线性回归与变量间的关系.7.D解析:D 【解析】 【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数. 【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816, 因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D. 【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题8.A解析:A 【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可. 【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95, 所以中位数为90+91=90.52,故选A. 【点睛】本题主要考查了中位数,茎叶图,属于中档题.9.B解析:B 【解析】 【分析】根据所给的两组数据,做出横标和纵标的平均数,写出这组数据的样本中心点,根据线性回归方程一定过样本中心点,得到线性回归直线一定过的点的坐标. 【详解】根据题意可得,,由线性回归方程一定过样本中心点,.故选:B . 【点睛】本题考查线性回归方程的意义,线性回归方程一定过样本中心点,本题解题的关键是正确求出样本中心点,题目的运算量比较小,是一个基础题.10.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.11.C解析:C 【分析】首先求得x 的值,然后利用线性回归方程过样本中心点的性质求解12345y y y y y ++++的值即可. 【详解】由题意可得:12345305x x x x x x ++++==,线性回归方程过样本中心点,则:0.6754.975y x =⨯+=,据此可知:12345y y y y y ++++5375y ==. 本题选择C 选项. 【点睛】本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.12.B解析:B【解析】分析:首先写出所有学生的乘积,然后结合系统抽样的方法整理计算即可求得最终结果.详解:由题意可知,学生的成绩如下:111,111,112,113,113;116,117,117,118,118;120,120,121,122,122;123,124,124,126127;128,128,129,129,129;131,131,131,132,132;132,133,134,134,135;137,138,138,138,139;140,142,142,143,144.用系统抽样方法从中抽取9人,则每5人中抽取一人,即上述分组中每组抽取一人,120,135上的学生人数为5.则所抽取的学生的成绩在区间[]本题选择B选项.点睛:本题主要考查系统抽样的概念及其应用,茎叶图的识别等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.①②③【分析】根据折线的变化率得到相比去年同期变化幅度、升降趋势逐一验证即可【详解】根据折现统计图可得2月相比去年同期变化幅度最小3月的空气质量指数最高故①正确;第一季度的空气质量指数的平均值最大第解析:①②③【分析】根据折线的变化率,得到相比去年同期变化幅度、升降趋势,逐一验证即可.【详解】根据折现统计图可得,2月相比去年同期变化幅度最小,3月的空气质量指数最高,故①正确;第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小,故②正确;第三季度空气质量指数相比去年同期变化幅度的方差最小,故③正确;空气质量指数涨幅从高到低居于前三位的月份为6、8、9月,故④错误,故答案为:①②③.【点睛】本题考查条形统计图和折线图的应用,重点考查数据分析,从表中准确获取信息是关键,属于中档题型.14.3【分析】先由频率之和等于1得出的值计算身高在的频率之比根据比例得出身高在内的学生中抽取的人数【详解】身高在的频率之比为所以从身高在内的学生中抽取的人数应为故答案为:【点睛】本题主要考查了根据频率分解析:3【分析】先由频率之和等于1得出a 的值,计算身高在[)120,130,[)130,140,[]140,150的频率之比,根据比例得出身高在[]140,150内的学生中抽取的人数. 【详解】(0.0050.010.020.035)101a ++++⨯=0.03a ∴=身高在[)120,130,[)130,140,[]140,150的频率之比为0.03:0.02:0.013:2:1= 所以从身高在[]140,150内的学生中抽取的人数应为11836⨯= 故答案为:3 【点睛】本题主要考查了根据频率分布直方图求参数的值以及分层抽样计算各层总数,属于中档题.15.【分析】先根据平均数计算出的值再根据方差的计算公式计算出这组数的方差【详解】依题意所以方差为故答案为【点睛】本小题主要考查平均数和方差的有关计算考查运算求解能力属于基础题 解析:265【分析】先根据平均数计算出m 的值,再根据方差的计算公式计算出这组数的方差. 【详解】 依题意12674,45m m ++++==.所以方差为()()()()()22222114244464745⎡⎤-+-+-+-+-⎣⎦[]126944955=+++=. 故答案为265. 【点睛】本小题主要考查平均数和方差的有关计算,考查运算求解能力,属于基础题.16.【分析】由搜集算法所费的时间的数据求得数据的平均数再结合方差的计算公式即可求解【详解】由题意搜集算法所费的时间的数据可得数据的平均数为所以方差为所以标准差故答案为:【点睛】本题主要考查了数据的平均数解析:【分析】由搜集算法所费的时间的数据,求得数据的平均数,再结合方差的计算公式,即可求解. 【详解】由题意,搜集算法所费的时间的数据, 可得数据的平均数为939388819491906x +++++==,所以方差为2222222(9390)(9390)(8890)(8190)(9490)(9190)206s -+-+-+-+-+-==,所以标准差s ==故答案为: 【点睛】本题主要考查了数据的平均数和方差的计算,其中解答中熟记数据的平均数和方差的计算公式,准确计算是解答的关键,着重考查运算与求解能力.17.1【分析】因为题目中要去掉一个最高分所以对进行分类讨论然后结合平均数的计算公式求出结果【详解】若去掉一个最高分和一个最低分86分后平均分为不符合题意故最高分为94分去掉一个最高分94分去掉一个最低分解析:1 【分析】因为题目中要去掉一个最高分,所以对x 进行分类讨论,然后结合平均数的计算公式求出结果 【详解】若4x >,去掉一个最高分()90x +和一个最低分86分后,平均分为()1899291949291.65++++=,不符合题意,故4x ≤,最高分为94分,去掉一个最高分94分,去掉一个最低分86分后,平均分()18992909192915x +++++=,解得1x =,故数字x 为1 【点睛】本题考查了由茎叶图求平均值,理解题目意思运用平均数计算公式即可求出结果,注意分类讨论18.18【解析】【分析】由题意知抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为即可解得【详解】因为抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为解得【点睛】本题主要考解析:18 【解析】 【分析】由题意知,抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,即可解得. 【详解】因为抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,解得18x =. 【点睛】本题主要考查了系统抽样,属于中档题.19.【解析】【分析】根据系统抽样的特征求出分段间隔即可【详解】根据系统抽样的特征得:从2100名学生中抽取100个学生分段间隔为故答案是21【点睛】该题所考查的是有关系统抽样的组距问题应用总体除以样本容解析:21【解析】【分析】根据系统抽样的特征,求出分段间隔即可.【详解】根据系统抽样的特征,得:从2100名学生中抽取100个学生,分段间隔为210021 100=,故答案是21.【点睛】该题所考查的是有关系统抽样的组距问题,应用总体除以样本容量等于组距,得到结果,属于简单题目.20.12【解析】分析:由频率=以及直方图可得分布在区间第一组与第二组共有20人的频率即可求出第三组中有疗效的人数得到答案详解:由直方图可得分布在区间第一组和第二组共有20人分布唉区间第一组与第二组的频率解析:12【解析】分析:由频率=频数样本容量,以及直方图可得分布在区间第一组与第二组共有20人的频率,即可求出第三组中有疗效的人数得到答案.详解:由直方图可得分布在区间第一组和第二组共有20人,分布唉区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人第三组的频率为0.36,所以第三组的人数为18人,第三组中没有疗效的有6人,第三组由疗效的有12人.点睛:1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法,分布表在数量表示上比较准确,直方图比较直观.2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.三、解答题21.(1)171277y=⨯;(2)该小组所得线性回归方程是理想的.【分析】(1)根据数据求出ˆb与ˆa 的值,即可求出y 关于x 的线性回归方程; (2)分别计算出1月份和6月份对应的预测值,与检验数据作差取绝对值,再与2.58进行比较即可得到结论. 【详解】(1)由表中2月至5月份的数据, 得11(1113128)11,(24302818)2544x y =+++==+++=,故有()()520(1)2513(3)(7)34iii x x y y =--=⨯-+⨯+⨯+-⨯-=∑,()5222222021(3)14ii x x =-=+++-=∑,34171712,251114777b a y bx ∴===-=-⨯=-, 即y 关于x 的线性回归方程为171277y =⨯; (2)由171277y =⨯,当10x =时,171215810777y =⨯-=, 1581820 2.5877-=<, 当6x =时,1712906777y =⨯=, 901515 2.5877-=<, 则该小组所得线性回归方程是理想的. 【点睛】方法点睛:该题考查的是有关回归分析的问题,解题方法如下:(1)结合题中所给的数据,根据最小二乘法系数公式起的ˆb与ˆa 的值,得到回归直线方程;(2)将相应的变量代入,得到的值域题中条件比较,得到结论.22.(1)平均数为260(小时);中位数为240(小时)(2)2,1,1(3)15【分析】(1)利用各频率之和为1,计算出a ,然后根据频率分布直方图以及平均数,中位数的求法,可得结果.(2)根据月光照量[160,240)X ∈、[240,320)X ∈、[320,400]X ∈的频率之比为111::244,结合分层抽样的方法,可得结果. (3)采用列举法,将“6个月份之中随机抽取2个月份”所有情况列举出来,并计算“抽取到的2个月份的月光照量X (小时)都不低于320”的个数,结合古典概型可得结果. 【详解】(1)根据各频率之和为1, 则0.062580()801a a ⨯++⨯=, 解得0.003125a =.月光照量X (小时)的平均数为()802000.00625+2800.0031253600.003125X =⨯⨯+⨯所以260X =(小时)设月光照量X (小时)的中位数为0X , 则0[240,320]X ∈.根据中位数的定义, 其左右两边的频率相等,都为0.5,可得()00.00625802400.0031250.5X ⨯+-⨯=,解得0240X =.所以月光照量X (小时)的中位数为240(小时). (2)因为月光照量[160,240)X ∈、[240,320)X ∈、[320,400]X ∈的频率之比为111::244,所以若准备按照月光照量来分层抽样,抽取一年中的4个月份来比较草莓的生长状况,那么,抽取的月光照量[160,240)X ∈,[240,320)X ∈,[320,400]X ∈的月份数分别为11142,41,41244⨯=⨯=⨯=. (3)由题意,月光照量[240,320)X ∈的有5,9,10月, 月光照量[320,400]X ∈的有6,7,8月, 故从该村庄2018年的5,6,7,8,9,10月份 之中随机抽取2个月份的月光照量X (小时) 进行调查,所有的情况有:(5,9),(5,10),(5,6),(5,7),(5,8); (9,10),(9,6),(9,7),(9,8); (10,6),(10,7),(10,8); (6,7),(6,8);(7,8)共15种;其中,抽取到的2个月份的月光照量X (小时)都不低于320的情况有:(6,7),(6,8),(7,8)共3种;故所抽取到的2个月份的月光照量X (小时)都不低于320的概率31155P ==. 【点睛】本题考查频率分布直方图中平均数,中位数的计算,以及古典概型的应用,分清题意,熟悉公式,耐心计算,属中档题.23.(1) 1.2 3.6y x =+;(2)21.6万元. 【分析】(1)先求出年限x 和维修费用y 的平均值,即得到样本中心点,利用最小二乘法得到线性回归方程的系数,根据样本中心点在线性回归直线上,得到a 值,即得线性回归方程; (2)将15x =代入回归直线方程即可求得结果. 【详解】 (1)1234535x ++++==,5678107.25++++==y51120i ii x y==∑,522222211234555i i x ==++++=∑25945nx =⨯=,537.2108nx y =⨯⨯=∴1201081.25545b -==-,7.2 1.23 3.6a =-⨯=∴y 关于x 的线性回归方程为 1.2 3.6y x =+(2)在上述回归方程中,当15x =时得21.6y = ∴该设备使用年限为15年时的维修费用大约为21.6万元. 【点睛】本题考查回归直线方程的求解及其应用,其中认真审题,准确合理的运算是解决此类问题的关键,考查运算能力,属于基础题.24.(1)4%,13%.;(2)平均数为0.20,方差的估计值为0.0364. 【分析】(1)直接根据频率分布表即可得到答案.(2)首先根据频率分布表估计企业产值增长率的平均数,然后再求方差即可. 【详解】(1)制造业企业中产值增长率不低于60%的企业比例为4100%4%100⨯=, 产值负增长的企业比例13100%13%100⨯=, 所以制造业企业中产值增长率不低于60%的企业比例4%,产值负增长的企业比例13%. (2)100家制造业企业产值增长率的平均数为()1130.10400.10350.3080.5040.700.20100⎡⎤⨯-+⨯+⨯+⨯+⨯=⎣⎦, 方差为()222221130.100.2040(0.100.20)35(0.300.20)8(0.500.20)4(0.700.20)100⎡⎤⨯--+⨯-+⨯-+⨯-+⨯-⎣⎦0.0364=所以制造业企业产值增长率的平均数为0.20,方差的估计值为0.0364. 【点睛】本题第一问考查频率分布表,第二问考查根据频率分布表估计平均值和方差,同时考查学生的计算能力,属于中档题.25.(1)=83.2x 甲,=84x 乙;(2)22=26.36=13.2S S 甲乙,,=5.13S 甲,=3.63S 乙;(3)乙班的总体学习情况比甲班好 【解析】试题分析:每组样本数据有10个,求样本的平均数利用平均数公式,10个数的平均数等于这10个数的和除以10;比较平均分的大小可以看出两个班学生平均水平的高低,求样本的方差只需使用方差公式,求这10个数与平均数的差的平方方和再除以10;比较两组数据方差的大小就可得出两组数据的标准差的大小,标准差较小者成绩较稳定 . 试题 (1)x 甲=110×(82+84+85+89+79+80+91+89+79+74)=83. 2, x 乙=110×(90+76+86+81+84+87+86+82+85+83)=84. (2)2S 甲=110×[(82-83. 2)2+(84-83. 2)2+(85-83. 2)2+(89-83. 2)2+(79-83. 2)2+(80-83. 2)2+(91-83. 2)2+(89-83. 2)2+(79-83. 2)2+(74-83. 2)2]=26. 36,2S 甲=110[(90-84)2+(76-84)2+(86-84)2+(81-84)2+(84-84)2+(87-84)2+(86-84)2+(82-84)2+(85-84)2+(83-84)2]=13. 2,则s 甲,s 乙≈3. 63.(3)由于x x <甲乙,则甲班比乙班平均水平低.由于S S >甲乙,则甲班没有乙班稳定. 所以乙班的总体学习情况比甲班好【点睛】怎样求样本的平均数,n 个数的平均数等于这n 个数的和除以n ;比较平均数的大小可以看出两个样本平均水平的高低,怎样求样本的方差,就是求这n 个数与平均数的差的平方方和再除以n ;比较两组数据方差的大小就可得出两组数据的标准差的大小,标准差较小者成绩较稳定 . 26.(1)2552;(2)3173;(3)当他的答题数量7n =时,他的复赛成绩的期望值最大. 【分析】(1)由表可知,样本中成绩不低于60分的学生共有40人,其中成绩优良的人数为15。

(好题)高中数学必修三第一章《统计》检测(含答案解析)(1)

(好题)高中数学必修三第一章《统计》检测(含答案解析)(1)

一、选择题1.某教研机构随机抽取某校20个班级,调查各班关注汉字听写大赛的学生人数,根据所得数据的茎叶图,以组距为5将数据分组成[)[)[)[)[)[)[)[]0,5,5,10,10,15,15,20,20,25,25,30,30,35,35,40时,所作的频率分布直方图如图所示,则原始茎叶图可能是( )A .B .C .D .2.为了解一片经济树林的生长情况,随机测量了其中100株树木的底部周长(单位:cm ),根据所得数据画出样本的频率分布直方图如图所示.那么在这100株树木中,底部周长小于110cm 的株数n 是 ( )A .30B .60C .70D .803.已知变量x ,y 的关系可以用模型kx y ce =拟合,设ln z y =,其变换后得到一组数据下:x 16 17 18 19 z50344131由上表可得线性回归方程4z x a =-+,则c =( ) A .4-B .4e -C .109D .109e4.一组数据的平均数为m ,方差为n ,将这组数据的每个数都加上(0)a a >得到一组新数据,则下列说法正确的是( ) A .这组新数据的平均不变 B .这组新数据的平均数为am C .这组新数据的方差为2a nD .这组新数据的方差不变5.图1是某学习小组学生数学考试成绩的茎叶图,1号到16号的同学的成绩依次为1A ,216,,A A ⋯,图2是统计茎叶图中成绩在一定范围内的学生情况的程序框图,那么该程序框图输出的结果是( )A .10B .6C .7D .166.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9C .y =1.9x +1.04D .y =1.05x -0.97.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是 A .甲地:总体均值为3,中位数为4 B .乙地:总体均值为1,总体方差大于0 C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为38.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 父亲身高x (cm )174176176176178儿子身高y (cm )175175176177177则y 对x 的线性回归方程为A .y = x-1B .y = x+1C .y =88+12x D .y = 1769.某校高一年级有学生1800人,高二年级有学生1500人,高三年级有1200人,为了调查学生的视力状况,采用分层抽样的方法抽取学生,若在抽取的样本中,高一年级的学生有60人,则该样本中高三年级的学生人数为( ) A .60B .50C .40D .3010.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位11.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经统计,得到一个卖出的热饮杯数与当天气温的对比表: 温度℃ -5 0 4 7 12 15 19 23 27 31 36 热饮杯数15615013212813011610489937654根据上表数据确定的线性回归方程应该是( )A .ˆ 2.352147.767yx =-+ B .ˆ 2.352127.765yx =-+ C .ˆ 2.35275.501yx =+D .ˆ 2.35263.674yx =+ 12.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响.对近8年的年宣传费i x 和年销售量()1,2,...8i y i =数据作了初步处理,得到下面的散点图及一些统计量的值.有下列5个曲线类型:①ˆˆy bxa =+;②y x d =+;③ln y p q x =+;④21k xy k e =+;⑤212y c x c =+,则较适宜作为年销售量y 关于年宣传费x 的回归方程的是( ) A .①②B .②③C .②④D .③⑤二、填空题13.如图是某地区2018年12个月的空气质量指数以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述正确的是______.①2月相比去年同期变化幅度最小,3月的空气质量指数最高;②第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小; ③第三季度空气质量指数相比去年同期变化幅度的方差最小; ④空气质量指数涨幅从高到低居于前三位的月份为6、8、4月.14.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高[)120130,,[)130140,,[]140,150三组内的学生中,用分层抽样的方法抽取18人参加一项活动,则从身高在[]140,150内的学生中抽取的人数应为________.15.上海市普通高中学业水平等级考成绩共分为五等十一级,各等级换算成分数如表所示: 等级A + AB + BB -C + CC -D + DE 分数 7067646158555249464340上海某高中2018届高三()1班选考物理学业水平等级考的学生中,有5人取得A +成绩,其他人的成绩至少是B 级及以上,平均分是64分,这个班级选考物理学业水平等级考的人数至少为______人.16.一个车间为了规定工作原理,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下: 零件数x (个) 15 20 30 40 50 加工时间y (分钟)6570758090由表中数据,求得线性回归方程0.66y x a =+,则估计加工70个零件时间为__________分钟(精确到0.1).17.为了了解2100名学生早晨到校时间,计划采用系统抽样的方法从全体学生中抽取容量为100栋样本,则分段间隔为__________.18.某种活性细胞的存活率(%)y 与存放温度()x C ︒之间具有线性相关关系,样本数据如下表所示: 存放温度()x C ︒ 10 4 -2 -8 存活率(%)y20445680经计算得回归直线的斜率为-3.2.若存放温度为6C ︒,则这种细胞存活率的预报值为__________%.19.某超市统计了一个月内每天光顾的顾客人数,得到如图所示的频率分布直方图,根据该图估计该组数据的中位数为__________.20.某班60名学生参加普法知识竞赛,成绩都在区间[40100],上,其频率分布直方图如图所示,则成绩不低于60分的人数为___.三、解答题21.据了解,温带大陆性气候,干燥,日照时间长,昼夜温差大,有利于植物糖分积累.某课题研究组欲研究昼夜温差大小()/x ℃与某植物糖积累指数()/y GI 之间的关系,得到如下数据:组数 第一组 第二组第三组第四组第五组第六组昼夜温差/℃x1011 13 12 8 6某植物糖积累指数/y GI20 24 30 28 18 15下的2组数据进行检验,假设这剩下的2组数据恰好是第一组与第六组数据.(1)求y 关于x 的线性回归方程ˆˆˆybx a =+ (2)若由线性回归方程得到的估计数据与所选出的检验数据的差的绝对值均不超过2.58,则认为得到的线性回归方程是理想的,试问(1)中所得线性回归方程是否理想?(参考公式:回归直线方程ˆˆˆybx a =+的斜率和截距的最小二乘估计()()()211ˆˆˆ,iiini ni x x y y bay bx x x ==--==--∑∑ 22.“湖广熟,天下足”,鱼米之乡的湖北是全国重要的农产品生产地.而受疫情影响,像莲藕、小龙虾等湖北很多优质农副产品近期都面临销售难题.为了让淜北尽快恢复正常,央视主持人朱广权化身直播带货官,和网红们一起为湖北产品做公益直播.在为湖北某地区的小龙虾进行带货时,需大致了解该地区小龙虾的产量,通过调查发现湖北某地区近几年的小龙虾产量统计如下表: 年份 2014 2015 2016 2017 2018 2019 年份代码t123456(1)根据表中数据,建立关于t 的线性回归方程y bt a =+; (2)请你根据线性回归方程预测今年(2020年)该地区小龙虾的年产量.附:对于一组数据()11,t y ,()22,t y ,…,(),n n t y ,其回归直线y bt a =+的斜率和截距的最小二乘估计分别为:()()()121ˆniii ni i t t y y bt t ==--=-∑∑,a y bt =-.(参考数据:()()616.3ii i tty y =--=∑)23.为提高某作物产量,种植基地对单位面积播种数与每棵作物的产量之间的关系进行了研究,收集了10块试验田的数据,得到下表:技术人员选择模型21y a bx =+作为y 与x 的回归方程类型,令2i i u x =,1ii v y =. (1)由最小二乘法得到线性回归方程v u βα=+,求y 关于x 的回归方程; (2)利用(1)得出的结果,计算当单位面积播种数x 为何值时,单位面积的总产量w xy =的预报值最大?(计算结果精确到0.01)附:对于一组数据()11,u v ,()22,u v …(),n n u v 其回归直线v u βα=+的斜率和截距的最小二乘法估计分别为1221ni i i nii u v nu vunuβ==-⋅=-∑∑,v u αβ=-.参考数据:1500nii u==∑,140ni i v ==∑,12321n i i i u v ==∑,2135642ni i u ==∑ 5.48≈.24.假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:若由资料可知y 对x 呈线性相关关系,试求:(1)回归直线方程;(2)估计使用年限为10年时,维修费用约是多少?(参考:1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-)25.经营费用指流通企业对在经营过程中发生除经营成本以外的所有费用,如管理费用、财务费用、法律费用等,这些费用没有直接用于生产产品或提供服务,但它是影响公司收益的重要因素.某创业公司从2014年开始创业到2019年每年的经营费用y (万元)、年份及其编号t ,有如下统计资料: 年份 2014 2015 2016 2017 2018 2019 t 1 2 3 4 5 6 y9.512.214.617.419.6m已知该公司从2014年到2019年年平均经营费用为16万元,且经营费用y 与年份编号t 呈线性相关关系.(1)求2019年该公司的经营费用;(2)y 关于t 的回归方程为 2.6y t a =+,求a ,并预测2020年所需要支出的经营费用; (3)该公司对2019年卖出的产品进行质量指标值检测,由检测结果得如图所示频率分布直方图:预计2020年生产产品质量指标值分布与上一年一致,将图表中频率作为总体的概率.当每件产品质量指标值不低于215时为优质品,指标值在185到215之间是合格品,指标值低于185时为次品.出售产品时,每件优质品可获利1.5万元,每件合格品可获利0.7万元,次品不仅全额退款,还要对客户进行赔付,所以每件次品亏损1.3万元.若2020年该公司的产量为500台,请你预测2020年该公司的总利润(总利润=销售利润-经营费用).26.某花圃为提高某品种花苗质量,开展技术创新活动,在A ,B 实验地分别用甲、乙方法培育该品种花苗.为观测其生长情况,分别在A ,B 试验地随机抽选各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图.记综合评分为80及以上的花苗为优质花苗.(1)求图中a 的值,并求综合评分的平均数;(2)若优质花苗数中甲乙两种培育法的比列为1:3,填写下面的列联表,并判断是否有99%的把握认为优质花苗与培育方法有关.优质花苗 非优质花苗 合计甲培育法 乙培育法 合计附:下面的临界值表仅供参考.()20P K k ≥ 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0k2.0722.706 3.841 5.0246.635 7.87910.828(参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)【参考答案】***试卷处理标记,请不要删除一、选择题1.A 解析:A 【解析】由频率分布直方图可知:第一组的频数为20×0.01×5=1个, [0,5)的频数为20×0.01×5=1个, [5,10)的频数为20×0.01×5=1个, [10,15)频数为20×0.04×5=4个, [15,20)频数为20×0.02×5=2个, [20,25)频数为20×0.04×5=4个, [25,30)频数为20×0.03×5=3个, [30,35)频数为20×0.03×5=3个, [35,40]频数为20×0.02×5=2个, 则对应的茎叶图为A , 本题选择A 选项.点睛:茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.2.C解析:C 【解析】解:由图可知:则底部周长小于110cm 段的频率为(0.01+0.02+0.04)×10=0.7, 则频数为100×0.7=70人. 故选C .3.D解析:D 【分析】由已知求得x 与z 的值,代入线性回归方程求得a ,再由kxy ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+,结合z lny =,得z lnc kx =+,则109lnc =,由此求得c 值.【详解】 解:1617181917.54x +++==,50344131394z +++==. 代入4z x a =-+,得39417.5a =-⨯+,则109a =.∴4109z x =-+,由kxy ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+,令z lny =,则z lnc kx =+,109lnc ∴=,则109c e =. 故选:D .【点睛】本题考查回归方程的求法,考查数学转化思想方法,考查计算能力,属于中档题. 4.D解析:D【分析】考查平均数和方差的性质,基础题.【详解】设这一组数据为()1,n X a a =,由()()E X a E X a +=+,()()D X a D X +=,故选:D .【点睛】本题主要考查方差的性质,考查了运算能力,属于容易题. 5.A解析:A【分析】先弄清楚程序框图中是统计成绩不低于90分的学生人数,然后从茎叶图中将不低于90分的个数数出来,即为输出的结果.【详解】176A =,1i =,16i ≤成立,190A ≥不成立,112i =+=;279A =,2i =,16i ≤成立,290A ≥不成立,112i =+=;792A =,7i =,16i ≤成立,790A ≥成立,011n =+=,718i =+=;依此类推,上述程序框图是统计成绩不低于90分的学生人数,从茎叶图中可知,不低于90分的学生数为10,故选A .【点睛】本题考查茎叶图与程序框图的综合应用,理解程序框图的意义,是解本题的关键,考查理解能力,属于中等题.6.B解析:B【解析】分析:根据所给的这组数据,取出这组数据的样本中心点,把样本中心点代入所给的四个选项中验证,若能够成立的只有一个,这一个就是回归直线方程. 详解:123+4=2.54x ++=, 3 3.8 5.26 4.5,4y +++== ∴这组数据的样本中心点是(2.5,4.5)把样本中心点代入四个选项中,只有y =1.04x +1.9成立,故选B. 点睛:这是一道关于考查回归直线方程的题目,关键掌握回归直线必过样本中心点的特点,首先分析题目,由四组数据可得,x y ,进而得到样本中心点的坐标,接下来根据回归直线必过样本中心点,即可解答此题. 7.D解析:D 【详解】 试题分析:由于甲地总体均值为,中位数为,即中间两个数(第天)人数的平均数为,因此后面的人数可以大于,故甲地不符合.乙地中总体均值为,因此这天的感染人数总数为,又由于方差大于,故这天中不可能每天都是,可以有一天大于,故乙地不符合,丙地中中位数为,众数为,出现的最多,并且可以出现,故丙地不符合,故丁地符合.考点:众数、中位数、平均数、方差8.C解析:C【详解】试题分析:由已知可得176,176x y ==∴中心点为()176,176,代入回归方程验证可知,只有方程y =88+12x 成立,故选C 9.C解析:C【分析】设该样本中高三年级的学生人数为x ,则1800601200x=,解之即可 【详解】设该样本中高三年级的学生人数为x , 则1800601200x=,解得40x =, 故选C .【点睛】 本题考查了分层抽样方法的应用问题,属基础题.10.C解析:C【解析】【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论.【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位,即减少1.5个单位,故选C.【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目. 11.A解析:A【解析】分析:先观察表中数据的规律,确定回归系数b 的符号,再计算x 和y ,代入选项确定正确答案.详解:由表中数据规律发现:热饮杯数y 随当天气温x 升高而减少,则0b <,排除C 、D. 计算1169=(504712151923273136)1111x -++++++++++= 11228=(15615013212813011610489937654)111.641111y ++++++++++=≈ 将x 代入选项A ,得1692.352147.767111.6311ˆy =-⨯+= 将x 代入选项B ,得1692.352127.76591.6311ˆy=-⨯+= 所以选项A 正确.故选A. 点睛:本题考查线性回归方程的求法与应用,一次项系数b 符号的判断和回归直线过样本中心点(,)x y 是解题关键.12.B解析:B【解析】分析:先根据散点图确定函数趋势,再结合五个选择项函数图像,进行判断选择.详解:从散点图知,样本点分布在开口向右的抛物线(上支)附近或对数曲线(上部分)的附近,所以y =d 或y =p +q ln x 较适宜,故选B .点睛:本题考查散点图以及函数图像,考查识别能力.二、填空题13.①②③【分析】根据折线的变化率得到相比去年同期变化幅度、升降趋势逐一验证即可【详解】根据折现统计图可得2月相比去年同期变化幅度最小3月的空气质量指数最高故①正确;第一季度的空气质量指数的平均值最大第解析:①②③【分析】根据折线的变化率,得到相比去年同期变化幅度、升降趋势,逐一验证即可.【详解】根据折现统计图可得,2月相比去年同期变化幅度最小,3月的空气质量指数最高,故①正确;第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小,故②正确;第三季度空气质量指数相比去年同期变化幅度的方差最小,故③正确;空气质量指数涨幅从高到低居于前三位的月份为6、8、9月,故④错误,故答案为:①②③.【点睛】本题考查条形统计图和折线图的应用,重点考查数据分析,从表中准确获取信息是关键,属于中档题型.14.3【分析】先由频率之和等于1得出的值计算身高在的频率之比根据比例得出身高在内的学生中抽取的人数【详解】身高在的频率之比为所以从身高在内的学生中抽取的人数应为故答案为:【点睛】本题主要考查了根据频率分 解析:3【分析】先由频率之和等于1得出a 的值,计算身高在[)120,130,[)130,140,[]140,150的频率之比,根据比例得出身高在[]140,150内的学生中抽取的人数.【详解】(0.0050.010.020.035)101a ++++⨯=0.03a ∴=身高在[)120,130,[)130,140,[]140,150的频率之比为0.03:0.02:0.013:2:1= 所以从身高在[]140,150内的学生中抽取的人数应为11836⨯= 故答案为:3【点睛】本题主要考查了根据频率分布直方图求参数的值以及分层抽样计算各层总数,属于中档题. 15.15【解析】【分析】设取得A 成绩的x 人取得成绩的y 人取得B 成绩的z 人由题意可得:解得:结合xy 可求的最【详解】设取得A 成绩的x 人取得成绩的y 人取得B 成绩的z 人则即又xy 即当且仅当时取得最小值15取得解析:15【解析】【分析】设取得A 成绩的x 人,取得B +成绩的y 人,取得B 成绩的z 人,由题意可得:()70567x 64y 61z 645x y z ⨯+++=⨯+++,解得:z x 10-=,结合x ,y ,z N ∈,可求5x y z +++的最.【详解】设取得A 成绩的x 人,取得B +成绩的y 人,取得B 成绩的z 人,则()70567x 64y 61z 645x y z ⨯+++=⨯+++,即z x 10-=,又x ,y ,z N ∈,即当且仅当x 0=,y 0=,z 10=时,5x y z +++取得最小值15,取得A 成绩的0人,取得B +成绩的0人,取得B 成绩的10人,这个班级选考物理学业水平等级考的人数至少为15人,故答案为15【点睛】本题考查了实际问题通过数学问题解决,考查了阅读理解及数学建模的能力,属中档题. 16.7【解析】【分析】结合题意先求出线性回归方程然后再计算出结果【详解】由题意可得则线性回归方程为当时【点睛】本题考查了求线性回归方程然后求出估计结果需要掌握解题方法较为基础解析:7【解析】【分析】结合题意先求出线性回归方程,然后再计算出结果【详解】 由题意可得1520304050315x ++++== 6570758090765y ++++==, 760.6631a ∴=⨯+, 55.54a =,则线性回归方程为0.66 5.4ˆ55yx =+ 当70x =时,ˆ101.7y≈ 【点睛】本题考查了求线性回归方程,然后求出估计结果,需要掌握解题方法,较为基础 17.【解析】【分析】根据系统抽样的特征求出分段间隔即可【详解】根据系统抽样的特征得:从2100名学生中抽取100个学生分段间隔为故答案是21【点睛】该题所考查的是有关系统抽样的组距问题应用总体除以样本容 解析:21【解析】【分析】根据系统抽样的特征,求出分段间隔即可.【详解】根据系统抽样的特征,得:从2100名学生中抽取100个学生,分段间隔为210021100=, 故答案是21.【点睛】该题所考查的是有关系统抽样的组距问题,应用总体除以样本容量等于组距,得到结果,属于简单题目. 18.34【解析】分析:由题意求出代入公式求值从而得到回归直线方程代入代入即可得到答案详解:由题意设回归方程由表中数据可得:;代入回归方程可得当时可得故答案为34点睛:该题考查的是有关回归直线的有关问题在 解析:34【解析】 分析:由题意求出,x y ,代入公式求值^a ,从而得到回归直线方程,代入6x =代入即可得到答案. 详解:由题意,设回归方程 3.2ˆ,ˆyx a =-+ 由表中数据可得:1,50x y ==;代入回归方程可得ˆ53.2a=. 当6x =时,可得3.2653.234y =-⨯+=,故答案为34.点睛:该题考查的是有关回归直线的有关问题,在解题的过程中,涉及到的知识点有回归直线过均值点,即样本中心点,利用题中所给的表格中的数据,计算得出相应的量,代入式子求得对应的结果.19.75【解析】分析:由频率分布直方图算出各频率然后计算中位数详解:由图可知的频率为的频率为的频率为的频率为的频率为前两组频率前三组频率中位数在第三组设中位数为则解得故该组数据的中位数为点睛:本题考查了 解析:75.【解析】分析:由频率分布直方图算出各频率,然后计算中位数详解:由图可知,10~20的频率为0.1420~30的频率为0.2430~40的频率为0.3240~50的频率为0.250~60的频率为0.1前两组频率0.140.240.380.5=+=<前三组频率0.140.240.320.70.5=++=>∴中位数在第三组设中位数为x ,则()300.380.320.510x -+⨯= 解得33.75x =故该组数据的中位数为33.75点睛:本题考查了在频率分布直方图中求中位数,此类题目需要先确定中位数所在的组,然后根据公式计算求得结果,较为基础. 20.30【解析】由题意可得:则成绩不低于分的人数为人解析:30【解析】由题意可得:()400.0150.0300.0250.0051030⨯+++⨯=则成绩不低于60分的人数为30人三、解答题21.(1)171277y =⨯;(2)该小组所得线性回归方程是理想的. 【分析】 (1)根据数据求出ˆb与ˆa 的值,即可求出y 关于x 的线性回归方程; (2)分别计算出1月份和6月份对应的预测值,与检验数据作差取绝对值,再与2.58进行比较即可得到结论.【详解】(1)由表中2月至5月份的数据, 得11(1113128)11,(24302818)2544x y =+++==+++=, 故有()()520(1)2513(3)(7)34i i i x x y y =--=⨯-+⨯+⨯+-⨯-=∑, ()5222222021(3)14i i x x =-=+++-=∑, 34171712,251114777b a y bx ∴===-=-⨯=-, 即y 关于x 的线性回归方程为171277y =⨯; (2)由171277y =⨯,当10x =时,171215810777y =⨯-=,1581820 2.5877-=<, 当6x =时,1712906777y =⨯=, 901515 2.5877-=<, 则该小组所得线性回归方程是理想的.【点睛】方法点睛:该题考查的是有关回归分析的问题,解题方法如下:(1)结合题中所给的数据,根据最小二乘法系数公式起的ˆb与ˆa 的值,得到回归直线方程;(2)将相应的变量代入,得到的值域题中条件比较,得到结论.22.(1)0.36 6.24y x =+;(2)8.76万吨.【分析】(1)由题意求得知 3.5t =,7.5=y ,()62117.5i i t t =-=∑,运用公式求得b ,代入可求得y 关于t 的线性回归方程.(2)由(1)得的线性回归方程,代入年份代码7t =计算,可预测2020年该地区小龙虾的年产量.【详解】(1)由题知 3.5t =,7.5=y ,()62117.5i i t t =-=∑,()()()61621 6.30.3617.5ˆi ii i i t t y y b t t ==--===-∑∑, 又 6.24=-=a y bt .所以,y 关于t 的线性回归方程为0.36 6.24y x =+.(2)由(1)得,当年份为2020年时,年份代码7t =,此时0.367 6.248.76=⨯+=y .所以,可预测,2020年该地区小龙虾的年产量为8.76万吨.【点睛】本题考查线性回归方程的求解,利用线性回归方程对总体进行估计,属于中档题. 23.(1)212.50.03y x=+;(1)9.13x =棵2/m . 【分析】(1)先利用公式和数据计算,αβ,即得v 关于u 的线性回归方程,再代入得到y 关于x 的回归方程即可;(2)先利用(1)的结果计算w xy =,再利用基本不等式求其最大值即可.【详解】解:(1)由题意得115010n i i u u ===∑,11410ni i v v ===∑, ∴1011022212321105040.033564210501010i ii i i u v u v u uβ==-⨯⨯=⨯⋅--≈=-∑∑, 2.5v u αβ=-=. 所以v 关于u 的线性回归方程为0.03 2.5v u =+.则y 关于x 的回归方程为212.503ˆ0.y x =+. (2)根据(1)的结果并结合条件,单位面积的总产量的预报值21252.50.030.03x w x x x==++ 1.83≤=≈. 当且仅当2.50.03x x =时,等号成立,此时9.133x =≈. 即当9.13x =棵2/m 时,单位面积的总产量w 的预报值最大,最大值是1.83. 【点睛】本题考查了非线性回归方程的求法以及方程的应用,属于中档题.24.(1) 1.2308ˆ.0yx =+;(2)12.38万元.. 【分析】(1)由已知表格中的数据,易计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221n ii i n i i x y nxy b xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.(2)把使用年限10代入回归直线方程,即可估算出维修费用的值.【详解】(1)4x =,5y =,52190ii x==∑,51112.3i i i x y ==∑, 12215 1.235n ii i n ii x y xy b xx ==-==-∑∑,0.08a y bx =-=,所以回归直线方程为 1.2308ˆ.0yx =+; (2) 1.23100.0812.3ˆ8y=⨯+=,即估计用10年时维修费约为12.38万元.【点评】本题考查回归直线的方程求解,关键是要求出回归直线方程的系数,由已知的变量x ,y 的值,我们计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221n ii i n i i x y nxy b xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.属于中等题.25.(1)22.7万元;(2)6.9;25.1万元;(3)254.9万元.【分析】(1)根据均值定义列式计算;(2)求出t ,代入方程可得a ,令7t =代入可得估计值;(3)由频率分布直方图是三种产品的概率,得三种产品的件数,根据各产品赢利可计算出总赢利,注意减去(2)中估计的经营费用.【详解】(1)9.512.214.617.419.6166m y +++++==. 解得22.7m =,即2019年该公司的经营费用为22.7万元.(2) 3.5t =,16y =,所以 2.6 6.9a y t =-=,取7t =,代入得25.1y =,预测2020年所需要支出的经营费用为25.1万元. (3)由图可得生产优质品的概率是0.1,生产合格品的概率是0.79,生产次品的概率是0.11,则预测该公司2020年的总利润为1.50.15000.70.79500 1.30.1150025.1254.9⨯⨯+⨯⨯-⨯⨯-=(万元).【点睛】本题考查线性回归方程及其应用,考查频率分布直方图及其期望,考查学生的数据处理能力,运算求解能力,属于中档题.26.(1)0.04,81;(2)列联表见解析,有99%的把握认为优质花苗与培育方法有关【分析】(1)利用频率和为1列方程求出a 的值,再利用直方图平均值公式计算平均值;(2)由(1)结合直方图求出有关数据,可填写列联表,计算观测值,对照临界值得出结论.【详解】(1)因为(0.0050.0100.0250.020)101a ++++⨯=,解得0.040a =,综合评分的平均数为,(0.005550.010650.025750.040850.02095)1081⨯+⨯+⨯+⨯+⨯⨯=(2)由(1)结合直方图可知,80分以上的频数为()1000.40.260⨯+=,甲乙两种培育法的比列为1:3,所以,甲乙两种培育法的优质苗数分别为15、45填写列联表如下,计算2100(1554535)37,510.828 60405050K⨯⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为优质花苗与培育方法有关.【点睛】本题考查了频率分布直方图的性质与应用问题,也考查了列联表与独立性检验问题的实际应用,是中档题.。

(常考题)北师大版高中数学必修三第一章《统计》检测(答案解析)(3)

(常考题)北师大版高中数学必修三第一章《统计》检测(答案解析)(3)

一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆybx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.如图1为某省2019年1~4月快递业务量统计图,图2是该省2019年1~4月快递业务收入统计图,下列对统计图理解错误的是( )A .2019年1~4月的业务量,3月最高,2月最低,差值接近2000万件B .2019年1~4月的业务量同比增长率超过50%,在3月最高C .从两图来看2019年1~4月中的同一个月快递业务量与收入的同比增长率并不完全一致D .从1~4月来看,该省在2019年快递业务收入同比增长率逐月增长3.2020年2月,受新冠肺炎的影响,医卫市场上出现了“一罩难求”的现象.在政府部门的牵头下,部分工厂转业生产口罩,下表为某小型工厂2-5月份生产的口罩数(单位:万) 月份x 2 3 4 5 口罩数y4.5432.5口罩数y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 的值为( ) A .6.1B .5.8C .5.95D .6.754.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是( )A .成绩B .视力C .智商D .阅读量5.某教研机构随机抽取某校20个班级,调查各班关注汉字听写大赛的学生人数,根据所得数据的茎叶图,以组距为5将数据分组成[)[)[)[)[)[)[)[]0,5,5,10,10,15,15,20,20,25,25,30,30,35,35,40时,所作的频率分布直方图如图所示,则原始茎叶图可能是( )A .B .C .D .6.某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是 A .8号学生B .200号学生C .616号学生D .815号学生7.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .8.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( ) A .70和50B .70和67C .75和50D .75和679.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系 价格(万元) 25 23.5 22 20.5 销售量(辆)30333639已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆybx =+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39B .42C .45D .5010.高二某班共有学生60名,座位号分别为01, 02, 03,···, 60.现根据座位号,用系统抽样的方法,抽取一个容量为4的样本.已知03号、18号、48号同学在样本中,则样本中还有一个同学的座位号是( ) A .31号B .32号C .33号D .34号11.为了考察两个变量x 和y 之间的线性相关性,甲.乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2.已知在两个人的试验中发现对变量x 的观测数据的平均值恰好相等,都为s ,对变量y 的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是( ) A .直线l 1和l 2有交点(s ,t)B .直线l 1和l 2相交,但是交点未必是点(s ,t)C .直线l 1和l 2由于斜率相等,所以必定平行D .直线l 1和l 2必定重合12.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据:11(,)x y ,22(,)x y ,33(,)x y ,44(,)x y ,55(,)x y .根据收集到的数据可知12345150x x x x x ++++=,由最小二乘法求得回归直线方程为0.6754.9y x =+,则12345y y y y y ++++的值为( )A .75B .155.4C .375D .466.2二、填空题13.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位: cm ),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有_______株树木的底部周长大于110cm .14.对两个变量y 和x 进行回归分析,得到一组样本数据()11,x y ,()22,x y ,…,(),n n x y ,则下列说法中正确的序号是______.①由样本数据得到的回归直线方程y bx a =+必过样本点的中心 ②残差平方和越小的模型,拟合的效果越好③用相关指数2R 来刻画回归效果,2R 越小说明拟合效果越好④若变量y 和x 之间的相关系数为0.946r =-,则变量y 和x 之间线性相关性强 15.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..16.一个项目由15个专家评委投票表决,剔除一个最高分96,一个最低分58后所得到的平均分为92,方差为16,那么原始得分的方差为______________.17.设一个回归方程为0.4 1.8y x =-,则当25x =时,y 的估计值是_______. 18.已知某人连续5次射击的环数分别是8,9,10,x ,8,若这组数据的平均数是9,则这组数据的方差为 .19.为弘扬我国优秀的传统文化,某小学六年级从甲、乙两个班各选出7名学生参加成语知识竞赛,他们取得的成绩的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则的值为__________.20.为了解某地区某种农产品的年产量x (单位:吨)对价格y (单位:千元/吨)的影响,对近五年该农产品的年产量和价格统计如下表:x1 2 3 4 5y 7.0 6.5m3.8 2.2已知x 和y 具有线性相关关系,且回归方程为 1.238.69y x =-+,那么表中m 的值为__________.三、解答题21.某科研课题组通过一款手机APP 软件,调查了某市1000名跑步爱好者平均每周的跑步量(简称“周跑量”),得到如下的频数分布表: 周跑量 [)10,15 [)15,20 [)20,25 [)25,30 [)30,35 [)35,40 [)40,45 [)45,50 []50,55人数100120130180220150603010周跑量 小于20公 20公里到 不小于40 类别 休闲跑者 核心跑者 精英跑者 装备价格250040004500);(3)根据跑步爱好者的周跑量,将跑步爱好者分成以下三类,不同类别的跑者购买的装备的价格不一样(如表),根据以上数据,估计该市每位跑步爱好者购买装备,平均需要花费多少元?22.2018年8月8日是我国第十个全民健身日,其主题是:新时代全民健身动起来.某市为了解全民健身情况,随机从某小区居民中抽取了40人,将他们的年龄分成7段:[10,20),[20,30),[30,40),[40,50),[50,60),[60,70),[70,80]后得到如图所示的频率分布直方图.(1)试求这40人年龄的平均数的估计值;(2)(i )若从样本中年龄在[50,70)的居民中任取2人赠送健身卡,求这2人中至少有1人年龄不低于60岁的概率;(ⅱ)已知该小区年龄在[10,80]内的总人数为2000,若18岁以上(含18岁)为成年人,试估计该小区年龄不超过80岁的成年人人数.23.某电视机的广告支出x (单位:万元)与销售收入y (单位:万元)之间有下表所对应的关系:(1)求出y 对x 的回归直线方程;(2)若广告费为9万元,则销售收入为多少万元? (参考公式:1122222212n n n x y x y x y nx yb x x x nx +++-⋅=+++-,a y bx =-) 24.从某小区抽取100个家庭进行月用电量调查,发现其月用电量都在50度至350度之间,频率分布直方图如图所示.(1)根据直方图求x 的值,并估计该小区100个家庭的月均用电量(同一组中的数据用该组区间的中点值作代表);(2)从该小区已抽取的100个家庭中, 随机抽取月用电量超过300度的2个家庭,参加电视台举办的环保互动活动,求家庭甲(月用电量超过300度)被选中的概率.25.经营费用指流通企业对在经营过程中发生除经营成本以外的所有费用,如管理费用、财务费用、法律费用等,这些费用没有直接用于生产产品或提供服务,但它是影响公司收益的重要因素.某创业公司从2014年开始创业到2019年每年的经营费用y (万元)、年份及其编号t ,有如下统计资料: 年份 2014 2015 2016 2017 2018 2019 t 1 2 3 4 5 6 y9.512.214.617.419.6m已知该公司从2014年到2019年年平均经营费用为16万元,且经营费用y 与年份编号t 呈线性相关关系.(1)求2019年该公司的经营费用;(2)y 关于t 的回归方程为 2.6y t a =+,求a ,并预测2020年所需要支出的经营费用; (3)该公司对2019年卖出的产品进行质量指标值检测,由检测结果得如图所示频率分布直方图:预计2020年生产产品质量指标值分布与上一年一致,将图表中频率作为总体的概率.当每件产品质量指标值不低于215时为优质品,指标值在185到215之间是合格品,指标值低于185时为次品.出售产品时,每件优质品可获利1.5万元,每件合格品可获利0.7万元,次品不仅全额退款,还要对客户进行赔付,所以每件次品亏损1.3万元.若2020年该公司的产量为500台,请你预测2020年该公司的总利润(总利润=销售利润-经营费用).26.某城市200户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,280,[)280,300分组的频率分布直方图如图:(1)求直方图中x 的值;(2)在月平均用电量为[)220,240,[)240,260,[)260,280的三组用户中,用分层抽样的方法抽取20户居民,则月平均用电量在[)220,240的用户中应抽取多少户? (3)求月平均用电量的中位数和平均数.【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】由已知求得 x , y ,进一步求得 a ,得到线性回归方程,取16x =求得y 值即可. 【详解】8.38.69.911.1512.1 10x +++=+=, 5.97.88.18.49.858y ++++==.又 0.78b =,∴ 80.78100.2a y bx --⨯===. ∴ 0.780.2y x =+.取16x =,得 0.78160.212.68y ⨯+==万元,故选A . 【点睛】本题主要考查线性回归方程的求法,考查了学生的计算能力,属于中档题.2.D解析:D 【分析】由题意结合所给的统计图确定选项中的说法是否正确即可. 【详解】对于选项A : 2018年1~4月的业务量,3月最高,2月最低, 差值为439724111986-=,接近2000万件,所以A 是正确的;对于选项B : 2018年1~4月的业务量同比增长率分别为55%,53%,62%,58%,均超过50%,在3月最高,所以B 是正确的;对于选项C :2月份业务量同比增长率为53%,而收入的同比增长率为30%,所以C 是正确的;对于选项D ,1,2,3,4月收入的同比增长率分别为55%,30%,60%,42%,并不是逐月增长,D 错误. 本题选择D 选项. 【点睛】本题主要考查统计图及其应用,新知识的应用等知识,意在考查学生的转化能力和计算求解能力.3.C解析:C 【分析】求得 3.5x y ==,得到样本中心点(3.5,3.5),再把样本中心点代入回归直线方程得解. 【详解】由表可得 3.5x y ==,带入线性回归方程中有 3.50.7 3.5 5.95=+⨯=a , 故选:C . 【点睛】本题考查利用线性相关关系求回归直线方程,属于基础题.4.D解析:D 【解析】试题分析:由表中数据可得 表1:()25262210140.00916362032K ⨯⨯-⨯=≈⨯⨯⨯;表2: ()2524201216 1.76916362032K ⨯⨯-⨯=≈⨯⨯⨯;表3: ()252824128 1.316362032K ⨯⨯-⨯=≈⨯⨯⨯;表4: ()25214302623.4816362032K ⨯⨯-⨯=≈⨯⨯⨯.其中23.48最大,所以阅读量与性别有关联的可能性最大.故D 正确. 考点:独立性检验.5.A解析:A 【解析】由频率分布直方图可知:第一组的频数为20×0.01×5=1个, [0,5)的频数为20×0.01×5=1个, [5,10)的频数为20×0.01×5=1个, [10,15)频数为20×0.04×5=4个, [15,20)频数为20×0.02×5=2个, [20,25)频数为20×0.04×5=4个, [25,30)频数为20×0.03×5=3个,[30,35)频数为20×0.03×5=3个, [35,40]频数为20×0.02×5=2个, 则对应的茎叶图为A , 本题选择A 选项.点睛:茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.6.C解析:C 【分析】等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案. 【详解】详解:由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{}n a ,公差10d =,所以610n a n =+()n *∈N ,若8610n =+,则15n =,不合题意;若200610n =+,则19.4n =,不合题意; 若616610n =+,则61n =,符合题意;若815610n =+,则80.9n =,不合题意.故选C . 【点睛】本题主要考查系统抽样.7.D解析:D 【解析】 【分析】 先计算,代入回归直线方程,可得,从而可求得结果.【详解】 因为,所以,代入回归直线方程可求得,所以,故选D. 【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.8.B【解析】【分析】根据平均数、方差的概念表示出更正前的平均数、方差和更正后的平均数、方差,比较其异同,然后整体代入即可求解.【详解】设更正前甲,乙,…的成绩依次为a1,a2,…,a50,则a1+a2+…+a50=50×70,即60+90+a3+…+a50=50×70,(a1﹣70)2+(a2﹣70)2+…+(a50﹣70)2=50×75,即102+202+(a3﹣70)2+…+(a50﹣70)2=50×75.更正后平均分为x=150×(80+70+a3+…+a50)=70;方差为s2=150×[(80﹣70)2+(70﹣70)2+(a3﹣70)2+…+(a50﹣70)2]=150×[100+(a3﹣70)2+…+(a50﹣70)2]=150×[100+50×75﹣102﹣202]=67.故选B.【点睛】本题考查平均数与方差的概念与应用问题,是基础题.9.B解析:B【解析】分析:先求均值,确定ˆb,再求自变量为19对应函数值得结果.详解:因为2523.52220.5330333639122,344442x y++++++====,所以1348022,3224ˆb-==-所以19(2)8042y=⨯-+=选B.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b,写出回归方程,回归直线方程恒过点(,)x y.10.C解析:C【解析】根据系统抽样知,组距为604=15÷,即可根据第一组所求编号,求出各组所抽编号.【详解】学生60名,用系统抽样的方法,抽取一个容量为4的样本,所以组距为604=15÷, 已知03号,18号被抽取,所以应该抽取181533+=号,故选C.【点睛】本题主要考查了抽样,系统抽样,属于中档题.11.A解析:A【分析】由题意知,两个人在试验中发现对变量x 的观测数据的平均值都是s ,对变量y 的观测数据的平均值都是t ,所以两组数据的样本中心点是(s ,t ),回归直线经过样本的中心点,得到直线l 1和l 2都过(s ,t ).【详解】∵两组数据变量x 的观测值的平均值都是s ,对变量y 的观测值的平均值都是t ,∴两组数据的样本中心点都是(s ,t )∵数据的样本中心点一定在线性回归直线上,∴回归直线l 1和l 2都过点(s ,t )∴两条直线有公共点(s ,t )故选A .【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x 与Y 之间的关系,这条直线过样本中心点.12.C解析:C【分析】 首先求得x 的值,然后利用线性回归方程过样本中心点的性质求解12345y y y y y ++++的值即可.【详解】 由题意可得:12345305x x x x x x ++++==, 线性回归方程过样本中心点,则:0.6754.975y x =⨯+=, 据此可知:12345y y y y y ++++5375y ==.本题选择C 选项.【点睛】本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.18【分析】根据频率小矩形的面积小矩形的高组距底部求出周长大于110的频率再根据频数样本容量频率求出对应的频数【详解】由频率分布直方图知:底部周长大于110的频率为所以底部周长大于110的频数为(株解析:18【分析】根据频率=小矩形的面积=小矩形的高⨯组距底部,求出周长大于110cm的频率,再根据频数=样本容量⨯频率求出对应的频数.【详解】由频率分布直方图知:+⨯=,底部周长大于110cm的频率为(0.0200.010)100.3⨯=(株),所以底部周长大于110cm的频数为600.318故答案是:18.【点睛】该题考查的是有关频率分布直方图的应用,在解题的过程中,注意小矩形的面积表示的是对应范围内的频率,属于简单题目.14.①②④【分析】根据两个变量线性相关的概念及性质逐项判定即可求解【详解】由题意根据回归直线方程的特征可得线性回归直线方程一定过样本中心所以①正确;根据残差的概念可得残差平方和越小的模型拟合效果越好所以解析:①②④【分析】根据两个变量线性相关的概念及性质,逐项判定,即可求解.【详解】由题意,根据回归直线方程的特征,可得线性回归直线方程一定过样本中心,所以①正确;根据残差的概念,可得残差平方和越小的模型,拟合效果越好,所以②正确;根据相关指数的概念,可得2R越大说明拟合效果越好,所以③不正确;r=-,则变量y和x之间负相关,且线性相关性若变量y和x之间的相关系数为0.946强,所以④正确;故答案为:①②④.【点睛】本题主要考查了两个变量的线性相关性的概念与判定,其中解答中熟记线性相关的基本概念和结论是解答的关键,属于基础题.15.5000【分析】由题意其他年级抽取200人其他年级共有学生2000人根据题意列出等式即可求出该校学生总人数【详解】由题意其他年级抽取200人其他年级共有学生2000人则该校学生总人数为人故答案是:5解析:5000【分析】由题意,其他年级抽取200人,其他年级共有学生2000人,根据题意列出等式,即可求出该校学生总人数.【详解】由题意,其他年级抽取200人,其他年级共有学生2000人, 则该校学生总人数为20005005000200⨯=人, 故答案是:5000.【点睛】该题考查的是有关分层抽样的问题,涉及到的知识点有分层抽样要求每个个体被抽到的概率是相等的,属于简单题目. 16.【解析】分析:根据方差与均值的关系求解即可详解:剔除最高分和最低分后的则原始平均分 原始原始方差即原始方差为88点睛:本题考查方差与均值的关系属基础题解析:88【解析】分析:根据方差与均值的关系()()()22D x E x E x ⎡⎤=-⎣⎦ 求解即可.详解:剔除最高分和最低分后的 222()()()92168480,E x E x D x =+=+=22()8480(152)110240,x E x n ∑=⨯=⨯-=则原始平均分()921?3? 96? 589015E x ;⨯++== 原始 22229658()8188,15x E x ∑++== 原始方差 222()?()?()81889088.D x E X E X =-=-=原始原始 即原始方差为 88 .点睛:本题考查方差与均值的关系,属基础题.17.2【解析】分析:直接利用回归方程将代入即可求得的估计值详解:∵回归方程为∴当时的估计值为故答案为82点睛:本题考查回归方程的运用考查学生的计算能力属于基础题解析:2【解析】分析:直接利用回归方程,将25x =代入,即可求得y 的估计值.详解:∵回归方程为0.4 1.8y x =-,∴当25x =时,y 的估计值为 0.425 1.88.2y =⨯-=.故答案为8.2.点睛:本题考查回归方程的运用,考查学生的计算能力,属于基础题.18.【解析】分析:先根据平均数求x 的值再求数据的方差详解:由题得所以数据的方差为故答案为点睛:(1)本题主要考查平均数和方差的计算意在考查学生对这些基础知识的掌握水平(2)方差公式为 解析:45 【解析】 分析:先根据平均数求x 的值,再求数据的方差.详解:由题得8+9+8109,10.5x x ++=∴= 所以数据的方差为22222214[(89)(99)(109)(109)(89)]55S =-+-+-+-+-=.故答案为45. 点睛:(1)本题主要考查平均数和方差的计算,意在考查学生对这些基础知识的掌握水平.(2) 方差公式为222121[()()()]n S x x x x x x n =-+-+⋅⋅⋅+-. 19.35【解析】79+78+80+80+x+85+92+967=85解得x=5根据中位数为83可知y=3故yx=35解析:【解析】,解得,根据中位数为,可知,故.20.5【解析】将样本中心代入回归方程得到m=55故答案为:55解析:5【解析】19.5,15,5m y x +== 将样本中心代入回归方程得到m=5.5. 故答案为:5.5. 三、解答题21.(1)见解析;(2)中位数29.2,众数32.5;(3)平均花费3720元.【分析】(1)由频数分布表能补全该市1000名跑步爱好者周跑量的频率分布直方图. (2)由频率分布直方图能求出样本的中位数.(3)分别求出休闲跑者、核心跑者、精英跑者的人数,由此能估计该市每位跑步爱好者购买装备平均需要花费多少钱.【详解】(1)补全该市1000名跑步爱好者周跑量的频率分布直方图,如下:(2)中位数的估计值:由50.0250.02450.0260.350.5⨯+⨯+⨯=<,0.3550.0360.530.5+⨯=>, 所以中位数位于区间[)25,30中,设中位数为x ,则()0.35250.0360.5x +-⨯=,解得29.2x ≈.即样本中位数是29.2.因为样本中频率最高的一组为[30,35),所以样本的众数为32.5.(3)依题意可知,休闲跑者共有()50.0250.024*******⨯+⨯⨯=人,核心跑者()50.02650.03650.04450.0301000680⨯+⨯+⨯+⨯⨯=人,精英跑者1000220680100--=人, 所以该市每位跑步爱好者购买装备,平均需要22025006804000100450037201000⨯+⨯+⨯=元. 即该市每位跑步爱好者购买装备,平均需要3720元.【点睛】本题考查频率分布直方图的作法,考查样本的中位数、平均数的求法,考查运算求解能力,是基础题.22.(1)37;(2)(ⅰ)35;(ⅱ)1760.(1)用每组数据中间点值乘以频率相加即得;(2)(i )年龄在[50,70)的人有6人,其中年龄在[50,60)的有4人,6人分别编号后用列举法写出任选2人的所有基本事件,同时得出至少有1人年龄不低于60岁的基本事件,计数后可得概率;(ⅱ)求出18岁以上的居民所占频率即可得.【详解】解:(1)平均数()150.15250.2350.3450.15550.165750.0537x =⨯+⨯+⨯+⨯+⨯++⨯=.(2)(ⅰ)样本中,年龄在[50,70)的人共有40×0.15=6人,其中年龄在[50,60)的有4人,设为a ,b ,c ,d ,年龄在[60,70)的有2人,设为x ,y .则从中任选2人共有如下15个基本事件:(a ,b ),(a ,c ),(a ,d ),(a ,x ),(a ,y ),(b ,c ),(b ,d ),(b ,x ),(b ,y ),(c ,d ),(c ,x ),(c ,y ),(d ,x ),(d ,y ),(x ,y ).至少有1人年龄不低于60岁的共有如下9个基本事件:(a ,x ),(a ,y ),(b ,x ),(b ,y ),(c ,x ),(c ,y ),(d ,x ),(d ,y ),(x ,y ).记“这2人中至少有1人年龄不低于60岁”为事件A ,故所求概率()93155P A ==. (ⅱ)样本中年龄在18岁以上的居民所占频率为1-(18-10)×0.015=0.88, 故可以估计,该小区年龄不超过80岁的成年人人数约为2000×0.88=1760.【点睛】本题考查频率分布直方图,考查古典概型,考查频率分布直方图的应用,考查了学生的数据处理能力,运算求解能力,属于中档题.23.(1)7325y x =-(2)129.4 【解析】试题分析:(1)观察散点图可知各点大致分布在一条直线附近,得到这组数据符合线性相关,求出利用最小二乘法所需要的数据,做出线性回归方程的系数,得到方程;(2)把x=9代入线性回归方程,估计出当广告费为9万元时,销售收入约为129.4万元 试题(1)52x =,692y =,所以735b = 2a y bx =-=-故y 对x 的回归直线方程为7325y x =- (2)当9x =时,129.4y =,故若广告费为9万元,则销售收入为129.4万元 考点:回归方程24.(1)x=0.0044, 月均用电量约为186度;(2).(1)由题意得, .设该小区100个家庭的月均用电量为S 则9+22.5+52.5+49.5+33+19.5=186.(2),所以用电量超过300度的家庭共有6个.分别令为甲、A 、B 、C 、D 、E ,则从中任取两个,有(甲,A )、(甲,B )、(甲,C )、(甲,D )、(甲,E )、(A,B )、(A,C )、(A,D )、(A,E )、(B,C )、(B,D )、(B,E )、(C,D )、(C,E )、(D,E )15种等可能的基本事件,其中甲被选中的基本事件有(甲,A )、(甲,B )、(甲,C )、(甲,D )、(甲,E )5种. 家庭甲被选中的概率. 25.(1)22.7万元;(2)6.9;25.1万元;(3)254.9万元.【分析】(1)根据均值定义列式计算;(2)求出t ,代入方程可得a ,令7t =代入可得估计值;(3)由频率分布直方图是三种产品的概率,得三种产品的件数,根据各产品赢利可计算出总赢利,注意减去(2)中估计的经营费用.【详解】(1)9.512.214.617.419.6166m y +++++==. 解得22.7m =,即2019年该公司的经营费用为22.7万元.(2) 3.5t =,16y =,所以 2.6 6.9a y t =-=,取7t =,代入得25.1y =,预测2020年所需要支出的经营费用为25.1万元. (3)由图可得生产优质品的概率是0.1,生产合格品的概率是0.79,生产次品的概率是0.11,则预测该公司2020年的总利润为1.50.15000.70.79500 1.30.1150025.1254.9⨯⨯+⨯⨯-⨯⨯-=(万元).【点睛】本题考查线性回归方程及其应用,考查频率分布直方图及其期望,考查学生的数据处理能力,运算求解能力,属于中档题.26.(1)0.0075;(2)10户;(3)224a =,225.6x =.【分析】(1)由频率和为1列出方程求解x ;(2)求出三组用户的月平均用电量的频率推出比例关系,用20乘以月平均用电量在[)220,240的用户所占比例即可得解;(3)根据中位数左边和右边的直方图面积相等列出等式估计中位数,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(1)由直方图的性质可得()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=,解得0.0075x =,所以直方图中x 的值是0.0075.(2)因为月平均用电量为[)220,240,[)240,260,[)260,280的三组用户的频率分别为0.25、0.15、0.1,所以这三组用户的月平均用电量比例为5:3:2,所以月平均用电量在[)220,240的用户中应抽取5201010⨯=(户). (3)因为()0.0020.00950.011200.450.5++⨯=<,所以月平均用电量的中位数在[)220,240内,设中位数为a ,则()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=,解得224a =.平均数 1700.041900.192100.222300.252500.152700.12900.05x =⨯+⨯+⨯+⨯+⨯+⨯+⨯ 225.6=,所以月平均用电量的中位数为224,平均数为225.6.【点睛】本题考查统计案例、分层抽样、根据频率分布直方图估计总体的数字特征,属于中档题.。

新教材高中数学章末综合检测三成对数据的统计分析新人教A版选择性必修第三册

新教材高中数学章末综合检测三成对数据的统计分析新人教A版选择性必修第三册

章末综合检测(三) 成对数据的统计分析A 卷——基本知能盘查卷一、单项选择题1.可用来分析身高与体重有关系的是( ) A .残差分析 B .线性回归模型 C .等高堆积条形图D .独立检验解析:选B 因为身高与体重是两个具有相关关系的变量,所以要用线性回归模型来解决.2.两个变量y 与x 的经验回归模型中,分别选择了四个不同模型来拟合y 与x 之间的关系,它们的相关指数R 2如下,其中拟合效果最好的模型是( )A .模型1 C .模型3D .模型4解析:选A 两个变量y 与x 的经验回归模型中,它们的相关指数R 2越接近于1,这个模型的拟合效果越好,所给出的四个选项中0.98是相关指数最大的值,所以拟合效果最好的模型是模型1.3.已知一组观测值(x 1,y 1),(x 2,y 2),…,(x n ,y n )满足y i =a +bx i +e i (i =1,2,…,n ),若e i 恒为0,则R 2=( )A .0B .0.5C .0.9D .1选D4.如果有95%的把握说事件A 和B 有关系,那么具体计算出的数据为( ) A .χ2>3.841 B .χ2<3.841 C .χ2>6.635D .χ2<6.635解析:选A 由独立性判断的方法可知,如果有95%的把握,即小概率值α=0.05,则χ2>3.841.5.观察两个变量(存在线性相关关系)得如下数据:A.y ^=12x +1B.y ^=xC.y ^=2x +13D.y ^=x +1解析:选 B 根据表中数据得x -=18×(-10-6.99-5.01-2.98+3.98+5+7.99+8.01)=0,y -=18×(-9-7-5-3+4.01+4.99+7+8)=0,所以两变量x ,y 的经验回归方程过样本点的中心(0,0),可以排除A 、C 、D 选项,故选B.6.2020年初,新型冠状病毒(COVID ­19)引起的肺炎疫情爆发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如下表所示:周数(x ) 1 2 3 4 5 治愈人数(y )2173693142由表格可得y 关于x 的二次回归方程为y ^=6x 2+a ,则此回归模型第4周的残差(实际值与预报值之差)为( )A .5B .4C .1D .0解析:选A 设t =x 2,则t -=15(1+4+9+16+25)=11,y -=15(2+17+36+93+142)=58,a =58-6×11=-8,所以y ^=6x 2-8.令x =4,得e 4=y 4-y ^4=93-6×42+8=5.7.通过随机询问100名性别不同的高二学生是否爱吃零食,得到如下的列联表:喜爱程度 性别合计 男(Y =0) 女(Y =1) 爱好(X =0) 10 40 50 不爱好(X =1)20 30 50 合计3070100参考数据及公式:P (χ2≥x α)0.10 0.05 0.01 x α2.7063.8416.635其中χ2=n ad -bc 2a +bc +d a +cb +d,n =a +b +c +d .则下列结论正确的是( )A .根据小概率值α=0.05的独立性检验,认为爱吃零食与性别有关B .根据小概率值α=0.05的独立性检验,认为爱吃零食与性别无关C .根据小概率值α=0.01的独立性检验,认为爱吃零食与性别有关D .根据小概率值α=0.1的独立性检验,认为爱吃零食与性别无关 解析:选A 零假设为H 0:是否爱吃零食与性别相互独立,即是否爱吃零食与性别无关.根据列联表中的数据,经计算得到 χ2=100×10×30-40×20250×50×30×70≈4.762>3.841=x 0.05,所以依据小概率值α=0.05的独立性检验,推断H 0不成立,即认为是否爱吃零食与性别有关.同理可得,根据小概率值α=0.01的独立性检验,认为爱吃零食与性别无关;根据小概率值α=0.1的独立性检验,认为爱吃零食与性别有关.8.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为y ^=0.66x +1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为( )A .83%B .72%C .67%D .66%解析:选A 将y ^=7.675代入回归方程,可计算得x ≈9.262,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.262≈0.83,即约为83%.二、多项选择题9.下列说法正确的是( )A .自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B .在线性经验回归模型中,相关系数r 的值越大,变量间的相关性越强C .在残差图中,残差点分布的水平带状区域的宽度越狭窄,其模型拟合的精度越高D .在经验回归模型中,R 2为0.98的模型比R 2为0.80的模型拟合的效果好解析:选ACD 由于线性相关系数|r |≤1,且当|r |越大,线性相关性越强,故r <0时,选项B 不正确,A 、C 、D 均正确.10.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,则下列结论正确的是( )A .y 与x 负相关且y ^=2.347x -6.423 B .y 与x 负相关且y ^=-3.476x +5.648 C .y 与x 正相关且y ^=5.437x +8.493 D .y 与x 正相关且y ^=-4.326x -4.578解析:选BC 正相关指的是y 随x 的增大而增大,负相关指的是y 随x 的增大而减小,故正确的为B 、C.11.以下关于线性经验回归的判断中,正确的选项为( )A .若散点图中所有点都在一条直线附近,则这条直线为经验回归直线B .散点图中的绝大多数都线性相关,个别特殊点不影响线性回归,如图中的A ,B ,C 点C .已知线性经验回归方程为y ^=0.50x -0.81,则x =25时,y 的估计值为11.69 D .线性经验回归方程的意义是它反映了样本整体的变化趋势解析:选BCD 能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数a ^,b ^得到的直线y ^=b ^x +a ^才是回归直线,所以A 错误;B 正确;将x =25代入y ^=0.50x -0.81,得y ^=11.69,所以C 正确;D 正确.12.有两个分类变量X 与Y ,其2×2列联表如下表所示:X Y 合计 Y =0 Y =1X =0 a20-a 20 X =115-a 30+a 45 合计155065其中a,15-a 均为大于5的整数,根据小概率值α=0.05的独立性检验,认为X 与Y 之间有关,则a 等于( )A .7B .8C .9D .6解析:选BC 根据小概率值α=0.05的独立性检验,认为X 与Y 之间有关,需要χ2的值大于或等于3.841,由χ2=65×[a 30+a -20-a15-a ]220×45×15×50=1313a -6025 400≥3.841,解得a ≥7.69或a ≤1.54.而a >5且15-a >5,a ∈Z , 所以a =8或a =9. 三、填空题13.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:吸烟量年龄合计不超过40岁 (Y =0)超过40岁 (Y =1) 不多于20支/天(X =0) 50 1565多于20支/天 (X =1) 10 25 35 合计6040100则χ2=________(保留到小数点后两位有效数字). 解析:由列联表知χ2=100×10×15-50×25260×40×65×35≈22.16.答案:22.1614.某高校“统计初步”课程的教师随机调查了选该课程的一些学生情况,具体数据如下表:性别专业非统计专业 (Y =0)统计专业 (Y =1) 男(X =0) 13 10 女(X =1)720为了判断主修统计专业是否与性别有关系,根据表中数据,得到χ2=50×13×20-10×7223×27×20×30≈4.844>3.841,所以能根据小概率值α=________,我们断定主修统计专业与性别有关系.解析:因为P (χ2≥3.841)=0.05,所以小概率值α=0.05. 答案:0.0515.下表是降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对应数据,根据表中提供的数据,求出y 关于x 的线性经验回归方程y ^=0.7x +0.35,那么表中m 的值为________.x3 4 5 6y2.5 m 4 4.5解析:根据所给的表格可以求出x -=3+4+5+64=4.5,y -=2.5+m +4+4.54=11+m 4,因为这组数据的样本点的中心在线性经验回归直线上, 所以11+m4=0.7×4.5+0.35,所以m =3.答案:3 四、解答题16.(12分)为做好2022年北京冬季奥运会的宣传工作,组委会计划从某大学选取若干名大学生志愿者,某记者在该大学随机调查了1 000名大学生,以了解他们是否愿意做志愿者工作,得到的数据如表所示:性别 是否愿意做志愿者 合计 愿意(Y =0)不愿意(Y =1)男(X =0)610 女(X =1)90 合计800(1)根据题意完成表格.(2)依据小概率值α=0.05的独立性检验,分析愿意做志愿者工作与性别是否有关? 参考公式及数据:χ2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d .P (χ2≥x α)0.10 0.05 0.01 x α2.7063.8416.635解:(1)性别 是否愿意做志愿者 合计 愿意(Y =0)不愿意(Y =1)男(X =0) 500 110 610 女(X =1) 300 90 390 合计8002001 000(2)零假设为H 0:愿意做志愿者工作与性别是相互独立,即愿意做志愿者工作与性别是无关的.根据列联表中的数据,经计算得到 χ2=1 000×500×90-110×3002610×390×800×200=3 000793≈3.783<3.841=x 0.05, 所以依据小概率值α=0.05的独立性检验,没有充分证据推断H 0不成立,即愿意做志愿者工作与性别是无关的.17.(12分)自从高中生通过高校自主招生可获得加分进入高校的政策出台后,自主招生越来越受到高中生家长的重视.某机构为了调查A 城市和B 城市的高中家长对于自主招生的关注程度,在这两个城市中抽取了100名高中生家长进行了调查,得到下表:城市高中家长是否关注合计关注(Y =0)不关注(Y =1)A 城高中家长(X =0)2050B 城高中家长(X =1) 20 合计100(1)完成上面的列联表;(2)根据上面列联表的数据,能否根据小概率值α=0.05的独立性检验,判断家长对自主招生关注与否与所处城市有关系;(3)为了进一步研究家长对自主招生的看法,该机构从关注的学生家长里面,按照分层随机抽样方法抽取了5人,并再从这5人里面抽取2人进行采访,求所抽取的2人恰好A ,B 两城市各一人的概率.参考公式:χ2=n ad -bc 2a +bc +d a +cb +d(其中n =a +b +c +d ).附表:P (χ2≥x α)0.10 0.05 0.010 x α2.7063.8416.635解:(1)列联表如下: 城市高中家长是否关注合计关注(Y =0) 不关注(Y =1)A 城高中家长(X =0)203050B 城高中家长(X =1) 30 20 50 合计 5050100(2)零假设为H 0:家长对自主招生关注与否与所处城市相互独立,即家长对自主招生关注与否与所处城市无关.根据列联表中的数据,经计算得到 χ2=100×20×20-30×30250×50×50×50=4>3.841.所以根据小概率值α=0.05的独立性检验,我们推断H 0不成立,即认为家长对自主招生的关注与否与所处城市是有关的.(3)关注的人共有50人,按照分层随机抽样的方法,A 城市2人,B 城市3人,从5人中抽取2人有C 25=10种不同的方法,A ,B 两城市各取一人有C 12C 13=2×3=6种不同的方法,故所抽取的2人恰好A ,B 两城市各一人的概率为C 13C 12C 25=610=0.6.B 卷——高考能力达标卷一、单项选择题1.下列属于相关关系的是( ) A .利息与利率 B .居民收入与储蓄存款 C .电视机产量与苹果产量 D .某种商品的销售额与销售价格解析:选B A 与D 是函数关系,C 中两变量没有关系,B 中居民收入与储蓄存款是相关的,但不具有函数关系.2.已知一个经验回归方程为y ^=1.5x +45,其中x 的取值依次为1,7,5,13,19,则y -=( )A .58.5B .46.5C .60D .75解析:选A x -=1+7+5+13+195=9,因为经验回归直线必过样本点的中心(x -,y -), 所以y -=1.5×9+45=13.5+45=58.5.3.已知每一吨铸铁成本y (元)与铸件废品率x %建立的经验回归方程y ^=56+8x ,则下列说法正确的是( )A .废品率每增加1%,成本每吨增加64元B .废品率每增加1%,成本每吨增加8%C .废品率每增加1%,成本每吨增加8元D .如果废品率增加1%,则每吨成本为56元解析:选C 根据经验回归方程知y 是关于x 的单调增函数,并且由系数知x 每增加一个单位,y 平均增加8个单位.4.某商品销售量y (件)与销售价格x (元/件)负相关,则其经验回归方程可能是( ) A .y =-10x +200 B .y =10x +200 C .y =-10x -200D .y =10x -200解析:选A 由于销售量y 与销售价格x 成负相关,故排除B 、D.又当x =10时,A 中y =100,而C 中y =-300,C 不符合题意.5.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的经验回归方程为y ^=0.85x -85.71,则下列说法错误的是( )A .y 与x 具有正的线性相关关系B .经验回归直线过样本点的中心C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg解析:选D 选项中,若该大学某女生身高为170 cm ,则可断定其体重约为0.85×170-85.71=58.79(kg).故D 选项错误.6.如图所示的是调查某地区男、女中学生喜欢理科的等高堆积条形图,阴影部分表示喜欢理科的百分比,从图中可以看出( )A .性别与喜欢理科无关B .女生中喜欢理科的比例约为80%C .男生比女生喜欢理科的可能性大些D .男生中不喜欢理科的比例约为60%解析:选C 由题图可知女生中喜欢理科的比例约为20%,男生中喜欢理科的比例约为60%,因此男生比女生喜欢理科的可能性大些.7.如图,5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( )A .相关系数r 变大B .残差平方和变大C .相关指数R 2变大D .解释变量x 与预报变量y 的相关性变强解析:选B 由散点图知,去掉D 后,x 与y 的相关性变强,且为正相关,所以r 变大,R 2变大,残差平方和变小.8.为考察数学成绩与物理成绩的关系,某老师在高二随机抽取了300名学生,得到下面的列联表:物理成绩数学成绩合计85~100分 (Y =0)85分以下 (Y =1) 85~100分(X =0) 37 85 122 85分以下(X =1)35 143 178 合计72228300 根据表中数据,分析数学成绩与物理成绩有关联的出错率不超过( ) A .0.5% B .1% C .0.1%D .5%解析:选D 由表中数据代入公式得 χ2=300×37×143-85×352122×178×72×228≈4.514>3.841=x 0.05,所以判断的出错率不超过5%. 二、多项选择题9.给出下列实际问题,其中用独立性检验可以解决的问题有( ) A .一种药物对某种病的治愈率 B .两种药物治疗同一种病是否有区别 C .吸烟得肺病的概率 D .吸烟与性别是否有关系答案:BD10.对于经验回归方程y ^=b ^x +a ^,下列说法正确的是( ) A .直线必经过点(x -,y -)B .x 增加1个单位时,y 平均增加b ^个单位 C .样本数据中x =0时,可能有y =a ^D .样本数据中x =0时,一定有y =a ^解析:选ABC 经验回归方程是根据样本数据得到的一个近似曲线,故由它得到的值也是一个近似值.11.下列说法中正确的有( ) A .若r >0,则x 增大时,y 也相应增大 B .若r <0,则x 增大时,y 也相应增大C .若r =1或r =-1,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上D .|r |越接近1,相关关系越强解析:选ACD 若r >0,表示两个相关变量正相关,x 增大时,y 也相应增大,故A 正确.r <0,表示两个变量负相关,x 增大时,y 相应减小,故B 错误.|r |越接近1,表示两个变量相关性越高,|r |=1表示两个变量有确定的关系(即函数关系),故C 正确,D 正确.12.根据如下样本数据:得到的经验回归方程为y =b x +a ,则( ) A.a ^>0 B.a ^<0 C.b ^>0D.b ^<0解析:选AD 根据题意,画出散点图(图略).根据散点图,知两个变量为负相关,且经验回归直线与y 轴的交点在y 轴正半轴,所以a ^>0,b ^<0.三、填空题13.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y 对总成绩x 的回归直线方程为y ^=6+0.4x .由此可以估计:若两名同学的总成绩相差50分,则他们的数学成绩大约相差________分.解析:令两人的总成绩分别为x 1,x 2.则对应的数学成绩估计为y ^1=6+0.4x 1,y ^2=6+0.4x 2,所以|y ^1-y ^2|=|0.4(x 1-x 2)|=0.4×50=20. 答案:2014.为了判断高三年级学生选修文科是否与性别有关,现随机抽取70名学生,得到如图所示2×2列联表:已知P (≈4.667,则在犯错误的概率不大于________的前提下认为选修文科与性别有关.解析:由题意知, χ2≈4.667,因为6.635>4.667>3.841,所以在犯错误的概率不大于0.05的前提下认为选修文科与性别有关.答案:0.0515.已知x ,y 之间的一组数据如下表,对于表中数据,甲、乙两同学给出的拟合直线分别为l 1:y =13x +1与l 2:y =12x +12,利用最小二乘法判断拟合程度更好的直线是______________.解析:用y =13x +1作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为:S 1=⎝⎛⎭⎪⎫1-432+(2-2)2+(3-3)2+⎝⎛⎭⎪⎫4-1032+⎝⎛⎭⎪⎫5-1132=73.用y =12x +12作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为:S 2=(1-1)2+(2-2)2+⎝⎛⎭⎪⎫3-722+(4-4)2+⎝⎛⎭⎪⎫5-922=12. 因为S 2<S 1,故用直线l 2:y =12x +12拟合程度更好.答案:y =12x +12四、解答题16.(12分)微信是现代生活进行信息交流的重要工具,某公司200名员工中90%的人使用微信,其中每天使用微信时间在一小时以内的有60人,其余的员工每天使用微信的时间在一小时以上.若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,则使用微信的人中75%是青年人.如果规定每天使用微信时间在一小时以上为经常使用微信,那么经常使用微信的员工中,中年人有40人.(1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,请完成下面的2×2列联表;使用微信 年龄合计青年人(Y =0)中年人(Y =1)经常使用微信 (X =0)不经常使用微信(X =1) 合 计(2)根据列联表中的数据,依据小概率值α=0.001的独立性检验分析该公司经常使用微信的员工与年龄的关系.解:(1)由已知可得,该公司员工中使用微信的有200×90%=180(人). 经常使用微信的有180-60=120(人), 使用微信的人中青年人有180×75%=135(人), 故2×2列联表如下:使用微信 年龄合计青年人(Y =0)中年人(Y =1)经常使用微信 (X =0) 8040120不经常使用微信(X =1) 55 5 60 合 计 13545180(2)零假设为H 0:该公司经常使用微信的员工与年龄相互独立,即该公司经常使用微信的员工与年龄无关.将列联表中的数据代入公式可得, χ2=180×80×5-40×552135×45×120×60≈13.333>10.828=x 0.001,所以根据小概率值α=0.001的独立性检验,我们推断H 0不成立,即认为该公司经常使用微信的员工与年龄有关.17.(12分)淘宝网卖家在某商品的所有买家中,随机选择男女买家各50位进行调查,他们的评分等级如下:评分等级 [0,1] (1,2] (2,3] (3,4] (4,5] 女/人 2 7 9 20 12 男/人 3918128(1)从评分等级为(4,5]的人中随机选取2人,求恰有1人是男性的概率;(2)规定:评分等级在[0,3]为不满意该商品,在(3,5]为满意该商品.完成下面列联表,并根据小概率值α=0.05的独立性检验,分析性别与对商品满意度是否有关.性别评分等级合计满意该商品 (Y =0)不满意该商品(Y =1)女(X =0) 男(X =1) 合计解:(1)因为从评分等级(4,5]的20人中随机选取2人,共有C 220=190种选法,其中恰有1人为男性的共有C 112C 18=96种选法,所以所求概率P =96190=4895.(2)列联表如下:性别评分等级合计满意该商品 (Y =0)不满意该商品(Y =1) 女(X =0) 32 18 50 男(X =1) 20 30 50 合计5248100 零假设为H 0:性别与对商品满意度相互独立,即性别与对商品满意度无关.由公式得χ2=100×32×30-20×18250×50×52×48≈5.769>3.841=x 0.05,所以根据小概率值α=0.05的独立性检验,我们推断H 0不成立,即可以认为性别与对商品满意度有关.。

必修3第6章统计(含单元测试)参考答案

必修3第6章统计(含单元测试)参考答案

实用文档必修3 第6章 统计 参考答案6.1.1 简单随机抽样1.C 2.C 3.A 4.抽签法,随机数表法,向上、向下、向左、向右5.21 6.60,30 7.相等,Nn 8.略 9.(1)不是简单随机抽样,由于被抽取样本的总体的个数是无限的而不是有限的。

(2)不是简单随机抽样,由于它是放回抽样10.选法二不是抽签法,因为抽签法要求所有的签编号互不相同,而选法二中39个白球无法相互区分。

这两种选法相同之处在于每名学生被选中的概率都相等,等于401。

6.1.2 系统抽样1.A 2.B 3.B 4.B 5.A 、B 、D 6. 200450 7.(一)简单随机抽样(1) 将每一个人编一个号由0001至1003;(2) 制作大小相同的号签并写上号码;(3) 放入一个大容器,均匀搅拌;(4)依次抽取10个号签具有这十个编号的人组成一个样本。

(二)系统抽样(1)将每一个人编一个号由0001至1003;(2)选用随机数表法找3个号,将这3个人排除;(3)重新编号0001至1000;(4)在编号为0001至0100中用简单随机抽样法抽得一个号L;(5)按编号将:L,100+L,…,900+L共10个号选出。

这10个号所对应的人组成样本。

8.系统抽样适用于总体中的个体数较多的情况;系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段进行抽样时,采用的是简单随机抽样;与简单随机抽样相同的是,系统抽样也属于等可能抽样。

9.是用系统抽样的方法确定的三等奖号码的,共有100个。

10.略(参考第7小题)6.1.3 分层抽样实用文档Nm1.B 2.B 3.104 4.n5.70,80 6.系统抽样,100个7.总体中的个体个数较多,差异不明显;总体由差异明显的几部分组成中年:200人;青年:120人;老年:80人8.分层抽样,简单随机抽样9.因为总体共有彩电3000台,数量较大,所以不宜采用简单随机抽样,又由于三种彩电的进货数量差异较大,故也不宜用系统方法,而以分层抽样为妥。

高中数学单元训练3统计三含解析北师大版必修3

高中数学单元训练3统计三含解析北师大版必修3

A.B.C.D.hmhmmhm,hA.B.C.D.200h,1000〔a,b90km/hB.200A.100 C.300 D.390^XiK.III.Xn : h, 'y1.y2JH.ym' k,A.B.C.2nh mkm nnk mhm n高中数学m n5、为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查 ,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异 ,而男女生视力情况差异不大•在下面的抽样方法中,最合理的抽样方法是( )A.简单的随机抽样 B.按性别分层抽样 C.按学段分层抽样D.系统抽样6、现从100件产品中随机抽出10件进行质量检测,下列说法中正确的是( )A.100件产品是总体B.10件产品是样本C.样本容量为100D.样本容量为107、下列抽样方式是简单随机抽样的是( )A.某工厂从老年、中年、青年职工中按 2:5:3的比例选取职工代表B. 某班45名同学,指定个子高的5名同学参加学校组织的某项活动C. 齐鲁福利彩票用摇奖机摇奖D. 规定凡买到的明信片的最后四位号码是“ 6637”的人获得三等奖 8、某学校随机抽取 20个班,调查各班中有网上购物经历的人数 示。

以组距为 5将数据分组成[0,5),[5,10),…,[30,35),[35,40] 图是()答案1. C解析:b -a 是组距,在频率分布直方图中,(频率/组距)是表示该组的小矩形的高 h ,所以,所得数据的茎叶图如图所时,所作的频率分布直方b「a, C.3. D90km / h(0.03+0.009『10 = 0.39, 0.39X000=390 ( ), D.4. Bnh mk,nh mk n m5.C6.D5100510100, 10, D.7.CC.8.A20, 5高中数学频率方法二:由茎叶图知落在区间[0,5)与[5,10)上的频数相等,故频率、违P也分别相等。

必修3第6章统计(含单元测试)参考答案

必修3第6章统计(含单元测试)参考答案

必修3 第6章 统计 参考答案6.1.1 简单随机抽样1.C 2.C 3.A 4.抽签法,随机数表法,向上、向下、向左、向右5.21 6.60,30 7.相等,Nn 8.略 9.(1)不是简单随机抽样,由于被抽取样本的总体的个数是无限的而不是有限的。

(2)不是简单随机抽样,由于它是放回抽样10.选法二不是抽签法,因为抽签法要求所有的签编号互不相同,而选法二中39个白球无法相互区分。

这两种选法相同之处在于每名学生被选中的概率都相等,等于401。

6.1.2 系统抽样1.A 2.B 3.B 4.B 5.A 、B 、D 6.200450 7.(一)简单随机抽样(1) 将每一个人编一个号由0001至1003;(2) 制作大小相同的号签并写上号码;(3) 放入一个大容器,均匀搅拌;(4) 依次抽取10个号签具有这十个编号的人组成一个样本。

(二)系统抽样(1) 将每一个人编一个号由0001至1003;(2) 选用随机数表法找3个号,将这3个人排除;(3) 重新编号0001至1000;(4) 在编号为0001至0100中用简单随机抽样法抽得一个号L ;(5) 按编号将:L ,100+L ,…,900+L 共10个号选出。

这10个号所对应的人组成样本。

8.系统抽样适用于总体中的个体数较多的情况;系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段进行抽样时,采用的是简单随机抽样;与简单随机抽样相同的是,系统抽样也属于等可能抽样。

9.是用系统抽样的方法确定的三等奖号码的,共有100个。

10.略(参考第7小题)6.1.3 分层抽样1.B 2.B 3.104 4.nNm 5.70,80 6.系统抽样,100个7.总体中的个体个数较多,差异不明显;总体由差异明显的几部分组成中年:200人;青年:120人;老年:80人8.分层抽样,简单随机抽样9.因为总体共有彩电3000台,数量较大,所以不宜采用简单随机抽样,又由于三种彩电的进货数量差异较大,故也不宜用系统方法,而以分层抽样为妥。

(好题)高中数学必修三第一章《统计》检测(答案解析)(3)

(好题)高中数学必修三第一章《统计》检测(答案解析)(3)

一、选择题1.某商场为了了解毛衣的月销售量y(件)与月平均气温x(C︒)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:︒171382月平均气温x C月销售量y(件)24334055由表中数据算出线性回归方程y bx a=+中的2b=-,气象部门预测下个月的平均气温为6C︒,据此估计该商场下个月毛衣销售量约为()A.58件B.40件C.38件D.46件2.为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如下图),已知从左到右各长方形高的比为2:3:5:6:3:1,则该班学生数学成绩在(80,100)之间的学生人数是()A.32 B.27 C.24 D.333.为了解一片经济树林的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出样本的频率分布直方图如图所示.那么在这100株树木中,底部周长小于110cm的株数n是()A .30B .60C .70D .804.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,85.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+6.在一个容量为5的样本中,数据均为整数,已测出其平均数为8,但墨水污损了后面两个数据,其中一个数据的十位数字1未污损,即5,7,8, ,那么这组数据的方差2s 可能的最大值是( ) A .185B .18C .36D .67.有一个容量为200的样本,样本数据分组为[50,70),[70,90),[90,110),[110,130),[130,150),其频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在区间[90,110)内的频数为( )A .48B .60C .64D .728.某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是 A .8号学生B .200号学生C .616号学生D .815号学生9.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9C .y =1.9x +1.04D .y =1.05x -0.910.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数( )A .40B .45C .48D .5011.已知一组数据12,,,n x x x 的平均数3x =,则数据1232,32,,32n x x x +++的平均数为( ) A .3B .5C .9D .1112.下列说法:①设有一个回归方程35y x =-,变量x 增加一个单位时,y 平均增加5个单位;②线性回归直线ˆybx a =+必过必过点(),x y ;③在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病;其中错误的个数是( ) A .0B .1C .2D .3二、填空题13.东汉·王充《论衡·宜汉篇》:“且孔子所谓一世,三十年也.”,清代·段玉裁《说文解字注》:“三十年为一世.按父子相继曰世”.“一世”又叫“一代”,到了唐朝,为了避李世民的讳,“一世”方改为“一代”,当代中国学者测算“一代”平均为25年.另据美国麦肯锡公司的研究报告显示,全球家庭企业的平均寿命其实只有24年,其中只有约30%的家族企业可以传到第二代,能够传到第三代的家族企业数量为总量的13%,只有5%的家族企业在第三代后还能够继续为股东创造价值.根据上述材料,可以推断美国学者认为“一代”应为__________年.14.上海市普通高中学业水平等级考成绩共分为五等十一级,各等级换算成分数如表所示:上海某高中2018届高三()1班选考物理学业水平等级考的学生中,有5人取得A +成绩,其他人的成绩至少是B 级及以上,平均分是64分,这个班级选考物理学业水平等级考的人数至少为______人. 15.已知由样本数据集合(){}11,1,2,3,...,x y i n =,求得的回归直线方程为1.2308ˆ.0y x =+,且ˆ4x =,若去掉两个数据点 (4.1,5.7)和(3.9,4.3)后重新求得的回归直线方程l 的斜率估计值为1.2,则此回归直线l 的方程为_______.16.数据1x ,2x ,…,n x 的平均数是3,方差是1,则数据15x -,25x -,…,5n x -的平均数和方差之和是__________.17.设一个回归方程为0.4 1.8y x =-,则当25x =时,y 的估计值是_______. 18.已知某人连续5次射击的环数分别是8,9,10,x ,8,若这组数据的平均数是9,则这组数据的方差为 .19.已知一组数据为2,3,4,5,6,则这组数据的方差为______.20.某校高三年级共有800名学生,现采用系统抽样的方法,抽取25名学生做问卷调查,将这800名学生按1,2,...,800随机编号,按编号顺序平均分组.若从第5组抽取的编号为136,则从第2组中抽取的编号为__________.三、解答题21.“湖广熟,天下足”,鱼米之乡的湖北是全国重要的农产品生产地.而受疫情影响,像莲藕、小龙虾等湖北很多优质农副产品近期都面临销售难题.为了让淜北尽快恢复正常,央视主持人朱广权化身直播带货官,和网红们一起为湖北产品做公益直播.在为湖北某地区的小龙虾进行带货时,需大致了解该地区小龙虾的产量,通过调查发现湖北某地区近几年的小龙虾产量统计如下表:(1)根据表中数据,建立关于t 的线性回归方程y bt a =+; (2)请你根据线性回归方程预测今年(2020年)该地区小龙虾的年产量.附:对于一组数据()11,t y ,()22,t y ,…,(),n n t y ,其回归直线y bt a =+的斜率和截距的最小二乘估计分别为:()()()121ˆniii ni i t t y y bt t ==--=-∑∑,a y bt =-.(参考数据:()()616.3ii i tty y =--=∑)22.班主任为了对本班学生的考试成绩进行分析,决定从本班24名女同学,18名男同学中随机抽取一个容量为7的样本进行分析.(1)如果按照性别比例分层抽样,可以得到多少个不同的样本?(写出算式即可,不必计算出结果)(2)如果随机抽取的7名同学的数学,物理成绩(单位:分)对应如下表:①若规定85分以上(包括85分)为优秀,从这7名同学中抽取3名同学,记3名同学中数学和物理成绩均为优秀的人数为ξ,求ξ的分布列和数学期望;②根据上表数据,求物理成绩y 关于数学成绩x 的线性回归方程(系数精确到0.01);若班上某位同学的数学成绩为96分,预测该同学的物理成绩为多少分? 附:线性回归方程y bx a =+,其中121()()()niii nii x x y y b x x ==--=-∑∑,a y bx =-.23.某地级市共有200000中学生,其中有7%学生在2017年享受了“国家精准扶贫”政策,在享受“国家精准扶贫”政策的学生中困难程度分为三个等次:一般困难、很困难、特别困难,且人数之比为5:3:2,为进一步帮助这些学生,当地市政府设立“专项教育基金”,对这三个等次的困难学生每年每人分别补助1000元、1500元、2000元.经济学家调查发现,当地人均可支配年收入较上一年每增加%n ,一般困难的学生中有3%n 会脱贫,脱贫后将不再享受“精准扶贫”政策,很困难的学生有2%n 转为一般困难学生,特别困难的学生中有%n 转为很困难学生.现统计了该地级市2013年到2017年共5年的人均可支配年收入,对数据初步处理后得到了如图所示的散点图和表中统计量的值,其中年份x 取13时代表2013年,x 取14时代表2014年,……依此类推,且x 与y (单位:万元)近似满足关系式y x βα=+.(2013年至2019年该市中学生人数大致保持不变)y521()ii yy =-∑51()()iii x x y y =--∑0.8 3.11(1)估计该市2018年人均可支配年收入为多少万元?(2)试问该市2018年的“专项教育基金”的财政预算大约为多少万元?附:对于一组具有线性相关关系的数据11(,)u υ,22(,)u υ,…,(,)n n u υ,其回归直线方程u υβα=+的斜率和截距的最小二乘估计分别为121()()()niii nii u u uu υυβ==--=-∑∑,u αυβ=-.24.为培养学生在高中阶段的数学能力,某校将举行数学建模竞赛.已知该竞赛共有60名学生参加,他们成绩的频率分布直方图如图所示.(1)估计这60名参赛学生成绩的中位数;(2)为了对数据进行分析,将60分以下的成绩定为不合格.60分以上(含60分)的成绩定为合格,某评估专家决定利用分层抽样的方法从这60名学生中选取10人,然后从这10人中抽取4人参加座谈会,记ξ为抽取的4人中,成绩不合格的人数,求ξ的分布列与数学期望;(3)已知这60名学生的数学建模竞赛成绩Z 服从正态分布()2,Nμσ,其中μ可用样本平均数近似代替,2σ可用样本方差近似代替(同一组数据用该区间的中点值作代表),若成绩在46分以上的学生均能得到奖励,本次数学建模竞赛满分为100分,估计此次竞赛受到奖励的人数(结果根据四舍五人保留整数).参考数据:()0.6827P Z μσμσ-<≤+≈,()220.9545P Z μσμσ-<≤+≈,()330.9973P Z μσμσ-<≤+≈.25.为研究冬季昼夜温差大小对某反季节大豆新品种发芽率的影响,某校课外兴趣小组记录了5组昼夜温差与100颗种子发芽数,得到如下资料: 组号 12 3 4 5 温差x (C ︒) 10 11 13 12 8 发芽数y (颗)2325302616经分析,这组数据具有较强的线性相关关系,因此该小组确定的研究方案是:先从这五组数据中选取3组数据求出线性回归方程,再用没选取的2组数据进行检验.(1)若选取的是第2,3,4组的数据,求出y 关于x 的线性回归方程ˆˆˆybx a =+; (2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?(参考公式:()()()1122211ˆnni i i i i i nn i i i i x x y y x y nxy bx x x nx====---==--∑∑∑∑,ˆˆay bx =-) 26.某“双一流”大学专业奖学金是以所学专业各科考试成绩作为评选依据,分为专业一等奖学金(奖金额3000元)、专业二等奖学金(奖金额1500元)及专业三等奖学金(奖金额600元),且专业奖学金每个学生一年最多只能获得一次.图(1)是统计了该校2018年500名学生周课外平均学习时间频率分布直方图,图(2)是这500名学生在2018年周课外平均学习时间段获得专业奖学金的频率柱状图.(Ⅰ)求这500名学生中获得专业三等奖学金的人数;(Ⅱ)若周课外平均学习时间超过35小时称为“努力型”学生,否则称为“非努力型”学生,列22⨯联表并判断是否有99.9%的把握认为该校学生获得专业一、二等奖学金与是否是“努力型”学生有关?(Ⅲ)若以频率作为概率,从该校任选一名学生,记该学生2018年获得的专业奖学金额为随机变量X ,求随机变量X 的分布列和期望.22()()()()()n ad bc K a b c d a c b d -=++++【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】试题分析:由表格得(),x y 为:()10,38,因为(),x y 在回归方程y bx a =+上且2b =-,()38102a ∴=⨯-+,解得58a =∴2ˆ58y x =-+,当6x =时,26ˆ5846y=-⨯+=,故选D. 考点:1、线性回归方程的性质;2、回归方程的应用.2.D解析:D 【详解】高的比就是频率的比,所以各区间上的频率可依次设为2x,3x,5x,6x,3x,x,,同它们的和为1235631,20x x x x x x x +++++=∴=,所以该班学生数学成绩在[80,100)之间的学生人数是1(56)6011603320x +⨯⨯=⨯⨯=,故选D 3.C解析:C 【解析】解:由图可知:则底部周长小于110cm 段的频率为(0.01+0.02+0.04)×10=0.7, 则频数为100×0.7=70人. 故选C .4.D解析:D 【分析】根据平均数的性质,方差的性质直接运算可得结果. 【详解】令23(1,2,,5)i i y x i =-=1234555x x x x x x ++++==,1234523232323232310375x x x x x y x -+-+-+-+-∴==-=-=,(也可()(23)2()32537E y E x E x =-=-=⨯-=) ()()()2y 232428D D x D x =-==⨯=故选:D 【点睛】本题主要考查方差及平均值的性质的简单应用,属于中档题.5.D解析:D 【分析】根据散点图的分布可选择合适的函数模型. 【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+. 故选:D. 【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.6.C解析:C 【分析】设出最后两个数,然后根据已知条件列方程,求得方程2s 的表达式,根据表达式的结构求得2s 的最大值. 【详解】设这组数据的最后2个分别是10x +,y 则5781085x y +++++=⨯, 得10x y +=,故10y x =-.∴()222211910(2)(2)21855s x x x ⎡⎤=+++++-=+⎣⎦, 显然当9x =时,2s 最大,最大为36. 故选:C 【点睛】本小题主要考查平均数和方差的计算,考查方程的思想,属于基础题.7.B解析:B 【分析】由(0.00500.00750.01000.0125)201a ++++⨯=,求出a ,计算出数据落在区间[90,110)内的频率,即可求解.【详解】由(0.00500.00750.01000.0125)201a ++++⨯=, 解得0.015a =,所以数据落在区间[90,110)内的频率为0.015200.3⨯=, 所以数据落在区间[90,110)内的频数2000.360⨯=, 故选B. 【点睛】本题主要考查了频率分布直方图,频率、频数,属于中档题.8.C解析:C 【分析】等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案. 【详解】详解:由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{}n a ,公差10d =,所以610n a n =+()n *∈N ,若8610n =+,则15n =,不合题意;若200610n =+,则19.4n =,不合题意; 若616610n =+,则61n =,符合题意;若815610n =+,则80.9n =,不合题意.故选C . 【点睛】本题主要考查系统抽样.9.B解析:B 【解析】分析:根据所给的这组数据,取出这组数据的样本中心点,把样本中心点代入所给的四个选项中验证,若能够成立的只有一个,这一个就是回归直线方程. 详解:123+4=2.54x ++=, 3 3.8 5.264.5,4y +++==∴这组数据的样本中心点是(2.5,4.5)把样本中心点代入四个选项中,只有y =1.04x +1.9成立, 故选B.点睛:这是一道关于考查回归直线方程的题目,关键掌握回归直线必过样本中心点的特点,首先分析题目,由四组数据可得,x y ,进而得到样本中心点的坐标,接下来根据回归直线必过样本中心点,即可解答此题.10.C解析:C 【分析】根据频数关系,求出前三段每段的频数,由直方图求出四五组的频率,进而求出前三组的频率和,从而可求该校报名学生的总人数. 【详解】从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,∴从左到右3个小组的频数分别为6,12,18,共有36人,第4,5小组的频率之和为()0.03750.012550.25+⨯=, 则前3小组的频率之和为10.250.75-=, 则该校报名学生的总人数为360.7548÷=,故选C. 【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标相乘后求和可得平均值;(4)直观图左右两边面积相等处横坐标表示中位数.11.D解析:D 【解析】分析:一组数据中的每一个数加或减一个数,它的平均数也加或减这个数;;依此规律求解即可.详解::∵一组数据12,,,n x x x 的平均数为3, ∴另一组数据1232,32,,32n x x x +++的平均数121211323232[32]33211n n x x x x x x n n n=++++⋯++=++⋯++=⨯+=()(), 故选D.点睛:本题考查了平均数,平均数是指在一组数据中所有数据之和再除以数据的个数.它是反映数据集中趋势的一项指标.12.C解析:C 【解析】分析:利用回归方程和独立性检验对每一个命题逐一判断.详解:对于①,一个回归方程35y x =-,变量x 增加一个单位时,y 应平均减少5个单位,所以该命题是错误的;对于②,线性回归直线ˆybx a =+必过必过点(),x y ,是正确的;对于③,在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,并不能说明他有99%的可能患肺病,所以该命题是错误的. 故答案为:C.点睛:本题主要考查回归方程和独立性检验,意在考查学生对这些知识的掌握水平和分析推理能力.二、填空题13.20【分析】设美国学者认为的一代为年然后可得出寿命在的家族企业的频率分别为然后利用平均数公式列方程解出的值即可得出所求结果【详解】设美国学者认为的一代为年然后可得出寿命在的家族企业的频率分别为则家族解析:20 【分析】设美国学者认为的一代为x 年,然后可得出寿命在(]0,x 、(],2x x 、(]2,3x x 、(]3,4x x 的家族企业的频率分别为0.52、0.3、0.13、0.05,然后利用平均数公式列方程解出x 的值,即可得出所求结果. 【详解】设美国学者认为的一代为x 年,然后可得出寿命在(]0,x 、(],2x x 、(]2,3x x 、(]3,4x x 的家族企业的频率分别为0.52、0.3、0.13、0.05, 则家族企业的平均寿命为0.5(10.30.130.05) 1.50.3 2.50.13 3.50.0512.124x x x x x ⨯---+⨯+⨯+⨯==,解得20x ≈,因此,美国学者认为“一代”应为20年,故答案为20. 【点睛】本题考查平均数公式的应用,解题的关键要审清题意,将题中一些关键信息和数据收集起来,结合相应的条件或公式列等式或代数式进行求解,考查运算求解能力,属于中等题.14.15【解析】【分析】设取得A 成绩的x 人取得成绩的y 人取得B 成绩的z 人由题意可得:解得:结合xy 可求的最【详解】设取得A 成绩的x 人取得成绩的y 人取得B 成绩的z 人则即又xy 即当且仅当时取得最小值15取得解析:15 【解析】 【分析】设取得A 成绩的x 人,取得B +成绩的y 人,取得B 成绩的z 人,由题意可得:()70567x 64y 61z 645x y z ⨯+++=⨯+++,解得:z x 10-=,结合x ,y ,z N ∈,可求5x y z +++的最. 【详解】设取得A 成绩的x 人,取得B +成绩的y 人,取得B 成绩的z 人, 则()70567x 64y 61z 645x y z ⨯+++=⨯+++, 即z x 10-=, 又x ,y ,z N ∈,即当且仅当x 0=,y 0=,z 10=时,5x y z +++取得最小值15, 取得A 成绩的0人,取得B +成绩的0人,取得B 成绩的10人, 这个班级选考物理学业水平等级考的人数至少为15人, 故答案为15 【点睛】本题考查了实际问题通过数学问题解决,考查了阅读理解及数学建模的能力,属中档题.15.【解析】【分析】由题意求出样本中心点然后求解新的样本中心利用回归直线的斜率估计值为求解即可得到答案【详解】有样本数据点集合求得的回归直线方程为且去掉两个数据点和重新求得的回归直线的斜率估计值为回归直解析: 1.20.2y x ∧=+. 【解析】 【分析】由题意求出样本中心点,然后求解新的样本中心,利用回归直线l 的斜率估计值为1.2,求解即可得到答案 【详解】 有样本数据点集合(){}11123,...,x y i n =,,,,求得的回归直线方程为 1.2308ˆ.0y x =+,且ˆ4x=, 1.2340.0ˆ85y=⨯+=, 去掉两个数据点()4.15.7,和()3.94.3,,ˆ4x =,ˆ5y =, 重新求得的回归直线l 的斜率估计值为1.2,回归直线方程设为 1.2ˆyx a =+,代入()45,,解得0.2a = ∴回归直线l 的方程为 1.2.2ˆ0y x =+ 故答案为 1.2.2ˆ0yx =+ 【点睛】本题主要考查的是数据的回归直线方程,利用回归直线方程恒过样本中心点是关键。

人教A版必修3统计单元测试(三套含解析)

人教A版必修3统计单元测试(三套含解析)

(一)一、选择题(共12小题,每小题5.0分,共60分)1.有下列关系:(1)人的年龄与他(她)体内脂肪含量之间的关系;(2)曲线上的点与该点的坐标之间的关系;(3)红橙的产量与气候之间的关系;(4)学生与他(她)的学号之间的关系.其中有相关关系的是()A. (1)(2)B. (1)(3)C. (1)(4)D. (3)(4)2.在抽样过程中,每次抽取的个体不再放回总体的为不放回抽样.在简单随机抽样、系统抽样、分层抽样中,为不放回抽样的有()A. 1个B. 2个C. 3个D. 0个3.为调查某中学学生平均每人每天参加体育锻炼时间X(单位:分钟),按锻炼时间分下列四种情况统计:①0~10分钟;②10~20分钟;③20~30分钟;④30分钟以上.有2 000名中学生参加了此项活动.下表是此次调查中的频数分布表.国家规定中学生每天参加体育锻炼时间达到30分钟以上者,才能保持良好健康的身体发展,则平均每天保持良好健康的身体发展的学生的频率是()A. 0.1B. 0.2C. 0.3D. 0.44.在由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的点所构成的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-2x+1上,则这组样本数据中变量x,y的相关系数为()A.-2B.-1C. 1D. 25.已知具有线性相关的两个变量x,y之间的一组数据如表:且线性回归方程是错误!未找到引用源。

=0.95x+2.6,则t等于()A. 6.7B. 6.6C. 6.5D. 6.46.如图是甲、乙两名运动员某赛季6个场次得分的茎叶图,用错误!未找到引用源。

甲、错误!未找到引用源。

乙分别表示甲乙得分的平均数,则下列说法正确的是()A.错误!未找到引用源。

甲>错误!未找到引用源。

乙且甲得分比乙稳定B.错误!未找到引用源。

甲=错误!未找到引用源。

乙且乙得分比甲稳定C.错误!未找到引用源。

(好题)高中数学必修三第一章《统计》测试题(包含答案解析)(1)

(好题)高中数学必修三第一章《统计》测试题(包含答案解析)(1)

一、选择题1.为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如下图),已知从左到右各长方形高的比为2:3:5:6:3:1,则该班学生数学成绩在(80,100)之间的学生人数是( )A .32B .27C .24D .332.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元3.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+4.某赛季甲、乙两名篮球运动员每场比赛得分用茎叶图表示,茎叶图中甲得分的部分数据丢失(如图),但甲得分的折线图完好,则下列结论正确的是( )A .甲得分的极差是11B .乙得分的中位数是18.5C .甲运动员得分有一半在区间[]20,30上D .甲运动员得分的平均值比乙运动员得分的平均值高5.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差D .极差6.某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则42x y +的值是( )A .12B .14C .16D .187.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( ) x 8 10 11 12 14 y2125m2835A .26B .27C .28D .298.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .9.已知某8个数的平均数为3,方差为2,现加入一个新数据3,此时这9个数的平均数为x ,方差为2s ,则( ) A .3x =,22s < B .3x =,22s > C .3x >,22s <D .3x >,22s >10.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( ) A .10B .11C .12D .1311.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位12.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为 A .12B .14C .16D .18二、填空题13.如图是某地区2018年12个月的空气质量指数以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述正确的是______.①2月相比去年同期变化幅度最小,3月的空气质量指数最高;②第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小; ③第三季度空气质量指数相比去年同期变化幅度的方差最小; ④空气质量指数涨幅从高到低居于前三位的月份为6、8、4月.14.水痘是一种传染性很强的病毒性疾病,容易在春天爆发,武汉疾控中心为了调查某高校高一年级学生注射水痘疫苗的人数,在高一年级随机抽取了5个班级,每个班级的人数互不相同,若把每个班抽取的人数作为样本数据,已知样本平均数为5,样本方差为4,则样本数据中最大值为__________.15.已知一组数据6,7,8,x ,y 的平均数是8,且90xy =,则该组数据的方差为_______. 16.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________. 17.给出下列命题:①若函数()y f x =满足(1)(1)f x f x -=+,则函数()f x 的图象关于直线1x =对称; ②点(2,1)关于直线10x y -+=的对称点为(0,3);③通过回归方程y bx a =+可以估计和观测变量的取值和变化趋势;④正弦函数是奇函数,2()sin(1)f x x =+是正弦函数,所以2()sin(1)f x x =+是奇函数,上述推理错误的原因是大前提不正确. 其中真命题的序号是__________.18.某校对全校1200名男女学生进行健康调查,采用分层抽样法抽取一个容量为200的样本,已知女生抽了95人,则该校的男生数是__________.19.已知某产品连续4个月的广告费i x (千元)与销售额i y (万元)(1,2,3,4i =),经过对这些数据的处理,得到如下数据信息:①441118,14ii i i xy ====∑∑;②广告费用x 和销售额y 之间具有较强的线性相关关系;③回归直线方程y bx a =+中的0.8b =. 那么广告费用为6千元时,则可预测销售额约为__________万元.20.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b+的最小值为__________.三、解答题21.某北方村庄4个草莓基地,采用水培阳光栽培方式种植的草莓个大味美,一上市便成为消费者争相购买的对象.光照是影响草莓生长的关键因素,过去50年的资料显示,该村庄一年当中12个月份的月光照量X (小时)的频率分布直方图如下图所示(注:月光照量指的是当月阳光照射总时长).(1)求月光照量X (小时)的平均数和中位数;(2)现准备按照月光照量来分层抽样,抽取一年中的4个月份来比较草莓的生长状况,问:应在月光照量[160,240)X ∈,[240,320)X ∈,[320,400]X ∈的区间内各抽取多少个月份?(3)假设每年中最热的5,6,7,8,9,10月的月光照量X 是大于等于240小时,且6,7,8月的月光照量X 是大于等于320小时,那么,从该村庄2018年的5,6,7,8,9,10这6个月份之中随机抽取2个月份的月光照量进行调查,求抽取到的2个月份的月光照量X (小时)都不低于320的概率.22.潜叶蝇是南方地区水稻容易遭受的虫害之一,成虫将虫卵产在叶片里,待虫卵孵化之后幼虫会在叶片中啃叶肉,使得秧苗的叶片呈现白色的状态,进而降低水稻产量.经研究,每只潜叶蝇的平均产卵数y 和夏季平均温度x 有关,现收集了某地区以往6年的数据,得到下面数据统计表格. 平均温度C i x ︒ 21 23 25 27 29 31 平均产卵数i y 个711212264115(Ⅰ)根据相关系数r 判断,潜叶蝇的平均产卵数y 与平均温度x 是否具有较强的线性相关关系,若有较强的线性相关关系,求出线性回归方程y bx a =+,若没有较强的线性相关关系,请说明理由(一般情况下,当0.75r >时,可认为变量有较强的线性相关关系);(Ⅱ)根据以往的统计,该地区夏季平均气温为()C ξ︒近似地服从正太分布()226.5,N σ,且()125282P ξ<≤=.当该地区某年平均温度达到28C ︒以上时,潜叶蝇快速繁殖引发虫害,需要进行一次人工治理,每次的人工治理成本为200元/公顷(其他情况均不需要人工治理),且虫害一定会导致水稻减产,对过往10次爆发虫害时的减产损失进行统计,结果如下: 每次虫害减产损失(元/公顷)10001400用样本的频率估计概率,预测未来2年,每公顷水稻可能因潜叶蝇虫害造成的经济损失Y (元)的数学期望.(经济损失=减产损失+治理成本) 参考公式和数据:()()ni i x xy yr --=∑()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-()()61700iii x x y y =--=∑,6214126ii x==∑,61240i i y==∑,()6218816i i y y=-=∑,8.4≈786≈.23. 2.5PM 是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与 2.5PM 的浓度是否相关,现采集到某城市周一至周五某时间段车流量与2.5PM 浓度的数据如下表:(1)根据上表数据,求出这五组数据组成的散点图的样本中心坐标; (2)用最小二乘法求出y 关于x 的线性回归方程y bx a =+;(3)若周六同一时间段车流量是100万辆,试根据(2)求出的线性回归方程预测,此时2.5PM 的浓度是多少?(参考公式:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-)24.经销商小王对其所经营的某一型号二手汽车的使用年数(010)x x <≤与销售价格y (单位:万元/辆)进行整理,得到如下的对应数据: (1)试求y 关于x 的回归直线方程;(2)已知每辆该型号汽车的收购价格为20.05 1.7517.2=-+w x x 万元,根据(1)中所求的回归方程,预测x 为何值时,小王销售一辆该型号汽车所获得的利润z 最大.附:回归方程ˆybx a =+中,1221ˆˆˆˆ,ni ii nii x ynx y b ay bx xnx -=-==--∑∑ 25.某校为了了解甲、乙两班的数学学习情况,从两班各抽出10名学生进行数学水平测试,成绩如下(单位:分):甲班:82 84 85 89 79 80 91 89 79 74 乙班:90 76 86 81 84 87 86 82 85 83 (1)求两个样本的平均数; (2)求两个样本的方差和标准差; (3)试分析比较两个班的学习情况.26.某市举办了一次“诗词大赛”,分预赛和复赛两个环节,已知共有20000名学生参加了预赛,现从参加预赛的全体学生中随机地抽取100人的预赛成绩作为样本,得到如下的统计数据.地抽取2人,求恰有1人预赛成绩优良的概率;(2)由样本数据分析可知,该市全体参加预赛学生的预赛成绩Z 服从正态分布()2,N μσ,其中μ可近似为样本中的100名学生预赛成绩的平均值(同一组数据用该组数据的中间值代替),且2361σ=.利用该正态分布,估计全市参加预赛的全体学生中预赛成绩不低于72分的人数;(3)预赛成绩不低于91分的学生将参加复赛,复赛规则如下: ①参加复赛的学生的初始分都设置为100分;②参加复赛的学生可在答题前自己决定答题数量n ,每一题都需要“花”掉一定分数来获取答题资格(即用分数来买答题资格),规定答第k 题时“花”掉的分数为()0.21,2,k k n =; ③每答对一题得2分,答错得0分;④答完n 题后参加复赛学生的最终分数即为复赛成绩.已知学生甲答对每道题的概率均为0.75,且每题答对与否都相互独立,则当他的答题数量n 为多少时,他的复赛成绩的期望值最大?参考数据:若()2~,Z Nμσ,则() 6.827P Z μσμσ-<<+≈,()220.9545P Z μσμσ-<<+≈,()330.9973P Z μσμσ-<<+≈【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【详解】高的比就是频率的比,所以各区间上的频率可依次设为2x,3x,5x,6x,3x,x,,同它们的和为1235631,20x x x x x x x +++++=∴=,所以该班学生数学成绩在[80,100)之间的学生人数是1(56)6011603320x +⨯⨯=⨯⨯=,故选D 2.C解析:C 【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.3.D解析:D 【分析】根据散点图的分布可选择合适的函数模型. 【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+. 故选:D. 【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.4.D解析:D 【分析】根据茎叶图和折线图依次判断每个选项得到答案.A. 甲得分的极差是28919-=,A 错误;B. 乙得分的中位数是161716.52+=,B 错误; C. 甲运动员得分在区间[]20,30上有3个,C 错误; D. 甲运动员得分的平均值为:912131315202628178+++++++=,乙运动员得分的平均值为:914151617181920168+++++++=,故D 正确.故选:D . 【点睛】本题考查了茎叶图和折线图,意在考查学生的计算能力和理解能力.5.A解析:A 【分析】可不用动笔,直接得到答案,亦可采用特殊数据,特值法筛选答案. 【详解】设9位评委评分按从小到大排列为123489x x x x x x ≤≤≤≤≤.则①原始中位数为5x ,去掉最低分1x ,最高分9x ,后剩余2348x x x x ≤≤≤,中位数仍为5x ,∴A 正确. ②原始平均数1234891()9x x x x x x x =+++++,后来平均数234817x x x x x '=+++()平均数受极端值影响较大,∴x 与x '不一定相同,B 不正确 ③()()()222219119S x x x x x x ⎡⎤=-+-++-⎣⎦()()()222223817s x x x x x x ⎡⎤'=-'+-'++-'⎢⎥⎣⎦由②易知,C 不正确.④原极差91=x -x ,后来极差82=x -x 可能相等可能变小,D 不正确. 【点睛】本题旨在考查学生对中位数、平均数、方差、极差本质的理解.6.A解析:A 【分析】由题,中位数为12,求得4x y +=,再求得平均数,利用总体标准差最小和基本不等式求得x ,y 的值,即可求得答案.由题,因为中位数为12,所以242x yx y +=∴+= 数据的平均数为:1(22342019192021)11.410x y ++++++++++= 要使该总体的标准最小,即方差最小,所以222222.8(1011.4)(1011.4)( 1.4)( 1.4)2()0.722x y x y x y +-+-++-=-+-≥= 当且紧当 1.4 1.4x y -=-,取等号,即2x y ==时,总体标准差最小 此时4212x y += 故选A 【点睛】本题考查了茎叶图,熟悉茎叶图,清楚中位数、标准差的求法是解题的关键,属于中档题型.7.A解析:A 【解析】 【分析】首先求得x 的平均值,然后利用线性回归方程过样本中心点求解m 的值即可. 【详解】 由题意可得:810111214115x ++++==,由线性回归方程的性质可知:99112744y =⨯+=, 故21252835275m++++=,26m ∴=.故选:A . 【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x 与y 之间的关系,这条直线过样本中心点.8.D解析:D 【解析】 【分析】 先计算,代入回归直线方程,可得,从而可求得结果.【详解】因为,所以, 代入回归直线方程可求得, 所以, 故选D.【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.9.A解析:A【分析】由题意计算出加入新数据后的平均数,然后比较方差【详解】()18138x x +⋯+=, ()181339x x +⋯++=, 3x ∴=,由方差的定义可知加入新数据3,样本数据会变得更加稳定故22s <故选A【点睛】本题主要考查了加入数据后平均数和方差的变化,代入公式计算出结果,较为基础 10.C解析:C【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n =30n ﹣19,由401≤30n ﹣21≤755,求得正整数n 的个数,即可得出结论.【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列, 又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,∴等差数列的通项公式为a n =11+(n ﹣1)30=30n ﹣19,由401≤30n ﹣19≤755,n 为正整数可得14≤n ≤25,∴做问卷C 的人数为25﹣14+1=12,故选C .【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.11.C解析:C【解析】【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论.【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位,即减少1.5个单位,故选C.【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目. 12.C解析:C【解析】【分析】根据分层抽样的定义求出在各层中的抽样比,即样本容量比上总体容量,按此比例求出在高三年级中抽取的人数.【详解】 根据题意得,用分层抽样在各层中的抽样比为421105020=, 则在高三年级抽取的人数是14001625⨯=人, 故选C.【点睛】该题所考查的是有关分层抽样的问题,在解题的过程中,需要明确无论采用哪种抽样方法,都必须保证每个个体被抽到的概率是相等的,所以注意成比例的问题. 二、填空题13.①②③【分析】根据折线的变化率得到相比去年同期变化幅度、升降趋势逐一验证即可【详解】根据折现统计图可得2月相比去年同期变化幅度最小3月的空气质量指数最高故①正确;第一季度的空气质量指数的平均值最大第 解析:①②③【分析】根据折线的变化率,得到相比去年同期变化幅度、升降趋势,逐一验证即可.【详解】根据折现统计图可得,2月相比去年同期变化幅度最小,3月的空气质量指数最高,故①正确;第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小,故②正确;第三季度空气质量指数相比去年同期变化幅度的方差最小,故③正确;空气质量指数涨幅从高到低居于前三位的月份为6、8、9月,故④错误,故答案为:①②③.【点睛】本题考查条形统计图和折线图的应用,重点考查数据分析,从表中准确获取信息是关键,属于中档题型.14.8【分析】先设五个班的人数分别为样本平均数为5又因样本方差为4则代入大于且不相等的整数可得的值依次为24568即可得最大值【详解】解:设五个班的人数分别为则则所以的值依次为24568即有最大值为8故解析:8【分析】先设五个班的人数分别为1a ,2a ,3a ,4a ,5a ,样本平均数为5,1234525a a a a a ++++=,又因样本方差为4,则()()()()()22222123455555520a a a a a -+-+-+-+-=,代入大于0且不相等的整数,可得1a ,2a ,3a ,4a ,5a 的值依次为2,4,5,6,8,即可得最大值.【详解】解:设五个班的人数分别为1a ,2a ,3a ,4a ,5a , 则()12345155a a a a a ++++=, 15()()()()()2222212345555554a a a a a ⎡⎤-+-+-+-+-=⎣⎦, 则1234525a a a a a ++++=,()()()()()22222123455555520a a a a a -+-+-+-+-=,所以1a ,2a ,3a ,4a ,5a 的值依次为2,4,5,6,8,即有最大值为8.故答案为: 8【点睛】 本题考查利用平均数公式和方差公式求样本数据中的最大值,是基础题.合理应用公式是关键. 15.2【分析】根据题意列出关于的等量关系式结合求得的值利用方差公式求得结果【详解】一组数据的平均数是8且所以化简得又所以的值分别为或所以该组数据的方差为:故答案是:2【点睛】该题考查的是有关求一组数据的 解析:2【分析】根据题意,列出关于,x y 的等量关系式,结合90xy =,求得,x y 的值,利用方差公式求得结果.【详解】一组数据6,7,8,,x y 的平均数是8,且90xy =,所以6788540x y ++++=⨯=,化简得19x y +=,又90xy =,所以,x y 的值分别为10,9或9,10,所以该组数据的方差为:222222110[(68)(78)(88)(98)(108)]255s =-+-+-+-+-==, 故答案是:2.【点睛】该题考查的是有关求一组数据的方差的问题,涉及到的知识点有方差公式,属于简单题目. 16.2【解析】【分析】根据系统抽样的概念结合可得最后结果为2【详解】学生总数不能被容量整除根据系统抽样的方法应从总体中随机剔除个体保证整除∵故应从总体中随机剔除个体的数目是2故答案为2【点睛】本题主要考 解析:2【解析】【分析】根据系统抽样的概念结合2544262=⨯+,可得最后结果为2.【详解】学生总数不能被容量整除,根据系统抽样的方法,应从总体中随机剔除个体,保证整除. ∵2544262=⨯+,故应从总体中随机剔除个体的数目是2,故答案为2.【点睛】本题主要考查系统抽样,属于基础题;从容量为N 的总体中抽取容量为n 的样本,系统抽样的前面两个步骤是:(1)将总体中的N 个个体进行编号;(2)当N n 为整数时,抽样距即为N n ;当N n不是整数时,从总体中剔除一些个体,使剩下的总体中的个体的个数N '能被n 整除.17.②③【解析】分析:根据函数的周期性可判断①;根据垂直平分线的几何特征可判断②;根据回归直线的实际意义可判断③;根据演绎推理及正弦函数的定义可判断④详解:①若函数满足则函数是周期为2的周期函数但不一定解析:②③【解析】分析:根据函数的周期性,可判断① ;根据垂直平分线的几何特征,可判断②;根据回归直线的实际意义,可判断③;根据演绎推理及正弦函数的定义,可判断④.详解:①若函数()y f x =满足()()11f x f x -=+,则函数()f x 是周期为2的周期函数,但不一定具有对称性,①错误;②点()()2,1?0,3确定直线的斜率为1-,与直线 10x y -+=垂直,且中点()1,2在直线10x y -+=上,故点()()2,1?0,3关于直线10x y -+=的对称,②正确;③通过回归方程ˆˆˆy bx a =+可以估计和观测变量的取值和变化趋势,③正确;④正弦函数是奇函数,()()2sin 1f x x =+是正弦函数,所以()()2sin 1f x x =+是奇函数,上述推理错误的原因是小前提不正确,④错误,故答案为②③.点睛:本题主要通过对多个命题真假的判断,主要综合考查函数的周期性、点关于直线对称、以及回归分析与“三段论”,属于难题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.18.630【解析】每层的抽样比为女生抽了95人所以男生抽取105人因此共有男生人故填630解析:630【解析】 每层的抽样比为200112006=,女生抽了95人,所以男生抽取105人,因此共有男生1056630⨯=人,故填630.19.【解析】因此解析:4.7【解析】18914779,0.80.1424222ˆx y a ====∴=-⨯=- 因此0.860.1 4.7y =⨯-= 20.2【解析】由茎叶图及10个班级的得分的平均数是90可得∴当且仅当即时取等号故答案为2解析:2【解析】由茎叶图及10个班级的得分的平均数是90可得8a b += ∴1911919191()()(19)(10)(1023)28888b a b a a b a b a b a b a b +=⨯++=+++=++≥+⨯=,当且仅当9b a a b=,即36b a ==时,取等号 故答案为2 三、解答题21.(1)平均数为260(小时);中位数为240(小时)(2)2,1,1(3)15 【分析】(1)利用各频率之和为1,计算出a ,然后根据频率分布直方图以及平均数,中位数的求法,可得结果.(2)根据月光照量[160,240)X ∈、[240,320)X ∈、[320,400]X ∈的频率之比为111::244,结合分层抽样的方法,可得结果. (3)采用列举法,将“6个月份之中随机抽取2个月份”所有情况列举出来,并计算“抽取到的2个月份的月光照量X (小时)都不低于320”的个数,结合古典概型可得结果.【详解】(1)根据各频率之和为1,则0.062580()801a a ⨯++⨯=,解得0.003125a =.月光照量X (小时)的平均数为()802000.00625+2800.0031253600.003125X =⨯⨯+⨯ 所以260X =(小时)设月光照量X (小时)的中位数为0X ,则0[240,320]X ∈.根据中位数的定义,其左右两边的频率相等,都为0.5,可得()00.00625802400.0031250.5X ⨯+-⨯=,解得0240X =.所以月光照量X (小时)的中位数为240(小时).(2)因为月光照量[160,240)X ∈、[240,320)X ∈、[320,400]X ∈的频率之比为111::244, 所以若准备按照月光照量来分层抽样,抽取一年中的4个月份来比较草莓的生长状况,那么,抽取的月光照量[160,240)X ∈,[240,320)X ∈,[320,400]X ∈的月份数分别为11142,41,41244⨯=⨯=⨯=. (3)由题意,月光照量[240,320)X ∈的有5,9,10月, 月光照量[320,400]X ∈的有6,7,8月,故从该村庄2018年的5,6,7,8,9,10月份之中随机抽取2个月份的月光照量X (小时)进行调查,所有的情况有:(5,9),(5,10),(5,6),(5,7),(5,8);(9,10),(9,6),(9,7),(9,8);(10,6),(10,7),(10,8);(6,7),(6,8);(7,8)共15种;其中,抽取到的2个月份的月光照量X (小时)都不低于320的情况有:(6,7),(6,8),(7,8)共3种;故所抽取到的2个月份的月光照量X (小时)都不低于320的概率31155P ==. 【点睛】 本题考查频率分布直方图中平均数,中位数的计算,以及古典概型的应用,分清题意,熟悉公式,耐心计算,属中档题.22.(Ⅰ)具有较强的线性相关关系,10220y x =-;(Ⅱ)330元【分析】(Ⅰ)代入公式计算r ,再做判断,根据公式求,b a ,即得结果;(Ⅱ)先确定温度达到28C ︒以上时概率,再确定随机变量取法,分别求出对应概率,最后根据数学期望公式求结果.【详解】(Ⅰ)21232527293171121226411526,4066x y ++++++++++=======()()7000.75786n i ix x y y r --==>=>∑ 所以潜叶蝇的平均产卵数y 与平均温度x 具有较强的线性相关关系, ()()()1217001070n i i i n i i x x y yb x x ==--===-∑∑,401026220a y bx =-=-⨯=- 10220y bx a x ∴=+=-;(Ⅱ)()12528,2P ξ<≤=()C ξ︒近似地服从正太分布()226.5,N σ, ()()12528128,24P P ξξ-<≤∴>== 0,1200,1600Y = 13141163(0)1,(1200),(1600)444101041020P Y P Y P Y ==-===⨯===⨯= 313()01200140033041020E Y =⨯+⨯+⨯=(元) 【点睛】本题考查线性回归方程、数学期望公式、正态分布,考查综合分析求解能力,属中档题. 23.(1)()54,42(2)0.72 3.12y x =+(3)75.12微克/立方米【分析】(1)求出,x y 从而得到样本点的中心;(2)利用参考公式求出()52150ii x x =-=∑,()()136n i ii x x y y =--=∑,从而得到b ,再将样本中心坐标代入求得a ,从而得到回归方程;(3)将100x =代入回方程,求出y 的值,即可得到答案.【详解】(1)5051545758394042444554,4255x y ++++++++====, 所以样本中心坐标为()54,42.(2)因为()52116991650i i x x =-=+++=∑, ()()1(4)(3)(3)(2)324336n ii i x x y y =--=-⋅-+-⋅-+⋅+⋅=∑, 所以360.7250b ==, 3.12a =, 线性回归方程为0.72 3.12y x =+.(3)0.72100 3.1275.12y =⨯+=(微克/立方米)此时 2.5PM 的浓度是75.12微克/立方米.【点睛】本题考查回归直线方程的最小二乘法求解及回归方程的应用,考查数据处理能力,求解时注意运算的准确性.24.(1) 1.4518.7y x =-+;(2)3【分析】(1)由表中数据计算x 、y ,求出ˆb、ˆa ,即可写出回归直线方程; (2)写出利润函数z y w =-,利用二次函数的图象与性质求出3x =时z 取得最大值.【详解】解:(1)由表中数据得,1(246810)65x =⨯++++=, 1(16139.57 4.5)105y =⨯++++=, 由最小二乘法求得:22222221641369.58710 4.5561058ˆ 1.452468105640b ⨯+⨯+⨯+⨯+⨯-⨯⨯-===-++++-⨯, ˆ10(1.45)618.7a=--⨯=, 所以y 关于x 的回归直线方程为 1.4518.7y x =-+;(2)根据题意,利润函数为:22( 1.4518.7)(0.05 1.7517.2)0.050.3 1.5z y w x x x x x =-=-+--+=-++, 所以,当0.332(0.05)x =-=⨯-时,二次函数z 取得最大值为1.95; 即预测3x =时,小王销售一辆该型号汽车所获得的利润z 最大.【点睛】本题考查了回归直线方程的求法,以及二次函数的图象与性质的应用,考查计算能力. 25.(1)=83.2x 甲,=84x 乙;(2)22=26.36=13.2S S 甲乙,,=5.13S 甲,=3.63S 乙;(3)乙班的总体学习情况比甲班好【解析】试题分析:每组样本数据有10个,求样本的平均数利用平均数公式,10个数的平均数等于这10个数的和除以10;比较平均分的大小可以看出两个班学生平均水平的高低,求样本的方差只需使用方差公式,求这10个数与平均数的差的平方方和再除以10;比较两组数据方差的大小就可得出两组数据的标准差的大小,标准差较小者成绩较稳定 . 试题 (1)x 甲=110×(82+84+85+89+79+80+91+89+79+74)=83. 2, x 乙=110×(90+76+86+81+84+87+86+82+85+83)=84. (2)2S 甲=110×[(82-83. 2)2+(84-83. 2)2+(85-83. 2)2+(89-83. 2)2+(79-83. 2)2+(80-83. 2)2+(91-83. 2)2+(89-83. 2)2+(79-83. 2)2+(74-83. 2)2]=26. 36, 2S 甲=110[(90-84)2+(76-84)2+(86-84)2+(81-84)2+(84-84)2+(87-84)2+(86-84)2+(82-84)2+(85-84)2+(83-84)2]=13. 2,则s 甲,s 乙≈3. 63.。

(常考题)北师大版高中数学必修三第一章《统计》检测卷(含答案解析)(3)

(常考题)北师大版高中数学必修三第一章《统计》检测卷(含答案解析)(3)

一、选择题1.2020年2月,受新冠肺炎的影响,医卫市场上出现了“一罩难求”的现象.在政府部门的牵头下,部分工厂转业生产口罩,下表为某小型工厂2-5月份生产的口罩数(单位:万) 月份x 2 3 4 5 口罩数y4.5432.5口罩数y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 的值为( ) A .6.1B .5.8C .5.95D .6.752.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm ),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是( )A .海水稻根系深度的中位数是45.5B .普通水稻根系深度的众数是32C .海水稻根系深度的平均数大于普通水稻根系深度的平均数D .普通水稻根系深度的方差小于海水稻根系深度的方差3.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s <>4.已知一组数据的茎叶图如图所示,则该组数据的平均数为( )A .85B .84C .83D .815. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日6.某宠物商店对30只宠物狗的体重(单位:千克)作了测量,并根据所得数据画出了频率分布直方图如下图所示,则这30只宠物狗体重(单位:千克)的平均值大约为( )A .15.5B .15.6C .15.7D .167.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )A .2,5B .5,5C .5,8D .8,88.某产品的广告费用x 与销售额y 的统计数据如下表:广告费用x (万元) 2 3 4 5 销售额y (万元)25374454根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为( ) A .61.5万元B .62.5万元C .63.5万元D .65.0万元9.某校高一年级有学生1800人,高二年级有学生1500人,高三年级有1200人,为了调查学生的视力状况,采用分层抽样的方法抽取学生,若在抽取的样本中,高一年级的学生有60人,则该样本中高三年级的学生人数为( )A .60B .50C .40D .3010.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数( )A .40B .45C .48D .5011.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位12.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响.对近8年的年宣传费i x 和年销售量()1,2,...8i y i =数据作了初步处理,得到下面的散点图及一些统计量的值.有下列5个曲线类型:①ˆˆy bxa =+;②y x d =+;③ln y p q x =+;④21k xy k e =+;⑤212y c x c =+,则较适宜作为年销售量y 关于年宣传费x 的回归方程的是( )A.①②B.②③C.②④D.③⑤二、填空题13.用系统抽样方法从400名学生中抽取容量为20的样本,将400名学生随机地编号为1~400,按编号顺序平均分为20个组.若第1组中用抽签的方法确定抽出的号码为11,则第17组抽取的号码为________.14.《数术记遗》相传是汉末徐岳(约公元2世纪)所著.该书主要记述了:积算(即筹算)、太乙算、两仪算、三才算、五行算、八卦算、九宫算、运筹算、了知算、成数算、把头算、龟算、珠算、计数共14种计算方法.某研究学习小组共6人,他们搜集整理该14种算法的相关资料所花费的时间(单位:min)分别为:93,93,88,81,94,91则这组时间数据的标准差为___________.15.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.16.某校对全校1200名男女学生进行健康调查,采用分层抽样法抽取一个容量为200的样本,已知女生抽了95人,则该校的男生数是__________.17.一个容量为40的样本,分成若干组,在它的频率分布直方图中,某一组相应的小长方形的面积为0.4,则该组的频数是__________.18.某校高三年级共有800名学生,现采用系统抽样的方法,抽取25名学生做问卷调查,将这800名学生按1,2,...,800随机编号,按编号顺序平均分组.若从第5组抽取的编号为136,则从第2组中抽取的编号为__________.19.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b的最小值为__________.20.已知某人连续5次投掷飞镖的环数分别是8,9,10,10,8,则该组数据的方差为______.三、解答题21.我国北方广大农村地区、一些城镇以及部分大中城市的周边区域,还在大量采用分散燃煤和散烧煤取暖,既影响了居民基本生活的改善,也加重了北方地区冬季的雾霾天气.推进北方地区冬季清洁取暖,是重大民生工程、民心工程,关系北方地区广大群众温暖过冬,关系雾霾天能不能减少,是能源生产和消费革命、农村生活方式革命的重要内容.2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改电用户大幅度增加,下面条形图反映了某省2018年1~7月份煤改气、煤改电的用户数量.(1)在给定坐标系中作出煤改气、煤改电用户数量y 随月份t 变化的散点图,并用散点图和相关系数说明y 与t 之间具有线性相关性;(2)建立y 关于t 的回归方程(系数精确到0.01),预测11月份该省煤改气、煤改电的用户数量. 参考数据:7772111y9.24,t 7 2.646iiii i i i y=====⋅≈≈∑∑∑(y -y ).参考公式:相关系数()()()()()()11112211niinn ni i i i i i nni i i i i i i t t y y r t ty y t y t y t ty y ======⋅--=⋅--=-⋅-⋅-∑∑∑∑∑∑.回归方程ˆy a bt=+中斜率和截距的最小二乘估计公式分别为:()()()121ˆˆˆ,nii i ni i tty y bay bt t t==⋅--==-⋅-∑∑. 22.某北方村庄4个草莓基地,采用水培阳光栽培方式种植的草莓个大味美,一上市便成为消费者争相购买的对象.光照是影响草莓生长的关键因素,过去50年的资料显示,该村庄一年当中12个月份的月光照量X (小时)的频率分布直方图如下图所示(注:月光照量指的是当月阳光照射总时长).(1)求月光照量X (小时)的平均数和中位数;(2)现准备按照月光照量来分层抽样,抽取一年中的4个月份来比较草莓的生长状况,问:应在月光照量[160,240)X ∈,[240,320)X ∈,[320,400]X ∈的区间内各抽取多少个月份?(3)假设每年中最热的5,6,7,8,9,10月的月光照量X 是大于等于240小时,且6,7,8月的月光照量X 是大于等于320小时,那么,从该村庄2018年的5,6,7,8,9,10这6个月份之中随机抽取2个月份的月光照量进行调查,求抽取到的2个月份的月光照量X (小时)都不低于320的概率.23.据统计某品牌服装专卖店一周内每天获取得纯利润y (百元)与每天销售这种服装件数x (百件)之间有如下一组数据.x3 4 5 6 7 8 9y 66 69 73 81 89 90 91 该专卖店计划在国庆节举行大型促销活动以提高该品牌服装的知名度,为了检验服装的质量,现从厂家购进的500件服装中抽取60件进行检验,(服装进货编号为001-500). (1)利用随机数表抽样本时,如果从随机数表第8行第2列的数开始按三位数连贯向右读取,试写出最先检测的5件服装的编号;(2)求该专卖店每天的纯利y 与每天销售件数x 之间的回归直线方程.(精确到0.01) (3)估计每天销售1200件这种服装时获多少纯利润? 附表:(随机数表第7行至第9行)84421 75331 57245 50688 77047 44767 21763 35025 83921 20676 63016 47859 16955 56719 98105 07185 12867 35807 44395 2387933211 23429 78645 60782 52420 74438 15510 01342 99660 27954 参考数据:721280i i x==∑,72145309i i y ==∑,713487i i i x y ==∑.参考公式:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-24.某学校因为今年寒假延期开学,根据教育部的停课不停学指示,该学校组织学生线上教学,高一年级在线上教学一个月后,为了了解线上教学的效果,在线上组织了学生数学学科考试,随机抽取50名学生的成绩并制成频率分布直方图如图.(1)求m 的值并估计这50名学生的平均成绩;(2)估计高一年级所有学生数学成绩在[90,100)分与[)70,100分的学生所占的百分比. 25.党的十八大以来,我国精准扶贫已经实施了六年,我国贫困人口从2012年的9899万人,减少到2018年的1660万人,2019年将努力实现减少贫困人口1000万人以上的目标,力争2020年在现行标准下,农村贫困人口全部脱贫,贫困县全部脱贫摘帽.某市为深入分析该市当前扶贫领域存在的突出问题,市扶贫办近三年来,每半年对贫困户(用y 表示,单位:万户)进行取样,统计结果如图所示,从2016年6月底到2019年6月底的共进行了七次统计,统计时间用序号t 表示,例如:2016年12月底(时间序号为2)贫困户为5.2万户.(1)求y 关于t 的线性回归方程y bx a =+,并预测到2020年12月底,该市能否实现贫困户全部脱贫;(2)为尽快打赢脱贫攻坚战,该市扶贫办在2019年6月底时,对全市贫困户随机抽取了100户贫困户,对每个家庭最主要经济收入来源进行抽样调查,统计结果如图.并决定据此选派一批农业技术人员对全市所有贫困户中,家庭最主要经济收入来源为养殖收入和种植收入的贫困户进行对口帮扶,每一名农业技术人员对口帮扶贫困户90户,则该市应分别安排多少农业技术人员对家庭最主要经济收入来源为养殖收入和种植收入的贫困户进行对口帮扶? 附:回归直线的斜率和截距的最小二乘法估计公式分别为:()()()1122211nniii ii i nniii i tty y t y nt yb tttnt====---==--∑∑∑∑,a y bt =-26.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式。

(必考题)高中数学必修三第一章《统计》测试(包含答案解析)(3)

(必考题)高中数学必修三第一章《统计》测试(包含答案解析)(3)

一、选择题1.某商场为了了解毛衣的月销售量y(件)与月平均气温x(C︒)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:︒171382月平均气温x C月销售量y(件)24334055由表中数据算出线性回归方程y bx a=+中的2b=-,气象部门预测下个月的平均气温为6C︒,据此估计该商场下个月毛衣销售量约为()A.58件B.40件C.38件D.46件2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是()A.成绩B.视力C.智商D.阅读量3.某中学有学生300人,其中一年级120人,二,三年级各90人,现要利用抽样方法取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一,二,三年级依次统一编号为1,2,…,300;使用系统抽样时,将学生统一编号为1,2,…,300,并将整个编号依次分为10段.如果抽得的号码有下列四种情况:①7,37,67,97,127,157,187,217,247,277;②5,9,100,107,121,180,195,221,265,299;③11,41,71,101,131,161,191,221,251,281;④31,61,91,121,151,181,211,241,271,299.关于上述样本的下列结论中,正确的是()A.②④都不能为分层抽样B.①③都可能为分层抽样C.①④都可能为系统抽样D.②③都不能为系统抽样4.下图是某公司2018年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是()A.2018年3月的销售任务是400台B.2018年月销售任务的平均值不超过600台C.2018年第一季度总销售量为830台D.2018年月销售量最大的是6月份5.在一次53.5公里的自行车个人赛中,25名参赛选手的成绩(单位:分钟)的茎叶图如号,再用系统抽样方法从中选取5人,图所示,现将参赛选手按成绩由好到差编为125已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为( )A.95 B.96 C.97 D.986.总体由编号为01,02,,29,30的30个个体组成,利用下面的随机数表选取4个个体.选取的方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的第4个个体的编号为().7806 6572 0802 6314 2947 1821 98003204 9234 4935 3623 4869 6938 7481A .02B .14C .18D .297.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3,则直线OP (O 为原点)的斜率的取值范围是3333(,)(,)282-∞-. A .①②③B .①③④C .①②④D .②③④8.甲、乙两名同学在五次数学考试中的成绩统计如下面的茎叶图所示,若甲、乙两人的平均成绩分别是1x ,2x ,观察茎叶图,下列结论正确的是( )A .12x x <,乙比甲成绩稳定B .12x x >,乙比甲成绩稳定C .12x x <,甲比乙成绩稳定D .12x x >,甲比乙成绩稳定9.某校高一年级有学生1800人,高二年级有学生1500人,高三年级有1200人,为了调查学生的视力状况,采用分层抽样的方法抽取学生,若在抽取的样本中,高一年级的学生有60人,则该样本中高三年级的学生人数为( ) A .60B .50C .40D .3010.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表: 时间周一周二周三周四周五车流量x (万辆) 100 102 108114 116 浓度y (微克)7880848890根据上表数据,用最小二乘法求出y 与x 的线性回归方程是( )参考公式:121()()()niii ni i x x y y b x x ==--=-∑∑,a y b x =-⋅;参考数据:108x =,84y =;A .0.6274ˆ.2yx =+ B .0.7264ˆ.2y x =+ C .0.7164ˆ.1y x =+ D .0.6264ˆ.2y x =+ 11.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为 A .12B .14C .16D .1812.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是( )A .4B .5C .6D .7二、填空题13.水痘是一种传染性很强的病毒性疾病,易在春天爆发.市疾控中心为了调查某校高年级学生注射水症疫苗的人数,在高一年级随机抽取5个班级,每个班抽取的人数互不相同,若把每个班级抽取的人数作为样本数据.已知样本平均数为7,样本方差为4,则样本数据中的最小值是______.14.下列说法正确的是__________(填序号)(1)已知相关变量(),x y 满足回归方程ˆ24yx =-,若变量x 增加一个单位,则y 平均增加4个单位(2)若,p q 为两个命题,则“p q ∨”为假命题是“p q ∧”为假命题的充分不必要条件(3)若命题0:p x R ∃∈,20010x x -+<,则:p x R ⌝∀∉,210x x -+≥(4)已知随机变量()22X N σ~,,若()0.32P X a <=,则()40.68P X a >-=15.一个车间为了规定工作原理,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下: 零件数x (个)1520304050由表中数据,求得线性回归方程0.66y x a =+,则估计加工70个零件时间为__________分钟(精确到0.1).16.现有10个数,其平均数为3,且这10个数的平方和是100,则这组数据的标准差是______. 17.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,若变量x 增加一个单位时,则y 平均增加5个单位; ③线性回归方程^^^y b x a =+所在直线必过(),x y ; ④曲线上的点与该点的坐标之间具有相关关系;⑤在一个22⨯列联表中,由计算得213.079K =,则其两个变量之间有关系的可能性是0090.其中错误的是________. 18.已知由样本数据点集合(){},|1,2,3,,i ix y i n =,求得的回归直线方程为1.230.08y x Λ=+ ,且4x =。

高中数学人教A版必修三章节综合测评 第二章《统计》3 含解析

高中数学人教A版必修三章节综合测评 第二章《统计》3 含解析

章末综合测评(三) 概率(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列事件中,随机事件的个数为( )①在学校明年召开的田径运动会上,学生张涛获得100米短跑冠军;②在体育课上,体育老师随机抽取一名学生去拿体育器材,抽到李凯;③从标有1,2,3,4的4张号签中任取一张,恰为1号签; ④在标准大气压下,水在4℃时结冰. A .1 B .2 C .3D .4【解析】 ①在明年运动会上,可能获冠军,也可能不获冠军.②李凯不一定被抽到.③任取一张不一定为1号签.④在标准大气压下水在4℃时不可能结冰,故①②③是随机事件,④是不可能事件.【答案】 C2.下列说法正确的是( )A .甲、乙二人比赛,甲胜的概率为35,则比赛5场,甲胜3场 B .某医院治疗一种疾病的治愈率为10%,前9个病人没有治愈,则第10个病人一定治愈C .随机试验的频率与概率相等D .天气预报中,预报明天降水概率为90%,是指降水的可能性是90%【解析】 概率只是说明事件发生的可能性大小,其发生具有随机性.故选D.【答案】 D3.(2016·开封高一检测)给甲、乙、丙三人打电话,若打电话的顺序是任意的,则第一个打电话给甲的概率是( )A.16 B .13 C.12D .23【解析】 给三人打电话的不同顺序有6种可能,其中第一个给甲打电话的可能有2种,故所求概率为P =26=13.故选B.【答案】 B4.在区间[-2,1]上随机取一个数x ,则x ∈[0,1]的概率为( ) A.13 B .14 C.12D .23【解析】 由几何概型的概率计算公式可知x ∈[0,1]的概率P =1-01-(-2)=13.故选A. 【答案】 A5.1升水中有1只微生物,任取0.1升化验,则有微生物的概率为()A.0.1 B.0.2C.0.3 D.0.4【解析】本题考查的是体积型几何概型.【答案】 A6.(2016·天水高一检测)从一批产品中取出三件产品,设A=“三件产品全不是次品”,B=“三件产品全是次品”,C=“三件产品不全是次品”,则下列结论正确的是()A.A与C互斥B.B与C互斥C.任何两个均互斥D.任何两个均不互斥【解析】互斥事件是不可能同时发生的事件,所以B与C互斥.【答案】 B7.某人从甲地去乙地共走了500 m,途中要过一条宽为x m的河流,他不小心把一件物品丢在途中,若物品掉在河里就找不到,若物品不掉在河里,则能找到,已知该物品能找到的概率为45,则河宽为()A.100 m B.80 m C.50 m D.40 m【解析】设河宽为x m,则1-x500=45,所以x=100.【答案】 A8.从一批羽毛球中任取一个,如果其质量小于4.8 g 的概率是0.3,质量不小于4.85 g 的概率是0.32,那么质量在[4.8,4.85)范围内的概率是( )A .0.62B .0.38C .0.70D .0.68【解析】 记“取到质量小于4.8 g ”为事件A ,“取到质量不小于4.85 g ”为事件B ,“取到质量在[4.8,4.85)范围内”为事件C .易知事件A ,B ,C 互斥,且A ∪B ∪C 为必然事件.所以P (A ∪B ∪C )=P (A )+P (B )+P (C )=0.3+0.32+P (C )=1,即P (C )=1-0.3-0.32=0.38.【答案】 B9.如图1,矩形ABCD 中,点E 为边CD 的中点,若在矩形ABCD 内部随机取一个点Q ,则点Q 取自△ABE 内部的概率等于( ) 【导学号:28750071】图1A.14 B .13 C.12D .23【解析】 点E 为边CD 的中点,故所求的概率P =△ABE 的面积矩形ABCD 的面积=12.【答案】 C10.将区间[0,1]内的均匀随机数x 1转化为区间[-2,2]内的均匀随机数x ,需要实施的变换为( )A .x =x 1*2B .x =x 1*4C .x =x 1*2-2D .x =x 1*4-2【解析】 由题意可知x =x 1*(2+2)-2=4x 1-2. 【答案】 D11.先后抛掷两颗骰子,设出现的点数之和是12,11,10的概率依次是P 1,P 2,P 3,则( )A .P 1=P 2<P 3B .P 1<P 2<P 3C .P 1<P 2=P 3D .P 3=P 2<P 1【解析】 先后抛掷两颗骰子的点数共有36个基本事件:(1,1),(1,2),(1,3),…,(6,6),并且每个基本事件都是等可能发生的.而点数之和为12的只有1个:(6,6);点数之和为11的有2个:(5,6),(6,5);点数之和为10的有3个:(4,6),(5,5),(6,4),故P 1<P 2<P 3.【答案】 B12.在5件产品中,有3件一等品和2件二等品,从中任取2件,则下列选项中以710为概率的事件是( )A .恰有1件一等品B .至少有一件一等品C .至多有一件一等品D .都不是一等品【解析】 将3件一等品编号为1,2,3,2件二等品编号为4,5,从中任取2件有10种取法:(1,2),(1,3),(1,4),(1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5).其中恰含有1件一等品的取法有:(1,4),(1,5),(2,4),(2,5),(3,4),(3,5),恰有1件一等品的概率为P 1=610,恰有2件一等品的取法有:(1,2),(1,3),(2,3).故恰有2件一等品的概率为P 2=310,其对立事件是“至多有一件一等品”,概率为P 3=1-P 2=1-310=710.【答案】 C二、填空题(本大题共4小题,每小题5分,共20分,把答案填在题中横线上).13.一个袋子中有5个红球,3个白球,4个绿球,8个黑球,如果随机地摸出一个球,记A ={摸出黑球},B ={摸出白球},C ={摸出绿球},D ={摸出红球},则P (A )=________;P (B )=________;P (C ∪D )=________.【解析】 由古典概型的算法可得P (A )=820=25,P (B )=320,P (C ∪D )=P (C )+P (D )=420+520=920.【答案】 25 320 92014.在区间(0,1)内任取一个数a ,能使方程x 2+2ax +12=0有两个相异实根的概率为________.【解析】 方程有两个相异实根的条件是Δ=(2a )2-4×1×12=4a 2-2>0,解得|a |>22,又a ∈(0,1),所以22<a <1,区间⎝ ⎛⎭⎪⎫22,1的长度为1-22,而区间(0,1)的长度为1,所以方程有两个相异实根的概率为1-221=2-22.【答案】 2-2215.甲、乙两组各有三名同学,他们在一次测验中的成绩的茎叶图如图2所示,如果分别从甲、乙两组中各随机选取一名同学,则这两名同学的成绩相同的概率是________.图2【解析】 由题意可知从甲、乙两组中各随机选取一名同学,共有9种选法,其中这两名同学的成绩相同的选法只有1种,故所求概率P =19.【答案】 1916.(2016·合肥高一检测)甲乙两人玩猜数字游戏,先由甲心中任想一个数字记为a ,再由乙猜甲刚才想的数字,把乙猜的数字记为b ,且a、b∈{0,1,2,…,9}.若|a-b|≤1,则称甲乙“心有灵犀”.现任意找两人玩这个游戏,则二人“心有灵犀”的概率为________.【解析】此题可化为任意从0~9中取两数(可重复)共有10×10=100种取法.若|a-b|≤1分两类,当甲取0或9时,乙只能猜0、1或8、9共4种,当甲取2~8中的任一数字时,分别有3种选择,共3×8=24种,所以P=24+410×10=725.【答案】7 25三、解答题(本大题共6小题,共70分,解答应写出文字说明、证明过程或演算步骤)17.(本小题满分10分)(2015·陕西高考)随机抽取一个年份,对西安市该年4月份的天气情况进行统计,结果如下:(1)在4月份任取一天,估计西安市在该天不下雨...的概率;(2)西安市某学校拟从4月份的一个晴天..开始举行连续2天的运动会,估计运动会期间不下雨...的概率. 【解】 (1)在容量为30的样本中,不下雨的天数是26,以频率估计概率,4月份任选一天,西安市不下雨的概率为2630=1315.(2)称相邻的两个日期为“互邻日期对”(如,1日与2日,2日与3日等).这样,在4月份中,前一天为晴天的互邻日期对有16个,其中后一天不下雨的有14个,所以晴天的次日不下雨的频率为78.以频率估计概率,运动会期间不下雨的概率为78.18.(本小题满分12分)对某班一次测验成绩进行统计,如下表所示:(1)求该班成绩在[80,100]内的概率; (2)求该班成绩在[60,100]内的概率.【解】 记该班的测试成绩在[60,70),[70,80),[80,90),[90,100]内依次为事件A ,B ,C ,D ,由题意知事件A ,B ,C ,D 是彼此互斥的.(1)该班成绩在[80,100]内的概率是P (C ∪D )=P (C )+P (D )=0.25+0.15=0.4.(2)该班成绩在[60,100]内的概率是P (A ∪B ∪C ∪D )=P (A )+P (B )+P (C )+P (D )=0.17+0.36+0.25+0.15=0.93.19.(本小题满分12分)小王、小李两位同学玩掷骰子(骰子质地均匀)游戏,规则:小王先掷一枚骰子,向上的点数记为x;小李后掷一枚骰子,向上的点数记为y.(1)在直角坐标系xOy中,以(x,y)为坐标的点共有几个?(2)规定:若x+y≥10,则小王赢;若x+y≤4,则小李赢,其他情况不分输赢.试问这个游戏规则公平吗?请说明理由. 【导学号:28750072】【解】(1)由于x,y取值为1,2,3,4,5,6,则以(x,y)为坐标的点有:(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),(2,3),(2,4),(2,5),(2,6),(3,1),(3,2),(3,3),(3,4),(3,5),(3,6),(4,1),(4,2),(4,3),(4,4),(4,5),(4,6),(5,1),(5,2),(5,3),(5,4),(5,5),(5,6),(6,1),(6,2),(6,3),(6,4),(6,5),(6,6),共有36个,即以(x,y)为坐标的点共有36个.(2)满足x+y≥10的点有:(4,6),(5,5),(5,6),(6,4),(6,5),(6,6),共6个,所以小王赢的概率是636=1 6,满足x+y≤4的点有:(1,1),(1,2),(1,3),(2,1),(2,2),(3,1),共6个,所以小李赢的概率是636=1 6,则小王赢的概率等于小李赢的概率,所以这个游戏规则公平.20.(本小题满分12分)(2014·天津高考)某校夏令营有3名男同学A,B,C和3名女同学X,Y,Z,其年级情况如下表:现从这6名同学中随机选出2人参加知识竞赛(每人被选到的可能性相同).(1)用表中字母列举出所有可能的结果;(2)设M为事件“选出的2人来自不同年级且恰有1名男同学和1名女同学”,求事件M发生的概率.【解】(1)从6名同学中随机选出2人参加知识竞赛的所有可能结果为{A,B},{A,C},{A,X},{A,Y},{A,Z},{B,C},{B,X},{B,Y},{B,Z},{C,X},{C,Y},{C,Z},{X,Y},{X,Z},{Y,Z},共15种.(2)选出的2人来自不同年级且恰有1名男同学和1名女同学的所有可能结果为{A,Y},{A,Z},{B,X},{B,Z},{C,X},{C,Y},共6种.因此,事件M发生的概率P(M)=615=25.21.(本小题满分12分)(2014·四川高考)一个盒子里装有三张卡片,分别标记有数字1,2,3,这三张卡片除标记的数字外完全相同.随机有放回地抽取3次,每次抽取1张,将抽取的卡片上的数字依次记为a,b,c.(1)求“抽取的卡片上的数字满足a +b =c ”的概率;(2)求“抽取的卡片上的数字a ,b ,c 不完全相同”的概率.【解】 (1)由题意知,(a ,b ,c )所有的可能为(1,1,1),(1,1,2),(1,1,3),(1,2,1),(1,2,2),(1,2,3),(1,3,1),(1,3,2),(1,3,3),(2,1,1),(2,1,2),(2,1,3),(2,2,1),(2,2,2),(2,2,3),(2,3,1),(2,3,2),(2,3,3),(3,1,1),(3,1,2),(3,1,3),(3,2,1),(3,2,2),(3,2,3),(3,3,1),(3,3,2),(3,3,3),共27种.设“抽取的卡片上的数字满足a +b =c ”为事件A ,则事件A 包括(1,1,2),(1,2,3),(2,1,3),共3种.所以P (A )=327=19.因此,“抽取的卡片上的数字满足a +b =c ”的概率为19.(2)设“抽取的卡片上的数字a ,b ,c 不完全相同”为事件B ,则事件B 包括(1,1,1),(2,2,2),(3,3,3),共3种.所以P (B )=1-P (B )=1-327=89.因此,“抽取的卡片上的数字a ,b ,c 不完全相同”的概率为89.22.(本小题满分12分)把参加某次铅球投掷的同学的成绩(单位:米)进行整理,分成以下6个小组:[5.25,6.15),[6.15,7.05),[7.05,7.95),[7.95,8.85),[8.85,9.75),[9.75,10.65],并绘制出频率分布直方图,如图3所示是这个频率分布直方图的一部分.已知从左到右前5个小组的频率分别为0.04,0.10,0.14,0.28,0.30,第6小组的频数是7.规定:投掷成绩不小于7.95米的为合格.图3(1)求这次铅球投掷成绩合格的人数;(2)你认为这次铅球投掷的同学的成绩的中位数在第几组?请说明理由;(3)若参加这次铅球投掷的学生中,有5人的成绩为优秀,现在要从成绩优秀的学生中,随机选出2人参加相关部门组织的经验交流会,已知a、b两位同学的成绩均为优秀,求a、b两位同学中至少有1人被选到的概率.【解】(1)∵第6小组的频率为1-(0.04+0.10+0.14+0.28+0.30)=0.14.∴参加这次铅球投掷的总人数为70.14=50.根据规定,第4、5、6组的成绩均为合格,人数为(0.28+0.30+0.14)×50=36.(2)∵成绩在第1、2、3组的人数为(0.04+0.10+0.14)×50=14,成绩在第5、6组的人数为(0.30+0.14)×50=22,参加这次铅球投掷的总人数为50,∴这次铅球投掷的同学的成绩的中位数在[7.95,8.85)内,即第4组.(3)设这次铅球投掷成绩优秀的5人分别为a、b、c、d、e,则选出2人的所有可能的情况为:ab,ac,ad,ae,bc,bd,be,cd,ce,de,共10种,其中a、b至少有1人的情况为:ab,ac,ad,ae,bc,bd,be,共有7种,∴a、b两位同学中至少有1人被选到的概率为P=7 10.。

必修3统计、概率数学试题(含标准答案)

必修3统计、概率数学试题(含标准答案)

一、选择题:(以下每小题有且仅有一个正确答案,每小题4分,共12题合计48分)1、我校高中生共有2700人,其中高一级900人,高二级1200人,高三级600人,现采取分层抽样法抽取容量为135的样本,则高一、高二、高三各级抽取的人数分别为 ( ) A.45,75,15 B. 45,45,45 C.30,90,15 D. 45,60,302、200辆汽车经过某一雷达地区, 时速频率分布直方图如右图所示,则时速超过70km/h 的汽车数量为( ) A 、2辆 B 、10辆 C 、20辆 D 、70辆3、右图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,中间的数字表示得分的十位数,下列对乙运动员的判断错误的是 ( ) A .乙运动员的最低得分为0分 B .乙运动员得分的众数为31 C .乙运动员的场均得分高于甲运动员 D .乙运动员得分的中位数是284、若样本,,21x x …,n x 的平均数、方差分别为x 、2s ,则样本531+x ,532+x ,…,53+n x 的平均数、方差分别为( )A .x 、2sB .53+x 、2sC .53+x 、29sD .53+x 、2)53(+s5、给出下列四个命题:①“三个球全部放入两个盒子,其中必有一个盒子有一个以上的球”是必然事件 ②“当x 为某一实数时可使20x <”是不可能事件③“明天顺德要下雨”是必然事件④“从100个灯泡中取出5个,5个都是次品”是随机事件. 其中正确命题的个数是 ( ) A. 0 B. 1 C.2 D.36、下列各组事件中,不是互斥事件的是( )A.一个射手进行一次射击,命中环数大于8与命中环数小于6B.统计一个班数学期中考试成绩,平均分数不低于90分与平均分数不高于95分C.播种菜籽100粒,发芽90粒与发芽80粒D.检查某种产品,合格率高于70%与合格率为70%7、袋中装有6个白球,5只黄球,4个红球,从中任取1球,抽到的不是白球的概率为 ( ) A. 25 B. 415C. 35 D.非以上答案甲 乙8 0 4 6 3 1 2 5 3 6 8 2 5 4 13 8 9 3 1 6 1 74 48、.设有一个直线回归方程为ˆˆ2 1.5yx =-,则变量x 增加一个单位时( ) A. y 平均增加 1.5 个单位 B. y 平均增加 2 个单位C. y 平均减少 1.5 个单位D. y 平均减少 2 个单位9、①学校为了了解高一学生的情况,从每班抽2人进行座谈;②一次数学竞赛中,某班有10人在110分以上,40人在90~100分,12人低于90分.现在从中抽取12人了解有关情况;③运动会服务人员为参加400m 决赛的6名同学安排跑道.就这三件事,合适的抽样方法为 ( ) A. 分层抽样,分层抽样,简单随机抽样 B. 系统抽样,系统抽样,简单随机抽样 C. 分层抽样,简单随机抽样,简单随机抽样 D. 系统抽样,分层抽样,简单随机抽样10、下列命题:①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求与该商品的价格是一种非确定性关系;④线性回归直线必过样本中心点;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究。

2020-2021学年高中数学北师大版必修3第一章统计单元测试题

2020-2021学年高中数学北师大版必修3第一章统计单元测试题

高中数学必修3第一章(统计)检测题班级姓名得分一、选择题:(本题共12小题,每小题5分,共60分,)1.为确保食品安全,质检部门检查一箱装有1 000件包装食品的质量,抽查总量的2%.在这个问题中下列说法正确的是( )A.总体是指这箱1 000件包装食品B.个体是一件包装食品C.样本是按2%抽取的20件包装食品D.样本容量为202.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14, 12.设其平均数为a,中位数为b,众数为c,则有( ).A.a>b>c B.b>c>a C.c>a>b D.c>b>a3.下列说法错误的是( ).A.在统计里,把所需考察对象的全体叫作总体B.一组数据的平均数一定大于这组数据中的每个数据C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D.一组数据的方差越大,说明这组数据的波动越大4.总体由编号为01,02,03,…,49,50的50个个体组成,利用随机数表(以下选取了随机数表中的第1行和第2行)选取5个个体,选取方法是从随机数表第1行的第9列和第10列数字开始由左向右读取,则选出来的第4个个体的编号为()66 67 40 67 14 64 05 71 95 86 11 05 65 09 68 76 83 20 37 9057 16 00 11 66 14 90 84 45 11 75 73 88 05 90 52 83 20 37 90A.05 B.09 C.11 D.205.已知x,y的取值如下表:x 0 1 3 4y 2.2 4.3 4.8 6.7从散点图可以看出y与x线性相关,且线性回归方程为y=0.95x+a,则a等于( )A.3.25B.2.6C.2.2D.06.如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5 B.5,5 C.3,7 D.5,77.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输人为15,那么由此求出的平均数与实际平均数的差是( ).A.3.5 B.-3 C.3 D.-0.58.在一次数学测验中,某小组14名学生分别与全班的平均分85分的差是:2,3,-3,-5,12,12,8,2,-1,4,-10,-2,5,5,那么这个小组的平均分是( )分.A.97.2 B.87.29 C.92.32 D.82.869.某题的得分情况如下:其中众数是( ).得分/分0 1 2 3 4百分率/(%) 37.0 8.6 6.0 28.2 20.2A.37.0% B.20.2% C.0分 D.4分10.如果一组数中每个数减去同一个非零常数,则这一组数的( ).A.平均数不变,方差不变 B.平均数改变,方差改变C.平均数不变,方差改变 D.平均数改变,方差不变11. 某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36的样本,适合的抽取样本的方法是 ( )A.简单的随机抽样B.系统抽样C.先从老年人中排除一人,再用分层抽样D.分层抽样12. 一个容量为20的样本数据,分组后组距与频数如下:[10,20]2个,[20,30]3个,[30,40]4个,[40,50]5个,[50,60]4个,[60,70]2个,则样本在区间(-∞,50)上的频率为 ( )A.5%B.25%C.50%D.70%二、填空题:(本题共4小题,每小题5分,共20分,)13.一个公司共有240名员工,下设一些部门,要采用分层抽样方法从全体员工中抽取一个容量为20的样本.已知某部门有60名员工,那么从这一部门抽取的员工人数是 .14.为了解某小区老年人在一天中锻炼身体的时间,随机调查了50人,根据调查数据,画出了锻炼时间在0~2时的样本频率分布直方图(如图),则50人中锻炼身体的时间在区间[0.5,1.5)内的人数是 .15.某校高一、高二、高三三个年级的学生数分别为1500人、1200人和1000人.现采用按年级分层抽样法了解学生的视力状况,已知在高一年级抽查了75人,则这次调查三个年级共抽查了人.16.某种彩票编号为0000~9999,中奖规则规定末三位号码是123的为二等奖,则中二等奖的号码为____________________________________ ;若将中二等奖的号码看作一个样本,则这里采用的抽样方法是.三、解答题:(本题共6小题,共70分,解答应写出文字说明,证明过程或演算步骤.)17.(10分)某机床加工直径为100cm的零件,为检验质量,从中抽取12件测量,数据如下:99 100 98 100 100 103 99 101 102 103 97 98计算参观人数的中位数、众数、平均数、标准差.18.(12分)在相同条件下对自行车运动员甲、乙两人进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:甲27 38 30 37 35 31乙33 29 38 34 28 36试判断选谁参加某项重大比赛更合适19.(12分)某中学团委组织了“我对祖国知多少”的知识竞赛,从参加竞赛的学生中抽出60名学生,将其成绩(均为整数)分成六组[40,50),[50,60),…,[90,100],其部分频率分布直方图如图所示.观察图形,回答下列问题.(1)求成绩在[70,80)的频率,并补全这个频率分布直方图;(2)估计这次考试的及格率(60分及以上为及格)和平均分(计算时可以用组中值代替各组数据的平均值).20.(12分)某连锁经营公司所属5个零售店某月的销售额和利润额资料如下表商店名称 A B C D E销售额(x)/千万元 3 5 6 7 9利润额(y)/百万元 2 3 3 4 5(1)画出销售额和利润额的散点图.(2)若销售额和利润额具有相关关系,用最小二乘法计算利润额y对销售额x的回归直线方程.(3)对计算结果进行简要的分析说明.21.(本大题满分12分)甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如下图所示.分别求.出两人得分的平均数与方差;根据图和上面算得的结果,对两人的训练成绩作出评价(1)画出频率分布直方图;(2)估计产品在200~500以内的频率.答 案一、 选择题:1、 D2、D3、B4、C5、B6、C7、B8、B9、A 10、D 11C 12D 二、 填空题: 13、答案:5 14、答案:35 15、答案:18516、答案:0123,1123,2123,3123,4123,5123,6123,7123,8123,9123.系统抽样.三、解答题:17、中位数:100cm 众数:100cm 平均数:100cm 标准差:s 2=42 18、甲x =33,乙x =33347s 2=甲>337s 2=乙,乙的成绩比甲稳定,应选乙参加比赛更合适 19、解:(1)因为各组的频率之和等于1, 所以成绩在[70,80)的频率是1-(0.025+0.015×2+0.01+0.005)×10=0.3. 频率分布直方图如图所示:(2)估计这次考试的及格率是75%. 估计这次考试的平均分是71分. 20. 1、(略)2、y=0.5x+0.43、结合散点图及线性回归方程可知,随着销售额的增加,销售利润也在增加,同时可知,零售店C 随着销售额的增加其销售利润的增加比较慢21. 21.解:(1)x 甲=13,x 乙=13,s 甲2=4,s 乙2=0.8,s 甲2=4>s 乙2=0.8,乙的成绩比较稳定.从折线图看,甲的成绩基本上是上升状态,而乙的成绩在水平线上、下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.22.解: (1)频率分布直方图如下.(2) 答案:0.75.频率组距寿命()100200300400500600。

(最新)高中数学必修三第二章《统计》单元测试(含答案)

(最新)高中数学必修三第二章《统计》单元测试(含答案)

(最新)高中数学必修三第二章《统计》单元测试(120分钟150分)一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.下面抽样方法是简单随机抽样的是( D )A.从平面直角坐标系中抽取5个点作为样本B.可口可乐公司从仓库中的1 000箱可乐中一次性抽取20箱进行质量检查C.某连队从200名战士中,挑选出50名最优秀的战士去参加抢险救灾活动D.从10个手机中逐个不放回地随机抽取2个进行质量检验(假设10个手机已编号)2.某企业有职工150人,其中高级职称15人,中级职称45人,一般职员90人,现用分层抽样抽取30人,则各职称抽取人数分别为 ( B )A.5,10,15B.3,9,18C.3,10,17D.5,9,163.在一次数学测试中,有考生1 000名,现想了解这1 000名考生的数学成绩,从中抽取100名学生的数学成绩进行统计分析,在这个问题中,总体是指 ( B )A.1 000名考生B.1 000名考生的数学成绩C.100名考生的数学成绩D.100名考生4.如图是某校高一学生到校方式的条形统计图,根据图形可得出骑自行车人数占高一学生总人数的 ( B )A.20%B.30%C.50%D.60%5.用抽签法进行抽样有以下几个步骤:①把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条制作)②将总体中的个体编号;③从这个容器中逐个不放回地抽取号签,将取出号签所对应的个体作为样本;④将这些号签放在一个容器内并搅拌均匀;这些步骤的先后顺序应为 ( A )A.②①④③B.②③④①C.①③④②D.①④②③6.由观测的样本数据算得变量x与y满足线性回归方程=0.6x-0.5,已知样本平均数=5,则样本平均数的值为 ( C )A.0.5B.1.5C.2.5D.3.57.用随机数表法对一个容量为500编号为000,001,002,…,499的产品进行抽样检验,抽取一个容量为10的样本,若选定从第12行第5列的数开始向右读数(下面摘取了随机数表中的第11行至第15行),根据下列数据,读出的第三个样本编号是( B )18 18 07 92 45 44 17 16 58 09 79 83 86 19 62 06 76 50 03 10 55 23 64 05 0526 62 38 97 75 84 16 07 44 99 83 11 46 32 24 20 14 85 88 45 10 93 72 88 7123 42 40 64 74 82 97 77 77 81 07 45 32 14 08 32 98 94 07 72 93 85 79 10 7552 36 28 19 95 50 92 26 11 97 00 56 76 31 38 80 22 02 53 53 86 60 42 04 5337 85 94 35 12 83 39 50 08 30 42 34 07 96 88 54 42 06 87 98 35 85 29 48 39A.841B.114C.014D.1468.某学校采用系统抽样方法,从该校高一年级全体800名学生中抽50名学生做视力检查.现将800名学生从1到800进行编号.已知从33~48这16个数中抽到的数是39,则在第1小组1~16中随机抽到的数是( B )A.5B.7C.11D.139.某校三个年级共有24个班,学校为了了解同学们的心理状况,将每个班编号,依次为1到24,现用系统抽样方法,抽取4个班进行调查,若抽到的最小编号为3,则抽取的最大编号为( C )A.15B.18C.21D.2210.某校为了了解高三学生的身体状况,抽取了100名女生的体重.将所得的数据整理后,画出了如图的频率分布直方图,则所抽取的女生中体重在40~45 kg的人数是( A )A.10B.2C.5D.1511.有关部门从甲、乙两个城市所有的自动售货机中各随机抽取了16台,记录上午8:00~11:00间各自的销售情况(单位:元),用茎叶图表示:设甲、乙的平均数分别为,,标准差分别为s1,s2,则 ( D )A.>,s1>s2B.>,s1<s2C.<,s1<s2D.<,s1>s212.某人对一个地区人均工资收入x与该地区人均消费水平y进行统计调查,y与x 有相关关系,得到线性回归方程为y=0.66x+1.562(单位:百元).若该地区人均消费水平为7.675百元,估计该地区人均消费水平占人均工资收入的百分比约为( D )A.66%B.72.3%C.67.3%D.83%二、填空题(本大题共4小题,每小题5分,共20分,将答案填在题中的横线上)13.甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为 1 800件.14.一个总体的60个个体编号为00,01,…,59,现需从中抽取一容量为8的样本,请从随机数表的倒数第5行(下表为随机数表的最后5行)第11列开始,向右读取,直到取足样本,则抽取样本的号码是18,00,38,58,32,26,25,39.95 33 95 22 00 18 74 72 00 18 38 79 58 69 32 81 76 80 26 92 82 80 84 25 3990 84 60 79 80 24 36 59 87 38 82 07 53 89 35 96 35 23 79 18 05 98 90 07 3546 40 62 98 80 54 97 20 56 95 15 74 80 08 32 16 46 70 50 80 67 72 16 42 7920 31 89 03 43 38 46 82 68 72 32 14 82 99 70 80 60 47 18 97 63 49 30 21 3071 59 73 05 50 08 22 23 71 77 91 01 93 20 49 82 96 59 26 94 66 39 67 98 60 15.若采用系统抽样的方法从420人中抽取21人做问卷调查,为此将他们随机编号为1,2,…,420,则抽取的21人中,编号在区间[241,360]内的人数是6.16.为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表中的实验数据,计算得回归直线方程为=0.85x-0.25.由以上信息,可得表中c的值为6.三、解答题(本大题共6小题,共70分.解答时应写出文字说明,证明过程或演算步骤)17.(10分)某校高三的某次数学测试中,对其中100名学生的成绩进行分析,按成绩分组,得到的频率分布表如下:(1)求出频率分布表中①,②位置相应的数据.(2)为了选拔出最优秀的学生参加即将举行的数学竞赛,学校决定在成绩较高的第3,4,5组中分层抽样取5名学生,则第4,5组每组各抽取多少名学生?【解析】(1)①处的数据为:15÷100=0.15,②处的数据为:0.35×100=35.(2)第三、四、五组中共有学生20+20+10=50人,故抽样比k=1/10,故应从第四组中抽取20×1/10=2人,应从第五组中抽取10×1/10=1人.18.(12分)高一(3)班有学生60人,为了了解学生对目前高考制度的看法,现要从中抽取一个容量为10的样本,问此样本若采用简单随机抽样,将如何获得?试设计抽样方案.【解析】抽签法:①将这60名学生按学号编号,分别为1,2, (60)②将这60个号码分别写在60张相同纸片上;③将这60张相同纸片揉成团,放到一个不透明的盒子里搅拌均匀;④抽出一张,记下上面的号码,然后再搅拌均匀,接着抽取第2张,记下号码.重复这个过程直到取到10个号码为止.这样,与这10个号码对应的10名学生就构成了一个简单的随机样本.19.(12分)某制造商为运动会生产一批直径为40 mm的乒乓球,现随机抽样检查20只,测得每只球的直径(单位:mm,保留两位小数)如下:40.02 40.00 39.98 40.00 39.9940.00 39.98 40.01 39.98 39.9940.00 39.99 39.95 40.01 40.0239.98 40.00 39.99 40.00 39.96(1)完成下面的频率分布表,并画出频率分布直方图.分组频数频率[39.95,39.97)[39.97,39.99)[39.99,40.01)[40.01,40.03)合计(2)假定乒乓球的直径误差不超过0.02 mm为合格品,若这批乒乓球的总数为10 000只,试根据抽样检查结果估计这批产品的合格只数.【解析】(1)分组频数频率[39.95,39.97)20.105[39.97,39.99)40.2010[39.99,40.01)100.5025[40.01,40.03]40.2010合计20150(2)因为抽样的20只产品中在[39.98,40.02]范围内有18只,所以合格率为×100%=90%,所以10 000×90%=9 000(只).即根据抽样检查结果,可以估计这批产品的合格只数为9 000.20.(12分)一台机器由于使用时间较长,生产的零件有一些会缺损,按不同转速生产出来的零件有缺损的统计数据如下表:转速x(转/秒) 16 14 12 8 每小时生产缺损零件数y(件) 11 9 8 5(1)作出散点图.(2)如果y与x线性相关,求出回归直线方程.(3)若实际生产中,允许每小时生产的产品中有缺损的零件最多为10个,那么,机器的转速应控制在什么范围内?(结果保留整数)附:线性回归方程=x+a中,=,=-.【解析】(1)散点图如图:(2)由题中数据列表如下:i1234x i1614128y i11985x i y i1761269640=12.5,=8.25,=660,x i y i=438,所以=≈0.73,=8.25-0.73×12.5=-0.875,所以=0.73x-0.875.(3)令0.73x-0.875≤10,解得x≤14.9≈15,故机器的运转速度应控制在15转/秒内.21.(12分)为缓解堵车现象,解决堵车问题,北京市交通局调查了甲、乙两个交通站的车流量,在2018年5月随机选取了14天,统计每天上午7:30~9:00间各自的车流量(单位:百辆)得到如图所示的茎叶图,根据茎叶图回答以下问题.(1)甲、乙两个交通站的车流量的中位数分别是多少?(2)甲、乙两个交通站哪个站更繁忙?说明理由.(3)计算甲、乙两交通站的车流量在[10,40]之间的频率.【解析】(1)甲交通站的车流量的中位数为(58+55)/2=56.5.乙交通站的车流量的中位数为(36+37)/2=36.5.(2)甲交通站的车流量集中在茎叶图的下方,而乙交通站的车流量集中在茎叶图的上方,从数据的分布情况来看,甲交通站更繁忙.(3)甲交通站的车流量在[10,40]之间的有4天,所以频率为4/14=2/7,乙交通站的车流量在[10,40]之间的有6天,所以频率为6/14=3/7.22.(12分)某重点中学100位学生在市统考中的理科综合分数,以[160,180), [180,200),[200,220),[220,240),[240,260), [260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值.(2)求理科综合分数的众数和中位数.(3)在理科综合分数为[220,240),[240,260),[260,280),[280,300]的四组学生中,用分层抽样的方法抽取11名学生,则理科综合分数在[220,240)的学生中应抽取多少人?【解析】(1)由(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20=1,解得x=0.007 5,所以直方图中x的值为0.007 5.(2)理科综合分数的众数是(220+240)/2=230,因为(0.002+0.009 5+0.011)×20=0.45<0.5,(0.002+0.009 5+0.011+0.012 5)×20=0.7>0.5,所以理科综合分数的中位数在[220,240)内,设中位数为a,则(0.002+0.009 5+0.011)×20+0.012 5×(a-220)=0.5,解得a=224,即中位数为224.(3)理科综合分数在[220,240)的学生有0.012 5×20×100=25(位),同理可求理科综合分数为[240,260),[260,280),[280,300]的学生分别有15位、10位、5位, 故抽取比为11/(25+15+10+5)=1/5,所以从理科综合分数在[220,240)的学生中应抽取25×1/5=5人.。

(压轴题)高中数学必修三第一章《统计》测试(包含答案解析)(1)

(压轴题)高中数学必修三第一章《统计》测试(包含答案解析)(1)

一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆybx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.为了了解某同学的数学学习情况,对他的6次数学测试成绩进行统计,作出的茎叶图如图所示,则下列关于该同学数学成绩的说法正确的是( )A .中位数为83B .众数为85C .平均数为85D .方差为193.某校举行演讲比赛,9位评委给选手A 打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若统计员计算无误,则数字x 应该是( )A .5B .4C .3D .24.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s <>5.有200人参加了一次会议,为了了解这200人参加会议的体会,将这200人随机号为001,002,003,…,200,用系统抽样的方法(等距离)抽出20人,若编号为006,036,041,176, 196的5个人中有1个没有抽到,则这个编号是( ) A .006B .041C .176D .1966.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是( )A .45B .47C .48D .637.在一次53.5公里的自行车个人赛中,25名参赛选手的成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为125-号,再用系统抽样方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为()A .95B .96C .97D .988.已知x ,y 取值如下表:x0 1 4 5 6 8 y 1.31.85.66.17.49.3从所得的散点图分析可知:y 与x 线性相关,且 1.03y x a =+,则a =( ) A .1.53B .1.33C .1.23D .1.139.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795B .0780C .0810D .081510.总体由编号为01,02,,29,30的30个个体组成,利用下面的随机数表选取4个个体.选取的方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的第4个个体的编号为( ).7806 6572 0802 6314 2947 1821 98003204 9234 4935 3623 4869 6938 7481A .02B .14C .18D .2911.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )A .2,5B .5,5C .5,8D .8,812.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位二、填空题13.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.14.《数术记遗》相传是汉末徐岳(约公元2世纪)所著.该书主要记述了:积算(即筹算)、太乙算、两仪算、三才算、五行算、八卦算、九宫算、运筹算、了知算、成数算、把头算、龟算、珠算、计数共14种计算方法.某研究学习小组共6人,他们搜集整理该14种算法的相关资料所花费的时间(单位:min )分别为:93,93,88,81,94,91则这组时间数据的标准差为___________.15.若1a ,2a ,…,20a 这20个数据的平均数为x ,方差为0.21,则1a ,2a ,…,20a ,x 这21个数据的方差为__________.16.某地区共有4所普通高中,这4所普通高中参加2018年高考的考生人数如下表所示: 学校 A 高中B 高中C 高中D 高中参考人数80012001000600现用分层抽样的方法在这4所普通高中抽取144人,则应在D 高中中抽取的学生人数为_______.17.现有10个数,其平均数为3,且这10个数的平方和是100,则这组数据的标准差是______.18.某校对全校1200名男女学生进行健康调查,采用分层抽样法抽取一个容量为200的样本,已知女生抽了95人,则该校的男生数是__________.19.已知某产品连续4个月的广告费i x (千元)与销售额i y (万元)(1,2,3,4i =),经过对这些数据的处理,得到如下数据信息:①441118,14ii i i xy ====∑∑;②广告费用x 和销售额y 之间具有较强的线性相关关系;③回归直线方程y bx a =+中的0.8b =. 那么广告费用为6千元时,则可预测销售额约为__________万元.20.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b+的最小值为__________.三、解答题21.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9x (2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-22.班主任为了对本班学生的考试成绩进行分析,决定从本班24名女同学,18名男同学中随机抽取一个容量为7的样本进行分析.(1)如果按照性别比例分层抽样,可以得到多少个不同的样本?(写出算式即可,不必计算出结果)(2)如果随机抽取的7名同学的数学,物理成绩(单位:分)对应如下表: 学生序号i 1 2 3 4 5 6 7 数学成绩i x 60 65 70 75 85 87 90 物理成绩i y70778085908693①若规定85分以上(包括85分)为优秀,从这7名同学中抽取3名同学,记3名同学中数学和物理成绩均为优秀的人数为ξ,求ξ的分布列和数学期望;②根据上表数据,求物理成绩y 关于数学成绩x 的线性回归方程(系数精确到0.01);若班上某位同学的数学成绩为96分,预测该同学的物理成绩为多少分? 附:线性回归方程y bx a =+,其中121()()()niii nii x x y y b x x ==--=-∑∑,a y bx =-.23.庐江县统计局统计了该县2019年10户家庭的年收入和年饮食支出的统计资料如下表:(1)由散点图可知y 与x 是线性相关的,求线性回归方程; (2)若某家庭年收入为9万元,预测其年饮食支出. 附:回归直线的斜率和截距的最小二乘估计公式分别为:1122211()ˆˆ).ˆ(,()nniii ii i nni ii i x x y y x y nxybay bx x x xnx ====---===---∑∑∑∑(参考数据:1010211115,406i ii i i x yx ====∑∑)24.脐橙营养丰富,含有人体所必需的各类营养成份,若规定单个脐橙重量(单位:千克)在[0.1,0.3)的脐橙是“普通果”,重量在[0.3,0.5)的磨橙是“精品果”,重量在[0.5,0.7]的脐橙是“特级果”,有一果农今年种植脐橙,大获丰收为了了解脐橙的品质,随机摘取100个脐橙进行检测,其重量分别在[0.1,0.2),[0.2,0.3),[0.3,0.4),[0.4,0.5),[0.5,0.6),[0.6,0.7]中,经统计得到如图所示频率分布直方图(1)将频率视为概率,用样本估计总体.现有一名消费者从脐橙果园中,随机摘取5个脐橙,求恰有3个是“精品果”的概率.(2)现从摘取的100个脐橙中,采用分层抽样的方式从重量为[0.4,0.5),[0.5,0.6)的脐橙中随机抽取10个,再从这10个抽取3个,记随机变量X表示重量在[0.5,0.6)内的脐橙个数,求X的分布列及数学期望.25.从某小区抽取100个家庭进行月用电量调查,发现其月用电量都在50度至350度之间,频率分布直方图如图所示.(1)根据直方图求x的值,并估计该小区100个家庭的月均用电量(同一组中的数据用该组区间的中点值作代表);(2)从该小区已抽取的100个家庭中, 随机抽取月用电量超过300度的2个家庭,参加电视台举办的环保互动活动,求家庭甲(月用电量超过300度)被选中的概率.26.在社会实践活动中,“求知”小组为了研究某种商品的价格x(元)和需求量y(件)之间的关系,随机统计了11月1日至11月5日该商品价格和需求量的情况,得到如下资料:日期11月1日11月2日11月3日11月4日11月5日x(元)1416182022y(件)1210743该小组所确定的研究方案是:先从这五天中选取2天数据,用剩下的3天数据求线性回归方程,再对被选取的2天数据进行检验.(1)若选取的是11月1日与11月5日两天数据,请根据11月2日至11月4日的数据,求出y 关于x 的线性回归方程y bx a =+;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2件,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?参考公式:()()()1122211nniii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】由已知求得 x , y ,进一步求得 a ,得到线性回归方程,取16x =求得y 值即可. 【详解】8.38.69.911.1512.1 10x +++=+=, 5.97.88.18.49.858y ++++==.又 0.78b =,∴ 80.78100.2a y bx --⨯===. ∴ 0.780.2y x =+.取16x =,得 0.78160.212.68y ⨯+==万元,故选A . 【点睛】本题主要考查线性回归方程的求法,考查了学生的计算能力,属于中档题.2.C解析:C 【解析】试题分析:A 选项,中位数是84;B 选项,众数是出现最多的数,故是83;C 选项,平均数是85,正确;D 选项,方差是,错误.考点:•茎叶图的识别 相关量的定义3.D解析:D【解析】记分员在去掉一个最高分94和一个最低分87后,余下的7个数字的平均数是91,()89889290939291791x +++++++÷=,635=917=6372x x ,∴+⨯∴=,故选D.4.A解析:A 【分析】根据题中所给的平均数的条件,重新列式求新数据的平均数,根据方差公式写出两组数据的方差,并比较大小. 【详解】 由题意,可得7050806070907050x ⨯+-+-==,设收集的48个准确数据分别记为1248,,,x x x ,则222221248175[(70)(70)(70)(6070)(9070)]50x x x =-+-++-+-+-22212481[(70)(70)(70)500]50x x x =-+-++-+,22222212481[(70)(70)(70)(8070)(7070)]50s x x x =-+-++-+-+-22212481[(70)(70)(70)100]7550x x x =-+-++-+<,所以275s <.故选:A . 【点睛】本题主要考查了数据的平均数和方差的计算公式的应用,其中解答中熟记数据的平均数和方差的公式,合理准确计算是解答的关键,着重考查了推理与运算能力,是基础题.5.B解析:B 【解析】 【分析】求得抽样的间隔为10,得出若在第1组中抽取的数字为6,则抽取的号码满足104n -,即可出判定,得到答案. 【详解】由题意,从200人中用系统抽样的方法抽取20人,所以抽样的间隔为2001020=, 若在第1组中抽取的数字为006,则抽取的号码满足6(1)10104n n +-⨯=-,其中n N +∈,其中当4n =时,抽取的号码为36;当18n =时,抽取的号码为176;当20n =时,抽取的号码为196,所以041这个编号不在抽取的号码中,故选B. 【点睛】本题主要考查了系统抽样的应用,其中解答中熟记系统抽样的抽取方法是解答的关键,着重考查了运算与求解能力,属于基础题.6.A解析:A 【解析】 【分析】由茎叶图确定所给的所有数据,然后确定中位数即可. 【详解】各数据为:12 20 31 32 34 45 45 45 47 47 48 50 50 61 63, 最中间的数为:45,所以,中位数为45. 本题选择A 选项. 【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.7.C解析:C 【分析】结合系统抽样法的方法,得出其他四名选手的成绩,然后计算平均数,即可. 【详解】结合系统抽样法,可知间隔5个人抽取一次,甲为85,则其他人分别是88,94,99,107,故平均数为88+94+99+107=974,故选C.【点睛】考查了系统抽样法,关键该抽取方法每间隔相同人数中抽取一人,计算平均数,即可,难度中等.8.D解析:D 【解析】分析:首先根据题中所给的表中的数据,计算得出样本中心点的坐标,利用回归直线必过样本中心点,代入求得结果. 详解:依题意得,1(014568)46x =⨯+++++=,1(1.3 1.8 5.6 6.17.49.3) 5.256y =+++++=,因为回归直线必过样本中心点(,)x y ,即点(4,5.25),所以有5.25 1.034ˆa=⨯+,解得ˆ 1.13a =,故选D. 点睛:该题考查的是有关回归直线的有关问题,涉及到的知识点有回归直线一定过样本中心点,计算得出相应坐标的平均值,求得样本中心点的坐标,代入求得结果.9.A解析:A 【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为10002050= 所以抽取的第40个数为1520(401)795+⨯-=选A.点睛:本题考查系统抽样概念,考查基本求解能力.10.D解析:D 【解析】分析:根据随机数表法则取数:取两个数,不小于30的舍去,前面已取的舍去. 详解:从表第1行5列,6列数字开始由左到右依次选取两个数字中小于30的编号为:08,02,14,29.∴第四个个体为29. 选D .点睛:本题考查随机数表,考查对概念基本运用能力.11.C解析:C 【解析】试题分析:由题意得5x =,116.8(915101824)85y y =+++++⇒=,选C. 考点:茎叶图12.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.二、填空题13.【分析】先根据平均数计算出的值再根据方差的计算公式计算出这组数的方差【详解】依题意所以方差为故答案为【点睛】本小题主要考查平均数和方差的有关计算考查运算求解能力属于基础题 解析:265【分析】先根据平均数计算出m 的值,再根据方差的计算公式计算出这组数的方差. 【详解】 依题意12674,45m m ++++==.所以方差为()()()()()22222114244464745⎡⎤-+-+-+-+-⎣⎦[]126944955=+++=. 故答案为265. 【点睛】本小题主要考查平均数和方差的有关计算,考查运算求解能力,属于基础题.14.【分析】由搜集算法所费的时间的数据求得数据的平均数再结合方差的计算公式即可求解【详解】由题意搜集算法所费的时间的数据可得数据的平均数为所以方差为所以标准差故答案为:【点睛】本题主要考查了数据的平均数解析:【分析】由搜集算法所费的时间的数据,求得数据的平均数,再结合方差的计算公式,即可求解. 【详解】由题意,搜集算法所费的时间的数据, 可得数据的平均数为939388819491906x +++++==,所以方差为2222222(9390)(9390)(8890)(8190)(9490)(9190)206s -+-+-+-+-+-==,所以标准差s ==故答案为: 【点睛】本题主要考查了数据的平均数和方差的计算,其中解答中熟记数据的平均数和方差的计算公式,准确计算是解答的关键,着重考查运算与求解能力.15.【分析】根据平均数与方差的概念利用公式准确计算即可求解【详解】由题意数据…这20个数据的平均数为方差为由方差的公式可得所以所以故答案为:【点睛】本题主要考查了平均数与方差的概念及应用其中解答中熟记平解析:0.20【分析】根据平均数与方差的概念,利用公式,准确计算,即可求解. 【详解】由题意,数据1a ,2a ,…,20a 这20个数据的平均数为x ,方差为0.21, 由方差的公式,可得222212201[()()()]0.2120s a x a x a x =⨯-+-++-=,所以2221220()()() 4.2a x a x a x -+-++-=,所以22222122011[()()()()] 4.20.202121s a x a x a x x x '=⨯-+-++-+-=⨯=, 故答案为:0.20.【点睛】本题主要考查了平均数与方差的概念及应用,其中解答中熟记平均数和方差的计算公式,准确运算是解答的关键,着重考查了计算能力,属于基础题.16.24【分析】计算出高中人数占总人数的比例乘以得到在高中抽取的学生人数【详解】应在高中抽取的学生人数为【点睛】本小题主要考查分层抽样考查频率的计算属于基础题解析:24 【分析】计算出D 高中人数占总人数的比例,乘以144得到在D 高中抽取的学生人数. 【详解】应在D 高中抽取的学生人数为6001442480012001000600⨯=+++.【点睛】本小题主要考查分层抽样,考查频率的计算,属于基础题.17.1【解析】【分析】设这10个数为则这组数据的方差为:由此能求出这组数据的标准差【详解】现有10个数其平均数为3且这10个数的平方和是100设这10个数为则这组数据的方差为:这组数据的标准差故答案为1解析:1 【解析】 【分析】设这10个数为1x ,2x ,3x ,⋯,10x ,则12310310x x x x +++⋯+=,222212310100x x x x +++⋯+=,这组数据的方差为:()()22222222212310123101231011[()()())69101010S x x x x x x x x x x x x x x x x ⎛⎤⎤⎡=-+-+-+⋯+-=+++⋯+-+++⋯++⨯ ⎥⎥⎢⎦⎣⎝⎦,由此能求出这组数据的标准差. 【详解】现有10个数,其平均数为3,且这10个数的平方和是100, 设这10个数为1x ,2x ,3x ,⋯,10x , 则12310310x x x x +++⋯+=,222212310100x x x x +++⋯+=,∴这组数据的方差为:()()22222222212310123101231011[()()())691011010S x x x x x x x x x x x x x x x x ⎛⎤⎤⎡=-+-+-+⋯+-=+++⋯+-+++⋯++⨯= ⎥⎥⎢⎦⎣⎝⎦,∴这组数据的标准差1S =.故答案为1. 【点睛】本题考查一组数据的标准差的求法,考查平均数、方差等基础知识,考查运算求解能力,考查函数与方程思想,是基础题.18.630【解析】每层的抽样比为女生抽了95人所以男生抽取105人因此共有男生人故填630解析:630 【解析】 每层的抽样比为200112006=,女生抽了95人,所以男生抽取105人,因此共有男生1056630⨯=人,故填630. 19.【解析】因此 解析:4.7【解析】18914779,0.80.1424222ˆx y a====∴=-⨯=- 因此0.860.1 4.7y =⨯-= 20.2【解析】由茎叶图及10个班级的得分的平均数是90可得∴当且仅当即时取等号故答案为2解析:2 【解析】由茎叶图及10个班级的得分的平均数是90可得8a b += ∴1911919191()()(19)(10)(1023)28888b a b a a b a b a b a b a b +=⨯++=+++=++≥+⨯=,当且仅当9b aa b=,即36b a ==时,取等号 故答案为2三、解答题21.(1)0.5 2.3y x =+;(2)6800元. 【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程; (2)将9x =代入即可预测. 【详解】解:(1)由表可得:123456747++++++==x ,2.93.3 3.64.4 4.85.2 5.9 4.37y ++++++==,又77211134.4,140i ii i i x yx ====∑∑,71722217134.474 4.30.5140747i ii i i x y x yb x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元. 【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题. 22.(1)不同的样本的个数为432418C C . (2)①分布列见解析,()E ξ97=. ②线性回归方程为0.6533.60y x =+.可预测该同学的物理成绩为96分. 【分析】(1)按比例抽取即可,再用乘法原理计算不同的样本数.(2)7名学生中物理和数学都优秀的有3名学生,任取3名学生,都优秀的学生人数ξ服从超几何分布,故可得其概率分布列及其数学期望.而线性回归方程的计算可用给出的公式计算,并利用得到的回归方程预测该同学的物理成绩. 【详解】(1)依据分层抽样的方法,24名女同学中应抽取的人数为724442⨯=名,18名男同学中应抽取的人数为718342⨯=名, 故不同的样本的个数为432419C C .(2)①∵7名同学中数学和物理成绩均为优秀的人数为3名, ∴ξ的取值为0,1,2,3.∴()34374035C P C ξ===,()21433711835C C C P ξ===, ()12433712235C C C P ξ===,()33375313C C P ξ===. ∴ξ的分布列为∴()0123353535357E ξ=⨯+⨯+⨯+⨯=. ②∵5260.65912b =≈,830.657633.60a y b x =-⨯=-⨯=. ∴线性回归方程为0.6533.60y x =+. 当96x =时,0.659633.6096y =⨯+=. 可预测该同学的物理成绩为96分. 【点睛】在计算离散型随机变量的概率时,注意利用常见的概率分布列来简化计算(如二项分布、超几何分布等).23.(1)ˆ0.150.9yx =+;(2)2.25万元. 【分析】(1)由已知数据求出x 和y ,根据所给公式求出ˆb与ˆa 的值,即可得y 关于x 的线性回归方程;(2)在(1)中求得的线性回归方程中,取9x =求得y 值即可. 【详解】解:(1)依题意可计算得, 1(24466677810)610x =+++++++++=, 1(1.0 1.5 1.6 2.0 1.8 1.9 1.8 2.0 2.1 2.3) 1.810y =+++++++++=. 236x =,10.8x y ⋅=,又101115i ii x y==∑,1021406i i x ==∑,1022110151ˆ0.1100ii i iix y x ybxx ==∴=≈⋅--∑∑,ˆˆ0.9ay bx =-=,ˆ0.150.9y x ∴=+, ∴所求的线性回归方程为ˆ0.150.9yx =+. (2)当9x =时,ˆ0.1590.9 2.25y=⨯+=(万元), ∴估计大多数年收入9万元的家庭每年饮食支出约为2.25万元.【点睛】本题考查线性回归方程的求法,考查计算能力,是基础题. 24.(1)516(2)见解析 【分析】(1)根据题意,先得到随机摘取一个脐橙,是“精品果”的概率为0.5,并且随机摘取5个脐橙,其中“精品果”的个数符合二项分布,再根据二项分布的概率公式,列出式子,得到答案.(2)先判断出X 可取的值为0,1,2,3,分别计算出其概率,然后列出概率分布列,再根据随机变量的数学期望公式,计算出其数学期望. 【详解】(1)从从脐橙果园中,随机摘取5个脐橙,其中“精品果”的个数记为Y , 由图可知,随机摘取一个脐橙,是“精品果”的概率为:0.2+0.3=0.5, ∴Y ~B (5,12), ∴随机摘取5个脐橙,恰有3个是“精品果”的概率为: P (Y =3)3325115()()2216C ==. (2)依题意,抽取10个脐橙,重量为[0.3,0.4),[0.4,0.5)的个数分别为6和4, X 的可能取值为0,1,2,3,P (X =0)3631016C C ==,P (X =1)216431012C C C ==, P (X =2)1264310310C C C ==,P (X =3)34310130C C ==, ∴X 的分布列为:E (X )1131601236210305=⨯+⨯+⨯+⨯=. 【点睛】本题考查满足二项分布的概率问题,以及随机变量的概率分布列和数学期望,属于中档题. 25.(1)x=0.0044, 月均用电量约为186度;(2).【详解】 (1)由题意得,.设该小区100个家庭的月均用电量为S 则9+22.5+52.5+49.5+33+19.5=186.(2),所以用电量超过300度的家庭共有6个.分别令为甲、A 、B 、C 、D 、E ,则从中任取两个,有(甲,A )、(甲,B )、(甲,C )、(甲,D )、(甲,E )、(A,B )、(A,C )、(A,D )、(A,E )、(B,C )、(B,D )、(B,E )、(C,D )、(C,E )、(D,E )15种等可能的基本事件,其中甲被选中的基本事件有(甲,A )、(甲,B )、(甲,C )、(甲,D )、(甲,E )5种. 家庭甲被选中的概率.26.(1) 1.534y x =-+;(2)详见解析. 【分析】(1)利用表中数据,分别求得:,x y ,再利用公式求得,b a ,然后写出回归直线方程即可. (2)根据(1)中的回归直线方程,令14x =, 22x =求得相应的y 值,再与实际值结合误差要求比较即可. 【详解】 由表中数据得: ()()1116182018,10747,33x y =++==++= 311610187204366i ii x y==⨯+⨯+⨯=∑,322221161820980ii x==++=∑,3132221336631871.59803183i ii i i x y x yb x x==--⨯⨯===--⨯-∑∑,()7 1.51834a y bx =-=--⨯=,所以y 关于x 的线性回归方程是 1.534y x =-+.(2)当14x =时, 1.5143413y =-⨯+=,131212-=<, 当22x =时, 1.522341y =-⨯+=,1322-=≤, 所以(1)中所得到的线性回归方程是可靠的. 【点睛】本题主要考查回归直线方程的求法以及应用,还考查了运算求解的能力,属于中档题.。

学习探究诊断必修三单元测试二 统计

学习探究诊断必修三单元测试二 统计

单元测试二统计(一)一、选择题1.为了解所加工的一批零件的长度,抽测了其中200个零件的长度.在这个问题中,200个零件的长度是( )(A)总体(B)个体(C)总体的一个样本(D)样本容量2.某城市有学校700所,其中大学20所,中学200所,小学480所.用分层抽样的方法抽取一个容量为70的样本进行某项调查,则应抽取的中学数为()(A)70(B)20(C)48(D)23.下列说法中,正确的是()(A)数据4,6,6,7,9,4的众数是4(B)一组数据的标准差是这组数据的方差的平方(C)数据3,5,7,9的标准差是数据6,10,14,18的标准差的一半(D)频率分布直方图中各小长方形的面积等于相应各组的频数4.如果数据x1,x2,…,x n的平均数是x,方差是s2,则2x1+3,2x2+3,…,2x n+3的平均数和方差分别是( )(A)x和s2;(B)2x+3和s2;(C)2x+3和4s2;(D)2x+3和4s2+12s+95.某校为了了解学生课外阅读情况,随机调查了50名学生,得到他们在某一天各自阅读所用时间的数据,结果用下面的条形图表示.根据条形图可得这50名学生平均每天课外阅读时间为( )(A)0.6小时(B)0.9小时(C)1.0小时(D)1.5小时二、填空题6.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差是______.7.某人5次上班途中所花时间(单位:分钟)分别为x,y,10,11,9,已知这组数据的平均数为10,方差为2,则|x—y|的值为______.8.某校有教师200人,男学生1200人,女学生1000人,现用分层抽样的方法从所有师生中抽取一个容量为n的样本,已知从女生中抽取的人数为80人,则n=______.9.对某班学生一次英语测试的成绩分析,各数据段的分布如图(分数取整数),由此估计这次测验的优秀率(不小于80分)为______.10.为了科学的比较考试成绩,有些选拔性考试常常将考试分数转化为标准分,转化关系式为s xx Z -=(其中x是某位学生的考试分数,x是该次考试的平均分,s是该次考试的标准差,z称为这位学生的标准分,也叫z分数),转化为标准分后可能出现小数或负数,因此,又常常再将z分数转化为T分数,线性变换公式是:T=40Z+60,已知在这次考试中某位考生的考试分数是85,这次考试的平均分是70,标准差是25,则该考生的T分数为______.三、解答题11.在对两个变量x,y进行线性回归分析时有下列步骤①对所求出的回归方程作出解释;②收集数据(x i,y i),i=1,2,…,n;③求线性回归方程;④判定是否线性相关;⑤根据所搜集的数据绘制散点图.请合理安排操作顺序.12.在相同条件下对自行车运动员甲、乙两人进行了6次测试,测得他们的最大速度(单位:m/s)甲27 38 30 37 35 31乙33 29 38 34 28 36 试判断选谁参加某项重大比赛更合适?13.为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组及各组的频数如下:[10.75,10.85)3 [10.85,10.95)9 [10.95,11.05)13[11.05,11.15)16 [11.15,11,25)26 [11.25,11.35)20[11.35,11.45)7 [11.45,11.55)4 [11.55,11.65)2(1)列出频率分布表;(2)画出频率分布直方图;(3)据上述图表,估计数据落在[10.95,11.35)范围内的可能性是百分之几?(4)数据小于11.20的可能性是百分之几?14如果y与x之间具有线性相关关系,求回归直线方程.测试卷参考答案单元测试二 统计(一)一、选择题1.C 2.B 3.C 4.C 5.B 二、填空题6.-3 7.4 8.192 9.0.56 10.84 三、解答题 11.②⑤④③①12.解:甲的平均数为33,乙的平均数为33,甲的方差为15.6,乙的方差为12.6.推选乙参加比赛更合适.13.解:(1)分组 频数 频率 [10.75,10.85) 3 0.03 [10.85,10.95) 9 0.09 [10.95,11.05) 13 0.13 [11.05,11.15) 16 0.16 [11.15,11.25) 26 0.26 [11.25,11.35) 20 0.20 [11.35,11.45) 7 0.07 [11.45,11.55) 4 0.04 [11.55,11.65)2 0.02 合计1001.00(2)(3)由上述图表可知数据落在[10.95,11.35)范围内的频率为:0.87-0.12=0.75=75%,即数据落在[10.95,11.35)范围内的可能性是75%. (4)0.03+0.09+0.13+0.16+0.13=0.54. 14.571.0,143.1,396,482,327,8,5.661261261=≈=====∑∑∑===a b y x y xy x i i i i i ii所以回归直线是y =1.143x +0.571。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

单元测试三 统计(二)一、选择题1.从某年级1000名学生中抽取125名学生进行体重的统计分析,就这个问题来说,下列说法正确的是( )A .1000名学生是总体B .每个被抽查的学生是个体C .抽查的125名学生的体重是一个样本D .抽取的125名学生的体重是样本容量2.已知一组数据为35,40,45,50,50,50,65,75,85,其中平均数、中位数、众数的大小关系为( )A .平均数>中位数>众数B .平均数<中位数<众数C .中位数<众数<平均数D .中位数=众数<平均数3.某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上的人,用分层抽样的方法抽取20人,各年龄段分别抽取的人数是( ) A .7,5,8 B .9,5,6 C .6,5,9 D .8,5,74.由小到大排列的一组数据x 1,x 2,x 3,x 4,x 5,其中每个数据都小于-1,那么对于样本1,x 1,-x 2,x 3,-x 4,x 5的中位数可以表示为( )A .)1(212x +B .)(2112x x - C .)1(215x +D .)(2143x x -5.已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是2,方差是31,那么另一组数3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数,方差分别是( ) A .31,2B .2,1C .32,4D .4,36.某社区有6000个家庭,其中高收入家庭1200户,中等收入家庭4200户,低收入家庭600户,为调查社会购买力的某项指标,要从中抽取一个容量为1000的样本,记作①;某学校高中二年级有15名男篮运动员,要从中选出3人调查学习负担情况,记作②;那么完成上述两项调查应采用的取样方法是( ) A .①简单随机抽样 ②系取抽样 B .①分层抽样 ②简单随机抽样 C .①系统抽样 ②分层抽样 D .①分层抽样 ②系统抽样7.对于数据2,2,3,2,5,2,10,2,5,2,3,(1)从数是2;(2)众数与中位数的值数不等;(3)中位数与平均数的数值相等;(4)平均数与众数的数值不相等.其中正确的结论有( ) A .1个 B .2个 C .3个 D .4个8.要从一编号(1~50)的50枚最新研制的某型号导弹中随机抽取5枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号是( ) A .5,10,15,20,25 B .2,4,8,16,32C .1,2,3,4,5D .3,13,23,33,439.期中考试以后,班长算出了全班40个人的数学成绩的平均分M ,如果把M 当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均值为N ,那么M ∶N 为( ) A .4140B .1C .4041 D .210.某中学人数相等的甲、乙两班学生参加了同一次数学测试,两班的平均分和方差分别为82=x 分,82=y 分,2甲s =245,2乙s =190,那么成绩较为整齐的是( )A .甲班B .乙班C .两班一样整齐D .无法确定11.设有一个回归方程yˆ=2-1,5x ,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位 D .y 平均减少2个单位12.某车间生产一种玩具,为了要确定加工玩具所需要的时间,进行了10次实验,数据如下:玩具个数 2 4 6 8 10 12 14 16 18 20 加工时间471215212517313741A .a =11b -21B .a =21-11bC .a =11-21bD .a =21b -11 二、填空题13.一个样本容量是100的频率分布如图:(1)样本落在[60,70)内的频率为______; (2)样本落在[70,80)内的频率为______;(3)样本落在[90,100)内的频率是0.16,该小矩形的高是______. 14.经问卷调查,某班学生对摄影分别持“喜欢”、“不喜欢”和“一般”三种态度,其中持“一般”态度的比“不喜欢”态度的多12人,按分层抽样方法从全班选出部分学生座谈摄影,如果选出5位“喜欢”摄影的同学、1位“不喜欢”摄影的同学和3位持“一般”态度的同学,那么全班学生中“喜欢”摄影的比全班人数的一半还多______. 人.15x 3 5 2 8 9 12 y46391214假设得到的关于x 和y 之间的回归直线方程是a bx y+=ˆ,那么该直线必过的定点是______.16.样本容量为m,组数为n,第i组的频数为k,则该组频率为_____;若前i-1组的累积频率(前i-1组的频率之和)为p,则前i组的累积频率为______.三、解答题17.(1)从30名高一学生的考试卷中抽取6名学生的试卷进行成绩分析,写出抽取样本的过程;(2)若从高二年级两个班的120名学生中,抽取12名学生调查其身高情况,你觉得采取哪种抽样方法较为合适(其中男生50人,女生70人)?18(1)分别求这些运动员成绩的众数、中位数、平均数(保留3个有效数字);(2)分析这些数据的含义.19.对自行车运动员甲、乙两人在相同条件下进行了六次测试,测得他们的最大速度(m/s)的数据如下:求两人比赛成绩的平均数以及方差,并且分析比赛成绩的稳定性,从中选出一位参加决赛.20.甲乙两组数据如下:甲:11.29.812.38.99.010.713.1乙:10.38.913.09.78.611.212.3(1)求平均数;(2)画出茎叶图求中位数;(3)求方差;(4)对两组数据加以比较.2122.从高一学生中抽取50名参加调研考试,成绩的分组及各组的频数如下(单位:分):[40,50),2;[50,60);3;[60,70),10;[70,80),15;[80,90),12;[90,100),8(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计成绩在[70,80)分的学生所占总体的百分比;(4)估计成绩在[70,100)分的学生所占总体的百分比.测试卷参考答案单元测试三 统计(二)一、选择题1.C 解析:在初中学过:“在统计中,所有考察对象的全体叫做总体,其中每一个所要考察的对象叫做个体,从总体中抽取的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本容量.”因此题中所指的对象应是体重,故A 、B 错误,样本容量应为125,故D 错误. 2.D 解析:平均数中位数55)857565505050454035(91=++++++++=x , 中位数=众数=50.3.B 解析:由45∶25∶30=8∶5∶6,设9x +5x +6x =20得x =1,故各年龄段分别抽取9人,5人,6人. 4.C 解析:由题意把样本从小到大排序为x 1,x 3,x 5,1,-x 4,-x 2,因此得中位数为()5121x + 5.D 解析:因为数据x 1,x 2,x 3,x 4,x 5的平均数是2,方差是31, 所以31)2(51,2251=-=∑=i i x x ,因此数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数为:42513)23(515151=-⨯=-∑∑==ii ii x x ,方差为:=--∑=251)23(51x x i i 9)63(51251=-∑=i i x 3319)2(51251=⨯=-⨯∑=i i x .6.B 解析:①中国各层之间的收入情况差异很大,故采用分层抽样法;②因总体和样本数量都较小,故采用抽样法.7.B 解析:众数是出现次数最多的数,故众数为2;把数从小到大排列为2,2,2,2,2,2,3,3,5,5,10,得中位数是2;又平均数约3.45,故(1),(4)正确.8.D 解析:由题意,以系统抽样分为5段,每段10名,并且每段取一名,间隔为10,符合此规律的只有D .9.B 解析:∵M =N ,∴M ∶N =1.10.B 解析:在平均数相同的情况下,方差较小的其数据波动较小,由于2甲s =245>2乙s =190因此乙班的成绩较为整齐.11.C 解析:回归直线斜率为-1.5,所以每增加一个单位,y 减少1.5,故选C . 12.B 解析:由112202=+=x , 21)413731172521151274(101=+++++++++=y 得:b x b y a 1121-=-=.二、填空题13.0.2 30 0.016解析:(1)由,得频率为0.2;(2)频率为0.3,又由频数=频率×样本容量,得频数为30; (3)由,得0.016.14.3 解析:由分层抽样可知“喜欢”、“不喜欢”和“一般”所占的比例为5∶1∶3,设每份为x ,则由题意3x -x =12,解得x =6.所以“喜欢”的有30人,全班人数为54,由于325430=-,故全班学生中“喜欢”摄影的比全班人数的一半还多3人. 15.(6.5,8) 解析:5.6)1298253(61=+++++=x ,8)14129364(61=+++++=y .由于回归直线方程a bx y+=ˆ恒过样本中心(x ,y ), 因此,回归直线方程a bx y+=ˆ必过定点(6.5,8). 16.mk P mk+解析:第i 组的频率为m k ,前i 组的频率为mk P +. 三、解答题17.解:(1)总体和样本数目较小,可采用抽签法较为简单易行.①先将30名学生进行编号、从1编到30,写在号签上(号签要形状,大小均相同);②将号签放入箱子中进行充分搅拌,然后逐个从箱子中取出6个号签,按这6个号签上的号码取出试卷即得到样本; (2)由于高二学生男、女身高有较大的差异,因此应按男、女分层,再按比例抽取,应抽取男生5人,女生7人.18.解:(1)在17个数据中,1.75出现了4次,次数最多,即众数是1.75;把成绩从小到大排列,中间一个数即第9个数据是1.70中的一个,即中位数是1.70;平均数)m (69.1)190.1360.1250.1(171≈⨯++⨯+⨯=Λx 因此,17名运动员成绩的众数、中位数、平均数依次为1.75m ,1.70m ,1.69m . (2)众数是1.75说明了跳1.75m 的人数最多;中位数是1.70m 说明了1.70m 以下和1.70m 以上的成绩个数相等;平均数是1.69m 说明了所有参赛运动员平均成绩是1.69m .19.解:平均速度为33)313537303827(61=+++++=甲x ,33)362834382933(61=+++++=乙x .所以方差为347])2(22)3(5)6[(612222222=-+++-++-=甲s , 338]3)5(15)4(0[612222222=+-+++-+=乙s .则,22乙甲s s >,即s 甲>s 乙因此,在平均数相同的情况下乙的成绩比甲的稳定,应选乙参加比赛比较合适. 20.解:(1)7.10)1.37.011.13.22.02.1(7110≈++--+-+=甲x , 6.10)3.22.14.13.031.13.0(7110≈++--+-+=乙x .(2)画出茎叶图如下:可见甲组数据的中位数是10.7,乙组数据的中位数是10.3; (3)22.2]4.207.1)8.1(6.1)8.0(5.0[7122222222≈+++-++-+=甲s , 35.2]6.16.029.04.27.13.0[7122222222≈++++++=乙s ;(4)此题甲的中位数大于乙的中位数,甲的平均数大于乙的平均数,数据乙波动较大. 21.解:画出散点图如下:由散点图可知:变量y 对x 成线性相关关系.算出如下的对应值表:i 1 2 3 4 5 6 x i 3 4 5 6 7 8 y i 40 50 55 60 67 70 x i y i120 200 275 360 469 560 2i x916253649645.5=x ,57=y∑==612199i ix,∑==611984i i i y x计算得:22261615.56199575.56198466⨯-⨯⨯-=--=∑∑==xx yx yx b i i ii i89.55.17103≈=, 61.245.589.557≈⨯-=-=x b y a .即得线性回归直线方程61.2489.5ˆ+=x y. 22.解:(1)成绩分组 频数 频率 [40,50) 2 0.04 [50,60) 3 0.06 [60,70) 10 0.2 [70,80) 15 0.3 [80,90) 12 0.24 [90,100) 8 0.16 合计501.00(2)(3)由频率分布直方图可知成绩在[70,80)分的学生所占总体的百分比是 0.03×10=0.3=30%;(4)由频率分布表可估计成绩在[70,100)分的学生所占总体的百分比是 0.3+0.24+0.16=0.7=70%.。

相关文档
最新文档