2018年高考数学(理)二轮复习 讲学案:考前专题七 概率与统计 第3讲 统计与统计案例(含答案解析)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第3讲统计与统计案例
1.以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等.
2.在概率与统计的交汇处命题,以解答题中档难度出现.
热点一抽样方法
1.简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体数较少.
2.系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成.
例1 (1)(2017届日照三模)从编号为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量为5的一个样本,若编号为42的产品在样本中,则该样本中产品的最小编号为________.
答案10
解析样本间隔为80÷5=16,∵42=16×2+10,∴该样本中产品的最小编号为10.
(2)某高级中学高一、高二、高三年级的学生人数分别为600,700,700,为了解不同年级学生的眼睛近视情况,现用分层抽样的方法抽取了容量为100的样本,则高三年级应抽取的学生人数为________.
答案35
解析由题意结合抽样比可得,高三年级应抽取的学生人数为100×700
600+700+700
=35.
思维升华(1)随机抽样的各种方法中,每个个体被抽到的概率都是相等的.
(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同.
(3)分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.
跟踪演练1 (1)(2017·葫芦岛协作体模拟)福利彩票“双色球”中红球的号码可以从01,02,03,…,32,33这33个二位号码中选取,小明利用如图所示的随机数表选取红色球的6个号码,选取方法是从第1行、第9列和第10列的数字开始从左到右依次选取两个数字,则第四个被选中的红色球号码为( )
A.12 B.33
C.06 D.16
答案 C
解析 被选中的红色球号码依次为17,12,33,06,所以第四个被选中的红色球号码为06,故选C.
(2)(2017届江西重点中学协作体联考)高三某班有学生36人,现将所有同学随机编号,用系统抽样的方法,抽取一个容量为4的样本,已知5号、23号、32号学生在样本中,则样本中还有一个学生的编号为( ) A .13 B .14 C .18 D .26
答案 B
解析 ∵高三某班有学生36人,用系统抽样的方法,抽取一个容量为4的样本, ∴样本组距为36÷4=9,则5+9=14, 即样本中还有一个学生的编号为14,故选B. 热点二 用样本估计总体
1.频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率
组距.
2.频率分布直方图中各小长方形的面积之和为1. 3.利用频率分布直方图求众数、中位数与平均数
利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者.在频率分布直方图中: (1)最高的小长方形底边中点的横坐标即众数. (2)中位数左边和右边的小长方形的面积和相等.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
例2 (1)(2017·湖南衡阳联考)一组数据共有7个数,记得其中有10,2,5,2,4,2,还有一个数没记清,但知道这组数的平均数、中位数、众数依次成等差数列,这个数的所有可能值的和为( ) A .-11 B .3 C .9 D .17 答案 C
解析 设没记清的数为x ,若x ≤2,则这列数为x,2,2,2,4,5,10,平均数为25+x
7,中位数为2,众数为2,所以2×2
=
25+x 7+2,得x =-11;若2<x ≤4,则这列数为2,2,2,x,4,5,10,则平均数为25+x
7
,中位数为x ,众数为2,所以2x =25+x 7+2,得x =3;若x ≥5,则这列数为 2,2,2,4,5,x,10或2,2,2,4,5,10,x ,则平均数为25+x 7,中
位数为4,众数为2,所以2×4=25+x
7
+2,得x =17,所以-11+3+17=9.
(2)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图可知,这200名学生中每周的自习时间不足22.5小时的人数是________.
答案45
解析阅读频率分布直方图可得,这200名学生中每周的自习时间不足22.5小时的人数是200×(0.02+0.07)×2.5=45.
思维升华(1)反映样本数据分布的主要方式:频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的平均数、众数、中位数和方差等.
(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.
跟踪演练2 (1)(2017届江西南昌二模)某人到甲、乙两市各7个小区调查空置房情况,调查得到的小区空置房的套数绘成了如图所示的茎叶图,则调查中甲市空置房套数的中位数与乙市空置房套数的中位数之差为( )
A.4 B.3
C.2 D.1
答案 B
解析由茎叶图可以看出甲、乙两市的空置房的套数的中位数分别是79,76,因此其差是79-76=3,故选B. (2)学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人,则n的值为( )
A.300 B.200
C.150 D.100
答案 D
解析根据频率分布直方图的面积和为1,可得[50,60)的频率为P=1-10×(0.01+0.024+0.036)=0.3,
又由P =30
n
=0.3,解得n =100.故选D.
热点三 统计案例 1.线性回归方程
方程y ^
=b ^
x +a ^
称为线性回归方程,其中b ^
=
∑n
i =1
x i y i -n x y
∑n i =1
x 2
i -n x
2
,a ^=y -b ^
x ,(x ,y )称为样本点的中心.
2.随机变量
K 2
=n (ad -bc )2
(a +b )(c +d )(a +c )(b +d )
,其中n =a +b +c +d .
例3 (1)(2017届山西太原三模)已知某产品的广告费用x (单位:万元)与销售额y (单位:万元)具有线性相关关系,其统计数据如下表:
附:b ^
=∑n
i =1
(x i -x )(y i -y )
∑n
i =1
(x i -x )2
=
∑n
i =1
x i y i -n x y
∑n i =1
x 2
i -n x
2
,a ^=y -b ^
x .
由上表可得线性回归方程y ^
=b ^
x +a ^
,据此模型预测广告费用为8万元时的销售额是( ) A .59.5万元 B .52.5万元 C .56万元 D .63.5万元
答案 A
解析 由题意可得
x =3+4+5+64=9
2, y =
25+30+40+45
4
=35,
则b ^=∑4
i =1
x i y i -4x y ∑4i =1
x 2i -4 x 2=665-4×9
2×3586-4×⎝ ⎛⎭
⎪⎫922
=7,
a ^
=y -b ^
x =3.5,
所以线性回归方程为y ^
=7x +3.5,
据此模型预报广告费用为8万元时的销售额是y =7×8+3.5=59.5(万元).
故选A.
(2)(2017·四川成都九校联考)某学校为了解该校学生对于某项运动的爱好是否与性别有关,通过随机抽查110名学生,得到如下2×2的列联表:
由公式K 2
=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )
,得K 2≈7.82.
附表:
参照附表,以下结论正确是( )
A .有99.5%以上的把握认为“爱好该项运动与性别有关”
B .有99.5%以上的把握认为“爱好该项运动与性别无关”
C .有99%以上的把握认为“爱好该项运动与性别有关”
D .有99%以上的把握认为“爱好该项运动与性别无关” 答案 C
解析 由题意知本题所给的观测值K 2
≈7.82>6.635,
∴这个结论有0.01的机会出错,即有99%以上的把握认为“爱好该项运动与性别有关”,故选C.
思维升华 (1)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值;回归直线过样本点的中心(x ,y ),应引起关注.
(2)独立性检验问题,要确定2×2列联表中的对应数据,然后代入公式求解K 2
即可.
跟踪演练3 (1)(2017届德州二模)某产品的广告费用x (万元)与销售额y (万元)的统计数据如表:
根据上表可得线性回归方程y ^
=9.4x +a ^
,据此模型预测,广告费用为6万元时的销售额为( ) A .65.5万元 B .66.6万元 C .67.7万元 D .72万元
答案 A
解析 x =2+3+4+54=3.5,y =26+39+49+54
4
=42,
代入线性回归方程,得42=9.4×3.5+a ^
,解得a ^
=9.1,
所以线性回归方程为y ^
=9.4x +9.1, 当x =6时,y =65.5,故选A.
(2)(2017·广东湛江二模)某同学利用课余时间做了一次社交软件使用习惯调查,得到2×2列联表如下:
附表:
则下列结论正确的是( )
A .在犯错的概率不超过0.005的前提下认为社交软件使用习惯与年龄有关
B .在犯错的概率超过0.005的前提下认为社交软件使用习惯与年龄有关
C .在犯错的概率不超过0.001的前提下认为社交软件使用习惯与年龄有关
D .在犯错的概率超过0.001的前提下认为社交软件使用习惯与年龄有关 答案 A
解析 K 2
=30×(4×2-16×8)
2
20×10×12×18
=10,由于7.879<10<10.828,可以认为在犯错的概率不超过0.005的前提下认为社
交软件使用习惯与年龄有关,故选A.
真题体验
1.(2017·山东改编)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为__________. 答案 3,5
解析 甲组数据的中位数为65,由甲、乙两组数据的中位数相等得y =5.又甲、乙两组数据的平均值相等, ∴15×(56+65+62+74+70+x )=1
5
×(59+61+67+65+78),∴x =3. 2.(2017·山东改编)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名
学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其线性回归方程为y ^
=b ^
x +a ^
.已知∑10
i =1
x i =225,
∑10
i =1
y i =1 600,b ^
=4.该班某学生的脚长为24,据此估计其身高为________.
答案 166
解析 ∵∑10
i =1x i =225,∴x =110∑10
i =1
x i =22.5. ∵∑10i =1y i =1 600,∴y =110∑10i =1
y i =160. 又b ^
=4,∴a ^
=y -b ^
x =160-4×22.5=70.
∴线性回归方程为y ^
=4x +70.
将x =24代入上式,得y ^
=4×24+70=166.
3.(2016·全国Ⅲ改编)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15 ℃,B 点表示四月的平均最低气温约为5 ℃.下列叙述不正确的是________.
①各月的平均最低气温都在0 ℃以上; ②七月的平均温差比一月的平均温差大; ③三月和十一月的平均最高气温基本相同; ④平均最高气温高于20 ℃的月份有5个. 答案 ④
解析 由题意知,平均最高气温高于20 ℃的有七月,八月,故④不正确.
4.(2017·江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件. 答案 18
解析 ∵样本容量总体个数=60200+400+300+100=3
50.
∴应从丙种型号的产品中抽取3
50×300=18(件).
押题预测
1.某公司为了解用户对其产品的满意度,从甲、乙两地分别随机调查了10个用户,将满意度的分数绘成茎叶图如图所示.设甲、乙两地的满意度分数的平均数分别为x 甲,x 乙,中位数分别为m 甲,m 乙,则( )
A.x 甲<x 乙,m 甲>m 乙
B.x 甲>x 乙,m 甲>m 乙
C.x 甲>x 乙,m 甲<m 乙
D.x 甲<x 乙,m 甲<m 乙
押题依据 从茎叶图中提取数字的特征(如平均数、众数、中位数等)是高考命题的热点题型. 答案 B
解析 甲地用户的平均满意度分数为
x 甲=
53+62+64+73+74+76+81+85+92+95
10
=75.5,
乙地用户的平均满意度分数为
x 乙=
51+56+62+64+73+73+81+82+83+91
10
=71.6,
所以x 甲>x 乙.
中位数分别为m 甲=74+762=75,m 乙=73+73
2=73,
所以m 甲>m 乙. 故选B.
2.某校为了解高三学生寒假期间的学习情况,抽查了100名学生,统计他们每天的平均学习时间,绘成的频率分布直方图如图所示,则这100名学生中学习时间在6至10小时之间的人数为________.
押题依据 频率分布直方图多以现实生活中的实际问题为背景,对图形的理解应用可以考查考生的基本分析能力,是高考的热点. 答案 58
解析 由图知,(0.04+0.12+x +0.14+0.05)×2=1,解得x =0.15,所以学习时间在6至10小时之间的频率是(0.15+0.14)×2=0.58, 所求人数为100×0.58=58.
3.某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:
(1)在给定的坐标系中画出表中数据的散点图;
(2)求出y
关于x 的线性回归方程y ^
=b ^
x +a ^
,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少小时?
(注:b ^
=
∑i =1
n
x i y i -n x y
∑i =1
n
x 2i -n x 2
,a ^=y -b ^
x )
押题依据 线性回归分析在生活中具有很强的应用价值,是高考的一个重要考点. 解 (1)散点图如图.
(2)由表中数据得∑i =1
4
x i y i =52.5,
x =3.5,y =3.5,∑i =1
4
x 2i =54,
∴b ^ =52.5-4×3.5×3.5
54-4×3.5
2
=0.7, a ^
=3.5-0.7×3.5=1.05,
∴y ^
=0.7x +1.05,回归直线如图所示.
(3)将x =10代入线性回归方程,
得y ^
=0.7×10+1.05=8.05,
故预测加工10个零件约需要8.05小时.
A 组 专题通关
1.(2017·山西实验中学模拟)一个学校高一、高二、高三的学生人数之比为2∶3∶5,若用分层抽样法抽取容量为200的样本,则应从高三学生中抽取的人数是( ) A .40 B .60 C .80 D .100
答案 D
解析 由分层抽样的概念可得,应从高三学生中抽取的人数是200×5
2+3+5
=100.故选D.
2.(2017届广东省东莞市二模)已知某学校有1 680名学生,现在采用系统抽样的方法抽取84人,调查他们对学校食堂的满意程度,将1 680人按1,2,3,…,1 680随机编号,则在抽取的84人中,编号落在[61,160]内的人数为( ) A .7 B .5 C .3 D .4 答案 B
解析 (160-60)×841 680
=5,故选B.
3.(2017·北京丰台区二模)某校高一1班、2班分别有10人和8人骑自行车上学,他们每天骑行路程(单位:千米)的茎叶图如图所示:
则1班10人每天骑行路程的极差和2班8人每天骑行路程的中位数分别是( ) A .14,9.5 B .9,9 C .9,10 D .14,9
答案 A
解析 2班共有8个数据,中间两个数是9和10,因此中位数为9.5,只有A 符合,故选A(1班10个数据最大为22,最小为8,极差为14).
4.(2017·福建泉州质检)2017年4月,泉州有四处湿地被列入福建省首批重要湿地名录,某同学决定从其中A ,B 两地选择一处进行实地考察,因此,他通过网站了解上周去过这两个地方的人对它们的综合评分,并将评分数据记录为下图的茎叶图,记A ,B 两地综合评分数据的平均数分别为A ,B ,方差分别为s 2
A ,s 2
B ,若已备受好评为依据,则下述判断较合理的是( ) A .因为A >B ,s 2
A >s 2
B ,所以应该去A 地 B .因为A >B ,s 2
A <s 2
B ,所以应该去A 地
C .因为A <B ,s 2
A >s 2
B ,所以应该去B 地 D .因为A <B ,s 2
A <s 2
B ,所以应该去B 地 答案 B
解析 计算可得A =8623>85=B ,s 2A <s 2
B (A 数据集中,B 数据分散),所以A 地好评分高,且评价稳定,故选B.
5.(2017届江西上饶二模)下面四个命题中,为真命题的是( )
①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;
②两个变量的线性相关程度越强,则相关系数的值越接近于1;
③判断两个分类变量X 与Y 的相关性:若K 2
越小,则说明“X 与Y 有关系”的把握程度越大; ④随机变量X ~N (0,1),则P (|X |<1)=2P (X <1)-1. A .①④ B .②④ C .①③ D .②③
答案 A
解析 ②错误,因为相关系数可以接近-1;③错误,K 2
越大,有关系的把握越大.故选A.
6.(2017届湖南长郡中学、衡阳八中等十三校联考)某校高三文科班150名男生在“学生体质健康50米跑”单项测试中,成绩全部介于6秒与11秒之间.现将测试结果分成五组:第一组[6,7];第二组(7,8],…,第五组(10,11].下图是按上述分组方法得到的频率分布直方图.按国家标准,高三男生50米跑成绩小于或等于7秒认定为优秀,若已知第四组共48人,则该校文科班男生在这次测试中成绩优秀的人数是________.
答案 9
解析 由题设中提供的频率分布直方图可以看出,这次测试中成绩优秀的人数的频率P =1-
⎝
⎛⎭⎪⎫0.38+0.16+0.08+48150×1=0.06,故这次测试中成绩优秀的人数为0.06×150=9. 7.(2017届四川广志联考)某同学使用计算器求30个数据的平均数时,错将其中的一个数据105输为15,那么由此求出的平均数与实际平均数的差是________. 答案 -3
解析 若将该数看做15,其他数据不变,其和记为M ,则其平均数为P 1=M +15
30
;若将该数看做105,其他数据不变,
其和仍为M ,则其平均数为P 2=
M +105
30
,则两次算得的平均数之差P 1-P 2=
M +15-M -105
30
=-3.
8.(2017·江西百校联盟联考)某设备的使用年数x 与所支出的维修总费用y 的统计数据如下表:
根据上表可得线性回归方程为y ^
=1.4x +a ^
.若该设备维修总费用超过12万元就报废,据此模型预测该设备最多可使用________年. 答案 8
解析 因为x =2+3+4+5+65
=4,
y =
1.5+4.5+5.5+6.5+7.5
5
=5.1,
故代入线性回归方程可得a ^
=5.1-1.4×4=-0.5,
所以线性回归方程为y ^
=1.4x -0.5, 当y =12时,解得x ≈8.9.
9.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是________.
表1
表2
表3
表4
答案 阅读量
解析 根据数据求出K 2
的值,再进一步比较大小.
表1中,a =6,b =14,c =10,d =22,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2
=52×(6×22-14×10)220×32×16×36=131 440
.
表2中,a =4,b =16,c =12,d =20,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2
=52×(4×20-16×12)2
20×32×16×36=637360
.
表3中,a =8,b =12,c =8,d =24,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2
=52×(8×24-12×8)2
20×32×16×36=1310
.
表4中,a =14,b =6,c =2,d =30,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2
=52×(14×30-6×2)2
20×32×16×36=3 757160
.
∵131 440<1310<637360<3 757160
, ∴与性别有关联的可能性最大的变量是阅读量.
10.(2017·全国Ⅱ)淡水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率直方图如下:
(1)设两种养殖方法的箱产量相互独立,记A 表示事件“旧养殖法的箱产量低于50 kg ,新养殖法的箱产量不低于50 kg”,估计A 的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01). 附:
K 2
=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )
.
解 (1)记B 表示事件“旧养殖法的箱产量低于50 kg”,C 表示事件“新养殖法的箱产量不低于50 kg”. 由题意知,P (A )=P (BC )=P (B )P (C ).
旧养殖法的箱产量低于50 kg 的频率为
(0.012+0.014+0.024+0.034+0.040)×5=0.62, 故P (B )的估计值为0.62.
新养殖法的箱产量不低于50 kg 的频率为 (0.068+0.046+0.010+0.008)×5=0.66, 故P (C )的估计值为0.66.
因此事件A 的概率估计值为0.62×0.66=0.409 2. (2)根据箱产量的频率分布直方图得列联表
K 2
=200×(62×66-34×38)2
100×100×96×104
≈15.705.
由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.
(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg 的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5,
箱产量低于55 kg 的直方图面积为
(0.004+0.020+0.044+0.068)×5=0.68>0.5, 故新养殖法箱产量的中位数的估计值为 50+0.5-0.340.068
≈52.35(kg).
B 组 能力提高
11.某公司有30名男职员和20名女职员,公司进行了一次全员参与的职业能力测试,现随机询问了该公司5名男职员和5名女职员在测试中的成绩(满分为30分),可知这5名男职员的测试成绩分别为16,24,18,22,20,5名女职员的测试成绩分别为18,23,23,18,23,则下列说法一定正确的是( ) A .这种抽样方法是分层抽样 B .这种抽样方法是系统抽样
C .这5名男职员的测试成绩的方差大于这5名女职员的测试成绩的方差
D .该测试中公司男职员的测试成绩的平均数小于女职员的测试成绩的平均数 答案 C
解析 根据抽样方法的特点,可知这种抽样既不是分层抽样,也不是系统抽样,故A ,B 是错误的;由这5名男职员和5名女职员的测试成绩得不出该公司男职员和女职员的测试成绩的平均数,故D 是错误的;根据公式,可以求得这5名男职员的测试成绩的方差为s 2
1=8,5名女职员的测试成绩的方差为s 2
2=6,所以C 正确.故选C.
12.(2017届四川大教育联盟三诊)某青少年成长关爱机构为了调研所在地区青少年的年龄与身高状况,随机抽取6岁,9岁,12岁,15岁,18岁的青少年身高数据各1 000个,根据各年龄段平均身高作出如图所示的散点图和回归
直线l .根据图中数据,下列对该样本描述错误的是( )
A .据样本数据估计,该地区青少年身高与年龄成正相关
B .所抽取数据中,5 000名青少年平均身高约为145 cm
C .直线l 的斜率的值近似等于样本中青少年平均身高每年的增量
D .从这5种年龄的青少年中各取一人的身高数据,由这5人的平均年龄和平均身高数据作出的点一定在直线l 上 答案 D
解析 在给定范围内,随着年龄增加,年龄越大身高越高,故该地区青少年身高与年龄成正相关,故A 正确;用样本数据估计总体可得平均数大约是145 cm ,故B 正确;根据直线斜率的意义可知斜率的值近似等于样本中青少年平均身高每年的增量,故C 正确;各取一人具有随机性,根据数据做出的点只能在直线附近,不一定在直线上,故D 错误.
13.为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表中的实验数据,计算得线性回归方程为y ^
=0.85x -0.25.由以上信息,可得表中c 的值为________.
答案 6
解析 x =3+4+5+6+75=5,y =2.5+3+4+4.5+c 5=14+c 5,代入线性回归方程,得14+c
5=0.85×5-0.25,
解得c =6.
14.(2017届广东潮州二模)当今,手机已经成为人们不可或缺的交流工具,人们常常把喜欢玩手机的人冠上了名号“低头族”,手机已经严重影响了人们的生活.一媒体为调查市民对低头族的认识,从某社区的500名市民中随机抽取n 名市民,按年龄情况进行统计的频率分布表和频率分布直方图如图:
(1)求出表中a ,b ,n 的值,并补全频率分布直方图;
(2)媒体记者为了做好调查工作,决定从所随机抽取的市民中按年龄采用分层抽样的方法抽取20名接受采访,再从抽出的这20名中年龄在[30,40)的选取2名担任主要发言人.记这2名主要发言人年龄在[35,40)的人数为ξ,求
ξ的分布列及期望.
解 (1)由题意及频率分布表可知,n =5÷0.05=100, 所以a =100×0.35=35,b =30
100=0.3.
补全频率分布直方图,如图所示.
(2)设抽出的20名受访者年龄在[30,35)和[35,40)的分别有m ,n 名,由分层抽样可得20100=m 35=n
30,
解得m =7,n =6.
所以年龄在[30,40)的共有13名. 故ξ的可能取值为0,1,2,
P (ξ=0)=C 06C 2
7C 213=726,P (ξ=1)=C 16C 1
7C 213=7
13,
P (ξ=2)=C 26C 07C 213=5
26
.
ξ的分布列为
∴E (ξ)=0×726+1×713+2×526=12
13
.。