高考数学文科二轮专题攻略课件:第十四讲 统计与统计案例
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
考点聚焦 栏目索引
答案 B 依题意及系统抽样的意义可知,将这600名学生按编号 一次分成50组,每一组各有12名学生,第k(k∈N*)组抽中的号码是3
高考导航
+12(k-1),令3+12(k-1)≤300,得k≤103 ,因此A营区被抽中的人数是
4
25.令300<3+12(k-1)≤495,得 103 <k≤42,因此B营区被抽中的人数
考点聚焦 栏目索引
2.相关系数r
当r>0时,表明两个变量正相关; 当r<0时,表明两个变量负相关.
高考导航
r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对
值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|
r|大于0.75时,认为两个变量有很强的线性相关性.
考点聚焦 栏目索引
^
^
a, 其中b
( xi
i1 n
x)( yi
y)
,
(xi x)2
i1
^
^
a y b x.
考点聚焦 栏目索引 高考导航
解析 (1)作出散点图如下.
考点聚焦 栏目索引 高考导航
考点聚焦 栏目索引
y
11 13
16
15 6
20
21
6
16, (
i 1
yi
y)2
76,
r
6
(xi x)( yi y)
观察题图易知1号,4号,5号学生的面试分数在100分以下,
故选择的两人的面试分数均在100分以下的选择方法有(1,4),(1,
5),(4,5),共3种, 故选择的两人的面试分数均在100分以下的概率为 3 .
10
考点聚焦 栏目索引
方法归纳
(1)关于平均数、方差的计算 高考导航
样本数据的平均数与方差的计算关键在于准确记忆公式,要特别
注意区分方差与标准差,不能混淆,标准差是方差的算术平方根.
(2)求解频率分布直方图中相关数据的两个注意点
①小长方形的面积表示频率,直方图中的纵轴是
频率 组距
,而不是频
率.
②各组数据频率之比等于对应小长方形的高度之比.
考点聚焦 栏目索引
考点三 回归分析
1.线性回归方程
高考导航
n
方程
^
y
^
=b
x+
^
a
方法归纳
1.求线性回归方程的步骤 (1)计算 x, y ;
高考导航
(2)计算
n
xiyi,
n
xi2
;
i1
i1
n
n
^
(3)计算b
=
(xi x)(
i1
n
(xi
yi x)2
y)
=
xi yi
i1 n
xi2
nx y
,
2
nx
^
a
=
y
^
-b
x
;
i1
(4)写出线性回归方程
^
y
=
^
b
i1^
x+ a
.
注意:样本点的中心( x, y )必在回归直线上.
(3)平均数:样本数据的算术平均数,即
x
=
1 n
(x1+x2+…+xn).
(4)方差与标准差
方差:s2= 1 [(x1- x)2+(x2- x)2+…+(xn-x)2],
n
标准差:s=
1 n
[( x1
x)2
(
x2
x)2
( xn
x)2
]
.
考点聚焦 栏目索引
1.(2018广西南宁模拟)已知某地区中小学生人数和近视情况分别 高考导航
考点聚焦 栏目索引
(2018陕西质量检测一)基于移动互联网技术的共高享考单导航车被称为 “新四大发明”之一,短时间内就风靡全国,带给人们新的出行体 验.某共享单车运营公司的市场研究人员为了解公司的经营状况, 对该公司最近六个月内的市场占有率进行了统计,结果如表:
考点聚焦 栏目索引
月份
2017.8
5,b=15 = 1 ,
30 2
高考导航
估计这些学生面试分数的平均值为50× 1 +150× 1 +250× 2 +350×
2
3
15
1 =120分.
30
(2)从1~5号学生中任选两人的选择方法有(1,2),(1,3),(1,4),(1,5),(2,
3),(2,4),(2,5),(3,4),(3,5),(4,5),共10种.
考点聚焦 栏Βιβλιοθήκη 索引4.将参加夏令营的600名学生编号为001,002,…,600.采用系统抽 样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600
高考导航
名学生分住在三个营区,从001到300在A营区,从301到495在B营 区,从496到600在C营区,三个营区被抽中的人数依次为 ( ) A.26,16,8 B.25,17,8 C.25,16,9 D.24,17,9
^
y
=-30.4+13.5t;根据2010年至2016年的
^
数据(时间变量t的值依次为1,2,…,7)建立模型②: y =99+17.5t.
162 27
样本,且分别应抽取的人数是7,14,21,故选D.
考点聚焦 栏目索引
2.某校为了了解学生学习的情况,采用分层抽样的方法从高一 1 000人、高二1 200人、高三n人中抽取81人进行问卷调查,已知高
高考导航
二被抽取的人数为30,那么n= ( ) A.860 B.720 C.1 020 D.1 040 答案 D 根据分层抽样,得 1 200 ×81=30,得n=1 040.
i 1
6
6
(xi x)2 ( yi y)2
i 1
i 1
35 17.5 76
高考导航 35 35 0.96. 1 330 36.5
两变量之间具有较强的线性相关关系,故可用线性回归模型拟合市场占有率y与月份代码x之间的关系.
6
^
(2) b
(xi x)(
i 1
6
(xi
yi x)2
y)
35 17.5
(2018课标全国Ⅱ,18,12分)如图是某地区2000年至高2考0导1航6年环境基 础设施投资额y(单位:亿元)的折线图.
考点聚焦 栏目索引
为了预测该地区2018年的环境基础设施投资额,建立了y与t的两
个线性回归模型,根据2000年至2016年的数据(时间变量t的值依
高考导航
次为1,2,…,17)建立模型①:
^
称为线性回归方程,其中b
=
xi yi
i1 n
xi2
nx y ^
,a
2
nx
=
y
^
-b
x
,(
x,
y
)
i1
称为样本点的中心.
考点聚焦 栏目索引
2.样本数据的相关系数r
n
(xi x)( yi y)
高考导航
r=
i1 n
n
,
(xi x)2 ( yi y)2
i1
i1
r反映样本数据的相关程度,|r|越大,相关性越强.
环保部门统计了该地区12月1日至12月24日连续24天的空气质量 指数AQI,根据得到的数据绘制出如图所示的折线图,则下列说法 错误的是 ( )
考点聚焦 栏目索引
高考导航
A.该地区在12月2日空气质量最好 B.该地区在12月24日空气质量最差 C.该地区从12月7日至12月12日AQI持续增大 D.该地区的空气质量指数AQI与这段日期成负相关
2,
i 1
x 1 2 3 4 5 6 3.5, 6
^
^
a y b x 16 2 3.5 9,
^
y关于x的线性回归方程为 y 2x 9.
^
2018年2月份的月份代码为x 7, y 2 7 9 23,
估计该公司2018年2月份的市场占有率为23%.
考点聚焦 栏目索引
占有率.
考点聚焦 栏目索引
6
6
参考数据 : (xi x)2 17.5, (xi x)( yi y) 35, 1 330 36.5.
i1
i1
参考公式 : 相关系数r
n
(xi x)( yi y)
i1
高; 考导航
n
n
(xi x)2 ( yi y)2
i1
i1
n
回归直线方程为
^
y
^
b
x
4
是42-25=17.结合各选项知,选B.
考点聚焦 栏目索引
方法归纳 抽样方法主要有简单随机抽样、系统抽样和分层抽样三种,这三
高考导航
种抽样方法各自适用不同特点的总体,但无论哪种抽样方法,每一 个个体被抽到的概率都是相等的,都等于样本容量与总体个体数 的比值.
考点二 用样本估计总体
1.频率分布直方图的两个结论
2017.9
2017.10
2017.11
2017.12
2018.1
月份
1
2
3
4
5
6
代码x
高考导航
市场占有 11
13
16
15
20
21
率y(%)
(1)请在给出的坐标纸中作出散点图,并用相关系数说明能否用线
性回归模型拟合市场占有率y与月份代码x之间的关系;
(2)求y关于x的线性回归方程,并预测该公司2018年2月份的市场
×2%=200,抽取的高中生人数是2 000×2%=40,由题图乙可知高中
生的近视率为50%,所以抽取的高中生近视人数为40×50%=20,故
选B.
考点聚焦 栏目索引
2.(2018四川成都模拟)空气质量指数AQI是检测空气质量的重要 参数,其数值越大说明空气污染状况越严重,空气质量越差.某地
高考导航
1 000 1 200 n
考点聚焦 栏目索引
3.高三某班有学生56人,现将所有同学随机编号,用系统抽样的方 法抽取一个容量为4的样本,已知5号、33号、47号学生在样本中,
高考导航
则样本中还有一个学生的编号为 ( ) A.13 B.17 C.19 D.21 答案 C 从56名学生中抽取4人,用系统抽样的方法,则分段间 隔为14,若第一段抽出的号码为5,则其他段抽取的号码分别为19, 33,47.
考点聚焦 栏目索引
答案 D 由题意知,折线图中“点”的位置越高,空气质量越差; “点”的位置越低,空气质量越好.据此,结合所给折线图易知,选
高考导航
项A,B,C正确,选项D错误,故选D.
考点聚焦 栏目索引
3.(2018湖北武汉调研)从某选手的7个得分中去掉1个最高分,去
掉1个最低分后,剩余5个得分的平均数为91分,如图所示是该选手 高考导航
2.系统抽样的特点是将总体平均分成差异明显的几部分,按各层 个体数之比按事先确定的规则在各部分中抽取.适用范围:总体中 的个体数较多.
3.分层抽样的特点是将总体分成差异明显的几层,按各层个体数 之比分层进行抽取,适用范围:总体由差异明显的几部分组成.
考点聚焦 栏目索引
1.某单位有老年人27人,中年人54人,青年人81人,高为考了导航调查他们的 身体状况的某项指标,需从他们中间抽取一个容量为42的样本,则 应分别抽取老年人、中年人、青年人的人数是 ( ) A.7,11,18 B.6,12,18 C.6,18,17 D.7,14,21 答案 D 因为该单位共有27+54+81=162(人),样本容量为42,所 以应当按 42 = 7 的比例分别从老年人、中年人、青年人中抽取
(1)小长方形的面积=组距×
频率 组距
=频率.
(2)各小长方形的面积之和等于1.
考点聚焦 栏目索引 高考导航
考点聚焦 栏目索引
2.统计中的四个数字特征
(1)众数:在样本数据中,出现次数最多的那个数据. 高考导航
(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如
果数据的个数为偶数,就取中间两个数据的平均数作为中位数.
如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用 分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的 高中生近视人数分别为 ( )
考点聚焦 栏目索引
A.100,20 B.200,20
C.200,10 D.100,10
高考导航
答案 B 由题图甲可知学生总人数是10 000,样本容量为10 000
得分的茎叶图,其中有一个数字模糊,无法辨识,在图中用x表示,则
剩余5个得分的方差为
.
考点聚焦 栏目索引
答案 6 解析 去掉一个最高分99分,一个最低分87分,剩余的得分为93
高考导航
分,90分,(90+x)分,91分,87分,则 93 90 90 x 91 87=91,解得x=4,
5
所以这5个数的方差s2= 1×[(91-93)2+(91-90)2+(91-94)2+(91-91)2+(9
5
1-87)2]=6.
考点聚焦 栏目索引
4.(2018重庆调研)30名学生参加某大学的自主招生面试,面试分
数与学生序号之间的统计图如下:
高考导航
(1)下表是根据统计图中的数据得到的频率分布表,求出a,b的值, 并估计这些学生面试分数的平均值(同一组中的数据用该组区间 中点值作代表);
考点聚焦 栏目索引
面试分数 人数 频率
[0,100) a b
[100,200)
10
1 3
[200,300)
4
2 15
[300,400)
1 高考导航
1 30
(2)该大学的某部门从1~5号学生中随机选择两人进行访谈,求选
择的两人的面试分数均在100分以下的概率.
考点聚焦 栏目索引
解析 (1)面试分数在[0,100)内的学生共有30-10-4-1=15名,故a=1
栏目索引 高考导航
第十四讲 统计与统计案例
考情分析 栏目索引 高考导航
总纲目录
考点一 抽样方法 考点二 用样本估计总体 考点三 回归分析 考点三 独立性检验
总纲目录 栏目索引 高考导航
考点聚焦 栏目索引
考点一 抽样方法
高考导航
1.简单随机抽样的特点是从总体中逐个抽取.适用范围:总体 中的个体数较少.