高考数学一轮复习 第九章 算法初步、统计、统计案例 9.4 用样本估计总体课件 理
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
月份 收入x 支出Y
1月份 12.3 5.63
2月份 14.5 5.75
3月份 15.0 5.82
4月份 17.0 5.89
5月份 19.8 6.11
6月份 20.6 6.18
• 根据统计资料,则( ) • A.月收入的中位数是15,x与Y有正线性相关关系 • B.月收入的中位数是17,x与Y有负线性相关关系 • C.月收入的中位数是16,x与Y有正线性相关关系 • D.月收入的中位数是16,x与Y有负线性相关关系
• 【答案】 (1)D (2)B
• 反思归纳 相关关系的直观判断方法就是作 出散点图,若散点图呈带状且区域较窄,说 明两个变量有一定的线性相关性,若呈曲线 型也是有相关性,若呈图形区域且分布较乱 则不具有相关性。
• 【变式训练】 (2016·长沙模拟)某公司在2015年上半年的收入x(单位:万元) 与月支出Y(单位:万元)的统计资料如表所示:
7
ti--t yi--y
(2)由-y =9.732≈1.331
i=1
及(1)得b^=
7
ti--t 2
2.89 = 28 ≈0.103,
i=1
a^=-y -b^-t ≈1.331-0.103×4≈0.92。 所以,y 关于 t 的回归方程为^y=0.92+0.10t。 将 2016 年对应的 t=9 代入回归方程得
第九章 算法初步、统计、统计案例
第四节 变量间的相关关系与统计案例
微知识 小题练 微考点 大课堂 微考场 新提升
•☆☆☆2017考纲考题考情☆☆☆
考纲要求
真题举例
命题角度
1.会作两个相关变量的数据的散点
图,会利用散点图认识变量间的相 2016,全国卷Ⅲ,18,12
关关系;
分(线性回归分析)
2.了解最小二乘法的思想,能根据 2015,全国卷Ⅰ,19,12
年份-2010 -4 -2 0 2 4 需求量-257 -21 -11 0 19 29 对预处理后的数据,容易算得,
-x =0,-y =3.2,
-4×-21+-2×-11+2×19+4×29-5×0×3.2
b^=
-42+-22+22+42-5×02
260 = 40 =6.5,
a^=-y -b^-x =3.2。
• (3)线性相关关系、回归直线
• 如果散点图中点的分布从整体上看大致在一条直线附近, 我们就称这两个变量之间具有线性相关关系,这条直线叫 做回归直线。
2.回归方程 (1)最小二乘法 使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小 二乘法。 (2)回归方程 方程^y=b^x+a^是两个具有线性相关关系的变量的一组数据(x1,y1), (x2,y2),…,(xn,yn)的回归方程,其中a^ ,b^ 是待定参数。
i=1
7
(ti
-
-t
)(yi
-
-y
)
=
7
t
iyi
-
-t
7
y
i
=
40.17
-
4×9.32
=
2.89
,
i=1
i=1
i=1
2.89 r≈0.55×2×2.646≈0.99。
因为 y 与 t 的相关系数近似为 0.99,说明 y 与 t 的线性相关程度相当 高,从而可以用线性回归模型拟合 y 与 t 的关系。
• 2.(选修1-2P16习题1.2T1改编)为考察某种药物预防疾病 的效果,对100只某种动物进行试验,得到如下的列联表: 患病 未患病 合计
服用药 10
40
50
没服用药 20
合计
30
30
50
70
100
• 经计算,统计量K2≈4.762,则有________把握认为药物有 效(P(K2≥3.841)=0.05,P(K2≥5.024=0.025)( )
15+17 【解析】 月收入的中位数是 2 =16,收入增加,支出增加,
故 x 与 Y 有正线性相关关系。故选 C。
【答案】 C
考点二 线性回归分析
• 【典例2】 (2016·全国卷Ⅲ)下图是我国2008年至2014年生活垃圾无 害化处理量(单位:亿吨)的折线图。
• (1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加 以说明;
微点提醒 1.回归分析中易误认为样本数据必在回归直线上,实质上回归直线 必过(-x ,-y )点,可能所有的样本数据点都不在直线上。 2.利用回归方程分析问题时,所得的数据易误认为是准确值,而实 质上是预测值(期望值)。 3.K2 越大,“X 与 Y 有关联”的把握程度越大。
小|题|快|练 一 、走进教材 1.(必修 3P94A 组 T3 改编)相关变量 x,y 的样本数据如下表:
• C.若从统计量中求出有95%的把握认为吸烟与患肺病有关 系,是指有5%的可能性使得推断出现错误
• D.以上三种说法都不正确
• 【解析】 根据独立性检验的思想知C项正确。 • 【答案】 C
微考点 大课堂
考点例析 对点微练
•考一【点典例1相】关关(1系)下的列判四断个散点图中,变量x与
y之间具有负的线性相关关系的是( )
• (2)为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班 学生的两科成绩得到如图所示的散点图(x轴、y轴的单位长度相同),用 回归直线方程=bx+a近似地刻画其相关关系,根据图形,以下结论最 有可能成立的是( )
• A.线性相关关系较强,b的值为1.25 • B.线性相关关系较强,b的值为0.83 • C.线性相关关系较强,b的值为-0.87 • D.线性相关关系较弱,无研究价值
2.回归直线方程^y=b^x+a^必经过样本点中心(-x ,-y )。 3.在分析两个变量的相关关系时,可根据样本数据作出散点图来确 定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线 性回归方程来估计和预测。
• 【变式训练】 某地最近十年粮食需求量逐年上升,下表是部分统计数 据:
年份
• 3.回归分析
• (1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法。
• (2)样本点的中心
• 对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn)中 (__x_,__y__)称为样本点的中心。
• (3)相关系数 • 当r>0时,表明两个变量_正__相__关__; • 当r<0时,表明两个变量_负__相__关__。
• 【解析】 (1)观察散点图可知,只有D选 项的散点图表示的是变量x与y之间具有负 的线性相关关系。故选D。
• (2)由散点图可以看出两个变量所构成的点 在一条直线附近,所以线性相关关系较强, 且应为正相关,所以回归直线方程的斜率 应为正数,且从散点图观察,回归直线方 程的斜率应该比y=x的斜率要小一些,综 上可知应选B。
经回归分析可得 y 与 x 线性相关,并由最小二乘法求得回归直线方程
为^y=1.1x+a,则 a=( )
A.0.1
B.0.2
C.0.3
D.0.4
【解析】 -x =3,-y =3.6,又回归直线经过样本中心点(-x ,-y ), 所以 3.6=1.1×3+a,解得 a=0.3。故选 C。
【答案】 C
• 【答案】 A
3.已知 x,y 的取值如下表,从散点图可以看出 y 与 x 线性相关,且
回归方程为^y=0.95x+a,则 a=( )
x
0
1
3
4
A.3.25
y
2.2
4.3
4.8
6.7
B.2.6
C.2.2
D.0
【解析】 由已知得-x =2,-y =4.5,因为回归直线经过点(-x ,-y ),
所以 a=4.5-0.95×2=2.6。故选 B。
微知识 小题练
Hale Waihona Puke 教材回扣 基础自测• 自|主|排|查
• 1.两个变量的线性相关
• (1)正相关 • 在散点图中,点散布在从左下角到__右__上_角____的区域,对
于两个变量的这种相关关系,我们将它称为正相关。
• (2)负相关 • 在散点图中,点散布在从左上角到__右__下_角__的区域,对于两
个变量的这种相关关系,我们将它称为负相关。
【答案】 B
• 4.在吸烟与患肺病这两个分类变量的计算中,下列说法正 确的是( )
• A.若K2的观测值为k=6.635,我们有99%的把握认为吸烟 与患肺病有关系,那么在100个吸烟的人中必有99人患有肺 病
• B.从独立性检验可知,有99%的把握认为吸烟与患肺病有 关时,我们说某人吸烟,那么他有99%的可能患有肺病
• 【答案】 C
2.(2016·葫芦岛模拟)某商品销售量 Y(件)与销售价格 x(元/件)负相关,
则其回归直线方程可能是( )
A.^y=-10x+200
B.^y=10x+200
C.^y=-10x-200
D.^y=10x-200
• 【解析】 因为商品销售量Y(件)与销售价 格x(元/件)负相关,所以<0,排除B、D。 又因为x=0时,y>0,所以应选A。
由上述计算结果,知所求回归直线方程为 ^y-257=b^(x-2010)+a^=6.5(x-2010)+3.2,
即^y=6.5(x-2010)+260.2。(*) (2)利用回归直线方程(*),可预测 2016 年的粮食需求量为 6.5(2016- 2010)+260.2=6.5×6+260.2=299.2(万吨)。 【答案】 (1)^y=6.5(x-2010)+260.2 (2)299.2 万吨
2006 2008 2010 2012 2014
需求量(万吨) 236 246 257 276 286
(1)利用所给数据求年需求量与年份之间的回归直线方程^y=b^x+a^; (2)利用(1)中所求出的回归直线方程预测该地 2016 年的粮食需求量。
• 【解析】 (1)由所给数据看出,年需求量与年份之间是近似直线上 升,下面来求回归直线方程,为此对数据预处理如下:
• r的绝对值越接近于1,表明两个变量的线性相关性越强。r的绝对值越 接近于0,表明两个变量之间几乎不存在线性相关关系。通常|r|大于 _0_._75__时,认为两个变量有很强的线性相关性。
• 4.独立性检验 • (1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变
量称为分类变量。
• (2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分 类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数 列联表(称为2×2列联表)为
• A.99.5%
B.95%
• C.99%
D.97.5%
• 【解析】 由K2≈4.762>3.841,可知有 95%的把握,认为药物有效。故选B。
• 【答案】 B
• 二、双基查验 • 1.观察下列各图: • 其中两个变量x,y具有相关关系的图是( )
• A.①② • C.③④
B.①④ D.②③
• 【解析】 由散点图知③④具有相关关系。 故选C。
• 2×2列联表
x1 x2 总计
y1 a c a+c
y2 b d b+d
总计 a+b c+d a+b+c+d
nad-bc2 构造一个随机变量 K2=a+b c+da+cb+d,其中 n=a+b+c
+d 为样本容量。
• (3)独立性检验
• 利用随机变量K2来判断“两个分类变量有关 系”的方法称为独立性检验。
^y=0.92+0.10×9=1.82。 所以预测 2016 年我国生活垃圾无害化处理量约为 1.82 亿吨。 【答案】 (1)见解析 (2)回归方程为^y=0.92+0.10t,生活垃圾无害
化处理量约为 1.82 亿吨
反思归纳 1.正确理解计算b^,a^的公式和准确的计算是求线性回归方 程的关键。
• (2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾 无害化处理量。
附注:
7
7
参考数据: yi=9.32, tiyi=40.17,
i=1
i=1
7
yi--y 2=0.55,
7
i=1
≈2.646。
参考公式:相关系数 r=
n
ti--t yi--y
i=1
,
n
ti--t 2
n
给出的线性回归方程系数公式建立 分(线性回归分析)
线性回归方程;
2015,福建卷,4,5分(线
3.了解独立性检验(只要求2×2列联 性回归分析)
表)的基本思想、方法及其简单应用;2014,安徽卷,18,12分
4.了解回归分析的基本思想、方法 (独立性检验)
及其简单应用。
1.以选择题、填空题 的形式考查求线性回 归系数或利用线性回 归方程进行预测,在 给出临界值的情况下 判断两个变量是否有 关; 2.在解答题中与频率 分布结合考查线性回 归方程的建立及应用 和独立性检验的应用。
yi--y 2
i=1
i=1
回归方程^y=a^+b^t 中斜率和截距的最小二乘估计公式分别为:b^=
n
ti--t yi--y
i=1
n
ti--t 2
,a^=-y -b^-t 。
i=1
【解析】 (1)由折线图中数据和附注中参考数据得
-t =4,
7
(ti--t )2=28,
i=1
7
yi--y 2=0.55,