高中数学一轮复习课件:第十章 统计、统计案例(必修3、选修1-2)10-3

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.(必修 3P94A 组 T3 改编)相关变量 x,y 的样本数据如下表: x12345 y22356
经回归分析可得 y 与 x 线性相关,并由最小二乘法求得回归 直线方程为y^=1.1x+a^,则a^=( )
A.0.1 B.0.2 C.0.3 D.0.4
[解析] -x =15×(1+2+3+4+5)=3,-y =15×(2+2+3+5 +6)=3.6,回归直线经过点(-x ,-y ),所以 3.6=1.1×3+a^,得a^ =0.3.故选 C.
[解析] 由题意知,[0.254(x+1)+0.321]-(0.254x+0.321)= 0.254.
[答案] 0.254
核心考点突破 H
精研考题 突破重难
考点一 相关关系的判断 【例 1】 (1)下列两变量中不存在相关关系的是( ) ①人的身高与视力;②曲线上的点与该点的坐标之间的关 系;③某农田的水稻产量与施肥量;④某同学考试成绩与复习时 间的投入量;⑤匀速行驶的汽车的行驶距离与时间;⑥商品的销 售额与广告费 A.①②⑤ B.①③⑥ C.④⑤⑥ D.②⑥
[解析] 由相关系数的定义及散点图所表达的含义,可知 r2<r4<0<r3<r1,故选 A.
[答案] A
考点二 线性回归分析 【例 2】 (2018·全国卷Ⅱ)如图是某地区 2000 年至 2016 年 环境基础设施投资额 y(单位:亿元)的折线图.
为了预测该地区 2018 年的环境基础设施投资额,建立了 y 与时间变量 t 的两个线性回归模型.根据 2000 年至 2016 年的数 据(时间变量 t 的值依次为 1,2,…,17)建立模型①:y^=-30.4+ 13.5t;根据 2010 年至 2016 年的数据(时间变量 t 的值依次为 1,2,…,7)建立模型②:y^=99+17.5t.
[答案] B
5.调查了某地若干户家庭的年收入 x(单位:万元)和年饮食 支出 y(单位:万元),调查显示年收入 x 与年饮食支出 y 具有线性 相关关系,并由调查数据得到 y 对 x 的回归直线方程:y^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加 1 万元,年饮 食支出平均增加________万元.
(2)对变量 x,y 有观测数据(xi,yi)(i=1,2,3,4,5),得表 1;对 变量 u,v 有观测数据(ui,vi)(i=1,2,3,4,5),得表 2.由这两个表可 以判断( )
表 1: x 1 2 34 5 y 2.9 3.3 3.6 4.4 5.1
表 2: u1 2 3 4 5 v 25 20 21 15 13
这说明从 2010 年开始环境基础设施投资额的变化规律呈线性增 长趋势,利用 2010 年至 2016 年的数据建立的线性模型y^=99+ 17.5t 可以较好地描述 2010 年以后的环境基础设施投资额的变化 趋势,因此利用模型②得到的预测值更可靠.
(ⅱ)从计算结果看,相对于 2016 年的环境基础设施投资额 220 亿元,由模型①得到的预测值 226.1 亿元的增幅明显偏低,而 利用模型②得到的预测值的增幅比较合理,说明利用模型②得到 的预测值更可靠.

n

xi--x 2
i=1
n xiyi-n-x -y
i=1
,a^=-y -b^-x ,其中b^是回归方程的
n x2i -n-x 2
i=1
斜率
在 y 轴上的 截距 , (-x ,-y ) 称为样本点的中心.
,a^是
(3)样本相关系数
n

xi--x yi--y
i=1
r=
,用它来衡量两个变量间的
A.变量 x 与 y 正相关,u 与 v 正相关 B.变量 x 与 y 负相关,u 与 v 正相关 C.变量 x 与 y 负相关,u 与 v 负相关 D.变量 x 与 y 正相关,u 与 v 负相关
[解析] (1)人的视力不受身高的影响,故①不存在相关关系; ②⑤是函数关系;③④是相关关系,故选 A.
2.回归直线方程的两个关注点 (1)样本数据点不一定在回归直线上,回归直线必过(-x ,-y ) 点. (2)在回归直线方程y^=b^x+a^中,b^>0 时,两个变量呈正相关 关系;b^<0 时,两个变量呈负相关关系.
[双基自测] 1.判断下列结论的正误.(正确的打“√”,错误的打“×”) (1)“名师出高徒”可以解释为教师的教学水平与学生的水 平成正相关关系.( ) (2)通过回归直线方程y^=b^x+a^可以估计预报变量的取值和 变化趋势.( ) (3)因为由任何一组观测值都可以求得一个线性回归方程,所 以没有必要进行相关性检验.( ) (4)事件 X,Y 关系越密切,则由观测数据计算得到的 K2 的观 测值越大.( ) [答案] (1)√ (2)√ (3)× (4)√
x2
c
d
c+d
总计 a+c b+d a+b+c+d
K2=a+ban+adc-bb+cd2 c+d(其中 n= a+b+c+d 为样本
容量),则利用独立性检验判断表来判断“X 与 Y 的关系”.
[辨识巧记] 1.两种关系——函数关系与相关关系 (1)函数关系是一种确定性关系,相关关系是一种非确定性关 系. (2)对线性相关关系求回归方程后,可以通过确定的函数关系 对两个变量间的取值进行估计.
(以上给出了 2 种理由,答出其中任意一种或其他合理理由均 可.)
线性回归分析问题的类型及解题方法 (1)求线性回归方程: ①利用公式,求出回归系数b^,a^. ②待定系数法:利用回归直线过样本点中心求系数. (2)利用回归方程进行预测:把回归直线方程看作一次函数, 求函数值. (3)利用回归直线判断正、负相关:决定正相关还是负相关的 是系数b^.
2.两个变量线性相关 (1)从散点图上看,如果这些点从整体上看大致分布在一条直线 附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线. (2)回归方程 ①最小二乘法:使得样本数据的点到回归直线的 距离的平方和 最小的方法叫最小二乘法.
n

xi--x yi--y
i=1
② 回 归 方 程 为 y^ = b^ x + a^ , 则 b^ =
[解析] 依题意,注意到题中相关的点均集中在某条直线的 附近,且该直线的斜率小于 1,结合各选项知,故选 B.
[答案] B
4.(选修 1-2P16 习题 1.2T1 改编)为考察某种药物预防疾病的 效果,对 100 只某种动物进行试验,得到如下的列联表:
患病 未患病 合计
服用药 10
40
50
没服用药 20
[对点训练]
随着我国经济的发展,居民的储蓄存款逐年增长.设某地区
城乡居民人民币储蓄存款(年底余额)如下表:
年份 2012 2013 2014 2015 2016
时间代号 t 1 2 3 4
5
储蓄存款 5 6 7 8 10
y(千亿元)
(1)求 y 关于 t 的回归方程y^=b^t+a^; (2)用所求回归方程预测该地区 2017 年(t=6)的人民币储蓄存 款.
30
50
合计
30
70 100
附表:
P(K2≥k0) 0.10 0.05 0.025 0.010
k0
2.706 3.841 5.024 6.635
经计算,统计量 K2≈4.762,则有________把握认为药物有
效.( )
A.99.5% B.95% C.99% D.97.5%
[解析] 因为 k2>3.841,所以有 95%的把握认为药物有效.故 选 B.
n tiyi-n-t -y
附:回归方程y^=b^t+a^中,b^=i=1
,a^=-y -b^-t .
n t2i -n-t 2
i=1
[解] (1)列表计算如下:
这里 n=5,-t =1ni=n1ti=155=3,-y =1ni=n1yi=356=7.2.
又 ltt=n t2i -n-t 2=55-5×32=10,lty=n tiyi-n-t -y =120
[对点训练] 1.已知变量 x 和 y 满足关系 y=-0.1x+1,变量 y 与 z 正相 关.下列结论中正确的是( ) A.x 与 y 正相关,x 与 z 负相关 B.x 与 y 正相关,x 与 z 正相关 C.x 与 y 负相关,x 与 z 负相关 D.x 与 y 负相关,x 与 z 正相关
n

xi--x 2
n

yi--y 2
i=1
i=1
线性相关关系的强弱.
①当 r>0 时,表明两个变量 正相关 ; ②当 r<0 时,表明两个变量 负相关 ; ③r 的绝对值越接近 1,表明两个变量的线性相关性 越强 ; r 的绝对值越接近 0,表明两个变量的线性相关性 越弱 .通常
当|r|>0.75 时,认为两个变量有很强的线性相关关系.
主干知识梳理 Z
主干梳理 精要归纳
[知识梳理] 1.变量间相关关系 (1)常见的两变量之间的关系有两类:一类是函数关系,另一 类是 相关关系 ;与函数关系不同, 相关关系 是一种非确定性 关系. (2)从散点图上看,点散布在从左下角到右上角的区域内,称 这两个变量为 正相关 . 点散布在从左上角到右下角的区域内,则称这两个变量 负相关 .
3.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的不同类别, 像这类变量称为分类变量. (2)列联表:列出两个分类变量的频数表,称为列联表.假设 有两个分类变量 X 和 Y,它们的可能取值分别为{x1,x2}和{y1, y2},其样本频数列联表为
2×2 列联表
y1
y2
Байду номын сангаас
总计
x1
a
b
a+b
(1)分别利用这两个模型,求该地区 2018 年的环境基础设施 投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
[解] (1)利用模型①,该地区 2018 年的环境基础设施投资额 的预测值为y^=-30.4+13.5×19=226.1(亿元).
利用模型②,该地区 2018 年的环境基础设施投资额的预测值 为y^=99+17.5×9=256.5(亿元).
(2)利用模型②得到的预测值更可靠.理由如下: (ⅰ)从折线图可以看出,2000 年至 2016 年的数据对应的点没 有随机散布在直线 y=-30.4+13.5t 上下,这说明利用 2000 年至 2016 年的数据建立的线性模型①不能很好地描述环境基础设施 投资额的趋势.2010 年相对 2009 年的环境基础设施投资额有明显 增加,2010 年至 2016 年的数据对应的点位于一条直线的附近,
(2)分别作出两组数据的散点图,如图所示,由散点图可知变 量 x 与 y 正相关,u 与 v 负相关,故选 D.
[答案] (1)A (2)D
判定两个变量正、负相关性的方法 (1)画散点图:点的分布从左下角到右上角,两个变量正相关; 点的分布从左上角到右下角,两个变量负相关. (2)相关系数:r>0 时,正相关;r<0 时,负相关. (3)线性回归方程中:b^>0 时,正相关;b^<0 时,负相关.
[解析] 因为 y=-0.1x+1,x 的系数为负,故 x 与 y 负相关; 而 y 与 z 正相关,故 x 与 z 负相关.故选 C.
[答案] C
2.对四组数据进行统计,获得以下散点图,关于其相关系 数的比较,正确的是( )
A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3 C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3
[答案] C
3.为研究语文成绩和英语成绩之间是否具有线性相关关系, 统计两科成绩得到如图所示的散点图(两坐标轴单位长度相同), 用回归直线y^=b^x+a^近似地刻画其相关关系,根据图形,以下结 论最有可能成立的是( )
A.线性相关关系较强,b^的值为 3.25 B.线性相关关系较强,b^的值为 0.83 C.线性相关关系较强,b^的值为-0.87 D.线性相关关系太弱,无研究价值

统计、统计案例


(必修 3、选修 1-2)
第三节
变量间的相关关系、统计案例
高考概览:1.会作两个有关联变量的数据的散点图,会利用 散点图认识变量间的相关关系;2.了解最小二乘法的思想,能根 据给出的线性回归方程系数公式建立线性回归方程;3.了解独立 性检验(只要求 2×2 列联表)的基本思想、方法及其简单应用;4. 了解回归分析的基本思想、方法及其简单应用.
相关文档
最新文档