高考数学一轮复习 第十一章 统计与统计案例 第3讲 变量间的相关关系、统计案例教学案 理
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
A.月收入的中位数是 15,x 与 y 有正线性相关关系
B.月收入的中位数是 17,x 与 y 有负线性相关关系
C.月收入的中位数是 16,x 与 y 有正线性相关关系
D.月收入的中位数是 16,x 与 y 有负线性相关关系
解析:选 C.月收入的中位数是15+2 17=16,收入增加,
支出增加,故 x 与 y 有正线性相关关系.
A.r2<r1<0
B.0<r2<r1
C.r2<0<r1
D.r2=r1
解析:选 C.对于变量 Y 与 X 而言,Y 随 X 的增大而增大,
故 Y 与 X 正相关,即 r1>0;对于变量 V 与 U 而言,V 随 U 的 增大而减小,故 V 与 U 负相关,即 r2<0,故选 C.
判断相关关系的 2 种方法
附:线性回归直线的斜率和截距的最小二乘估计公式分
n
∑
(xi--x )(yi--y )
i=1
别为 b=
n
∑
(xi--x )2
,a=-y -b-x
i=1
【解】 (1)依题意得,m,n 的所有情况有{23,25},
{23,30},{23,26},{23,16},{25,30},{25,26},{25,
16},{30,26},{30,16},{26,16},共 10 个.
A.94,72
B.52,50
C.52,74
D.74,52
解析:选 C.因为 a+21=73,所以 a=52.又 a+22=b,
所以 b=74.
3.某研究机构对高三学生的记忆力 x 和判断力 y 进行
统计分析,所得数据如表:
x 6 8 10 12 y23 5 6
则 y 对 x 的线性回归直线方程为( )
再对被选取的 2 组数据进行检验.
(i)若选取的是 3 月 2 日与 30 日的两组数据,请根据 3
月 7 日、15 日和 22 日这三天的数据,求出 y 关于 x 的线性
回归方程;
(ii)若由线性回归方程得到的估计数据与选出的检验
数据的误差均不超过 2 个,则认为得到的线性回归方程是可
靠的,试问(i)中所得的线性回归方程是否可靠?
B.若某人吸烟,那么他有 95%的可能性患肺病
C.有 95%的把握认为“患肺病与吸烟有关”
D.只有 5%的把握认为“患肺病与吸烟有关”
解析:选 C.由已知数据可得,有 1-0.05=95%的把握
认为“患肺病与吸烟有关”.故选 C.
3.某车间为了规定工时定额,需要确定加工零件所花
费的时间,为此进行了 5 次试验法:如果所有的样本点都落在某一函数的曲
线附近,变量之间就有相关关系.如果所有的样本点都落在
某一直线附近,变量之间就有线性相关关系.
(2)相关系数法:利用相关系数判定,当|r|越趋近于 1
时,相关性越强.
回归分析(多维探究)
角度一 线性回归方程及其应用
(2020·福建福州模拟)随着我国中医学的发展,药
眼睛近视是否与性别有关时,用下列哪种方法最有说服力
()
A.回归分析
B.均值与方差
C.独立性检验 D.概率
解析:选 C.“近视”与“性别”是两类变量,其是否有
关,应用独立性检验判断.
2.下面是 2×2 列联表:
y1
y2
合计
x1
a 21 73
x2
22 25
47
合计 b 46 120
则表中 a,b 的值分别为( )
某基地蔬菜大棚采用无土栽培方式种植各类蔬 菜.过去 50 周的资料显示,该地周光照量 X(单位:小时) 都在 30 小时以上,其中不足 50 小时的有 5 周,不低于 50 小时且不超过 70 小时的有 35 周,超过 70 小时的有 10 周.根 据统计,该基地的西红柿增加量 y(千克)与使用某种液体肥 料的质量 x(千克)之间的对应数据为如图所示的折线图.
A.y=2.3x-0.7
B.y=2.3x+0.7
C.y=0.7x-2.3
D.y=0.7x+2.3
4
解析:选 C.因为 xiyi=6×2+8×3+10×5+12×6=
i=1
158, x =6+8+410+12=9, y =2+3+4 5+6=4.所以 b= 36+641+581-004+×194×4-4 4×81=0.7,a=4-0.7×9=-2.3.故 线性回归直线方程为 y=0.7x-2.3.故选 C.
则是不相关,所以应该是①③②.
2.某医疗机构通过抽样调查(样本容量 n=1 000),利
用 2×2 列联表和 χ2 统计量研究患肺病是否与吸烟有关.计
算得 χ2=4.453,经查阅临界值表知 P(χ2≥3.841)≈0.05,
现给出四个结论,其中正确的是( )
A.在 100 个吸烟的人中约有 95 个人患肺病
的观测值越大.( )
(5)通过线性回归方程 y=bx+a 可以估计和观测变量的
取值和变化趋势.( )
答案:(1)× (2)√ (3)√ (4)√ (5)√
二、易错纠偏
常见误区|K(1)混淆相关关系与函数关系;
(2)对独立性检验 χ2 值的意义不清楚;
(3)不知道线性回归直线必过样本点中心.
1.两个变量的相关关系有①正相关,②负相关,③不
【第 3 讲 变量间的相关关系、统 计案例】之小船创作
一、知识梳理 1.相关性 (1)线性相关 若两个变量 x 和 y 的散点图中,所有点看上去都在一条 直线附近波动,则称变量间是线性相关的,此时可用一条直 线来拟合. (2)非线性相关 若两个变量 x 和 y 的散点图中,所有点看上去都在某条 曲线(不是一条直线)附近波动,则称此相关为非线性相关, 此时可用一条曲线来拟合. (3)不相关 如果所有的点在散点图中没有显示任何关系,则称变量 间是不相关的. 2.最小二乘法 (1)最小二乘法 如果有 n 个点(x1,y1),(x2,y2),…,(xn,yn),可以 用下面的表达式来刻画这些点与直线 y=a+bx 的接近程度:
相关,则下列散点图从左到右分别反映的变量间的相关关系
是( )
A.①②③
B.②③①
C.②①③
D.①③②
解析:选 D.第一个散点图中,散点图中的点是从左下角
区域分布到右上角区域,则是正相关;第三个散点图中,散
点图中的点是从左上角区域分布到右下角区域,则是负相
关;第二个散点图中,散点图中的点的分布没有什么规律,
[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2,使 得上式达到最小值的直线 y=a+bx 即为所求直线,这种方
法称为最小二乘法.
(2)线性回归方程
线 性 回 归 方 程 为 y = bx + a , 其 中 b =
n
∑
(xi--x )(yi--y )
∑n xiyi-n-x ·-y
用昆虫的使用相应愈来愈多.每年春暖以后至寒冬前,是昆
虫大量活动与繁殖的季节,易于采集各种药用昆虫.已知一
只药用昆虫的产卵数 y(单位:个)与一定范围内的温度 x(单
位:℃)有关,于是科研人员在 3 月份的 31 天中随机挑选了
5 天进行研究,现收集了该种药用昆虫的 5 组观测数据如表:
日期
2 日 7 日 15 日 22 日 30 日
3.变量 X 与 Y 相对应的一组数据为(10,1),(11.3,
2),(11.8,3),(12.5,4),(13,5);变量 U 与 V 相对应
的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),
(13,1).r1 表示变量 Y 与 X 之间的线性相关系数,r2 表示变 量 V 与 U 之间的线性相关系数,则( )
i=1
i=1
a=-y -b-x =27-52×12=-3, 所以 y 关于 x 的线性回归方程为 y=52x-3. (ii)由(i)知,y 关于 x 的线性回归方程为 y=52x-3, 当 x=10 时,y=52×10-3=22,且|22-23|<2, 当 x=8 时,y=52×8-3=17,且|17-16|<2. 所以所得到的线性回归方程y^=52x-3 是可靠的. 角度二 相关系数及其应用
温度 x/℃
10
11
13
12
8
产卵数 y/个 23
25
30
26
16
(1)从这 5 天中任选 2 天,记这两天药用昆虫的产卵数
分别为 m,n,求事件“m,n 均不小于 25”的概率;
(2)科研人员确定的研究方案是:先从这五组数据中任
选 2 组,用剩下的 3 组数据建立 y 关于 x 的线性回归方程,
因
为
样
本
点
的
中
心
在
线
性
回
归
直
线
上
,
所
以
m+307 5
=
0.67×30+54.9,解得 m=68.
答案:68
相关关系的判断(自主练透)
1.对变量 x,y 有观测数据(xi,yi)(i=1,2,…,10), 得散点图如图①,对变量 u,v 有观测数据(ui,vi)(i=1,2,…,
10),得散点图如图②.由这两个散点图可以判断( )
充分利用线性回归直线过样本中心点(-x ,-y ).
2.根据 χ2的值可以判断两个分类变量有关的可信程度,
若χ2 越大,则两分类变量有关的把握越大.
3.根据线性回归方程计算的 y 值,仅是一个预报值,
不是真实发生的值.
二、教材衍化
1.为调查中学生近视情况,测得某校男生 150 名中有
80 名近视,在 140 名女生中有 70 名近视.在检验这些学生
i=1
i=1
(2)当 r>0 时,称两个变量正相关. 当 r<0 时,称两个变量负相关. 当 r=0 时,称两个变量线性不相关.
r 的绝对值越接近于 1,表明两个变量之间的线性相关
程度越高;r 的绝对值越接近 0,表明两个变量之间的线性
相关程度越低.
4.独立性检验
设 A,B 为两个变量,每一个变量都可以取两个值,变
设“m,n 均不小于 25”为事件 A,则事件 A 包含的基本
事件有{25,30},{25,26},{30,26},共 3 个.
所以 P(A)=130,即事件 A 的概率为130.
(2)(i)由数据得 x =12, y =27,
3
3
(xi- x )(yi- y )=5, (xi- x )2=2,
关联,可以认为变量 A,B 是没有关联的;
②当 χ2>2.706 时,有 90%的把握判定变量 A,B 有关
联;
③当 χ2>3.841 时,有 95%的把握判定变量 A,B 有关
联;
④当 χ2>6.635 时,有 99%的把握判定变量 A,B 有关
联.
常用结论
1.求解线性回归方程的关键是确定回归系数 a,b,应
2.某公司在 2019 年上半年的月收入 x(单位:万元)与
月支出 y(单位:万元)的统计资料如表所示:
月份 1 月份 2 月份
收入 x 12.3
14.5
支出 y 5.63
5.75
根据统计资料,则(
3 月份 15.0 5.82
)
4 月份 17.0 5.89
5 月份 19.8 6.11
6 月份 20.6 6.18
量 A:A1,A2=A1;变量 B:B1,B2=B1,通过观察得到下表所 示数据:
B
B1
B2
A
总计
A1
a
b
a+b
A2
c
d
c+d
总 计 a+c b+d n=a+b+c+d
则
χ2
=
n(ad-bc)2 (a+b)(c+d)(a+c)(b+d),用它的
大小来检验变量之间是否独立.
①当 χ2≤2.706 时,没有充分的证据判定变量 A,B 有
一、思考辨析
判断正误(正确的打“√”,错误的打“×”)
(1)相关关系与函数关系都是一种确定性的关系,也是
一种因果关系.( )
(2)利用散点图可以直观判断两个变量的关系是否可以
用线性关系表示.( )
(3)只有两个变量有相关关系,所得到的回归模型才有
预测价值.( )
(4)事件 X,Y 的关系越密切,由观测数据计算得到的 χ2
i=1
n
∑
(xi--x )2
=i=1 ∑n x2i-n-x 2 ,a=-y -b-x .
i=1
i=1
3.相关系数 r
(1)r =
n
(xi--x )(yi--y )
i=1
=
n
(xi--x )2
n
(yi--y )2
i=1
i=1
n xiyi-n-x -y
i=1
.
n x2i-n-x 2
n y2i-n-y 2
A.变量 x 与 y 正相关,u 与 v 正相关
B.变量 x 与 y 正相关,u 与 v 负相关
C.变量 x 与 y 负相关,u 与 v 正相关
D.变量 x 与 y 负相关,u 与 v 负相关
解析:选 C.由散点图可得两组数据均线性相关,且图①
的线性回归方程斜率为负,图②的线性回归方程斜率为正,
则由散点图可判断变量 x 与 y 负相关,u 与 v 正相关.
表),由最小二乘法求得线性回归方程为 y=0.67x+54.9.
零件数 x/个 10
20
30 40 50
加工时间 y/min 62
○
75 81 89
现发现表中有一个数据模糊看不清,则该数据为
________.
解析:设表中那个模糊看不清的数据为 m.由表中数据得
x =30, y =m+5307,所以样本点的中心为30,m+5307,