2021届北师大版高考理科数一轮复习课件:第十一章 第3讲 变量间的相关关系、统计案例
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
B.②③① D.①③②
解析:选 D.第一个散点图中,散点图中的点是从左下角区域分布到右上角区域,则是正 相关;第三个散点图中,散点图中的点是从左上角区域分布到右下角区域,则是负相关; 第二个散点图中,散点图中的点的分布没有什么规律,则是不相关,所以应该是①③②.
2.某医疗机构通过抽样调查(样本容量 n=1 000),利用 2×2 列联表和 χ2 统计量研究患
(2)非线性相关 若两个变量 x 和 y 的散点图中,所有点看上去都在某条__曲__线___ (不是一条直线)附近波 动,则称此相关为非线性相关,此时可用一条_曲__线____来拟合. (3)不相关 如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.
2.最小二乘法
(1)最小二乘法
如果有 n 个点(x1,y1),(x2,y2),…,(xn,yn),可以用下面的表达式来刻画这些点与直 线 y=a+bx 的接近程度:[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2,使得上 式达到___最__小__值____的直线 y=a+bx 即为所求直线,这种方法称为最小二乘法.
肺病是否与吸烟有关.计算得 χ2=4.453,经查阅临界值表知 P(χ2≥3.841)≈0.05,现给
出四个结论,其中正确的是
()
A.在 100 个吸烟的人中约有 95 个人患肺病
B.若某人吸烟,那么他有 95%的可能性患肺病
C.有 95%的把握认为“患肺病与吸烟有关”
D.只有 5%的把握认为“患肺病与吸烟有关”
2.下面是 2×2 列联表:
则表中 a,b 的值分别为 A.94,72 C.52,74
x1 x2 合计
y1
y2
合计
a
21
73
22
25
47
b
46 120
B.52,50 D.74,52
解析:选 C.因为 a+21=73,所以 a=52.又 a+22=b,所以 b=74.
()
3.某研究机构对高三学生的记忆力 x 和判断力 y 进行统计分析,所得数据如表:
如表:
日期 2 日 7 日 15 日 22 日 30 日
温度 x/℃ 10 11 13 12 8
产卵数 y/个 23 25 30 26 16
(1)从这 5 天中任选 2 天,记这两天药用昆虫的产卵数分别为 m,n,求事件“m,n 均不 小于 25”的概率; (2)科研人员确定的研究方案是:先从这五组数据中任选 2 组,用剩下的 3 组数据建立 y 关于 x 的线性回归方程,再对被选取的 2 组数据进行检验.
( ×) ( √) ( √) ( √) ( √)
二、易错纠偏 常见误区 (1)混淆相关关系与函数关系; (2)对独立性检验 χ2 值的意义不清楚; (3)不知道线性回归直线必过样本点中心.
1.两个变量的相关关系有①正相关,②负相关,③不相关,则下列散点图从左到右分
别反映的变量间的相关关系是
()
A.①②③ C.②①③
3.变量 X 与 Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);
变量 U 与 V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1
表示变量 Y 与 X 之间的线性相关系数,r2 表示变量 V 与 U 之间的线性相关系数,则
一、思考辨析 判断正误(正确的打“√”,错误的打“×”) (1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系. (2)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示. (3)只有两个变量有相关关系,所得到的回归模型才有预测价值. (4)事件 X,Y 的关系越密切,由观测数据计算得到的 χ2 的观测值越大. (5) 通过线性回归方程 y=bx+a 可以估计和观测变量的取值和变化趋势.
①当 χ2___≤___2.706 时,没有充分的证据判定变量 A,B 有关联,可以认为变量 A,B 是 没有关联的; ②当 χ2>___2_._7_0_6__时,有 90%的把握判定变量 A,B 有关联; ③当 χ2>___3_._8_4_1__时,有 95%的把握判定变量 A,B 有关联; ④当 χ2>__6_._6_3_5___时,有 99%的把握判定变量 A,B 有关联.
(i)若选取的是 3 月 2 日与 30 日的两组数据,请根据 3 月 7 日、15 日和 22 日这三天的数 据,求出 y 关于 x 的线性回归方程; (ii)若由线性回归方程得到的估计数据与选出的检验数据的误差均不超过 2 个,则认为得 到的线性回归方程是可靠的,试问(i)中所得的线性回归方程是否可靠? 附:线性回归直线的斜率和截距的最小二乘估计公式分别为
2.某公司在 2019 年上半年的月收入 x(单位:万元)与月支出 y(单位:万元)的统计资料如
表所示:
月份 1 月份 2 月份 3 月份 4 月份 5 月份 6 月份
收入 x 12.3 14.5 15.0 17.0 19.8 20.6
支出 y 5.63 5.75 5.82 5.89 6.11 6.18
解析:设表中那个模糊看不清的数据为 m.由表中数据得 x =30,y =m+5307,所以样本
点
的
中
心
为
30,m+5307
,
因
为
样
本
点
的
中
心
在
线
性
回
归
直
线
上
,
所
以
m+307 5
=
0.67×30+54.9,解得 m=68.
答案:68
相关关系的判断(自主练透)
1.对变量 x,y 有观测数据(xi,yi)(i=1,2,…,10),得散点图如图①,对变量 u,v 有 观 测 数 据 (ui , vi)(i = 1 , 2 , … , 10) , 得 散 点 图 如 图 ②. 由 这 两 个 散 点 图 可 以 判 断
(2)线性回归方程
n
∑ 线性回归方程为 y=bx+a,其中 b=i=1
(i∑=nx1i-(-xxi)-(-x y)i-2 -y )=i∑=n1i∑=xn1iyxi2i--nn-x-x·2-y ,
a=__-y__-__b_-x______.
3.相关系数 r
(1)r=
n
(xi--x )(yi--y )
第十一章 统计与统计案例
第3讲 变量间的相关关系、统计案例
数学
01
基础知识 自主回顾
02
核心考点 深度剖析
03
方法素养 助学培优
04
高效演练 分层突破
一、知识梳理
1.相关性 (1)线性相关 若两个变量 x 和 y 的散点图中,所有点看上去都在___一__条__直__线____附近波动,则称变量 间是线性相关的,此时可用一条__直__线___来拟合.
根据统计资料,则
()
A.月收入的中位数是 15,x 与 y 有正线性相关关系
B.月收入的中位数是 17,x 与 y 有负线性相关关系
C.月收入的中位数是 16,x 与 y 有正线性相关关系
D.月收入的中位数是 16,x 与 y 有负线性相关关系
解析:选 C.月收入的中位数是15+2 17=16,收入增加,支出增加,故 x 与 y 有正线性相 关关系.
4.独立性检验
设 A,B 为两个变量,每一个变量都可以取两个值,变量 A:A1,A2=A1;变量 B:B1, B2=B1,通过观察得到下表所示数据:
B
B1
B2
A
总计
A1 A2 总计
a
b
c
d
a+c
b+d
a+b c+d n=a+b+c+d
n(ad-bc)2 则 χ2=____(__a_+__b_)_(__c_+__d_)__(__a_+__c_)__(__b_+__d_)___,用它的大小来检验变量之间是否独立.
i=1
=
n
(xi--x )2
i=1
n
(yi--y )2
i=1
n xiyi-n-x -y
i=1
.
n x2i -n-x 2
i=1
n y2i -n-y 2
i=1
(2)当 r>0 时,称两个变量__正__相___关_____. 当 r<0 时,称两个变量___负__相__关_____. 当 r=0 时,称两个变量_线__性__不__相__关___. r 的绝对值越接近于 1,表明两个变量之间的线性相关程度越高;r 的绝对值越接近 0, 表明两个变量之间的线性相关程度越低.
()
A.变量 x 与 y 正相关,u 与 v 正相关 B.变量 x 与 y 正相关,u 与 v 负相关 C.变量 x 与 y 负相关,u 与 v 正相关 D.变量 x 与 y 负相关,u 与 v 负相关 解析:选 C.由散点图可得两组数据均线性相关,且图①的线性回归方程斜率为负,图② 的线性回归方程斜率为正,则由散点图可判断变量 x 与 y 负相关,u 与 v 正相关.
解析:选 C.由已知数据可得,有 1-0.05=95%的把握认为“患肺病与吸烟有关”.故
选 C.
3.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了 5 次试验.根 据收集到的数据(如下表),由最小二乘法求得回归方程为 y=0.67x+54.9.
零件数 x/个 10 20 30 40 50 加工时间 y/min 62 ○ 75 81 89 现发现表中有一个数据模糊看不清,则该数据为________.
1.为调查中学生近视情况,测得某校男生 150 名中有 80 名近视,在 140 名女生中有 70
名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力
A.回归分析 C.独立性检验
B.均值与方差 D.概率
()
解析:选 C.“近视”与“性别”是两类变量,其是否有关,应用独立性检验判断.
x 6 8 Biblioteka 0 12y23 5 6则 y 对 x 的线性回归直线方程为
()
A.y=2.3x-0.7
B.y=2.3x+0.7
C.y=0.7x-2.3
D.y=0.7x+2.3
解析:选
4
C.因为
i=1
xiyi=6×2+8×3+10×5+12×6=158,x =6+8+410+12=9,y =
2+3+4 5+6=4.所以 b=36+641+581-004+×194×4-4 4×81=0.7,a=4-0.7×9=-2.3.故线性 回归直线方程为 y=0.7x-2.3.故选 C.
常用结论 1.求解线性回归方程的关键是确定回归系数 a,b,应充分利用线性回归直线过样本中 心点(-x ,-y ). 2.根据 χ2 的值可以判断两个分类变量有关的可信程度,若 χ2 越大,则两分类变量有关 的把握越大. 3.根据线性回归方程计算的 y 值,仅是一个预报值,不是真实发生的值.
二、教材衍化
(2)(i)由数据得 x =12, y =27,
3
3
(xi- x )(yi- y )=5, (xi- x )2=2,
i=1
i=1
所以 y 关于 x 的线性回归方程为 y=52x-3.
(ii)由(i)知,y 关于 x 的线性回归方程为 y=52x-3, 当 x=10 时,y=52×10-3=22,且|22-23|<2, 当 x=8 时,y=52×8-3=17,且|17-16|<2. 所以所得到的线性回归方程^y=52x-3 是可靠的.
回归分析(多维探究) 角度一 线性回归方程及其应用
(2020·福建福州模拟)随着我国中医学的发展,药用昆虫的使用相应愈来愈多.每
年春暖以后至寒冬前,是昆虫大量活动与繁殖的季节,易于采集各种药用昆虫.已知一
只药用昆虫的产卵数 y(单位:个)与一定范围内的温度 x(单位:℃)有关,于是科研人员
在 3 月份的 31 天中随机挑选了 5 天进行研究,现收集了该种药用昆虫的 5 组观测数据
【解】 (1)依题意得,m,n 的所有情况有{23,25},{23,30},{23,26},{23,16}, {25,30},{25,26},{25,16},{30,26},{30,16},{26,16},共 10 个. 设“m,n 均不小于 25”为事件 A,则事件 A 包含的基本事件有{25,30},{25,26},{30, 26},共 3 个. 所以 P(A)=130,即事件 A 的概率为130.
()
A.r2<r1<0
B.0<r2<r1
C.r2<0<r1
D.r2=r1
解析:选 C.对于变量 Y 与 X 而言,Y 随 X 的增大而增大,故 Y 与 X 正相关,即 r1>0;
对于变量 V 与 U 而言,V 随 U 的增大而减小,故 V 与 U 负相关,即 r2<0,故选 C.
判断相关关系的 2 种方法 (1)散点图法:如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如 果所有的样本点都落在某一直线附近,变量之间就有线性相关关系. (2)相关系数法:利用相关系数判定,当|r|越趋近于 1 时,相关性越强.