2022高三统考数学文北师大版一轮教师文档:第九章第七节 变量间的相关关系与统计案例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七节 变量间的相关关系与统计案例
授课提示:对应学生用书第189页
[基础梳理]
1.相关关系与回归方程
(1)相关关系的分类 ①正相关:从散点图上看,点分布在从左下角到右上角的区域内; ②负相关:从散点图上看,点分布在从左上角到右下角的区域内. (2)线性相关关系:从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫作回归直线. (3)回归方程
①最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫作最小二乘法.
②回归方程:两个具有线性相关关系的变量的一组数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程为y =bx +a ,则b =
∑n i =1 (x i -x -)(y i -y -)∑n i =1 (x i -x -)2=∑n i =1x i y i -nx - y -∑n i =1x 2i -nx -2,a
=y --bx -.其中,b 是回归方程的斜率,a 是在y 轴上的截距.
(4)样本相关系数
r =∑n i =1
(x i -x -)(y i -y -)∑n
i =1 (x i -x -)2∑n i =1 (y i -y -)2
,用它来衡量两个变量间的线性相关关系.
①当r >0时,表明两个变量正相关;
②当r <0时,表明两个变量负相关;
③r 的绝对值越接近1,表明两个变量的线性相关性越强;r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r |>0.75时,认为两个变量有很强的线性相关关系.
2.独立性检验
(1)2×2列联表:假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称2×2列联表)为:
y 1 y 2 总计
x 1 a b a +b
x 2 c d c +d
总计 a +c b +d a +b +c +d
(2)χ2统计量
χ2=n (ad -bc )2
(a +b )(c +d )(a +c )(b +d )
(其中n =a +b +c +d 为样本容量).
1.两种关系——函数关系与相关关系
(1)区别
①函数关系是一种确定性关系,相关关系是一种非确定性关系.
②函数关系是一种因果关系,相关关系不一定是因果关系,也可能是伴随关系.
(2)联系:对线性相关关系求回归方程后,可以通过确定的函数关系对两个变量间的取值进行估计.
2.回归直线方程的两个关注点
(1)样本数据点不一定在回归直线上,回归直线必过(x -,y -
)点.
(2)在回归直线方程y =bx +a 中,b >0时,两个变量呈正相关关系;b <0时,两个变量呈负相关关系.
3.回归分析的意义
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.在线性回归模型y =bx +a +e 中,因变量y 的值由自变量x 和随机误差e 共同确定,即自变量x 只能解释部分y 的变化,在统计中,我们把自变量x 称为解释变量,因变量y 称为预报变量.
4.独立性检验
利用独立性假设、随机变量χ2来确定是否有一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
两个分类变量X 和Y 是否有关系的判断标准:
统计学研究表明:
当χ2≤2.706时,认为没有充分证据显示X 与Y 有关系;
当χ2>3.841时,有95%的把握说X 与Y 有关;
当χ2>6.635时,有99%的把握说X 与Y 有关;
当χ2>10.828时,有99.9%的把握说X 与Y 有关.
[四基自测]
1.(基础点:回归分析的相关指数)两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数R 2如下,其中拟合效果最好的模型是 ( )
A .模型1的相关指数R 2为0.98
B .模型2的相关指数R 2为0.80
C .模型3的相关指数R 2为0.50
D .模型4的相关指数R 2为0.25
答案:A
2.(基础点:回归直线方程的特征)某研究机构对高三学生的记忆力x 和判断力y
则y 对x A .y =2.3x -0.7 B .y =2.3x +0.7
C .y =0.7x -2.3
D .y =0.7x +2.3
答案:C
3.(基础点:独立性检验)为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50
理科文科
男1310
女720
已知P(χ2≥3.841)≈0.05,2据表中数据,得到χ2=50×(13×20-10×7)2
≈4.844.
23×27×20×30
则认为选修文科与性别有关系出错的可能性为________.
答案:5%
4.(基础点:散点图与线性相关)为了研究某班学生
的脚长x(cm)与身高y(cm)的关系,从该班中抽取10
名学生,其脚长x和身高y的散点图如图所示,则y
与x间________(有、没有)相关关系.
答案:有
授课提示:对应学生用书第190页
考点一回归分析
挖掘1相关关系的判断/ 互动探究
[例1](1)(2020·镇江模拟)如图所示,有A,B,C,D,E 5组数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.
[详细分析]由散点图知呈带状区域时有较强的线性相关关系,故去掉D组数据.[答案]D
(2)下列两变量中不存在相关关系的是()
①人的身高与视力;②曲线上的点与该点的坐标之间的关系;③某农田的水稻产量与施肥量;④某同学考试成绩与复习时间的投入量;⑤匀速行驶的汽车的行驶距离与时间;⑥商品的销售额与广告费.
A.①②⑤B.①③⑥
C.④⑤⑥D.②⑥
[详细分析]①人的身高与视力无任何关系,故①不存在相关关系;
②曲线上的点与该点的坐标之间,存在一一对应的关系,故②不存在相关关系;
③某农田的水稻产量与施肥量,两变量有关系,但不确定,故存在相关关系;