【2021高考数学】第3节 相关性、最小二乘估计与统计案例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第3节相关性、最小二乘估计与统计案例
考试要求 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆);3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;4.了解回归分析的基本思想、方法及其简单应用
.
知识梳理
1.变量间的相关关系
(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.
(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在左上角到右下角的区域内,两个变量的相关关系为负相关.
2.回归分析
对具有相关关系的两个变量进行统计分析的方法叫回归分析.其基本步骤是:(ⅰ)画散点图;(ⅱ)求回归直线方程;(ⅲ)用回归直线方程作预报.
(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两
1
个变量之间具有线性相关关系,这条直线叫作回归直线.
(2)回归直线方程的求法——最小二乘法.
设具有线性相关关系的两个变量x,y的一组观察值为(x i,y i)(i=1,2,…,n),则回归直线方程y=a+bx的系数为:
其中x=1
n
∑
i=1
n
x i,y=
1
n
∑
i=1
n
y i,(x,y)称为样本点的中心.
(3)相关系数
当r>0时,表明两个变量正相关;
当r<0时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线性相关性越强.
r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.
3.独立性检验
(1)设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=1A;变量B:B1,B2=1B.
2×2列联表
B B1B2总计
1
构造一个随机变量χ2=
n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)
n=a+b+
c+d为样本容量.
(2)独立性检验
利用随机变量来判断“两个变量有关联”的方法称为独立性检验.
(3)当数据量较大时,在统计中,用以下结果对变量的独立性进行判断
①当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B 是没有关联的;
②当χ2>2.706时,有90%的把握判定变量A,B有关联;
③当χ2>3.841时,有95%的把握判定变量A,B有关联;
④当χ2>6.635时,有99%的把握判定变量A,B有关联.
[常用结论与微点提醒]
1.求解回归方程的关键是确定回归系数a,b,应充分利用回归直线过样本点的中心(x-,y-).
2.根据回归方程计算的y值,仅是一个预报值,不是真实发生的值.
3.根据χ2的值可以判断两个分类变量有关的可信程度,若χ2越大,则两分类变量有关的把握越大.
1
诊断自测
1.判断下列结论正误(在括号内打“√”或“×”)
(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( )
(2)通过回归直线方程y=bx+a可以估计预报变量的取值和变化趋势.( )
(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( )
(4)事件X,Y关系越密切,则由观测数据计算得到的χ2值越大.( )
答案(1)√(2)√(3)√(4)√
2.(老教材选修1-2P21问题提出改编)为调查中学生近视情况,测得某校在150名男生中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力( )
A.回归分析
B.均值与方差
C.独立性检验
D.概率
解析“近视”与“性别”是两类变量,其是否有关,应用独立性检验判断.
答案 C
3.(老教材选修1-2P7讲解改编)两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关系数r如下,其中拟合效果最好的模型是( )
A.模型1的相关系数r为0.98
B.模型2的相关系数r为0.80
C.模型3的相关系数r为0.50
D.模型4的相关系数r为0.25
1。