【2021高考数学】第3节 相关性、最小二乘估计与统计案例

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第3节相关性、最小二乘估计与统计案例

考试要求 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆);3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;4.了解回归分析的基本思想、方法及其简单应用

.

知识梳理

1.变量间的相关关系

(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.

(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在左上角到右下角的区域内,两个变量的相关关系为负相关.

2.回归分析

对具有相关关系的两个变量进行统计分析的方法叫回归分析.其基本步骤是:(ⅰ)画散点图;(ⅱ)求回归直线方程;(ⅲ)用回归直线方程作预报.

(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两

1

个变量之间具有线性相关关系,这条直线叫作回归直线.

(2)回归直线方程的求法——最小二乘法.

设具有线性相关关系的两个变量x,y的一组观察值为(x i,y i)(i=1,2,…,n),则回归直线方程y=a+bx的系数为:

其中x=1

n

i=1

n

x i,y=

1

n

i=1

n

y i,(x,y)称为样本点的中心.

(3)相关系数

当r>0时,表明两个变量正相关;

当r<0时,表明两个变量负相关.

r的绝对值越接近于1,表明两个变量的线性相关性越强.

r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.

3.独立性检验

(1)设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=1A;变量B:B1,B2=1B.

2×2列联表

B B1B2总计

1

构造一个随机变量χ2=

n(ad-bc)2

(a+b)(c+d)(a+c)(b+d)

n=a+b+

c+d为样本容量.

(2)独立性检验

利用随机变量来判断“两个变量有关联”的方法称为独立性检验.

(3)当数据量较大时,在统计中,用以下结果对变量的独立性进行判断

①当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B 是没有关联的;

②当χ2>2.706时,有90%的把握判定变量A,B有关联;

③当χ2>3.841时,有95%的把握判定变量A,B有关联;

④当χ2>6.635时,有99%的把握判定变量A,B有关联.

[常用结论与微点提醒]

1.求解回归方程的关键是确定回归系数a,b,应充分利用回归直线过样本点的中心(x-,y-).

2.根据回归方程计算的y值,仅是一个预报值,不是真实发生的值.

3.根据χ2的值可以判断两个分类变量有关的可信程度,若χ2越大,则两分类变量有关的把握越大.

1

诊断自测

1.判断下列结论正误(在括号内打“√”或“×”)

(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( )

(2)通过回归直线方程y=bx+a可以估计预报变量的取值和变化趋势.( )

(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( )

(4)事件X,Y关系越密切,则由观测数据计算得到的χ2值越大.( )

答案(1)√(2)√(3)√(4)√

2.(老教材选修1-2P21问题提出改编)为调查中学生近视情况,测得某校在150名男生中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力( )

A.回归分析

B.均值与方差

C.独立性检验

D.概率

解析“近视”与“性别”是两类变量,其是否有关,应用独立性检验判断.

答案 C

3.(老教材选修1-2P7讲解改编)两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关系数r如下,其中拟合效果最好的模型是( )

A.模型1的相关系数r为0.98

B.模型2的相关系数r为0.80

C.模型3的相关系数r为0.50

D.模型4的相关系数r为0.25

1

相关文档
最新文档