相关系数-高中数学知识点讲解

合集下载

高二样本相关系数知识点

高二样本相关系数知识点

高二样本相关系数知识点高二的学生们在数学学习中,接触到了许多统计学上的知识点。

其中一个重要而且实用的概念就是样本相关系数。

本文将为大家介绍高二样本相关系数的相关知识点。

一、样本相关系数的概念样本相关系数是用来衡量两个变量之间线性相关关系强弱的指标,通常用符号r表示。

它的取值范围在-1到1之间,r越接近1意味着两个变量呈现强正相关,r越接近-1意味着两个变量呈现强负相关,r接近0则代表两个变量之间无线性相关关系。

二、样本相关系数的计算1. 首先,我们需要有一组样本数据,通常是通过观察或实验得到的。

2. 确定两个变量X和Y,并对应记录样本数据。

3. 计算相关系数的公式如下:r = (Σ(X - X)(Y - Ȳ)) / (√(Σ(X - X)²) * √(Σ(Y - Ȳ)²))其中,X和Ȳ分别代表变量X和Y的样本均值,Σ代表求和运算。

4. 将样本数据代入公式进行计算,即可得到样本相关系数r的值。

三、样本相关系数的意义样本相关系数的值可以帮助我们判断变量之间的线性相关关系及其强度。

以下是常见的样本相关系数取值解释:1. r > 0:变量X和Y呈现正相关关系。

当r接近1时,表示两个变量之间存在着强正相关关系。

2. r < 0:变量X和Y呈现负相关关系。

当r接近-1时,表示两个变量之间存在着强负相关关系。

3. r ≈ 0:变量X和Y之间无线性相关关系。

即使r接近0,也不代表两个变量之间没有其他非线性关系。

四、样本相关系数的应用样本相关系数在实际应用中有着广泛的用途,例如:1. 金融领域:用于分析股票、债券等金融产品之间的关联性,帮助投资者进行风险管理。

2. 经济学:用于衡量不同经济指标之间的关联性,以及预测经济趋势。

3. 医学研究:用于分析疾病发生与某种因素之间的相关性,帮助确定防治策略。

4. 市场调研:用于分析消费者行为与销售业绩之间的关系,优化产品市场推广策略。

五、样本相关系数的局限性在使用样本相关系数时,也需要注意其局限性:1. 相关性不代表因果关系:相关性只能告诉我们变量之间的相关程度,不能确定其中哪个变量是因果关系的原因。

3.1.2相关系数ppt课件

3.1.2相关系数ppt课件

相关系数
相关关系的测度
(相关系数取值及其意义)
完全负相关 无线性相关 完全正相关
-1.0
-0.5
0
+0.5
正相关程度增加
+1.0
r
负相关程度增加
小结
* 线性相关系数r:
r
x y
i 1 i
n
i
nx y yi2 ny 2
i 1 n
,其中 1 r 1 。
x nx
2 i =1 i=1
xiyi=1 222.6
i=1
6
xiyi-6 x y
i=1
6
(1)r=
≈-0.949 8. 6 6 x2-6 x 2 y2-6 y 2 i i i=1 i=1
由|r|>0.75,可知变量 y 和 x 存在很强的线性相关关系.
《名师一号》P64和P65
课后反思:(1)相关系数可以用来判断线 性相关程度的强弱,对于数据较大或不易 做散点图时效果特别明显;(2)本节课重 点是探讨相关系数的原理及其应用,可以 利用必修3中学过的最小二乘法原理给学生 讲解,核心是让学生明了学习相关系数的 意义所在;(3)本节课在最后应该设置一 道例题,让学生先利用相关系数公式验证, 然后再求出线性回归直线方程,这样教学 效果较好。
负相关
正相关
思考交流
对于课本P73给出的例题,变量的线性相关系数r 如何求? 我们知道,相关系数的计算公式为:
r
x y
i 1 i
n
i
nx y yi2 ny 2
i 1
n
n n
xi2 nx 2
i 1
n
n
要求r,只需求出相关的量: xi yi , x , yi2 ,

高中相关系数r公式两种形式

高中相关系数r公式两种形式

高中相关系数r公式两种形式
高中相关系数r公式是完全等价的,1式的分子∑(xi- ̄x)(yi- ̄y)=∑(xiyi-xi  ̄y- ̄xyi+ ̄x ̄y)=∑xiyi- ̄y∑xi- ̄x∑yi+n ̄x ̄y=∑xiyi-n ̄x ̄y-n ̄x  ̄y+n ̄x ̄y=∑xiyi-n ̄x ̄y,也就是2式的分子,1式的分母也可以化成2式分母的形式。

简单相关系数:又叫相关系数或线性相关系数,一般用字母P 表示,是用来度量变量间的线性关系的量。

复相关系数:又叫多重相关系数。

复相关是指因变量与多个自变量之间的相关关系。

例如,某种商品的季节性需求量与其价格水平、职工收入水平等现象之间呈现复相关关系。

典型相关系数:是先对原来各组变量进行主成分分析,得到新的线性关系的综合指标,再通过综合指标之间的线性相关系数来研究原各组变量间相关关系。

相关系数的范围与意义

相关系数的范围与意义

相关系数的范围与意义
相关系数是一个用于量化两个变量之间线性关系强度和方向的统计指标。

其取值范围通常为-1到1,包括-1、1和0这三个特殊的值。

当相关系数为1时,表示两个变量完全正相关,即一个变量增加时,另一个变量也按相同的比率增加。

当相关系数为-1时,表示两个变量完全负相关,即一个变量增加时,另一个变量按相同的比率减少。

当相关系数为0时,表示两个变量之间没有线性关系,但这并不意味着两个变量之间没有关系,可能存在其他类型的关系(如非线性关系)。

相关系数的绝对值(|r|)表示两个变量之间线性关系的强度。

|r|值越接近1,两个变量之间的线性关系越强;|r|值越接近0,两个变量之间的线性关系越弱。

一般来说,当|r|≥0.8时,可以认为两个变量之间有较强的线性关系;当0.3≤|r|<0.8时,可以认为两个变量之间有较弱的线性关系;当|r|<0.3时,可以认为两个变量之间的线性关系很弱,甚至可能没有线性关系。

然而,需要注意的是,即使相关系数很高,也不能保证两个变量之间存在因果关系。

相关关系并不意味着因果关系,这是统计分析中的一个重要原则。

此外,相关系数的解释还需要考虑到样本大小、数据的分布情况以及是否存在异常值等因素。

在实际应用中,需要综合考虑这些因素来正确解读相关系数的意义。

北师版高中数学选择性必修第一册精品课件 第7章 统计案例 相关系数 成对数据的线性相关性分析

北师版高中数学选择性必修第一册精品课件 第7章 统计案例 相关系数  成对数据的线性相关性分析

探究点二
线性回归分析
【例2】 随着网络的发展,网上购物越来越受到人们的喜爱,各大购物网站
为增加收入,促销策略越来越多样化,促销费用也不断增加,下表是某购物
网站2023年1~8月促销费用(单位:万元)和产品销量(单位:万件)的具体数据:
月份
1
2
3
4
5
6
7
8
促销费用X/万元
2
3
6
10
13
21
15
18
产品销量Y/万件
∑ ( -)( -)
=1


2
∑ ( -)
=1
^
∑ ( -)2
=1
^
(2)对于一组数据(x1,y1),(x2,y2),…,(xn,yn),回归直线 Y=X+,其中

^
=
∑ ( -)( -) ^
=1

2
∑ ( -)
=1
^
, = − .
=1
7
7
i=1
=1
∑ xiyi=18 542, ∑ 2 =124 393,
7
∴r=
∑ ( -)( -)
=1
7
2
7
∑ ( -) · ∑ ( -)
=1

7
=
2
=1
∑ -7
=1
7
2 7 2
2
2
( ∑ -7 )( ∑ -7 )
=1
=1
(方法二)观察表格中的数据可知,人的体重随着身高的增高而增长,因此人
的身高和体重之间存在相关关系.
(方法三)以x轴表示身高,以y轴表示体重,得到相应的散点图如图所示.

相关系数课件

相关系数课件

思索3:假如两个变量成负有关,从整体上看这两个变 量旳变化趋势怎样?其散点图有什么特点?
一种变量随另一种变量旳变大而变小,散点图中旳点 散布在从左上角到右下角旳区域.这就像函数中旳增 函数和减函数。即一种变量从小到大,另一种变量也 从小到大,或从大到小。
思索4:你能列举某些生活中旳变量成正有关或负有 关旳实例吗?
(2)计算
xi
n

yi
旳积,求
i
1
xi yi
(3)计算 xi2
i 1
(4)将上述有关成果代入公式,求b、a,写
出回归直线方程.
C.用回归直线方程处理应用问题
有关性
1、在散点图中,点有一种集中旳大致趋势 2、在散点图中,全部旳点都在一条直线附近
波动----线性有关。
y

••
• ••
• •ቤተ መጻሕፍቲ ባይዱ
• •
• •
r
i1
n
xi2 n(x)2
n
yi2
_
n(y)2
i1
i1
n
_
_
n
__
(xi x)( yi y)
xi yi n x y
b i1 n
i1 n
(xi x)2
xi2 n( x)2
i 1
i 1
例. 下表是随机抽取旳8对母女旳身高数据,试 根据这些数据探讨y与x之间旳关系.
解:画出散点图
有关系数r旳性质:
当r 0 时, 表明两个变量正相关; (1) 当r 0 时, 表明两个变量负相关.
(2) r 1 ;
(3) r 越接近于1,x,y旳线性有关
程度越强;
(4) r 越接近于0,x,y旳线性有关

高中数学知识点精讲精析 相关系数

高中数学知识点精讲精析 相关系数

1.2 相关系数1.相关系数是变量之间相关程度的指标。

样本相关系数用r表示,总体相关系数用ρ表示,相关系数的取值范围为[-1,1]。

|r|值越大,误差Q越小,变量之间的线性相关程度越高;|r|值越接近0,Q越大,变量之间的线性相关程度越低。

2.γ>0为正相关,γ<0为负相关。

γ=0表示不相关;γ的绝对值越大,相关程度越高。

3.两个现象之间的相关程度,一般划分为四级:如两者呈正相关,r呈正值,r=1时为完全正相关;如两者呈负相关则r呈负值,而r=-1时为完全负相关。

完全正相关或负相关时,所有图点都在直线回归线上;点子的分布在直线回归线上下越离散,r的绝对值越小。

当例数相等时,相关系数的绝对值越接近1,相关越密切;越接近于0,相关越不密切。

当r=0时,说明X和Y两个变量之间无直线关系。

通常|r|大于0.75时,认为两个变量有很强的线性相关性。

某种合成纤维的强度与其拉伸倍数有关。

下表是24个纤维样品的强度与相应的拉伸倍数的实测记录。

试求这两个变量间的经验公式。

【解析】将观察值(x i,y i),i=1,……,24在平面直角坐标系下用点标出,所得的图称为散点图。

从本例的散点图看出,强度y与拉伸倍数x之间大致呈现线性相关关系,一元线性回归模型aˆ,ˆ,这里n=24是适用y与x的。

现用公式(9.6)求b946.1171.11324193.650756.1301.1135.1272416.731266.1525.12724161.8296.731,93.650,61.8291.113,5.1272222=⨯-==⨯⨯-==⨯-======∑∑∑∑∑yy xy xx i i i i i i L L L y x y x y x∴15.0ˆˆ859.0ˆ=-===x b y aL L b xx xy由此得强度y 与拉伸倍数x 之间的经验公式为 x y859.015.0ˆ+=。

相关系数r的分级-详细解释说明

相关系数r的分级-详细解释说明

相关系数r的分级-概述说明以及解释1.引言1.1 概述概述:相关系数r是一种衡量两个变量之间关系强度和方向的统计量,其取值范围在-1到1之间。

当r=1时,表示两个变量呈完全正相关;当r=-1时,表示两个变量呈完全负相关;当r=0时,表示两个变量之间没有线性相关关系。

相关系数r的大小和符号能够帮助我们了解两个变量之间的趋势和关联程度,对于研究和分析数据具有重要意义。

本文将对相关系数r 的定义、计算方法以及应用进行详细介绍和分析。

通过对相关系数r的分级和解释,可以更好地理解和利用相关系数r在实际应用中的价值和意义。

1.2 文章结构文章结构部分的内容:文章结构部分主要介绍了本文的组织架构和内容安排。

首先,我们会在引言部分简要概括本文要讨论的内容,并介绍本文的目的和重要性。

接着,我们将在正文部分详细介绍相关系数r的定义、计算方法和应用,以帮助读者更好地理解相关系数r的概念和使用方法。

最后,在结论部分,我们将对整个文章进行总结,并展望相关系数r在未来的应用前景,最终得出结论。

通过本文的结构安排,读者可以清晰地了解到文章内容的组织结构和内容安排,提前了解到本文所涉及的主要知识点和重点讨论内容。

1.3 目的在本文中,我们旨在系统地探讨相关系数r的分级,通过对相关系数r的定义、计算方法和应用进行详细讲解,帮助读者全面理解相关系数r的概念和意义。

同时,我们也将对相关系数r的分级进行深入分析,以便读者对不同分级的相关系数r有更清晰的认识。

通过本文的阐述,读者将能够更好地理解并利用相关系数r,从而在实际应用中具有更高的价值和意义。

2.正文2.1 相关系数r的定义相关系数r是用来衡量两个变量之间线性关系强弱的统计指标。

相关系数r的取值范围在-1到+1之间,其绝对值越接近1表示两个变量之间的线性关系越强,接近0表示两个变量之间几乎没有线性关系,而正负号则表示了线性关系的方向。

当相关系数r为正时,表示两个变量呈正相关关系,即一个变量的增加伴随着另一个变量的增加;当相关系数r为负时,表示两个变量呈负相关关系,即一个变量的增加伴随着另一个变量的减少。

高中数学相关系数52页ppt课件

高中数学相关系数52页ppt课件

之间在数量上的变化关系有的是属于因果关系(一种现象
是另一种现象的原因,另一种现象是这种现象的结果), 有的却不能直接作出因果关系的解释。当一个或几个相互
联系的变量取一定数值时,与之相对应的另一个变量的值
虽然不确定,但它仍然按某种规律在一定范围内变化,变 量间的这种关系,被称为相关关系,如图5-0(b)。
(a),即一个变量增加(或减少),另一个变量也增加
(或减少)。
图5-4(a) 正相关
负相关:若散布点主要位于二、四象限,如图 5-4(b),即一个变量增加(或减少),另一个变
量也减少(或增加)。
图5-4(b) 负相关
零相关:散布点的变化无一定规律。如 图5-4(c)。
图5-4(c)零相关
四、相关系数
r是一个比值
r1=0.25,r2=0.5,r3=0.75,不能认为r1=r3-r2 或r2=2r1。 (3)相关系数受变量取值区间大小及观测值 个数的影响较大。
变量的取值区间越大,观测值个数越多,相关
系数受抽样误差的影响越小,结果就越可靠,如
二、计算方法 (一)基本公式计算法 步骤:
2、负相关:两个变量中,一个变量增大,
另一个变量对应值也随之减少;或一个变
量值减小,另一个变量对应值也随之增大,
两列变量变化方向相反。如学生学习能力
水平与其解题时间的关系;运动员赛跑与
所用时间之间的相关;学生学习能力与识
记所用时间之间的相关等。
3、零相关。两变量值的变化方向无规律。如
学生的身高与学生成绩的变化关系。
图5-1
散布图
相关散布图的用途: 1、判断相关是否直线式。 当两变量之间呈曲线趋势,其相关散布 图呈弯月状,说明两变量之间是非线性关 系,如图5-2(a)。

相关系数PPT课件

相关系数PPT课件
第1页/共21页
2、协方差的定义 (X, Y)为二维随机变量,则称下式为X、Y的协方差。
说明:
Cov(X,Y) =E{[ X-E(X)][Y-E(Y) ]}
⑴ 协方差为X,Y偏差[ X-E(X)] 与[Y-E(Y) ] 乘积的数学期望
(2) Cov(X,Y)>0,正相关;Cov(X,Y)<0, 负相关。=0,不相关
2 2
0.5,
0.4
x1*
0.5 0.4 0.3* 0.5 0.3 0.5 2* 0.4 0.3* 0.5
0.704
第20页/共21页
谢谢您的观看!
第21页/共21页
(3) Cov(aX, bY) =E{[aX-E(aX)][bY-bE(Y) ]} =E{ab [X-E(X)][Y-E(Y) ]} = ab cov(X, Y)
(4) Cov(X1+X2, Y)=E{[X1+X2 -E(X1+X2)][Y-E(Y) ]} =E{[X1 -E(X1)][Y-E(Y) ]}+E{[ X2 -E(X2)] [Y-E(Y) ]}} =Cov(X1, Y) + Cov(X2, Y)
(3) 当X,Y相同时,Cov(X, X) = D(X)=Var(X).
(4) 离散型 : COV ( X ,Y )
[xi E( X )][y j E(Y )] pij
ij
连续型 : COV (X ,Y ) [x E(X )][y E(Y )]f (x, y)dxdy
第2页/共21页
x12
2 1
(1
x1
)2
2 2
2x1(1
x1 )1 2
第19页/共21页
求D( P )

2025高中数学选择性必修第三册-8.1.2样本的相关系数【课件】

2025高中数学选择性必修第三册-8.1.2样本的相关系数【课件】

2.例2.有人收集了某城市居民收入(所有居民在一年内收入 的总和)与A商品销售额的10年数据,如下表所示.
第n年
1
2
3
4
5
6
7
8
9 10
居民年收入/亿元 32.2 31.1 32.9 35.8 37.1 38 39 43 44.6 46
A商品销售额/万元 25.0 30.0 34.0 37.0 39.0 41.0 42.0 44.0 48.0 51.0
样本相关系数r有时也称样本线性相关系数,|r|刻画了样本 点集中于某条直线的程度.当r=0时,只表明成对样本数据 间没有线性相关关系,但不排除它们之间有其他相关关系.
判断线性相关程度: 散点图+r
两个随机变量的相关性可以通过散点图对成对样本数 据进行分析,而样本相关系数r可以反映两个随机变量之 间的线性相关程度: r 的符号反映相关关系的正负性, |r|的大小反映两个变量线性相关的程度,即散点集中于 一条直线的程度.
n
n
r cos
-1 cos 1
-1 r 1
样本相关系数r的取值范围为[-1,1]
当|r|=1时,成对样本数据之间具有怎样的关系?
r cos
所以 当|r|=1时 =0或 ,向量 x' 与 y' 共线。
即存在实数 ,使得 y' x'
yi y xi x ,i 1, 2, , n
sy
i=1
i=1
n
xiyi -nxy
i=1
n xi2 - nx2 n yi2 - ny2
i=1
i=1
2.样本相关系数
n
xi -xyi - y
r=
i=1

高一数学相关性北师大版知识精讲

高一数学相关性北师大版知识精讲

高一数学相关性北师大版【本讲教育信息】一. 教学内容:相关性二. 学习目标1. 通过收集现实问题中两个变量的数据作出散点图,利用散点图直观认识变量间的相关关系.2. 经历用不同的估算方法来描述两个变量线性相关的过程.三、知识要点1、变量的相关性变量与变量之间的关系常见的有两类,一类是变量与变量之间存在着确定性的关系,如函数关系,当自变量给出以后,就有唯一的函数值与之对应;一类是变量与变量之间存在着非确定性的依赖关系,如人的身高与体重;2、相关关系当一个变量确定时,另一个变量的取值带有一定的随机性,我们把这两个变量之间的关系称为相关关系。

说明:相关关系与函数关系的异同点①相同点:均指两个变量的关系;②不同点:函数关系是一种确定的关系,描述了自变量与因变量之间的关系,是两个非随机变量之间的关系;相关关系是一种非确定性关系,是非随机变量与随机变量之间的关系。

3、相关关系的分类①正相关:存在相关关系的两个变量,如果一个变量随着另一个变量的增加而增加,则称这两个变量正相关;②负相关:存在相关关系的两个变量,如果一个变量随着另一个变量的增加而减小,则称这两个变量负相关。

4、散点图在研究两个变量的关系时,为了对变量之间的关系有一个大致的认识,把变量对应的点在坐标系中绘出所得到的图称为变量之间的散点图。

5、曲线拟合观察散点图,如果变量之间存在着某种关系,这些点会有一个大致集中的趋势,这种趋势通常可以用一条光滑的曲线来近似表示,这种近似的过程称为曲线拟合。

6、线性相关若两个变量x,y的散点图中,所有点看上去都在一条直线附近波动,则称这两个变量是线性相关的,此时我们可以用一条直线来近似表示。

7、非线性相关若两个变量x,y的散点图中,所有点看上去都在某条曲线(非直线)附近波动,则称此相关为非线性相关,此时我们可以用一条曲线(非直线)来拟合。

8、不相关若所有点在散点图中没有显示任何关系,则称变量间是不相关的。

9、正确认识数据相关与事件因果关系之间的联系①统计数据相关并不意味着两个事件必然具有因果关系(如公鸡打鸣的时间与太阳升起的时间,在统计数据上是相关的);具有因果关系的两件事,从统计数据上看有时也并不相关(如铀矿工人的寿命并不比其他人群短,表面上看在不在铀矿工作与寿命长短并无相关性)。

高中数学课件相关性.优秀文档PPT

高中数学课件相关性.优秀文档PPT
身高 165 157 155 175 168 157 178 160 163 体重 52 44 45 55 54 47 62 50 53
体重
散点图
80
60
40
20
0
身高
150 155 160 165 170 175 180
三、相关性
1、在散点图中,点有一个集中的大致趋势
2、在散点图中,所有的点都在一条直线附 近
热量百分比 25 34 20 19 26 20 19 24 19 13 口味记录 89 89 80 78 75 71 65 62 60 52
关于这两个变量间的关系,能得到什么结论?
口味记录
100
80
60
40
20
0 0
热量百分比
10
20
30
40
例2、下面是水稻产量与施化肥量的一组数据:
施化肥量 15 20 25 30 35 40 45
水稻产量 320 关于这两个变量间的关系,能得到什么结论?探究3、判断下面的数据组是否 Nhomakorabea相关关系?
330
360
410
460
470
480
探究3、判断下面的数据组是否有相关关系?
探究1、下列变量中具有相关关系的是( )
(1)水稻产量与施化肥量是线性相关吗? (1)水稻产量与施化肥量是线性相关吗?
2、在散点图中,所有的点都在一条直线附近
175569632一相关关系给出两个变量当一个变量一定时另一个变量的取值具有一定的随机性1注意与函数关系的区别2回归分析二散点图将样本中的所有数据点x平面直角坐标系中以表示具有相关关系的两个变量的一组数据的图形例1为了了解人的身高与体重的关系随机地抽取9名15岁的男生测得如下数据

高中数学选择性必修三 8 1 2 样本相关系数

高中数学选择性必修三 8 1 2 样本相关系数

8.1.2样本相关系数课标要求素养要求1.结合实例,会通过相关系数比较多组成对数据的相关性.2.了解样本相关系数与标准化数据向量夹角的关系. 通过学习样本相关系数,提升数学抽象及数据分析素养.新知探究散点图可以说明变量间有无线性相关关系,但无法量化两个变量之间的相关程度的大小,更不能精确地说明成对样本数据之间关系的密切程度,那么我们如何才能寻找到这样一个合适的量来对样本数据的相关程度进行定量分析呢?问题若样本系数r=0.97,则成对样本数据的相关程度如何?提示r=0.97,表明成对样本数据正线性相关程度很强.1.相关系数r的计算注意:相关系数是研究变量之间线性相关程度的量假设两个随机变量的数据分别为(x1,y1),(x2,y2),…,(x n,y n),对数据作进一步的“标准化处理”处理,用s x=1n∑ni=1(x i-x-)2,s y=1n∑ni=1(y i-y-)2分别除x i -x -和y i -y - (i =1,2,…,n ,x -和y -分别为x 1,x 2,…,x n 和y 1,y 2,…,y n 的均值),得⎝ ⎛⎭⎪⎫x 1-x -s x ,y 1-y -s y ,⎝ ⎛⎭⎪⎫x 2-x -s x ,y 2-y -s y ,…,⎝ ⎛⎭⎪⎫x n -x -s x ,y n -y -s y ,为简单起见,把上述“标准化”处理后的成对数据分别记为(x 1′,y 1′),(x 2′,y 2′),…,(x n ′,y n ′),则变量x 和变量y 的样本相关系数r 的计算公式如下: r =1n (x 1′y 1′+x 2′y 2′+…+x n ′y n ′)=∑n i =1 (x i -x -)(y i -y -)∑n i =1(x i -x -)2∑n i =1(y i -y -)2.2.相关系数r 的性质(1)当r >0时,称成对样本数据正相关;当r <0时,成对样本数据负相关;当r =0时,成对样本数据间没有线性相关关系. (2)样本相关系数r 的取值范围为[-1,1].当|r |越接近1时,成对样本数据的线性相关程度越强; 当|r |越接近0时,成对样本数据的线性相关程度越弱. 3.样本相关系数与标准化数据向量夹角的关系r =1n x ′·y ′=1n |x ′||y ′|cos θ=cos θ(其中x ′=(x 1′,x 2′,…,x n ′),y ′=(y 1′,y 2′,…,y n ′),|x ′|=|y ′|=n ,θ为向量x ′和向量y ′的夹角).拓展深化[微判断]1.回归分析中,若r =±1说明x ,y 之间具有完全的线性关系.(√) 2.若r =0,则说明成对样本数据间是函数关系.(×) 提示 若r =0,则说明成对样本数据间没有线性相关关系. 3.样本相关系数r 的范围是r ∈(-∞,+∞).(×) 提示 样本相关系数的范围是[-1,1]. [微训练]1.下面对相关系数r 描述正确的是( )A.r>0表明两个变量负相关B.r>1表明两个变量正相关C.r只能大于零D.||r越接近于0,两个变量相关关系越弱解析因r>0表明两个变量正相关,故A错误;又因r∈[-1,1],故B,C错误;两个变量之间的相关系数r的绝对值越接近于1,表明两个变量的线性相关性越强,r的绝对值越接近于0,表示两个变量之间几乎不存在线性相关,故D 正确.答案 D2.(多选题)下面的各图中,散点图与相关系数r符合的是()解析因为相关系数r的绝对值越接近1,线性相关程度越高,且r>0时正相关,r<0时负相关,故观察各选项,易知B不符合,A,C,D均符合.故选ACD. 答案ACD[微思考]当r=1或-1时,两个变量的相关性如何?提示当r=1时,两个变量完全正相关;当r=-1时,两个变量完全负相关.题型一线性相关性的检验【例1】现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩x(分)与入学后第一次考试的数学成绩y(分)如下:学生号12345678910 x 12010811710410311010410599108y 84648468696869465771请问:这10名学生的两次数学成绩是否具有线性相关关系?解 x -=110(120+108+…+99+108)=107.8, y -=110(84+64+…+57+71)=68,∑10i =1x 2i=1202+1082+…+992+1082=116 584, ∑10i =1y 2i=842+642+…+572+712=47 384, ∑10i =1x i y i =120×84+108×64+…+99×57+108×71 =73 796.所以相关系数为r =73 796-10×107.8×68(116 584-10×107.82)(47 384-10×682)≈0.750 6.由此可看出这10名学生的两次数学成绩具有线性相关关系.规律方法 利用相关系数r 判断线性相关关系,需要应用公式计算出r 的值,由于数据较大,需要借助计算器.【训练1】 假设关于某种设备的使用年限x (年)与所支出的维修费用y (万元)有如下统计资料:已知∑5i =1x 2i =90,∑5i =1y 2i =140.78,∑5i =1x i y i=112.3. (1)求x -,y -;(2)对x ,y 进行线性相关性检验. 解 (1)x -=2+3+4+5+65=4.y -=2.2+3.8+5.5+6.5+7.05=5.(2) ∑5i =1x i y i -5x - y -=112.3-5×4×5=12.3,∑5i =1x 2i -5x -2=90-5×42=10, ∑5i =1y 2i -5y -2=140.78-125=15.78, 所以r =12.310×15.78≈0.979.所以x 与y 之间具有很强的线性相关关系. 题型二 判断线性相关的强弱【例2】 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y 来衡量,这个指标越高,耐水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x (克/升)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据.求样本相关系数r 并判断它们的相关程度. 解 列表如下x -=1687=24,y -=202.947,r=∑7i=1x i y i-7x-y-∑7i=1x2i-7x-2∑7i=1y2i-7y-2=4 900.16-7×24×202.9474 144-7×2425 892.013 6-7×⎝⎛⎭⎪⎫202.9472≈0.96.由此可知,甲醛浓度与缩醛化度之间有很强的正线性相关关系.规律方法当相关系数|r|越接近1时,两个变量的相关关系越强,当相关系数|r|越接近0时,两个变量的相关关系越弱.【训练2】以下是收集到的新房屋的销售价格y(万元)和房屋的大小x(m2)的数据.(1)画出数据的散点图;(2)求相关系数r,并作出评价.解(1)图略.(2)列表如下:x -=5455=109,y -=1165=23.2,r =∑5i =1x i y i -5x - y -∑5i =1x 2i -5x-2∑5i =1y 2i -5y-2=12 952-5×109×23.260 975-5×10922 756.8-5×23.22=3081 570×65.6≈0.96,由此可知,新房屋的销售价格和房屋的大小之间有很强的正线性相关关系.一、素养落地1.通过本节课的学习,进一步提升数学抽象及数据分析素养.2.判断变量之间的线性相关关系,一般用散点图,但在作图中,由于存在误差,有时很难判断这些点是否分布在一条直线的附近,从而就很难判断两个变量之间是否具有线性相关关系,此时就可利用线性相关系数来判断.3.|r |越接近1,它们的散点图越接近一条直线,两个变量之间的相关关系越强. 二、素养训练1.两个变量之间的相关程度越低,则其线性相关系数的数值( ) A .越小 B .越接近1 C .越接近0D .越接近-1解析 由相关系数的性质知选C. 答案 C2.给定y 与x 的一组样本数据,求得相关系数r =-0.690,则( ) A .y 与x 线性不相关 B .y 与x 正线性相关 C .y 与x 负线性相关D .以上都不对 解析 因为r =-0.690<0,所以y 与x 负线性相关. 答案 C3.(多选题)下列说法正确的是( )A .变量间的关系是非确定性关系,因此因变量不能由自变量唯一确定B .线性相关系数可以是正的或负的C .如果r =±1,说明x 与y 之间完全线性相关D .线性相关系数r ∈(-1,1) 解析 ∵相关系数|r |≤1, ∴D 错误. 答案 ABC4.某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据:x 6 8 10 12 y2356已知记忆力x 和判断力y 是线性相关的,求相关系数r . 解 列表如下i x i y i x 2i y 2i x i y i 1 6 2 36 4 12 2 8 3 64 9 24 3 10 5 100 25 50 4 12 6 144 36 72 ∑361634474158x -=364=9,y -=164=4,∴r =∑4i =1x i y i -4x - y - ∑4i =1x 2i -4x -2∑4i =1y 2i -4y -2=158-4×9×4344-4×8174-4×16≈0.99.基础达标一、选择题1.已知某产品产量与产品单位成本之间的线性相关系数为-0.97,这说明二者之间存在着()A.高度相关B.中度相关C.弱度相关D.极弱相关解析由|-0.97|比较接近1知选A.答案 A2.关于两个变量x,y与其线性相关系数r,有下列说法:①若r>0,则x增大时,y也相应增大;②若|r|越趋近于1,则x与y的线性相关程度越强;③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.其中正确的有()A.①②B.②③C.①③D.①②③解析根据相关系数的定义,变量之间的相关关系可利用相关系数r进行判断:当r为正数时,表示变量x,y正相关;当r为负数时,表示两个变量x,y负相关;|r|越接近于1,相关程度越强;|r|越接近于0,相关程度越弱.故可知①②③正确.答案 D3.甲、乙、丙、丁四位同学各自对A,B两变量进行线性相关试验,并分别求得相关系数r如表:则这四位同学的试验结果能体现出A,B两变量有更强的线性相关性的是() A.甲B.乙C.丙D.丁解析由相关系数的意义可知,相关系数的绝对值越接近于1,相关性越强,结合题意可知,丁的线性相关性最强,故选D. 答案 D4.对于相关系数r ,下列结论正确的个数为( ) ①r ∈[-1,-0.75]时,两变量负相关很强 ②r ∈[0.75,1]时,两变量正相关很强③r ∈(-0.75,-0.3]或[0.3,0.75)时,两变量相关性一般 ④r =0.1时,两变量相关性很弱 A .1 B .2 C .3D .4解析 由相关系数的性质可知4个结论都正确. 答案 D5.对四对变量y 和x 进行线性相关检验,已知n 是观测值组数,r 是相关系数,且已知:①n =7,r =0.953 3;②n =15,r =0.301 2; ③n =17,r =0.499 1;④n =13,r =0.995 0. 则变量y 和x 线性相关程度最高的两组是( ) A .①② B .①④ C .②④D .③④解析 相关系数r 的绝对值越接近于1,变量x ,y 的线性相关程度越高. 答案 B 二、填空题6.已知某个样本点中的变量x ,y 线性相关,相关系数r >0,平移坐标系,则在以(x -,y -)为坐标原点的坐标系下的散点图中,大多数的点都落在第__________象限.解析 因为r >0,所以大多数的点都落在第一、三象限. 答案 一、三7.若已知∑ni =1 (y i -y -)2是∑ni =1 (x i -x -)2的4倍,∑ni =1 (x i -x -)(y i -y -)是∑ni =1 (x i -x -)2的1.5倍,则相关系数r 的值为__________.解析 由r =∑n i =1 (x i -x -)(y i -y -)∑n i =1(x i -x -)2∑ni =1(y i -y -)2,得r =34.答案 348.部门所属的10个工业企业生产性固定资产价值x 与工业增加值y 资料如下表(单位:百万元):根据上表资料计算的相关系数为__________. 解析 x -=3+3+5+6+6+7+8+9+9+1010=6.6.y -=15+17+25+28+30+36+37+42+40+4510=31.5.∴r =∑10i =1(x i -x -)(y i -y -)∑10i =1 (x i -x -)2∑10i =1(y i -y -)2≈0.991 8.答案 0.991 8 三、解答题9.5个学生的数学和物理成绩如表:试用散点图和相关系数r判断它们是否有线性相关关系,若有,是正相关还是负相关?解散点图法:涉及两个变量:数学成绩与物理成绩,可以以数学成绩为自变量,考察因变量物理成绩的变化趋势.以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图.由散点图可见,两者之间具有线性相关关系且是正相关.(相关系数r法)列表:i x i y i x2i y2i x i y i18070 6 400 4 900 5 60027566 5 625 4 356 4 95037068 4 900 4 624 4 76046564 4 225 4 096 4 16056062 3 600 3 844 3 720∑35033024 75021 82023 190∴r=∑5i=1x i y i-5x-y-⎝⎛⎭⎪⎫∑5i=1x2i-5x-2⎝⎛⎭⎪⎫∑5i=1y2i-5y-2=23 190-23 100250×40=0.9>0.∴两变量具有相关关系且正相关.10.某火锅店为了了解营业额y(百元)与气温x(℃)之间的关系,随机统计并制作了某6天当天营业额与当天气温的对比表.气温/℃261813104-1营业额/百元 20 24 34 38 50 64画出散点图并判断营业额与气温之间是否具有线性相关关系. 解 画出散点图如图所示.x -=16(26+18+13+10+4-1)≈11.7, y -=16(20+24+34+38+50+64)≈38.3,∑6i =1x i y i =26×20+18×24+13×34+10×38+4×50-1×64=1 910, ∑6i =1x 2i =262+182+132+102+42+(-1)2=1 286, ∑6i =1y 2i =202+242+342+382+502+642=10 172, 由r =∑6i =1x i y i -6x - y - ∑6i =1x 2i -nx -2∑6i =1y 2i -6y -2,可得r ≈-0.98.由于|r |的值较接近1,所以x 与y 具有很强的线性相关关系.能力提升11.为考察两个变量x ,y 的相关性,搜集数据如下表,则两个变量的线性相关程度( )x 5 10 15 20 25 y103105110111114A.很强 B .很弱 C .无相关D .不确定解析 ∑5i =1x i =75,∑5i =1y =543,∑5i =1x 2i =1 375,∑5i =1x i y i =8 285,∑5i =1y 2i =59 051,x -=15,y -=108.6,r =∑5i =1x i y i -5x - y -∑5i =1x 2i -5x -2∑5i =1y 2i -5y -2=8 285-5×15×108.61 375-5×152×59 051-5×108.62≈0.982 6,故相关程度很强. 答案 A12.下图是我国2012年至2018年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1~7分别对应年份2012~2018.由折线图看出,y 与t 有线性相关关系,请用相关系数加以说明. 附注:参考数据:∑7i =1y i =9.32,∑7i =1t i y i =40.17,∑7i =1(y i -y -)2=0.55,7≈2.646. 参考公式:相关系数r =∑ni =1(t i -t -)(y i -y -)∑n i =1 (t i -t -)2∑ni =1(y i -y -)2.解 由折线图中数据和附注中参考数据得t -=4,∑7i =1 (t i -t -)2=28,∑7i =1(y i -y -)2=0.55.∑7i =1 (t i -t -)(y i -y -)=∑7i =1t i y i -t -∑7i =1y i =40.17-4×9.32=2.89, r ≈ 2.890.55×2×2.646≈0.99. 因为y 与t 的相关系数近似为0.99,所以y 与t 的线性相关程度相当高.创新猜想13.(多选题)对于线性相关系数r ,以下说法错误的是( ) A .r 只能是正值,不能为负值B.||r ≤1,且||r 越接近于1,相关程度越大;相反则越小C.||r ≤1,且||r 越接近于1,相关程度越小;相反则越大 D .r <0时表示两个变量无相关解析 由相关系数的性质知B 正确,其余均错误. 答案 ACD。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

相关系数
1.相关系数
【知识点的知识】
1、概念:
相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度.于是,著名统计学家卡尔•皮尔逊设计了统计指标﹣﹣相关系数.相关系数是用以反映变量之间相关关系密切程度的统计指标.相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数.
2、相关系数用r 表示,计算公式为
其中:当r>0 时,表明两个变量正相关;当r<0 时,表明两个变量负相关;|r|≤1,且|r|越接近于 1,相关程度越大;|r|越接近于 0,相关程度越小.
3、残差:
相关指数R2 用来刻画回归的效果,其计算公式是
在含有一个解释变量的线性模型中,R2 恰好等于相关系数r 的平方.显然,R2 取值越大,意味着残差平方和越小,也就是模型的拟合效果越好.
【解题方法点拨】
建立回归模型的基本步骤:
(1)确定研究对象,明确哪个变量是解释变量,哪个是预报变量;
(2)画出解释变量和预报变量的散点图,观察它们之间的关系;
^(3)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程:푦=^
푏x +
^
푎);
(4)按一定规则估计回归方程中的参数(如最小二乘法);
1/ 2
(5)得出结果分析残差图是否有异常,若存在异常,则检查数据是否有误,或模型是否适当.当回归方程不是形
^如:푦=^
푏x +
^
푎时,我们称之为非线性回归方程.
2/ 2。

相关文档
最新文档