统计学课件 第十一章 一元线性回归

合集下载

《一元线性回归》课件

《一元线性回归》课件
模型评价
使用评价指标对模型的性能进行评估。
《一元线性回归》PPT课 件
一元线性回归是一种用于探索变量之间关系的统计方法。本课件将介绍一元 线性回归的基本概念、模型、参数估计、模型评估以及Python实现。
一元线性回归-简介
一元线性回归是一种分析两个变量之间线性关系的方法。在这一节中,我们 将介绍一元线性回归的定义、使用场景以及它的重要性。
决定系数
4
方的平均值。
衡量模型对观测值的解释能力,取值范 围从0到1。
一元线性回归-Python实现
导入数据
使用Python的pandas库导入数据集。
划分数据集
将数据集划分为训练集和测试集。
预测结果
使用测试集数据对模型进行预测。
特征工程
选择合适的特征并对其进行处理。
训练模型
使用训练集数据训练线性Байду номын сангаас归模型。
一元线性回归-线性回归模型
1
简单线性回归模型
一个自变量和一个因变量之间的线性关
多元线性回归模型
2
系。
多个自变量和一个因变量之间的线性关
系。
3
线性回归模型的假设
包括线性关系、平均误差为零、误差具 有相同的方差、误差相互独立等。
一元线性回归-模型参数估计
1
最小二乘法
通过最小化观测值和模型预测值之间的平方误差来估计模型参数。
2
矩阵求导
使用矩阵求导的方法来计算模型参数的最优解。
3
梯度下降法
通过迭代的方式逐步优化模型参数,使得模型预测值与观测值之间的差距最小。
一元线性回归-模型评估
1
对模型误差的描述
通过各种指标来描述模型预测值和观测

一元线性回归PPT演示课件

一元线性回归PPT演示课件

196.2
15.8
16.0
102.2
12.0
10.0
本年固定资产投资额 (亿元) 51.9 90.9 73.7 14.5 63.2 2.2 20.2 43.8 55.9 64.3 42.7 76.7 22.8 117.1 146.7 29.9 42.1 25.3 13.4 64.3 163.9 44.5 67.9 39.7 97.1
6. r 愈大,表示相关关系愈密切.
例 11.7
根据例11.6的样本数据,计算不良贷款、贷款余额、应收 贷款、贷款项目、固定资产投资额之间的相关系数.
解:用Excel计算的相关系数矩阵如下.
三、相关系数的显著性检验
(一) r 的抽样分布
当样本数据来自正态总体,且 0 时,则
t r n 2 ~ t(n 2) 1 r2
时,yˆ ˆ0 .
二、参数的最小二乘估计
假定样本数据 (xi , yi ) , i 1,2,, n ,满足一元线性回归模 型, 根据(11.6)式则样本回归方程为
yˆi ˆ0 ˆ1xi , i 1,2,, n
(11.7)
最小二乘法是使因变量的观察值 yi 与估计值 yˆi 之间的离差平
i1 i1
n
n
n
n
n xi2 ( xi )2 n yi2 ( yi )2
i 1
i 1
i 1
i 1
( 11.1 ) ( 10.2 )
相关系数的取值范围及意义
1. r 的取值范围为[-1,1].
2. r 1 ,称完全相关,既存在线性函数关系.
r =1,称完全正相关. r =-1,称完全负相关. 3. r =0,称零相关,既不存在线性相关关系. 4. r <0,称负相关. 5. r >0,称正相关.

统计学-第11章一元线性回归学习指导

统计学-第11章一元线性回归学习指导

第11章一元线性回归(相关与回归)学习指导一、本章基本知识梳理基本知识点含义或公式相关关系 客观现象之间确实存在的、但在数量表现上不是严格对应的依存关系。

函数关系 客观现象之间确实存在的、而且数量表现上是严格对应的依存关系。

因果关系有相关关系的现象中能够明确其中一种现象(变量)是引起另一种现象(变量)变化的原因,另一种现象是这种现象变化的结果。

起影响作用的现象(变量)称为“自变量”;而受自变量影响发生变动的现象(变量)称为“因变量”。

因果关系∊相关关系,但相关关系中还包括互为因果关系的情况。

相关关系的种类 按涉及变量多少分为单相关、复相关;按相关方向分为正相关、负相关;按相关形态分为线性相关、非线性相关等。

线性(直线) 相关系数 简称相关系数,反映具有直线相关关系的两个变量关系的密切程度。

()()∑∑∑∑∑∑∑---==2222y yn x xn yx xy n SS S r yx xy相关系数的 显著性检验 ——t 检验 ()().2;,212:0:,0:020221Hn t t Hn t t rn r t HH,拒绝不能拒绝检验统计量-〉-〈--=≠=ααρρ回归方程中的 参数β0和β1为回归直线的截距、起始值,表示在没有自变量x 的影响(即x =0)时,其他各种因素对因变量y 的平均影响;β1为回归系数、斜率,表示自变量x 每变动一个单位,因变量y 的平均变动量。

β1的最小平方估计:∑∑∑∑∑⎪⎭⎫ ⎝⎛--=221x x n yx xy nβ估计标准误差反映因变量实际值与其估计值之间的平均差异程度,表明其估计值对实际值的代表性强弱。

其值越大,实际值与估计值之间的平均差异程度越大,估计值的代表性越差。

()代替。

用大样本条件下,分母可;n n yyS e 2ˆ2--=∑总离差平方和S S T反映因变量的n 个观察值与其均值的总离差。

回归离差平方和S S R 反映自变量x 的变化对因变量y 取值变化的影响;或者说,是由于x 与y 之间的线性关系引起的y 取值的变化,也称为可解释的平方和。

《一元线性回归》ppt课件

《一元线性回归》ppt课件
E (Y|X i)01X i
E (Y|Xi)01Xi2 E (Y|Xi)01 2Xi
三、总体回归模型与随机干扰项 〔 population regression model,PRM & stochastic disturbance/error〕
• 描画总体中解释变量X和被解释变量Y的个体值Yi之间的变 化规律:Yi=f〔Xi〕+μi
称为线性总体回归函数。其中,0,1是未知参数,称为回归系 数〔regression coefficients〕。
A1:“线性〞的含义
• 对变量为线性——解释变量以一次方的方式出现 • ○ 从几何上看,此时总体回归线是一条直线
• 对参数为线性——回归系数以一次方的方式出现 • ○ 从几何上看,此时总体回归线并不一定是直线
四、样本回归函数 〔sample regression function,SRF〕
•描画样本中解释变量X和被解释变量Y的之间的平均变化规 律:Y^i=f〔Xi〕
1、样本回归函数〔SRF〕
• 总体的信息往往无法掌握,因此PRF实践上未知 • 现实的情况只能是在一次观测中得到总体的一个样本,经过样本的信息来 估计总体回归函数。
1969 1991 2046 2068 2101
968 1045 1243 1474 1672 1881 1078 1254 1496 1683 1925
2189 2233
1122 1298 1496 1716 1969 1155 1331 1562 1749 2013
2244 2299
1188 1364 1573 1771 2035 1210 1408 1606 1804 2101
问题:能否从样本估计总体回归函数?
例2.2:从例2.1的总体中获得如下一个样本:

掌握一元线性回归分析-PPT模板

掌握一元线性回归分析-PPT模板

)(y x)2
y
)
a y bx
5
根据表计算
代入回归方程 yc a bx
6
序 号
产品产 生产费 量x 用y(万
(千吨) 元)
1 1.2
62
2 2.0
86
3 3.1
80
4 3.8
110
5 5.0
115
6 6.1
132
7 7.2
135
8 8.0
160
合 计
36.4
880
x2
1.44 4
9.61 14.44
207.54
xy 74.4 172 248 418 575 805.2 972 1 280
4 544.6
yc 66.79 77.11 91.3 100.33 115.81 130 144.19 154.51
880
(y yc)2 22.944 1 79.032 1 127.69 93.508 9 0.656 1
统计学基础
一、理解回归分析的概念
当给出自变量某一数值时,不能根据相 关系数来估计或预测因变量可能发生的数值。 回归分析就是对具有相关关系的变量之间数 量变化的一般关系进行测定,确定一个相关 的数学表达式,以便于进行估计或预测的统 计方法。
相关关系是一种数量关系不严格的相互依存关系。
2
二、掌握一元线性回归分析方法
1
一元线性回归分析的特点
在两个变量之间进行回归分析时,必须根据研究目的,具体确定
(1) 哪个是自变量,哪个是因变量。
在两个现象互为根据的情况下,可以有两个回归方程——y倚x回归方程和x倚y回
(2) 归方程。这和用以说明两个变量之间关系密切程度的相关关系只能计算一个是不相同的。

一元线性回归分析PPT课件

一元线性回归分析PPT课件
第18页/共40页
拟合程度评价
拟合程度是指样本观测值聚集在样本回归线周围的紧
密程度. ( Y t Y ) ( Y ˆ t Y ) ( Y t Y ˆ t)
n
n
n
(Y t Y )2 (Y ˆt Y )2 (Y t Y ˆ)2
t 1
t 1
t 1
n
(Yt Y)2 :总离差平方和,记为SST;
t1
n
第8页/共40页

食品序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
求和
脂肪Xt 4 6 6 8 19 11 12 12 26 21 11 16 14 9 9 5
热量Yt 110 120 120 164 430 192 175 236 429 318 249 281 160 147 210 120
第1页/共40页
回归分析的分类
一个自变量
一元回归
回归分析
两个及以上自变量
多元回归
线性 回归
非线性 回归
线性 回归
非线性 回归
第2页/共40页
一元线性回归模型
(一)总体回归函数
Yt=0+1Xt+ut
ut是随机误差项,又称随机干扰项,它是一个特殊的 随机变量,反映未列入方程式的其他各种因素对Y的 影响。
(ˆ1t(n2)Sˆ1)
2
第15页/共40页
回归分析的Excel实现
“工具”->“数据分析”->“回归”
第16页/共40页
ˆ 0
S ˆ 0
ˆ 1
S ˆ 1
(ˆ0t(n2)Sˆ0)
2
(ˆ1t(n2)Sˆ1)
2
第17页/共40页

一元线性回归模型ppt课件

一元线性回归模型ppt课件

差e的原因.
例1.(多选)在如图所示的四个散点图,适合用一元线性回
归模型拟合其中两个变量的是( AC ).
例2.在一元线性回归模型中,下列关于Y=bx+a+e的说法正确的是( C )
A.Y=bx+a+e是一次函数
B.响应变量Y是由解释变量x唯一确定的
C.响应变量Y除了受解释变量x的影响外,可能还受到其他因素的影响,这
Y bx a e
(1)

2
E (e ) 0,D(e ) .
追问3.对于父亲身高为xi的某一名男大学生,他的身高yi一定是bxi+a吗?
对于父亲身高为的某一名男大学生,他的身高 并不一定为
bxi+a ,它仅是该子总体的一个观测值,这个观测值与均值有一个误
差项ei=yi -(+a).
相关程度较高.
编号
1
2
3
4
5
6
7
8
9
10
11
12
13
14
父亲身高/cm 174
170
173
169182172180172168
166
182
173
164
180
儿子身高/cm 176
176
170
170
185
176
178
174
170
168
178
172
165
182
问题2.根据表中的数据,儿子身高和父亲身高这两个变量之间的关系可以
参数;e是Y与bx+a之间的随机误差. 模型中的Y也是随机变量,其值虽不能由变
量x的值确定,但却能表示为bx+a与e的和,前一部分由x所确定,后一部分是随

课件 一元线性回归

课件 一元线性回归

y=7.743x+8.371
求回归直线方程的步骤:
⑴计算平均数 x 与 y ; ⑶计算 ;
2
⑵计算xi与yi的积,求 x
⑷将结果代入公式求 a;
i
yi
xi
⑸用 b y a x 求 b ; ⑹写出回归方程 .
教材 P 198 A 组
最佳直线的方程即为
这条直线就称作为
回归直线
以直线表示的相关关系就叫做
一元线性关系
一般地,寻求数学公式表达,我们总结出一个普遍适用的式子
回归直线方程 y a bx 其中a、b是待定系数 ˆ

b
n
xi yi nx y , xi nx
2 2
i 1

n
i ⑵在直角坐标系内作出图象.
⑶观察图象中的点有什么特点?
70 60 50 40 30 20 10 0 -5 0
热茶销售量/杯
y=bx+a
5
10
15
20
25 30 最低气温/℃
W(a,b)=(26b+a-20)2+(18b+a-24)2+(13b+a-34)2 + (10b+a-38)2+ (4b+a-50)2+(- b+a-64)2
x y 2 25
设对变量 x,y 有如下观察数据:
4 40 5 48 6 50 7 60 8 75
试写出y对x的回归直线方程
解: x(平均)=16/3 y(平均)=149/3 x(平均)*y(平均)=2384/9 x i y i(总和)=1770 x i2(总和)=194 n=6
得 b=7.743

第十一章 一元线性回归.ppt

第十一章 一元线性回归.ppt
由(11—1)式可推知,若总体不存在直线关 系,则总体回归系数β=0;若总体存在直线关系, 则β≠0。所以对直线回归系数b的假设检验为: HO:β=0;HA:β≠0。
在HO成立的条件下,回归系数b服从t分布。
统计量t b / Sb , df n 2.........(.11 3) 其中,Sb S yx / S XX ,称为回归系数标准误
(三)直线回归方程的建立 在x、y的坐标平面上可作出无数条直线,而
回归直线是所有直线中最接近散点图中全部散点
的直线。设样本直线回归方程为:yˆ = a +bx
其中a是的估计值,称为 回归截距;b是β的估计值,
称为回归系数;yˆ i是+βxi的
估计值。
图11—2 直线回归散点图
回归值 yˆi与yi观察值间的偏差(或称残差)为:
Sb S yx / S XX 60.9525/ 1685 1.4849 t b / Sb 21.7122/1.4849 14.62
当df = n-2 = 12-2 = 10,查附表4得
t 0.05(10) = 2.228,t 0.01(10) = 3.169
t = 14.62 > 3.169
函数关系-有确定的数学表达式
直线回归分析
(确定性的关系)
一元回归分析

曲线回归分析

间 的 关
因果关系 回归分析
多元线性回归分析

多元回归分析
多元非线性回归分析
相关关系
(非确定性的关系)
简单相关分析-直线相关分析
平行关系 相关分析
复相关分析
多元相关分析
偏相关分析
主要内容:
第一节 直线回归

《一元线回归》课件

《一元线回归》课件

总结
本课程的收获和反思
总结本课程学习过程中的收获和个人反思。
后续学习与建议
提供后续学习一元线性回归模型的建议和推 荐资源。
参考文献
相关论文籍。
等式约束最小二乘法
探讨等式约束最小二乘法 在解决线性回归问题中的 优化效果。
经典案例分析
典型案例介绍
介绍一些经典的使用一元 线性回归模型解决的案例。
项目案例分析
详细分析一个实际项目中 运用一元线性回归模型解 决的问题和效果。
成果总结与展望
总结一元线性回归模型在 实际应用中的成果和展望 未来的发展方向。
本课程的目标和内容
明确本课程的学习目标,以及将覆盖的内容。
线性回归基础
线性回归的定义和公式
详细解释线性回归模型的定义和数学公式。
最小二乘法求解线性回归
介绍使用最小二乘法计算线性回归模型的参数。
回归系数和截距的意义和计算方法
解释回归系数和截距在线性回归中的意义和计算方法。
模型评估
模型拟合优度的评价 指标
讲解数据预处理的重要性以及常用的数据清 洗方法。
加载数据集
介绍如何加载数据集,为一元线性回归模型 训练做准备。
训练模型并预测结果
演示如何使用加载的数据集训练一元线性回 归模型,并进行预测。
优化算法
梯度下降算法
介绍梯度下降算法在优化 线性回归模型中的应用。
正规方程法
解释使用正规方程法求解 线性回归模型的计算过程。
《一元线回归》PPT课件
一元线性回归PPT课件大纲,旨在介绍一元线性回归的基本概念、模型评估、 优化算法,以及经典案例分析。从理论到实践,帮助大家掌握这一重要数据 分析方法。
课程简介

一元线性回归(S).ppt

一元线性回归(S).ppt

y)2 y)2
=1-SSE/SST
• R2∼[0,1] 越接近于1,拟合度越好。
简单回归中,R2与简单相关系数的关系
•判定系数的平方根即皮尔逊积矩相关系数
r (b的符号) r2 •其方向与样本回归系数 b (b1) 相同。 •R说明两变量间关联程度及方向。 •有夸大变量间相关程度的倾向,判定系数是更好的
点估计 区间估计
点估计
对于给定的 X 值,求出 Y 平均值的一个估计值或 Y 的一个个别值。
yˆ 123.15961.0788x 若 x = 169,则:
yˆ 123.15961.0788169
y 59.16 Y
点估计不能提供估计量的精确度。
在样本自变量取值范围之外进行预测要特别谨慎。
区间估计
果,因此可以认为I(即Yi)是在x条件下的正态分布。
回归方程的拟合优度检验- R2
• R2 (Coe. of determination):决定系数或判定系数。
• 拟合优度的度量。
• PRE意义。表明Y 的变异性能被估计的回归方程
解释的部分所占比例。


定义式:
r2
SSR SST
( yˆ (y
样本一元线性回归方程: (估计的回归方程)
样本回归系数
yˆ b0 b1x
以样本统计量估计总体参数
Yˆ 0 1X
总体未知参数
线性回归方程的参数估计-最小二乘法
• 所谓最小二乘法就是通过使残差平方和为最小来估计回 归系数的一种方法。
• 回归系数的意义
• b1表示X每增加一个单位 ,Y会增加b个单位;
回归系数的显著性检验X可否有 效地解释Y的线性变化。
H0 : 1 0 H1 : 1 0
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
STATISTICS (第三版 第三版)
相关系数的显著性检验
(例题分析)
各相关系数检验的统计量
作者:张占贞 作者:张占贞
青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
统计学
STATISTICS (第三版 第三版)
§11.2
一元线性回归
11.2.1 11.2.2 11.2.3 11.2.4
一元线性回归模型 参数的最小二乘估计 回归直线的拟合优度 显著性检验
统计学
STATISTICS (第三版 第三版)
变量间的关系
作者:张占贞 作者:张占贞
青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
统计学
STATISTICS (第三版 第三版)
函数关系
是一一对应的确定关系 2. 设有两个变量 x 和 y ,变量 y y 随变量 x 一起变化,并完 全依赖于 x ,当变量 x 取某 个数值时, y 依确定的关系 取相应的值,则称 y 是 x 的 函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 3. 各观测点落在一条线上
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
统计学
STATISTICS (第三版 第三版)
相关系数的经验解释
|r|≥0.8时,可视为两个变量之间高度相关 0.5≤|r|<0.8时,可视为中度相关 0.3≤|r|<0.5时,视为低度相关 |r|<0.3时,说明两个变量之间的相关程度 极弱,可视为不相关 5. 上述解释必须建立在对相关系数的显著性 进行检验的基础之上
3. 根据显著性水平α=0.05,查t分布表得tα/2(n-2)=2.069 由于 | t|=7.5344>tα/2(25-2)=2.069 , 拒绝 H0 , 不良贷 款与贷款余额之间存在着显著的正线性相关关系
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
统计学
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
散点图
(不良贷款对其他变量的散点图)
14 12 不 良 贷 款 10 8 6 4 2 0 0 10 20 30
10 8 6 4 2 0 0 100 200 300 400 贷款余额 不良贷款与贷款余额的散点图
14 12
累计应收贷款 不良贷款与累计应收贷款的散点图
14 12 不 良 贷 款 10 8 6 4 2 0
– 提出假设:H0:ρ = 0 ;H1:ρ ≠ 0
t= r 计算检验的统计量:
• 若|t|>tα/2,拒绝H0 • 若|t|<tα/2,不拒绝H0
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
确定显著性水平α,并作出决策
n−2 ~ t (n − 2) 2 1− r
x
作者:张占贞 作者:张占贞
青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
统计学
STATISTICS (第三版 第三版)
相关关系
(几个例子)
父亲身高y与子女身高x之间的关系 收入水平y与受教育程度x之间的关系 粮食单位面积产量y与施肥量x1 、降雨量 x2 、温度x3之间的关系 商品的消费量y与居民收入x之间的关系 商品销售额y与广告费支出x之间的关系
相关系数的显著性检验
作者:张占贞 作者:张占贞
青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
统计学
STATISTICS (第三版 第三版)
相关系数的显著性检验
(检验的步骤)
1. 检验两个变量之间是否存在线性相关关系 2. 等价于对回归系数 β1的检验 3. 采用R.A.Fisher提出的 t 检验 4. 检验的步骤为
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
统计学
STATISTICS (第三版 第三版)
相关关系
(correlation)
y
1. 变量间关系不能用函数关
系精确表达 2. 一个变量的取值不能由另 一个变量唯一确定 3. 当变量 x 取某个值时,变 量 y 的取值可能有几个 4. 各观测点分布在直线周围
1. 2. 3. 4.
作者:张占贞 作者:张占贞
青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
统计学
STATISTICS (第三版 第三版)
相关系数
(例题分析)
用Excel计算相关系数
作者:张占贞 作者:张占贞
青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
统计学
STATISTICS (第三版 第三版)
不 良 贷 款
10 8 6 4 2 0 0 10 20 30 40 贷款项目个数
0
50
100
不良贷款与贷款项目个数的散点图
作者:张占贞 作者:张占贞
不良贷款与固定资产投资额的散点图
青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
150 200 固定资产投资额
统计学
STATISTICS (第三版 第三版)
统计学
STATISTICS (第三版 第三版)
相关系数的显著性检验
(例题分析)
1. 2.
对不良贷款与贷款余额之间的相关系数进行显著 性检验(α=0.05) 提出假设:H0:ρ = 0 ;H1:ρ ≠ 0 计算检验的统计量
25 − 2 t = 0 .8436 = 7 .5344 2 1 − 0 .8436
相关关系的描述与测度
(相关系数)
作者:张占贞 作者:张占贞
青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
统计学
STATISTICS (第三版 第三版)
相关系数
(correlation coefficient)
度量变量之间关系强度的一个统计量 对两个变量之间线性相关强度的度量称为简单相 关系数 3. 若相关系数是根据总体全部数据计算的,称为总 体相关系数,记为ρ 4. 若 是根据样本数据计算的,则称为样本相关系 数,简称为相关系数,记为 r
统计学
STATISTICS (第三版 第三版)
第11章 一元线性回归
统计学
作者:张占贞 作者:张占贞
青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
统计学
STATISTICS (第三版 第三版)
第11章 一元线性回归
变量间关系的度量 一元线性回归 利用回归方程进行估计和预测 残差分析
§11.1 §11.2 §11.3 §11.4
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
统计学
STATISTICS (第三版 第三版)
散点图
(例题分析)
作者:张占贞 作者:张占贞
青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
统计学
STATISTICS (第三版 第三版)
14 12 不 良 贷 款
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
统计学
STATISTICS (第三版 第三版)
相关关系
(类型)
相关关系
线性相关
正相关 负相关
非线性相关
完全相关
正相关 负相关
作者:张占贞 作者:张占贞
不相关
青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
统计学
STATISTICS (第三版 第三版)
相关系数
(计算公式)
样本相关系数的计算公式
r=
∑( x − x)( y − y) ∑ ( x − x ) ⋅ ∑ ( y − y)
2
2
或化简为 r =
n∑x −(∑x) ⋅ n∑y −(∑y)
2 2 2
作者:张占贞 作者:张占贞
n∑xy−∑x∑y
2
青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
完全负线性相关
非线性相关
正线性相关
负线性相关
作者:张占贞 作者:张占贞
不相关
青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
统计学
STATISTICS (第三版 第三版)
散点图
(例题分析)
【 例 】 一家大型商业银行在多个地区设有分 行,其业务主要是进行基础设施建设、国家重 点项目建设、固定资产投资等项目的贷款。近 年来,该银行的贷款额平稳增长,但不良贷款 额也有较大比例的增长,这给银行业务的发展 带来较大压力。为弄清楚不良贷款形成的原 因,管理者希望利用银行业务的有关数据做些 定量分析,以便找出控制不良贷款的办法。下 面是该银行所属的 25 家分行 2002 年的有关业 务数据
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
统计学
STATISTICS (第三版 第三版)
§11.1 变量间关系的度量
11.1.1 变量间的关系 11.1.2 相关关系的描述与测度 11.1.3 相关系数的显著性检验
作者:张占贞 作者:张占贞
青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
统计学
STATISTICS (第三版 第三版)
相关系数的性质
|r|=1,为完全相关
r =1,为完全正相关 r =-1,为完全负正相关
性质1:r 的取值范围是 [-1,1]

Hale Waihona Puke – – – –r = 0,不存在线性相关关系 -1≤r<0,为负相关 0<r≤1,为正相关 |r|越趋于1表示关系越强;|r|越趋于0 表示关 系越弱
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
相关文档
最新文档