一元线性回归分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(independent variable),也称为回归变量(regressor),它可以
是随机变量,也可以是非随机变量。
• 回归的类型
如果回归分析时只有一个自变量,则称为一元回归;含有两个或 两个以上回归变量时称为多元回归。
若响应变量与回归变量之间为线性关系就称为线性回归分析,否
则称为非线性回归分析。
居民受教育程度与收入的关系及相关关系。
➢ 由于客观上常会出现观察或测量上的误差等原因,函数关系在实际 工作中往往通过相关关系表现出来。而在研究相关关系时,为了找出 变量之间数量关系的内在联系和表现形式,又常常需要借助函数关系
的形式加以描述。
互动地带
8-3
第一节 相关分析
二、相关关系的种类 ❖ 根据相关变量之间的密切程度不同,可分为不相关、完
8-4
第一节 相关分析
❖ 散点图与相关的类型
互动地带
8-5
第一节 相关分析
❖ 相关系数(correlation coefficient) 是测度变量之间相关关系密切程度和相关方向的代表
性指标。 ➢ 对两个变量之间线性相关程度的度量称为简单相关系数。
➢ 若相关系数是根据总体全部数据计算的,称为总体相关系 数,记为 ;若是根据样本数据计算的,则称为样本相 关系数,记为 r 。
➢ 两个变量的线性相关系数
r sxy sx sy
n
1 1
(x
x
)(
y
y)
1 n 1
(x
x)2
n
1 1
(
y
y)2
或r
例8.1
n xy x y
n x2 x2 n y2 y2
8-6
第一节 相关分析
➢ 相关系数的取值范围在-1和+1之间,即:–1≤ r≤ 1。
若0< r≤ 1,表明和之间存在正线性相关关系; 若-1≤ r<0,表明和之间存在负线性相关关系;
若 r =1,表明和之间是完全正线性相关关系;
若 r = -1,表明和之间是完全负线性相关关系。 ➢ r =0只表示两个变量之间不存在线性相关关系,并不说明变量之间
没有任何关系,比如它们之间可能存在非线性相关关系。
➢ 通常认为,当n较大时:0≤︱r︱<0.3为微弱相关;0.3≤︱r︱<0.5为 低度相关;0.5≤︱︱r <0.8为显著相关;0.8≤︱︱r <1为高度相关。
全相关和不完全相关。 ❖ 根据相关变量的变化方向划分,可分为正相关和负相关 ❖ 根据相关变量的多少划分,可分为单相关和复相关。 ❖ 根据变量间依存关系的形式划分,可分为直线相关和曲
线相关。 三、相关关系的描述与测度 ❖ 散点图(scatter diagram)
用直角坐标的横轴表示变量x的值,纵轴表示变量y的值,每组数据 在直角坐标系中用一个点表示,n组数据在直角坐标系中形成的n个数 据点称为散布点或散点,由坐标及其散点形成的二维数据图 。
不可观测的随机变量,表示 x 和 y 的关系中不确定因素的影响,我们 称之为随机误差;响应变量 y为随机变量。
❖ 模型的三个假定
1. 随机误差 e 的期望值为0,即 E(e) 0
2. 对于所有的x 值,e 的方差都相同 ;
3. 随机误差 e 是一个服从正态分布的随机变量,且各次观测的随机误
差 e1,e2 , ,en 相互独立。
H0
,表明不良贷款与贷款余
互动地带 附表6
8-7
8-8 第二节 一元线性回归分析
❖ 自变量与因变量

在回归分析中,通常把被解释(预测)变量称为因变量
(dependent variable),也叫响应变量(response variable),一
般假设为Baidu Nhomakorabea机变量;

把用来解释(预测)的一个或多个变量称为自变量
❖ 回归方程
E(y) A Bx
8-10 第二节 一元线性回归分析
❖ 估计的回归方程
总体回归参数A和B是未知的,我们必须利用样本数据去估计它们。
用样本统计量 和 a 代替b 回归方程中的未知参数A和B,可以得出估计
的一元线性回归方程式:
yˆ a bx
式中,a 是估计的回归直线在 y 轴上的截距;b 是直线的斜率;yˆ 是
• 相关系数的显著性检验
互动地带
H0 : 0; H1 : 0
统计量 t r
n2 1 r2
服从自由度为n-2的t分布
例8.2 根据对25家银行的调查数据计算不良贷款额与贷款余额的相 关系数为0.8436。试检验不良贷款额与贷款余额之间的相关系数是否显 著。
解:(1)提出原假设和备择假设
H0 : 0 ; H1 : 0
的 y估计值,也称 yˆ 为 y 的回归值(regressand value)或拟合值(fitted
value)。b 为x 每变动一个单位时,y 的平均变动值。
二、参数的最小二乘估计
互动地带
在根据散布点去拟合回归直线时,应使得直线 yˆ a bx 所代 表的估计值 yˆ 和与其对应的实际观测值 y 之间的差为最小,即残差
8-2
第一节 相关分析
一、变量间的关系
❖ 函数关系
是变量之间一种完全确定的关系。如,圆的面积与圆半径之间的关
系 s r 2 即函数关系。
❖ 相关关系(correlation)
指变量之间的数量变化受随机因素的影响而不能惟一确定的相互依
存关系,其一般数学表达式为 y f x ,其中代表随机因素。如,
• 回归模型(regression model) 描述响应变量与回归变量和误差项之间的因果关系的数学表达式
称为回归模型。
8-9 第二节 一元线性回归分析
一、一元线性回归模型
❖ 理论回归模型
y A Bx e
式中A和B是未知常数,称作回归系数(coefficient);回归变量 x 可以是随机变量,也可以是可以控制其取值的非随机的普通变量;e 是
(residual)最小。 即:
Q(a,b) (y a bx)2 最小值
8-11 第二节 一元线性回归分析
利用数学求极值的方法,由条件
Q 0 且
a
(2)取显著性水平 =0.05,根据自由度 df n 2 25 2 23 , 查 t 分布表得:临界值 t / 2,n2 t0.025,23 2.069
(3)计算检验的统计量
t r
n2 1 r2
0.8436
25 2 1 0.8436 2
7.5344
(4)由于 t ﹥ t / 2,n2 ,所以拒绝 额之间存在显著的正线性相关关系。
相关文档
最新文档