一元线性回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 相关系数的显著性检验
统计量 t r n 2 服从自由度为n-2的t分布 2
1 r
互动地带
H 0 : 0; H 1 : 0
例8.2 根据对25家银行的调查数据计算不良贷款额与贷款余额的相 关系数为0.8436。试检验不良贷款额与贷款余额之间的相关系数是否显 著。 解:(1)提出原假设和备择假设
8-1
第八章 相关与回归分析
学习目的: 1. 理解现象之间存在的相关关系; 2. 能利用相关系数对相关关系进行测定分析; 3. 明确相关分析与回归分析的主要内容以及它们 各自的特点; 4. 掌握一元线性回归的基本原理和参数的最小二 乘估计; 5. 能够对回归方程的显著性进行检验,并利用回 归方程进行估计和预测。
8-2
第一节 相关分析
一、变量间的关系 函数关系
是变量之间一种完全确定的关系。如,圆的面积与圆半径之间的关 2 系 s r 即函数关系。
相关关系(correlation)
指变量之间的数量变化受随机因素的影响而不能惟一确定的相互依 存关系,其一般数学表达式为 y f x ,其中 代表随机因素。如, 居民受教育程度与收入的关系及相关关系。 由于客观上常会出现观察或测量上的误差等原因,函数关系在实际 工作中往往通过相关关系表现出来。而在研究相关关系时,为了找出 变量之间数量关系的内在联系和表现形式,又常常需要借助函数关系 的形式加以描述。
1. 随机误差 e 的期望值为0,即 E (e) 0
2. 对于所有的 x 值,e 的方差都相同 ; 3. 随机误差 e 是一个服从正态分布的随机变量,且各次观测的随机误 差 e , e ,, e 相互独立。
1 2 n
回归方程
E ( y) A Bx
8-10
第二节 一元线性回归分析
估计的回归方程 总体回归参数A和B是未知的,我们必须利用样本数据去估计它们。 用样本统计量 和 a 代替回归方程中的未知参数 A和B,可以得出估计 b 的一元线性回归方程式:
相关系数的取值范围在-1和+1之间,即:–1≤ r ≤ 1。 若0< r≤ 1,表明和之间存在正线性相关关系; 若-1≤ r <0,表明和之间存在负线性相关关系; 若 r =1,表明和之间是完全正线性相关关系; 若 r = -1,表明和之间是完全负线性相关关系。 r =0只表示两个变量之间不存在线性相关关系,并不说明变量之间 没有任何关系,比如它们之间可能存在非线性相关关系。 r r 通常认为,当 n 较大时: 0≤︱︱< 0.3 为微弱相关; 0.3≤︱︱< 0.5 为 r 0.8为显著相关;0.8≤︱︱< r 1为高度相关。 低度相关;0.5≤︱︱<
用直角坐标的横轴表示变量x的值,纵轴表示变量y的值,每组数据 在直角坐标系中用一个点表示,n组数据在直角坐标系中形成的n个数 据点称为散布点或散点,由坐标及其散点形成的二维数据图 。
8-4
第一节 相关分析
散点图与相关的类型
Baidu Nhomakorabea
互动地带
8-5
第一节 相关分析
相关系数(correlation coefficient) 是测度变量之间相关关系密切程度和相关方向的代表 性指标。 对两个变量之间线性相关程度的度量称为简单相关系数。 若相关系数是根据总体全部数据计算的,称为总体相关系 数,记为 ;若是根据样本数据计算的,则称为样本相 关系数,记为 r 。 两个变量的线性相关系数
(4)由于 t ﹥ t / 2,n2 ,所以拒绝 H 0 ,表明不良贷款与贷款余 额之间存在显著的正线性相关关系。
互动地带
8-7
附表6
8-8
第二节 一元线性回归分析
自变量与因变量
在回归分析中,通常把被解释(预测)变量称为因变量 (dependent variable ),也叫响应变量(response variable ),一 般假设为随机变量; 把用来解释(预测)的一个或多个变量称为自变量 (independent variable ),也称为回归变量(regressor ),它可以 是随机变量,也可以是非随机变量。 • 回归的类型 如果回归分析时只有一个自变量,则称为一元回归;含有两个或 两个以上回归变量时称为多元回归。 若响应变量与回归变量之间为线性关系就称为线性回归分析,否
则称为非线性回归分析。
• 回归模型(regression model) 描述响应变量与回归变量和误差项之间的因果关系的数学表达式 称为回归模型。
8-9
第二节 一元线性回归分析
一、一元线性回归模型 y A Bx e 理论回归模型 式中A和B是未知常数,称作回归系数(coefficient);回归变量 x e是 可以是随机变量,也可以是可以控制其取值的非随机的普通变量; 不可观测的随机变量,表示 x 和 y 的关系中不确定因素的影响,我们 称之为随机误差;响应变量 y 为随机变量。 模型的三个假定
H0 : 0
;
H1 : 0
(2)取显著性水平 查 t 分布表得:临界值
t / 2,n2 t 0.025,23 2.069
=0.05,根据自由度 df n 2 25 2 23 ,
(3)计算检验的统计量
t r n2 25 2 0 . 8436 7.5344 2 1 r2 1 0.8436
互动地带
8-3
第一节 相关分析
二、相关关系的种类 根据相关变量之间的密切程度不同,可分为不相关、完 全相关和不完全相关。 根据相关变量的变化方向划分,可分为正相关和负相关 根据相关变量的多少划分,可分为单相关和复相关。 根据变量间依存关系的形式划分,可分为直线相关和曲 线相关。 三、相关关系的描述与测度 散点图(scatter diagram)
r
sxy sx s y
1 ( x x )( y y ) n 1 1 1 2 ( x x ) ( y y)2 n 1 n 1
或r
n x 2 x
n xy x y
2
n y 2 y
2
例8.1
8-6
第一节 相关分析