第九讲回归与回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第九讲回归与回归分析
图6-1 不同形态的散点图
(a)
(b)
(c)
(d)
就两个变量而言,如果变量之间的关系近似地表 现为一条直线,则称为线性相关,如图6-1(a)和(b); 如果变量之间的关系近似地表现为一条曲线,则称为 非线性相关或曲线相关;如图6-1(c);如果两个变量 的观测点很分散,无任何规律,则表示变量之间没有 相关关系,如图6-l(d)。
第九讲回归与回归分析
2. 相关系数
相关系数是对变量之间关系密切程度的度量。若 相关系数是根据总体全部数据计算的,称为总体相关 系数,记为ρ;总体相关系数的计算公式为:
COV(X,Y)
D(X) D(Y)
其中COV(X,Y)为变量X和Y的协方差,D(X)和D(Y)分 别为X和Y的方差。
第九讲回归与回归分析
x 111 160 188 81 92 80 63 105 89 73 130 65 y 6.5 15.3 17.7 5.9 10.6 8.3 6.0 8.5 10.1 3.5 11.1 11.9
data li6_1; input x y@@; cards;
77 8.8 64 7.9 …73 ;
proc corr;
三、简单相关实例
例6-1 橡胶树幼苗期刺检干胶产量(x,毫克)与正式割胶量(y, 克)如下表,试求x与y的相关系数并画出y关于x的散点图。
x 77 64 62 72 71 83 79 94 104 96 61 90 81 122 y 8.8 7.9 8.9 7.7 8.6 8.1 9.1 5.6 8.5 7.6 4.9 8.1 12.0 15.7
第九讲回归与回归分析
2) 由样本观测值计算检验统计量:
t |r|
n2 1r2
~t(n2)
的观测值t0和衡量观测结果极端性的p值:
p = P{| t | ≥ | t0 |} = 2P{t ≥ |t0|}
3) 进行决策:比较p和检验水平作判断:p < ,拒 绝原假设H0;p ,不能拒绝原假设H0。
第九讲回归与回归分析
第九讲回归与回归分析
二、简单相关系数r的显著性测验
统计假设H0:总体相关系数ρ=0 由d.f=n-2查出相关系数的临界值r0.05 、r0.01 (degree of freedom) SAS直接输出prob>|r|概率值,记为α. 若α >0.05,接受H0,相关不显著,即总体x与y间不存在相关关系。 若0.01<α<0.05,拒绝H0,相关显著,即总体x与y间存在相关关系。 若α <0.01,拒绝H0,相关极显著,即总体x与y间存在相关关系。
第六章 回归和回归分析
6.1 相关分析概述 6.2 6.3 多元线性回归 6.4 曲线回归 6.5 逐步回归
6.1 相关分析概述
1. 散点图
散点图是描述变量之间关系的一种直观方法。我们用 坐标的横轴代表自变量X,纵轴代表因变量Y,每组数 据(xi,yi)在坐标系中用一个点表示,由这些点形成的 散点图描述了两个变量之间的大致关系,从中可以直 观地看出变量之间的关系形态及关系强度。
var x y; /*验证相关性*/
run;
3.5
proc gplot; plot y*x; /*指明横纵坐标轴*/
第九讲回归r与u回n归;分析
PLOT的用法
PLOT <纵轴变量> * <横轴变量> [= <变量>][/<选项>];
选项 FRAM | NOFRAM
表 PLOT语句的选项 意义 在图形四周加入或不加入边框
第九讲回归与回归分析
3)当–1 < r < 1时,为说明两个变量之间的线性关系的 密切程度,通常将相关程度分为以下几种情况:当| r | ≥ 0.8时,可视为高度相关;0.5 ≤ | r | < 0.8时,可视 为中度相关;0.3 ≤ | r | <0.5时,视为低度相关;当| r | < 0.3时,说明两个变量之间的相关程度极弱,可视 为不相关。但这种解释必须建立在对相关系数进行显 著性检验的基础之上。
CFRAM = 颜色
边框内的颜色
AUTOHREF(AUTOVEREF) 在水平(垂直)轴的每个主刻度处加入水平 (垂直)参考线
相关分析的实质: 反映各变量之间相关密切程度。
简单相关:研究两变量直线相关的密切程度和性质,也 称直线相关。 偏相关:排除其余的影响因子,求出x 与y的纯相关,这 种相关称偏相关。 复相关:研究一个变量与一组变量之间的相关性关系。 典型相关:研究两组变量间的相关关系。
第九讲回归与回归分析
6.2 相关分析(Analysis of Correlation)
若相关系数是根据样本数据计算的,则称为样本相 关系数(简称为相关系数),记为r。样本相关系数的计 算公式为:
n
(xi x)(yi y)
r
i1
n (xi x)2 n (yi y)2
i1
i1
一般情况下,总体相关系数ρ是未知的,我们通常 是将样本相关系数r作为ρ的近似估计值。
第九讲回归与回归分析
❖ 1 简单相关 ❖ 2 偏相关 ❖ 3 复相关
第九讲回归与回归分析
1 简单相关 (Simple Correlation)
简单相关: 是对有联系的两类事物(x与y)表面关系密 切程度的衡量。
一、简单相关系数
r (xx)y (y) coxபைடு நூலகம்v y)(
(xx)2 (yy)2
sxsy
相关系数r(无单位)的取值: | r | 1 即: 1r 1
第九讲回归与回归分析
3. 相关系数的显著性检验
相关系数的显著性检验也就是检验总体相关系数 是否显著为0,通常采用费歇尔(Fisher)提出的t分 布检验,该检验可以用于小样本,也可以用于大样本。 检验的具体步骤如下:
1) 提出假设:假设样本是从一个不相关的总体中 随机抽取的,即
H0:ρ = 0;H1:ρ ≠ 0
相关系数r有如下性质:
1)相关系数的取值范围:–1 ≤ r ≤ 1,若0 < r ≤ 1,表明X 与Y之间存在正线性相关关系,若–1 ≤ r < 0,表明X与Y 之间存在负线性相关关系。 2)若r = 1,表明X与Y之间为完全正线性相关关系;若 r = –1,表明X与Y之间为完全负线性相关关系;若r = 0, 说明二者之间不存在线性相关关系。
图6-1 不同形态的散点图
(a)
(b)
(c)
(d)
就两个变量而言,如果变量之间的关系近似地表 现为一条直线,则称为线性相关,如图6-1(a)和(b); 如果变量之间的关系近似地表现为一条曲线,则称为 非线性相关或曲线相关;如图6-1(c);如果两个变量 的观测点很分散,无任何规律,则表示变量之间没有 相关关系,如图6-l(d)。
第九讲回归与回归分析
2. 相关系数
相关系数是对变量之间关系密切程度的度量。若 相关系数是根据总体全部数据计算的,称为总体相关 系数,记为ρ;总体相关系数的计算公式为:
COV(X,Y)
D(X) D(Y)
其中COV(X,Y)为变量X和Y的协方差,D(X)和D(Y)分 别为X和Y的方差。
第九讲回归与回归分析
x 111 160 188 81 92 80 63 105 89 73 130 65 y 6.5 15.3 17.7 5.9 10.6 8.3 6.0 8.5 10.1 3.5 11.1 11.9
data li6_1; input x y@@; cards;
77 8.8 64 7.9 …73 ;
proc corr;
三、简单相关实例
例6-1 橡胶树幼苗期刺检干胶产量(x,毫克)与正式割胶量(y, 克)如下表,试求x与y的相关系数并画出y关于x的散点图。
x 77 64 62 72 71 83 79 94 104 96 61 90 81 122 y 8.8 7.9 8.9 7.7 8.6 8.1 9.1 5.6 8.5 7.6 4.9 8.1 12.0 15.7
第九讲回归与回归分析
2) 由样本观测值计算检验统计量:
t |r|
n2 1r2
~t(n2)
的观测值t0和衡量观测结果极端性的p值:
p = P{| t | ≥ | t0 |} = 2P{t ≥ |t0|}
3) 进行决策:比较p和检验水平作判断:p < ,拒 绝原假设H0;p ,不能拒绝原假设H0。
第九讲回归与回归分析
第九讲回归与回归分析
二、简单相关系数r的显著性测验
统计假设H0:总体相关系数ρ=0 由d.f=n-2查出相关系数的临界值r0.05 、r0.01 (degree of freedom) SAS直接输出prob>|r|概率值,记为α. 若α >0.05,接受H0,相关不显著,即总体x与y间不存在相关关系。 若0.01<α<0.05,拒绝H0,相关显著,即总体x与y间存在相关关系。 若α <0.01,拒绝H0,相关极显著,即总体x与y间存在相关关系。
第六章 回归和回归分析
6.1 相关分析概述 6.2 6.3 多元线性回归 6.4 曲线回归 6.5 逐步回归
6.1 相关分析概述
1. 散点图
散点图是描述变量之间关系的一种直观方法。我们用 坐标的横轴代表自变量X,纵轴代表因变量Y,每组数 据(xi,yi)在坐标系中用一个点表示,由这些点形成的 散点图描述了两个变量之间的大致关系,从中可以直 观地看出变量之间的关系形态及关系强度。
var x y; /*验证相关性*/
run;
3.5
proc gplot; plot y*x; /*指明横纵坐标轴*/
第九讲回归r与u回n归;分析
PLOT的用法
PLOT <纵轴变量> * <横轴变量> [= <变量>][/<选项>];
选项 FRAM | NOFRAM
表 PLOT语句的选项 意义 在图形四周加入或不加入边框
第九讲回归与回归分析
3)当–1 < r < 1时,为说明两个变量之间的线性关系的 密切程度,通常将相关程度分为以下几种情况:当| r | ≥ 0.8时,可视为高度相关;0.5 ≤ | r | < 0.8时,可视 为中度相关;0.3 ≤ | r | <0.5时,视为低度相关;当| r | < 0.3时,说明两个变量之间的相关程度极弱,可视 为不相关。但这种解释必须建立在对相关系数进行显 著性检验的基础之上。
CFRAM = 颜色
边框内的颜色
AUTOHREF(AUTOVEREF) 在水平(垂直)轴的每个主刻度处加入水平 (垂直)参考线
相关分析的实质: 反映各变量之间相关密切程度。
简单相关:研究两变量直线相关的密切程度和性质,也 称直线相关。 偏相关:排除其余的影响因子,求出x 与y的纯相关,这 种相关称偏相关。 复相关:研究一个变量与一组变量之间的相关性关系。 典型相关:研究两组变量间的相关关系。
第九讲回归与回归分析
6.2 相关分析(Analysis of Correlation)
若相关系数是根据样本数据计算的,则称为样本相 关系数(简称为相关系数),记为r。样本相关系数的计 算公式为:
n
(xi x)(yi y)
r
i1
n (xi x)2 n (yi y)2
i1
i1
一般情况下,总体相关系数ρ是未知的,我们通常 是将样本相关系数r作为ρ的近似估计值。
第九讲回归与回归分析
❖ 1 简单相关 ❖ 2 偏相关 ❖ 3 复相关
第九讲回归与回归分析
1 简单相关 (Simple Correlation)
简单相关: 是对有联系的两类事物(x与y)表面关系密 切程度的衡量。
一、简单相关系数
r (xx)y (y) coxபைடு நூலகம்v y)(
(xx)2 (yy)2
sxsy
相关系数r(无单位)的取值: | r | 1 即: 1r 1
第九讲回归与回归分析
3. 相关系数的显著性检验
相关系数的显著性检验也就是检验总体相关系数 是否显著为0,通常采用费歇尔(Fisher)提出的t分 布检验,该检验可以用于小样本,也可以用于大样本。 检验的具体步骤如下:
1) 提出假设:假设样本是从一个不相关的总体中 随机抽取的,即
H0:ρ = 0;H1:ρ ≠ 0
相关系数r有如下性质:
1)相关系数的取值范围:–1 ≤ r ≤ 1,若0 < r ≤ 1,表明X 与Y之间存在正线性相关关系,若–1 ≤ r < 0,表明X与Y 之间存在负线性相关关系。 2)若r = 1,表明X与Y之间为完全正线性相关关系;若 r = –1,表明X与Y之间为完全负线性相关关系;若r = 0, 说明二者之间不存在线性相关关系。