自考统计学第五章:相关分析与回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 一元线性回归分析
• y 方程式: a bx
• 式中,x为自变量,是可控变量(或称确定变量);a为直线截距;b为 直线斜率,其含义:表示当x增加一个单位时y的平均增加数量。
回归参数计算式
线性回归模型参数估计值计算公式:
Σxy ΣxΣy
b
Σx 2
n (Σx)2
n
nΣxy ΣxΣy nΣx2 (Σx)2
[例]计算过程。
小费Y 5.5 5 12 9.4 8.1 17 16 15.4 18.6 22.5
129.5
X-sq 1122.25 2570.49 4044.96 6162.25 7726.41 9761.44 11513.29 10465.29 14568.49 19768.36 87703.23
a
Σy n
b
Σx n
y
bx
回归分析
• 解:通过散点图可近似看出用餐消费与小费支出支出之间呈线性关系,故 设两者有关系
n 10, Σx 883.9, Σy 129.5, Σx2 87703.23 Σy 2 1987.59, Σxy 13031.18
b
nΣxy ΣxΣy nΣx2 (Σx)2
Y-sq 30.25
25 144 88.36 65.61 289 256 237.16 345.96 506.25 1987.59
XY 184.25 253.5 763.2 737.9 711.99 1679.6 1716.8 1575.42 2245.02 3163.5 13031.18
解答
Σx 883.9, Σy 129.5.8, Σx2 87703.23, Σy 2 1987.59, Σxy 13031.18, n 10
统计学原理
课程代码:00974
第五章 相关分析与回归分析
第一节 变量间的相关关系
一、相关关系的概念 • 概念:统计学把现象之间在数量上非确定性的对应关系,叫做相关关
系或统计关系。
二、相关关系的种类 1、按相关的方向不同:正相关和负相关 2、按相关的形式不同:线性相关和非线性相关 3、按影响因素的数量不同:单相关、复相关和偏相关
第三节 一元线性回归分析
一、回归分析的概念 二、回归分析的方法 三、估计标准误差 四、可化为线性回归的非线性回归 五、相关分析与回归分析的特点
一、回归分析的概念
• 回归分析,描述的是一个变量怎样依赖于另一个变量,或者说,当 一个变量发生一定的变动时,另一个变量将会发生怎样的数量变动。
二、回归分析的方法
n(Σxy
ΣxΣy n
)
n
Σx2
(Σx)2 n
Σy 2
(Σy)2 n
xy x y
x2 x2 y2 y2
xy x y σxσy
举例:相关分析
为了解餐饮业消费数额与小费之间的数额关系,特从若干名消费者中随机抽取 10消费者调查,所得数据如下:
餐饮消费额与小费数据如下:单位:美元
10
13031.18 883.9 129.5 10 87703.23 883.9 2
15846.75 95753.09
0.166
a
y bx
Σy n
b
Σx n
12.95
0.166
88.39
1.723
回归方程 : yˆ a bx 1.723 0.166x
经济意义:用餐消费每增加100元,小费支出平均增加16.6元。
r
b
σ σ
x y
0.166
32.61 5.87
0.92 高度正相关
三、估计标准误差
•
计算:
s
y2a y-b xy n-2
• 作用:表现为两方面,一是衡量回归模型的拟合优度;另一方 面用来对实际值落在估计值周围的区间做出一个大概的说明。
相关系数计算公式
设(xi , yi )是(X, Y)的一组样本观察值 , 则
r
σ2xy σxσy
为x与y的相关系数
σxy x, y的协方差 σxσy x, y的标准差
Σ(x x)(y y)
r
n
Σ(x x)(y y)
Σ(x x)2 Σ(y y)2
平均受教育程度与平均年收入散点图
60 50 40 30 20 10
0 0
平均年收入(y)
平均年收入(y)
5
10
15
20
25
二、相关系数
• 含义:是用于测定两个变量之间线性相关程度和相关方向的统 计分析指标,用字母r表示。
计算公式:
判定标准:
• 0.3以下,微弱线性相关 • 0.3~0.5,低度线性相关 • 0.5~0.8,显著线性相关 • 0.8以上,高度线性相关
r
nΣxy ΣxΣy
nΣx2 (Σx)2 nΣy2 (Σy)2
10 13031.18 883.9 129.5
10 87703.23 883.9 2 10 1987.59 129.5 2
15846.75
0.92
95753.09 3234.9
答:即账单消费额与小费之间存在着高度的正相关关系。
第二节 简单线性相关分析
一、相关表与相关图 1、相关表 2、相关图
二、相关系数 含义:
计算公式 判定标准
一、相关表与相关图
1、相关表 • 把相关的两个变量的数值,相对应地排列而成的一张表。如教材P127
(表5-1)
2、相关图 • 又称散点图,是在平面直角坐标中,以横轴表示变量X,以纵轴表示变
量Y,将相关表中对应的资料数值在图上标出坐标点所形成的图形。
消 33.5 50.7 87.9 98.8 63.6 107.3 120.7 78.5 102.3 140.6
费
小
5.5 5.0 8.1
17
12
16
18.6 9.4
15.4 22.4
费
账单X 33.5 50.7 63.6 78.5 87.9 98.8 107.3 102.3 120.7 140.6 883.9
Σ(x x)2 Σ(y y)2
n
n
Lxy
Lxx Lyy
r的简化计算式
r
σ xy σ xσ y
Σ(x x)(y y) Σ(x x)2 Σ(y y)2
Σxy ΣxΣy
n
Σx2
(Σx)2 n
Σy 2
ຫໍສະໝຸດ Baidu
(Σy)2 n
nΣxy ΣxΣy
nΣx2 (Σx)2 nΣy2 (Σy)2
• y 方程式: a bx
• 式中,x为自变量,是可控变量(或称确定变量);a为直线截距;b为 直线斜率,其含义:表示当x增加一个单位时y的平均增加数量。
回归参数计算式
线性回归模型参数估计值计算公式:
Σxy ΣxΣy
b
Σx 2
n (Σx)2
n
nΣxy ΣxΣy nΣx2 (Σx)2
[例]计算过程。
小费Y 5.5 5 12 9.4 8.1 17 16 15.4 18.6 22.5
129.5
X-sq 1122.25 2570.49 4044.96 6162.25 7726.41 9761.44 11513.29 10465.29 14568.49 19768.36 87703.23
a
Σy n
b
Σx n
y
bx
回归分析
• 解:通过散点图可近似看出用餐消费与小费支出支出之间呈线性关系,故 设两者有关系
n 10, Σx 883.9, Σy 129.5, Σx2 87703.23 Σy 2 1987.59, Σxy 13031.18
b
nΣxy ΣxΣy nΣx2 (Σx)2
Y-sq 30.25
25 144 88.36 65.61 289 256 237.16 345.96 506.25 1987.59
XY 184.25 253.5 763.2 737.9 711.99 1679.6 1716.8 1575.42 2245.02 3163.5 13031.18
解答
Σx 883.9, Σy 129.5.8, Σx2 87703.23, Σy 2 1987.59, Σxy 13031.18, n 10
统计学原理
课程代码:00974
第五章 相关分析与回归分析
第一节 变量间的相关关系
一、相关关系的概念 • 概念:统计学把现象之间在数量上非确定性的对应关系,叫做相关关
系或统计关系。
二、相关关系的种类 1、按相关的方向不同:正相关和负相关 2、按相关的形式不同:线性相关和非线性相关 3、按影响因素的数量不同:单相关、复相关和偏相关
第三节 一元线性回归分析
一、回归分析的概念 二、回归分析的方法 三、估计标准误差 四、可化为线性回归的非线性回归 五、相关分析与回归分析的特点
一、回归分析的概念
• 回归分析,描述的是一个变量怎样依赖于另一个变量,或者说,当 一个变量发生一定的变动时,另一个变量将会发生怎样的数量变动。
二、回归分析的方法
n(Σxy
ΣxΣy n
)
n
Σx2
(Σx)2 n
Σy 2
(Σy)2 n
xy x y
x2 x2 y2 y2
xy x y σxσy
举例:相关分析
为了解餐饮业消费数额与小费之间的数额关系,特从若干名消费者中随机抽取 10消费者调查,所得数据如下:
餐饮消费额与小费数据如下:单位:美元
10
13031.18 883.9 129.5 10 87703.23 883.9 2
15846.75 95753.09
0.166
a
y bx
Σy n
b
Σx n
12.95
0.166
88.39
1.723
回归方程 : yˆ a bx 1.723 0.166x
经济意义:用餐消费每增加100元,小费支出平均增加16.6元。
r
b
σ σ
x y
0.166
32.61 5.87
0.92 高度正相关
三、估计标准误差
•
计算:
s
y2a y-b xy n-2
• 作用:表现为两方面,一是衡量回归模型的拟合优度;另一方 面用来对实际值落在估计值周围的区间做出一个大概的说明。
相关系数计算公式
设(xi , yi )是(X, Y)的一组样本观察值 , 则
r
σ2xy σxσy
为x与y的相关系数
σxy x, y的协方差 σxσy x, y的标准差
Σ(x x)(y y)
r
n
Σ(x x)(y y)
Σ(x x)2 Σ(y y)2
平均受教育程度与平均年收入散点图
60 50 40 30 20 10
0 0
平均年收入(y)
平均年收入(y)
5
10
15
20
25
二、相关系数
• 含义:是用于测定两个变量之间线性相关程度和相关方向的统 计分析指标,用字母r表示。
计算公式:
判定标准:
• 0.3以下,微弱线性相关 • 0.3~0.5,低度线性相关 • 0.5~0.8,显著线性相关 • 0.8以上,高度线性相关
r
nΣxy ΣxΣy
nΣx2 (Σx)2 nΣy2 (Σy)2
10 13031.18 883.9 129.5
10 87703.23 883.9 2 10 1987.59 129.5 2
15846.75
0.92
95753.09 3234.9
答:即账单消费额与小费之间存在着高度的正相关关系。
第二节 简单线性相关分析
一、相关表与相关图 1、相关表 2、相关图
二、相关系数 含义:
计算公式 判定标准
一、相关表与相关图
1、相关表 • 把相关的两个变量的数值,相对应地排列而成的一张表。如教材P127
(表5-1)
2、相关图 • 又称散点图,是在平面直角坐标中,以横轴表示变量X,以纵轴表示变
量Y,将相关表中对应的资料数值在图上标出坐标点所形成的图形。
消 33.5 50.7 87.9 98.8 63.6 107.3 120.7 78.5 102.3 140.6
费
小
5.5 5.0 8.1
17
12
16
18.6 9.4
15.4 22.4
费
账单X 33.5 50.7 63.6 78.5 87.9 98.8 107.3 102.3 120.7 140.6 883.9
Σ(x x)2 Σ(y y)2
n
n
Lxy
Lxx Lyy
r的简化计算式
r
σ xy σ xσ y
Σ(x x)(y y) Σ(x x)2 Σ(y y)2
Σxy ΣxΣy
n
Σx2
(Σx)2 n
Σy 2
ຫໍສະໝຸດ Baidu
(Σy)2 n
nΣxy ΣxΣy
nΣx2 (Σx)2 nΣy2 (Σy)2