相关与回归分析方法介绍
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
30 家同类企业的有关资料
产量(件)x
企业数 平均单位成本(元)y
20
9
16.8
30
5
15.6
40
5
15.0
50
6
14.8
80
5
14.2
2020/12/4
11
一、相关图表
2、双变量分组相关表:对自变量与因变量均进行分组。 注:自变量X轴;因变量Y轴。
30 家同类企业的有关资料
单位成本 y
产量 x(件)
合
(元/件)
20 30 40 50 80 计
18
4 ————4
16
4 3 1 1 —9
15
1 2 3 3 1 10
14
—— 1 2 4 7
合计
9 5 5 6 5 30
2020/12/4
12
一、相关图表
(二)相关图
又称散点图,用直角坐标系的x轴代表自变量,y轴代
表因变量,将两个变量间相对应的变量值用坐标点的 形式描绘出来,用以表明相关点分布状况的图形。
(1)犯罪率与偷窃率;
(2)香烟消费与患癌症率;
(3)个人收入水平与受教育年限;(4)血压与年龄;
(5)父母身高与子女身高;
(6)薪金与酒价等等。
2020/12/4
3
主要内容
8.1 相关关系概述
一、变量间的相互关系 二、相关关系的种类 三、相关分析的内容及其假定
8.2 线性相关关系的测定
一、相关图表 二、相关系数
– 样本所反映的变量之间的关系能否代表总体变量之 间的关系?
2. 为解决这些问题,在进行相关分析时,对总体有 以下两个主要假定
– 两个变量之间是线性关系 – 两个变量都是随机变量
2020/12/4
10
8.2 线性相关关系的测定
[目的]测定变量间的相关方向与密切程度。
一、相关图表
(一)相关表
1、单变量分组相关表:自变量分组且计算次数,因变量只计算 平均数。
账单 (美元) 33.5
小费 (美元)
5.5
表 8-1 账单与小费的成对数据
50.7 87.9 98.8 63.6 107.3 120.7 78.5 5.0 8.1 17 12 16 18.6 9.4
102.3 140.6 15.4 22.4
2020/12/4
2
Statistics in Practice
体重与身高、食欲、睡眠时间之间的关系。 3、偏相关:就多个变量测定其中两个变量的相关程度而假定其 他变量不变。 [例]就y=ax1+bx2+ ,研究y与x1之间的关系,假定x2不变。
2020/12/4
9
三、相关分析的内容及其假定
1. 相关分析要解决的问题
– 变量之间是否存在关系? – 如果存在关系,它们之间是什么样的关系? – 变量之间的关系强度如何?
问题:
1、是否有足够的证据断定:在账单与小费数额之间存在某种 联系?
2、如果存在某种联系,怎样使用这种联系来确定应该留下多 少小费?
本章的重点就是基于成对出现的样本数据做出一些推论。如上 例,我们想要确定账单与小费数额之间是否存在某种联系,如 果存在,我们就想用一个公式来描述它,这样就能找出人们留 小费时遵循的规则。类似这样的问题还有很多,如:
3、数量关系的形式
(1)单一因果关系 ;(2)互为因果关系 ;(3)伴随关系 。
2020/12/4
6
二、相关关系的种类
(一)按相关的程度分
1、完全相关:函数关系; 2、不相关:没有关系; 3、不完全相关。 (二)按相关的方向分
1、正相关:变量的变动方向一致(同增同减); 2、负相关:变量的变动方向相反(一增一减)。 (三)按相关的形式分
C:x=60kg、y=1.68m; D: x=60kg、y=1.65m。
(2)表述:y=f(x)+。
影响身高的因素:体重、遗传、锻炼、睡眠质量……
2、成因
(1)某些影响因素尚未被认识;(2)虽已认识但无法测量;
(3)测量误差。
[例]某种水果P元/斤: 购买额 y=Px 购买量
x=2斤 y=2P+=2×1.9+0.2
8.3 回归分析
一、回归分析概述 二、一元线性回归方程的拟合 三、回归分析的方差分析 四、一元线性回归模型的检验 五、对回归分析结果的评价 六、多元线性回归分析
2020/12/4
4
8.1 相关关系概述
一、变量间的相互关系
(一)函数关系 定义:完全确定的(数量)关系。
(1)某一(组)变量与另一变量间存在着一一对应的关系; [例]计件工资(y)与产量(x) y=f(x)=10x;
1、线性相关; 2、非线性相关。
2020/12/4
7
二、相关关系的种类
•
•
•
• 相关程度密切
•
• ••
相关程度不密切
•• • •
2020/12/4
••••• • •
•
••
•
•
•
••
•
•
•
8
二、相关关系的种类
(四)按影响因素的多少分 1、单(简单)相关:只有一个自变量; [例]学习成绩与学习时间;血压与年龄;亩产量与施肥量。 2、复(多元)相关:两个或两个以上的自变量 ; [例]经济增长与人口增长、科技水平、自然资源、管理水平等之 间的关系;
第八章 相关与回归分析
Correlation Regression Analysis
章前导语:
1、有其父,必有其子。
--------古人和现代人都这么 说
2、“真的,”公爵夫人说:“火烈鸟和 芥末都很刺鼻。那意思是说‘物以类 聚’。”
“但芥末并不是鸟。” Alice说。
2020/12/4
“是的,象往常那样,”公爵夫人说, “你具有多么清晰的表达方式!”
1
第八章 相关与回归分析
Statistics in Practice
消费者应该留下多少小费?
在西方国家餐饮等服务行业有一条不成文的规定,即发生餐饮 等服务项目消费时,必须给服务员一定数额的小费,许多人都 听说小费应该是账单的16%左右,是否真的如此呢?让我们来考 察表8-1,表中的数据是经过调查所得的样本数据,通过对这几 组数据的分析与观察,我们能发现两者之间的数量关系。
y
y
y
y
正 相 关 x 负 相 关 x 曲线相关 x 不 相 关 x
[不足]难以精确反映相关的密切程度。
x0=1件, y0=10元; x1=2件, y1=20元 圆的面积S=ΠR2,R=10,S=100 Π (2)表述:y=f(x)。 (二)相关关系 1、定义:不完全确定的关系。
(1)某一(组)变量与另一变量间有关系,但并非一一对应;
2020/12/4
5
Biblioteka Baidu
一、变量间的相互关系
[例]身高y与体重x;
A:x=60kg、y=170m; B: x=60kg、y=1.72m;