统计学 8相关与回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
合计
9 5 5 6 5 30
2021/2/16
12
一、相关图表
(二)相关图
又称散点图,用直角坐标系的横轴代表变量x ,纵轴
代表变量y ,将两个变量间相对应的变量值用坐标点 的形式描绘出来,用以表明相关点分布状况的图形。
y
y
[例]经济增长与人口增长、科技水平、自然资源、管理水平等之 间的关系;
体重与身高、食欲、睡眠时间之间的关系。
3、偏相关:在一个变量与多个变量相关的情况下,假定其他变 量不变,测定其中两个变量之间的相关关系。
[例]就y=ax1+bx2+ ,研究y与x1之间的关系,假定x2不变。
2021/2/16
9
三、相关分析的内容及其假定
账单 (美元) 33.5
小费 (美元)
5.5
表 8-1 账单与小费的成对数据
50.7 87.9 98.8 63.6 107.3 120.7 78.5 5.0 8.1 17 12 16 18.6 9.4
102.3 140.6 15.4 22.4
2021/2/16
2
源自文库
Statistics in Practice
x0=1件, y0=10元; x1=2件, y1=20元 圆的面积S=ΠR2,R=10,S=100 Π (2)表述:y=f(x)。 (二)相关关系 1、定义:不完全确定的关系。 (1)某一(组)变量与另一变量间有关系,但并非一一对应;
2021/2/16
5
一、变量间的相互关系
[例]身高y与体重x;
A:x=60kg、y=170m; B: x=60kg、y=1.72m;
第八章 相关与回归分析
Correlation Regression Analysis
章前导语:
2021/2/16
1、有其父,必有其子。
--------古人和现代人都这么说
2、“真的,”公爵夫人说:“火烈鸟和
芥末都很刺鼻。那意思是说‘物以类 聚’。”
“但芥末并不是鸟。” Alice说。
“是的,象往常那样,”公爵夫人说, “你具有多么清晰的表达方式!”
2021/2/16
10
8.2 线性相关关系的测定
[目的]测定变量间的相关方向与密切程度。
一、相关图表
(一)相关表
1、单变量分组相关表:一变量分组且计算次数,另一变量只计 算平均数。
30 家同类企业的有关资料
产量(件)x
企业数 平均单位成本(元)y
20
9
16.8
30
5
15.6
40
5
15.0
50
6
14.8
(1)犯罪率与偷窃率;
(2)香烟消费与患癌症率;
(3)个人收入水平与受教育年限;(4)血压与年龄;
(5)父母身高与子女身高;
(6)薪金与酒价等等。
2021/2/16
3
主要内容
8.1 相关关系概述
一、变量间的相互关系
二、相关关系的种类
三、相关分析的内容及其假定
8.2 线性相关关系的测定
一、相关图表
二、相关系数
80
5
14.2
2021/2/16
11
一、相关图表
2、双变量分组相关表:对两个变量均进行分组。 注:一变量X轴;另一变量Y轴。
30 家同类企业的有关资料
单位成本 y
产量 x(件)
合
(元/件)
20 30 40 50 80 计
18
4 ————4
16
4 3 1 1 —9
15
1 2 3 3 1 10
14
—— 1 2 4 7
3、数量关系的形式
(1)单一因果关系 ;(2)互为因果关系 ;(3)伴随关系 。
2021/2/16
6
二、相关关系的种类
(一)按相关的程度分
1、完全相关:函数关系;
2、不相关:没有关系;
3、不完全相关。
(二)按相关的方向分
1、正相关:变量的变动方向一致(同增同减);
2、负相关:变量的变动方向相反(一增一减)。
C:x=60kg、y=1.68m; D: x=60kg、y=1.65m。
(2)表述:y=f(x)+。
影响身高的因素:体重、遗传、锻炼、睡眠质量……
2、成因
(1)某些影响因素尚未被认识;(2)虽已认识但无法测量;
(3)测量误差。
[例]某种水果P元/斤: 购买额 y=Px 购买量
x=2斤 y=2P+=2×1.9+0.2
--------《 Alice漫游奇境记》
1
第八章 相关与回归分析
Statistics in Practice
消费者应该留下多少小费?
在西方国家餐饮等服务行业有一条不成文的规定,即发生餐饮 等服务项目消费时,必须给服务员一定数额的小费,许多人都 听说小费应该是账单的16%左右,是否真的如此呢?让我们来 考察表8-1,表中的数据是经过调查所得的样本数据,通过对这 几组数据的分析与观察,我们能发现两者之间的数量关系。
(三)按表现形态分
1、线性相关;
2、非线性相关。
2021/2/16
7
二、相关关系的种类
• • •
• 相关程度密切
•
• ••
相关程度不密切
•• • •
2021/2/16
••••• • •
•
••
•
•
•
••
•
•
•
8
二、相关关系的种类
(四)按涉及变量的多少分
1、单(简单)相关:一个变量对另一个变量的相关关系; [例]学习成绩与学习时间;血压与年龄;亩产量与施肥量。 2、复(多元)相关:一个变量对两个或两个以上其他变量的相 关关系;
问题:
1、是否有足够的证据断定:在账单与小费数额之间存在某种 联系?
2、如果存在某种联系,怎样使用这种联系来确定应该留下多 少小费?
本章的重点就是基于成对出现的样本数据做出一些推论。如上 例,我们想要确定账单与小费数额之间是否存在某种联系,如 果存在,我们就想用一个公式来描述它,这样就能找出人们留 小费时遵循的规则。类似这样的问题还有很多,如:
1. 相关分析要解决的问题
– 变量之间是否存在关系? – 如果存在关系,它们之间是什么样的关系? – 变量之间的关系强度如何? – 样本所反映的变量之间的关系能否代表总体变量之
间的关系?
2. 为解决这些问题,在进行相关分析时,对总体有 以下两个主要假定
– 两个变量之间是线性关系 – 两个变量都是随机变量
8.3 回归分析
一、回归分析概述
二、一元线性回归方程的拟合
三、回归分析的方差分析
四、一元线性回归模型的检验
五、对回归分析结果的评价
六、多元线性回归分析
2021/2/16
4
8.1 相关关系概述
一、变量间的相互关系
(一)函数关系 定义:完全确定的(数量)关系。
(1)某一(组)变量与另一变量间存在着一一对应的关系; [例]计件工资(y)与产量(x) y=f(x)=10x;