统计学课件之相关与回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
变量间的关系
(相关关系)
1. 变量间关系是不确定的数
量关系,不能用函数关系 y
精确表达
2. 一个变量的取值不能由另 一个变量唯一确定
3. 当变量 x 取某个值时,变
量 y 的取值可能有几个
x
4. 各观测点分布在直线周围
变量间的关系
(相关关系)
相关关系的例子
▪ 商品的消费量(y)与居民收入(x)之间的关系 ▪ 商品销售额(y)与广告费支出(x)之间的关系 ▪ 粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、
相关关系的图示
完全正线性相关
正线性相关
完全负线性相关
负线性相关
非线性相关
不相关
相关关系的类型
❖ 1 按相关关系涉及变量(因素0的多少,可以分 为单相关和复相关(多元相关)
❖ 2 按相关形式可分为线性相关和非线性相关 ❖ 3 按相关的方向,线性相关可分为正相关和负
相关 ❖ 4 按变量之间的相关程度,可分为完全相关,高
第二节 一元线性回归
一. 一元线性回归模型 ب- 参数的最小二乘估计 ج- 回归方程的显著性检验
一元线性回归模型
什么是回归分析?
1. 侧重于考察变量之间的数量伴随关系 2. 从一组样本数据出发,确定变量之间的数学
关系式 3. 对这些关系式的可信程度进行各种统计检验,
并从影响某一特定变量(因变量)的诸多变量 (自变量)中找出哪些变量的影响显著,哪些 不显著 4. 利用所求的关系式,根据一个或几个变量的 取值来预测或控制另一个特定变量的取值, 并给出这种预测或控制的精确程度
系数,记为
6. 若是根据样本数据计算的,则称为样本相关系数,记为 r
相关系数
样本相关系数的计算公式
r (xx)(yy) (xx)2(yy)2
或化简为 r
nx yxy
nx2x2 ny2y2
相关系数
(相关系数取值及其意义)
1. r 的取值范围是 [-1,1] 2. |r|=1,为完全相关
r =1,为完全正相关 r =-1,为完全负正相关
回归分析与相关分析的区别
1. 相关分析中,变量 x 变量 y 处于平等的地位; 回归分析中,变量 y 称为因变量,处在被解释 的地位,x 称为自变量,用于预测因变量的变化
2. 相关分析中所涉及的变量 x 和 y 都是随机变量; 回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量
第一节 变量间关系的度量
一. 变量间的关系 二. 相关关系的描述与测度 三. 相关关系的显著性检验
变量间的关系
变量间的关系
(函数关系)
1. 是一一对应的确定关系
2. 设有两个变量 x 和 y ,变量
y 随变量 x 一起变化,并完 y
全依赖于 x ,当变量 x 取某 个数值时, y 依确定的关系 取相应的值,则称 y 是 x 的函数,记为 y = f (x),其 中 x 称为自变量,y 称为因
❖ 一位工业 心理学家 获得了10 个工人的 智商值和 劳动生产 率,试计 算智商值 和劳动生 产率之间 的相关系 数,并对 进行显著 性检验.( 0.05
相关系数例题
x2
y2
相关系数计算
❖ 解:根据样本相关系数的计算公式有
r
nxyxy
nx2 x2 ny2 y2
10504.26110744
1012482311072 10210.84442
3. r = 0,不存在线性相关 4. -1r<0,为负相关 5. 0<r1,为正相关 6. |r|越趋于1表示关系越密切;|r|越趋于0表示关
系越不密切 通常:|r|>=0.8,高度相关; 0.5=<|r|<0.8,中度 相关;o.3=< |r|<0.5,低度相关; |r|<0.3,不相 关.
相关系数的显著性检验
温度(x3)之间的关系 ▪ 收入水平(y)与受教育程度(x)之间的关系 ▪ 父亲身高(y)与子女身高(x)之间的关系
相关关系的描述与测度
散点图
相关分析就是对两个变量之间关系的描 述与度量,关注的是评价对象两两之间的 相对变动,不需要明确区分自变量,因变量.
散点图: 用坐标的横轴xi , 代yi 表变量x,纵轴代 表因变量y,每组数据( )在坐标系中用一 个点表示,n组数据在坐标系中形成的n个 点称为散点,由坐标及散点形成的二维数 据图叫散点图.
1. 检验两个变量之间是否存在线性相关关系 2.采用 t 检验 3.检验的步骤为
提出假设:H0: ;H1: 0
计算检验的统计量:t r n2 ~t(n2)
1r2
根据给定的显著性水平和自由度(n-2),查t分布表 找到相应的临界值,并作出决策
• 若t>t,拒绝H0 • 若t<t,接受H0
第七章 相关与回归分析
第一节 第二节 第三节 第四节
变量间的相关关系 一元线性回归 利用回归方程进行估计和预测 多元线性回归
学习目标
1.掌握相关系数的含义、计算方法和应用 2.掌握一元线性回归的基本原理和参数的最
小二乘估计方法 3.掌握回归方程的显著性检验 4.利用回归方程进行预测 5.掌握多元线性回归分析的基本方法
度相关,低度相关和不相关
相关系数
1. 是对变量之间关系密切程度的度量 2. 根据线性相关变量的多少,分析问题的角度的不同,相关
系数分为简单相关系数,偏相关系数,复相关系数 3. 反映曲线相关变量之间关系密切程度的曲线相关系数称
为相关指数 4. 对两个变量之间线性相关程度的度量称为简单相关系数 5. 若相关系数是根据总体全部数据计算的,称为总体相关
0.867
相关系数的显著性检验
对计算的相关系数进行显著性检(0.05)
1提出假设:H0: ;H1: 0
2计算检验的统计量
t 0.867102 4.921 10.8672
3根据显著性水平=0.05,查t分布表得t(n2)=2.306
▪ 由于t=4.921>t(10-2)=2.306,拒绝H0,即样本 相关系数是显著的,说明智商值与劳动生产率之间 确实存在线性关系
变量
x
3. 各观测点落在一条线上
变量间的关系
(函数关系)
函数关系的例子
▪ 某种商品的销售额(y)与销售量(x)之间的关 系可表示为 y = p x (p 为单价)
▪ 圆的面积(S)与半径之间的关系可表示为S = R2
▪ 企业的原材料消耗额(y)与产量(x1) 、单位 产量消耗(x2) 、原材料价格(x3)之间的关系 可表示为来自百度文库 = x1 x2 x3