相关分析与回归模型课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关分析。
图2 居民家庭收入与消费支出的数据作出的散点图
PPT学习交流
5
• 二、相关关系的种类
• 根据相关所涉及变量的多少,相关关系分为单相关与 复相关。两个变量之间的相关关系称为单相关;多个变 量之间的相关关系称为复相关。
• 根据相关的形式不同,相关关系分为线性相关与非线 性相关。如果变量之间的关系近似地表现为一条直线, 则称为线性相关;如果变量之间的关系近似地表现为一 条曲线,则称为非线性相关或曲线相关。
计算结果表明单位成本与产量之间存在高度负相关关系。
PPT学习交流
17
PPT学习交流
18
• 例4 股票价格指数是反映各个时期股价水平变动情况的指数,上 证指数和上证30指数都是判断我国上海证券交易所股市行情的主 要指标。下表是2019年前10个交易周的上证指数和上证30指数的 资料:
PPT学习交流
15
PPT学习交流
16
• 例3 某企业上半年产品产量与单位成本资料如下:
• 表3 某企业上半年产品产量与单位成本统计资料
月份
1 2 34 5 6
产量 (万件) 2 3 4 3 4 5
单位成本(元/件) 73 72 71 73 69 68
解 根据上述资料,单位成本与产量之间的相关系数为
• 表2 10个家庭月收入与月消费支出统计资料(百元)
家庭编号 1 2 3 4 5 6 7 8 9 10
月收入
9 13 15 17 18 20 22 23 26 30
月消费支出 6 8 9 10 11 13 14 13 15 20
解 根据上述资料,家庭月消费支出与家庭月收入之间的相关系数为
计算结果表明家庭月消费支出与家庭月收入之间存在高度正相关关 系。
• 例如,在例2中给出了10个家庭的月收入和月消费 支出的统计数据,它们之间呈正相关趋势;在例3中给出 了某企业上半年产品产量和单位成本的统计数据,它们 之间呈负相关趋势。
• 根据相关程度的不同,相关关系分为不相关、完全相 关和不完全相关。如果两个变量彼此的数量变化相互独 立,这种关系称为不相关;如果一个变量的数量变化完 全由另一个变量的数量变化所唯一确定,这种关系称为 完全相关;介于不相关与完全相关之间的关系,称为不 完全相关。
到月平均销售收入 y(万元)与月平均广告支出 x(万元)
的如下统计资料:
• 表1 某种护发产品2019年在8个地区销售的统计资料
地区编号 1 2 3 4 5 6 7 8
月平均销售收入
(万元)y
31
40
30
34
25
20
35
40
月平均广告支出 5 10 5 7 4 3 7 9
(万元)x
PPT学习交流
13
PPT学习交流
2
wenku.baidu.com • 一、变量相关的概念
• 一切客观事物都是相互联系的,而且任一事物的变化 都与其周围的其他事物相互联系和相互影响。客观现象 之间的相互联系,可以通过一定的数量关系反映出来。 现象之间的关系形态有两种类型:函数关系和统计相关 关系。
• 函数关系是变量之间的一种完全确定的关系,即一个 变量的数值完全由另一个(或一组)变量的数值所确定。 例如,银行的1年期存款利率为2.25%,设存入本金为 x , 到期的本息为 y ,则
• 图2中的散点大致分布在一条直线两侧,表明两个变 量之间是线性相关;图3中散点的分布大致呈抛物线形状, 表明两个变量之间是非线性相关。
PPT学习交流
6
图3 非线性相关
PPT学习交流
7
• 根据变量相关方向的不同,相关关系分为正相关与负 相关。正相关是指两个变量之间的变化方向一致,都是 增长或下降趋势,如居民收入增加,居民消费额随之增 加,故它们是正相关;负相关是指两个变量变化趋势方 向相反,如产品单位成本降低,利润随之增加,故它们 是负相关。
(1)
PPT学习交流
10
(1)式可简化为
(1)
PPT学习交流
11
• (二)相关系数的意义
• 相关系数的取值范围是在 -1和 +1之间,即 -1 ≤ r ≤ 1。r>0为正相关, r<0 为负相关。
• 如果 |r|=1 ,则表明两个变量是完全线性相关;r=0,则 表明两个变量完全不线性相关,但两个变量之间有可能 存在非线性相关。当变量之间非线性相关程度较大时, 就可能导致r=0,因此,当r=0时或很小时,应结合散点 图作出合理的解释。
• 这里 x 与 y表现为一种线性函数关系。微积分学是研究 函数关系的数学学科。
PPT学习交流
3
图1 线性函数
的图形
PPT学习交流
4
统计相关关系是变量之间存在的不完全确定性的关系。 在实际问题中,许多变量之间的关系并不是完全确定性 的,例如居民家庭消费与居民家庭收入这两个变量的关 系就不是完全确定的。收入水平相同的家庭,它们的消 费额往往不同;消费额相同的家庭,它们的收入也可能 不同。对现象之间相关关系密切程度的研究,称为
• 根据经验将相关程度划分为以下几种情况:
• 当 |r|≥0.8时,视为高度相关; 0.5≤|r|<0.8时,视为中 度相关; 0.3≤|r|<0.5时,视为低度相关; |r|<0.3时, 说明两个变量之间相关程度极弱,可视为不相关 。
PPT学习交流
12
• 例1 根据某种护发产品2019年在8个地区的销售情况,得
PPT学习交流
8
图4 不相关
• 图4中的散点杂乱无章地分布在一个区域中,表明两个变
量之间不相关。
PPT学习交流
9
• 三、相关关系的测度
• (一)简单相关系数
• 相关系数是对变量之间相关关系密切程度的度量,对 两个变量之间线性相关程度的度量称为简单相关系数。
•设
是
系数的计算公式为
的 n 组观测值,简单相关
相关分析和回归模型
第一节 相关分析 第二节 一元回归分析 第三节 多元线性回归分析 第四节 可线性化的曲线回归 附录:用Excel计算相关系数和进行回归分析
第一节 相关分析
• 相关分析的主要目的是对现象之间的相关关 系的密切程度给出一个数的度量,相关系数和等 级相关系数就是测定变量间相关关系的指标。
• 解 首先做出的散点图,
从图上我们看
到。这些点大致分别落在一条直线附近,说明月平均广告支出 x 与 月平均销售收入 y 之间具有明显的线性关系。
• 月平均广告支出 x 与月平均销售收入 y 的相关系数为
=
计算结果表明月平均广告支出与月平均销售收入之间存在高度正相
关关系。
PPT学习交流
14
• 例2 根据下表的资料,计算家庭月消费支出与家庭月收 入之间的相关系数。
图2 居民家庭收入与消费支出的数据作出的散点图
PPT学习交流
5
• 二、相关关系的种类
• 根据相关所涉及变量的多少,相关关系分为单相关与 复相关。两个变量之间的相关关系称为单相关;多个变 量之间的相关关系称为复相关。
• 根据相关的形式不同,相关关系分为线性相关与非线 性相关。如果变量之间的关系近似地表现为一条直线, 则称为线性相关;如果变量之间的关系近似地表现为一 条曲线,则称为非线性相关或曲线相关。
计算结果表明单位成本与产量之间存在高度负相关关系。
PPT学习交流
17
PPT学习交流
18
• 例4 股票价格指数是反映各个时期股价水平变动情况的指数,上 证指数和上证30指数都是判断我国上海证券交易所股市行情的主 要指标。下表是2019年前10个交易周的上证指数和上证30指数的 资料:
PPT学习交流
15
PPT学习交流
16
• 例3 某企业上半年产品产量与单位成本资料如下:
• 表3 某企业上半年产品产量与单位成本统计资料
月份
1 2 34 5 6
产量 (万件) 2 3 4 3 4 5
单位成本(元/件) 73 72 71 73 69 68
解 根据上述资料,单位成本与产量之间的相关系数为
• 表2 10个家庭月收入与月消费支出统计资料(百元)
家庭编号 1 2 3 4 5 6 7 8 9 10
月收入
9 13 15 17 18 20 22 23 26 30
月消费支出 6 8 9 10 11 13 14 13 15 20
解 根据上述资料,家庭月消费支出与家庭月收入之间的相关系数为
计算结果表明家庭月消费支出与家庭月收入之间存在高度正相关关 系。
• 例如,在例2中给出了10个家庭的月收入和月消费 支出的统计数据,它们之间呈正相关趋势;在例3中给出 了某企业上半年产品产量和单位成本的统计数据,它们 之间呈负相关趋势。
• 根据相关程度的不同,相关关系分为不相关、完全相 关和不完全相关。如果两个变量彼此的数量变化相互独 立,这种关系称为不相关;如果一个变量的数量变化完 全由另一个变量的数量变化所唯一确定,这种关系称为 完全相关;介于不相关与完全相关之间的关系,称为不 完全相关。
到月平均销售收入 y(万元)与月平均广告支出 x(万元)
的如下统计资料:
• 表1 某种护发产品2019年在8个地区销售的统计资料
地区编号 1 2 3 4 5 6 7 8
月平均销售收入
(万元)y
31
40
30
34
25
20
35
40
月平均广告支出 5 10 5 7 4 3 7 9
(万元)x
PPT学习交流
13
PPT学习交流
2
wenku.baidu.com • 一、变量相关的概念
• 一切客观事物都是相互联系的,而且任一事物的变化 都与其周围的其他事物相互联系和相互影响。客观现象 之间的相互联系,可以通过一定的数量关系反映出来。 现象之间的关系形态有两种类型:函数关系和统计相关 关系。
• 函数关系是变量之间的一种完全确定的关系,即一个 变量的数值完全由另一个(或一组)变量的数值所确定。 例如,银行的1年期存款利率为2.25%,设存入本金为 x , 到期的本息为 y ,则
• 图2中的散点大致分布在一条直线两侧,表明两个变 量之间是线性相关;图3中散点的分布大致呈抛物线形状, 表明两个变量之间是非线性相关。
PPT学习交流
6
图3 非线性相关
PPT学习交流
7
• 根据变量相关方向的不同,相关关系分为正相关与负 相关。正相关是指两个变量之间的变化方向一致,都是 增长或下降趋势,如居民收入增加,居民消费额随之增 加,故它们是正相关;负相关是指两个变量变化趋势方 向相反,如产品单位成本降低,利润随之增加,故它们 是负相关。
(1)
PPT学习交流
10
(1)式可简化为
(1)
PPT学习交流
11
• (二)相关系数的意义
• 相关系数的取值范围是在 -1和 +1之间,即 -1 ≤ r ≤ 1。r>0为正相关, r<0 为负相关。
• 如果 |r|=1 ,则表明两个变量是完全线性相关;r=0,则 表明两个变量完全不线性相关,但两个变量之间有可能 存在非线性相关。当变量之间非线性相关程度较大时, 就可能导致r=0,因此,当r=0时或很小时,应结合散点 图作出合理的解释。
• 这里 x 与 y表现为一种线性函数关系。微积分学是研究 函数关系的数学学科。
PPT学习交流
3
图1 线性函数
的图形
PPT学习交流
4
统计相关关系是变量之间存在的不完全确定性的关系。 在实际问题中,许多变量之间的关系并不是完全确定性 的,例如居民家庭消费与居民家庭收入这两个变量的关 系就不是完全确定的。收入水平相同的家庭,它们的消 费额往往不同;消费额相同的家庭,它们的收入也可能 不同。对现象之间相关关系密切程度的研究,称为
• 根据经验将相关程度划分为以下几种情况:
• 当 |r|≥0.8时,视为高度相关; 0.5≤|r|<0.8时,视为中 度相关; 0.3≤|r|<0.5时,视为低度相关; |r|<0.3时, 说明两个变量之间相关程度极弱,可视为不相关 。
PPT学习交流
12
• 例1 根据某种护发产品2019年在8个地区的销售情况,得
PPT学习交流
8
图4 不相关
• 图4中的散点杂乱无章地分布在一个区域中,表明两个变
量之间不相关。
PPT学习交流
9
• 三、相关关系的测度
• (一)简单相关系数
• 相关系数是对变量之间相关关系密切程度的度量,对 两个变量之间线性相关程度的度量称为简单相关系数。
•设
是
系数的计算公式为
的 n 组观测值,简单相关
相关分析和回归模型
第一节 相关分析 第二节 一元回归分析 第三节 多元线性回归分析 第四节 可线性化的曲线回归 附录:用Excel计算相关系数和进行回归分析
第一节 相关分析
• 相关分析的主要目的是对现象之间的相关关 系的密切程度给出一个数的度量,相关系数和等 级相关系数就是测定变量间相关关系的指标。
• 解 首先做出的散点图,
从图上我们看
到。这些点大致分别落在一条直线附近,说明月平均广告支出 x 与 月平均销售收入 y 之间具有明显的线性关系。
• 月平均广告支出 x 与月平均销售收入 y 的相关系数为
=
计算结果表明月平均广告支出与月平均销售收入之间存在高度正相
关关系。
PPT学习交流
14
• 例2 根据下表的资料,计算家庭月消费支出与家庭月收 入之间的相关系数。