[课件]第十三章 相关与回归分析PPT
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
13
2018/12/2
山东轻院皮革教研室
相关关系的描述与测度
(相关系数)
讨论一个群体在两个变量上的 表现,是计算一个群体两个变 量之间的相关,而不是对应任 何一个特定的人。
2018/12/2 山东轻院皮革教研室 14
相关系数
(correlation coefficient)
1. 2.
3.
4.
对变量之间关系密切程度的度量 对两个变量之间线性相关程度的度量称为 简单相关系数 若相关系数是根据总体全部数据计算的, 称为总体相关系数,记为 若是根据样本数据计算的,则称为样本相 关系数,记为 r
总体相关系数反映总体两个变量X和Y的线性相关程度。 特点:对于特定的总体来说,X和Y的数值是既定的, 总体相关系数是客观存在的特定数值。
2018/12/2 山东轻院皮革教研室 16
相关系数
(计算公式)
样本相关系数的计算公式
( x x )( y y ) r ( x x ) ( y y )
第十三章 相关与回 归分析
第13章 相关与回归分析
§13.1 §13.2 §13.3 §13.4 变量间关系的度量 一元线性回归 利用回归方程进行估计和预测 残差分析
2018/12/2
山东轻院皮革教研室
2
学习目标
1. 相关系数的分析方法 2. 一元线性回归的基本原理和参数的最小 二乘估计 3. 回归直线的拟合优度 4. 回归方程的显著性检验 5. 利用回归方程进行估计和预测 6. 用 Excel 进行回归
2018/12/2 山东轻院皮革教研室 18
3. 4.
5.
6.
相关系数
(取值及其意义)
完全负相关 无线性相关 完全正相关
-1.0
-0.5
0
+0.5
正相关程度增加
+1.0
r
负相关程度增加
2018/12/2 山东轻院皮革教研室 19
相关系数的显著性检验
( r 的抽样分布)
1. r 的抽样分布随总体相关系数和样本容量的大 小而变化 当样本数据来自正态总体时,随着n的增大,r 的抽样分布趋于正态分布,尤其是在总体 相关系数很小或接近0时,趋于正态分布 的趋势非常明显。而当远离0时,除非n非 常大,否则r的抽样分布呈现一定的偏态。 2. 当为较大的正值时,r 呈现左偏分布;当为 较大的负值时,r 呈现右偏分布。只有当接近 于0,而样本容量n很大时,才能认为r是接近 于正态分布的随机变量
山东轻院皮革教研室
8
相关关系
相关关系的例子
(几个例子)
父亲身高(y)与子女身高(x)之间的关系
收入水平(y)与受教育程度(x)之间的关系
粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、 温度(x3)之间的关系 商品的消费量(y)与居民收入(x)之间的关系 商品销售额(y)与广告费支出(x)之间的关系
2018/12/2 山东轻院皮革教研室 6
函数关系
函数关系的例子
(几个例子)
某种商品的销售额(y)与销售量(x)之间的关系可 表示为 y = px (p 为单价) 圆的面积(S)与半径之间的关系可表示为S=R2 企业的原材料消耗额(y)与产量(x1) 、单位产量 消耗(x2) 、原材料价格(x3)之间的关系可表示为 y = x1 x2 x 3
2018/12/2 山东轻院皮革教研室 9
相关关系
(类型)
相 关 关 系
线 性 相 关 非 线 性 相 关 完 全 相 关
正 相 关负 相 关
2018/12/2
不 相 关
正 相 关负 相 关
10
wk.baidu.com
山东轻院皮革教研室
相关关系的描述与测度
(散点图scatter diagram)
2018/12/2
山东轻院皮革教研室
2018/12/2 山东轻院皮革教研室 7
相关关系
(correlation)
1.
2.
3.
4.
变量间关系不能用函数关 y 系精确表达 一个变量的取值不能由另 一个变量唯一确定 当变量 x 取某个值时,变 量 y 的取值可能有几个 各观测点分布在直线周围 x
2018/12/2
2018/12/2 山东轻院皮革教研室 15
总体相关系数(correlation coefficient)
对于所研究的总体,表示两个相互联系变量相关程度 的总体相关系数为:
C o v ( X ,Y ) Cov ( X , Y ) V a r( X ) V a r ( Y Var ( X ) Var ( Y ))
2018/12/2 山东轻院皮革教研室 3
§13.1 变量间关系的度量
一. 二. 三.
变量间的关系 相关关系的描述与测度 相关系数的显著性检验
2018/12/2
山东轻院皮革教研室
4
“小时候胖,不是胖”。 “龙生龙,凤生凤,老鼠的儿子会 打洞”。
2018/12/2
山东轻院皮革教研室
5
变量间的关系
2
2
或化简为 r 2 2 2 2 n x x n y y
n xy x y
2018/12/2
山东轻院皮革教研室
17
相关系数
1. 2.
(取值及其意义)
r 的取值范围是 [-1,1] |r|=1,为完全相关 r =1,为完全正相关 r =-1,为完全负正相关 r = 0,不存在线性相关关系相关 -1r<0,为负相关 0<r1,为正相关 |r|越趋于1表示关系越密切;|r|越趋于0表示关系 越不密切
2018/12/2
山东轻院皮革教研室
12
练习
X身高 158 155 165 162 160 和800 Y体重 49 45 55 50 51 250 xy 7742 6975 9075 8100 8160 40052 x2 24964 24025 27225 26244 25600 128058 y2 2401 2025 3025 2500 2601 12552
函数关系
1. 2.
3.
是一一对应的确定关系 设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完 y 全依赖于 x ,当变量 x 取某 个数值时, y 依确定的关系 取相应的值,则称 y 是 x 的 函数,记为 y = f (x),其中 x 称为自变量, y 称为因变 量 x 各观测点落在一条线上
11
散点图
(scatter diagram)
非线性相关
完全正线性相关
完全负线性相关
负线性相关
不相关
正线性相关
2018/12/2
山东轻院皮革教研室
相关关系的描述与测度
(相关系数)
讨论一个群体在两个变量上的 表现,是计算一个群体两个变 量之间的相关,而不是对应任 何一个特定的人。
2018/12/2 山东轻院皮革教研室 14
相关系数
(correlation coefficient)
1. 2.
3.
4.
对变量之间关系密切程度的度量 对两个变量之间线性相关程度的度量称为 简单相关系数 若相关系数是根据总体全部数据计算的, 称为总体相关系数,记为 若是根据样本数据计算的,则称为样本相 关系数,记为 r
总体相关系数反映总体两个变量X和Y的线性相关程度。 特点:对于特定的总体来说,X和Y的数值是既定的, 总体相关系数是客观存在的特定数值。
2018/12/2 山东轻院皮革教研室 16
相关系数
(计算公式)
样本相关系数的计算公式
( x x )( y y ) r ( x x ) ( y y )
第十三章 相关与回 归分析
第13章 相关与回归分析
§13.1 §13.2 §13.3 §13.4 变量间关系的度量 一元线性回归 利用回归方程进行估计和预测 残差分析
2018/12/2
山东轻院皮革教研室
2
学习目标
1. 相关系数的分析方法 2. 一元线性回归的基本原理和参数的最小 二乘估计 3. 回归直线的拟合优度 4. 回归方程的显著性检验 5. 利用回归方程进行估计和预测 6. 用 Excel 进行回归
2018/12/2 山东轻院皮革教研室 18
3. 4.
5.
6.
相关系数
(取值及其意义)
完全负相关 无线性相关 完全正相关
-1.0
-0.5
0
+0.5
正相关程度增加
+1.0
r
负相关程度增加
2018/12/2 山东轻院皮革教研室 19
相关系数的显著性检验
( r 的抽样分布)
1. r 的抽样分布随总体相关系数和样本容量的大 小而变化 当样本数据来自正态总体时,随着n的增大,r 的抽样分布趋于正态分布,尤其是在总体 相关系数很小或接近0时,趋于正态分布 的趋势非常明显。而当远离0时,除非n非 常大,否则r的抽样分布呈现一定的偏态。 2. 当为较大的正值时,r 呈现左偏分布;当为 较大的负值时,r 呈现右偏分布。只有当接近 于0,而样本容量n很大时,才能认为r是接近 于正态分布的随机变量
山东轻院皮革教研室
8
相关关系
相关关系的例子
(几个例子)
父亲身高(y)与子女身高(x)之间的关系
收入水平(y)与受教育程度(x)之间的关系
粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、 温度(x3)之间的关系 商品的消费量(y)与居民收入(x)之间的关系 商品销售额(y)与广告费支出(x)之间的关系
2018/12/2 山东轻院皮革教研室 6
函数关系
函数关系的例子
(几个例子)
某种商品的销售额(y)与销售量(x)之间的关系可 表示为 y = px (p 为单价) 圆的面积(S)与半径之间的关系可表示为S=R2 企业的原材料消耗额(y)与产量(x1) 、单位产量 消耗(x2) 、原材料价格(x3)之间的关系可表示为 y = x1 x2 x 3
2018/12/2 山东轻院皮革教研室 9
相关关系
(类型)
相 关 关 系
线 性 相 关 非 线 性 相 关 完 全 相 关
正 相 关负 相 关
2018/12/2
不 相 关
正 相 关负 相 关
10
wk.baidu.com
山东轻院皮革教研室
相关关系的描述与测度
(散点图scatter diagram)
2018/12/2
山东轻院皮革教研室
2018/12/2 山东轻院皮革教研室 7
相关关系
(correlation)
1.
2.
3.
4.
变量间关系不能用函数关 y 系精确表达 一个变量的取值不能由另 一个变量唯一确定 当变量 x 取某个值时,变 量 y 的取值可能有几个 各观测点分布在直线周围 x
2018/12/2
2018/12/2 山东轻院皮革教研室 15
总体相关系数(correlation coefficient)
对于所研究的总体,表示两个相互联系变量相关程度 的总体相关系数为:
C o v ( X ,Y ) Cov ( X , Y ) V a r( X ) V a r ( Y Var ( X ) Var ( Y ))
2018/12/2 山东轻院皮革教研室 3
§13.1 变量间关系的度量
一. 二. 三.
变量间的关系 相关关系的描述与测度 相关系数的显著性检验
2018/12/2
山东轻院皮革教研室
4
“小时候胖,不是胖”。 “龙生龙,凤生凤,老鼠的儿子会 打洞”。
2018/12/2
山东轻院皮革教研室
5
变量间的关系
2
2
或化简为 r 2 2 2 2 n x x n y y
n xy x y
2018/12/2
山东轻院皮革教研室
17
相关系数
1. 2.
(取值及其意义)
r 的取值范围是 [-1,1] |r|=1,为完全相关 r =1,为完全正相关 r =-1,为完全负正相关 r = 0,不存在线性相关关系相关 -1r<0,为负相关 0<r1,为正相关 |r|越趋于1表示关系越密切;|r|越趋于0表示关系 越不密切
2018/12/2
山东轻院皮革教研室
12
练习
X身高 158 155 165 162 160 和800 Y体重 49 45 55 50 51 250 xy 7742 6975 9075 8100 8160 40052 x2 24964 24025 27225 26244 25600 128058 y2 2401 2025 3025 2500 2601 12552
函数关系
1. 2.
3.
是一一对应的确定关系 设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完 y 全依赖于 x ,当变量 x 取某 个数值时, y 依确定的关系 取相应的值,则称 y 是 x 的 函数,记为 y = f (x),其中 x 称为自变量, y 称为因变 量 x 各观测点落在一条线上
11
散点图
(scatter diagram)
非线性相关
完全正线性相关
完全负线性相关
负线性相关
不相关
正线性相关