统计学PPT课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11 - 6
相关关系
(correlation)
1. 变量间关系不能用函数关
系精确表达
y
2. 一个变量的取值不能由另 一个变量唯一确定
3. 当变量 x 取某个值时,变 量 y 的取值可能有几个
4. 各观测点分布在直线周围
x
11 - 7
相关关系
(几个例子)
相关关系的例子
父亲身高(y)与子女身高(x)之间的关系 收入水平(y)与受教育程度(x)之间的关系 粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、
系越不密切
11 - 18
相关系数
(取值及其意义)
完全负相关
无线性相关
完全正相关
-Leabharlann Baidu.0 -0.5 0 +0.5 +1.0
r
负相关程度增加 正相关程度增加
11 - 19
相关系数
(例题分析)
用Excel计算相关系数
11 - 20
相关系数的显著性检验
11 - 21
相关系数的显著性检验
( r 的抽样分布)
简单相关系数 3. 若相关系数是根据总体全部数据计算的,
称为总体相关系数,记为
4. 若是根据样本数据计算的,则称为样本相 关系数,记为 r
11 - 16
相关系数
(计算公式)
样本相关系数的计算公式
r (x x)( y y) (x x)2 (y y)2
或化简为 r
11 - 2
11.1 变量间关系的度量
一. 变量间的关系 二. 相关关系的描述与测度 三. 相关系数的显著性检验
11 - 3
变量间的关系
11 - 4
函数关系
1. 是一一对应的确定关系
2. 设有两个变量 x 和 y ,变量
y 随变量 x 一起变化,并完 y
全依赖于 x ,当变量 x 取某 个数值时, y 依确定的关系 取相应的值,则称 y 是 x 的 函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量
11 - 12
散点图
(例题分析)
11 - 13
散点图
(例题分析)
»² ¼Á û´ î¿
14
12
10
8
6
4
2
0
0
50
100
150
200
¹Ì ¶¨× Ê ²ú Ͷ × Ê ¶î
²» Á¼ ´û ¿î Óë ¹Ì ¶¨ × Ê ²ú Ͷ × Ê ¶î
µÄ É¢ µã ͼ
»² ¼Á û´ î¿
14 12 10
于0,而样本容量n很大时,才能认为r是接近 于正态分布的随机变量
11 - 22
温度(x3)之间的关系 商品的消费量(y)与居民收入(x)之间的关系 商品销售额(y)与广告费支出(x)之间的关系
11 - 8
相关关系
(类型)
相关关系
线性相关 非线性相关 完全相关 不相关
正相关 负相关
11 - 9
正相关 负相关
相关关系的描述与测度
(散点图)
11 - 10
3. 各观测点落在一条线上
x
11 - 5
函数关系
(几个例子)
函数关系的例子
某种商品的销售额(y)与销售量(x)之间的关系可 表示为 y = px (p 为单价)
圆的面积(S)与半径之间的关系可表示为S=R2
企业的原材料消耗额(y)与产量(x1) 、单位产量 消耗(x2) 、原材料价格(x3)之间的关系可表示为 y = x1 x2 x3
完全正线性相关
正线性相关
11 - 11
散点图
(scatter diagram)
完全负线性相关
负线性相关
非线性相关
不相关
散点图
(例题分析)
【例】一家大型商业银行在多个地区设有分行 ,其业务主要是进行基础设施建设、国家重 点项目建设、固定资产投资等项目的贷款。 近年来,该银行的贷款额平稳增长,但不良 贷款额也有较大比例的提高,这给银行业务 的发展带来较大压力。为弄清楚不良贷款形 成的原因,希望利用银行业务的有关数据做 些定量分析,以便找出控制不良贷款的办法 。下面是该银行所属的25家分行2002年的有 关业务数据
n xy x y
n x2 x2 n y2 y2
11 - 17
相关系数
(取值及其意义)
1. r 的取值范围是 [-1,1] 2. |r|=1,为完全相关
r =1,为完全正相关 r =-1,为完全负正相关
3. r = 0,不存在线性相关关系相关
4. -1r<0,为负相关 5. 0<r1,为正相关 6. |r|越趋于1表示关系越密切;|r|越趋于0表示关
1. r 的抽样分布随总体相关系数和样本容量的大 小而变化
当样本数据来自正态总体时,随着n的增大,r 的
抽样分布趋于正态分布,尤其是在总体相关系数
很小或接近0时,趋于正态分布的趋势非常明显。 而当远离0时,除非n非常大,否则r的抽样分布呈 现一定的偏态。
2. 当为较大的正值时,r 呈现左偏分布;当为 较大的负值时,r 呈现右偏分布。只有当接近
14
12
10
8
6
4
2
0
0
20
40
´û ¿î Ïî Ä¿ ¸ö Êý
²» Á¼ ´û ¿î Óë ´û ¿î Ïî Ä¿ ¸ö Êý µÄ É¢ µã ͼ
相关关系的描述与测度
(相关系数)
11 - 15
相关系数
(correlation coefficient)
1. 对变量之间关系密切程度的度量 2. 对两个变量之间线性相关程度的度量称为
8 6 4 2 0
11 - 14
0
5
10
15
20
25
30
²» Á¼ ´û ¿î Óë ÀÛ ¼Æ Ó¦ ÊÕ ´ûÀÛ ¿î¼Æ Ó¦ ÊÕ ´û ¿î
µÄ É¢ µã ͼ
»² ¼Á û´ î¿
»² ¼Á û´ î¿
14
12
10
8
6
4
2
0
0
100
200
300
400
´û ¿î Óà ¶î ²» Á¼ ´û ¿î Óë ´û ¿î Óà ¶î µÄ É¢ µã ͼ
第七章 一元线性回归
11.1 变量间关系的度量 11.2 一元线性回归 11.3 利用回归方程进行估计和预测 11.4 残差分析
11 - 1
学习目标
1. 相关系数的分析方法 2. 一元线性回归的基本原理和参数的最小
二乘估计 3. 回归直线的拟合优度 4. 回归方程的显著性检验 5. 利用回归方程进行估计和预测 6. 用 Excel 进行回归
相关关系
(correlation)
1. 变量间关系不能用函数关
系精确表达
y
2. 一个变量的取值不能由另 一个变量唯一确定
3. 当变量 x 取某个值时,变 量 y 的取值可能有几个
4. 各观测点分布在直线周围
x
11 - 7
相关关系
(几个例子)
相关关系的例子
父亲身高(y)与子女身高(x)之间的关系 收入水平(y)与受教育程度(x)之间的关系 粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、
系越不密切
11 - 18
相关系数
(取值及其意义)
完全负相关
无线性相关
完全正相关
-Leabharlann Baidu.0 -0.5 0 +0.5 +1.0
r
负相关程度增加 正相关程度增加
11 - 19
相关系数
(例题分析)
用Excel计算相关系数
11 - 20
相关系数的显著性检验
11 - 21
相关系数的显著性检验
( r 的抽样分布)
简单相关系数 3. 若相关系数是根据总体全部数据计算的,
称为总体相关系数,记为
4. 若是根据样本数据计算的,则称为样本相 关系数,记为 r
11 - 16
相关系数
(计算公式)
样本相关系数的计算公式
r (x x)( y y) (x x)2 (y y)2
或化简为 r
11 - 2
11.1 变量间关系的度量
一. 变量间的关系 二. 相关关系的描述与测度 三. 相关系数的显著性检验
11 - 3
变量间的关系
11 - 4
函数关系
1. 是一一对应的确定关系
2. 设有两个变量 x 和 y ,变量
y 随变量 x 一起变化,并完 y
全依赖于 x ,当变量 x 取某 个数值时, y 依确定的关系 取相应的值,则称 y 是 x 的 函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量
11 - 12
散点图
(例题分析)
11 - 13
散点图
(例题分析)
»² ¼Á û´ î¿
14
12
10
8
6
4
2
0
0
50
100
150
200
¹Ì ¶¨× Ê ²ú Ͷ × Ê ¶î
²» Á¼ ´û ¿î Óë ¹Ì ¶¨ × Ê ²ú Ͷ × Ê ¶î
µÄ É¢ µã ͼ
»² ¼Á û´ î¿
14 12 10
于0,而样本容量n很大时,才能认为r是接近 于正态分布的随机变量
11 - 22
温度(x3)之间的关系 商品的消费量(y)与居民收入(x)之间的关系 商品销售额(y)与广告费支出(x)之间的关系
11 - 8
相关关系
(类型)
相关关系
线性相关 非线性相关 完全相关 不相关
正相关 负相关
11 - 9
正相关 负相关
相关关系的描述与测度
(散点图)
11 - 10
3. 各观测点落在一条线上
x
11 - 5
函数关系
(几个例子)
函数关系的例子
某种商品的销售额(y)与销售量(x)之间的关系可 表示为 y = px (p 为单价)
圆的面积(S)与半径之间的关系可表示为S=R2
企业的原材料消耗额(y)与产量(x1) 、单位产量 消耗(x2) 、原材料价格(x3)之间的关系可表示为 y = x1 x2 x3
完全正线性相关
正线性相关
11 - 11
散点图
(scatter diagram)
完全负线性相关
负线性相关
非线性相关
不相关
散点图
(例题分析)
【例】一家大型商业银行在多个地区设有分行 ,其业务主要是进行基础设施建设、国家重 点项目建设、固定资产投资等项目的贷款。 近年来,该银行的贷款额平稳增长,但不良 贷款额也有较大比例的提高,这给银行业务 的发展带来较大压力。为弄清楚不良贷款形 成的原因,希望利用银行业务的有关数据做 些定量分析,以便找出控制不良贷款的办法 。下面是该银行所属的25家分行2002年的有 关业务数据
n xy x y
n x2 x2 n y2 y2
11 - 17
相关系数
(取值及其意义)
1. r 的取值范围是 [-1,1] 2. |r|=1,为完全相关
r =1,为完全正相关 r =-1,为完全负正相关
3. r = 0,不存在线性相关关系相关
4. -1r<0,为负相关 5. 0<r1,为正相关 6. |r|越趋于1表示关系越密切;|r|越趋于0表示关
1. r 的抽样分布随总体相关系数和样本容量的大 小而变化
当样本数据来自正态总体时,随着n的增大,r 的
抽样分布趋于正态分布,尤其是在总体相关系数
很小或接近0时,趋于正态分布的趋势非常明显。 而当远离0时,除非n非常大,否则r的抽样分布呈 现一定的偏态。
2. 当为较大的正值时,r 呈现左偏分布;当为 较大的负值时,r 呈现右偏分布。只有当接近
14
12
10
8
6
4
2
0
0
20
40
´û ¿î Ïî Ä¿ ¸ö Êý
²» Á¼ ´û ¿î Óë ´û ¿î Ïî Ä¿ ¸ö Êý µÄ É¢ µã ͼ
相关关系的描述与测度
(相关系数)
11 - 15
相关系数
(correlation coefficient)
1. 对变量之间关系密切程度的度量 2. 对两个变量之间线性相关程度的度量称为
8 6 4 2 0
11 - 14
0
5
10
15
20
25
30
²» Á¼ ´û ¿î Óë ÀÛ ¼Æ Ó¦ ÊÕ ´ûÀÛ ¿î¼Æ Ó¦ ÊÕ ´û ¿î
µÄ É¢ µã ͼ
»² ¼Á û´ î¿
»² ¼Á û´ î¿
14
12
10
8
6
4
2
0
0
100
200
300
400
´û ¿î Óà ¶î ²» Á¼ ´û ¿î Óë ´û ¿î Óà ¶î µÄ É¢ µã ͼ
第七章 一元线性回归
11.1 变量间关系的度量 11.2 一元线性回归 11.3 利用回归方程进行估计和预测 11.4 残差分析
11 - 1
学习目标
1. 相关系数的分析方法 2. 一元线性回归的基本原理和参数的最小
二乘估计 3. 回归直线的拟合优度 4. 回归方程的显著性检验 5. 利用回归方程进行估计和预测 6. 用 Excel 进行回归