第七章中财统计学PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0.00005 350
300
250
200
150
100
50
0
2
4
6
8
中央财经大学统计学院15
相关系数的显著性检验
检验的步骤是:
1、提出假设:H0: ;H1: 0
2、 计算检验的统计量:
t r n2 ~t(n2) 1r2
3、 确定显著性水平,并作出决策 • 若 t >t,拒绝H0 • 或者:若p值< ,拒绝H0
中央财经大学统计学院3
函数关系与相关关系
当一个变量取一定数值时,另一个变量有 确定值与之相对应,这种关系称为函数关 系。
当一个变量取一定数值时,与之相对应的 另一变量的数值虽然不确定,但它仍按某 种规律在一定的范围内变化,这种关系称 为相关关系。
对相关关系的分析是统计学的重要研究内 容。 主要研究方法:相中央财关经大学分统计学析院4 和与回归分析。
第七章 相关与回归分 析
一元线性回归 多元线性回归 回归分析的其他问题
中央财经大学统计学院
学习目标
掌握两个或多个变量之间相关关系的分析 方法。
能够根据收集到的数据估计一元和多元回 归方程,并对结果进行解释。
掌握回归分析模型的各类检验方法。
中央财经大学统计学院2
7.1 相关分析
函数关系与相关关系 相关分析与回归分析 散点图 相关系数
中央财经大学统计学院5
相关分析的类型
根据相关关系的类型和程度可以有以下分
类:
相关关系
完全相关
不完全相关
不相关
线性相关 非线性相关
中央财经大学统计学院6
散点图 Scatter Diagram
散点图是观察两个变量之间的相关 程度和类型最直观的方法。
散点图是在直角坐标系中用相对应 的两个变量值作为图中一个点的横 坐标和纵坐标描点得到的图形。
中央财经大学统计学院18
zhi7.2 一元线性回归分析
总体回归函数 、样本回归函数 一元线性回归模型的估计 一元线性回归模型的检验
中央财经大学统计学院19
趋向中间高度的回归
回归这个术语是由英国著名统计学家Francis Galton在19世纪末期研究孩子及他们的父母的身 高时提出来的。Galton发现身材高的父母,他们 的孩子也高。但这些孩子平均起来并不像他们的父 母那样高。对于比较矮的父母情形也类似:他们的 孩子比较矮,但这些孩子的平均身高要比他们的父 母的平均身高高。 Galton把这种孩子的身高向中 间值靠近的趋势称之为一种回归效应,而他发展的 研究两个数值变量的方法称为回归分析。
中央财经大学统计学院9
散点图
人 均 20.00 消 费 支 出
15.00
10.00
5.00
0.00 0.00
5.00
10.00
15.00
人均可支配收入
中央财经大学统计学院10
20.00
25.00
相关系数的计算及其检验
相关系数(Coefficient of Correlation)是 用来衡量变量之间相关程度的指标,根据 变量的多少和属性可以有多种不同的计算 方法。
相关分析与回归分析
相关分析(Correlation Analysis)研究变 量之间相关的方向和相关的程度,但无法 给出变量间相互关系的具体形式,因而无 法从一个变量推测另一个变量。
回归分析(Regression)可以确定变量之 间相互关系的具体形式(回归方程),确 定一个变量对另一个变量的影响程度,并 根据回归方程进行预测。
(xx)2(yy)2
中央财经大学统计学院12
相关系数r 的特征
没有单位,取值介于-1与1之间。 当r>0时,X与Y为正相关;当r<0时,X与
Y为负相关。 绝对值越接近1说明关系越密切。r=1为完
全正相关,而r=-1为完全负相关。 注意:当r=0时,只是表明两个变量之间不
存在线性关系,它并不意味着X与Y之间不 存在其他类型的相关关系。
典型的错误推断: 统计分析表明,庆祝生日次数越 多的人越长寿。因此,庆祝生日有利于健康。 调查表明,世界各国人均电视机拥有量与预期寿 命存在很强的正相关性。因此,电视机拥有量越 高,预期寿命越长。 对小学各年级学生的抽样调查表明,学生的识字 水平与他们鞋子的尺寸高度正相关。因此,学生 穿的鞋越大,他的识字水平就越高。
中央财经大学统计学院13
相关系数的显著性检验
样本相关系数r受到抽样波动的影响,是一 个随机变量。
相关系数非常高的样本也有可能来自无相 关关系的总体,样本容量越小其可信程度 就越差,为了排除这种情况,需要对相关 系数的显著性进行检验。
中央财经大学统计学院14
样本能代表总体吗?
如果红色的点碰巧为你的样本,则样 本相关系数为0.907,总体相关系数为
中央财经大学统计学院16
消费支出和可支配收入的相关系数
计算结果:
t检验值为
消费支出
可支配收 入
消费支出 可支配收入 1
0.9968
1
tr n20.99682157.1981 1r2 10.99682
临界值t(21)=2.08,故拒绝H0,认为相关系数显 著非零。
中央财经大学统计学院17
注意:相关关系≠因果关系!
衡量两个定量变量之间线性相关程度的常 用指标是皮尔逊( Pearson)相关系数。
通常以ρ表示总体的相关系数,以r表示样 本的相关系数。
中央财经大学统计学院11
相关系数的计算及其检验
总体相关系数 的定义式是:
Co(vX,Y)
Va(rX)V源自文库(Yr)
样本相关系数
r (xx)(yy)
的定义公式是:
中央财经大学统计学院7
用散点图观察变量之间的相关关系
完全正线性相关
正线性相关
完全负线性相关
负线性相关
中央财经大学统计学院8
非线性相关
不相关
例题7.1
教材中的表7.1是 1985-2007年北京市城镇 居民人均年消费性支出(变量Y)和人均年 可支配收入(变量X)的有关资料,请对X 和Y变量进行相关分析 。
中央财经大学统计学院20
Regression 的原始释义
中央财经大学统计学院21
自变量和因变量
两个变量,如果一个变量是另一个变量变化的 结果,那么 代表原因的变量称为自变量 [Independent (Explanatory) Variable],用X表示; 代表结果的变量称为因变量 [Dependent (Response) Variable] ,用Y表示。
300
250
200
150
100
50
0
2
4
6
8
中央财经大学统计学院15
相关系数的显著性检验
检验的步骤是:
1、提出假设:H0: ;H1: 0
2、 计算检验的统计量:
t r n2 ~t(n2) 1r2
3、 确定显著性水平,并作出决策 • 若 t >t,拒绝H0 • 或者:若p值< ,拒绝H0
中央财经大学统计学院3
函数关系与相关关系
当一个变量取一定数值时,另一个变量有 确定值与之相对应,这种关系称为函数关 系。
当一个变量取一定数值时,与之相对应的 另一变量的数值虽然不确定,但它仍按某 种规律在一定的范围内变化,这种关系称 为相关关系。
对相关关系的分析是统计学的重要研究内 容。 主要研究方法:相中央财关经大学分统计学析院4 和与回归分析。
第七章 相关与回归分 析
一元线性回归 多元线性回归 回归分析的其他问题
中央财经大学统计学院
学习目标
掌握两个或多个变量之间相关关系的分析 方法。
能够根据收集到的数据估计一元和多元回 归方程,并对结果进行解释。
掌握回归分析模型的各类检验方法。
中央财经大学统计学院2
7.1 相关分析
函数关系与相关关系 相关分析与回归分析 散点图 相关系数
中央财经大学统计学院5
相关分析的类型
根据相关关系的类型和程度可以有以下分
类:
相关关系
完全相关
不完全相关
不相关
线性相关 非线性相关
中央财经大学统计学院6
散点图 Scatter Diagram
散点图是观察两个变量之间的相关 程度和类型最直观的方法。
散点图是在直角坐标系中用相对应 的两个变量值作为图中一个点的横 坐标和纵坐标描点得到的图形。
中央财经大学统计学院18
zhi7.2 一元线性回归分析
总体回归函数 、样本回归函数 一元线性回归模型的估计 一元线性回归模型的检验
中央财经大学统计学院19
趋向中间高度的回归
回归这个术语是由英国著名统计学家Francis Galton在19世纪末期研究孩子及他们的父母的身 高时提出来的。Galton发现身材高的父母,他们 的孩子也高。但这些孩子平均起来并不像他们的父 母那样高。对于比较矮的父母情形也类似:他们的 孩子比较矮,但这些孩子的平均身高要比他们的父 母的平均身高高。 Galton把这种孩子的身高向中 间值靠近的趋势称之为一种回归效应,而他发展的 研究两个数值变量的方法称为回归分析。
中央财经大学统计学院9
散点图
人 均 20.00 消 费 支 出
15.00
10.00
5.00
0.00 0.00
5.00
10.00
15.00
人均可支配收入
中央财经大学统计学院10
20.00
25.00
相关系数的计算及其检验
相关系数(Coefficient of Correlation)是 用来衡量变量之间相关程度的指标,根据 变量的多少和属性可以有多种不同的计算 方法。
相关分析与回归分析
相关分析(Correlation Analysis)研究变 量之间相关的方向和相关的程度,但无法 给出变量间相互关系的具体形式,因而无 法从一个变量推测另一个变量。
回归分析(Regression)可以确定变量之 间相互关系的具体形式(回归方程),确 定一个变量对另一个变量的影响程度,并 根据回归方程进行预测。
(xx)2(yy)2
中央财经大学统计学院12
相关系数r 的特征
没有单位,取值介于-1与1之间。 当r>0时,X与Y为正相关;当r<0时,X与
Y为负相关。 绝对值越接近1说明关系越密切。r=1为完
全正相关,而r=-1为完全负相关。 注意:当r=0时,只是表明两个变量之间不
存在线性关系,它并不意味着X与Y之间不 存在其他类型的相关关系。
典型的错误推断: 统计分析表明,庆祝生日次数越 多的人越长寿。因此,庆祝生日有利于健康。 调查表明,世界各国人均电视机拥有量与预期寿 命存在很强的正相关性。因此,电视机拥有量越 高,预期寿命越长。 对小学各年级学生的抽样调查表明,学生的识字 水平与他们鞋子的尺寸高度正相关。因此,学生 穿的鞋越大,他的识字水平就越高。
中央财经大学统计学院13
相关系数的显著性检验
样本相关系数r受到抽样波动的影响,是一 个随机变量。
相关系数非常高的样本也有可能来自无相 关关系的总体,样本容量越小其可信程度 就越差,为了排除这种情况,需要对相关 系数的显著性进行检验。
中央财经大学统计学院14
样本能代表总体吗?
如果红色的点碰巧为你的样本,则样 本相关系数为0.907,总体相关系数为
中央财经大学统计学院16
消费支出和可支配收入的相关系数
计算结果:
t检验值为
消费支出
可支配收 入
消费支出 可支配收入 1
0.9968
1
tr n20.99682157.1981 1r2 10.99682
临界值t(21)=2.08,故拒绝H0,认为相关系数显 著非零。
中央财经大学统计学院17
注意:相关关系≠因果关系!
衡量两个定量变量之间线性相关程度的常 用指标是皮尔逊( Pearson)相关系数。
通常以ρ表示总体的相关系数,以r表示样 本的相关系数。
中央财经大学统计学院11
相关系数的计算及其检验
总体相关系数 的定义式是:
Co(vX,Y)
Va(rX)V源自文库(Yr)
样本相关系数
r (xx)(yy)
的定义公式是:
中央财经大学统计学院7
用散点图观察变量之间的相关关系
完全正线性相关
正线性相关
完全负线性相关
负线性相关
中央财经大学统计学院8
非线性相关
不相关
例题7.1
教材中的表7.1是 1985-2007年北京市城镇 居民人均年消费性支出(变量Y)和人均年 可支配收入(变量X)的有关资料,请对X 和Y变量进行相关分析 。
中央财经大学统计学院20
Regression 的原始释义
中央财经大学统计学院21
自变量和因变量
两个变量,如果一个变量是另一个变量变化的 结果,那么 代表原因的变量称为自变量 [Independent (Explanatory) Variable],用X表示; 代表结果的变量称为因变量 [Dependent (Response) Variable] ,用Y表示。