区域分析(相关、回归分析)PPT
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
量观察或实验取得相关资料,通 常是从两个变量关联的数据集合中随机抽取样 本,先对样本数据进行统计分析,然后再对总 体进行推断,达到对变量间相关密切程度的定 量认识。
第一节 相关分析
表4.1是某地区2001年抽样调查20户城市居 民得到的平均每人每月可支配收入及消费性支 出的原始资料。
按不同的标志加以区分。
第一节 相关分析
1. 按相关程度: 完全相关 不相关 不完全相关
第一节 相关分析
➢ 完全相关 当一种现象的数量变化完全由另一个现象 的数量变化所确定时,称这两种现象间的关系 为完全相关。 例如在价格不变的条件下,某种商品的销 售总额与其销售量之间总是成正比例关系。
第一节 相关分析
我们本节所研究的统计相关关系一般是 指不完全相关关系。
第一节 相关分析
2. 按相关形式: 线性相关 非线性相关
第一节 相关分析
➢ 线性相关 当两种相关现象之间的关系大致呈现为直 线方程的关系时,称之为线性相关。 例如人均消费水平与人均收入水平通常成 线性关系。
第一节 相关分析
➢ 非线性相关 如果两种相关现象之间,并不表现为直线 方程的关系,而是近似于某种曲线方程的关系, 则这种相关关系称为非线性相关。 例如产品的平均成本与产品总产量之间的 相关关系就是一种非线性相关。
系的直观工具。一般在进行详细的定量分析之 前,可以先利用它们对现象之间存在的相关关 系的形式、方向和密切程度作大致的判断。
第一节 相关分析
相关表是一种反映变量之间相关关系的统 计表。将某一变量按其取值的大小顺序排列, 然后再将与其相关的另一变量的对应值平行排 列,便可得到简单的相关表。
第一节 相关分析
第一节 相关分析
二、一元线性相关分析
相关分析是研究不同变量间密切程度的一 种常用统计方法。我们首先从最简单的一元线 性相关现象开始,介绍对于两个变量间的线性 相关密切程度进行统计分析的基本原理和一般 方法。
第一节 相关分析
统计分析是从对所研究的客观现象的定性认识 到定量认识的。要对两个变量进行相关分析,首先 必须根据研究的目的,以经济理论为指导,结合有 关的专业知识和实际经验对所研究的变量进行定性 分析,确认两个变量之间客观存在着统计相关关系。
第一节 相关分析
所以,在0.01的置信水平下,人均可支配 收入和人均消费支出之间不相关的概率低于1%, 即两者之间同向相关的概率高达99%。因此可 以断定,两者之间存在着显著的线性相关关系。
第一节 相关分析
对相关系数r进行显著性检验的另一种
方法是计算t值。 数学上可以证明,在X与Y都服从于正态
分布,并且又有ρ=0的条件下,可以采用t检 验来确定r的显著性。其步骤如下:
住户编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
合计
每户人数(人) 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
人均可支配收入(元/月) 760.3 439.3 456.5 483.9 434.4 439.4 524.2 620.4 460.9 573.6 669.7 652.6 614.1 580.7 467.4 585.1 494.5 469.7 470.1 550.1 10746.9
第一节 相关分析
4. 按所研究的变量多少: 单相关 复相关 偏相关
第一节 相关分析
➢ 单相关 两个现象的相关,即一个变量对另一个变 量的相关关系,称为单相关或一元相关。
第一节 相关分析
➢ 复相关 当所研究的是一个变量对两个或两个以上 其他变量的相关关系时,称为复相关或多元相 关。 例如,某种商品的需求与其价格水平以及 人们收入水平之间的相关关系便是一种复相关。
系数ρ=0的临界值,即 r;公式 rr的意思
是, 当所计算的相关系数r的绝对值大于在α水平 下的临界值时,两要素不相关(即ρ=0)的可能性 只有α。
第一节 相关分析
比如,根据公式 rxy Sx Sx xS yyy X iX iX X 2 Y iY iY Y2
计算表4.1中,人均可支配收入和人均消费支出间的 相关系数,r=0.981,查表3.1.2可知,在f=18、 α=0.01时, r =0.5614,r> r .
第一节 相关分析
因此,相关分析中必须对样本相关系数r 进行显著性检验,只有通过检验才能知道它的 可信度。
第一节 相关分析
一般情况下,相关系数的检验,是在给 定的置信水平下,通过查阅相关系数检验的 临界值表来完成的。
r
第一节 相关分析
在上表中,左边的f叫作自由度,其数值为f= n-2,这里的n为样本数;上方的α代表不同的置 信水平;表内的数值代表不同的置信水平下相关
第一节 相关分析
当给定X某一个值时,由于消费环境等 的影响,而使Y有不同的值与之相对应,因此, 商品销售额Y与广告费支出x之间不存在确定 的函数关系。
第一节 相关分析
又如劳动生产率相同的企业其利润率 并不一定相同,因为利润率的提高除受劳 动生产率提高的影响外,还受产量、资金 流转、原材料消耗、管理费用以及其他偶 然因素变化的影响。
第四章 相关分析和回归分析
第一节 相关分析 第二节 回归分析
第四章 相关分析和回归分析
第一节 相关分析
第一节 相关分析
任何事物的存在都不是孤立的,社会经济现 象之间总是相互联系和相互制约的,在其发展变 化的过程中,社会经济现象不仅同与它有关的现 象构成一个普遍联系的整体,而且在它的内部也 存在着许多彼此关联的因素。
定序变量又称顺序变量、有序变量,它取值 的大小能够表示观测对象的某种顺序关系。测度 定序变量间的相关系数要采用斯皮尔曼相关系数 和肯特尔相关系数。这两个相关系数都属于秩相 关系数。
8090.6
第一节 相关分析
从相关表4.2中可以看出,随着城市居民可 支配收入的不断提高,其消费性支出也伴随着 产生相应提高的趋势,两者之间存在明显的正 相关关系。
第一节 相关分析
相关图也叫散点图或散布图,它是观察两 个变量之间关系的一种更加直观的方法。散点 图的具体绘制方法是:以横轴代表自变量(X), 纵轴代表因变量(Y),将两个变量间相对应的观 测值用坐标点的形式描绘在坐标平面上,从而 揭示了各相关点的分布情况。
这种变量之间在数量变化上按一定法则 严格确定的相互依存关系称为函数关系。
第一节 相关分析
例如,商品销售额(Y)与广告费支出(X) 之间的数量关系。在一定前提下,当X取 值在一定范围内,广告费投入越多,商品 销售额就越高。
第一节 相关分析
但是,X 并不能唯一确定Y的大小,因 为Y的大小还与其它因素的影响有关,如 销售地区消费者的数量,收入水平等。
第一节 相关分析
➢ 偏相关 多个变量之间的相关关系是错综复杂的, 其中任何两个变量之间的关系中都夹杂了其他 变量所带来的影响。 这种情况下,当控制其他变量都保持不变 时,其中两个变量之间的相关关系称为偏相关。
第一节 相关分析
在上例复相关中,若在控制人们的收入水 平不变的条件下,某种商品的需求与其价格水 平的关系就是一种偏相关关系。
第一节 相关分析
要揭示社会经济现象发展变化的数量规律 性必须从描述社会经济现象特征的变量入手, 探求变量的变化规律。本节着重研究变量间的 统计相关关系。
第一节 相关分析
变量间的数量联系存在着两种不同的类 型:一种是函数关系;只一种是统计相关关 系。
第一节 相关分析
一、相关关系的界定与类型划分 (一)函数关系与相关关系
相关系数的取值范围是-1≤r ≤1。
样本相关系数r是个随机变量,由实际抽 样得到的r值与总体相关系数ρ之间总是存在 着抽样误差。
第一节 相关分析
样本容量越小,r的可信程度就越差,特别 是当n=2时,相关系数r的绝对值总为1,由此得 出总体中两个变量之间完全相关未免为时过早。 可见,r不为0,并不能说明ρ就不为0;同样,r 为0,也不能肯定总体中的两个变量就不相关。
第一节 相关分析
第一步,计算r的t值:
t r n2 1 r2
该统计量服从自由度为(n—2)的T分布。
第一节 相关分析
第二步,根据给定的显著性水平α和自由
度(n—2),查找t分布表中相应的临界值tα. 若t的绝对值大于tα,则表明r在统计上是
显著的;反之就是不显著的.
第一节 相关分析
三、定序变量的相关分析
第一节 相关分析
3. 按相关的方向: 正相关 负相关
第一节 相关分析
➢ 正相关 当一个现象的数量由小变大,另一个现象的 数量也相应由小变大,这种相关称为正相关。 例如工人的工资随着劳动生产率的提高而 增加。
第一节 相关分析
➢ 负相关 当一个现象的数量由小变大,而另一个现 象的数量相反地由大变小,这种相关称为负相 关。 例如产品的平均成本随着劳动生产率的提 高而减少;商品流转的规模愈大,流通费用水 平则愈低。
第一节 相关分析
通常用ρ表示总体的相关系数;用r表示 样本的相关系数,它是根据样本观测值计算 的,是描述相关程度和相关方向的统计量。
第一节 相关分析
变量x和y的简单线性相关系数r的定义公 式如下:
rxy Sx Sx xS yyy X iX iX X 2 Y iY iY Y2
第一节 相关分析
人均消费支出(元/月) 562.9 352.5 353.8 380.1 340.5 339.9 394.3 445.1 346.8 424.2 487.6 456.6 474.1 421.7 366.9 438.0 355.4 371.6 373.2 405.4 8090.6
第一节 相关分析
(一)相关表和相关图 相关表和相关图是研究变量间统计相关关
根据表4.1中的原始资料,将平均每人每月 可支配收入的观察值按从低到高的顺序排列, 可得到相关表4.2。
住户编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
合计
每户人数(人) 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
第一节 相关分析
诸如此类还有储蓄额与居民收入的关 系,投资额和国民收入的关系,商品流转 规模与流通费用的关系等等。
第一节 相关分析
这种变量之间在数量变化上受随机因素 或未考虑到的其他因素的影响而产生的不确 定的相互依存关系称为统计相关关系。
第一节 相关分析
(二)相关关系的类型划分 社会经济现象之间的统计相关关系可以
➢ 不相关 当两个现象彼此互不影响,其数量变化 各自独立时,称为不相关现象。
比如,股票价格和气温就是一种不相关 的关系。
第一节 相关分析
➢ 不完全相关 两个现象之间的关系介于完全相关和不 相关之间,称为不完全相关。
第一节 相关分析
可见,完全相关就是函数关系,函数关 系和不相关关系都可以看作是统计相关关系 的特殊情形。
人均可支配收入(元/月) 434.4 439.3 439.4 456.5 460.9 467.4 469.7 470.1 483.9 494.5 524.2 550.1 573.6 580.7 585.1 614.1 620.4 652.6 669.7 760.3
10746.9
人均消费支出(元/月) 340.5 352.5 339.9 353.8 346.8 366.9 371.6 373.2 380.1 355.4 394.3 405.4 424.2 421.7 438.0 474.1 445.1 456.6 487.6 562.9
第一节 相关分析
由于散点图可以粗略地判断变量间的大致 关系,因此人们通常在正式计算相关前,先绘 制散点图,如果图形显示变量之间相关关系不 明显,就不必再耗费时间进行相关系数的计算 及其检验了。
第一节 相关分析
根据相关表4.2的资料,应用SPSS绘制相 关图。
第一节 相关分析
(二)相关系数
在相关分析中,相关系数是反映相关 关系密切程度的重要指标。
当一个或几个变量取一定的值时,另一个 变量有确定值与之相对应。
第一节 相关分析
例如,银行的1年期存款利率为年息 3.5%,存入的本金用X表示,到期的本息 用Y表示,则Y与X两个变量之间的数量关 系可表示:Y=X+3.5%X表示。
第一节 相关分析
当给定某一笔本金,则一年到期的本息 Y就是一笔确定的金额。
第一节 相关分析
表4.1是某地区2001年抽样调查20户城市居 民得到的平均每人每月可支配收入及消费性支 出的原始资料。
按不同的标志加以区分。
第一节 相关分析
1. 按相关程度: 完全相关 不相关 不完全相关
第一节 相关分析
➢ 完全相关 当一种现象的数量变化完全由另一个现象 的数量变化所确定时,称这两种现象间的关系 为完全相关。 例如在价格不变的条件下,某种商品的销 售总额与其销售量之间总是成正比例关系。
第一节 相关分析
我们本节所研究的统计相关关系一般是 指不完全相关关系。
第一节 相关分析
2. 按相关形式: 线性相关 非线性相关
第一节 相关分析
➢ 线性相关 当两种相关现象之间的关系大致呈现为直 线方程的关系时,称之为线性相关。 例如人均消费水平与人均收入水平通常成 线性关系。
第一节 相关分析
➢ 非线性相关 如果两种相关现象之间,并不表现为直线 方程的关系,而是近似于某种曲线方程的关系, 则这种相关关系称为非线性相关。 例如产品的平均成本与产品总产量之间的 相关关系就是一种非线性相关。
系的直观工具。一般在进行详细的定量分析之 前,可以先利用它们对现象之间存在的相关关 系的形式、方向和密切程度作大致的判断。
第一节 相关分析
相关表是一种反映变量之间相关关系的统 计表。将某一变量按其取值的大小顺序排列, 然后再将与其相关的另一变量的对应值平行排 列,便可得到简单的相关表。
第一节 相关分析
第一节 相关分析
二、一元线性相关分析
相关分析是研究不同变量间密切程度的一 种常用统计方法。我们首先从最简单的一元线 性相关现象开始,介绍对于两个变量间的线性 相关密切程度进行统计分析的基本原理和一般 方法。
第一节 相关分析
统计分析是从对所研究的客观现象的定性认识 到定量认识的。要对两个变量进行相关分析,首先 必须根据研究的目的,以经济理论为指导,结合有 关的专业知识和实际经验对所研究的变量进行定性 分析,确认两个变量之间客观存在着统计相关关系。
第一节 相关分析
所以,在0.01的置信水平下,人均可支配 收入和人均消费支出之间不相关的概率低于1%, 即两者之间同向相关的概率高达99%。因此可 以断定,两者之间存在着显著的线性相关关系。
第一节 相关分析
对相关系数r进行显著性检验的另一种
方法是计算t值。 数学上可以证明,在X与Y都服从于正态
分布,并且又有ρ=0的条件下,可以采用t检 验来确定r的显著性。其步骤如下:
住户编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
合计
每户人数(人) 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
人均可支配收入(元/月) 760.3 439.3 456.5 483.9 434.4 439.4 524.2 620.4 460.9 573.6 669.7 652.6 614.1 580.7 467.4 585.1 494.5 469.7 470.1 550.1 10746.9
第一节 相关分析
4. 按所研究的变量多少: 单相关 复相关 偏相关
第一节 相关分析
➢ 单相关 两个现象的相关,即一个变量对另一个变 量的相关关系,称为单相关或一元相关。
第一节 相关分析
➢ 复相关 当所研究的是一个变量对两个或两个以上 其他变量的相关关系时,称为复相关或多元相 关。 例如,某种商品的需求与其价格水平以及 人们收入水平之间的相关关系便是一种复相关。
系数ρ=0的临界值,即 r;公式 rr的意思
是, 当所计算的相关系数r的绝对值大于在α水平 下的临界值时,两要素不相关(即ρ=0)的可能性 只有α。
第一节 相关分析
比如,根据公式 rxy Sx Sx xS yyy X iX iX X 2 Y iY iY Y2
计算表4.1中,人均可支配收入和人均消费支出间的 相关系数,r=0.981,查表3.1.2可知,在f=18、 α=0.01时, r =0.5614,r> r .
第一节 相关分析
因此,相关分析中必须对样本相关系数r 进行显著性检验,只有通过检验才能知道它的 可信度。
第一节 相关分析
一般情况下,相关系数的检验,是在给 定的置信水平下,通过查阅相关系数检验的 临界值表来完成的。
r
第一节 相关分析
在上表中,左边的f叫作自由度,其数值为f= n-2,这里的n为样本数;上方的α代表不同的置 信水平;表内的数值代表不同的置信水平下相关
第一节 相关分析
当给定X某一个值时,由于消费环境等 的影响,而使Y有不同的值与之相对应,因此, 商品销售额Y与广告费支出x之间不存在确定 的函数关系。
第一节 相关分析
又如劳动生产率相同的企业其利润率 并不一定相同,因为利润率的提高除受劳 动生产率提高的影响外,还受产量、资金 流转、原材料消耗、管理费用以及其他偶 然因素变化的影响。
第四章 相关分析和回归分析
第一节 相关分析 第二节 回归分析
第四章 相关分析和回归分析
第一节 相关分析
第一节 相关分析
任何事物的存在都不是孤立的,社会经济现 象之间总是相互联系和相互制约的,在其发展变 化的过程中,社会经济现象不仅同与它有关的现 象构成一个普遍联系的整体,而且在它的内部也 存在着许多彼此关联的因素。
定序变量又称顺序变量、有序变量,它取值 的大小能够表示观测对象的某种顺序关系。测度 定序变量间的相关系数要采用斯皮尔曼相关系数 和肯特尔相关系数。这两个相关系数都属于秩相 关系数。
8090.6
第一节 相关分析
从相关表4.2中可以看出,随着城市居民可 支配收入的不断提高,其消费性支出也伴随着 产生相应提高的趋势,两者之间存在明显的正 相关关系。
第一节 相关分析
相关图也叫散点图或散布图,它是观察两 个变量之间关系的一种更加直观的方法。散点 图的具体绘制方法是:以横轴代表自变量(X), 纵轴代表因变量(Y),将两个变量间相对应的观 测值用坐标点的形式描绘在坐标平面上,从而 揭示了各相关点的分布情况。
这种变量之间在数量变化上按一定法则 严格确定的相互依存关系称为函数关系。
第一节 相关分析
例如,商品销售额(Y)与广告费支出(X) 之间的数量关系。在一定前提下,当X取 值在一定范围内,广告费投入越多,商品 销售额就越高。
第一节 相关分析
但是,X 并不能唯一确定Y的大小,因 为Y的大小还与其它因素的影响有关,如 销售地区消费者的数量,收入水平等。
第一节 相关分析
➢ 偏相关 多个变量之间的相关关系是错综复杂的, 其中任何两个变量之间的关系中都夹杂了其他 变量所带来的影响。 这种情况下,当控制其他变量都保持不变 时,其中两个变量之间的相关关系称为偏相关。
第一节 相关分析
在上例复相关中,若在控制人们的收入水 平不变的条件下,某种商品的需求与其价格水 平的关系就是一种偏相关关系。
第一节 相关分析
要揭示社会经济现象发展变化的数量规律 性必须从描述社会经济现象特征的变量入手, 探求变量的变化规律。本节着重研究变量间的 统计相关关系。
第一节 相关分析
变量间的数量联系存在着两种不同的类 型:一种是函数关系;只一种是统计相关关 系。
第一节 相关分析
一、相关关系的界定与类型划分 (一)函数关系与相关关系
相关系数的取值范围是-1≤r ≤1。
样本相关系数r是个随机变量,由实际抽 样得到的r值与总体相关系数ρ之间总是存在 着抽样误差。
第一节 相关分析
样本容量越小,r的可信程度就越差,特别 是当n=2时,相关系数r的绝对值总为1,由此得 出总体中两个变量之间完全相关未免为时过早。 可见,r不为0,并不能说明ρ就不为0;同样,r 为0,也不能肯定总体中的两个变量就不相关。
第一节 相关分析
第一步,计算r的t值:
t r n2 1 r2
该统计量服从自由度为(n—2)的T分布。
第一节 相关分析
第二步,根据给定的显著性水平α和自由
度(n—2),查找t分布表中相应的临界值tα. 若t的绝对值大于tα,则表明r在统计上是
显著的;反之就是不显著的.
第一节 相关分析
三、定序变量的相关分析
第一节 相关分析
3. 按相关的方向: 正相关 负相关
第一节 相关分析
➢ 正相关 当一个现象的数量由小变大,另一个现象的 数量也相应由小变大,这种相关称为正相关。 例如工人的工资随着劳动生产率的提高而 增加。
第一节 相关分析
➢ 负相关 当一个现象的数量由小变大,而另一个现 象的数量相反地由大变小,这种相关称为负相 关。 例如产品的平均成本随着劳动生产率的提 高而减少;商品流转的规模愈大,流通费用水 平则愈低。
第一节 相关分析
通常用ρ表示总体的相关系数;用r表示 样本的相关系数,它是根据样本观测值计算 的,是描述相关程度和相关方向的统计量。
第一节 相关分析
变量x和y的简单线性相关系数r的定义公 式如下:
rxy Sx Sx xS yyy X iX iX X 2 Y iY iY Y2
第一节 相关分析
人均消费支出(元/月) 562.9 352.5 353.8 380.1 340.5 339.9 394.3 445.1 346.8 424.2 487.6 456.6 474.1 421.7 366.9 438.0 355.4 371.6 373.2 405.4 8090.6
第一节 相关分析
(一)相关表和相关图 相关表和相关图是研究变量间统计相关关
根据表4.1中的原始资料,将平均每人每月 可支配收入的观察值按从低到高的顺序排列, 可得到相关表4.2。
住户编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
合计
每户人数(人) 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
第一节 相关分析
诸如此类还有储蓄额与居民收入的关 系,投资额和国民收入的关系,商品流转 规模与流通费用的关系等等。
第一节 相关分析
这种变量之间在数量变化上受随机因素 或未考虑到的其他因素的影响而产生的不确 定的相互依存关系称为统计相关关系。
第一节 相关分析
(二)相关关系的类型划分 社会经济现象之间的统计相关关系可以
➢ 不相关 当两个现象彼此互不影响,其数量变化 各自独立时,称为不相关现象。
比如,股票价格和气温就是一种不相关 的关系。
第一节 相关分析
➢ 不完全相关 两个现象之间的关系介于完全相关和不 相关之间,称为不完全相关。
第一节 相关分析
可见,完全相关就是函数关系,函数关 系和不相关关系都可以看作是统计相关关系 的特殊情形。
人均可支配收入(元/月) 434.4 439.3 439.4 456.5 460.9 467.4 469.7 470.1 483.9 494.5 524.2 550.1 573.6 580.7 585.1 614.1 620.4 652.6 669.7 760.3
10746.9
人均消费支出(元/月) 340.5 352.5 339.9 353.8 346.8 366.9 371.6 373.2 380.1 355.4 394.3 405.4 424.2 421.7 438.0 474.1 445.1 456.6 487.6 562.9
第一节 相关分析
由于散点图可以粗略地判断变量间的大致 关系,因此人们通常在正式计算相关前,先绘 制散点图,如果图形显示变量之间相关关系不 明显,就不必再耗费时间进行相关系数的计算 及其检验了。
第一节 相关分析
根据相关表4.2的资料,应用SPSS绘制相 关图。
第一节 相关分析
(二)相关系数
在相关分析中,相关系数是反映相关 关系密切程度的重要指标。
当一个或几个变量取一定的值时,另一个 变量有确定值与之相对应。
第一节 相关分析
例如,银行的1年期存款利率为年息 3.5%,存入的本金用X表示,到期的本息 用Y表示,则Y与X两个变量之间的数量关 系可表示:Y=X+3.5%X表示。
第一节 相关分析
当给定某一笔本金,则一年到期的本息 Y就是一笔确定的金额。