第八章 相关分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

=
1009 440 2373.36
= 0.987
答:人均销售额与利润率之间存在着高度的正相关关系。 人均销售额与利润率之间存在着高度的正相关关系。
说明: 说明:
相关系数是测定变量之间相关密切程度和相关方向的代表 性指标。相关系数用符号“ 表示 其特点表现在: 表示, 性指标。相关系数用符号“r”表示,其特点表现在: 参与相关分析的两个变量是对等的,不分自变量和因变 参与相关分析的两个变量是对等的, 量,因此相关系数只有一个。 因此相关系数只有一个。 相关系数有正负号反映相关关系的方向, 相关系数有正负号反映相关关系的方向,正号反映正相 关,负号反映负相关。 负号反映负相关。 计算相关系数的两个变量都是随机变量。 计算相关系数的两个变量都是随机变量。 利用Excel中地函数可以直接计算两组数据地相关系数: 中地函数可以直接计算两组数据地相关系数: 利用 中地函数可以直接计算两组数据地相关系数 函数为CORREL(Array1,Array2) , 函数为
解联立方程得到: 解联立方程得到:
b0
∑y −b ∑x = y −b x =
1 1
b = 1
xy − xy x −x
2 2
=
n n n∑xy − ∑x∑y n∑x − (∑x)
2 2
据前面例题资料拟合生产费用依产量变化的回归方程: 据前面例题资料拟合生产费用依产量变化的回归方程: 序 月产量 生产费用 2 2 y xy x y 号 1 1.2 62 1.44 3844 74.4 2 2.0 86 4.00 7396 172.0 3 3.1 80 9.61 6400 248.0 4 3.8 110 14.44 12100 418.0 5 5.0 115 25.00 13225 575.0 6 6.1 132 37.21 17424 805.2 7 7.2 135 51.84 18225 972.0 8 8.0 160 64.00 25600 1280.0 ∑ 36.4 880 207.54 104214 4544.6
回归系数的经济涵义: 回归系数的经济涵义: 自变量变动一个单位时,因变量的平均变动值。 自变量变动一个单位时,因变量的平均变动值。
拟合直线回归方程的方法: 拟合直线回归方程的方法 拟合直线回归方程的过程就是求解方程系数的过程, 拟合直线回归方程的过程就是求解方程系数的过程,求解 方法一般采用最小平方法(最小二乘法)。 方法一般采用最小平方法(最小二乘法)。 用最小平方法拟合回归直线的基本思想是: 用最小平方法拟合回归直线的基本思想是: 在所有的相关点中,通过数学方法拟合一条较为理想的直 在所有的相关点中, 线,这条直线必须满足: 这条直线必须满足: 原数列与趋势线的离差平方和为最小值。 原数列与趋势线的离差平方和为最小值。即:
三、回归分析和相关分析的联系和区别
1、联系 理论和方法具有一致性; 理论和方法具有一致性; 无相关就无回归,相关程度越高,回归越好; 无相关就无回归,相关程度越高,回归越好; 相关系数和回归系数方向一致,可以互相推算。 相关系数和回归系数方向一致,可以互相推算。 2、区别 相关分析 x与y对等 x,y均为随机变量 测定相关程度和方向 回归分析 x与y要确定自变量和因变量 只有y为随机变量 只有y 用回归模型进行预测和控制
二、相关关系的概念
函数关系:函数关系是一种严格的依存关系, 函数关系:函数关系是一种严格的依存关系,这种 关系可以用y = f(x)的方程来表现。 关系可以用 ( )的方程来表现。 相关关系:相关关系是一种不完全确定的随机关系。 相关关系:相关关系是一种不完全确定的随机关系。 函数关系与相关关系的联系:对具有相关关系的现 函数关系与相关关系的联系: 象进行分析时, 象进行分析时,必须利用相应的函数关系的数学表 达式来表明现象之间的相关方程式。 达式来表明现象之间的相关方程式。
店 A1 A2 A3 A4 额 6 5 8 1 % 12.6 10.4 18.5 3.0 A5 A6 A7 A8 4 7 6 3 8.1 16.3 12.3 6.2 A9 A10 3 7 6.6 16.8
相关系数的计算分析
[解]列表计算如下: 解 列表计算如下 列表计算如下:
利润率( 人均销售额 x 利润率(%)y 6 12.6 5 10.4 8 18.5 1 3.0 4 8.1 7 16.3 6 12.3 3 6.2 3 6.6 7 16.8 50 110.8 x2 36 25 64 1 16 49 36 9 9 49 294 y2 158.76 108.16 342.25 9.00 65.61 265.69 151.29 38.44 43.56 282.24 1465.00 1465.00 xy 75.6 52.0 148.0 3.0 32.4 114.1 73.8 18.6 19.8 117.6 654.9
第八章 相关分析
相关分析是研究变量之间相互关系的密切程度和相互 联系方式的重要方法。本章详细讲述相关分析的概念、 联系方式的重要方法。本章详细讲述相关分析的概念、相 关关系的确定、回归方程的建立和应用等内容。 关关系的确定、回归方程的建立和应用等内容。
本章主要内容
相关的意义和种类 相关系数 回归分析
三、相关的空间形式图(散点图P201) 相关的空间形式图(散点图
• • • • • • • • • • • •
• • • • • • • • • •

• • • • • • •
四、相关系数
相关系数:测定两个变量间线性关系强度的统计指标。 相关系数:测定两个变量间线性关系强度的统计指标。 相关系数的计算方法(线性相关系数) 1、相关系数的计算方法(线性相关系数) 通过两变量与各自平均值的离差的乘积来反映两变量之间 的相关程度。 的相关程度。
2、相关系数的性质 、
(1)相关系数有正负号,分别表示正相关和负相关。 )相关系数有正负号,分别表示正相关和负相关。 之间。 (2)相关系数的取值范围在绝对值的 0−1 之间。 ) 其值大小反映两变量之间相关的密切程度。 其值大小反映两变量之间相关的密切程度。 表明两变量完全相关; (3)相关系数 r = 1 表明两变量完全相关; r = 0 ) 表明两变量完全不相关; 表明两变量完全不相关;
四、一元线性回归
利用一元线性回归方程进行回归分析的前提:所分析 利用一元线性回归方程进行回归分析的前提: 的两个变量之间必须存在相关关系, 的两个变量之间必须存在相关关系,且相关程度在显 著相关以上。 著相关以上。 估计回归线:在两变量相关的散点图中, 估计回归线:在两变量相关的散点图中,引出一条最优的 直线,这条直线就是估计回归线。 直线,这条直线就是估计回归线。它表明了两变量数量变 动的一般关系。 动的一般关系。
2 σ xy r= = σ xσ y
∑ ( x − x )( y − y ) ∑ (x − x ) × ∑ ( y − y)
2
2
计算相关系数的简化式: 计算相关系数的简化式:
r= n∑ xy − ∑ x ∑ y n x 2 − ( x )2 n y 2 − ( y )2 ∑ ∑ ∑ ∑
x
计算得到: 计算得到: x = 36.4,
2
∑ ∑y
∑ y = 880, n = 8, ∑x = 104214, ∑xy = 4544.6
2 2
2
= 207.54,
b = 1
n∑xy − ∑x∑y n∑x − (∑x)
第一节 相关的意义和种类
一、相关分析:对两变量间线性关系的描述与度量。解 相关分析:对两变量间线性关系的描述与度量。 决的问题主要包括: 决的问题主要包括: 变量间是否存在关系? 变量间是否存在关系? 如存在,则是什么关系? 如存在,则是什么关系? 关系强度如何? 关系强度如何? 样本反映的变量间的关系能否代表总体变量间的关系? 样本反映的变量间的关系能否代表总体变量间的关系? 实际暗含对总体变量的假设: 实际暗含对总体变量的假设: 两个变量均为随即变量,而且二者间存在线性关系。 两个变量均为随即变量,而且二者间存在线性关系。
五、相关关系的显著性检验(P205) 相关关系的显著性检验(
提出假设 计算统计量 确定显著性水平,确定临界值 确定显著性水平, 做出决策
第二节 回归分析
一、回归分析的意义 对具有相关关系的两个或两个以上变量之间的数量变化的 一般关系进行测定,确立一个相应的数学表达式, 一般关系进行测定,确立一个相应的数学表达式,以便从 一个Байду номын сангаас知量来推测另一个未知量, 一个已知量来推测另一个未知量,为估算预测提供一个重 要的方法。 要的方法。 二、回归的种类 按自变量的个数分 按回归线的形态分 一元回归 多元回归 线性回归 非线性回归
线性相关的判断准则
r < 0 .3 → 微弱相关 0 .3 ≤ r < 0 .5 → 低度相关
0.5 ≤ r < 0.8 → 显著相关
0.8 ≤ r < 1 → 高度相关
r = 0 → x 与 y无线性关系 , 但可能有其他关系 r = 1 → x 与 y有完全线性关系 : 函数关系
例:为了解营业员每人月平均销售额(万元)和利润率(%)之间 为了解营业员每人月平均销售额(万元)和利润率(%) 的关系,特从100家商店中随机抽取 家,得到如下资料,试计算 家商店中随机抽取10家 得到如下资料, 的关系,特从 家商店中随机抽取 样本相关系数。 样本相关系数。
β0,β1
未知参数
样本的一元线性回归模型和回归方程
b 1 一元线性回归模型 Y= 0 + b X + e
一元线性回归方程 截距
ˆ y = b0 + b1x
斜率(回归系数) 斜率(回归系数) 相互独立
e 的理论假定
服从正态分布 数学期望为0 数学期望为 方差相同
ˆ y = b0 + b1x
ˆ 因 量 估 值 y: 变 的 计 , b0: 距 截 b: 线 斜 , 称 归 数 1 直 的 率 又 回 系 x: x: 变 自 量
则:
Σx = 50, Σy = 110.8, Σx 2 = 294, Σy 2 = 1465, Σxy = 654.9, n = 10
r=
=
nΣxy − ΣxΣy nΣ x 2 − ( Σ x ) 2 Σ y 2 − ( Σ y ) 2
10 × 654.9 − 50 × 110.8 10 × 294 − 50 2 10 × 1465 − 110.8 2
总体一元线性回归模型的一般形式: 总体一元线性回归模型的一般形式: 的一般形式
Y=β0+β1 X+u
Y的数学期望 (Y) 的数学期望E( ) 的数学期望 随机误差
E Y)=β0+β1X (
称为总体的一元线性回归方程,是对应于自变量 某一取值时 称为总体的一元线性回归方程,是对应于自变量X某一取值时 总体的一元线性回归方程 因变量Y的均值 的均值。 因变量 的均值。
相关关系是相关分析的研究对象,而函数关系则是相关分 相关关系是相关分析的研究对象, 析的工具。 析的工具。 相关关系与函数关系的不同之处表现在: 相关关系与函数关系的不同之处表现在: 函数关系指变量之间的关系是确定的, 函数关系指变量之间的关系是确定的,而相关关系的两 变量的关系则是不确定的。可以在一定范围内变动; 变量的关系则是不确定的。可以在一定范围内变动; 函数关系变量之间的依存可以用一定的方程y=f(x)表现 函数关系变量之间的依存可以用一定的方程y=f(x)表现 y=f(x) 出来,可以给定自变量来推算因变量, 出来,可以给定自变量来推算因变量,而相关关系则不能 用一定的方程表示。 用一定的方程表示。 函数关系是相关关系的特例, 函数关系是相关关系的特例,即函数关系是完全的相关关 系。
ˆ)2 = ∑( y −b0 −b x)2 = 最小值 ∑( y − y 1
据微积分极值定理求最小值,通过求 据微积分极值定理求最小值,通过求b0、b1的一阶偏导 并分别令其为0,可求出b 的联立方程: 并分别令其为 ,可求出 0、b1的联立方程:
nb0 + b ∑x = ∑y 1 2 b0 ∑x + b ∑x = ∑xy 1
相关文档
最新文档