第7章 相关与回归分析。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章相关与回归分析
学习内容
一、变量间的相关关系
二、一元线性回归
三、线性回归方程拟合优度的测定
学习目标
1. 掌握相关系数的含义、计算方法和应用
2. 掌握一元线性回归的基本原理和参数的最小二
3. 掌握回归方程的显著性检验
4. 利用回归方程进行预测
5. 了解可化为线性回归的曲线回归
6. 用Excel 进行回归分析
一、变量间的相关关系
1. 变量间的关系(函数关系)
1)是一一对应的确定关系。
2)设有两个变量x和y,变量y 随变量x一起变化,
并完全依赖于x,当变量x 取某个数值时,y依确定的关系取相应的值,
则称y 是x的函数,记为y = f (x),其中x 称为自变量,y 称为因变量。
3)各观测点落在一条线上。
4)函数关系的例子
–某种商品的销售额(y)与销售量(x)之间的关系可表示为 y = p x (p 为单价)。
–圆的面积(S)与半径之间的关系可表示为S = π R2。
–企业的原材料消耗额(y)与产量x1、单位产量消耗x2、原材料价格x3间的关系可表
示为y =x1 x2 x3。
单选题
下面的函数关系是()
A、销售人员测验成绩与销售额大小的关系
B、圆周的长度决定于它的半径
C、家庭的收入和消费的关系
D、数学成绩与统计学成绩的关系
2. 变量间的关系(相关关系)
1)变量间关系不能用函数关系精确表达。
2)一个变量的取值不能由另一个变量唯一确定。
3)当变量 x 取某个值时,变量 y 的取值可能有几个。
4)各观测点分布在直线周围。
5)相关关系的例子
–商品的消费量(y)与居民收入(x)之间的关系。
–商品销售额(y)与广告费支出(x)之间的关系。
–粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度 (x3)之间的关系。
–收入水平(y)与受教育程度(x)之间的关系。
–父亲身高(y)与子女身高(x)之间的关系。
3. 相关图表
1)相关表:将具有相关关系的原始数据,按某一顺序平行排列在一张表上,以观察它
们之间的相互关系。
2)相关图:也称为分布图或散点图,它是在平面直角坐标中把相关关系的原始数据用
点描绘出来,通常以直角坐标轴的横轴代表自变量x,纵轴代表因变量y。
4. 相关关系的类型
相关关系的图示(散点图)
5. 相关关系的测度(相关系数)
1)对变量之间关系密切程度的度量。
2)对两个变量之间线性相关程度的度量称为简单相关系数。
3)若相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ。
4)若是根据样本数据计算的,则称为样本相关系数,记为 r。
样本相关系数的计算公式
化简为
相关系数取值及其意义
a)r 的取值范围是 [-1,1]。
|r|=1,为完全相关。(r =1,为完全正相关。r =-1,为完全负相关。)
b)r = 0,不存在线性相关关系。
c)-1 d)0 e) |r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切。 单选题 ①下列哪两个变量之间的相关程度高() – A、商品销售额和商品销售量的相关系数是0.9 – B、商品销售额和商业利润率的相关系数是0.84 – C、平均流通费用率与商业利润率的相关系数是0.94 – D、商品销售价格与销售量的相关系数是-0.91 ②下列关系中,属于正相关关系的有() – A、合理限度内,施肥量和平均单产量之间的关系 – B、产品产量与单位产品成本之间的关系 – C、商品的流通费用与销售利润之间的关系 – D、流通费用率与商品销售量之间的关系 ③变量之间的相关程度越低,则相关系数值() A、越小 B、越接近于0 C、越接近于-1 D、越接近于1 ④已知Σ(X-X¯)2是Σ(Y-Y¯)2的两倍,并已知Σ(X-X¯) (Y-Y¯)是Σ(Y-Y¯)2的1.2倍,则相关系数r为() A、不能计算 B、0.6 C、1.2/ D、 多选题 变量之间的不完全相关可以表现为() A、零相关 B、正相关 C、负相关 D、曲线相关 E、相关系数为1 求X与Y的相关系数 二、一元线性回归 1. 什么是回归分析?(内容) 1)从一组样本数据出发,确定变量之间的数学关系式。 2)对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中 找出哪些变量的影响显著,哪些不显著。 3)利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取 值,并给出这种预测或控制的精确程度。 回归分析与相关分析的区别 1)相关分析中,变量 x 变量 y 处于平等的地位;回归分析中,变量 y 称为因变量, 处在被解释的地位,x 称为自变量,用于预测因变量的变化。 2)相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变 量,自变量 x 可以是随机变量,也可以是非随机的确定变量。 3)相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变 量 x 对变量 y的影响大小,还可以由回归方程进行预测和控制。 多选题 线性相关分析的特点表现为() – A、两个变量之间的地位是对等关系 – B、只能算出一个相关系数 – C、相关系数有正负号 – D、相关的两个变量必须都是随机变量 – E、不反映任何自变量和因变量的关系