市场调查与预测二

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

在实际问题中,我们常常要研究两个变量之间的联
系,例如:汽车生产数量Y与所需车轮数量X之间的关
系,某产品的价格X与社会对该产品的需求Y之间的关
系,人的身高X与体重Y之间的关系,家庭收入X与
消费支出Y之间的关系等等。这些变量之间的关系
可以分为两类:函数关系(确定性关系)和相关关 系(随机性关系)。 如果给定解释变量X的值,被解释变量Y的值就
• 例如,定义性别变量x,数值1表示男性,数值2表 示女性,如下图:
(7)定义缺失值 在Variable View窗口中,单击变量与Missing对 应的单元格,然后单击右侧的删节号按钮,展 开Missing Values,定义变量用户缺失值的对 话框。
二、SPSS在市场调查资料统计分析中的初步 应用 (一)数据的输入和保存 3. 输入数据 输入数据的方法比较简单,选择要输入数 据的单元格,通过键盘进行数据输入即可 。
SX

n i 1
X X n 1

2
称为样本X的标准差,它的平方,即:
2 X的样本方差S X 是Var ( X ) 的无偏估计;
SY

n i 1
Y Y

2
n 1
称为样本Y的标准差,它的平方即Y的样
2 S 本方差 Y 是 Var (Y ) 的无偏估计。
因此,样本相关系数r 是总体相关系数ρ的无偏估计。
我们对它们有了深刻的规律性认识,并且能够把影响因
变量变动的因素全部纳入方程,这时的相关关系也可能 转化为函数关系。另外,相关关系也具有某种变动规律 性,所以,相关关系经常可以用一定的函数形式去近似 地描述。经济现象的函数关系可以用数学分析的方法去 研究,而研究社会经济现象的相关关系必须借助于统计 学中的相关与回归分析方法。
(4)定义变量类型:单击Type列的单元格,默 认值Numeric旁出现删节号,单击删节号,展 开Define Variable Type对话框。定义变量类型 对话框左半部分有八种可供选择的变量类型, 单击选择的类型。
(5)定义变量标签为了注释变量名含义,在 Variable View窗口中双击Labels相应的单元格, 输入注释即可,要尽量简单明了。 (6)定义与修改值标签,定义值标签,单击Value 栏相应的单元格,该单元格右侧出现删节号,单 击删节号,打开Value Labels对话框,在第一个 Value框中,输入变量值,在第二个Value框中, 输入对该值含义解释的标签,单击按钮“Add”, 一个值标签就被加入到第三个框,即值标签清单 中
• 单击保存类型列表框,可以看到SPSS所 支持的DBF、FoxPro、EXCEL、 ACCESS等各种数据类型,这里我们将 其存为SPSS的数据格式(*.sav文件)。
SPSS在市场调查资料统计分析中的初步应用
(二)数据的预分析 1. 数据的简单描述 首先我们需要知道数据的基本情况,如均数、标 准差等。选择Analyze==>Descriptive Statistics==>Descriptives菜单,系统弹出描述对 话框。
其中,Cov(X,Y)是随机变量X和Y的协方差Var(X)
和Var(Y)分别为变量X和Y的方差。总体相关系数是
反映两变量之间线性相关程度的一种特征值,表现
为一个常数。
样本相关系数的定义公式是:
r
x x y y
n i 1 i i
x x y y
n 2 n i 1 i i 1 i
市场调查与预测 2
会计系 杨建超
SPSS软件
SPSS 是英文Statistical Package for the Social Science( 社会科学统计软件包)的缩写。应用于自然科学、技术 科学、社会科学的各个领域,世界上许多有影响的报 刊杂志纷纷就SPSS 的自动统计绘图、数据的深入分析 等。
• 该对话框可分为左右两大部分,左侧为所有可用 的侯选变量列表,右侧为选入变量列表。
• 我们只需要描述X,用鼠标选中X,单击中间的 变量X的标签就会移入右侧,表明可以进行分 析了,单击它,系统会弹出一个新的界面。
3.1 线性回归分析及案例
在数量分析中,我们经常会看到变量与变量之间存 在着一定的联系,而不只是前面所讨论的单个变量的某 些孤立的特性,如均值、方差的特性等。我们要了解的 是变量之间是如何发生相互影响的,这就是所谓的相关 分析和回归分析。
图2 家庭月消费支出与可支配收入的关系
从该散点图似乎可以看到可支配收入确实对消费支
出有影响。也应该可能通过拟合一条穿过这一散点
图的直线或曲线来描述可支配收入X 是如何影响消 费支出Y 的。这里的消费支出Y 取决于可支配收入, 作为因变量(或被解释变量、响应变量),可支配 收入X 不依赖于消费,作为自变量(或解释变量、 独立变量、预测因子、回归子等)。 下面我们来看一个简单的线性回归模型:
如下表:消费支出与可支配收入的观测值
创建SPSS数据表:
在下拉菜单中选择[Regression]—[Linear]进行回归分析:
图3 观测值的散点图及其拟合直线
该对话框表示回归分析的输入变量: 是由可支配收入和消费支出组成,具体表达式:
Y b0 b1 X1 e
判定系数 R 是对回归模型拟合程度的综合度量, 判定系数越大,模型拟合程度越高;判定系数越小, 则模型对样本的拟合程度越差。
2
3.判定系数是样本观测值的函数,它也是一个统计量。
所以,根据上表的数据,可知道 R2 0.954(见上表Model Summary 中的R Square栏目),说明消费支出的变动中 有95.4%可以由可支配收入来解释。
相关系数的显著性检验:
经济变量之间通常是相关的。问题是相关程度如何,如果在
总体回归直线
如图所示,因变量的实际观测值与其样本均值的离差即总离 差 Y Y 可以分解为两部分:一部分是因变量的理论回归值 与其样本均值的离差 ,它可以看成是能够由回归直 线解释的部分,称为可解释离差;另一部分是实际观测值与 理论回归值的离差 ,它是不能由回归直线加以解释 的残差e。 对任一实际观测值Y总有:
相关程度过低的变量之间建立回归模型,就没有很大的意 义。这里讨论两个变量之间的线性相关,称为简单相关。
利用相本相关系数:
S XY r S X SY
作为总体相关系数的无偏估计。 其中,S XY
X X Y Y
n i 1
n 1
称为X和Y的样本协方差。是
Cov X,Y 的无偏估计;
SPSS在市场调查资料统计分析中的初步应用 (一)数据的输入和保存 1. SPSS的界面 当打开SPSS后,展现在我们面前的界面如下
(一)数据的输入和保存
2. 定义变量

定义变量即要定义变量名、变量类型、变量长度
、变量标签和变量格式、缺失值等。

变量的定义步骤如下:
(1)单击Variable View选项卡,使数据编辑窗口 置于定义变量状态,每行定义一个变量。
们无法确切地推断出他的体重。这是因为,身高不
是决定体重的唯一因素,从而身高相同的人未必体
重一样。因此身高与体重的关系就是相关关系。研
究变量之间相关关系密切程度的分析叫相关分析。 如果在研究变量之间的相关关系时,把其中的一些 因素作为所控制的变量(自变量),而另一些随机 变量作为它们的因变量,这种关系分析就称为回归
对变量X和Y作相关分析得出的,用以判定X与Y的线性相关程 度。 3.相关系数r 接近于1 的程度与样本容量n有关:当n较小时, 相关系数的绝对值容易接近于1;当n较大时,相关系数的绝 对值容易偏小。因此仅凭相关系数较大就说变量之间具
(2)定义变量名,光标置于Name列的空单元格
中,单击单元格后输入变量名。 (3)变量的默认属性值: Type:变量类型,默认类型为数值型 Width:变量长度,默认长度为8 Decimals:小数位数,默认位数为2
Label:变量标签,用户自定
Values:值标签,用户自定 Missing:缺失值,用户自定
对上式两边平方并求和并计算,可得到:
得到:TSS=RSS+ESS
上式中,TSS是总离差平方和(Total Sum of Squ百度文库res);
RSS是用回归直线无法解释的离差平方和,称为残差平方和
(Residual Sum of Squares); ESS是由回归直线可以解释的那一部分离差平方和,称为回 归平方和(Explained Sum of Squares)。
2
R 2 (拟合优度检验)的具体含义:
所谓拟合程度,是指样本观测值聚集在样本回归直线周围的 紧密程度。判断回归模型拟合程度优劣最常用的数量指标是
判定系数(Coefficient of Determination)。该指标是建立在
对总离差平方和进行分解的基础之上的。
不能被模型解释 的部分 总离差
能够被模型解 释的部分
2
例子:
[例] 某地区统计了机电行业的销售额Y和汽车产量X1以 及建筑产值X2 (如表7-36所示),请使用SPSS 计算Y 与X1的相关系数并进行显著性检验。
1)根据表7-36的数据创建SPSS 数据文件(如下);
输入建立SPSS数据表
2)选择[Analyze]=>[Correlate]=>[Bivariate],在显示的如下对话框中,选择变量 Y 和X1进入[Variables]框。采用默认设置,直接单击[OK]进行分析。
RSS ESS 1 TSS TSS
显而易见,各个样本观测点与样本回归直线靠得越紧,ESS
在TSS 中所占的比例就越大。因此,可定义这一比例为判定 系数,即有:
ESS RSS R 1 TSS TSS
2
判定系数是对回归模型拟合程度的综合度量,判定系数越大, 模型拟合程度越高。判定系数越小,则模型对样本的拟合程 度越差。
相关系数r 具有以下性质:
1.相关系数r 的取值范围在-1 至+1之间,当r>0时,称X与Y 正 相关;当r<0时,称X与Y负相关;当r=0时,称X与Y (线性) 相关。当|r|接近于1时,相关程度越高; 2.
r R2 ,但两者的概念不同。判定系数R2是对变量Y
和X 作回归分析得出的,用于衡量拟合优度,而相关系数r是
在下拉菜单中选 择命令语句
从结果可以看出,Y 与X1 的相关系数r=0.948,p 值=0.000,在α=0.01 水平下线性关系显著。
应该指出的是,变量之间的函数关系和相关关系,在一 定条件下是可以互相转化的。本来具有函数关系的经济 变量,当存在观测误差时,其函数关系往往以相关的形 式表现出来。而具有相关关系的变量之间的联系,如果
唯一地确定了,那么Y与X的关系就是函数关系,即
Y=F(X)。例如,生产一辆汽车要配四个车轮,只要
知道了汽车的生产数量X,所需的车轮数量Y也就唯
一地确定了,其函数关系式为:Y=4X。
如果给定了解释变量X的值,被解释变量Y的值不是 唯一的,Y与X的关系就是相关关系,例如,身高与 体重的关系是很密切的,但已知某人的身高X,我
分析。
3.1.1 简单的相关分析
简单相关分析是对两个变量之间的相关程度进行分析。 单相关分析所用的指标称为单相关系数,又称为单相关 系数、Pearson(皮尔森)相关系数或相关系数。通常 以ρ表示总体的相关系数,以r表示样本的相关系数。
Cov( X , Y ) Var ( X ) Var (Y )
• 例如,输入变量X的值,先选择一行二列单元 格为当前单元格,输入第一个数据0.84,单击 回车键,此时界面显示如下图所示。如果一行 一列单元格因为没有输入数据,显示为“.”, 这代表该数据为缺失值。
二、SPSS在市场调查资料统计分析中的初步 应用 (一)数据的输入和保存 4. 保存数据 选择菜单File==>Save,由于该数据从来没 有被保存过,所以弹出Save Date As对话 框。
R 2 (拟合优度检验)的性质:
1. 非负性; 2. 判定系数的取值范围为 0 R 1 ;
2
由 R 的计算公式可以看出:当所有的观测值都位于回归 直线上时,RSS=0,这时 R 2 1 ,说明总离差可以完 全由所估计的样本回归直线来解释;当观测值并不是全部 位于回归直线上时,RSS>0,则RSS/TSS>0, 这时 R 2 1;当回归直线没有解释任何离差,即模型中解 释变量X与因变量Y完全无关时,Y的总离差全部归于残 2 差平方和,即RSS=TSS,这时R 0 。
相关文档
最新文档