市场研究的数据分析方法介绍

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

市场研究的数据分析方法

通过本章学习,掌握市场营销研究的基本数据分析方法。掌握线性回归分析方法及其应用;掌握判别分析法及其应用;了解聚类分析及其具体方法和步骤;了解因子分析方法的数学模型和相关统计量以及基本步骤;了解对应分析方法及其基本步骤;、了解多维偏好分析法的主成分分析模型;了解多维尺度法及其分析步骤;了解联合分析方法的基本模型及其基本步骤。第一节线性回归分析

一、线性回归方程的基本模型

线性回归分析是考察变量之间的数量关系变化规律,它通过一定的数学表达式—回归方程,来描述这种关系,以确定一个或几个变量的变化对另一个变量的影响程度,为预测提供数学依据。

线性回归方程从样本资料出发,一般利用最小二乘法,根据回归只限于向本资料点在垂直方向上的偏离程度最低的原则,进行回归方程的参数的求解。根据线性回归方程总之变量的个数,回归方程可分为一元线性回归方程和多元线性回归方程。

(一)一元线性回归模型

一元线性回归模型是两个变量之间的关系可以通过有关的参数直接用直线关系来表示。

(二)多元回归模型

多元线性回归模型中自变量的个数在2个以上。

二、线性回归方程的统计检验

1、回归方程拟合优度检验

2、回归方程的显着性检验

3、回归系数显着性检验

三、回归分析假设条件的检验

1、残差分析

2、多重共线性

3、误差项的序列相关

四、线性回归分析的基本步骤

1、确定回归中的自变量和因变量。

2、从收集到样本资料出发确定自变量和因变量之间的数学关系,即建立回归方程。

3、对回归方程进行各种统计检验。

4、利用回归方程进行预测。

在利用统计软件进行回归分析时,只有第一步由用户给定,其它均可由计算机完成。

第二节判别分析

一、判别分析法的基本思想

判别分析是一种进行统计鉴别和分组的技术,最早由费雪(Fisher)于1936年提出。它是根据观察或测量到若干变量值,判断研究对象如何分类的方法。在进行判别分析时,首先必须已知观察对象的分类和若干表明观察对象特征的变量值。然后再从中筛选出能提供较多信息的变量并建立判别函数,然后利用其结果对待判对象进行判断其类别。在判别分析中,称分类变量为因变量,而用以分类的其它特征变量称为判别变量或自变量。简而言之,判别分析包括以下两步:

1、分析和解释各类指标之间存在的差异,并建立判别函数。

2、以第一步的分析结果为依据,将对那些未知分类属性的案例进行判别分类。

二、判别分析基本模型与统计术语

(一)假设条件

1、每一个类别都取自一个多元正态总体的样本

2、所有正态总体的协方差矩阵或相关矩阵都相等

(二)基本模型

判别分析的基本模型是判别函数,它表示为分组变量与满足假设条件的判别变量之间的线性关系。

(三)统计术语

1、先验概率

2、后验概率

3、判别系数

4、结构系数

5、分组的矩心

6、判别力指数

7、残余判别力

三、分析的基本步骤

1、确定研究的问题

2、获取判别分析的数据

3、进行判别分析

4、评价和解释分析结果

第三节聚类分析

一、聚类分析的基本思想

聚类分析(又称数字分类学)是新近发展起来的一种研究分类问题的多元统计分析方法。它是根据事物本身的特性研究个体分类的方法,其基本原则是同类的个体有较大的相似性,而不同类的个体的差异很大。在聚类分析中,根据分类对象的不同可分为样品聚类(Q型聚类)和变量聚类(R型聚类)两种。样品聚类是对事件进行聚类,或是说对观测量进行聚类,使对反映被观测对象的特征的变量值

进行分类。变量聚类则是当反映事物特点的变量很多是,我们根据所研究的问题选择部分变量对事物的某一方面进行研究的聚类方法。

二、距离与相似系数

(一)定距或定比率数据的距离和相似系数

1. 常用的距离指标有:欧式距离、欧式距离的平方、曼哈顿距离、切比雪夫距离幂距离

2. 常用的相似系数指标主要有:余弦系数、皮尔逊相关系数

(二)定类数据的距离

1.卡方距离

2.法方距离

三、聚类方法

(一)层次聚类法

(二)迭代聚类法

四、聚类分析的主要步骤

1.确定研究的问题

2.计算相似性

3.聚类

4.聚类结果的解释和证实

第四节因子分析

一、因子分析的基本思想

因子分析是一项多元统计分析技术,其主要目的就是简化数据。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示基本的数据结果。这些假设变量是不可观测的,通常称为因子。它们反映了原来众多的观测变量所代表的主要信息,并能解释这些观测变量之间的相互依存关系。

二、因子分析的数学模型和相关统计量

(一)数学模型

(二)相关统计量

1、因子载荷

2、共同度

3、因子的贡献

4、巴特利特球体检验

5、KMO指数

三、因子分析的基本步骤

1、确定研究变量

2、计算所有变量的相关矩阵

3、构造因子变量

4、因子旋转

第五节对应分析

一、对应分析的基本思想

对应分析(Correspondence Analysis)又称为相应分析,是由法国统计学家J.P.Beozecri于1970提出的,是在R型和Q型因子分析基础上,发展起来的一种多元相依的变量统计分析技术。它通过分析由定性变量构成的交互汇总表来揭示变量间的关系。当以变量的一系列类别以及这些类别的分布图来描述变量之间的联系时,使用这一分析技术可以揭示同一变量的各个类别之间的差异以及不同变量各个类别之间的对应关系。

二、有关统计术语与资料格式

(一)统计术语

1.列联表

2.主成分

3.惯量和特征值

(二)数据格式

相关文档
最新文档