(完整版)多元统计分析思考题答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《多元统计分析》思考题答案
记得老师课堂上说过考试内容不会超出这九道思考题,如下九道题题目中有错误的或不清楚的地方,欢迎大家指出、更改、补充。
1、 简述信度分析
答题提示:要答可靠度概念,可靠度度量,克朗巴哈α系数、拆半系数、单项与总体相关系数、稀释相关系数等(至少要答四个系数,至少要给出两个指标的公式)
答:
信度(Reliability )即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。信度分析的方法主要有以下四种:
1)、重测信度法
这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测,计算两次施测结果的相关系数。重测信度属于稳定系数。重测信度法特别适用于事实式问卷,如果没有突发事件导致被调查者的态度、意见突变,这种方法也适用于态度、意见式问卷。由于重测信度法需要对同一样本试测两次,被调查者容易受到各种事件、活动和他人的影响,而且间隔时间长短也有一定限制,因此在实施中有一定困难。
2)、复本信度法
复本信度法是让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。复本信度属于等值系数。复本信度法要求两个复本除表述方式不同外,在内容、格式、难度和对应题项的提问方向等方面要完全一致,而在实际调查中,很难使调查问卷达到这种要求,因此采用这种方法者较少。
3)、折半信度法
折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信度。折半信度属于内在一致性系数,测量的是两半题项得分间的一致性。这种方法一般不适用于事实式问卷(如年龄与性别无法相比),常用于态度、意见式问卷的信度分析。在问卷调查中,态度测量最常见的形式是5级李克特(Likert )量表。进行折半信度分析时,如果量表中含有反意题项,应先将反意题项的得分作逆向处理,以保证各题项得分方向的一致性,然后将全部题项按奇偶或前后分为尽可能相等的两半,计算二者的相关系数。
为了校正差异,两半测验的方差相等时,常运用斯皮尔曼-布朗公式(Spearman-Brown Formula ):rxx=2rhh/(1+rhh),其中,rhh :两半测验的相关系数;rxx :估计或修正后的信度。该公式可以估计增长或缩短一个测验对其信度系数的影响。当两半测验的方差不同时,应采用卢伦公式(Rulon Formula )或弗拉纳根公式(Flanagan Formula )进行修正。
4)、α信度系数法
Cronbach α信度系数是目前最常用的信度系数,其公式为:
⎪⎪⎪⎪⎪⎭⎫ ⎝⎛--=∑=21211X n i i S S n n α
其中,2i S 为每一项目的方差;2X S 为测验总分方差。
从公式中可以看出,α系数评价的是量表中各题项得分间的一致性,属于内在一致性系数。
这种方法适用于态度、意见式问卷(量表)的信度分析。
2、简述多元尺度分析在你工作中的应用
答:
多元尺度分析(Multi-dimension Analysis)是市场研究的一种有力手段,是市场调查、分析数据的统计方法之一。它可以通过低维空间(通常是二维空间)展示多个研究对象(比如品牌)之间的联系,利用平面距离来反映研究对象之间的相似程度。由于多维尺度分析法通常是基于研究对象之间的相似性(距离)的,只要获得了两个研究对象之间的距离矩阵,我们就可以通过相应统计软件做出他们的相似性知觉图。
在实际应用中,距离矩阵的获得主要有两种方法:一种是采用直接的相似性评价,先对所有评价对象进行两两组合,然后要求被访者对所有的这些组合间进行直接相似性评价,这种方法我们称之为直接评价法;另一种为间接评价法,由研究人员根据事先经验,找出影响人们评价研究对象相似性的主要属性,然后对每个研究对象,让被访者对这些属性进行逐一评价,最后将所有属性作为多维空间的坐标,通过距离变换计算对象之间的距离。
多维尺度分析的主要思路是利用对被访者对研究对象的分组,来反映被访者对研究对象相似性的感知,这种方法具有一定直观合理性。
在工作中,通过多维尺度分析,可以将消费者对商品相似性的判断产生一张能够看出这些商品间相关性的图形。
例如:有十个百货商场,让消费者排列出对这些百货商场两两间相似的感知程度,根据这些数据,用多维尺度分析,可以判断消费者认为哪些商场是相似的,从而可以判断竞争对手。
用于反映多个研究事物间相似(不相似)程度,通过适当的降维方法,将这种相似(不相似)程度在低维度空间中用点与点之间的距离表示出来,并有可能帮助识别那些影响事物间相似性的潜在因素。这种方法在市场研究中应用得非常广泛。
3、简述两个变量之间的相关分析
答题提示:答什么是相关,对连续型变量用相关系数,对离散型变量用质相关系数
答:
相关分析(correlation analysis),研究随机变量之间的相关关系的一种统计方法。相关关系是一种非确定性的关系。相关性探讨的是两变量间相关情况的的大致趋势。相关分析涉及两个变量:应变量和自变量。应变量(response variable)是度量研究结果的变量;自变量是解释或影响反应变量的变量。
两变量数据相关检验的步骤:一、图示两变量数据以及各个统计数字;二、查看整体状态及数据的离散情况;三、如果有较稳定的关系,就用简单的数学模式描述该关系。
对连续型变量常用相关系数刻画两个变量之间的相关性,而对离散型变量则用质相关系数。
4、聚类和判别分析的异同
答:聚类分析是把研究目标分割成为具有相同属性的小的群体。对变量的聚类称为R型聚类,而对观测值聚类称为Q型聚类。它们在数学上是无区别的。聚类的基本想法:根据某种距离,把最近的聚在一起。这里的距离含义很广,如欧氏距离、马氏距离等距离,相似系数也可看作为距离。
判别分析的基本思路是:设有G1、G2、…GK个总体,从不同的总体中抽出不同的样本,根据样本→建立判别法则→判别新的样品属于哪一个总体。当然,根据不同的方法,建立的判别法则也是不同的。常用的判别方法有:距离判别、Fisher判别、Bayes判别。
判别分析和聚类分析都是分类。其主要不同点就是,在聚类分析中一般人们事先并不知道或一定要明确应该分成几类,完全根据数据来确定。而在判别分析中,至少有一个已经明确知道类别的“训练样本”,利用这个数据,就可以建立判别准则,并通过预测变量来为未知类别的观测值进行判别了。
可以先聚类以得知类型,再进行判别.
5、因子分析和主成分分析的异同
答:主成分分析和因子分析是多元统计方法中关系密切的两种方法,应用范围十分广泛,可以解决经济、教育、科技、社会等领域中的综合评价问题。主成分分析采用降维的思想,将研究对象的多个相关变量(指标)综合为少数几个不相关的变量,反映原变量提供的主要信息。因子分析是主成分分析的推广和发展,它将具有错综复杂关系的变量综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系,同时根据不同因子还可以对变量进行分类,它属于多元分析中处理降维的一种统计方法。但是,在许多论文中用SPSS进行综合分析时,出现这两种方法运用混淆的错误。比如,主成分分析中对变量进行了因子旋转,因子分析的公因子系数错误等问题。本文就此对主成分分析和因子分析的异同进行比较,并在SPSS和DPS软件上如何实现给予说明。
一、主成分分析与因子分析的异同点
两者的相同点:1、思想一致:都是降维的思想;2、应用范围一致:都要求变量之间具有不完全的相关性;3、数据处理过程一致:数据的无量纲化,求相关系数矩阵的特征值和特征向量,通过累计贡献率确定主成分个数、因子个数;4、合成方法一致:都没有考虑原始变量之间的关系,直接用线性关系处理变量与主成分和因子之间的关系。
两者的不同点:1、方差损失上:主成分解释了原始变量的全部方差,无方差损失;因子模型中除了有公因子外还有特殊因子,公因子只解释了部分信息,有方差损失;2、唯一性:主成分分析不存在因子旋转,主成分是唯一的;因子分析进行因子旋转,解不唯一;3、