《基础统计》 教学案例 计算基本描述统计量的应用举例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计算基本描述统计量的应用举例
对某地区居民储蓄情况进行调查,所得部分数据见附表。

对一次存(取)款金额变量计算基本描述统计量。

有以下两个分析目标。

目标一:计算存(取)款金额的基本描述统计量,并分别对城镇储户和农村储户进行比较。

目标二:分析储户一次存(取)款的数量是否存在不均衡现象。

为实现上述分析目标,利用基本描述统计分别做如下分析。

1.城镇与农村储户一次存(取)款金额的分析比较
利用居民储蓄调查数据计算存(取)款金额的基本描述统计量,并对城镇储户和农村储户进行比较。

首先按照户口对数据进行拆分(SplitFile),然后计算存(取)款金额的基本描述统计量,SPSS操作结果如表1所示。

表1 城镇储户和农村储户存(取)款金额的基本描述统计量
表1表明,城镇储户的一次平均存(取)款金额(2687。

2元)高于农村储户(1944.97元)。

标准差证明了城镇储户存(取)款金额的离散程度低于农村储户。

无论城镇储户还是农村储户,存(取)款金额的分布均呈右偏分布(两个偏度统计量分别为4.57和8。

311),且农村的偏斜程度更大些(8.311>4.57);同时,城镇储户和农村储户存(取)款金额均呈尖峰分布(两个峰度统计量分别为26.996和?3。

134),且农村更尖峰。

由此可见,城镇储户和农村储户中的大部分人一次存(取)款金额都低于平均水平,且农村储户表现得更为明显。

2.储户一次存{取)款数量的均衡性分析
分析储户一次存(取)款数量是否存在不均衡现象,可以从分析金额是否有大量异常值人手。

这里,如果假设储户一次存<取)款金额的分布服从正态分析,那么根据3,准则,异常值通常为3个标准差之外的变量值,可通过对数据的标准化处理来判断。

标准化的数学定义为:
Z i=( x i- x i)/S
通过标准化可得到一系列新变量值,通常称为标准化值或Z分数。

由式(4.?)可见,标准化值反映的是变量值与变量均值的差是几个标准差单位。

如果标准化值等于0<即分子为0),则表示该变量值等于变量均值;如果标准化值大于0“p分子为正),则表示该变量值大于变量均值;如果标准化值小于o“p分子为负),则表示该变量值小于变量均值。

基于上述对案例申存(取)款金额数据分布的假设和分析的要求,计算存(取)款金额的标准化值。

SPSS可计算存(取)款金额的标准化值并将结果保存在一个新变量Za中。

对该变量的取值进行分组整理,可以发现Z分数值的绝对值大于3的储户是存在的。

对变量分组为三组(Za<=-3ó低金额组、-3ó<Za<3ó中金额组、Za5>3ó高金额组)后进行频数分析可得,低金额组 (即低异常值组)的比例为0%,高金额组<即高异常值组)的比例为2.2%。

异常组的总比例大于理论值0.3%,因此可以认为存(取)款金额存在一定的不均衡现象。

资料来源:薛薇,《SPSS统计分析方法及应用》,电子工业出版社,2007年4月。

B中国市场调查业发展状况的国际比较分析
教学目的:
1.掌握描述统计分析、聚类分析和相关分析的理论、方法。

2.熟悉Spss等统计软件的操作。

3.提高应用统计方法解决实际问题的能力。

作业与问题:
1.比较分析一国市场调查业发展状况,都可以从哪些方面考虑?
2.做比较分析可以考虑采取的统计方法都有哪些?
3.做聚类分析时聚类方法和间距的选择都有哪些?其各自的适用范围是什么?
4。

做分析时如何对现有数据进行充分的利用和挖掘?都可以从哪些方面入手?
一、问题的提出
1935年美国的乔治·盖洛普博士以自己的名字命名了一家市场调查公司,开创了全球调查业的先河。

这几十年来市场调查已将企业与市场场密切地联系起来,使企业能够面向市场,进而适应市场需求的变化,在竞争中立于不败之地。

由于市场调查与企业发展与生存能力密切相关,而企业发展与生存能力则是一国的竞争力的核心,因此市场调查业在国民经济中逐步变得举足轻重。

相对于西方国家来说,中国的市场调查业发展较晚,直到20世纪80年代末,中国的专业市场调查业才开始慢慢起步。

根据有关数据显示,近年来,中国市场调查业发展迅速,到2000年市场调查总额已经达到181百万美元。

那么,相对于世界上其他国家,中国市场调查业目前的发展状况究竟如何?这个问题的研究也就具有重大的意义。

本案例试图应用多元统计方法对此进行剖析和研究,力求使大家对中国市场调查业的发展状况有正确的认识。

二、数据的采集
1.数据来源
笔者通过“欧洲民意和市场研究协会(ESOMAR)(o网”网址为:
http://www.esomar.nl/Publications/Industry%20Report%202000.pdf,查找到欧洲民意和市场研究协会(ESOMAR)发布的2000年全球市场调查业的报告,并选取了其中一部分数据用于分析。

2.数据说明
(1)自1990年起,ESOMAR每年发布一次全球市场调查业报告。

本案例选取2000年数据是因为在2001年ESOMAR全球市场调查业报告中中国数据缺失,2002年ESOMAR全球市场调查业报告迄今为止还没有发布。

(2)该报告中的数据来自于2000年ESOMAR在其100多个成员国中进行的一次调查,数据主要由各个国家的市场调查协会提供。

该数据不包括由机构内部顾客和广告机构、大学、政府、非盈利调查协会进行的调查。

(3)该报告中的数据只包含市场调查业发展规模较大,即市场调查总额超过 1百万美元的国家的市场调查数据。

2000年全球的市场调查业总额15263百万美元。

本文选取的60个国家的市场调查额总计为15011百万美元,占全球市场调查总额的98.35%。

(4)在许多国家中,市场调查协会采取给市场调查公司发放调查问郑的形式搜集数据资料,由于种种现实原因,一些国家的详细数据难以获得,存在缺失值和一定的统计误差。

3.数据整理
因为网上数据为图片形式,无法直接用于分析,笔者将数据逐一输入到Spss数据库中。

4.数据库结构
三、统计分析的思路
分析中国市场调查业的发展状况,需要与其他国家进行对比,只有与其他国家进行对比,才可以看出中国市场调查业的真实发展水平。

笔者考虑从三个方面做比较:
第一,从数量上比较。

第二,从结构上比较。

第三,从发展速度上比较。

数量比较和结构比较是在一定时点的静态比较,而发展速度比较则是一种动态比较。

其中,从数量上比较包括从市场调查额总量和人均量比较;从结构上比较包括从市场调查额行业来源和市场调查方法的比较;从发展速度上比较是指用2000年与1999年市场调查额之比的增K率比较。

四、统计方法的选择
本案例主要采用描述统计分析、相关分析、聚类分析。

五、统计分析的过程
1.中国市场调查业与其他国家市场调查业数量比较分析
(1)总量比较分析
根据市场调查额超过1百万美元的60个国家的市场调查额,分别计算各国在全球市场调查业中所占份额(Transform-Compute),然后按降序排列(SortDe— seending)得到表4。

由表4可以看出:2000年,中国的市场调查额为181百万美元,居于第14位,次于美国、英国、德国等13个国家。

但是中国市场调查业总额在全球市场调查额中所占份额较低,仅占 1.19%,与之相比,美国、英国、德国、日本、法国分别占38.8%、10.63%、 8.45%、7.9%、6.28%,
这5个国家合计占72.06%。

(2)人均量比较分析
通常分析一国经济发展水平既可以考虑总量指标也可以考虑人均量指标。

但是,总量指标与人均量指标相比往往受到多种因素的影响,从而不能真正反映发展水平。

同理,分析一个国家市场调查业发展的水平,应该结合市场调查额,进而考虑人均市场调查额。

将市场调查总额除以人口,得出人均市场调查额,GDP除以人口得出人均GDP(Transform-Compute),再按人均市场调查额降序排列(SortDescending),得到表5。

表5 60个国家人均市场调查额排序表
由表5可以看出:中国的人均市场调查额为0.14美元,在这60个国家中位于第57位,同期,中国的人均GDP为852.54美元。

考虑人均市场调查额与人均GDP有无关联,由表5,做人均市场调查额与人均GDP的散点图,利用Spss,按菜单操作,过程为:
由图1可以看出:人均GDP高的国家,人均市场调查额相对也较高,人均市场调查额与人均GDP存在正相关关系,但是相关程度如何?做皮尔逊相关分析,过程为:
表6 皮尔逊相关分析结果表
由表6可以看出:人均市场调查额与人均GDP的皮尔逊相关系数为 0.812,即可以认为,市场调查业发展水平与经济发展水平存在强正相关关系(一般认为,相关系数绝对值超过0.8视为强相关)。

这同表2的情况比较吻合。

英国、瑞典、美国这三个发达国家(人均GDP分别为24122.66、25505.62、 36467.77美元)人均市场调查额分别为27.65、25.62、21.68美元,排名居于前三位,分别是中国人均市场调查额的197、183、155倍,充分说明了中国市场调查业发展相对比较落后;而同中国经济发展水平相近的三个国家,罗马尼亚、菲律宾、斯里兰卡,人均GDP分别为1066.67、1002.67、752.69美元,人均市场调查额分别为0.49、0.29、0.27美元,分别是中国的人均市场调查额的3.5、2.07、 1.93倍;仅有人均GDP分别为440.91、423.79、731.01美元的印度、巴基斯坦;印度尼西亚,人均市场调查额分别为0.05、0.04、0.04,低于中国。

讨论一:由市场调查业发展水平与经济发展水平存在强正相关关系,能否推论出二者存在因果关系?
我们认为,从数量上说中国市场调查业还比较落后,影响中国市场调查业发展落后的因素,主要有以下几点:
(1)发展较晚。

中国在20世纪50年代建立了城市抽样调查队伍,但是由于长期以来一直
否认市场的存在,造成市场调查一直得不到重视和发展。

直到20世纪80年代末,中国的专业市场调查业才开始慢慢起步,到2000年发展也不过十几年;而大部分西方国家的市场调查业则已经发展了几十年了。

(2)缺乏专业人才与必要的技术、设备等。

在中国现有的市场调查公司中,不少市场调查公司规模较小,缺乏专业人才,无力承担先进昂贵设备。

访问员主要由在校学生组成,缺乏必要的培训,素质不高。

(3)市场尚不成熟。

不少企业还没有认识到市场调查在企业决策中的重要价值,企业内部不设立市场调查部门,也根本不进行市场调查。

另外一些企业认为只有项目初期才需要进行市场调查,过后就不需要了,有些企业在出现问题时才诉诸于市场调查,做过一次调查就匆忙做出对策,认为“市场调查,一次了事”。

另外许多企业也缺乏做调查的资金。

讨论二:你认为影响中国市场调查业发展落后现状的因素还有哪些?
2.中国市场调查业与其他国家市场调查业结构比较分析
(1)市场调查额行业来源结构比较分析
按照ESOMAR报告,市场调查额在各个行业的分布,可以分为制造业、企业电子商务、批发零售、金融、公用事业、邮电通讯、公共部门、媒介、广告机构、调查机构、其他服务部门、其他等12类。

在市场调查额行业来源结构上中国市场调查业与其他国家市场调查业相比,是否存在偏差?考虑使用分层聚类(Hierarchical Cluster)中的样本聚类(Q型)进行分析,由此获得更进一步的信息。

有效样本数39个;
因为参与聚类的变量量纲相同,不需要进行标准化处理;
由表7,各类所包括的国家及其特征概括如下:
第一类:英国、瑞典、瑞士、芬兰、丹麦、澳大利亚、加拿大、比利时、葡萄牙、希腊、匈牙利、捷克共和国、南非、韩国、波兰、斯洛伐克共和国、罗马尼亚、俄罗斯、尼加拉瓜、洪都拉斯、萨尔瓦多、斯洛文尼亚、日本。

该类的主要特征为:市场调查来自于媒介调查比例较高,一般在8%~20%之间,邮电通讯、公共部门进行的调查比例相对也较高。

第二类:法国、德国、意大利、西班牙、巴西、土耳其、克罗地亚、巴基斯坦、埃及、美国、乌拉圭。

该类的主要特征为:市场调查来自于制造业的调查比例较高,一般占50%一 60%。

第三类:中国。

该类的主要特征为:市场调查中来自于制造业调查比例相对于大多数国家比例较低,而其他服务部门所占比例远远高于其他国家,占30%,媒介、广告所占比例很高,占21%和17%,而企业电子商务、批发零售、金融、公用事业、邮政通讯、政府、其他比例近似为①。

第四类:塞浦路斯。

该类的主要特征为:市场调查中来源于批发零售、金融、媒体的比例很高,分别占28%、15%、20%,而政府、广告机构、其他类型所占比例近乎为0。

第五类:秘鲁和委内瑞拉。

该类的主要特征为:市场调查中来自于市场调查协会的调查比例较高,占 20%多。

第六类:新加坡。

该类的主要特征为:市场调查中来自于制造业的调查比例很低,仅占10%,远远低于其他国家;邮政通讯、政府、媒体所占比例很高,共占到了50%。

此外,由表7可以看出,除了塞浦路斯和新加坡外,其他国家市场调查业行业来源中制造业较其他行业所占比例都高。

其中美国(54%),英国(41%),德国 (55%),日本(42%),法国(65%),制造业比例都较高。

因为这5个国家的市场调查额总计占全球的72.06%,加权估计,全球市场调查业来源中,制造业与其他行业大致50/50分。

中国的市场调查业行业来源结构上与其他国家相比,单独属于一类。

在12项调查来源中,中国仅仅有4项,其中,制造业32%,低于全球平均水平(50%),媒介21%,广告机构17%,其他服务30%,公用事业、公共部门、邮电通讯、金融等行业、调查比例都近似为0,
市场调查业来源结构属于极为特殊的一类。

我们认为,在中国,公用事业、公共部门、邮电通讯、金融部门等调查比例极低,跟这些部门长期以来一直处于国有、无竞争地位有关,但是随着国家对一些部门的放开和市场竞争的加剧,这些部门调查比例将会有所上升。

讨论三:你认为造成中国市场调查业行业来源结构极其特殊的原因还有哪些?
(2)市场调查方法结构比较分析
市场调查数据收集方法可以分为邮寄调查、电话调查、拦截调查、入户调查、神秘顾客、在线调查等。

邮寄调查,是指访问者将调查问卷寄给被访问者,由被访问者在完成问卷以后再寄回访问者处。

它的优点为无须对访问者进行专门的培训和管理,可以扩大调查区域,调查成本较低,被访问者有较充分的时间填写问卷,可以避免被访问者受访问者态度、情绪等因素的影响,对被访问者采取匿名方式,可以对某些敏感和隐私情况进行调查;缺点为回收率较低,信息反馈时间长,影响资料的时效性,要求被访问者有一定的文字理解能力和表达能力,对文化程度较低者不适用。

电话调查,是指访问者在他们家外的地方通过电话与家庭主妇或商业代表进行访问。

它的优点是成本较低,能产生高质量的样本,调查时间较短;缺点为受时间限制,询问时间不能过长,内容不能过于复杂,无法深入了解一些情况和问题。

拦截调查,是指在购物中心的购物者被访问者拦住并邀请其参加调查。

访问通常在大厅或公司大厅内的仪器设备上进行。

它的优点是成本低,访问者能拦截被访问者并取得接触;缺点为样本的代表性有时候较差,并且在购物中心很难创造一种舒适的家庭环境,造成访问质量较差。

入户调查是指访问者按照抽样方案中的要求,到抽中的家庭中进行访问。

它的优点是具有较强的灵活性,反馈信息质量较高;缺点为调查的人力、经费消耗较多,对访问者素质要求较高。

其他调查包括神秘顾客、网上调查等。

其中神秘顾客调查是指由符合条件的调查员作为消费者,到指定场所消费商品或服务,同时对商品、环境、服务态度等各方面进行调查。

它的优点是可以对营销渠道的各个方面进行控制;缺点为真实性与调查员的心理状态有很大关系,在调查的当时无法做记录,可能产生细节的遗漏。

网上调查是指利用网络来进行调查,获取资料,优点是因特网没有时空、地域限制,因特网的交互性使网上调查的周期大大缩短。

缺点是无法确定被
访问者的真实身份,样本代表性有可能较差。

做描述统计分析,看中国市场调查业数据收集方法与其他国家相比是否存在差距。

表8 描述统计分析结果表
由表8可以看出,各国市场调查方法差异很大,表现为相对于均值来说,标准差较大。

进一步比较分析中国与其他国家市场调查方法有无显著不同,分别按各种调查方法升序排列(SortAscending),得到表9。

由表9,中国邮寄调查比例为0,低于平均值7.1491%,其中韩国的邮寄调查比例最高,占38.1%,日本、挪威、芬兰、瑞典、丹麦等国家邮寄调查比例也较高,在15%以上;
中国电话调查占6.12%,远低于平均值29.0706%,其中加拿大电话调查比例最高,占75.64%,芬兰、斯洛文尼亚、挪威、瑞典、瑞士等国家电话调查比例很高,占到了50%以上;
中国拦截调查比例也为0,低于平均值13.6548%,其中西班牙拦截调查比例最高,占39.13%,委内瑞拉、匈牙利、日本等国家拦截调查比例也较高,在20%以上;
中国入户调查占89.8%,远远高于平均值41.9644%,仅仅低于秘鲁(90%),
相对来说,西班牙入户调查比例为0,韩国、加拿大、芬兰、丹麦等国家入户调查 [t例部比较低,远低于平均值。

中国其他调查如神秘顾客、在线调查等比例也较低,占4.08%,低于平均值 8.1610%,其中以土耳其其他调查比例最高,占23.91%,葡萄牙、法国等国家其他调查比例也较高。

由此,可以看出,中国市场调查业调查方法比较单一,主要依赖于传统的市场调查方法——入户调查,邮寄调查、电话调查、拦截调查、其他调查比例都低于甚至可以说是远远低于平均值,市场调查方法结构与其他国家相比显著不同。

我们认为,造成这种状况,主要是因为:
中国现阶段邮寄调查比例极低,这跟中国邮寄调查回收率较低(通常低于 20%)和对被访问者的选择无针对性有很大关系,而在国外很多国家邮寄调查普遍应用,一般是利用各种通讯录、名册等来选择被访问者,电脑的应用使信息拥有量大增,电脑中储存了大量的客户名单,调查时只需要查询、抽选并打印地址和信封即可寄出。


中国电话调查比例较低,跟中国电话普及率尚不高有关。

在经济发达国家,电活普及率很高,电话调查得到广泛应用。

但是在中国,因为电话普及率不高,在一定程度上会影响调查总体的完整性。

但是随着近些年中国电讯事业的发展,电话调查作为一种快捷、有效的调查方法,将会越来越得到广泛的应用。

入户访问是最传统的数据收集方法,也是中国现阶段主要的数据收集方法,占到了89.8%,这与中国妇女就业率不高有关系。

在国外一些国家中,入户调查比例很低,主要是因为越来越多的妇女加入就业行业,入户调查合作率日益下降,居民要求隐私权的呼声越来越高。

讨论四:为什么有的市场调查方法,如拦截调查在国外得到广泛应用而在中国得不到广泛应用?而相对来说入户调查在中国应用很广泛?
3.中国市场调查业与其他国家市场调查业发展速度(u比较分析
从发展速度上比较是指用2000年与1999年市场调查额之比的增长率比较。

在60个国家中,有8个国家发展速度数据缺失,将剩余52个国家的发展速度降序排列(SortDescending),得到表10。

由表10可以看出:各国市场调查业发展速度差异很大,由—27%一35%不等。

中国市场调查业发展速度较快,2000年比1999年市场调查额增长了32%,仅低于韩国的发展速度35%。

表10 各国市场调查业发展状况比较
在这52个国家中,有23个即44.23%的国家的发展速度非负,在29个即 55.77%的国家的发展速度为负。

在发展速度非负的23个国家中仅有4个(占17.39%)国家,即加拿大、日本、美国、匈牙利人均市场调查额较高,在8.21~21.68美元之间,剩余19个(占 82.61%)国家人均市场调查额较低,在0.04—4.6美元之间。

在发展速度为负的29个国家中,有15个(占51.72%)国家的人均市场调查额较高,
在6.93~27.65美元之间,剩余14个(占48.28%)国家的人均市场调查额较低,在0.04—4.15美元之间。

可以认为:市场调查业发展较好的国家,发展速度普遍来说比较低,只有加,拿大和日本发展速度较快,分别为11%、10%,美国、匈牙利发展速度>0,分别为5%、3%,其余市场调查业发展较好的国家,发展速度都为负,而相对来说,市场调查业发展较差国家,发展速度较快,而在市场调查业发展较为落后国家中:中国市场调查业发展速度很快,居于第二位,即说明中国正在逐步缩小与市场调查业发展较好的国家的差距。

六、分析结论
综合上述分析,可以认为中国市场调查业目前发展水平还比较落后,从总量上说,尽管位次较靠前,但是所占份额较小;从人均量上说,中国不仅与发达国家相比市场调查水平相差悬殊,与经济发展水平相近的国家相比,市场调查水平也落后;从市场调查额行业来源结构上说,行业来源极为不均,属于很特殊的一类:从市场调查方法上说,依然依赖于传统的调查方法,调查方法结构也属于比较特殊的一类;但是从发展速度来说,中国市场调查业发展迅速,正在逐步缩小与市场调查业发展较好的国家的差距。

七、分析中的问题
受到现有资料和笔者水平的限制,本案例的分析比较粗浅,采用的统计方法
比较简单,读者可以充分利用多种统计方法进行分析,另外,在分析过程中存在
以下问题,需要解决:
1.本案例仅从数量、结构、发展速度对中国市场调查业发展现状进行了粗
略的国际比较,没有对中国市场调查业从业人员规模等其他方面进行深入的国
际比较。

2.本案例在进行数量比较分析时采用了市场调查业总额这个指标,这本身存在一定问题。

因为中国人力资源丰富,劳动力比较廉价,同样的100美元,可雇用的人员数是欧美等发达国家的8~10倍,这样就造成了中国市场调查业总额偏小,也造成了没有经过购买力平价处理的各国市场调查业总额难以准确比较;另外本案例中所采用的数据不包括大学、政府、非盈利调查协会等进行的非盈利性调查,而从实际情况来看,在中国,大学、政府、非盈利协会等进行的调查多以研究为主,营业为辅,为研究的目的所进行的调查额在实际调查业总额中所占比重,相对于其他国家来说比较大,同样造成了中国市场调查业总额偏小。

以没有经过数据处理的市场调查业总额来进行国际比较,可比性相对差一些。

可以考虑结合调查的覆盖面的大小等指标来分析更合理,如调查的范围、调查的企业、总的调查时数或人力总数等指标,比单纯的调查业总额更具可比性。

2.发展速度分析只是考虑了2000年与1999年相比的增长速度,缺少时间序列数据。

3.所有分析都是对市场调查业发展规模较大,即超过1百万美元且数据比较完整的国家进行了比较。

对中国市场调查业的真实发展现状只是初步的估计,存在统计误差。

相关文档
最新文档