山西联通市场调研的抽样设计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

山西联通市场调研的抽样设计
山西信
本文从市场调查的实践出发,结合通信市场用户的消费特征与实施调研的数据统计过程,系统地整理并提出了样本量配置的分布表,并在两项有关电信市场的调研中进行了实践,取得了满意的效果。

本文的要紧结论对现实的市场研究具有较高的参考价值与简易的可操作性,同时能够很好地保证样本的精确程度,减小抽样误差。

不管是全面调查还是抽样调查,样本产生的误差都是不可避免的。

因此,为了获得较高精度与较高可靠性的数据,与误差作斗争就成为市场调研最大的课题之一。

依照传统的理论习惯,人们在研究实践中通常使用调整样本量与改进抽样技术的方法来减小误差与提高调研的精确度。

但问题是,尽管我们能够用较大的样本来弥补抽样技术的误差,用足够多的样本数来保证市场数据的真实可靠,但委托方对样本量增多而带来的调研成本的提高也非常敏感,调研的经济约束要求我们用最少的样本数来达到最大的抽样精确度。

一、影响样本量的要紧因素
在市场调研实践中,样本量是关系到调研精确度与市场研究公司效益的一项重要指标。

确定样本量是抽样方案的一个重要内容,也是实施抽样前务必解决的一个问题0样本量过大,会使调查费用显著增加,人力及管理费用加大,从而也难以表达抽样调查的优越性;样本量过小,又会使样本对总体的代表性降低,增大抽样误差。

因此,解决抽样设计中的样本量问题至关重要。

从统计学的角度来看,影响样本量的因素要紧包含置信度与同意误差。

简言之,置信度是对抽样估计可靠性的度量,同意误差是指事先要求与•定的置信概率相对应的抽样误差g∙8∣的最大范围,它是对抽样估计的精确度提出的要求。

另一方面,就具体的调研项目而言,项目的总预算费用又构成了样本量的一个上限。

容量过大就会突破预算约束,导致超支,这是受托方风险。

设经费总额为c,费用函数能够表示为
C=C0+阀Cl
其中,°。

为固定费用,与样本量无关;为平均每一样本单位需要的调查经费。

由此CYO
H三 ---------- --
解出的样本量,,能够作为经费约束的一个基本条件。

二、简单随机抽样样本量的测度方法
1.基本公式
在简单随机抽样的条件下,我们所使用的确定调查样本量的公式为:
其中:n代表所需要样本量;Z表示置信水平下的Z统计量,如95%置信水平的Z统计量为1.96,99%的Z为2.68;S代表总体的标准差;d代表置信区间的1/2,在实际应用中就是容许误差,或者者调查误差。

关于比例型变量,确定样本量的公式为:
d
其中:n表示样本量;Z表示置信水平下的Z统计量,如95%置信水平的Z统计量为1.96,99%的为2.68;P表示目标总体的比例期望值;d表示置信区间的半宽,即调查误差。

2.公式的应用
一些参数是我们能够事先确定的:Z值取决于置信水平,通常我们能够考虑α=95%的置信水平,那么Z=1.96;或者者取α=99%,Z=2∙68.然后能够确定容许误差d(或者者说精度),即我们能够根据实际情况指定置信区间的半宽度d。

因此,公式应用的关键是如何确定总体的标准差So假如我们能够估计出总体的方差(标准差),那么我们能够根据公式计算出样本量。

比如,要熟悉某城市的居民收入,假定我们明白该市居民收入的标准差为1000,要求的调查误差不超过100元,则在95%的置信水平下,所需的样本量为
n=!%7°,=384.16W385
100,
即需要调查的样本量为385个。

3.最大样本量的讨论
以上公式只是理论上的,在实际调查中确定合理的样本量,务必考虑多方面的因素。

首先,由于人们通常缺乏对标准差的感性认识,因此对标准差的估计往往是比较困难的。

总体的标准差是123,还是765?假如没有一点对样本的先验知识,那么对标准差的估计是不可能的。

好在我们通常能对变量的平均值进行估计,如我们通过历史资料估计该地区目前的年人均收入大致为10,000元,那么根据统计学知识,我们引入变异系数的概念:
变异系数V=标准差S/平均值X<=1
因此,我们明白人均收入的标准差应该小于平均值,就是说标准差应该在IoOoo F列。

当然,这关于我们确定样本量还不能起太大的作用。

假如我们使用相对误差表述的精度,我们有
―/疗--------------- P-57Γ
其中P表示相对误差
根据上述公式,我们能够计算在相对误差一定的情况下,所需的最大样本量。

下列是在置信程度95%的水平下,在不一致相对误差下的最高样本量:
通常,变异系数为1的情况是很少见的,根据本人对市场研究中经常遇到的情况,变异系数多在50%下列,因此,实际所需要的样本量能够进一步缩小。

关于比例型变量,在事先缺乏对比例的估计时,我们能够使用最保守的估计法,即p=0.5,下列是比例P在不一致绝对误差程度下,所需的最大样本量(95%置信水平):
4.实际调查样本量的确定原则
尽管我们根据公式能够从理论上确定样本量的上限,但是由于实际工作的经费与时间限制,使用最大样本量的可能性很小。

而且,实际研究的情况通常要复杂得多,一项研究往往要考虑多个目标,即要求对多个指标的误差进行操纵,而不是简单地考虑一个指标。

因此我们在实际的市场研究中,务必综合考虑,使用多种方式来确定样本量。

(1)调查的要紧目标
一个现实的市场调查往往有多个目标,关于一些目标单一的调查,调查的样本量往往能够很少,比如100个,甚至50个就足够了。

而关于具有多个目标的研究,务必考虑这些目标中变异程度最大,要求精度最高的目标。

(2)分类比较的程度
分类是市场研究中一个最基本的方法,研究者往往是通过分类来发现细分市场,确定产品的市场定位等。

假定对同一变量(研窕目标),在一定精度与置信程度下,只要100个样本量就足够了,假如我们仅仅希望熟悉不一致性别的消费者市场,则确定样本量时只需要考虑两类消费者的样本量,这样调查的总样本量可能需要200个以上,假如希望熟悉不•致年龄层的消费者,则可能要将消费者分为多类,如分为:20岁下列,20-35,35-50,50岁以上等四类,这样的样本量需要400个以上。

也就是说,确定样本量时务必考虑到每一类别的样本量。

(3)调查区域的大小
根据常识,调查区域越大,所需要的样本量可能越大,由于大区域内的样本变异程度通常较难掌握。

此外,在实际研究中,我们还往往需要对大区域进行进一步分类,以寻求更加准确的市场细分。

比如,对柯达胶卷进行的调研在北京的取样明显应高于太原。

三、山西联通市场调研的抽样设计分配表
山西联通是中国联合通信集团公司的全资子公司,负责经营山西省各地市的综合电信业务。

该公司十分注重市场调查,对市场调研的精度与深度都有一定的要求。

2003年6月实施的山西省联通用户综合业务调研中,样本的设计具有一定的科学性。

本文给出了本次调查计划中全省范围市场调查的样本配置方案,以资参阅。

设p为本次调查总体的任一比例值,力为其估计值,要求
P(∖p-p∣≤<∕)=I-Qf
则样本大小n能够计算如下:
假设在95%的概率保证下,最大误差不超过2%,可取的一个样本方案是2401。

我们考虑到山西省各地市人口数量的差异,使用比例配置法把全部样本依照比例分摊到各个地市。

结果如下表:
我们注意到,阳泉市与朔州市的样本均在一三8下列,也就是说,这两个地市的抽样精度还达不到90%的置
信度,而最大误差则超过了7%。

因此,我们对这两个地市的样本数量进行修正,均提高到一三8,以满足各个地市调查数据能够独立的要求,如今,两个地市的抽样概率置信度都达到了90%,最大误差操纵在7%下列。

调整以后的样本列在表的最右边一列。

这时,样本总数达到了2476个。

注记,
1 .通过对方差的估计,使用公式计算所需样本量,要紧使用两步抽样,即在调查前先抽取少量的样本,得到标准差S的估计,然后代入公式中,得到下一步抽样所需样本量n;假如有往常类似调查的数据,能够使用往常调查的方差作为总体方差的估计。

2 .根据经验,确定样本量的要紧方法有:
假如往常有人做过类似的研究,初学者能够参照前人的样本。

假如是大型城市、省市一级的地区性研究,样本数在500.1000之间可能比较适合;而关于中小城市,样本量在200-300之间可能比较适合;假如是多省市或者者全国性的研究,则样本量可能在IOoo-3000之间比较适合。

3 .作为一个常识(要紧是为了显著性检验),要进行分组研究的每组样本量应该很多于30个。

4 .通过调研设计所作的研究,能够使用较小的样本量。

如产品试用(留置)调查,在经费有限的情况下,能够将每组的样本量降低至一五个左右,最好每组在30以上。

此外,我们在多次的实际研究中发现,每组样本超过50个可能是一种资源浪费。

相关文档
最新文档