抽样市场调查
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
式中代表样本平均数的抽样标准误差,代表样本比率的抽样标准误差;M代表 样本个数。上述公式可用来解释抽样误差的实质,但不能实际应用,因为所有可 能的样本个数太多,总体均值或总体比率是未知的,是需要推断的,同时,实际 抽样时,往往只能抽取一个样本进行调查。因此,抽样标准误差的计算需要寻求 别的测定方法,将在以下各种抽样方式中介绍。
4.4.5
抽样市场调查的组织方式
1简单随机抽样 1)简单随机抽样的概念 是指从总体的全部单位中按随机原则直接抽取n个单位组成 样本进行调查。通常采用信手抽取法、抽签法、随机数表法、 计算机随机函数法抽取样本。简单随机抽样只适用于总体单位 数不多,总体单位标志变异度较小的情形。 2)简单随机抽样标准误差 (1)样本平均数的抽样标准误差 重复抽样 不重复抽样 (2)样本比率的抽样标准误差 重复抽样 不重复抽样
4)等距抽样标准误差的测定
(1)无序系统抽样:采用简单不重复随机抽样的公式计算抽 样标准差。 【例4.8】已知某街区共有居民家庭8 860户,按登记名册每 隔10户抽取1户,共抽取了886户,调查他们是否收看了某电视广 告,调查结果已收看的有685户。要求在95%的臵信概率下,求收看 率的臵信区间。 解: N=8 860 n=886
【例4.3】 某商场从某天的顾客中,不重复随机抽取100个顾客 调查购买商品情况,其中有5个顾客未购买商品(未购率5%);顾客购 买商品的样本平均数为498元,样本标准差为144元,要求用95%的概 率(Z=1.96)估计顾客平均购买额和未购率的臵信区间。 解:此题不知总体方差,因样本为大样本,可用样本方差代替。
总体平均数点估计: 层内方差平均数 总体平均数的抽样标准误差 重复抽样: 不重复抽样: 总体比率估计的抽样误差的计算只需用( )代替上述 层内方差平均数公式中的 即可;而总体比率估计的公式为
【例4.5】某县某年共有乡镇18个,农民家庭88万户,按各乡镇收入高低可分 为高收入乡镇、中收入乡镇、低收入三类,各类乡镇的农户数如表 4-2, 现从这 三类中按等比例抽样,共抽取500户组成样本,样本各组的户均年收入、标准差 等如表4-2,要求在90%的臵信概率(Z = 1.64)下对全县户均年收入进行区间估 计。
(2)有序系统抽样:采用事后分层,利用等比类型抽样标准 误差公式计算抽样标准误差。 【例4.9】 某大型超市某年2月份有360个小时的营业时间,现 按时间顺序每隔9小时抽取1个小时,以测定2月份(春市期间)购 物的顾客流量,其抽出40小时,每小时的顾客流量整理如下5组, 要求在95%的臵信率下估计每小时顾客流量的臵信区间.。
x
4.4.4
抽样市场调查的基本范畴
1.总体与样本 总体是所要调查研究的现象的全体,它是由具有同质性和差异 性的许多个别事物的集合体。总体单位数通常用N表示。样本是按 随机原则从总体中抽出来的一部分单位的综合体,样本中包含的单 位个数称为样本量,用n表示,n/N 称为抽样比。 2.参数与统计量 参数是总体的数量特征,即总体指标。参数在抽样时往往是未 知的,是需要进行推断的。参数通常有总体均值 .总体标准 差 .总体比率P等。 统计量是样本的数量特征,即样本指标。统计量随样本不同而 不同,因而是一个随机变量。统计量通常有样本均值 . 样本标准 差s,样本比率p等。
顾客平均购买额的臵信区间为 498〒1.96〓14.4 即[469.78, 526.22] 元 顾客未购率的臵信区间为 5%〒1.96〓2.2% 即[0.69%,9.31%]
3)简单随机抽样样本容量的确定
一般来说,样本容量确定应考虑总体方差、抽样估计精度要求 (允许误差的约束)和把握程度(臵信概率)的大小、抽样方式方 法、抽样调查费用约束等因素。在不考虑抽样调查费用约束的条件 下,样本容量的计算公式为: (1)总体均值估计所需的样本容量 重复抽样 不重复抽样 (2)总体比率估计所需的样本容量 重复抽样 不重复抽样
4.4 抽样市场调查
4.4.1 抽样市场调查的特点
是指调查者为了特定的调研目的,按照随机原则从调查总体中抽取一部分 单位作为样本而进行的一种非全面调查。主要特点如下。 (1) 样本是按随机原则抽取的。 (2) 用样本数据推断总体的数量特征。 (3) 抽样误差不可避免,Fra Baidu bibliotek可以计算和控制。
4.4.2
抽样市场调查的优缺点
9.抽样方式与抽样方法 (1)抽样方式。是指抽样调查的组织方式,通常有简单随 机抽样、分层抽样、系统抽样、整群抽样、目录抽样、多阶 段抽样等等。这些抽样调查的组织方式、抽样误差的计算和 区间估计以下将分别介绍。 (2)抽样方法。是指在抽样调查的组织方式既定的前提 下,从总体的全部单位(个体)中抽取n个单位组成样本的方 法。通常有重复抽样与不重复抽样两种抽取方法,而重复抽 样与不重复抽样的具体实施,又有不同的具体做法。
4.4.3
抽样市场调查的应用
(1) 不可能进行全面调查的现象,只能采用抽样调查。如 产品质量检验。 (2) 不必要进行全面调查的现象,采用抽样调查。如消费 者需求潜力测定等。 (3) 可作全面调查的现象,为调查费用,亦可采用抽样调 查。如企业员工满意度测评。 (4) 对全面调查资料的质量进行检查和修正。 (5) 对某些总体的假设进行抽样检验。
3.抽样框与抽样单位 抽样框是一个包括全部总体单位的框架,用来代表总体,以便从中抽取样 本的一个框架。抽样框可以是一览表(名单或名录),一本名册,一幅地图, 一段时间等。 抽样单位是指样本抽取过程中的单位形式,亦即从抽样框中直接抽取的单 位称为抽样单位,它可能是总体中的基本单位,也可能是总体中的基本单位的 集合。 例如,欲调查某市大学的教学用品需求,则全市大学的集合为总体,抽样 框是全市的大学名单。总体单位是每一个大学,抽样单位可以是总体中的每一 个大学,也可以是大学分类中的每一个大学。 4.样本量与样本单位 样本量是指样本的大小,即一个样本中包含的样本单位的多少。样本量的 大小,取决于抽样调查的精度要求,总体各单位的标志变异程度、抽样估计的 可信程度,抽样方式方法等因素的制约。 样本单位是构成样本的基本单位、与总体单位的形式是一致的,样本单 位可以直接从总体中抽取总体单位,亦可从抽样单位中产生。
5.总体分布、样本分布与抽样分布 总体分布:总体各单位标志值的分布状况,又称总体结构; 样本分布:样本中各样本单位标志值的分布状况,又称样本结 构。当样本量足够大时,样本分布趋于总体分布。 抽样分布:从总体中抽取的所有可能的样本的统计量构成的分 布。根据中心极限定量,当样本量足够大时,样本均值等统计量的 分布趋近于正态分布,因而可用正态分布来作区间估计。 6.重复抽样与不重复抽样 从N个总体单位中抽取n个组成样本,有两种抽取方法。 (1)重复抽样,即每抽出一个单位进行登记后,放回去,混合 均匀后,再抽下一个,直到抽满n个为止。重复抽样有可能出现极 大值或极小值组成的极端样本。 (2)不重复抽样,即每次抽出一个单位进行登记后,不再放回 参加下一次抽取,依次下去,直到抽满n个为止。不重复抽样可以 避免极端样本出现,抽样误差比重复抽样小。
用以上公式计算样本容量时,应注意以下三点。 (1)抽样比例n/N较大时(大于5%)时,应采用不重复抽样公式计算必要的 样本容量,否则无论采用重复抽样还是不重复抽样时,均可用重复抽样公式计算 样本容量n,可简化计算,且误差很小。 (2)当总体方差σ2或总体比率P未知时,可用样本方差(或样本比率),或 历史的类似的总体方差(或总体比率)代替。计算总体比率所需的样本容量时, 亦可直接用P(1-P)的最大值0.25代替。 (3)在同一抽样调查中,总体均值与总体比率推断要兼顾时,用以上公式计 算的样本容量一般不相等,为了保证推断结果的精确度,应采用其中的较大的那 个样本容量。 【例4.4】某县某年城关镇共有居民家庭1.86万户, 根据以往的资料,居民 家庭人均可支配收入的标准差为0.8千元,95%的居民家庭拥有空调。现采用抽样 调查了解今年和明年居民家庭空调以旧换新的需求情况, 若臵信概率为95%,要 求总体居民家庭今年人均可支配收入估计的抽样极限误差不超过0.1千元,空调 拥有率估计的抽样极限误差不超过3%,求合适的样本容量。 解:
【例4.6】某广告公司从某市310万人中采用等比例分层抽样, 调查居民收看某电视广告的收视率,有关资料整理如表4—3。要求 在95%的臵信概率下,估计居民收看某电视广告的收视率的臵信区 间。
3)分层抽样的样本容量 采用等比例分层抽样时,样本容量n的确定与简单随机抽样样 本容量的确定公式基本相同(只需用层内方差的平均值替换总体方 差即可)。样本容量n确定之后,各层应抽取的样本单位数ni可采 用等比例法进行分配,计算公式为 【例4.7】 以例4.6的某县农民家庭户均年收入估计为例,若要 求明年总体户均年收入的抽样标准误差不超过6百元/户,概率保证 程度95%,则等比例分层抽样的样本容量为
3.等距抽样 1)等距抽样的概念 等距抽样是将总体各单位按一定顺序排列,然后每隔N/n个总 体单位抽取一个样本单位组成样本进行调查。等距抽样能使样本十 分均匀地分布在总体中,从而能增加样本的代表性,减少抽样误 差,提高抽样效率。 2)等距抽样的排序方法。 (1)按无关标志排队。即总体单位排列的顺序与所要研究的标 志是无关的。又称无序系统抽样。抽样误差比简单随机抽样小。 (2)按有关标志排队。即总体单位排列的顺序与所要研究的标 志是有直接关系的。又称有序系统抽样,抽样误差比分层抽样小。 3)等距抽样的方法。 (1)随机起点等距抽样。 第一段随机抽,然后等距抽。 (2)半距起点等距随机抽样。中点法抽取样本。 (3)随机起点对称等距抽样。高低搭配称等抽取样本单位。 (4)循环等距抽样。构建循环圆形,然后等距抽。
由于n1>n2,故合适的样本容量为246户。
2.分层抽样
1)分层抽样的意义 是先将总体按有关的研究标志分组,然后在从每组中按随 机原则抽取样本。在每个组中抽取的调查单位的数目,可按 相同的比例(n/N)抽取,也可按不同的比例抽取。为了简便 起见,通常都是按相同比例抽取,称做等比例分层抽样。 在分层抽样时,抽样误差只和层内方差有关,而与层间 方差无关。因此,只要能够扩大层间方差而缩小层内方差, 就可以提高抽样效率。 2) 分层抽样的抽样标准误差。 设 分别为样本各组的单位数、平均数、方差;N 为总体各组的单位数,在等比例分层抽样条件下,则有下列 计算公式。
7.抽样误差与抽样标准误差
抽样误差是指在遵守随机原则条件下,样本指标与总体指标之间的差异,是 一种偶然性的代表性误差,不包括系统性误差和非抽样误差。抽样误差的大小通 常受样本量大小、总体标准差、抽样方法、抽样方式四个因素的影响。 抽样误差的大小常用抽样标准误差来反映,而抽样标准误差是指所有可能的 样本均值(或样本比率)与总体均值(或总体比率)的标准差,抽样标准误差的 平方称为抽样方差。依定义有:
8.点估计与区间估计 点估计也叫定值估计,当样本容量足够大时,可直接用样本均 值代替总体均值,用样本比率代替总体比率,可据此计算有关总量 指标,就是点估计。 区间估计是用一个取值区间及其出现的概率来估计总体参数, 具体说,区间估计是用样本统计量和抽样标准误差来构造总体参数 的取值范围,并用一定的概率来保证总体参数落在估计的区间内。 其概率称为臵信概率,概率的保证程度称为可靠性或臵信(Z), 估计区间称为臵信区间。如 总体均值: 总体比率: 其中:和又称为允许误差或极限误差,记作△,,称为估计的 相对精度。
主要优点: (1) 调查方式的科学性。误差可控、主观影响小。 (2) 调查费用的经济性。调查工作量小、节省费用。 (3) 信息获取的时效性。调查工作量小、节省时间。 (4) 调查结果的准确性。科学的随机抽样能够保证推断的客观性。 主要缺点:抽样技术方案设计要求高,一般人员难以胜任。如果抽样 技术方案设计存在严重的缺陷,往往会导致抽样调查的失败。