分层随机抽样及其excel分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

课程设计任务书

案例:某公司要估计某地家用电器的潜在用户。这种商品的消费同居民收入水平相关,因而以家庭年收入为分层基础。假定某地居民为1,000,000户,已确定样本数为1,000户,家庭年收入分10,000元以下,10,000——30,000元;30,000——60,000元,60,000元以上四层,其中收入在10,000元以下家庭户为180,000户,收入在10,000——30,000元家庭户为350,000户,收入在30,000——60,000元家庭户为3000,000户,收入在60,000元以下家庭户为170,000户,若采取分层比例抽样法,如何抽样?

下面针对案例对分层随机抽样进行大致说明。

一.分层随机抽样定义:

分层抽样也称类型抽样或分类抽样,就是将总体单位按一定标准(调研对象的属性、特征等)分组,然后在各个类型组中用纯随机抽样方式或其他抽样方式抽取样本单位,而不是在总体中直接抽取样本单位。

二.注意事项:

分层抽样必须注意以下问题:第一,必须有清楚的分层界限,在划分时不致发生混淆;第二,必须知道各层中的单位数目和比例;第三,分层的数目不宜太多,否则将失去分层的特征,不便在每层中抽样。

三.分层抽样步骤:

分层抽样的步骤包括:

(1)确认目标总体。

(2)决定样本数。

(3)决定分层标志。

(4)将总体按照分层标志分成若干类,其中每一类称为一层。

(5)在每一层中随机抽取出足够的样本。

四.具体做法及例子说明:

分层抽样的具体做法有以下两种:

1.等比例分层抽样。这种抽样法就是按照各层中样本单位的数目占总体单位数目的比例分配各层的样本数量。

[例]某教授对甲大学的学生消费倾向产生了兴趣,想对全校学生做抽样调查,总体有5 000人,欲抽样500人,则:

总体样本

一年级 2 000人一年级200人

二年级 1 500人二年级150人

三年级 1 000人三年级100人

四年级500人四年级50人

2.不等比例分层抽样,又称分层最佳抽样。这种抽样法不按各层中样本单位数占总体单位数的比例分配各层样本数,而是根据各层的标准差的大小来调整各层样本数目。该方法既考虑了各层在总体中所占比重的大小,又考虑了各层标准差的差异程度,有利于降低各层的差异,以提高样本的可信程度,故也可将不等比例分层抽样称为分层信任程度抽样。[例]某公司要调研某地家用电器产品的潜在用户,这种产品的消费同居民收入水平有关,因

此以家庭收入为分层基础。假定该地居民户即总体单位数为20 000户,已确定调研样本数为200户。家庭收入分高、中、低三层,其中高档收入家庭为2 000户,占总体单位数的比重为10%;中等收入家庭为6 000户,占总体单位数的30%;低等收入家庭为12 000户,占总体单位数的60%。现又假定各层样本标准差为:高档收入家庭是300元,中等收入家庭是200元,低等收入家庭是50元。现要求根据分层最佳抽样法,确定各收入层家庭应抽取的户数各为多少? 公式n Si Ni Si Ni ⨯⨯⨯∑

Ni 为i 层调查单位总数;ni 为i 层应抽的样本数目;si 为i 层调查单位标准差

为了便于观察,列表1如下。

表1 调研单位数与样本标准差乘积计算表

家庭收入分层 各层调研单位数

(潜在用户数) 各层的样本标准差 乘积 样本单位数

高 2 000 300 600 000 200×600 000÷2 400 000=50

中 6 000 200 1 200 000 200×1200000÷2400 000=100

低 12 000 50 600 000 200×600 000÷2 400 000=50

合计20 000 — 2 400 000 —

如果根据等比例分层抽样的话,那么,高档收入家庭的分层样本数为20户(200×10%);中等收入家庭的分层样本数为60户(200×30%);低等收入家庭的分层样本数为120户(200 ×60%)。将前后两种方法抽取的各层样本数做个对比,不难看出,相比于等比例分层抽样法,根据分层最佳抽样法抽取样本,则高档收入家庭的分层样本数增加了30户,中等收入家庭的分层样本数增加了40户;低等收入家庭的分层样本数则减少了70户。由于购买家用电器同家庭收入水平是成正比例变动的,所以,增加高、中档层的样本数,相应减少低档层的样本数,将有利于提高抽样的准确性。

对案例开始进行分析:

由上述可知该案例中应采取不等比例抽样。

由公式可以求出:

收入在10000以下的家庭户的样本量应为(180000/1000000)*1000=180.

收入在10000—30000的家庭户的样本量应为(350000/1000000)*1000=350.

收入在30000—60000的家庭户的样本量应为(3000000/1000000)*1000=300.

收入在60000以上的家庭户的样本量应为(170000/1000000)*1000=170.

其分层比例抽样示意图如下所示:

分层比例抽样示意图总体

子样本样本

N 1000000

N1180000 N2 350000 N3300000 N4170000 n1180 n2350 n3300 n4170

n 1000

案例的excel实现过程:

因为在excel中,抽样功能是作为一种扩展功能存在的,所以在应用时就应该先加载分析工具库。

点击工具,选择加载宏,再选择分析工具库。

单击“工具”菜单,再选择“数据分析”选项,打开“数据分析”对话框,从中选择“抽样”。单击“抽样”选项,弹出“抽样”对话框。

相关文档
最新文档