第五章 抽样调查
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x 2 N n
n N 1
第四节 抽样误差的测定
3 成数重复抽样误差的计算公式: p(1 p)
式中:
代表成数(相对数)抽样误差 P代表成数(相对数) n代表样本单位数
n
第四节 抽样误差的测定
4 成数不重复抽样误差计算公式:
总体指标和样本指标
总体平均数 定义:总体中所有个体的平均数叫做总 体平均数。 原理:考察的对象中的每一个考察对象的平均 数叫做总体平均数。 总体方差 是一组资料中各数值与其算术平均数离 差平方和的平均数。 总体标准差 是反映研究总体内个体之间差异程度 的一种统计指标 。
(五)总体指标和样本指标 1.总体指标 总体平均数: 总体方差:
第一节 抽样调查介绍
一、抽样调查的含义与特点 (一)抽样调查的含义 抽样调查是指按照一定的程序,从所要调查的 总体中抽取一部分个体作为样本,对样本进行调查, 并在一定条件下运用数理统计的原理和方法对总体 的数量特征进行估计和推断的一种专门性调查活动。 (二)抽样调查的特点 1、经济性好,易广泛应用;2、质量可控,可信 度高;3、时间短,时效性强。 二、抽样调查的适用范围
【小思考4-3】 样本容量是否影响估计的精度,是不是样本容量越大越 好?
答:市场调查中,样本容量的大小直接影响到估计 的精度,增加样本容量回提高估计的精度,但样本 容量的增加会使调查费用增加,样本容量太大,固 然在精度上能完全满足要求,但可能会造成浪费, 因此,不是样本容量越大越好。
小部分的特征
划分小部分的标准
二、非随机抽样 非随机抽样是指抽样时不遵循随机原则,而是按照 调查人员主观设立的某个标准抽选样本。当总体各 单位间离散程度不大,且调查人员具有丰富的调查 经验时,往往采用非随机抽样。非随机抽样方式主 要有三种:方便抽样、判断抽样、配额抽样滚雪球 抽样。 1.方便抽样 2.判断抽样 3.配额抽样 4.滚雪球抽样
(三)分层抽样 1.分层抽样的含义 分层抽样,又称为分类抽样,它是先将总体中的所有单 位按其一定的属性或特征分成相互不重叠的若干层,然后在 每一层中分别抽取样本,最后把各层中抽出的样本合在一起 构成总体的样本的方法。 划分群时,每群的单位数可以相等,也可以不等,在每 一群中的具体抽选方式,既可以采用随机的方式,也可以采 用等距抽样的方式,但不管什么方式,都只能用不重复的抽 样方法。 2.分层抽样程序 3.等比例分层抽样 4.不等比例分层抽样
三、抽样调查的相关概念 (一)总体 总体(population)也称全及总体,指所要认识的研 究对象的全体,它是由所研究范围内具有某种共同性质的全 体单位所组成的集合体。 (二)样本 样本(sample)又称样本总体,它是从全及总体中随 机抽取出来的一部分单位所组成的集合体,也是抽样调查实 际的调查对象。 例如,某市某行业有30万名员工,从中抽取1000名 来进行生活状况的调查。这30万名职工就是总体,被抽选 出来的1000名职工就构成样本。 (三)分析单位 (四)抽样单位和抽样框
p(1 p) n (1 ) n N
【补充阅读资料4-3】 某地区有居民10万户,据年1月份底抽样调查,在 1000户样本中得到空调机家庭普及率为20%, 以此作为全地区居民空调机在1月份底的社会保有 量,即为:100000*20%=20000(台)
(三)抽样成数的抽样平均误差
第五章 抽样调查
培养目标
学习目标: 基本了解:了解抽样调查的含义、特点、适用范围等基本知识; 了解典型随机抽样方法的含义和特点; 了解典型非随机抽样方法的含义和特点; 了解成数抽样误差和平均数抽样误差的含义; 了解点估计和区间估计的含义。 重点掌握: 掌握样本容量的确定方法和步骤; 掌握成数抽样误差和平均数抽样误差的计算; 掌握点估计和区间估计的含义。 技能目标: 能够应用随机抽样方法和非随机抽样方法设计完整的抽样方案; 能够应用数理统计的方法计算样本量并控制误差的大小。
(3)成数指标重复抽样数目的计算公式: (4.9)
t 2 p(1 p) n p 2
4.3.2 抽样数目的确定
(4) 成数指标不重复抽样数目的计算公式:
t 2 Np(1 p) n 式中: Np 2 t 2 p(1 pt )
t p
p
n
:概率 :成数 :成数允许误差 :抽样数目
一、随机抽样 (一)简单随机抽样 对于大小为N的总体,抽取样本量为n的样本, 若全部可能的样本被抽中的概率都相等,则称这样 的抽样为简单随机抽样。 1. 抽选方法 (1)抽签法 (2)随机数表法 2. 优缺点
简单随机抽样的优缺点
这种抽样方法保证总体的每个成员具有已知的且同 等的被选为样本的机会,因此产生的样本都是总体 的一个有效代表。这种方法简单易行,成本低。
X X N
XX N
2
2
总体标准差:
XX N
2
2.样本指标 样本平均数: 2 x x 样本方差: i2
n
x x n
样本标准差:
i
xx n
2
(六)抽样误差
四、抽样调查的程序
第二节 抽样调查的分类
几种调查形式
全面调查是指国家统计系统和各个业务部门为了定 期取得系统的、全面的基本统计资料,按一定的要 求和表式自上而下统一布置,自下而上提供资料的 一种统计调查方法。 重点调查是指对某种社会现象比较集中的、对全局 具有决定性作用的一个或几个单位所进行的调查。 典型的调查就是从调查对象中选择具有代表性的单 位作为典型,并通过对典型的调查来认识同类社会 现象的本质和发展规律方法。
第三节 样本容量的确定
一、影响样本容量的因素 (1)总体中各单位之间标志值的变异程度。 (2)允许误差的大小。 (3)不同的抽样方法也会影响抽样数目的多少 二、必要样本容量的确定 (一)数理统计法 置信区间,又称估计区间,是用来估计参数的取值范围的, 常见的是在52%—64%之间。
(二)经验方法
总体规模 100以下 100~1000 表5-5 经验确定样本量的范围 1000~5000 5000~ 10000 10000~ 100000 100000以上
样本占总体的 比重
50%以上
50%~20%
30%~10%
15%~3%
5%~1%
1%以下
4.3.2 抽样数目的确定 (1) 平均数指标重复抽样数目的计算公式: t 2 2
n
式中:n :样本单位数 2 :总体方差 2 :概率度平方 t 2 :平均数允许误差平方
x
2 x
4.3.2 抽样数目的确定
(2)平均数指标不重复抽样数目的计算公式:
t 2 2 N n 2 2 N 2 t x
式中: 总体单位数
N
4.3.2 抽样数目的确定
第四节 抽样误差的测定
一、抽样误差的概念 由于随机抽样的偶然因素使样本各单位的结构 不足以代表总体各单位的结构,而引起抽样指标和 总体指标之间的绝对离差即抽样误差。 (二)抽样平均数的抽样平均误差 1.重复抽样下抽样平均误差的计算
x
n
2.不重复抽样下抽样平均误差的计算
【例5-3】某地共有居民4万户,按经济收入高低 进行分类,其中高收入居民为8000户,中等收入 居民为24000户,低收入居民有8000户。要从中 抽出800户进行购买力调查,采用等比例分层抽样, 如何抽取?
分析:因为购买力是与家庭的收入水平密切相关的,所以以 收入水平作为分层变量是合适的。按此变量将总体分为高收 入户、中等收入户和低收入户三层。具体的抽样程序如下: 第一步,计算各层在总体中的比例。 高收入户:8000/40000=20%;中等收入户: 24000/40000=60%;低收入户: 8000/40000=20%。 第二步,各层在总体中所占的比例与各层在样本中所占的比 例是一样的。因此,计算样本在各层中的具体分布数目。 高收入户:800*20%=160(户); 中等收入户:800*60%=480(户); 低收入户:800*20%=160(户)。 第三步,在各层中采用等距抽样方法抽取样本单位。
本章目录
一 二
抽样调查介绍
抽样调查的分类 样本容量的确定 抽样误差的测定
3 三
四 二 五
抽样估计的方法
引入
全国电视观众抽样调查抽样方案
本抽样方案采用分层五阶抽样。各阶抽样单元确定为: 第一阶抽样:区(地级市以上城市的市辖区)、县(包括县 级市等); 第二阶抽样:街道、乡、镇; 第三阶抽样:居委会、村委会; 第四阶抽样:家庭户; 第五阶抽样:个人。
(四)整群抽样 1.整群抽样的概念 整群抽样即将总体按照某一标准划分成群,然 后采用随机的方法抽取若干个群,以这些群包含的 所有单位作为样本。例如,某地要了解各校学生的 学习情况,可在该校随机抽取几个班级,对抽中班 级的全部学生进行调查。 2.抽样程序
【例5-4】某校有学生2000名,计划从中 抽160名进行调查。可将学 生宿舍作为抽样单位。假设该校共有学生宿舍250个,每个宿舍住8个 学生。我们可以从250个宿舍中随机抽取20个,其中男生宿舍10个。 女生宿舍10个,对抽中的每个宿舍的所有学生进行调查,这20个宿舍 总共160名学生就是此次抽样调查的样本,见下图。
但这种抽样方法需要预先设定每个总体成员,且需 为每个总体成员提供唯一标志。
(二)等距抽样 1.等距抽样的含义 等距抽样又称为系统抽样或机械抽样。这种方法先将总 体中各单位按某一标志顺序排列,然后每隔一定的间距抽取 样本单位。 2.等距抽样的程序 在排队的基础上,计算抽选距离(间隔),计算公式为: 抽选距离 = N/n 确定抽选距离之后,可以采用简单随机抽样方式,从 第一段距离中抽取第一个单位,为简化工作并防止出现某种 系统性偏差,也可以从距离的1/2处抽取第一个单位,并 按抽选距离继续抽选剩余单位,直到抽完为止。
【例5-2】现有180名学生,要利用等距抽样法从 中抽取15名学生作研究样本,请简述其方法。
其方法如下:先将学生按与学生学习成绩无关的标 志编号,假设按学生座位顺序把学生编为1-180 号,然后按下述步骤抽取:
(1)确定抽样间隔距离k=180/15=12 (2)随机抽取了编号34为起点,即决定从第34 号单位作为第一个样本。先前抽取样本为3412=22号单位;向后抽取样本为34+12=46; 如此类推,抽出的15个样本为: (10),(22),(34),(46),(58), (70),(82),(94)(106),(118), (130),(142),(154),(166), (178)
整群抽样与分层抽样的比较
抽样方法 相似之处 不同之处 具体的抽样方式 wk.baidu.com层抽样 整群抽样
都是将总体划分为更小的部分 以每一类中的 部分单位作 为样本 各层内部差异 小,层之间 的差异大 与研究目的密 切相关 以若干子群体中 的所有单位作 为样本 各子群体内部差 异大,子群体 之间差异小 不能与研究目的 相关
等距抽样的优缺点
优点:等距离抽样与简单随机抽样比较,可使中选单 位比较均匀的分布在全及总体总,尤其当被研究现 象的标志值的变异程度较大,而在实际工作中又不 可能抽选更多的样本单位时,这种方法更为有效。 缺点:运用等距抽样的前提是要有全及总体每个单位 的有关资料,特别是按有关标志排队时,往往要有 较为详细具体的资料,这是一项非常复杂和细致的 工作。 当抽选间隔和被调查对象本身的节奏性相重合时, 就会影响调查的精度。
n N 1
第四节 抽样误差的测定
3 成数重复抽样误差的计算公式: p(1 p)
式中:
代表成数(相对数)抽样误差 P代表成数(相对数) n代表样本单位数
n
第四节 抽样误差的测定
4 成数不重复抽样误差计算公式:
总体指标和样本指标
总体平均数 定义:总体中所有个体的平均数叫做总 体平均数。 原理:考察的对象中的每一个考察对象的平均 数叫做总体平均数。 总体方差 是一组资料中各数值与其算术平均数离 差平方和的平均数。 总体标准差 是反映研究总体内个体之间差异程度 的一种统计指标 。
(五)总体指标和样本指标 1.总体指标 总体平均数: 总体方差:
第一节 抽样调查介绍
一、抽样调查的含义与特点 (一)抽样调查的含义 抽样调查是指按照一定的程序,从所要调查的 总体中抽取一部分个体作为样本,对样本进行调查, 并在一定条件下运用数理统计的原理和方法对总体 的数量特征进行估计和推断的一种专门性调查活动。 (二)抽样调查的特点 1、经济性好,易广泛应用;2、质量可控,可信 度高;3、时间短,时效性强。 二、抽样调查的适用范围
【小思考4-3】 样本容量是否影响估计的精度,是不是样本容量越大越 好?
答:市场调查中,样本容量的大小直接影响到估计 的精度,增加样本容量回提高估计的精度,但样本 容量的增加会使调查费用增加,样本容量太大,固 然在精度上能完全满足要求,但可能会造成浪费, 因此,不是样本容量越大越好。
小部分的特征
划分小部分的标准
二、非随机抽样 非随机抽样是指抽样时不遵循随机原则,而是按照 调查人员主观设立的某个标准抽选样本。当总体各 单位间离散程度不大,且调查人员具有丰富的调查 经验时,往往采用非随机抽样。非随机抽样方式主 要有三种:方便抽样、判断抽样、配额抽样滚雪球 抽样。 1.方便抽样 2.判断抽样 3.配额抽样 4.滚雪球抽样
(三)分层抽样 1.分层抽样的含义 分层抽样,又称为分类抽样,它是先将总体中的所有单 位按其一定的属性或特征分成相互不重叠的若干层,然后在 每一层中分别抽取样本,最后把各层中抽出的样本合在一起 构成总体的样本的方法。 划分群时,每群的单位数可以相等,也可以不等,在每 一群中的具体抽选方式,既可以采用随机的方式,也可以采 用等距抽样的方式,但不管什么方式,都只能用不重复的抽 样方法。 2.分层抽样程序 3.等比例分层抽样 4.不等比例分层抽样
三、抽样调查的相关概念 (一)总体 总体(population)也称全及总体,指所要认识的研 究对象的全体,它是由所研究范围内具有某种共同性质的全 体单位所组成的集合体。 (二)样本 样本(sample)又称样本总体,它是从全及总体中随 机抽取出来的一部分单位所组成的集合体,也是抽样调查实 际的调查对象。 例如,某市某行业有30万名员工,从中抽取1000名 来进行生活状况的调查。这30万名职工就是总体,被抽选 出来的1000名职工就构成样本。 (三)分析单位 (四)抽样单位和抽样框
p(1 p) n (1 ) n N
【补充阅读资料4-3】 某地区有居民10万户,据年1月份底抽样调查,在 1000户样本中得到空调机家庭普及率为20%, 以此作为全地区居民空调机在1月份底的社会保有 量,即为:100000*20%=20000(台)
(三)抽样成数的抽样平均误差
第五章 抽样调查
培养目标
学习目标: 基本了解:了解抽样调查的含义、特点、适用范围等基本知识; 了解典型随机抽样方法的含义和特点; 了解典型非随机抽样方法的含义和特点; 了解成数抽样误差和平均数抽样误差的含义; 了解点估计和区间估计的含义。 重点掌握: 掌握样本容量的确定方法和步骤; 掌握成数抽样误差和平均数抽样误差的计算; 掌握点估计和区间估计的含义。 技能目标: 能够应用随机抽样方法和非随机抽样方法设计完整的抽样方案; 能够应用数理统计的方法计算样本量并控制误差的大小。
(3)成数指标重复抽样数目的计算公式: (4.9)
t 2 p(1 p) n p 2
4.3.2 抽样数目的确定
(4) 成数指标不重复抽样数目的计算公式:
t 2 Np(1 p) n 式中: Np 2 t 2 p(1 pt )
t p
p
n
:概率 :成数 :成数允许误差 :抽样数目
一、随机抽样 (一)简单随机抽样 对于大小为N的总体,抽取样本量为n的样本, 若全部可能的样本被抽中的概率都相等,则称这样 的抽样为简单随机抽样。 1. 抽选方法 (1)抽签法 (2)随机数表法 2. 优缺点
简单随机抽样的优缺点
这种抽样方法保证总体的每个成员具有已知的且同 等的被选为样本的机会,因此产生的样本都是总体 的一个有效代表。这种方法简单易行,成本低。
X X N
XX N
2
2
总体标准差:
XX N
2
2.样本指标 样本平均数: 2 x x 样本方差: i2
n
x x n
样本标准差:
i
xx n
2
(六)抽样误差
四、抽样调查的程序
第二节 抽样调查的分类
几种调查形式
全面调查是指国家统计系统和各个业务部门为了定 期取得系统的、全面的基本统计资料,按一定的要 求和表式自上而下统一布置,自下而上提供资料的 一种统计调查方法。 重点调查是指对某种社会现象比较集中的、对全局 具有决定性作用的一个或几个单位所进行的调查。 典型的调查就是从调查对象中选择具有代表性的单 位作为典型,并通过对典型的调查来认识同类社会 现象的本质和发展规律方法。
第三节 样本容量的确定
一、影响样本容量的因素 (1)总体中各单位之间标志值的变异程度。 (2)允许误差的大小。 (3)不同的抽样方法也会影响抽样数目的多少 二、必要样本容量的确定 (一)数理统计法 置信区间,又称估计区间,是用来估计参数的取值范围的, 常见的是在52%—64%之间。
(二)经验方法
总体规模 100以下 100~1000 表5-5 经验确定样本量的范围 1000~5000 5000~ 10000 10000~ 100000 100000以上
样本占总体的 比重
50%以上
50%~20%
30%~10%
15%~3%
5%~1%
1%以下
4.3.2 抽样数目的确定 (1) 平均数指标重复抽样数目的计算公式: t 2 2
n
式中:n :样本单位数 2 :总体方差 2 :概率度平方 t 2 :平均数允许误差平方
x
2 x
4.3.2 抽样数目的确定
(2)平均数指标不重复抽样数目的计算公式:
t 2 2 N n 2 2 N 2 t x
式中: 总体单位数
N
4.3.2 抽样数目的确定
第四节 抽样误差的测定
一、抽样误差的概念 由于随机抽样的偶然因素使样本各单位的结构 不足以代表总体各单位的结构,而引起抽样指标和 总体指标之间的绝对离差即抽样误差。 (二)抽样平均数的抽样平均误差 1.重复抽样下抽样平均误差的计算
x
n
2.不重复抽样下抽样平均误差的计算
【例5-3】某地共有居民4万户,按经济收入高低 进行分类,其中高收入居民为8000户,中等收入 居民为24000户,低收入居民有8000户。要从中 抽出800户进行购买力调查,采用等比例分层抽样, 如何抽取?
分析:因为购买力是与家庭的收入水平密切相关的,所以以 收入水平作为分层变量是合适的。按此变量将总体分为高收 入户、中等收入户和低收入户三层。具体的抽样程序如下: 第一步,计算各层在总体中的比例。 高收入户:8000/40000=20%;中等收入户: 24000/40000=60%;低收入户: 8000/40000=20%。 第二步,各层在总体中所占的比例与各层在样本中所占的比 例是一样的。因此,计算样本在各层中的具体分布数目。 高收入户:800*20%=160(户); 中等收入户:800*60%=480(户); 低收入户:800*20%=160(户)。 第三步,在各层中采用等距抽样方法抽取样本单位。
本章目录
一 二
抽样调查介绍
抽样调查的分类 样本容量的确定 抽样误差的测定
3 三
四 二 五
抽样估计的方法
引入
全国电视观众抽样调查抽样方案
本抽样方案采用分层五阶抽样。各阶抽样单元确定为: 第一阶抽样:区(地级市以上城市的市辖区)、县(包括县 级市等); 第二阶抽样:街道、乡、镇; 第三阶抽样:居委会、村委会; 第四阶抽样:家庭户; 第五阶抽样:个人。
(四)整群抽样 1.整群抽样的概念 整群抽样即将总体按照某一标准划分成群,然 后采用随机的方法抽取若干个群,以这些群包含的 所有单位作为样本。例如,某地要了解各校学生的 学习情况,可在该校随机抽取几个班级,对抽中班 级的全部学生进行调查。 2.抽样程序
【例5-4】某校有学生2000名,计划从中 抽160名进行调查。可将学 生宿舍作为抽样单位。假设该校共有学生宿舍250个,每个宿舍住8个 学生。我们可以从250个宿舍中随机抽取20个,其中男生宿舍10个。 女生宿舍10个,对抽中的每个宿舍的所有学生进行调查,这20个宿舍 总共160名学生就是此次抽样调查的样本,见下图。
但这种抽样方法需要预先设定每个总体成员,且需 为每个总体成员提供唯一标志。
(二)等距抽样 1.等距抽样的含义 等距抽样又称为系统抽样或机械抽样。这种方法先将总 体中各单位按某一标志顺序排列,然后每隔一定的间距抽取 样本单位。 2.等距抽样的程序 在排队的基础上,计算抽选距离(间隔),计算公式为: 抽选距离 = N/n 确定抽选距离之后,可以采用简单随机抽样方式,从 第一段距离中抽取第一个单位,为简化工作并防止出现某种 系统性偏差,也可以从距离的1/2处抽取第一个单位,并 按抽选距离继续抽选剩余单位,直到抽完为止。
【例5-2】现有180名学生,要利用等距抽样法从 中抽取15名学生作研究样本,请简述其方法。
其方法如下:先将学生按与学生学习成绩无关的标 志编号,假设按学生座位顺序把学生编为1-180 号,然后按下述步骤抽取:
(1)确定抽样间隔距离k=180/15=12 (2)随机抽取了编号34为起点,即决定从第34 号单位作为第一个样本。先前抽取样本为3412=22号单位;向后抽取样本为34+12=46; 如此类推,抽出的15个样本为: (10),(22),(34),(46),(58), (70),(82),(94)(106),(118), (130),(142),(154),(166), (178)
整群抽样与分层抽样的比较
抽样方法 相似之处 不同之处 具体的抽样方式 wk.baidu.com层抽样 整群抽样
都是将总体划分为更小的部分 以每一类中的 部分单位作 为样本 各层内部差异 小,层之间 的差异大 与研究目的密 切相关 以若干子群体中 的所有单位作 为样本 各子群体内部差 异大,子群体 之间差异小 不能与研究目的 相关
等距抽样的优缺点
优点:等距离抽样与简单随机抽样比较,可使中选单 位比较均匀的分布在全及总体总,尤其当被研究现 象的标志值的变异程度较大,而在实际工作中又不 可能抽选更多的样本单位时,这种方法更为有效。 缺点:运用等距抽样的前提是要有全及总体每个单位 的有关资料,特别是按有关标志排队时,往往要有 较为详细具体的资料,这是一项非常复杂和细致的 工作。 当抽选间隔和被调查对象本身的节奏性相重合时, 就会影响调查的精度。