统计学原理第七章抽样调查ppt课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
18
※ 四、抽样平均误差的计算
►(一)抽样平均数的抽样平均误差μx ►是变量总体一系列抽样平均数对总体平均数
的标准差。其理论计算公式:
平均数 抽样平 均误差
(X x)2
x
K
样本平均 数(随机 变量)
14
第二节 抽样平均误差
一、抽样平均误差的概念 二、影响抽样平均误差的因素 三、抽样平均误差的意义 四、抽样平均误差的计算※
15
一、抽样平均误差的概念
►(一)抽样误差 ►是指样本指标和总体指标之间在数量上的差
别,是随机性的代表性误差。是抽样推断的 依据,不包括登记误差和可能产生的偏差。 ►※(二)抽样平均误差 ►是指所有可能出现的样本指标的标准差,即 所有可能出现的样本指标和总体指标的平均 离差。抽样实际误差无法知道,而平均误差 是可能计算的。
►3. 考虑顺序抽样:即考虑总体单位的性质, 还考虑各单位排序的抽样。
►4. 不考虑顺序抽样:只考虑总体单位的性质 差异,而不考虑其排序的抽样。
9
(二)样本可能数目 ►是指从既定的总体中可以抽取多少个样本,
即样本总体的数量有多少。 ►1. 考虑顺序的不重复抽样可能数目 ►即不重复排列的可能样本数目。计算公式:
17
三、抽样平均误差的意义
►抽样平均误差是一种标准差的概念,是所有 可能样本指标与总体指标之间离差平方的平 均数的平方根。它概括了一系列抽样可能结 果所产生的所有抽样误差。它有三点意义:
►1. μ是衡量抽样指标对于总体指标代表性程 度的一个尺度;
►2. μ是计算极限误差的依据; ►3. μ是确定抽样单位数多少的计算依据之一
►1. 总体平均数:根据变量总体的标志值
计算的。 X X
Nຫໍສະໝຸດ Baidu
5
2. 总体成数(总体比例):常用“P”表示 ►是指总体中具有某种标志的单位数在总体中
所占的比重。变量总体也可以计算成数。
总体 成数
P N1 N
具有某种属性的单位数 总体单位总数
不具有某种属性的单位数
不具有某种属 性的单位数所
占的比重
C N nN (N 1 )N ( n 2 )! (N n 1 )
C N n15 0 4 9 3 8 2 7 1 631022 02 45 02
11
4. 不考虑顺序的重复抽样可能数目 ►即可重复组合。计算公式: DNn=CnN+n-1
►对于同一总体,采用四种不同的抽样组织形 式,其样本可能数目也是不同的。按样本可 能数目的多少排序依次是:考虑顺序的重复 抽样>考虑顺序的不重复抽样>不考虑顺序 的重复抽样>不考虑顺序的不重复抽样
12
五、抽样理论依据
►抽样调查的理论依据是概率论的大数定律。 ►(一)大数定律 ►1. 独立同分布大数定律:证明当n足够大时,
平均数具有稳定性,为用样本平均数估计总 体平均数提供了理论依据。
►2. 贝努力大数定律:证明当n足够大时,频 率具有稳定性,为用频率代替概率提供了理 论依据。大数的重要意义P253
►2. 抽样总体(样本):是从全及总体中随机 抽取出来一部分单位的集合体。有大样本和 小样本之分,以30个样本单位为划分依据。
►样本总体是随机的、已知的,常用“n”表示。
4
三、全及指标和样本指标
►(一) 全及指标 ►根据全体总体各个单位的标志值或标志
特征计算的、反映总体某种属性的综合 指标。全及指标也是惟一确定的,但也 是未知的。
A N nN (N 1 )N (2) (N n 1 )(N N n !)!
设:N=10,n=5,则: ANn =10×9×8×7×6=30240个可能样本数目
10
2. 考虑顺序的重复抽样可能数目 ►即可重复排列的可能样本数目。公式: ►BNn=Nn =105 =100000个可能样本数目 ►3. 不考虑顺序的不重复抽样可能数目 ►即不重复组合。计算公式:
xx
n
2. 样本成数数:
p n1 n
3. 样本标准差 qn0 nn11p
和样本方差:
nn
(xx)2 2 (xx)2
n
n
8
四、抽样方式和样本可能数目
►(一)抽样方式
►1. 重复抽样(放回抽样):从总体N中随机 抽取n个单位,每次抽取均为独立试验。
►2. 不重复抽样(不放回抽样):每次抽中的 单位不再放回总体中,为不独立试验。
16
二、影响抽样平均误差的因素
►(一)总体标志的变动程度(σx ) ►总体标志的变动程度与抽样平均误差μ成同
向变动关系。 ►(二)抽样单位数(n)的多少 ►在其他条件不变的情况下,抽样单位数与抽
样平均误差μ成反向变动关系。 ►(三)抽样组织方式 ►重复抽样方式的μ高于不重复抽样,分类抽
样的μ低于机械抽样或整群抽样。
►2. 估计值:是指估计量的具体数值。根据具 体样本数据,按照估计量的计算公式,计算 出的样本均值、样本比例和样本方差的具体 数值就是估计值。是抽样推断的基础。
3
二、全及总体和抽样总体
►1. 全及总体(总体):是指所要认识对象的 全体,是同一性质的许多个体的集合体。有 变量总体与属性总体之分,全及总体是惟一 的、确定的但却是未知的,常用“N”表示。
13
(二)中心极限定律 ►1. 独立同分布中心极限定理:证明不论变量
总体服从何种分布,只要它的数学期望和方 差存在,从中抽取容量为n 的样本,则这个 样本的总和或平均数是个随机变量,当n 充 分大时,样本的总和或平均数趋于正态分布. ►2. 德莫佛-拉普拉斯中心极限定理:证明属性 总体的样本成数和样本方差,在n足够大时, 同样趋于正态分布。
第七章 抽样调查
1
第一节 抽样调查的基本概念 及理论依据
一、估计量和估计值 二、全及总体和抽样总体 三、全及指标和样本指标 四、抽样方式和样本可能数目 五、抽样理论依据
2
一、估计量和估计值
►1. 估计量:是指用于估计相关的总体参数的 统计量。样本均值、样本比例(样本成数) 和样本方差都是估计量,估计量是随机的。
QN0 NN11P NN
6
3. 总体标准差σ和总体方差σ2 ►都是测量总体标志值分散程度的指标。
(XX)2 2 (XX)2
N
N
►(二)抽样指标
►是指根据抽样总体各个标志值或标志特征计
算的综合指标。与全及指标相对应也有抽样
平均数、抽样成数、样本标准差和样本方差
等估计量。抽样指标是随机的。
7
1. 样本平均数:
※ 四、抽样平均误差的计算
►(一)抽样平均数的抽样平均误差μx ►是变量总体一系列抽样平均数对总体平均数
的标准差。其理论计算公式:
平均数 抽样平 均误差
(X x)2
x
K
样本平均 数(随机 变量)
14
第二节 抽样平均误差
一、抽样平均误差的概念 二、影响抽样平均误差的因素 三、抽样平均误差的意义 四、抽样平均误差的计算※
15
一、抽样平均误差的概念
►(一)抽样误差 ►是指样本指标和总体指标之间在数量上的差
别,是随机性的代表性误差。是抽样推断的 依据,不包括登记误差和可能产生的偏差。 ►※(二)抽样平均误差 ►是指所有可能出现的样本指标的标准差,即 所有可能出现的样本指标和总体指标的平均 离差。抽样实际误差无法知道,而平均误差 是可能计算的。
►3. 考虑顺序抽样:即考虑总体单位的性质, 还考虑各单位排序的抽样。
►4. 不考虑顺序抽样:只考虑总体单位的性质 差异,而不考虑其排序的抽样。
9
(二)样本可能数目 ►是指从既定的总体中可以抽取多少个样本,
即样本总体的数量有多少。 ►1. 考虑顺序的不重复抽样可能数目 ►即不重复排列的可能样本数目。计算公式:
17
三、抽样平均误差的意义
►抽样平均误差是一种标准差的概念,是所有 可能样本指标与总体指标之间离差平方的平 均数的平方根。它概括了一系列抽样可能结 果所产生的所有抽样误差。它有三点意义:
►1. μ是衡量抽样指标对于总体指标代表性程 度的一个尺度;
►2. μ是计算极限误差的依据; ►3. μ是确定抽样单位数多少的计算依据之一
►1. 总体平均数:根据变量总体的标志值
计算的。 X X
Nຫໍສະໝຸດ Baidu
5
2. 总体成数(总体比例):常用“P”表示 ►是指总体中具有某种标志的单位数在总体中
所占的比重。变量总体也可以计算成数。
总体 成数
P N1 N
具有某种属性的单位数 总体单位总数
不具有某种属性的单位数
不具有某种属 性的单位数所
占的比重
C N nN (N 1 )N ( n 2 )! (N n 1 )
C N n15 0 4 9 3 8 2 7 1 631022 02 45 02
11
4. 不考虑顺序的重复抽样可能数目 ►即可重复组合。计算公式: DNn=CnN+n-1
►对于同一总体,采用四种不同的抽样组织形 式,其样本可能数目也是不同的。按样本可 能数目的多少排序依次是:考虑顺序的重复 抽样>考虑顺序的不重复抽样>不考虑顺序 的重复抽样>不考虑顺序的不重复抽样
12
五、抽样理论依据
►抽样调查的理论依据是概率论的大数定律。 ►(一)大数定律 ►1. 独立同分布大数定律:证明当n足够大时,
平均数具有稳定性,为用样本平均数估计总 体平均数提供了理论依据。
►2. 贝努力大数定律:证明当n足够大时,频 率具有稳定性,为用频率代替概率提供了理 论依据。大数的重要意义P253
►2. 抽样总体(样本):是从全及总体中随机 抽取出来一部分单位的集合体。有大样本和 小样本之分,以30个样本单位为划分依据。
►样本总体是随机的、已知的,常用“n”表示。
4
三、全及指标和样本指标
►(一) 全及指标 ►根据全体总体各个单位的标志值或标志
特征计算的、反映总体某种属性的综合 指标。全及指标也是惟一确定的,但也 是未知的。
A N nN (N 1 )N (2) (N n 1 )(N N n !)!
设:N=10,n=5,则: ANn =10×9×8×7×6=30240个可能样本数目
10
2. 考虑顺序的重复抽样可能数目 ►即可重复排列的可能样本数目。公式: ►BNn=Nn =105 =100000个可能样本数目 ►3. 不考虑顺序的不重复抽样可能数目 ►即不重复组合。计算公式:
xx
n
2. 样本成数数:
p n1 n
3. 样本标准差 qn0 nn11p
和样本方差:
nn
(xx)2 2 (xx)2
n
n
8
四、抽样方式和样本可能数目
►(一)抽样方式
►1. 重复抽样(放回抽样):从总体N中随机 抽取n个单位,每次抽取均为独立试验。
►2. 不重复抽样(不放回抽样):每次抽中的 单位不再放回总体中,为不独立试验。
16
二、影响抽样平均误差的因素
►(一)总体标志的变动程度(σx ) ►总体标志的变动程度与抽样平均误差μ成同
向变动关系。 ►(二)抽样单位数(n)的多少 ►在其他条件不变的情况下,抽样单位数与抽
样平均误差μ成反向变动关系。 ►(三)抽样组织方式 ►重复抽样方式的μ高于不重复抽样,分类抽
样的μ低于机械抽样或整群抽样。
►2. 估计值:是指估计量的具体数值。根据具 体样本数据,按照估计量的计算公式,计算 出的样本均值、样本比例和样本方差的具体 数值就是估计值。是抽样推断的基础。
3
二、全及总体和抽样总体
►1. 全及总体(总体):是指所要认识对象的 全体,是同一性质的许多个体的集合体。有 变量总体与属性总体之分,全及总体是惟一 的、确定的但却是未知的,常用“N”表示。
13
(二)中心极限定律 ►1. 独立同分布中心极限定理:证明不论变量
总体服从何种分布,只要它的数学期望和方 差存在,从中抽取容量为n 的样本,则这个 样本的总和或平均数是个随机变量,当n 充 分大时,样本的总和或平均数趋于正态分布. ►2. 德莫佛-拉普拉斯中心极限定理:证明属性 总体的样本成数和样本方差,在n足够大时, 同样趋于正态分布。
第七章 抽样调查
1
第一节 抽样调查的基本概念 及理论依据
一、估计量和估计值 二、全及总体和抽样总体 三、全及指标和样本指标 四、抽样方式和样本可能数目 五、抽样理论依据
2
一、估计量和估计值
►1. 估计量:是指用于估计相关的总体参数的 统计量。样本均值、样本比例(样本成数) 和样本方差都是估计量,估计量是随机的。
QN0 NN11P NN
6
3. 总体标准差σ和总体方差σ2 ►都是测量总体标志值分散程度的指标。
(XX)2 2 (XX)2
N
N
►(二)抽样指标
►是指根据抽样总体各个标志值或标志特征计
算的综合指标。与全及指标相对应也有抽样
平均数、抽样成数、样本标准差和样本方差
等估计量。抽样指标是随机的。
7
1. 样本平均数: