抽样的基本概念,3
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§ 2 抽样调查中的几个基本概念
一.总体与样本 1.总体是指由调查对象的全部单位所构成的集合体.也称为 全及总体. 例如:要调查某城市居民的年龄结构、受教育程度,则 该市的全体市民就构成一个总体。又如,要调查某区所有职 总体容量,记为N 工家庭收入情况,则该区全部职工家庭便构成一个总体。 有限总体:总体中所包含的单位数目是有限的。如:一个地 区的人口,一个企业的年产量等。 无限总体:总体中所包含的单位数目是无限的。如:湖泊海 洋中的鱼尾数,森林中的树的棵数等。
是一个确定的量! 二.总体指标与样本指标
原因:总体是唯 一确定的!
1、总体指标:根据总体中各单位的标志值计算出来的用于反 映总体的数量特征的指标。又称为全及指标或总体参数。 如:一批灯泡的平均使用寿命;一个城市职工家庭的年平均 收入等等都是总体指标。 常用的总体指标有: 1 N ①总体平均数(总体均值):Y Yi N —总体容量 N i 1 N0 N1 , Q 1 P Yi —个体标志值 ②总体比例: P N N N 1 2 2 N 1 —总体中具有 ( Y Y ) ③总体方差: i
N
1 N
④总体标准差:
i 1 N
⑤总体总量指标: Y Yi
i 1
i 1 N
2 ( Y Y ) i
某种特性个 体数目
N 0 —总体中不具
有某种特性 个体数目
2、样本指标:根据样本中各单位的标志值计算出来的用于反 原因:样本是在 总体中随机抽取 映样本数量特征的指标称为样本指标,也称样本参数。
多阶段随机抽样是将一次抽样后得到的样本当作总体再 次进行随机抽样,得到第二次抽样样本,然后再如此进行下 去的抽样方式。 例如:我国农产量调查就采用五阶段抽样方式。省抽县、县 抽乡、乡抽村、村抽地块、地块抽样本点,对样本点进行实 割实测的调查方法。 另外还有二重抽样法、比估计法、回归估计等
二.样本单位的抽选方法 在组织抽样调查时,根据样本单位是否重复抽取,分别 有重复抽样和不重复抽样两种方法。 1、重复抽样
⑤样本标志总量: y yi
i 1 n
n0 —样本中不具
来自百度文库有某种特性 个体数目
样本指标是不确定的,它的取值随样本的变化而变化,是一 个随机变量,样本指标也称为统计量。
§ 3 抽样调查的组织形式及调查方法
随着抽样技术的发展,抽样调查的组织形式也越来越多 样化。在实际应用中,为提高抽样效果,需要根据调查的任 务和条查对象的具体情况,采用不同的抽样方式和调查方法 以便使抽出的样本能充分地反映总体,并便于组织实施、节 省人力物力和时间。 一.抽样调查的几种组织形式
2、无顺序重复抽样样本种数 设从a,b,c,d 4单位中按无顺序重复抽样方式每次抽取2 个单位构成样本,则所有不同的样本为: aa , ab , ac ,ad bb , bc ,bd cc ,cd dd 在上述抽选中,总体中每个单位都可重复抽选一次,故 相当于总体中增加一个单位。所以,配合种数为: 5 4 2 2 C4 21 C5 10 2 一般地,总体容量为N,样本容量为n。采用有顺序重复 抽样时,相当于总体中增加到 N+n-1个单位,故样本配合种 ( N n 1)! 数为: n
1.简单随机抽样
简单随机抽样是一种对总体的每个单位(个体)都不加 任何限制的抽样。在总体中不作任何分组、划类、排队等, 完全随机地抽取调查单位。
2.系统随机抽样 系统随机抽样又称为机械随机抽样或等距随机抽样。它 是先将总体中各单位按一定的标志排队,然后每隔一定的距 离抽取一个总体单位(个体)的抽样方式。 例如:从100人中抽取10人构成样本,先将100人排队编号, 然后在1~10号之间随机抽取一个数字,比如抽到3,那么编 号为 3,13,23,33,43,53,63,73,83,93的10个人组 成样本。
样本中所含单位的数目称为样本容量,记为 n . 样本容量相对于总体容量一般是很小的,即 N是个很 小的数,往往是百分之几或千分之几,最大也不超过1/3。但 当总体容量N很大时,样本容量n本身也必须足够的大,这样 才能保证样本对总体的代表性。
n
n 30时,称为小样本。 一般 n 30时,称为大样本;
3.分层随机抽样 分层随机抽样是按照某一标志先将总体分成若干组 (类),其中每一组称为一层,然后在每一层内按照简单 随机抽样方式进行抽样的抽样方式。
例如:将工业企业划分为冶金、电力、石油化工、煤炭、机 械、电子等部门,每个部门中进行简单随机抽样调查。
4.整群随机抽样 整群随机抽样是先将总体按某一标志分成若干组,每一 组称为一个群,以群为单位进行简单随机抽样,然后对抽到 的群进行全面调查的抽样方式。 例如:了解某地区职工家庭生活状况时,按居委会分群,然 后对抽到的群(居委会)所辖每户职工家庭进行调查登记。 5.多阶段随机抽样
的!样本不同样 常用的样本指标有: 本指标也不同
是一个随机变量!
1 n ①样本平均数(样本均值): y yi n i 1 n0 n1 , q 1 p ②样本成数: p n n n
2
n —样本容量
yi —个体标志值
n1 —样本中具有
某种特性个 体数目
1 2 ( yi y ) ③样本方差: s n 1 i 1 n 1 2 ④样本标准差:s ( y y ) i n 1 i 1
n N ( N 1) ( N n 1) N ! A n CN N 1 2 n n ! ( N n)! n !
2、不重复抽样 不重复抽样是指每次从总体中抽取一个单位进行观察后 不再把这个单位重新放回总体,这个总体单位不再继续参加 下次抽选。这种抽选法也称为不回置抽样或不重置抽样。
不重复抽样法由于每次抽中的单位不再放回总体中,每 抽选一次,总体中的单位就减少一个,使连续抽选的各个单 位不相互独立。但是总体中各单位被抽中的机会仍然是均等 的! 不重复抽样按是否考虑抽选样本单位的顺序,又可分为 有顺序不重复抽样和无顺序不重复抽样两种。有顺序不重复 抽样即通常所说的不重复排列。按这种抽样方法只要有一个 单位不同,就算不同的样本。 无顺序不重复抽样即通常所说的不重复组合。按这种抽 样方法,不考虑抽样次序,只要所有的单位相同,不论抽选 次序如何都作为同一样本。
三.样本配合种数
采用不同的抽样方法从同一总体中抽选容量相同的样本 其样本配合种数是不同的。
1、有顺序重复抽样样本种数
设总体容量为N,样本容量为n。采用有顺序重复抽样时, 各个样本单位是独立选取的,每个样本单位都有N个选法,所 以,抽选包含n个样本单位的样本配合种数为:
n n BN NN
N Nn
重复抽样是指每次从总体中抽取一个单位进行观察后, 再把这个单位重新放回总体,使之继续参加下次抽选。
重复抽样法由于前一次抽中的单位又被放回总体中,不 会影响后面的抽选,所以总体中每个单位被抽中的机会均等 连续抽选各单位都是独立进行的的。 *重复抽样按是否考虑抽选样本单位的顺序,又可分为有 顺序重复抽样和无顺序重复抽样两种。有顺序重复抽样即通 常所说的可重复的排列。这种抽样方法要考虑不同单位的中 选顺序。样本中单位构成相同而中选次序不同则为不同样本
C N n1
n ! ( N 1)!
3、有顺序不重复抽样样本种数
有顺序不重复抽样,即是通常所说的不重复排列,因此 样本配合种数为:
A N ( N 1)
n N
N! ( N n 1) ( N n)!
*4、无顺序不重复抽样样本种数 无顺序不重复抽样,即是通常所说的不重复组合,因此 样本配合种数为:
2.样本 进行调查时,往往很难将总体中的每个个体访问到,有 时是不可能的。一般地是从总体中随机选取出部分单位作为 一个抽样总体进行调查,这个抽样总体通常称为样本。
比如:从一批100000只灯泡中抽出20只进行寿命测试,那么 这20只灯泡就构成一个样本;从全市职工家庭中抽出200户进 行家庭收入调查,那么这200户职工家庭就构成一个样本。
一.总体与样本 1.总体是指由调查对象的全部单位所构成的集合体.也称为 全及总体. 例如:要调查某城市居民的年龄结构、受教育程度,则 该市的全体市民就构成一个总体。又如,要调查某区所有职 总体容量,记为N 工家庭收入情况,则该区全部职工家庭便构成一个总体。 有限总体:总体中所包含的单位数目是有限的。如:一个地 区的人口,一个企业的年产量等。 无限总体:总体中所包含的单位数目是无限的。如:湖泊海 洋中的鱼尾数,森林中的树的棵数等。
是一个确定的量! 二.总体指标与样本指标
原因:总体是唯 一确定的!
1、总体指标:根据总体中各单位的标志值计算出来的用于反 映总体的数量特征的指标。又称为全及指标或总体参数。 如:一批灯泡的平均使用寿命;一个城市职工家庭的年平均 收入等等都是总体指标。 常用的总体指标有: 1 N ①总体平均数(总体均值):Y Yi N —总体容量 N i 1 N0 N1 , Q 1 P Yi —个体标志值 ②总体比例: P N N N 1 2 2 N 1 —总体中具有 ( Y Y ) ③总体方差: i
N
1 N
④总体标准差:
i 1 N
⑤总体总量指标: Y Yi
i 1
i 1 N
2 ( Y Y ) i
某种特性个 体数目
N 0 —总体中不具
有某种特性 个体数目
2、样本指标:根据样本中各单位的标志值计算出来的用于反 原因:样本是在 总体中随机抽取 映样本数量特征的指标称为样本指标,也称样本参数。
多阶段随机抽样是将一次抽样后得到的样本当作总体再 次进行随机抽样,得到第二次抽样样本,然后再如此进行下 去的抽样方式。 例如:我国农产量调查就采用五阶段抽样方式。省抽县、县 抽乡、乡抽村、村抽地块、地块抽样本点,对样本点进行实 割实测的调查方法。 另外还有二重抽样法、比估计法、回归估计等
二.样本单位的抽选方法 在组织抽样调查时,根据样本单位是否重复抽取,分别 有重复抽样和不重复抽样两种方法。 1、重复抽样
⑤样本标志总量: y yi
i 1 n
n0 —样本中不具
来自百度文库有某种特性 个体数目
样本指标是不确定的,它的取值随样本的变化而变化,是一 个随机变量,样本指标也称为统计量。
§ 3 抽样调查的组织形式及调查方法
随着抽样技术的发展,抽样调查的组织形式也越来越多 样化。在实际应用中,为提高抽样效果,需要根据调查的任 务和条查对象的具体情况,采用不同的抽样方式和调查方法 以便使抽出的样本能充分地反映总体,并便于组织实施、节 省人力物力和时间。 一.抽样调查的几种组织形式
2、无顺序重复抽样样本种数 设从a,b,c,d 4单位中按无顺序重复抽样方式每次抽取2 个单位构成样本,则所有不同的样本为: aa , ab , ac ,ad bb , bc ,bd cc ,cd dd 在上述抽选中,总体中每个单位都可重复抽选一次,故 相当于总体中增加一个单位。所以,配合种数为: 5 4 2 2 C4 21 C5 10 2 一般地,总体容量为N,样本容量为n。采用有顺序重复 抽样时,相当于总体中增加到 N+n-1个单位,故样本配合种 ( N n 1)! 数为: n
1.简单随机抽样
简单随机抽样是一种对总体的每个单位(个体)都不加 任何限制的抽样。在总体中不作任何分组、划类、排队等, 完全随机地抽取调查单位。
2.系统随机抽样 系统随机抽样又称为机械随机抽样或等距随机抽样。它 是先将总体中各单位按一定的标志排队,然后每隔一定的距 离抽取一个总体单位(个体)的抽样方式。 例如:从100人中抽取10人构成样本,先将100人排队编号, 然后在1~10号之间随机抽取一个数字,比如抽到3,那么编 号为 3,13,23,33,43,53,63,73,83,93的10个人组 成样本。
样本中所含单位的数目称为样本容量,记为 n . 样本容量相对于总体容量一般是很小的,即 N是个很 小的数,往往是百分之几或千分之几,最大也不超过1/3。但 当总体容量N很大时,样本容量n本身也必须足够的大,这样 才能保证样本对总体的代表性。
n
n 30时,称为小样本。 一般 n 30时,称为大样本;
3.分层随机抽样 分层随机抽样是按照某一标志先将总体分成若干组 (类),其中每一组称为一层,然后在每一层内按照简单 随机抽样方式进行抽样的抽样方式。
例如:将工业企业划分为冶金、电力、石油化工、煤炭、机 械、电子等部门,每个部门中进行简单随机抽样调查。
4.整群随机抽样 整群随机抽样是先将总体按某一标志分成若干组,每一 组称为一个群,以群为单位进行简单随机抽样,然后对抽到 的群进行全面调查的抽样方式。 例如:了解某地区职工家庭生活状况时,按居委会分群,然 后对抽到的群(居委会)所辖每户职工家庭进行调查登记。 5.多阶段随机抽样
的!样本不同样 常用的样本指标有: 本指标也不同
是一个随机变量!
1 n ①样本平均数(样本均值): y yi n i 1 n0 n1 , q 1 p ②样本成数: p n n n
2
n —样本容量
yi —个体标志值
n1 —样本中具有
某种特性个 体数目
1 2 ( yi y ) ③样本方差: s n 1 i 1 n 1 2 ④样本标准差:s ( y y ) i n 1 i 1
n N ( N 1) ( N n 1) N ! A n CN N 1 2 n n ! ( N n)! n !
2、不重复抽样 不重复抽样是指每次从总体中抽取一个单位进行观察后 不再把这个单位重新放回总体,这个总体单位不再继续参加 下次抽选。这种抽选法也称为不回置抽样或不重置抽样。
不重复抽样法由于每次抽中的单位不再放回总体中,每 抽选一次,总体中的单位就减少一个,使连续抽选的各个单 位不相互独立。但是总体中各单位被抽中的机会仍然是均等 的! 不重复抽样按是否考虑抽选样本单位的顺序,又可分为 有顺序不重复抽样和无顺序不重复抽样两种。有顺序不重复 抽样即通常所说的不重复排列。按这种抽样方法只要有一个 单位不同,就算不同的样本。 无顺序不重复抽样即通常所说的不重复组合。按这种抽 样方法,不考虑抽样次序,只要所有的单位相同,不论抽选 次序如何都作为同一样本。
三.样本配合种数
采用不同的抽样方法从同一总体中抽选容量相同的样本 其样本配合种数是不同的。
1、有顺序重复抽样样本种数
设总体容量为N,样本容量为n。采用有顺序重复抽样时, 各个样本单位是独立选取的,每个样本单位都有N个选法,所 以,抽选包含n个样本单位的样本配合种数为:
n n BN NN
N Nn
重复抽样是指每次从总体中抽取一个单位进行观察后, 再把这个单位重新放回总体,使之继续参加下次抽选。
重复抽样法由于前一次抽中的单位又被放回总体中,不 会影响后面的抽选,所以总体中每个单位被抽中的机会均等 连续抽选各单位都是独立进行的的。 *重复抽样按是否考虑抽选样本单位的顺序,又可分为有 顺序重复抽样和无顺序重复抽样两种。有顺序重复抽样即通 常所说的可重复的排列。这种抽样方法要考虑不同单位的中 选顺序。样本中单位构成相同而中选次序不同则为不同样本
C N n1
n ! ( N 1)!
3、有顺序不重复抽样样本种数
有顺序不重复抽样,即是通常所说的不重复排列,因此 样本配合种数为:
A N ( N 1)
n N
N! ( N n 1) ( N n)!
*4、无顺序不重复抽样样本种数 无顺序不重复抽样,即是通常所说的不重复组合,因此 样本配合种数为:
2.样本 进行调查时,往往很难将总体中的每个个体访问到,有 时是不可能的。一般地是从总体中随机选取出部分单位作为 一个抽样总体进行调查,这个抽样总体通常称为样本。
比如:从一批100000只灯泡中抽出20只进行寿命测试,那么 这20只灯泡就构成一个样本;从全市职工家庭中抽出200户进 行家庭收入调查,那么这200户职工家庭就构成一个样本。