中国人民大学题库问题详解-抽样技术

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

中国人民大学

同等学力申请硕士学位课程考试试题

课程代码：123105 课程名称：抽样技术与方法

试题卷号： 1

名词解释

非概率抽样

非概率抽样又称为非随机抽样，是调查者根据自己的方便或主观判断抽取样本的方法，其最主要的特征是抽取样本时并不依据随机原则。包含有判断选样、方便抽样、自愿样本、配额抽样等。

最优分配

在分层随机抽样中，对于给定的费用，使估计量的方差V(y_st)达到最小，或者对于给定的估计量方差V，使总费用达到最小的各层样本量的分配，称为最优分配。

PPS抽样

是有放回的按规模大小成比例的概率抽样。其抽选样本的方法有代码法、拉希里方法等。

PPS 抽样是按概率比例抽样，属于概率抽样中的一种。是指在多阶段抽样中，尤其是二阶段抽样中，初级抽样单位被抽中的机率取决于其初级抽样单位的规模大小，初级抽样单位规模越大，被抽中的机会就越大，初级抽样单位规模越小，被抽中的机率就越小。就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样。

自加权样本

指调查中每个样本单元的设计权数是相同的，也就是说每个单元最终入样的概率是相等的。在不考虑非抽样误差的情况下，可以认为自加权样本完全代表总体，因为每个样本单元都代表了总体中相同数目的单元。（此时可以使用标准统计方法来进行点估计。此外，自加权样本往往方差较小，样本统计量更稳健）

简述题

有人认为“抽样调查除了调查误差以外，还有抽样误差，因此抽样调查不如全面调查准确”，请对此加以评价。

一项调查的误差来自多个方面，抽样调查因为只调查总体中的一小部分，用部分的调查结果推断总体，所以存在着抽样误差，但这只是所有误差中的一部分。对于抽样调查，误差包括抽样误差和非抽样误差。有些情况下，全面调查由于参与的人员众多、涉及围大，因此虽然没有抽样误差，但在数据采集和数据汇总整理的过程中却有产生其他误差的更大可能性，所以调查规模并不是越大越好。与全面调查相比，抽样调查的工作量小，这就为使用素质较高的工作人员并对他们进行深入的培训创造了条件。此外，如果能对调查过程实施更为细致的监督、检查和指导，可以使抽样调查所得到的数据质量比同样的全面调查数据质量更高，从而使调查的总误差更小。

试对分层抽样中的联合比率估计和分别比率估计方法进行比较。

如果每一层都满足比率估计量有效的条件，则除非R h=R，都有分别比率估计量的方差小于联合比率估计量的方差。但当每层的样本量不太大时，还是采用联合比率估计量更可靠些，因为这时分别比率估计量的偏倚很大，从而使总的均方误差增大。

实际使用时，如果各层的样本量都较大，且有理由认为各层的比率R h 差异较大，则分别比率估计优于联合比率估计。当各层的样本量不大，或各层比率R h 差异很小，则联合比率估计更好些。此外，联合比估计不像分别比那样需要已知每层的辅助信息X h 。计算题

某住宅区调查居民的用水情况，该区共有N =1000户，调查了n =100户，得y _

=12.5吨，s 2

=1252，有40户用水超过了规定的标准。

要求计算：

（1）该住宅区总的用水量及95%的置信区间；

（2）若要求估计的相对误差不超过10%，应抽多少户作为样本？

（3）以95%的可靠性估计超过用水标准的户数；

（4）若认为估计用水超标户的置信区间过宽，要求缩短一半应抽多少户作为样本？

【解】已知N=1000,n=100,f== =0.1, y _=12.5, s 2

=1252

（1）估计该住宅区总的用水量Y 为：Y ^=Ny _=1000*12.5=12500吨

估计该住宅区总的用水量Y 的方差和标准差为：

V(Y ^)=N 2v(y _

)=N 2s 2=10002**1252=11268000 s(Y ^)=SQRT(v(Y ^))= ≈ 3356.7842 因此，在95%的置信度下，该住宅总的用水量的置信区间估计为：

Y ^±z 0.025s(Y ^

)=12500±1.96*3356.7842≈12500±6579

即，我们可以以95%的把握认为该住宅总的用水量在5921吨～19079吨之间。

（2）根据题意，要求估计的相对误差不超过10%，即r≤0.1，假定置信度为95%

根据公式：n0==≈3078

由于=3.078>0.05,所以需要对n0进行修正：

n==≈755

若要求估计的相对误差不超过10%，应抽不少于755户作为样本。

或：n0=1/(1/N+d2/(zα/22s2)) ≈755 （d=ry_=1.25）

（3）令超过用水标准的户数为A，样本中超过用水标准的户数为a = 40，估计超过用水标准的比例p为：p=a/n=40/100=40%

估计超过用水标准的比例p的方差和标准差为：

v(p)=p(1-p)=*40%*60%≈0.002182

s(p)==≈4.67%

在95%的可靠性下，超过用水标准的比例p的估计区间为：

p±z0.025 s(p)=40%±1.96*4.67%

因此，我们有95%的把握认为，超过用水标准的比例p在30.85%-49.15%之间，超过用水标准的户数的点估计为：1000*40%=400户，超过用水标准的户数在1000*30.85%户～1000*49.15%户之间，即309户～492户之间。

或：p±z0.025代入得(0.3089,0.4911)

（4）若要置信区间的宽度缩小为原来一半，即要求应抽取的户数n满足方程

z0.025 = 1/2 * z0.025≈0.045766代入数据解得

n=306.25≈306户。

为估计市区人均居住面积，按与各区人数呈比例的概率从12个区中抽了4个区，经调查

的数据如下：

样本区号区居住面积（米2）人口数

1 2835326 604746

2 1670996 456035

3 1835226 470981

4 2895058 585257

试对市区人均居住面积作点估计和置信度为95%的区间估计。

^【解】设居住面积为Y，人口数为X，N=12，n=4，f=n/N=1/3。人均居住面积点估计值为R

=r= = ≈4.363米2/人.

s y2===

[(2835326-4.363*604746)2+(1670996-4.363*456035)2+(1835226-4.363*470981)2+(2895 058-4.363*585257)2)≈ 2.336373

V(R^)=V(r)≈=≈ * ≈)=≈0.492

因此置信度为95%的区间估计为：4.363±1.96*0.492,即(3.3987,5.3273)