第10章抽样估计与样本量确定

合集下载

样本量的确定

样本量的确定1. 二值分布(估计比例时的样本容量)这种情况下，表明可能的采样结果只有两种情况，即是与非的问题。

比如调查某一批产品的合格率。

样本量的确定主要受以下几个因素影响：置信水平α、所能接受的抽样偏差e (估计值与真实值的最大偏差)、总体数量N ；通过置信水平即可查表确定z 。

通常情况下置信水平选择95%。

抽样偏差为±5%，不过也不完全一定，抽样偏差的确定还是要考虑实际情况，比如最小的调查估计值p=5%，此时抽样偏差就应该小于5%。

这时，就可以确定样本量：222(1)(1)z p p n z p p e N-=-+P 值的确定：用以前类似样本得到的结果来近似，如果完全不知道就设p=，因为此时方差最大，可求得一个比较保守的样本容量。

样本容量和在p=时运用简单随机抽样估计p 值得到的抽样偏差e如果总体容量N 非常大，可近似为无穷，那么上面这个公式可简化成：22(1)z p p n e -=事实上当总体容量很小时，不会采用抽样调查，而是普查了。

2. 正态分布(估计均值时的样本容量)在这种情况下，表明采样的结果是具有多样性的，并不局限在0、1上。

比如对某一城市老年人的患病年龄进行统计。

这个时候，样本量同样受如下几个因素影响：置信水平α、所能接受的抽样偏差e (估计值与真实值的最大偏差)、总体数量N 。

样本量为：22222z S n z S e N=+S 表明的是总体标准差，这个可以用以前类似样本得到的S 或是实验调查样本的S 来近似。

同样，如果总体容量N 非常大，可近似为无穷，那么上面这个公式可简化成：222z S n e=理论基础：根据数理统计知识，样本均值对总体均值可构造如下统计量：xX uσ-，他满足标准正态分布，查表即可得到某一显著性水平下这个统计量的值，这里面的x σ表示总体均值估计量的标准误差。

在无放回简单随机抽样情况下，总体均值估计量的标准误差表达式：x σ=如果误差界限设为e ，那么：(1)n Sez N N=-解得：22222z S n z S e N=+对于二值分布，p 的总体方差为：2(1)S p p =-此时：222(1)(1)z p p n z p p e N-=-+当然，这里只考虑了简单随机抽样，对于分层抽样和整群抽样，需要再乘以一个设计效应，分层抽样效率高于简单随机抽样，效应因子小于1，整群抽样效率低于简单随机抽样，效应因子大于1.总体大小对于样本量也是有影响的，当总体个数越小时，影响越明显。

《市场调查与预测》课程教学大纲烟台南山学院

《市场调查与预测》课程教学大纲烟台南山学院《市场调查与预测》课程教学大纲课程名称：市场调查与预测课程代码：1739041课程类型：专业核心课学分：3.5 总学时：64 理论学时：48 实践学时：16先修课程：市场营销学适用专业:市场营销一、课程性质、目的和任务本课程是市场营销专业的专业核心课。

通过本课程的学习，应使学生比较全面系统地掌握市场调研的基础理论和基本方法，在市场营销活动中经常应用的调查、测量方法，同时具备分析基础数据和撰写调查报告的能力。

培养学生严谨的市场调查研究的态度和职业素质。

二、教学基本要求1．知识、能力、素质的基本要求本课程是市场营销专业课程，通过对市场调查的基本概念、调查内容、调查方法技巧、调查过程特点及其每一阶段的具体操作（包括调查方案企划设计、调查抽样、调查实施、调查资料整理设计分析、调查报告书撰写）等方面知识技能的讲解分析与实践训练使学生能够理解掌握现代市场调查的专业知识与专业操作技能技巧，并能比较熟练且规范地开展各种类型的市场调查。

2．教学模式基本要求本课程在学科体系上属于市场营销的一个分支，但其内容又与多种学科相融合，涉及《市场营销学》、《心理学》、《统计学》等多学科的知识，所以，在本课程的教学过程中，应注意其学科特点与学习方法，重点系统论述市场调研与预测的基本理论、方法和技术。

3．考核方法基本要求成绩评定包括平时考查、期中考试和期末考试3种形式。

平时考查成绩占总成绩的20%，期中考试占总成绩的20%，期末考试成绩占总成绩的60%。

其中平时过程性考查主要课堂出勤10分；课后作业、课堂讨论、课内实践等综合评定10分。

平时考核要求作业最少8次，少一次作业扣2分，作业完成质量不高每次扣1分，扣完10分为止；旷课一次扣2分，迟到一次扣1分，扣完10分为止。

三、教学内容及要求第1篇市场调查设计总论第1章市场调研职能1.教学内容1.1 市场调研及其基本分类 1.2 市场调研的功能与价值1.3 市场调研的局限 1.4 市场调研的历史与现状2．教学要求了解市场、市场信息的概念；了解市场调研的历史与现状；理解市场调研的功能与价值；掌握市场调研的含义及基本分类。

MRAF-C10 抽样估计与样本量确定

• 点估计是容易做到的，但是，点估计没有给出估计值接近总体参数程度的信息。
• 当样本均值与总体均值不全相同时，样本均值与实际总体均值就存在着差距，形成抽样误差。
16
調查分析預測
MRAF
总体参数的区间估计
• 区间估计：在点估计的基础上，对总体参数的区间或范围进行估计。
• 区间估计不仅要说明区间大小，还要说明点估计值在区间内的概率，即置信度。置信度是一个百分比，用来说明结果正确的长期概率。被估计的区间则被称为置信区间。
27
調查分析預測
MRAF
设计权数的调整
• 上述等概率抽样的加权和不等概率抽样的加权都是加权的基本形式。
• 权数估计常会遇到更真实和复杂的情况：
– 考虑无回答的情况，然后对权数做出调整；
– 考虑来自其他渠道的、更具权威性的某些辅助信息，将它们合并到权数中。
28
調查分析預測
MRAF
对无回答的权数调整
– 另外， PPS等也可以设计为一个自加权抽样。
• 对于自加权抽样设计，如果无需对权数调整，则在计算比例、均值等估计量时可将其忽略，对总值估计也仅需将样本总值乘上某个倍数。 (例P215)
26
調查分析預測
MRAF
不等概率抽样的加权
• 自加权设计并不总是可行的。如，在使用分层抽样进行一个全国调查时，可能需要采用纽曼分层。
18
調查分析預測
MRAF
训练题
• 5.一家电器连锁商店正在进行空调的季节性降价促销。被抽取的10个样本商店销售出的空调数量如下（单位：台）：82，113，2，41， 71，83，99，52，84，30。那么，根据这些数据能否说明这次促销期间每家商店平均销售空调数量多于50台（95%）？

抽样误差与样本量

2P
重复抽样
NZ 2P1 P
不重复抽样
n N2x Z 2P1 P
例如，抽查检验某产品的质量，产品的合
格率90%，要求估计值与实际值之间的误
差最大不超过4%，置信度为95.45%，那么
应抽取多少件产品进行检查？
已知t 2：p(p1=0p.9) t=2 Δ=4%
n=
2p
=225
即所抽取的产品数至少为225件。
市场调查
抽样误差与样本量
一、抽样误差二、样本容量的确定
一、抽样误差
1.定义：抽样估计量与被估计的总体参数之间的差值。抽样平均误差，即样本估计量的标准差。
2. 影响抽样误差的因素
总体各单位的差异程度（即标准差的大小）样本单位数的多少抽样方法：不重复抽样的抽样误差比重复抽样的抽样
误差小抽样组织方式：简单随机抽样、分类抽样、机械抽样
等。
3.抽样误差的计算
❖ 抽样平均数的抽样误差
重复抽样时
x
或
n
s n
不重复抽样时
x
2 1 n 或
n N
s2 1 n n N
•抽样成数的抽样误差
重复抽样时
p
p
n
或
p1 p
n
不重复抽样时
p
2 p
1
n
或
n N
p1 p 1 n
n N
4.抽样极限误差
指在一定的概率保证程度下，抽样指标与总体指标之间的误差范围。
样本平均数的 z
极限误差：
x
x
样本成数的极限误差：
p z p
Z 为概率保证程度.
二、样本容量的确定
1.总体均值样本容量的确定

第十章审计抽样201201

第十章审计抽样201202审计抽样方法的运用是审计工作理论和实践的重大突破。

在有限的审计资源条件下，极大地提高了审计工作的效率，降低了审计费用，收集到充分适当的审计证据。

审计抽样的方法由最初的判断抽样发展到统计抽样，而统计抽样比起判断抽样，一定程度上又大大提高了审计结论的可靠性，控制和降低了抽样风险。

一、审计抽样的概念审计抽样是指注册会计师对具有审计相关性的总体中低于百分之百的项目实施审计程序，使所有抽样单元都有被选取的机会，为注册会计师针对整个总体得出结论提供合理基础。

审计抽样的基本目标是在有限的审计资源条件下，收集充分适当的审计证据，以形成和支持审计结论。

审计抽样的应用，极大地提高了审计工作的效率，降低了审计费用。

审计抽样不同于详细审计。

详细审计是指对审计对象总体中的全部项目进行审计，并根据审计结果形成审计意见。

那种从审计对象总体中选取部分项目进行审计，并对所选项目本身发表审计意见的方法也不属于审计抽样。

审计抽样应当具备三个基本特征：（1）对某类交易或账户余额中低于百分之百的项目实施审计程序；（2）所有抽样单元都有被选取的机会；（3）审计测试的目的是为了评价该账户余额或交易类型的某一特征。

审计人员拟实施的审计程序将对运用审计抽样产生重要影响。

有些审计程序可以使用审计抽样，有些审计程序则不宜使用审计抽样。

现详细说明：（一）风险评估程序审计人员应当实施下列风险评估程序以了解被审计单位及其环境：①询问被审计单位管理层和内部其他相关人员；②分析程序；③观察和检查。

审计人员在实施上述风险评估程序时通常不涉及审计抽样。

原因是：一方面，审计人员实施风险评估程序的目的是了解被审计单位及其环境，识别和评估重大错报风险，而不需要对总体取得结论性证据；另一方面，风险评估程序实施的范围较为广泛，且所获取的信息具有较强的主观色彩，因此通常不涉及使用审计抽样方法。

但是，如果审计人员在了解控制的设计和确定其是否得到执行时，一并计划和实施控制测试，则会涉及审计抽样方法，但此时审计抽样仅适用于控制测试。

如何确定抽样方法与样本量

如何确定抽样方法与样本量在设计一个抽样调查时，我们通常需要做的工作是：定义总体及抽样单元、确定或构置抽样杠、选择样本量的大小、制定实施细节并实施。

在这本小册子中我们着重介绍一下定量研究的抽样和样本量这两个技术环节。

最基本的定量研究的抽样方法分为两类，一类为非概率抽样，一类为概率抽样。

一．非概率抽样非概率抽样是不能计算抽样误差的，因为它是靠调研者个人的判断来进行的抽样。

它包括偶遇抽样或者方便抽样、判断抽样、配额抽样、雪球抽样等。

偶遇抽样（方便抽样）常见的未经许可的街头随方或拦截式访问、邮寄式调查、杂志内问卷调查等都属于偶遇抽样的方式。

偶遇抽样是所有抽样技术中花费最小的（包括经费和时间）。

抽样单元是可以接近的、容易测量的、并且是合作的。

但尽管有许多优点，这种形式的抽样还是有严重的局限性。

许多可能的选择偏差都会存在，如被调查者的自我选择、抽样的主观性偏差等。

这种抽样不能代表总体的推断总体。

因此，当我们在进行街头访问或邮寄调查时，一定要谨慎对待调查结果。

判断抽样判思抽亲是基于调研者对总体的了解和经验，从总体中抽选“有代表性的”“曲型的”单位作为样本，例如从全体企业作为样本，来考察全体企业的经营状况。

如果判断准，这种方法有呆取得具有较好代表性的样本，但这种方法受主观因素影响较大。

配额抽样配额抽样是根据总体的结构特征来给调查员分派定额，以取得一个与总体结构特征大体相似的样本，例如根据人口的性别、年龄构成来给调查员规定不同性别、年龄的调查人数。

配额保证了在这些特征上样本的组成与总体的组成是一致的。

一旦配额分配好了，选择样本元素的自由度就很大了。

唯一的要求闵是所选取的元素要适合所控制的特性。

这种抽样方法的目的是使样本对总体具有更好的代表性，但仍不一定能保证样本就是有代表性的。

如果与问题相关联的某个特征是十分困难的。

另外，用这种方法进行选择严格控制调查员和调查过度程的条件下，可使配额抽样获得与某些概率抽样非常接近的结果。

抽样方法及样本量的确定

抽样方法及样本量的确定在社会科学研究中，抽样方法及样本量的确定是非常重要的环节。

抽样方法是指从总体中选择一部分样本进行研究，以代表总体特征的一种方法。

而样本量的确定则涉及到研究的可靠性和有效性。

本文将探讨抽样方法的选择以及样本量的确定。

一、抽样方法的选择1. 简单随机抽样简单随机抽样是一种基本的抽样方法，它通过随机选择样本，确保每个个体都有相等的机会被选中。

这种方法适用于总体分布均匀且规模较小的情况。

例如，当我们想要研究某个小城市的居民对某一政策的态度时，可以使用简单随机抽样方法。

2. 分层抽样分层抽样是将总体划分为若干层次，然后从每个层次中随机选择样本。

这种方法适用于总体具有明显的层次结构的情况。

例如，当我们想要研究一个城市的不同社区对某一政策的态度时，可以将城市划分为不同的社区层次，然后从每个社区中随机选择样本。

3. 整群抽样整群抽样是将总体划分为若干个群组，然后随机选择一部分群组作为样本进行研究。

这种方法适用于总体群组之间差异较大的情况。

例如，当我们想要研究某个国家的不同地区对某一政策的态度时，可以将国家划分为不同的地区群组，然后随机选择一部分地区进行研究。

二、样本量的确定确定样本量的大小是保证研究结果准确性和可靠性的关键因素。

样本量过小可能导致结果的不可靠，样本量过大则可能浪费资源。

确定样本量的大小需要考虑以下几个因素：1. 总体大小总体大小是影响样本量确定的一个重要因素。

当总体较大时，样本量可以相对较小；当总体较小时，样本量应相对较大。

2. 置信水平置信水平是指研究结果的可靠程度。

常见的置信水平有95%和99%。

置信水平越高，样本量需要越大。

3. 允许误差允许误差是指研究结果与总体特征之间的差异。

允许误差越小，样本量需要越大。

4. 方差方差是指总体内个体之间的差异程度。

方差越大，样本量需要越大。

综合考虑以上因素，可以使用统计学方法计算出合适的样本量。

常见的计算方法有公式法和抽样方差法。

样本量的确定方法

样本量的确定方法 The pony was revised in January 2021样本量的确定方法(2008-10-14 09:12:34)一、样本单位数量的确定原则一般情况下，确定样本量需要考虑调查的目的、性质和精度要求。

以及实际操作的可行性、经费承受能力等。

根据调查经验，市场潜力和推断等涉及量比较严格的调查需要的样本量比较大，而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查，样本量相对可以少一些。

实际上确定样本量大小是比较复杂的问题，即要有定性的考虑，也要有定量的考虑；从定性的方面考虑，决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。

但是这只能原则上确定样本量大小。

具体确定样本量还需要从定量的角度考虑。

从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。

归纳起来，样本量的大小主要取决于：(1)研究对象的变化程度，即变异程度；(2)要求和允许的误差大小，即精度要求；(3)要求推断的置信度，一般情况下，置信度取为95%；(4)总体的大小；(5)抽样的方法。

也就是说,研究的问题越复杂,差异越大时,样本量要求越大；要求的精度越高,可推断性要求越高时,样本量也越大；同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系；而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1；分层抽样由于抽样效率高于简单随机抽样，其设计效应的值小于1,合适恰当的分层，将使层内样本差异变小，层内差异越小，设计效应小于1的幅度越大；多阶抽样由于效率低于简单随机抽样，设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。

对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。

实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。

二、样本量的确定方法如何确定样本量,基本方法很多,但是公式检验表明,当误差和置信区间一定时,不同的样本量计算公式计算出来的样本量是十分相近的,所以,我们完全可以使用简单随机抽样计算样本量的公式去近似估计其他抽样方法的样本量,这样可以更加快捷方便，然后将样本量根据一定方法分配到各个子域中去。

抽样样本量的确定

简单随机抽样下，通常使用误差界限和估计量的标准误来确定所需的样本容量。
SSI
第36页
在无放回简单随机抽样情况下总体均值估计量的标准误差的表达式
y
(1 n ) S Nn
其中，S 是总体的标准差
SSI
第37页
如果误差界限设为e，那么：
e z (1 n ) S Nn
这里Z是对应于某一置信水平的标准正态分布的分位点值。
下面用一个例子，说明估计比例问题时样本容量的确定过程。
在这一例子中，所需的精度是根据误差界限确定的，所研究的指标取两个值，即P和1-P。在这种情况下，对于大总体，且估计量服从正态分布时， P的总体方差为：
S 2 P(1 P)
n

e2
z2 P(1 P) z2P(1 P)
N
SSI
分层抽样分配样本的标准
1. 总的样本容量事先确定 2. 估计值要求调查样本容量的因素
调查估计值所希望达到的精度调查估计值所能允许的误差。估计量的抽样方差较小，估计值是精确的估计值的精度越高，所需的样本容量就越大影响精度的因素也同样影响着样本容量的大小所研究指标在总体中的变异程度总体的大小样本设计和所使用的估计量无回答率
培训访员，等等），这样做可能更有效率
SSI
第21页
4．总体的变异程度
调查总体中，我们所研究的项目或指标，对于不同的个人、住户或企业，得到的估计结果可能会有很大的不同。虽然我们不能控制这种变异性，但它的大小却影响到了给定精度水平下，研究项目所必需的样本容量。
SSI
第22页
我们来看假设有一个首次开展的调查，试图估计对某企业提供的服务持满意态度的顾客比例。对 “顾客满意”这一指标，设置两个可能的值：满意或者不满意。

市场调研中的样本选择与样本量确定

市场调研中的样本选择与样本量确定市场调研在确定目标受众和进行市场分析时起到了至关重要的作用。

其中，样本选择和样本量的确定是市场调研过程中必不可少的环节。

本文将就样本选择和样本量确定的原则和方法进行探讨，以帮助读者更好地进行市场调研。

一、样本选择的原则和方法在市场调研中，样本选择是一项极为重要的工作，其结果的准确性直接影响到调研结果的可靠性。

以下是样本选择的原则和方法。

1. 代表性原则样本选择的首要原则是代表性。

样本的代表性要求能够真实反映总体的特征和分布情况。

为了确保样本代表性，我们需要根据所研究的对象的特点，选择具有相似特征的人群或单位作为样本。

2. 随机性原则样本选择中的随机性原则是指每个个体或单位都有相同的机会被选择为样本，避免主观或偏见的干扰。

常用的随机化方法有简单随机抽样、分层抽样、整群抽样等，根据实际情况选择适当的方法。

3. 多样性原则样本选择中的多样性原则是指样本需要具有一定的多样性，可以覆盖不同地区、不同性别、不同年龄、不同职业等因素。

这样可以提高样本选择的可靠性和代表性。

二、样本量的确定样本量的确定是市场调研中关键的一环。

合理的样本量可以保证调研结果具有一定的可信度和统计学意义。

以下是样本量确定的原则和方法。

1. 总体大小原则样本量的确定需要考虑总体的大小。

当总体较大时，相同的误差水平需要较大的样本量，以保证结果的精度。

相反，当总体较小时，相同的误差水平需要较小的样本量。

2. 信心水平和置信度原则样本量的确定还涉及到信心水平和置信度的考虑。

信心水平是指调研结果的可靠程度，常见的信心水平有95%和99%。

置信度是指在样本误差范围内，对总体的估计结果。

3. 调查方法和目标变量原则样本量的确定还需要根据调查方法和所要研究的目标变量来确定。

不同的调查方法和目标变量会对样本量的要求产生不同的影响。

一般来说，较为复杂的调查方法和目标变量需要更大的样本量。

三、总结市场调研中的样本选择和样本量的确定是确保调研结果可靠性的重要环节。

【转】如何确定样本量

【转】如何确定样本量调查一般分为普查和抽样调查，只有抽样调查才涉及到样本量的问题。

例如某企业有100名员工，在进行员工满意度调查时就无需抽样，只要全部调查即可。

那么，样本量是不是越大越好呢?当然不是，调查是要消耗大量人力财力和时间的，并且，从统计学上讲，当样本量达到一定程度以后，再增加样本，对于提高调查效果的作用(样本对于总体的估计效应)就不大了，反而会增加经费和时间。

那么是不是随便确定一个样本量就可以呢?当然也不行。

样本量的大小受许多因素制约，如调研的性质、总体指标的变异程度、调研精度、样本设计、回答率、项目经费和时间等。

市场潜力等涉及量比较严格的调查所需样本量较大，而产品测试，产品定价，广告效果等人们间彼此差异不是特别大或对量的要求不严格的调查所需样本量较小些;探索性研究，样本量一般较小，而描述性研究，就需要较大的样本;收集有关许多变量的数据，样本量就要大一些;如果需要采用多元统计方法对数据进行复杂的高级分析，样本量就应当更大;如果需要特别详细的分析，如做许多分类等，也需要大样本。

针对子样本分析比只限于对总样本分析，所需样本量要大得多;总体指标的差异化越大，需要的样本量就越高;调研的精度越高，样本量越大。

简单随机抽样设计，设计效应等于1;分层抽样设计，设计效应一般小于等于1;整群或多阶抽样设计，设计效应一般大于等于1。

在实际中，在确定样本量时，不考虑时间和费用这两个极为重要的因素是不可思议的。

最终确定的样本量必须与可获得的经费预算和允许的时限保持一致。

最终样本量的确定需要在精度、费用、时限和操作的可行性等相互冲突的限制条件之间进行协调。

它还可能需要重新审查初始样本量、数据需求、精度水平、调查计划的要素和现场操作因素，并作必要的调整。

通常，统计调查机构和客户寻求在最有效使用费用的基础上(例如缩短访问时间)，使用户能对所需的样本量提供经费支持。

注意一个误区:"大城市多抽，小城市少抽"，这种说法原则上是不对的。

(朱锦余)审计学(第四版)章后习题参考答案：第10章审计抽样习题+案例

第10章审计抽样习题参考答案1.审计抽样的含义是什么？【答】审计抽样是指从某一特定的审计对象（审计总体）中，按一定方式抽取一部分具有代表性的样本进行审查，并用样本的审查结果推断审计总体特征的审计方法。

2.什么是抽样风险？抽样风险具体表现为哪几种形式，各自对审计结果有何影响？【答】抽样风险：由于采用抽样审查方法，即并非对总体中100%的项目进行审查，而只是对抽取的样本进行审查，并以样本特征推断总体特征，由此得出的审计结论与总体实际情况之间必然存在着差异。

表现形式及影响：（1）控制测试中的抽样风险。

控制测试中的抽样风险主要1有两种，一是过度依赖风险；二是依赖不足风险。

过度依赖风险是指在对内部控制有效性进行测试时，通过样本的考察，得出依赖内部控制的结论，但总体的实际情况可能并不符合这一结论。

即在审计师选取的内部控制样本中，其有效性好于总体水平，这样对样本考察的结果将导致审计师对内部控制给予过度的依赖。

依赖不足风险，指对内部控制有效性进行测试时，基于对样本的考察得出了不能依赖内部控制的结论，但总体的实际情况却是可以依赖的，即对内部控制应该依赖而未予依赖。

（2）实质性测试中的抽样风险。

实质性测试中的抽样风险也有两种：一是误拒风险；二是误受风险。

误拒风险，指在对账户余额的正确性进行测试时，实际上某项余额正确，而审计师通过考察样本却得出该余额不正确的结论，即将事实上正确的余额看成是错误的余额。

误受风险，指实际上某项余额是错误的，而审计师考察样本后却得出该项余额正确的结论，即将事实上错误的余额误作为正确的予以接受。

3.什么是非抽样风险？非抽样风险的具体表现形式有哪些？【答】非抽样风险：非抽样风险是指由于采用抽样审查方法之外的其他原因所造成的风险。

例如，审计程序设计不当、审计方法选择不合理、审计师工作疏忽、审计师专业判断存在瑕疵等原因，导致审计目标难以实现。

具体表现形式：非抽样风险一般难以量化，可以通过审计程序和审计方法的2科学、周密设计以及审计工作的适当督导将其消除或减少。

样本量估计

样本量估算的影响因素
设定检验的第Ⅱ类错误概率β，或检验效能1-β 。检验效能又称把握度，为1-β，即假设检验第二类错误出现的概率，为假阴性错误出现的概率。即在特定的α水准下，若总体参数之间确实存在着差别，此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力，β越小，检验效能越高，所需的样本量越大，反之就要越小。β 水平由研究者具情决定，通常取β为0.2，0.1或 0.05。即1－β=0.8，0.1或0.95，也就是说把握度为80%，90%或95%。

2
单样本与已知总体检验时样本量的估计
单样本与已知总体检验的样本量估计公式类似。其估计公式为： (u u ) 2 1
N
2Байду номын сангаас
式中：δ为容许的误差，即允许样本率和已知总体率的最大容许误差为多少 . 为已知总体患病率。
两样本率比较样本量估计
两样本率比较，当例数相等时，其样本量估计公式为： 2
样本量估算的影响因素

了解由样本推断总体的一些信息。总体标准差一般未知，用样本标准差s代替。处理组间差别σ的估计，即确定容许误差。如果调查均数时，则先确定样本的均数和总体均数之间最大的误差为多少。容许误差越小，需要样本量越大。一般取总体均数（1－α）可信区间的一半。
样本量估算的影响因素
样本量估计
概述
医学研究没有绝对的样本量标准，不同的研究方法、研究目的，研究要求和研究资料决定了样本量。一般而言，样本越大，结果的估计越精确。但样本过大或过小均可影响研究的可行性。因此，科学地确定样本量可增加研究的可靠性，得到可信的研究结果。
样本量估算的影响因素

抽样样本量的确定

表2 列出了持满意和不满意态度的顾客可能占的比例的组合
1
100% 满意
2
90% 满意
3
80% 满意
4
70% 满意
5
60% 满意
6
50% 满意
抽样方差的几种计量方法
标准误差误差界限变异系数
抽样调查中样本容量的确定，也经常会使用一种或多种这样的计量方法来对精度进行说明。
非抽样误差
非抽样误差会对调查估计值的精度产生显著的影响非抽样误差的大小与样本容量的大小却没有很大的关系确定样本容量，就不必将这些误差作为影响因素加以考虑为确保调查结果的准确性，应该消除非抽样误差，至少应尽可能使之最小化
调查结果可能需要包括一些细分的数据这些数据称为子总体估计值（或域估计值）为使数据满足调查要求，应该确定合适的精度
与调查估计值有关的抽样方差有多大？
对于不同的子总体，对精度的要求可能有所不同
例如，在一次全国范围的抽样调查中，对国家层次的数据，调查主办者可能需要±3%的误差界限；但对于省级层次的估计值，±5% 的误差界限可能就可以满足要求；
培训访员，等等），这样做可能更有效率
4．总体的变异程度
调查总体中，我们所研究的项目或指标，对于不同的个人、住户或企业，得到的估计结果可能会有很大的不同。虽然我们不能控制这种变异性，但它的大小却影响到了给定精度水平下，研究项目所必需的样本容量。
我们来看假设有一个首次开展的调查，试图估计对某企业提供的服务持满意态度的顾客比例。对 “顾客满意”这一指标，设置两个可能的值：满意或者不满意。
❖ 事实上，P可以是P=0 到 P=1.0之间的任一数值。在确定调查估计值所需的精度时，应该考虑当某个既定精度达到时所得的最小估计值。如果最小的估计值是 P=5%，那么误差界限就应该小于5%。

抽样样本量的确定

抽样样本量的确定
确定样本量的方法有很多种，下面将介绍其中几种常用的方法：
1.点估计方法：这种方法假设总体参数已知或已经进行过先前的研究，通过计算得到一个点估计值，并根据误差容忍度和置信水平来计算样本量。

例如，如果要估计一个总体比例的点估计值，可以通过以下公式计算样本量：n=(Z^2*p*(1-p))/E^2，其中Z为置信水平对应的标准正态分布的分
位数，p为总体比例的估计值，E为允许的误差容忍度。

2.回归分析方法：当研究中涉及到自变量和因变量之间的关系时，可
以使用回归分析方法来确定样本量。

这个方法基于回归模型的统计力学，
通过指定预期的效应大小、误差容忍度和显著性水平来计算样本量。

3.探索性研究方法：对于探索性研究，通常没有先验的参数估计值可
以使用，因此无法使用点估计方法来确定样本量。

在这种情况下，研究者
可能需要基于经验或者判断来确定样本量。

除了以上几种方法，还有一些特殊的情况需要考虑，如多层抽样、群
组随机化实验等，这些情况下样本量的确定方法可能会有所不同。

总之，确定样本量需要综合考虑多个因素，并利用相关的统计方法来
进行计算。

在实际应用中，需要根据具体情况选择合适的方法，并确保样
本量足够大以获得可靠的统计结果。

样本量的确定方法

样本量的确定方法.样本量的计算公式为：样本量= (Zα/2 * σ / E)²，其中Zα/2为置信水平对应的标准正态分布值，σ为总体标准差，E 为允许的误差。

2）对于比例类型的变量，样本量的计算公式为：样本量= (Zα/2)² * p * (1-p) / E²，其中Zα/2为置信水平对应的标准正态分布值，p为总体比例，E为允许的误差。

2．分层抽样确定样本量，需要先将总体划分为若干层，然后根据每层的变异程度和大小，计算出每层的样本量，最后将各层样本量相加得到总样本量。

3．整群抽样确定样本量，需要先将总体分为若干群，然后根据群内变异程度和群大小，计算出每群的样本量，最后将各群样本量相加得到总样本量。

总之，样本量的确定需要综合考虑多个因素，包括调查目的、性质、精度要求、实际操作的可行性和经费承受能力等，同时需要根据不同的抽样方法和变量类型选择相应的样本量计算公式。

本文介绍了如何确定抽样调查方案的样本量。

对于已知数据为绝对数的情况，需要根据期望调查结果的精度、置信度、总体标准差估计值和总体单位数来计算样本量。

计算公式为n=σ/(e/Z+σ/N)。

如果是很大总体，则公式变为n=Zσ/e。

例如，如果希望平均收入误差在正负人民币30元之间，调查结果在95%的置信范围以内，置信度为1.96，估计总体标准差为150元，总体单位数为1000，则样本量为88.对于已知数据为百分比的情况，需要根据调查结果的精度值百分比、置信度、比例估计的精度和总体数来计算样本量。

计算公式为n=P(1-P)/(e/Z+ P(1-P)/N)。

如果不考虑总体，则公式为n=ZP(1-P)/e。

一般情况下，取样本变异程度最大值0.5作为P的取值。

例如，如果希望平均收入误差在正负0.05之间，调查结果在95%的置信范围以内，置信度为1.96，估计P为0.5，总体单位数为1000，则样本量为278.确定样本量后，需要进行样本量分配。

抽样估计与样本量确定

*
使用辅助信息调整权数
[例10．5] 为得到某公司职员是否有吸烟习惯的信息，进行了一项调查。从N=780人的名录中抽出了一个n=100人的简单随机样本。在收集有关吸烟习惯信息时，收集了每个回答者的年龄和性别情况，且100人都做出了回答，由此得到样本数据的分布如表10-3所示：
*
10．3 抽样分布与抽样误差
统计量～t(n-1)
总体置信区间 μ= ±
*
总体均值的区间估计例题
[例10．7] 某银行收集到由36信用卡用户组成的随机样本，得到各用户年龄(周岁)数据如下 23，35，39，27，36，44；36，42，46，43，31，33，42，53，45，54，47，24，34，28，39，36，44，40，39，49，38，34，48，50，34，39，45，48，45，32。试建立信用卡用户年龄90%的置信区间。
参数估计有两种估计方法：点估计区间估计
*
总体参数的点估计
点估计就是用样本的估计量直接作为总体参数的估计值。例如，用样本均值直接作为总体均值的估计，或者用两个样本均值之差直接作为总体均值之差的估计。
点估计是容易做到的，但是，点估计没有给出估计值接近总体参数程度的信息。
当样本均值与总体均值不完全相同时，样本均值与实际总体均值就存在着差距，形成抽样误差。
*
使用辅助信息调整权数
为什么要使用辅助信息来调整权数呢？首先，使调查的估计值与已知总体总值相匹配。例如，使用最新的人口普查数据来调整估计值，以确保这些估计值(如年龄、性别分布等)的一致性。二是为了提高估计值的精度。将辅助信息与抽样设计相结合，将有助于提高估计的精度。要想在调查设计阶段使用辅助信息，抽样框中的所有单元都必须具备这个辅助信息。否则，就只能在数据收集上来后，在估计阶段利用辅助信息提高估计值的精度。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

19
10.4 参数估计

参数估计就是根据从样本中收集的信息对总体参数进行推断的过程。根据中心极限定理等推断理论所阐明的抽样分布与总体分布之间的关系，由样本统计量的具体值（估计值）估计总体参数。点估计区间估计

20

点估计

用样本的估计量直接作为总体参数的估计量。存在抽样误差。在点估计的基础上，对总体参数的区间或范围进行估计(样本统计量加减抽样误差)，点估计值落在该区间范围内的概率为置信度或置信系数或置信水平。
26
举例P227
已知：n 36,1 95%, 2 0.025,1 2 0.975. 根据样本计算得： x 39.5, s 2 60.37.
2 查 2分布表得知： , 12 2 n 1 20.6120 . 2 n 1 53.1604
课后思考与训练题 P237-238 第4、5、7题

28
10.5 样本量的确定

样本量的确定问题，首先涉及对总体参数估计值的精度要求，同时也涉及与各种运作限制（如可获得的预算、资源和时间）之间的平衡问题。抽样调查估计值的精度是对抽样误差大小的度量。因此确定样本量是为控制抽样误差，而不是非抽样误差。
该银行信用卡年龄方差 2在95%置信度下的置信区间为： 53.1604 20.6120 即， 39.75 2 102.51
36 -1 60.37 2 36 -1 60.37
结论是：在95%的置信度下，信用卡用户年龄标准差为 6.3 ~ 10.1岁.
27
练习题

12
10.3 抽样分布与抽样误差

总体分布：总体各单位的观测值所形成的频数分布。样本分布：一个样本中各个观测值形成的频数分布。抽样分布：样本统计量的抽样分布是一种理论分布，是指在重复抽取容量为n的样本时，由该统计量的所有可能取值形成的相对频数分布。
13

10.3.1 样本均值的抽样分布及抽样误差

3）样本设计和估计量
以上所讨论的抽样方法都假定的是简单随机抽样，当调查采用了复杂的样本设计时，就应考虑实际使用抽样设计的效率，并对计算样本量的基本公式作出调整。通常的做法是在简单随机抽样的样本量计算公式的基础上乘以一个设计效应因子。设计效应（Deff）是指在给定抽样设计下估计值的抽样方差，与相等样本量下的简单随机抽样的估计值的抽样方差之比。
纽曼分层抽样即是一种不等概率抽样。
高收入阶层： wd ,1 N1 n1 2000 33.3 60.1
各层样本中收入阶层： wd ,2 N2 n2 12000133.3 90.0 单元权数低收入阶层： wd ,3 N3 n3 6000 33.3 180.2
5

抽样误差范围： E Z 2 S p 重复的简单随机抽样下样本比例的标准误差： Sp 解得样本量n : n
2 Z 1 2
1
n
E2

如果在以往调查中可以得到总体比例的一个较好的估计，那么直接代入公式即可。否则可以取π=0.5，因为此时总体的方差最大。
10.2.3 权数的调整

无回答时需要对权数调整；考虑来自其他渠道、更具权威性的某些辅助信息，合并到权数中。 1. 对无回答的权数调整 2. 使用辅助信息调整权数 3. 事后分层 4. 比率估计
6

1. 对无回答的权数调整
无回答调整因子是原来样本单元的权数与给出回答的单元的权数和的比值。对于自加权设计，该比值也等于原样本单元数与给出回答的单元数的比值。
29

10.5.1 估计精度与样本量之间的关系
总体参数总体参数的估计值抽样误差的范围（ E）
E Z 2 S x
p Z 2 S p
2）调查回答率 100%
假定条件： 1 ）放回（重复）的简单随机抽样
但实际抽样调查中，以上假定条件可能很难都满足。如样本可能不是重复抽样；抽样方法可能是分层抽样、系统抽样、分群抽样，而非简单随机抽样；调查的回答率实际上很少能达到100%
2 2 1 n 非重复的简单随机抽样下样本比例的标准误差： S p2 1 2 2 2 Z 2

n
1
n N
抽样误差范围： E Z 2S p
n
解得样本量n :
E
Z N
n
N
n
Z 2 1 Z 2 1 E2 2 N
对于来自正态总体的简单随机样本，则（n-1）倍的样本方差与总体方差的比值的抽样分布服从自由度为（n-1）的x2分布。
n 1s

2
2
~ 2 n 1
or
2 x x s i i 1
n
2
~ 2 n 1
总体方差在1-a置信水平下的区间估计为：
n 1s 2 2 n 1s 2 2 2 n 1 2 1- 2 n 1
30

10.5.2 假定条件下样本量的计算及其应用考虑 1、确定样本量的基本公式
1）给定总体均值估计的精度下确定样本量的公式
抽样误差范围： E Z 2 S x 重复的简单随机抽样下样本均值的标准误差： Sx 解得样本量n : n
2 2 Z 2
n
E2
31

2）给定比例估计的精度下确定样本量的公式
第10章抽样估计与样本量确定

Байду номын сангаас

10.1 引言 10.2 加权及权数调整 10.3 抽样分布与抽样误差 10.4 参数估计 10.5 样本量的确定
1
10.1 引言

抽样调查的目的是用样本推断总体。确定样本权数是估计过程中一个重要组成部分。当确定了每个样本单元的权数后，就可以将它们应用于抽样估计，包括总体总量、均值和比例等简单估计值的计算，抽样误差的估计。
3
设计权数wd
1
1 100
100

10.2.1 等概率抽样的加权（自加权设计）
入样概率
P 1
n1 20 1 N1 2000 100
入样概率 P2 N2
4
n

2
120 1 12000 100
入样概率
P3
n3 60 1 N 3 6000 100

10.2.2 不等概率抽样加权
9
例10-5

利用设计权数计算调查估计值
10
例10-5
wpst ,男性 N男性 360 6.55 nr ,男性 55 wpst ,女性 N女性 420 9.33 nr ,女性 45
11

4. 比率估计
比率估计：用一个乘数因子对各类权数进行调整，这个乘数因子就是各类的辅助变量值与同类的样本估计值的比率。如例10-5中，男性层的调整因子（男性数量与男性估计值之比）即是一种乘数因子。
Sx
n

3）若总体 X ~ N
,那么，
2
x ~ N ,

2
n

4）总体不服从正态分布，当样本量足够大时（大于等于30），样本均值也服从正态分布。
16

10.3.2 样本比例的抽样分布及抽样误差
N0 总体比例 N n0 样本比例 n
样本容量足够大时
样本比例期望值 E p
2
38
总体大小对确定样本量的影响（表10-11）
样本量随总体大小变化的趋势
样本量
500 400 300 200 100 0 50 100 500 1000 5000 10000 1E+05 1E+06 1E+07 总体大小 44 79 217 278 357 370 383
88
384
384
39

32

2、对样本量基本公式的应用考虑

1）多大抽样误差对调研目标而言是可以接受的 2）是否需要对调查总体中的子总体（域）进行估计 3）相对于调查估计值的抽样误差应该多大为宜 4）精度要求的实际含义是什么
33
精度要求与样本量
0.0693 0.0196
34

10.5.3 关于确定样本量的现实复杂考虑及计算 1、关于确定样本量的现实复杂考虑

区间估计

21

1、总体均值的区间估计
当总体标准差未知时，一般通过样本标准差S来估计总体标准差
Sx S n

当总体标准差已知时，样本均值标准误可以通过如下公式：
Sx n
22
例10-7
23

2、总体比例的区间估计
p Z 2 S p
S p—样本比例的标准误差
例10-6：一个总体，含四个元素1、2、3、4，现抽取 n=2个简单随机样本。
1 2 3 4 总体均值 2 .5 N 4
i 1 i 2 x i i 1 N
x
N
总体方差 2
N
1.25
14

抽样均值及方差
15
结论

1）
E x
2

2 2） S x OR n

40

设某一抽样设计样本估计值的方差为 S (，同等样本 ˆ) 2 S 量的简单随机抽样设计的样本估计值的方差为在抽 ˆ ) ( 样设计效应Deff为：
1 0
2

第10章 抽样估计与样本量确定

样本量的确定

《市场调查与预测》课程教学大纲 烟台南山学院

MRAF-C10 抽样估计与样本量确定

抽样误差与样本量

第十章 审计抽样201201

如何确定抽样方法与样本量

抽样方法及样本量的确定

样本量的确定方法

抽样样本量的确定

市场调研中的样本选择与样本量确定

【转】如何确定样本量

(朱锦余)审计学(第四版)章后习题参考答案：第10章 审计抽样习题+案例

样本量估计

抽样样本量的确定

抽样样本量的确定

样本量的确定方法

抽样估计与样本量确定

第10章抽样估计与样本量确定

《市场调查与预测》课程教学大纲烟台南山学院

第十章审计抽样201201

(朱锦余)审计学(第四版)章后习题参考答案：第10章审计抽样习题+案例