样本量大小评估
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
进行分析
7
• 例如:估计快餐族平均每月吃快餐的平均次数: 与公司的管理者进行磋商后,市场调研经理认为有必要估计一 下吃快餐的平均次数。考虑到管理者对精确度的要求,他规定 估计值不得超过实际值的0.10。这个值将作为h带入公式。 此外,市场调研经理还认为,考虑全局,需要把实际总体平 均值在区间以内的置信度定为95%。而若要置信度为95%,就 必须是在2倍标准误差范围内(严格为1.96)。因此2作为Z值 代入公式 最后确定公式中的值,幸好公司做过类似的调查。调查对象 是最近30天内吃快餐的平均次数。标准差为1.39,带入样本容 量的公式。经过计算,可知样本容量为722时,可以满足提出 的要求。
Thanks!
谢谢!
样本量的评估
C = Complete I = In Progres N = Not Done
N/A = Not Applicable
: 预测值
样本量的评估
-3 -2 -
目标值
2 3
C = Complete I = In Progres N = Not Done
N/A = Not Applicable
n = Z2 2
h2
• 其中: • Z = 标准误差的置信水平 • = 总体标准差 • h = 允许误差(可接受误差水平)
6
计算样本容量——均值问题
• 置信水平Z和误差E的确定需要由调研人 员同客户进行磋商后确定,要在精确度、 置信度和成本之间进行衡量。
• 估计总体标准误差的四种方法
1.利用以前的结果 2.进行试验性调查 3.利用二手资料 4.通过判断,把许多管理人员的判断集中起来
4.第二类错误的概率, 1- 又称统计效能,1- 越大,需要的样 本量越多,一般取=0.1。
C = Complete I = In Progres N = Not Done
N/A = Not Applicable
样本量的评估Байду номын сангаас
标准差
N POWER
Power=0.68<0.9,样本量 不足,需要更多的样本
样本量的评估
原则上: 1.二样本间均数差别愈大,需要的样本量越少,均数差别越小,需 要样本量越多。
2.另一方面综合估计标准差愈小,则需要样本量越少,标准差越大, 需要样本量越多,因而在确定样本量之先,一定要知道标准差的约 略值。
3.第一类错误的概率,越小,需要的样本量越多,一般取=0.05, 可根据具体情况进行调整。
1. : 第一类风险(拒真错误),取0.05; 2. : 第二类风险(取伪错误),取0.1; 3. : 要检测的变异; 4. n: 样本量的大小. 5.Power:获取统计量的概率,显示统计量的显著性。功效越大越 好,便样本量越大,成本越高。要求至少为0.9
可使用软件:Mintab,JMP.
样本量的评估
样本量的评估
对于计数型的特性样本量计算:
用于计数型数据样本量一般要求较大的子组,以便检验出性能的 一般变化:一般选择 N=100,且NP>=5(不良的个数) P为不良率 当N=100为最小样本量,当N=100,NP<5时,说明样本量不足。 例如:目前倒装开路不良率为1%,为验证变更对开路的影响, 样本量为:N>=5/P=5/0.01=500,至少需要500个样品进行验证。
• 理论基础是中心极限定理:随着样本容量的增加,从 任一总体中抽取的大量随机样本平均数的分布接近服 从正态分布。
• 其均值为 ,且标准差等于: S x n
n为样本容量, 为总体的标准差 x ~ N ( , 2 )
n
3
平均数或百分率标准误差的概念
• 实际总体值与所预期的典型样本结果的差距。
8
计算样本容量——比率问题 n = Z2 PQ
h2
– 保守估计可取P值为.50 – 给定 Z 和 E, P 将得到最大可能样本 – P=0.50 将会使PQ 最大
9
样本量的评估
PCRA中有关样本量的表,对于计量型的特性样本量计算
Quality Characteristic
n
power
分别的意义:
样本量的计算评估
抽样分布的概念
• 总体分布
– 总体中全部单位的频率分布,平均数为,标准差
• 样本分布
– 单个样本中所有单位的频率分布,具体的分布形式依赖于 总体分布。
• 抽样分布
– 一个总体中许多独立样本均值的理论分布。在大样本的情 况下,其分布近似服从于正态分布。
2
抽样分布的概念
• 如果样本是随机的且容量足够大,则样本均值的分布 近似于正态分布
误差。
Sx
pq n
1 CNn
CN n
(pi
i1
P)2
– Sp百分率标准误差;p为样本中的百分率;q=1-p; n为 样本容量。
例:假设抽选中的100名驾驶者中有40%的人表示其汽车上 配有辐射状轮胎。则标准误差为:=4.899
5
计算样本容量——均值问题
• 在简单随机抽样的条件下,样本容量为
– 平均数标准误差,即样本均值的标准差(抽样误差)。
Sx
n
1 CNn
CNn
(xi
i1
X)2
– 由于总体标准差是未知的,一般由样本标准差s代替。
– 例如:驾驶里程调查中,样本容量n是100名驾驶者,标准 差是3000公里,则平均数标准误差=300。
4
平均数或百分率标准误差的概念
– 标准误差还适用于研究百分率的调查,称之为百分率标准
7
• 例如:估计快餐族平均每月吃快餐的平均次数: 与公司的管理者进行磋商后,市场调研经理认为有必要估计一 下吃快餐的平均次数。考虑到管理者对精确度的要求,他规定 估计值不得超过实际值的0.10。这个值将作为h带入公式。 此外,市场调研经理还认为,考虑全局,需要把实际总体平 均值在区间以内的置信度定为95%。而若要置信度为95%,就 必须是在2倍标准误差范围内(严格为1.96)。因此2作为Z值 代入公式 最后确定公式中的值,幸好公司做过类似的调查。调查对象 是最近30天内吃快餐的平均次数。标准差为1.39,带入样本容 量的公式。经过计算,可知样本容量为722时,可以满足提出 的要求。
Thanks!
谢谢!
样本量的评估
C = Complete I = In Progres N = Not Done
N/A = Not Applicable
: 预测值
样本量的评估
-3 -2 -
目标值
2 3
C = Complete I = In Progres N = Not Done
N/A = Not Applicable
n = Z2 2
h2
• 其中: • Z = 标准误差的置信水平 • = 总体标准差 • h = 允许误差(可接受误差水平)
6
计算样本容量——均值问题
• 置信水平Z和误差E的确定需要由调研人 员同客户进行磋商后确定,要在精确度、 置信度和成本之间进行衡量。
• 估计总体标准误差的四种方法
1.利用以前的结果 2.进行试验性调查 3.利用二手资料 4.通过判断,把许多管理人员的判断集中起来
4.第二类错误的概率, 1- 又称统计效能,1- 越大,需要的样 本量越多,一般取=0.1。
C = Complete I = In Progres N = Not Done
N/A = Not Applicable
样本量的评估Байду номын сангаас
标准差
N POWER
Power=0.68<0.9,样本量 不足,需要更多的样本
样本量的评估
原则上: 1.二样本间均数差别愈大,需要的样本量越少,均数差别越小,需 要样本量越多。
2.另一方面综合估计标准差愈小,则需要样本量越少,标准差越大, 需要样本量越多,因而在确定样本量之先,一定要知道标准差的约 略值。
3.第一类错误的概率,越小,需要的样本量越多,一般取=0.05, 可根据具体情况进行调整。
1. : 第一类风险(拒真错误),取0.05; 2. : 第二类风险(取伪错误),取0.1; 3. : 要检测的变异; 4. n: 样本量的大小. 5.Power:获取统计量的概率,显示统计量的显著性。功效越大越 好,便样本量越大,成本越高。要求至少为0.9
可使用软件:Mintab,JMP.
样本量的评估
样本量的评估
对于计数型的特性样本量计算:
用于计数型数据样本量一般要求较大的子组,以便检验出性能的 一般变化:一般选择 N=100,且NP>=5(不良的个数) P为不良率 当N=100为最小样本量,当N=100,NP<5时,说明样本量不足。 例如:目前倒装开路不良率为1%,为验证变更对开路的影响, 样本量为:N>=5/P=5/0.01=500,至少需要500个样品进行验证。
• 理论基础是中心极限定理:随着样本容量的增加,从 任一总体中抽取的大量随机样本平均数的分布接近服 从正态分布。
• 其均值为 ,且标准差等于: S x n
n为样本容量, 为总体的标准差 x ~ N ( , 2 )
n
3
平均数或百分率标准误差的概念
• 实际总体值与所预期的典型样本结果的差距。
8
计算样本容量——比率问题 n = Z2 PQ
h2
– 保守估计可取P值为.50 – 给定 Z 和 E, P 将得到最大可能样本 – P=0.50 将会使PQ 最大
9
样本量的评估
PCRA中有关样本量的表,对于计量型的特性样本量计算
Quality Characteristic
n
power
分别的意义:
样本量的计算评估
抽样分布的概念
• 总体分布
– 总体中全部单位的频率分布,平均数为,标准差
• 样本分布
– 单个样本中所有单位的频率分布,具体的分布形式依赖于 总体分布。
• 抽样分布
– 一个总体中许多独立样本均值的理论分布。在大样本的情 况下,其分布近似服从于正态分布。
2
抽样分布的概念
• 如果样本是随机的且容量足够大,则样本均值的分布 近似于正态分布
误差。
Sx
pq n
1 CNn
CN n
(pi
i1
P)2
– Sp百分率标准误差;p为样本中的百分率;q=1-p; n为 样本容量。
例:假设抽选中的100名驾驶者中有40%的人表示其汽车上 配有辐射状轮胎。则标准误差为:=4.899
5
计算样本容量——均值问题
• 在简单随机抽样的条件下,样本容量为
– 平均数标准误差,即样本均值的标准差(抽样误差)。
Sx
n
1 CNn
CNn
(xi
i1
X)2
– 由于总体标准差是未知的,一般由样本标准差s代替。
– 例如:驾驶里程调查中,样本容量n是100名驾驶者,标准 差是3000公里,则平均数标准误差=300。
4
平均数或百分率标准误差的概念
– 标准误差还适用于研究百分率的调查,称之为百分率标准