六西格玛分析之置信区间
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
置信区间 -8-
95%的置信区间
绝大多数情况下,我们计算95%的置信区间(CI)
这可解释为
100中大约95的CI将包含总体参数,或者 我们95%确信总体参数在此区间内
反观以前,我们看到大约95%的样本平均在总体平均的2倍标准 差内 (正态分布时 Z= ±2s内的概率约为95%.)
[ 注意 ] 当样本容量相当大时,即使总体分布形式未知或总体为非正态分
布,根据定理,样本均值近似服从正态分布,因此估计总体均值的 方法与上述方法相同;
大样本情况下,当总体方差未知而用样本方差代替时,由于t分 布可用正态分布近似,所以对总体均值的估计也采用上述方法。
置信区间 -13-
[ 例题2 ] 某企业生产某种产品的工人有1000人,某日采用不重复抽样
六西格玛分析之置信区间
置信区间
( Confidence Intervals )
置信区间 -2-
路径位置
Define Measure Analyze
Step 7- Data 收集 Step 8- Data 分析
多变量研究 中心极限定理 假设检验 置信区间 方差分析,均值检验 卡方检验 相关/回归分析
1)总体均值u的置信区间; 2)总体方差σ 的置信区间; 3)工程能力Cp的置信区间; 4)总体比例P的置信区间;
置信区间 -10-
1)总体均值的置信区间
1-1)总体方差已知时,正态总体均值的区间估计 [ 一般公式 ]
x Za/2s(x) m x +Za/2s(x)
x 其中 称为样本均值;
所以对总体数字特征的抽样估计也叫参数估计。 可分为:点估计和区间估计。
预测总体特征
总体
抽取样本
零假设 样本 备择假设
P-value
置信区间 -5-
总体参数
参数估计
统计量
区间估计:
根据样本估计量以一定可靠程度推断总体参数所在的区间范围。
这种估计方法不仅以样本估计量为依据,而且考虑了估计量的分布,所以它 能给出估计精度,也能说明估计结果的把握程度。
如果我们从一个工程中随机抽取一个样本并计算其平均值时, 我们确信其样本的均值包含在总体中的概率是95%.
置信区间 -9-
置信区间介绍
求参数置信区间时可参考下面的通用格式:
置信区间= 统计量±K*(标准误差) 这里,统计量 = 均值、方差、Cp等 K = 基于某统计分布的常数
置信区间反映我们的点估计的样本与样本间的散布 我们将考虑如下的置信区间:
置信区间 -3-
Step 9- Vital Few X’的选定
Improve
理论课
Control
目录
置信区间介绍 总体均值的置信区间 总体标准差的置信区间 Cp的置信区间 置信区间例题
置信区间 -4-
统计性推断
抽样估计: 根据样本提供的信息对总体的某些特征进行估计或推断。
估计量或统计量: 用来估计总体特征的的样本指标; 总体参数:待估计的总体指标。
①将题中的6个数据输入到Minitab中的C1列 ②路径:统计→基本统计→单样本Z…
③输入相关参数(参考右图)
置信区间 -12-
④输出结果:
平均值 变量 N 平均值 标准差 标准误 95% 置信区间 C1 6 15.0000 0.2191 0.0204 (14.9600, 15.0400) ⑤结论:该产品直径的均值置信区间为(14.96, 15.04)cm
从中随机抽取100人调查他们的当日产量,样本人均产量为35件, 产量的样本标准差为4.5件,试以95.5%的置信度估计平均产量的 置信区间。 [ Minitab解法 ]
①打开Minitab ②路径:统计→基本统计量→单样本Z…
置信区间 -14-
③输入相关参数(参考下图)
④输出结果: 平均值
N 平均值 标准误 95.5% 置信区间 100 35.000 0.450 (34.098, 35.902) ⑤结论:平均产量的均值置信区间为( 34.0979, 35.9021 )件
置信区间 -15-
1-2)总体方差未知时,正态总体均值的区间估计(小样本)
[ 一般公式 ]
sm s x ta/2 ,n 1Sn x+ ta/2 ,n 1
S
n
x 其中 称为样本均值;
ta/2,n-1 称为对应于a/2,自由度为n-1的的 t 值; ta/2,n-1 s 称为抽样极限误差(△x)
通称为置信限。
α为显著性水平;
1- α则称为置信度,
置信区间 -7-
置信区间的意义
• 它表示区间估计的可靠程度或把握程度,也即所估计的区间包含总体真 实的可能性。 • 置信度为1-α 的置信区间也就表示以1-α 的可能性(概率)包含了未知 总体参数的区间。 • 置信区间的直观意义为:
若作多次同样的抽样,将得到多个置信区间,那么其中有的区间包含 了总体参数的真值,有点区间却未包含总体参数的真值。平均说来,包含 总体参数真值的区间有(1-α )*100%,反之有α *100%的区间未包含总体 参数真值。
Za/2 称为对应于a/2的Z值;
s( x ) 称为抽样平均误差;
Za/2s( x ) 称为抽样极限误差(△x)
置信区间 -11-
[ 例题1 ] 某企业从长期实践得知,其产品直径X是一个随机变量,服从
标准差为0.05的正态分布。从某日产品中随机抽取6个,测得其直 径分别为14.8,15.3,15.1,15,14.7,15.1(单位:厘米)。 在0.95的置信度下,试求该产品直径的均值的置信区间。 [ Minitab解法 ]
利用基于统计学的置信区间来量化样本的不确定性置Biblioteka 区间 -6-置信区间的定义
设总体参数为θ
,
θL、
θ
为样本确定的两个样本量,
U
对于给定的α( 0 < α<1),有
P( θL ≤ θ≤ θ U ) = 1- α
则称( θL ,θ U )为参数θ的置信度为1- α的置信区间。 该区间的两个端点θL 、θ U分别称为置信下限和置信上限,
n
置信区间 -16-
[ 例题3 ] 某食品厂从一批袋装食品中随机抽取10袋,测得每袋重量(单
位:克)分别为789、780、794、762、802、813、770、785、810、 806,要求以95%的把握程度,估计这批食品的平均每袋重量的区间 范围及其允许误差。 [ Minitab解法 ]
95%的置信区间
绝大多数情况下,我们计算95%的置信区间(CI)
这可解释为
100中大约95的CI将包含总体参数,或者 我们95%确信总体参数在此区间内
反观以前,我们看到大约95%的样本平均在总体平均的2倍标准 差内 (正态分布时 Z= ±2s内的概率约为95%.)
[ 注意 ] 当样本容量相当大时,即使总体分布形式未知或总体为非正态分
布,根据定理,样本均值近似服从正态分布,因此估计总体均值的 方法与上述方法相同;
大样本情况下,当总体方差未知而用样本方差代替时,由于t分 布可用正态分布近似,所以对总体均值的估计也采用上述方法。
置信区间 -13-
[ 例题2 ] 某企业生产某种产品的工人有1000人,某日采用不重复抽样
六西格玛分析之置信区间
置信区间
( Confidence Intervals )
置信区间 -2-
路径位置
Define Measure Analyze
Step 7- Data 收集 Step 8- Data 分析
多变量研究 中心极限定理 假设检验 置信区间 方差分析,均值检验 卡方检验 相关/回归分析
1)总体均值u的置信区间; 2)总体方差σ 的置信区间; 3)工程能力Cp的置信区间; 4)总体比例P的置信区间;
置信区间 -10-
1)总体均值的置信区间
1-1)总体方差已知时,正态总体均值的区间估计 [ 一般公式 ]
x Za/2s(x) m x +Za/2s(x)
x 其中 称为样本均值;
所以对总体数字特征的抽样估计也叫参数估计。 可分为:点估计和区间估计。
预测总体特征
总体
抽取样本
零假设 样本 备择假设
P-value
置信区间 -5-
总体参数
参数估计
统计量
区间估计:
根据样本估计量以一定可靠程度推断总体参数所在的区间范围。
这种估计方法不仅以样本估计量为依据,而且考虑了估计量的分布,所以它 能给出估计精度,也能说明估计结果的把握程度。
如果我们从一个工程中随机抽取一个样本并计算其平均值时, 我们确信其样本的均值包含在总体中的概率是95%.
置信区间 -9-
置信区间介绍
求参数置信区间时可参考下面的通用格式:
置信区间= 统计量±K*(标准误差) 这里,统计量 = 均值、方差、Cp等 K = 基于某统计分布的常数
置信区间反映我们的点估计的样本与样本间的散布 我们将考虑如下的置信区间:
置信区间 -3-
Step 9- Vital Few X’的选定
Improve
理论课
Control
目录
置信区间介绍 总体均值的置信区间 总体标准差的置信区间 Cp的置信区间 置信区间例题
置信区间 -4-
统计性推断
抽样估计: 根据样本提供的信息对总体的某些特征进行估计或推断。
估计量或统计量: 用来估计总体特征的的样本指标; 总体参数:待估计的总体指标。
①将题中的6个数据输入到Minitab中的C1列 ②路径:统计→基本统计→单样本Z…
③输入相关参数(参考右图)
置信区间 -12-
④输出结果:
平均值 变量 N 平均值 标准差 标准误 95% 置信区间 C1 6 15.0000 0.2191 0.0204 (14.9600, 15.0400) ⑤结论:该产品直径的均值置信区间为(14.96, 15.04)cm
从中随机抽取100人调查他们的当日产量,样本人均产量为35件, 产量的样本标准差为4.5件,试以95.5%的置信度估计平均产量的 置信区间。 [ Minitab解法 ]
①打开Minitab ②路径:统计→基本统计量→单样本Z…
置信区间 -14-
③输入相关参数(参考下图)
④输出结果: 平均值
N 平均值 标准误 95.5% 置信区间 100 35.000 0.450 (34.098, 35.902) ⑤结论:平均产量的均值置信区间为( 34.0979, 35.9021 )件
置信区间 -15-
1-2)总体方差未知时,正态总体均值的区间估计(小样本)
[ 一般公式 ]
sm s x ta/2 ,n 1Sn x+ ta/2 ,n 1
S
n
x 其中 称为样本均值;
ta/2,n-1 称为对应于a/2,自由度为n-1的的 t 值; ta/2,n-1 s 称为抽样极限误差(△x)
通称为置信限。
α为显著性水平;
1- α则称为置信度,
置信区间 -7-
置信区间的意义
• 它表示区间估计的可靠程度或把握程度,也即所估计的区间包含总体真 实的可能性。 • 置信度为1-α 的置信区间也就表示以1-α 的可能性(概率)包含了未知 总体参数的区间。 • 置信区间的直观意义为:
若作多次同样的抽样,将得到多个置信区间,那么其中有的区间包含 了总体参数的真值,有点区间却未包含总体参数的真值。平均说来,包含 总体参数真值的区间有(1-α )*100%,反之有α *100%的区间未包含总体 参数真值。
Za/2 称为对应于a/2的Z值;
s( x ) 称为抽样平均误差;
Za/2s( x ) 称为抽样极限误差(△x)
置信区间 -11-
[ 例题1 ] 某企业从长期实践得知,其产品直径X是一个随机变量,服从
标准差为0.05的正态分布。从某日产品中随机抽取6个,测得其直 径分别为14.8,15.3,15.1,15,14.7,15.1(单位:厘米)。 在0.95的置信度下,试求该产品直径的均值的置信区间。 [ Minitab解法 ]
利用基于统计学的置信区间来量化样本的不确定性置Biblioteka 区间 -6-置信区间的定义
设总体参数为θ
,
θL、
θ
为样本确定的两个样本量,
U
对于给定的α( 0 < α<1),有
P( θL ≤ θ≤ θ U ) = 1- α
则称( θL ,θ U )为参数θ的置信度为1- α的置信区间。 该区间的两个端点θL 、θ U分别称为置信下限和置信上限,
n
置信区间 -16-
[ 例题3 ] 某食品厂从一批袋装食品中随机抽取10袋,测得每袋重量(单
位:克)分别为789、780、794、762、802、813、770、785、810、 806,要求以95%的把握程度,估计这批食品的平均每袋重量的区间 范围及其允许误差。 [ Minitab解法 ]