六西格玛分析之置信区间
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
⑤结论:该产品直径的均值置信区间为(14.96, 15.04)cm
[ 注意 ]
当样本容量相当大时,即使总体分布形式未知或总体为非正态分 布,根据定理,样本均值近似服从正态分布,因此估计总体均值的 方法与上述方法相同;
大样本情况下,当总体方差未知而用样本方差代替时,由于t分 布可用正态分布近似,所以对总体均值的估计也采用上述方法。
x Za/2s(x) m x +Za/2s(x)
x 其中 称为样本均值;
Za/2 称为对应于a/2的Z值;
s( x ) 称为抽样平均误差;
Za/2s( x ) 称为抽样极限误差(△x)
What is 城市轨道交通 urban rail transport
精品ppt模板
[ 例题1 ]
某企业从长期实践得知,其产品直径X是一个随机变量,服从 标准差为0.05的正态分布。从某日产品中随机抽取6个,测得其直 径分别为14.8,15.3,15.1,15,14.7,15.1(单位:厘米)。 在0.95的置信度下,试求该产品直径的均值的置信区间。
What is 城市轨道交通 urban rail transport
精品ppt模板
1. 产生20个随机数据,并保存在C1 2. 求其工程能力
What is 城市轨道交通 urban rail transport
精品ppt模板
3. 统计 → 基本统计量→图形化汇总 4.求总体标准差的置信区间的上限和下限.
置信区间反映我们的点估计的样本与样本间的散布 我们将考虑如下的置信区间:
1)总体均值u的置信区间; 2)总体方差σ的置信区间; 3)工程能力Cp的置信区间; 4)总体比例P的置信区间;
What is 城市轨道交通 urban rail transport
精品ppt模板
1)总体均值的置信区间
1-1)总体方差已知时,正态总体均值的区间估计 [ 一般公式 ]
[ Minitab解法 ]
①将题中的6个数据输入到Minitab中的C1列
②路径:统计→基本统计→单样本Z…
③输入相关参数(参考右图)
What is 城市轨道交通 urban rail transport
精品ppt模板
④输出结果:
平均值 变量 N 平均值 标准差 标准误 95% 置信区间 C1 6 15.0000 0.2191 0.0204 (14.9600, 15.0400)
What is 城市轨道交通 urban rail transport
精品ppt模板
[ 例题2 ]
某企业生产某种产品的工人有1000人,某日采用不重复抽样 从中随机抽取100人调查他们的当日产量,样本人均产量为35件, 产量的样本标准差为4.5件,试以95.5%的置信度估计平均产量的 置信区间。
[ Minitab解法 ]
所以对总体数字特征的抽样估计也叫参数估计。 可分为:点估计和区间估计。
预测总体特征
总体
抽取样本
零假设 样本 备择假设
P-value
What is 城市轨道交通 urban rail transport
精品ppt模板
总体参数
参数估计
统计量
区间估计:
根据样本估计量以一定可靠程度推断总体参数所在的区间范围。
精品ppt模板
置信区间的意义
• 它表示区间估计的可靠程度或把握程度,也即所估计的区间包含总体真 实的可能性。
• 置信度为1-α的置信区间也就表示以1-α的可能性(概率)包含了未知 总体参数的区间。
• 置信区间的直观意义为:
若作多次同样的抽样,将得到多个置信区间,那么其中有的区间包含 了总体参数的真值,有点区间却未包含总体参数的真值。平均说来,包含 总体参数真值的区间有(1-α)*100%,反之有α*100%的区间未包含总体 参数真值。
精品ppt模板
Cp的置信区间Minitab模拟
❖ 我们将定义一个过程,其目标值为70,USL=100,LSL=40. ❖ 班上的每个人都从一个平均值=70,标准差=10的分布中产生 20
个随机正态数字 ❖ 假设我们的“真实的”Cp = 1.00. ❖ 产生数据后,先用Minitab计算出Cp; ❖ 再用前面的公式计算 Cp的95%置信区间; ❖ 假设班里的人数为 50,我们期待至少一个 CI 不包含1.00 ❖ 准备发表你的结果
如果我们从一个工程中随机抽取一个样本并计算其平均值时, 我们确信其样本的均值包含在总体中的概率是95%.
What is 城市轨道交通 urban rail transport
精品ppt模板
置信区间介绍
求参数置信区间时可参考下面的通用格式:
置信区间= 统计量±K*(标准误差)
这里,统计量 = 均值、方差、Cp等 K = 基于某统计分布的常数
[ 一般公式 ](小样本)
sS
n1
c2 a /2
s
sS
n1
c2 1a /2
s 其中 称为样本标准差;
χ2a /2 称为对应于a/2的Chi-Square值;
n1 称为自由度;
What is 城市轨道交通 urban rail transport
精品ppt模板
假设我们获得一个16个数据点的样本,得到的标准偏差为1.66。 自由度()为16-1 或 15。 Sigma的 95% (a = .05)置信区间是:
Improve
理论课
Control
目录
Leabharlann Baidu
置信区间介绍
总体均值的置信区间
总体标准差的置信区间
Cp的置信区间
置信区间例题
What is 城市轨道交通 urban rail transport
精品ppt模板
统计性推断
抽样估计: 根据样本提供的信息对总体的某些特征进行估计或推断。
✓ 估计量或统计量: 用来估计总体特征的的样本指标; ✓ 总体参数:待估计的总体指标。
六西格玛分析之置信区 间
What is 城市轨道交通 urban rail transport
精品ppt模板
置信区间
( Confidence Intervals )
What is 城市轨道交通 urban rail transport
精品ppt模板
路径位置
Define
Measure
Analyze
What is 城市轨道交通 urban rail transport
精品ppt模板
5. 求Cp的置信区间
总体标准差的置信区间 下限 Sigma 上限 样本大小
8.689 11.425 16.687 20
现在我们可以使用这些估计的上下限来计算Cp的置信区间了
Cp( Best Case) =
100 40 6*8.689
c
2 a
/
2,n-1
n -1
n -1
Cp=2.29 (n=20) 的 95% 置信区间计算如右:
Cp
c
2 1-a
/
2, n
-1
Cp Cp
c
2 a
/
2, n -1
n -1
n -1
这就是说,我们有 95% 把握说真实的 Cp 值在1.57 和 3.01之间
What is 城市轨道交通 urban rail transport
p 其中 称为样本比例;
Za/2s( p ) 称为抽样极限误差(△p)
What is 城市轨道交通 urban rail transport
精品ppt模板
[ Minitab解法 ]
①将题中的10个数据输入到Minitab中的C1列
②路径:统计→基本统计量→单样本t…
What is 城市轨道交通 urban rail transport
精品ppt模板
③输入相关参数(参考右图)
④输出结果:
平均值 变量 N 平均值 标准差 标准误 C1 10 791.10 17.14 5.42
Step 7- Data 收集
Step 8- Data 分析 多变量研究 中心极限定理 假设检验 置信区间 方差分析,均值检验 卡方检验 相关/回归分析
What is 城市轨道交通 urban rail transport
精品ppt模板
Step 9- Vital Few X’的选定
What is 城市轨道交通 urban rail transport
精品ppt模板
[ 例题3 ]
某食品厂从一批袋装食品中随机抽取10袋,测得每袋重量(单 位:克)分别为789、780、794、762、802、813、770、785、810、 806,要求以95%的把握程度,估计这批食品的平均每袋重量的区间 范围及其允许误差。
95% 置信区间 (778.84, 803.36)
⑤结论:该产品每袋重量的均值置信区间为( 778.841, 803.359 )克; 允许误差:2.262 * 5.419 = 12.26(克)
What is 城市轨道交通 urban rail transport
精品ppt模板
2)总体标准差的置信区间
这种估计方法不仅以样本估计量为依据,而且考虑了估计量的分布,所以它 能给出估计精度,也能说明估计结果的把握程度。
利用基于统计学的置信区间来量化样本的不确定性
What is 城市轨道交通 urban rail transport
精品ppt模板
置信区间的定义
设总体参数为θ
,
θL、
θ
为样本确定的两个样本量,
精品ppt模板
③输出结果
④结论:样本的标准差是 17.14 , 总体标准差的95%的置信区间在 11.79和31.78之间。
What is 城市轨道交通 urban rail transport
精品ppt模板
3)工程能力Cp的置信区间
[ 一般公式 ]
Cp
c
2 1-a
/
2,n-1
Cp Cp
What is 城市轨道交通 urban rail transport
精品ppt模板
95%的置信区间
绝大多数情况下,我们计算95%的置信区间(CI)
这可解释为
100中大约95的CI将包含总体参数,或者 我们95%确信总体参数在此区间内
反观以前,我们看到大约95%的样本平均在总体平均的2倍标准 差内 (正态分布时 Z= ±2s内的概率约为95%.)
What is 城市轨道交通 urban rail transport
精品ppt模板
[ 例题4 ] 用[例题3]的10个数据求标准差的置信区间
[ Minitab解法 ]
①将题中的10个数据输入到Minitab中的C1列 ②路径:统计→基本统计量→图形化汇总…
What is 城市轨道交通 urban rail transport
What is 城市轨道交通 urban rail transport
精品ppt模板
1-2)总体方差未知时,正态总体均值的区间估计(小样本)
[ 一般公式 ]
S
S
x 其中 称为样本均值;
ta/2,n-1 称为对应于a/2,自由度为n-1的的 t 值; ta/2,n-1 s 称为抽样极限误差(△x)
n
= 1.15
Cp(Worst
Case)
= 100 40 6*16.687
=0.599
我们看到这是一个包含1.00的实际Cp 95%的置信区间
What is 城市轨道交通 urban rail transport
精品ppt模板
4)总体比率(或比例)P的置信区间
[ 一般公式 ]
p Za/2s(p) P p +Za/2s(p)
①打开Minitab
②路径:统计→基本统计量→单样本Z…
What is 城市轨道交通 urban rail transport
精品ppt模板
③输入相关参数(参考下图)
④输出结果:
平均值 N 平均值 标准误
95.5% 置信区间
100 35.000 0.450 (34.098, 35.902)
⑤结论:平均产量的均值置信区间为( 34.0979, 35.9021 )件
U
对于给定的α( 0 < α<1),有
P( θL ≤ θ≤ θ U ) = 1- α
➢则称( θL ,θ U )为参数θ的置信度为1- α的置信区间。 ➢该区间的两个端点θL 、θ U分别称为置信下限和置信上限,
通称为置信限。
➢ α为显著性水平;
➢ 1- α则称为置信度,
What is 城市轨道交通 urban rail transport
[ 注意 ]
当样本容量相当大时,即使总体分布形式未知或总体为非正态分 布,根据定理,样本均值近似服从正态分布,因此估计总体均值的 方法与上述方法相同;
大样本情况下,当总体方差未知而用样本方差代替时,由于t分 布可用正态分布近似,所以对总体均值的估计也采用上述方法。
x Za/2s(x) m x +Za/2s(x)
x 其中 称为样本均值;
Za/2 称为对应于a/2的Z值;
s( x ) 称为抽样平均误差;
Za/2s( x ) 称为抽样极限误差(△x)
What is 城市轨道交通 urban rail transport
精品ppt模板
[ 例题1 ]
某企业从长期实践得知,其产品直径X是一个随机变量,服从 标准差为0.05的正态分布。从某日产品中随机抽取6个,测得其直 径分别为14.8,15.3,15.1,15,14.7,15.1(单位:厘米)。 在0.95的置信度下,试求该产品直径的均值的置信区间。
What is 城市轨道交通 urban rail transport
精品ppt模板
1. 产生20个随机数据,并保存在C1 2. 求其工程能力
What is 城市轨道交通 urban rail transport
精品ppt模板
3. 统计 → 基本统计量→图形化汇总 4.求总体标准差的置信区间的上限和下限.
置信区间反映我们的点估计的样本与样本间的散布 我们将考虑如下的置信区间:
1)总体均值u的置信区间; 2)总体方差σ的置信区间; 3)工程能力Cp的置信区间; 4)总体比例P的置信区间;
What is 城市轨道交通 urban rail transport
精品ppt模板
1)总体均值的置信区间
1-1)总体方差已知时,正态总体均值的区间估计 [ 一般公式 ]
[ Minitab解法 ]
①将题中的6个数据输入到Minitab中的C1列
②路径:统计→基本统计→单样本Z…
③输入相关参数(参考右图)
What is 城市轨道交通 urban rail transport
精品ppt模板
④输出结果:
平均值 变量 N 平均值 标准差 标准误 95% 置信区间 C1 6 15.0000 0.2191 0.0204 (14.9600, 15.0400)
What is 城市轨道交通 urban rail transport
精品ppt模板
[ 例题2 ]
某企业生产某种产品的工人有1000人,某日采用不重复抽样 从中随机抽取100人调查他们的当日产量,样本人均产量为35件, 产量的样本标准差为4.5件,试以95.5%的置信度估计平均产量的 置信区间。
[ Minitab解法 ]
所以对总体数字特征的抽样估计也叫参数估计。 可分为:点估计和区间估计。
预测总体特征
总体
抽取样本
零假设 样本 备择假设
P-value
What is 城市轨道交通 urban rail transport
精品ppt模板
总体参数
参数估计
统计量
区间估计:
根据样本估计量以一定可靠程度推断总体参数所在的区间范围。
精品ppt模板
置信区间的意义
• 它表示区间估计的可靠程度或把握程度,也即所估计的区间包含总体真 实的可能性。
• 置信度为1-α的置信区间也就表示以1-α的可能性(概率)包含了未知 总体参数的区间。
• 置信区间的直观意义为:
若作多次同样的抽样,将得到多个置信区间,那么其中有的区间包含 了总体参数的真值,有点区间却未包含总体参数的真值。平均说来,包含 总体参数真值的区间有(1-α)*100%,反之有α*100%的区间未包含总体 参数真值。
精品ppt模板
Cp的置信区间Minitab模拟
❖ 我们将定义一个过程,其目标值为70,USL=100,LSL=40. ❖ 班上的每个人都从一个平均值=70,标准差=10的分布中产生 20
个随机正态数字 ❖ 假设我们的“真实的”Cp = 1.00. ❖ 产生数据后,先用Minitab计算出Cp; ❖ 再用前面的公式计算 Cp的95%置信区间; ❖ 假设班里的人数为 50,我们期待至少一个 CI 不包含1.00 ❖ 准备发表你的结果
如果我们从一个工程中随机抽取一个样本并计算其平均值时, 我们确信其样本的均值包含在总体中的概率是95%.
What is 城市轨道交通 urban rail transport
精品ppt模板
置信区间介绍
求参数置信区间时可参考下面的通用格式:
置信区间= 统计量±K*(标准误差)
这里,统计量 = 均值、方差、Cp等 K = 基于某统计分布的常数
[ 一般公式 ](小样本)
sS
n1
c2 a /2
s
sS
n1
c2 1a /2
s 其中 称为样本标准差;
χ2a /2 称为对应于a/2的Chi-Square值;
n1 称为自由度;
What is 城市轨道交通 urban rail transport
精品ppt模板
假设我们获得一个16个数据点的样本,得到的标准偏差为1.66。 自由度()为16-1 或 15。 Sigma的 95% (a = .05)置信区间是:
Improve
理论课
Control
目录
Leabharlann Baidu
置信区间介绍
总体均值的置信区间
总体标准差的置信区间
Cp的置信区间
置信区间例题
What is 城市轨道交通 urban rail transport
精品ppt模板
统计性推断
抽样估计: 根据样本提供的信息对总体的某些特征进行估计或推断。
✓ 估计量或统计量: 用来估计总体特征的的样本指标; ✓ 总体参数:待估计的总体指标。
六西格玛分析之置信区 间
What is 城市轨道交通 urban rail transport
精品ppt模板
置信区间
( Confidence Intervals )
What is 城市轨道交通 urban rail transport
精品ppt模板
路径位置
Define
Measure
Analyze
What is 城市轨道交通 urban rail transport
精品ppt模板
5. 求Cp的置信区间
总体标准差的置信区间 下限 Sigma 上限 样本大小
8.689 11.425 16.687 20
现在我们可以使用这些估计的上下限来计算Cp的置信区间了
Cp( Best Case) =
100 40 6*8.689
c
2 a
/
2,n-1
n -1
n -1
Cp=2.29 (n=20) 的 95% 置信区间计算如右:
Cp
c
2 1-a
/
2, n
-1
Cp Cp
c
2 a
/
2, n -1
n -1
n -1
这就是说,我们有 95% 把握说真实的 Cp 值在1.57 和 3.01之间
What is 城市轨道交通 urban rail transport
p 其中 称为样本比例;
Za/2s( p ) 称为抽样极限误差(△p)
What is 城市轨道交通 urban rail transport
精品ppt模板
[ Minitab解法 ]
①将题中的10个数据输入到Minitab中的C1列
②路径:统计→基本统计量→单样本t…
What is 城市轨道交通 urban rail transport
精品ppt模板
③输入相关参数(参考右图)
④输出结果:
平均值 变量 N 平均值 标准差 标准误 C1 10 791.10 17.14 5.42
Step 7- Data 收集
Step 8- Data 分析 多变量研究 中心极限定理 假设检验 置信区间 方差分析,均值检验 卡方检验 相关/回归分析
What is 城市轨道交通 urban rail transport
精品ppt模板
Step 9- Vital Few X’的选定
What is 城市轨道交通 urban rail transport
精品ppt模板
[ 例题3 ]
某食品厂从一批袋装食品中随机抽取10袋,测得每袋重量(单 位:克)分别为789、780、794、762、802、813、770、785、810、 806,要求以95%的把握程度,估计这批食品的平均每袋重量的区间 范围及其允许误差。
95% 置信区间 (778.84, 803.36)
⑤结论:该产品每袋重量的均值置信区间为( 778.841, 803.359 )克; 允许误差:2.262 * 5.419 = 12.26(克)
What is 城市轨道交通 urban rail transport
精品ppt模板
2)总体标准差的置信区间
这种估计方法不仅以样本估计量为依据,而且考虑了估计量的分布,所以它 能给出估计精度,也能说明估计结果的把握程度。
利用基于统计学的置信区间来量化样本的不确定性
What is 城市轨道交通 urban rail transport
精品ppt模板
置信区间的定义
设总体参数为θ
,
θL、
θ
为样本确定的两个样本量,
精品ppt模板
③输出结果
④结论:样本的标准差是 17.14 , 总体标准差的95%的置信区间在 11.79和31.78之间。
What is 城市轨道交通 urban rail transport
精品ppt模板
3)工程能力Cp的置信区间
[ 一般公式 ]
Cp
c
2 1-a
/
2,n-1
Cp Cp
What is 城市轨道交通 urban rail transport
精品ppt模板
95%的置信区间
绝大多数情况下,我们计算95%的置信区间(CI)
这可解释为
100中大约95的CI将包含总体参数,或者 我们95%确信总体参数在此区间内
反观以前,我们看到大约95%的样本平均在总体平均的2倍标准 差内 (正态分布时 Z= ±2s内的概率约为95%.)
What is 城市轨道交通 urban rail transport
精品ppt模板
[ 例题4 ] 用[例题3]的10个数据求标准差的置信区间
[ Minitab解法 ]
①将题中的10个数据输入到Minitab中的C1列 ②路径:统计→基本统计量→图形化汇总…
What is 城市轨道交通 urban rail transport
What is 城市轨道交通 urban rail transport
精品ppt模板
1-2)总体方差未知时,正态总体均值的区间估计(小样本)
[ 一般公式 ]
S
S
x 其中 称为样本均值;
ta/2,n-1 称为对应于a/2,自由度为n-1的的 t 值; ta/2,n-1 s 称为抽样极限误差(△x)
n
= 1.15
Cp(Worst
Case)
= 100 40 6*16.687
=0.599
我们看到这是一个包含1.00的实际Cp 95%的置信区间
What is 城市轨道交通 urban rail transport
精品ppt模板
4)总体比率(或比例)P的置信区间
[ 一般公式 ]
p Za/2s(p) P p +Za/2s(p)
①打开Minitab
②路径:统计→基本统计量→单样本Z…
What is 城市轨道交通 urban rail transport
精品ppt模板
③输入相关参数(参考下图)
④输出结果:
平均值 N 平均值 标准误
95.5% 置信区间
100 35.000 0.450 (34.098, 35.902)
⑤结论:平均产量的均值置信区间为( 34.0979, 35.9021 )件
U
对于给定的α( 0 < α<1),有
P( θL ≤ θ≤ θ U ) = 1- α
➢则称( θL ,θ U )为参数θ的置信度为1- α的置信区间。 ➢该区间的两个端点θL 、θ U分别称为置信下限和置信上限,
通称为置信限。
➢ α为显著性水平;
➢ 1- α则称为置信度,
What is 城市轨道交通 urban rail transport