6sigma统计基础(Fysip)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
① P(X<160) = 0.0729
等)、水文气象(年最高气温、雨量、水位、
② P(X>180) = 1-0.9854 = 0.0146
风速波高)等
③ P(160≤X≤180) = 0.9854-0.0729 = 0.9125
峰度:分布平坦性的度量
=
(−)4
4
- 3 参考样本峰度
V()
1
=
=
1
V( (1 +
2
1
2)
(n
2
2 + ⋯ + ))
2
=
参考中心极限定理
n
随机变量的标准差,正态分布曲线
① V(C) = 0
拐点到中心线的距离 = ()
② V(aX) = 2 V(X)
③ X1和X2相互独立时,V(aX1±2) =
2 V(X1) + 2 V(X2)
1
− 1 +
ν+1
1
2 ∗ 1 ∗
ν
2
2
1+
2
2
2
2+ ( − 1)
1
+1
2
2
− 1 +
2
1
− 2 1 +
期望0,方差
−2
ν1
ν1−ν2
ν1+ν2
2
2
2
∗ ν1
∗
ν1 +2 ν2
ν2
•X3k+2 + 0.25 (X3k+2 – X3k+1) = 32.25(n = 40+2)
•X3k+3
= 33
(n = 40+3)
9
概率论基础(6)
✓ Minitab应用:逆累积概率计算
④ x0.158655
计算>概率分布>正态
= 162.5
例:均值168,标准差5.5,正态分布
① x0.25 = 164.29
➢ 例:保险费20元/人,赔额40万元,意外发生
概率0.001%,求保险公司平均赚每投保人多
少钱?
b
E(Y) = X1P1+X2P2
=20*0.99999-400000*0.00001
随机变量质心的横坐标、分布的对称中心即
=19.9998 – 4 = 15.9998 ≅ 16元
均值,求期望值实际上就是求平均值
Normal Distribution
符号
函数
期望
方差
N(μ, 2 )
(−)2
−
22
μ
2
2
2
−
2
1
b−a
1 −
b
标准正态分布
N(0,1)
Standard Normal Distribution
均匀分布
(2)
U(a,b)
Uniform Distribution
(3)
6σ统计基础(six sigma basics of statistics)
---概率论基础(basics of probability theory)
6σ培训课程
1
课程内容
一.六西格玛与统计学的关系
二.概率论(Probability theory)基础
三.描述性统计与图形
四.统计基础---参数估计(点估计&区间估计)
以保证过程持续改进的有效性
六西格玛管理统计属于应用统计学,区别与理论统计学
除“描述性统计及图形”属描述统计学外,其余属推论统计学
3
二.概率论基础(1)
在任何情况下,个别随机现象绝对不可预测
,但大量随机现象将呈现明显的规律性,是
可以预测的。
随机试验random experiment、随机事件
分位数sample 1st quartile Q1
+
Q1 = X([+
]) + (
+
]){X([+
]+1)
-[
- X([+
]) }
Q3 = X([+
]) + (
•Xk + 0.25 (Xk+1 - Xk) = 10.25 (n = 40)
•(X2k + X2k+1)/2 = 20.5 (n = 40)
(n = 40+1)
= 22 (n = 40+3)
+
+
- [ ]){X([+
]+1)
•X3k + 0.75 (X3k+1 - Xk)
- X([+
]) }
=30.75 (n = 40)
•X3k+1 + 0.5 (X3k+2 – X3k+1) = 31.5 (n = 40+1)
random event、离散型discrete、连续型
continuous、随机变量random variable(事先可
以肯定取值的范围,但不能肯定具体的取值
是多少)
✓ Minitab应用:绘制概率分布图
图形>散点图→单一视图>离散
例:用任意离散型概率分布律表绘制概率分布图
概率论_离散型分布律图.xls
= 0.9854-0.0735 = 0.9119
8
概率论基础(5)
分位数:若xp左侧的累积概率为p,则称xp为➢
x0.75 称为上四分位数upper quartile UQ或第三
随机变量X的p分位数。
四分位数sample 3rd quartile Q3
例:水位比每年最高洪水水位的0.99分位数还要➢
四分位间距 描述离散状况 inter quartile range
高的洪水称为百年一遇的洪水
IQR = UQ – LQ,可适用于非正态或非对称
➢
x0.5称为中位数sample median
分布敏感,在数据偏度严重时,平均值代表
➢
x0.25称为下四分位数lower quartile LQ或第一四
性不如中位数
2
M到N的整数范围内,等概率取值
(8)
任意离散分布
Discrete
Distribution
分布律表
N−n
n次无放回抽样,成功次数的分布 p =
n < 0.1N时,近似于二项分布
σ( − )2 pi 一般的离散分布
11
概率论基础(8)
✓ Minitab应用:
生产离散型模板化数据
V(X) = 2 = E( − )2
离散型
V(X) = σ( − )2 pi 参考任意离散分布
连续型
∞
V(X) = 2 = −∞( − )2 p(x)dx
参考样本方差计算公式
V(1 + 2 + ⋯ + ) = 2
ത = V( (1 + 2 + ⋯ + ))
例:二项分布,试验次数20次,
每次成功概率0.2,成功n次的概
率分布
计算>生产模板化数据>简单数集
计算>概率分布>二项
绘制离散型数据概率分布律图
参考P4
图形>散点图
→单一视图>离散
图形>概率分布图
→单一视图>离散
12
概率论基础(9)---常用的连续分布
NO.
•
(1)
名称
正态分布、高斯(Gauss)分布
① 离散型 E(X) = σ 参考任意离散分布
•
•
•
∞
随机变量X的某个函数Y = g(x),求Y的期望
值时,可以对于每个Y的取值按X的取值概率
求其平均值
E(aX + b) = aE(X) + b
E(aX1 + bX2) = aE(X1) + bE(X2)
5
二.概率论基础(2)
随机变量的转动惯量即方差
0
1-p
N−M
−
应用
备注
只有两种取值,且概率固定的变量的分布
Minitab
试独立试验(有放回抽样),成功次数的分布
连续生产过程中不合格品数的分布
最常用
n>100且0.1<p<0.9时近似于正态分布N(np,np(1- 与比率检
验有关
p))
n>100且p<0.05,np<30时近似于泊松分布P(np)
具有均值可分性
稀有事件出现的概率,每分钟顾客人数,一定时
最常用
间内接错电话次数,一定时间内系统故障数。1
个铸件上的缺陷数,1平方米玻璃上的气泡数
(4)
超几何分布
Hypergeometric
Distribution
(5)
几何分布
Geometric
Distribution
(1 − ) −1
1
(6)
④ X1, X2, …,Xn相互独立且1 = 1 =
⋯ = 时
6
二.概率论基础(3)
偏度:不对称性的度量
✓ Minitab应用:累积概率计算
(−)3
✓ 计算>概率分布>正态
=
参考样本偏度
3
例:均值168,标准差5.5,正态分布
正偏分布:寿命分布、社会状况(收入、住房
峰度具有可比性的前提:方差相等
正态分布的峰度为零
累积分布函数F(x)
0 ≤ F(x) ≤ 1
F(x)与x成正比
∞
P(a ≤ X ≤ b) = F(b) - F(a) = −∞
P(X ≤ b) = F(b)
P(a ≤ X)= 1 - F(a)
① P(X<162.5) = 0.158655
(16)
F分布
F-distribution
(17)
卡方分布
Chi-Square Distribution
伽马分布的特例(a=n/2,b=2)
(4)
t(ν)
−
λ λ
1 −−
b
(−)2
−
2 2
2
ab −1 −
a+b
2
( − )2
12
b
2
1
1
λ
b+T
λ
2
织经营战略的持续改进的管理模式。
六西格玛管理不只是统计技术,其本质上是一种全新的管理方式,但六西格玛管理离不开统
计技术,对影响过程输出的根本性原因的查找需要严谨的数据分析。
基于事实和数据驱动的管理,不只是简单、直接地运用事实和数据,而是运用数理统计的方
法进行客观、科学的分析,提取有效的信息,用统计思维看待和分析问题,然后做出决策,
指数分布
Exponential Distribution
伽马分布的特例(a=1)
E(λ)
双参数指数分布
对数正态分布
Lognormal Distribution
lnX~
N(μ,σ2)
(5)
威布尔分布
Weibull Distribution
W(a,b)
(15)
学生t分布
Student t distribution
p(1-p)
(1 − )−
x = 0,1,2,…,n
np
np(1-p)
−
!
λ
λ
np
np(1-p)N−1
1−
2
只有两种结果的独立试验,首次成功所需的试验
次数
r=1时,负二项分布的特例
无后效性,玩老虎机,换机和不换机的效果相同
1
p
泊松分布
P(λ)
Poisson Distribution
•Xk + 0.5 (Xk+1 - Xk) = 10.5 (n = 40+1)
•X2k+1
•Xk + 0.75 (Xk+1 - Xk) = 10.75 (n = 40+2)
•(X2k+1 + X2k+2)/2 = 21.5(n = 40+2)
•Xk+1
= 11
(n = 40+3)
•X2k+2
= 21
7
二.概率论基础(4)
✓ 手工计算:累积概率计算
例:均值168,标准差5.5,正态分布
① P(X<160) = P(
−168 160−168
<
)
5.5
5.5
= P(Z<-1.45)
= 1-P(Z<1.45)
= 1-0.9265 = 0.0735
查《标准正态函数分布表》
② P(X>180) = P(
② x0.75 = 171.71
③ IQR = 171.71-164.29 = 7.42
10
概率论基础(7)---常用的离散分布
NO.
•
名称
符号
(1)
0-1(两点)分布
0-1 Distribution
B(1,p)
(2)
二项分布
Binomial
Distribution
B(n,p)
(3)
函数
期望
方差
p
图形>概率分布图→单一视图>离散
x
1
2
3
4
5
p
0.1
0.2
0.3
0.3
0.1
4
二.概率论基础(1)
概率密度函数Probability density function
① 1≥ p(x) ≥0
∞
②
−∞ p x dx = 1
③
P ≤ ≤ = a
②
连续型 = −∞
2
一.六西格玛与统计学的关系
早期的六西格玛管理是一种系统的过程改进方法,通过对现有过程实行DMAIC业务改进流程
,消除过程缺陷和无价值作业,从而提高质量、降低成本、缩短周期时间,最终达到顾客完
全满意。
目前,六西格玛管理已逐渐从一种过程改进的方法演变成为一种提升企业竞争力和实现组织
变革的战略举措,可以看作全面质量管理的一种继承性新发展,本质上是基于顾客需求和组
−168
5.5
>
180−168
)
5.5
= P(Z>2.18)
= 1- P(Z>2.18)
=1- 0.9854 = 0.0146
① P(160≤X≤180) = P(
160−168
5.5
<
−168 180−168
<
)
5.5
5.5
= P(-1.45<Z<2.18)
等)、水文气象(年最高气温、雨量、水位、
② P(X>180) = 1-0.9854 = 0.0146
风速波高)等
③ P(160≤X≤180) = 0.9854-0.0729 = 0.9125
峰度:分布平坦性的度量
=
(−)4
4
- 3 参考样本峰度
V()
1
=
=
1
V( (1 +
2
1
2)
(n
2
2 + ⋯ + ))
2
=
参考中心极限定理
n
随机变量的标准差,正态分布曲线
① V(C) = 0
拐点到中心线的距离 = ()
② V(aX) = 2 V(X)
③ X1和X2相互独立时,V(aX1±2) =
2 V(X1) + 2 V(X2)
1
− 1 +
ν+1
1
2 ∗ 1 ∗
ν
2
2
1+
2
2
2
2+ ( − 1)
1
+1
2
2
− 1 +
2
1
− 2 1 +
期望0,方差
−2
ν1
ν1−ν2
ν1+ν2
2
2
2
∗ ν1
∗
ν1 +2 ν2
ν2
•X3k+2 + 0.25 (X3k+2 – X3k+1) = 32.25(n = 40+2)
•X3k+3
= 33
(n = 40+3)
9
概率论基础(6)
✓ Minitab应用:逆累积概率计算
④ x0.158655
计算>概率分布>正态
= 162.5
例:均值168,标准差5.5,正态分布
① x0.25 = 164.29
➢ 例:保险费20元/人,赔额40万元,意外发生
概率0.001%,求保险公司平均赚每投保人多
少钱?
b
E(Y) = X1P1+X2P2
=20*0.99999-400000*0.00001
随机变量质心的横坐标、分布的对称中心即
=19.9998 – 4 = 15.9998 ≅ 16元
均值,求期望值实际上就是求平均值
Normal Distribution
符号
函数
期望
方差
N(μ, 2 )
(−)2
−
22
μ
2
2
2
−
2
1
b−a
1 −
b
标准正态分布
N(0,1)
Standard Normal Distribution
均匀分布
(2)
U(a,b)
Uniform Distribution
(3)
6σ统计基础(six sigma basics of statistics)
---概率论基础(basics of probability theory)
6σ培训课程
1
课程内容
一.六西格玛与统计学的关系
二.概率论(Probability theory)基础
三.描述性统计与图形
四.统计基础---参数估计(点估计&区间估计)
以保证过程持续改进的有效性
六西格玛管理统计属于应用统计学,区别与理论统计学
除“描述性统计及图形”属描述统计学外,其余属推论统计学
3
二.概率论基础(1)
在任何情况下,个别随机现象绝对不可预测
,但大量随机现象将呈现明显的规律性,是
可以预测的。
随机试验random experiment、随机事件
分位数sample 1st quartile Q1
+
Q1 = X([+
]) + (
+
]){X([+
]+1)
-[
- X([+
]) }
Q3 = X([+
]) + (
•Xk + 0.25 (Xk+1 - Xk) = 10.25 (n = 40)
•(X2k + X2k+1)/2 = 20.5 (n = 40)
(n = 40+1)
= 22 (n = 40+3)
+
+
- [ ]){X([+
]+1)
•X3k + 0.75 (X3k+1 - Xk)
- X([+
]) }
=30.75 (n = 40)
•X3k+1 + 0.5 (X3k+2 – X3k+1) = 31.5 (n = 40+1)
random event、离散型discrete、连续型
continuous、随机变量random variable(事先可
以肯定取值的范围,但不能肯定具体的取值
是多少)
✓ Minitab应用:绘制概率分布图
图形>散点图→单一视图>离散
例:用任意离散型概率分布律表绘制概率分布图
概率论_离散型分布律图.xls
= 0.9854-0.0735 = 0.9119
8
概率论基础(5)
分位数:若xp左侧的累积概率为p,则称xp为➢
x0.75 称为上四分位数upper quartile UQ或第三
随机变量X的p分位数。
四分位数sample 3rd quartile Q3
例:水位比每年最高洪水水位的0.99分位数还要➢
四分位间距 描述离散状况 inter quartile range
高的洪水称为百年一遇的洪水
IQR = UQ – LQ,可适用于非正态或非对称
➢
x0.5称为中位数sample median
分布敏感,在数据偏度严重时,平均值代表
➢
x0.25称为下四分位数lower quartile LQ或第一四
性不如中位数
2
M到N的整数范围内,等概率取值
(8)
任意离散分布
Discrete
Distribution
分布律表
N−n
n次无放回抽样,成功次数的分布 p =
n < 0.1N时,近似于二项分布
σ( − )2 pi 一般的离散分布
11
概率论基础(8)
✓ Minitab应用:
生产离散型模板化数据
V(X) = 2 = E( − )2
离散型
V(X) = σ( − )2 pi 参考任意离散分布
连续型
∞
V(X) = 2 = −∞( − )2 p(x)dx
参考样本方差计算公式
V(1 + 2 + ⋯ + ) = 2
ത = V( (1 + 2 + ⋯ + ))
例:二项分布,试验次数20次,
每次成功概率0.2,成功n次的概
率分布
计算>生产模板化数据>简单数集
计算>概率分布>二项
绘制离散型数据概率分布律图
参考P4
图形>散点图
→单一视图>离散
图形>概率分布图
→单一视图>离散
12
概率论基础(9)---常用的连续分布
NO.
•
(1)
名称
正态分布、高斯(Gauss)分布
① 离散型 E(X) = σ 参考任意离散分布
•
•
•
∞
随机变量X的某个函数Y = g(x),求Y的期望
值时,可以对于每个Y的取值按X的取值概率
求其平均值
E(aX + b) = aE(X) + b
E(aX1 + bX2) = aE(X1) + bE(X2)
5
二.概率论基础(2)
随机变量的转动惯量即方差
0
1-p
N−M
−
应用
备注
只有两种取值,且概率固定的变量的分布
Minitab
试独立试验(有放回抽样),成功次数的分布
连续生产过程中不合格品数的分布
最常用
n>100且0.1<p<0.9时近似于正态分布N(np,np(1- 与比率检
验有关
p))
n>100且p<0.05,np<30时近似于泊松分布P(np)
具有均值可分性
稀有事件出现的概率,每分钟顾客人数,一定时
最常用
间内接错电话次数,一定时间内系统故障数。1
个铸件上的缺陷数,1平方米玻璃上的气泡数
(4)
超几何分布
Hypergeometric
Distribution
(5)
几何分布
Geometric
Distribution
(1 − ) −1
1
(6)
④ X1, X2, …,Xn相互独立且1 = 1 =
⋯ = 时
6
二.概率论基础(3)
偏度:不对称性的度量
✓ Minitab应用:累积概率计算
(−)3
✓ 计算>概率分布>正态
=
参考样本偏度
3
例:均值168,标准差5.5,正态分布
正偏分布:寿命分布、社会状况(收入、住房
峰度具有可比性的前提:方差相等
正态分布的峰度为零
累积分布函数F(x)
0 ≤ F(x) ≤ 1
F(x)与x成正比
∞
P(a ≤ X ≤ b) = F(b) - F(a) = −∞
P(X ≤ b) = F(b)
P(a ≤ X)= 1 - F(a)
① P(X<162.5) = 0.158655
(16)
F分布
F-distribution
(17)
卡方分布
Chi-Square Distribution
伽马分布的特例(a=n/2,b=2)
(4)
t(ν)
−
λ λ
1 −−
b
(−)2
−
2 2
2
ab −1 −
a+b
2
( − )2
12
b
2
1
1
λ
b+T
λ
2
织经营战略的持续改进的管理模式。
六西格玛管理不只是统计技术,其本质上是一种全新的管理方式,但六西格玛管理离不开统
计技术,对影响过程输出的根本性原因的查找需要严谨的数据分析。
基于事实和数据驱动的管理,不只是简单、直接地运用事实和数据,而是运用数理统计的方
法进行客观、科学的分析,提取有效的信息,用统计思维看待和分析问题,然后做出决策,
指数分布
Exponential Distribution
伽马分布的特例(a=1)
E(λ)
双参数指数分布
对数正态分布
Lognormal Distribution
lnX~
N(μ,σ2)
(5)
威布尔分布
Weibull Distribution
W(a,b)
(15)
学生t分布
Student t distribution
p(1-p)
(1 − )−
x = 0,1,2,…,n
np
np(1-p)
−
!
λ
λ
np
np(1-p)N−1
1−
2
只有两种结果的独立试验,首次成功所需的试验
次数
r=1时,负二项分布的特例
无后效性,玩老虎机,换机和不换机的效果相同
1
p
泊松分布
P(λ)
Poisson Distribution
•Xk + 0.5 (Xk+1 - Xk) = 10.5 (n = 40+1)
•X2k+1
•Xk + 0.75 (Xk+1 - Xk) = 10.75 (n = 40+2)
•(X2k+1 + X2k+2)/2 = 21.5(n = 40+2)
•Xk+1
= 11
(n = 40+3)
•X2k+2
= 21
7
二.概率论基础(4)
✓ 手工计算:累积概率计算
例:均值168,标准差5.5,正态分布
① P(X<160) = P(
−168 160−168
<
)
5.5
5.5
= P(Z<-1.45)
= 1-P(Z<1.45)
= 1-0.9265 = 0.0735
查《标准正态函数分布表》
② P(X>180) = P(
② x0.75 = 171.71
③ IQR = 171.71-164.29 = 7.42
10
概率论基础(7)---常用的离散分布
NO.
•
名称
符号
(1)
0-1(两点)分布
0-1 Distribution
B(1,p)
(2)
二项分布
Binomial
Distribution
B(n,p)
(3)
函数
期望
方差
p
图形>概率分布图→单一视图>离散
x
1
2
3
4
5
p
0.1
0.2
0.3
0.3
0.1
4
二.概率论基础(1)
概率密度函数Probability density function
① 1≥ p(x) ≥0
∞
②
−∞ p x dx = 1
③
P ≤ ≤ = a
②
连续型 = −∞
2
一.六西格玛与统计学的关系
早期的六西格玛管理是一种系统的过程改进方法,通过对现有过程实行DMAIC业务改进流程
,消除过程缺陷和无价值作业,从而提高质量、降低成本、缩短周期时间,最终达到顾客完
全满意。
目前,六西格玛管理已逐渐从一种过程改进的方法演变成为一种提升企业竞争力和实现组织
变革的战略举措,可以看作全面质量管理的一种继承性新发展,本质上是基于顾客需求和组
−168
5.5
>
180−168
)
5.5
= P(Z>2.18)
= 1- P(Z>2.18)
=1- 0.9854 = 0.0146
① P(160≤X≤180) = P(
160−168
5.5
<
−168 180−168
<
)
5.5
5.5
= P(-1.45<Z<2.18)