正态分布的种类PPT课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
正态分布以平均为轴相对 称,具有钟形的图表.又称 高斯分布.
正态分布是平均为 μ,标准偏差为 σ的概率密度函数.度数在中心附近最多,
离中心越远越少.是通常出现的形态,是自然的变动
2021/6/4
2
正态性(适合度)验证
大家为了判断得到的数据是否为正态分布,可以在MINITAB使用如 下分析方法
Stat > Basic Statistics > Normality Test
0
0
2
4
6
8
10 12
工程与自然界限相近时
0
2021/6/4 0
2
4
6
8
10 12
9
2) 因筛选检查,选别时
超过规格上,下限的数据选别后删除或通过再作业调查(斜型,平尖) 有意地选别良品后剩下的数据(多重峰)时发生非正态分布
测定值的最初分布
规格 下限
规格 上限
2021/6/4
规格外的制品 废弃时左,右边 斜型分布
非正态分布的种类和原因
1. 正态分布的理解 2. 非正态分布的种类 3. 非正态分布的原因
2021/6/4
1
1.正态分布的(Normal Distribution)的理 解“标准的”“自然的”“正常的”表示Normal的含义,正态分布是最
正常的数据分布形态.数据脱离正态分布时,可以判断为这种工程是改 善的对象.
1.5 1.0 0.5 0.0
0.5
左,右边斜型 例如
因不同的机器
因不同时间
因使用不同原资材
1.5
lognorm1
2.5 因不同作业者 分布混合时,发生这种非正态
分布
急尖
2021/6/4
平尖
다중모드
11
4) 输入,出变量间为非线性时
对输入变量X,输出变量Y具有非线性关系时,即使输入变量管理为正态 输出变量分布也有可能表现为非正态
正态分布时 Skewness为0, 右边斜型分布是(+),左边斜型 分布是(-)值. 在左边图中Skewness值为2.186, 是(+)值,因此是右边斜型分布
2021/6/4
6
尖度(Skewness)的解释
急尖或平尖分布的平均的分布在中心,但左,右两边的尾巴比正态分布 短或长. Kurtosis称为尖度,表示分布形态的平或尖的程度
2021/6/4
正态分布时 Kurtosis为0, 急尖分布时(+),平尖分布时(-) 值. 在左图中Kurtosis值为3.082, 是(+)值,可以看出是平尖分布
7
3. 非正态分布的原因
非对称或非正态分布的问题是在现场经常出现的问题,其潜在的原因 如下
1) 具有自然界限的数据 2) 筛选检查时不良品的选别 3) 分布的混合 4) 输入变量与输出变量间的非线性关系 5) 输入变量间的交互作用 6) 按照时间的工程变化 7) 缺乏独立性或周期的变化 8) 测定器精密度问题 9) 具有异常点(Outliers)的数据
35
输 ຫໍສະໝຸດ Baidu0 出
25
收率的分布 (右边斜型)
2021/6/4
80% 相对粘性
粘性的分布 (正态分布)
输入
30% 相对粘性
50도
75도
输入
温度的分布
(正态分布)
13
6) 按时间工程变化时
按时间作业条件变化,因此制品品质变化时,有可能带来右边斜型 或左边斜型的结果
30
Y
的
25
周
边
分
20
布
工程输出 (右边斜型)
规格外的制品 再作业,调整时 左,右边斜型分布
两侧规格外的 制品选别时平 尖分布
规格内的制品 有意选别时剩 下多重分布
10
3) 分布混合时
实际的工程并不只受同一条件的约束,因多样作业条件或多数原因输入 的提供,有可能存在分布的混合.这种相异的根源是输出非对称的原因, 因此我们应该集中找出潜在原因
log2
斜型(Skewness)
右边斜型
左边斜型
斜型时,为更加准确 地计算SIGMA水平,使 用Box-Cox 后,求 SIGMA水平
平均在中心分布左边称为, 平均在中心分布右边称为,
右边斜型
左边斜型
2021/6/4
4
尖度(Kurtosis)
离散型 (Granularity)
急尖
分布的形态比正态分 布尖,两侧尾部较长.
打开 A05_非正态分布.mtw
2021/6/4
P-Value 0.824
进行正态性验证后 P-Value大于0.05
时此分布可以假定为正态的.即母集团
是正态分布时上述Sample是正态分布
的概率是82.4%.
3
2. 非正态分布的种类
但在现场我们经常遇到非正态分布的情况. 因此要正确理解非正态分布的形态及形状,这样才有助于问题的解决.
平尖
分布的形态比较平,两 侧尾部较短
立状
测定设备的精度低时可 能得到这种数据
多重 Mode (Multiple Modes)
用2台机器生产时, 机器的性能不同时 发生的分布
用几台机器生产时, 因特定机器的故障 等发生的分布
一般的双重峰
2021/6/4
极端的双重峰
5
斜型(Skewness)的解释
如柱型图,斜型分布是平均的分布从分布的中心偏向左或右,是左右 非对称的 Skewness表示数据偏移的程度
X 的周边分布 (正态曲线)
Y 的周边分布 ( 右边斜型 )
非线性关系曲线
2021/6/4
输入变量与输出变量 的非线性关系可能影 响尖度.特别是在化学 工程经常出现
12
5) 输入变量间具有交互作用时
输入变量X’s全部是正态分布时如果它们之间有交互作用时输入变量 Y有可能是非对称的.如下例:某一工程使用的粘接剂的粘性低,温度高 时收率下降,粘性高,温度高时收率也上升,存在这种交互作用时收率 的分布是非正态分布.
2021/6/4
8
1) 具有自然界限的情况
在物理上或不可避地存在无法测定数据的最小值或最大值时,例如时间,
不纯度,平坦度.主要 形成左边或右边斜型的分布.
100
工程与自然界限有一定9800 距离时
빈 70
150
도
60 50
수 40
30
频 100
20
率
10
150
数
50
0
0
2
4
6
8
10 12
频 100 率 数 50
10
20
时间
30
40
50
例:工具的磨损
镀金工程
使用热器具的工程
2021/6/4
14
部分资料从网络收集整 理而来,供大家参考,
感谢您的关注!