6sigma第二章 基础统计1
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
方差--与中心值 间距的平均值
21
让我们练习 . . .
例子
计算平均值,均方差和标准偏差
x = 平均值
x i i=1
n
n
s
2
=
2 1 ( X i - X ) i = n -1
n
s=
2 1 ( X i - X ) i = n -1
n
均方差
标准偏差
课堂例子 :计算均方差和标准偏差(2,6,4)
27
第二节 概率分布
概率分布是将分布的形状演变成数据 模型成为品质管理及 6 Sigma 开展的 基本。
28
1)正态分布
中心光滑连接形成曲线 直方块的中
大多数(但不是所有)数据是正态分布或钟形曲线
正态分布告诉我们数据的离散情况
29
正态分布(Normal distribution)
12
平均值 - 总体或样本的平均值。 - 总体的平均值用 表示 - 样本的平均值用 X 均方差 - 与平均值间距的平方的平均值 . (表示数据的离散程度.) - 总体的方差用 表示
-样本的方差用s2 表示
标准的方差是方差的平方根。(表示数据的离散程度.)
- 总体标准偏差由 表示 - 样本标准偏差由s 表示
40
关于正态分布的附加说明
影响制造工程的平均值或分散的要因区分为1)偶然要因和2)异常要因.偶然要因 指的是如现场的温度变化等不可管理的要因,异常要因指设备的异常,作业者的失 误等要因.
没有异常要因介入,只有偶然要因作用时取出的数据必然遵守正态分布.在教育中 大家也能感觉到利用连续概率分布函数的统计分析中最先观察的是是否正态.就 是说正态分布是非常重要的. 今后要学习的 t-分布, F-分丰, 2-分布等是人为制造的概率密度函数.但正态 分布是说明自然现象的自然的分布.
x =
1
n
平均值公式
, where x1 first point and xn is the last point of a sample.
n
16
极差
除了平均值 ,我们还要知道其它信息吗? 例如:
• 数据的离散程度怎 样?
5 7 21 25
这是子组
五位数的中心值 是5
5
5 5
5
3 2
1
1 1
0
用来判定一个数据 集合 离散程度或宽度的恒量尺度
均方差为什么有用?
20
统计术语和定义
标准偏差--恒量数据的离散程度 总体的标准偏差用“ ”表示,样本的标准偏 ^ 差用S表示
2 1 ( X i - ) i=
N
总体的标准偏差
=
n
N
S=
2 1 ( X i - X ) i =
样本的标准偏差
n -1
15
X = 65.1
Frequency
10
s 2.8 R = 15
60 65 70 75
5
0
56.7
59.5
37
65.1
Height
62.3
正态分布例 1
<问题> 对某一制品的拉长长度进行品质管理,平均为40,标准偏差为2. 即
N(40,22).
购买此制品时顾客要求拉长长度在35以上.
此工程生产的制品满足顾客要求的概率为多少?
1 2 3 4 5
7
逻辑
合格 合格 不合格 合格 不合格
连续
2.031 2.034 2.076 2.022 2.001
连续变量
连续变量参数如:尺寸,重量或时间来描述产品或过程特性,这个测量尺度 可以被细细分成有意义的小数
你能举出三个设备吗?可用来收集连续变 量的.
相比仅仅知道零件的好或坏连续变量能告诉更多的 信息
90位女士的身高:
59 62 65 63 67 71 64 64 64 68 68 70 66 62 60 61 66 62 64 64 63 67 64 68 66 67 65 66 67 67 63 65 64 68 66 69 64 61 66 65 65 68 65 65 63 63 65 68 66 58 63 66 64 67 63 64 65 63 66 60 64 64 70 65 65 66 62 63 69 64 65 66 68 67 64 59 60 65 66 65 70 64 65 71 64 64 69 66 66 73
s=
2 1 ( X i - X ) i =
n
n -1
课堂练习:计算均方差 标准偏差 (1,3,5,4,7) 用下列表格做指导 首先计算平 均 值 2
i xi xi - x (x i - x) 1 2 3 4 5 Totals
均方差 (s2) =
标准偏 差 (s ) =
23
还有其它的统计概念吗?
中位数 & 众数:
4
3
2
1
0
钟形 (Bell-shaped)
31
正态分布的标准偏差()
1
p(d) UCL
LCL
规范上限(USL) 规范下限(LSL) 分布的中心值 (U) 分布的标准偏差( )
32
中心值
X or
3
Sigma是?
第一个弯曲点(倾斜从减 少到增加的位置, Deflection Point) 与平均间的距离
13
极差-- 在一个子组中最高值与最低值的差值 极差= X高 - X低.极 差用 R 表示
中位数--反应中间50%的数值,一系列数据由低到高排列后所 得到的中间数。 众数 -- 在一个数据集中最频繁出现的值。
14
平均值
下列是茄子的重量
1.0 1.2 1.5 2.5 3.0 4.2 6.1
1.1
0 0 10 20 30 40 50 60 70 80
N o r m al
Neg S ke w
中位数
300
平均值
200
100
0 60 70 80 90 100 110 120 130
P os S kew
26
到目前为止我们知道:
•偏差.
•数据的类型
•中心值 •中位数
•众数
•极差 •标准偏 差
•均方差
68.3%
95.5% 99.73%
4
3
2
1
0
1
2
3
4
以平均为中心占据 68%的面积
33
正态分布的函数式
正态分布的密度函数
f(X) = 1 -(x-)2/22 2 e √2 - < X < +
:3.142 e:2.7183 :分布的平均 :分布的标准偏差
X~N(
, 2
38
解
2
面积是多少?
N(40,22).
35
已知这个时
40
Minitab 中求面积的部分
39
正态分布例 2
<例 2> 假设某一工艺的品质特性遵守标准正态分布
(平均=0, 标准偏差=1) 不良率为 1% 时, z 值(Sigma level) 是多少?
<解>
已知累计概率时求Z值,在 minitab的 normal 分布中使用 inverse cumulative probability.
i xi (xi-4) (xi-4)2
1
2 3
2
6 4
-2
2 0
4
4 0
总和
12
0
8
均方差 (s2) = 8 / (3 - 1) = 4 标准偏差(s) = 平方根(4) = 2
22
练习
计算中心值 x = 平均值 均方差
n
标准偏差
xi 1
n
n
s
2
=
( Xi - X ) i = 1
2
均方差
n -1 标准偏差
8
离散变量
离散变量是事情发生或不发生的次数或测量发生的频率. 离散变量也是可分类的数据,如;销售区域,生产线,操作班组和工 厂,单板有缺陷的焊点
离散变量不可能再细分成有意义的小数
9
离散变量
离散变量的例子:
单板的合格 发票的正确性 按时付款 合格/不合格 正确/不正确 按时/迟交
连续和离散变量的注释: • 通常如果能获得更多的信息优先考虑连续变量. • 如果不能获得连续变量可以分析逻辑变量,找出结果并做结论.
3
偏差:观察值与实际值之间的差异
观察的偏差
当重复测量时,经常产生不同的结果,这就是偏 差
通常原因的偏差 测量中的差异是被期望的并可以预测的 特殊原因的偏差(随机) 测量中的差异是不可预测的
4
偏差
所有的茄子产于一块地并同一天采摘 问题:
你期望存在偏差吗?什么类型的偏差?
5
观察的偏差(续)
我们期望观察出偏差,当没有时将引起注意 如果所有的区域的产品的销售量完全相同,我们将怀疑数据的真实性.
中位数 - 反应中间(50%)处的数值, 一系列数据由低到高排列所得的中间数 。 什么是中位数? 众数 - 在一个数集中最频繁出现的数。 什么是众数?
24
平均值,中位数和众数是所有 居中趋势的测量
值 聚集在某个中心值附近
25
何时应 用
平均值=中位数
100 300
平均值
中位数
200 50 100 0 20 30 40 50 60 70 80 90 100 110
)
34
正态曲线(Normal curve)形态
1 2 , 1 = 2
[因和而异的正态分布形状 ] 1 2
68.3%
1 = 2 , 1 2
95.5% 99.73%
1
2
1 2
4
3
2
1
0
1
2
3
1 2 , 1 2
4
1 = 1
1
2
应熟悉教材后部分的正态分布表的读法
正态分布在统计应用领域最重要的分布并成为 6 Sigma 开展的基本. 正态分布也可如下表示
X~N(
, 2
)
标准偏差
变量
正态分布
平均
即正态分布由平均和标准偏差来定义
30
正态分布的形态是?
以平均为轴对称 (Symmetric)
68.3%
原点在一个位置 (Unimodal)
1 2 3 4
95.5% 99.73%
第二章
基础统计
作者:项目支持部 日期: 2012/02/20
第一节
统计的基本概念
2
统计学
统计学的概念在日常生活中经常接触,且每天都在使用
- 为预测棒球比赛的胜负,调查各个Team的过去胜率 - 用收集的气象资料预测天气
统计学
为了对不确实的未来的预测提供必要的情报收集,分类,分析资料 及以此为基础提示结论的学问
1
35
2
标准正态分布
利用 Z = X - ————
将正态分布式进行座标转换
平均(中心)为0,标准偏差为1的正态分布
N(0,12)
68. 3% 95.5 99.7 % - 3% 1 0
4
36
3
2
1
2
3
4
回到先前的例子:
身高直方图和和正态曲线
Histogram of Height, with Normal Curve
偏差使我们的工作更有挑战性, 我们通常不相信来源于单个数据的结果,通常收集多个数据并注意收集的 方法以减少偏差,
偏差是自然存在的,被期望的并是统计的基础
6
数据类型
解决方案
连续变量
离散变量
问题 •连续变量用长度或时间等作为测量尺度。 •离散变量是分类的信息如“合格”或“不合格”。 例如: 零件编号.
A
A A
V
V V
A
A A
V
V V
A
11
V
总体(母集团)和样本
成为关心对象的所有个体的集合称为总体,
在总体中作为调查对象采纳的一部分称为样本。
总体的特性 : 平均 µ 分散 2 标准偏差 样本的特性 : 平均 x 分散 S2 标准偏差 S 个数(N)
总体
统计量(n)
样本
如果能够准确计算总体的个数时没有问题,但如果难以计算 时以样本计算的统计量为基础进行推定.
0.9 1.2 1.0
1.5
1.4 1.6 1.5
2.0
2.1 2.5 2.4
3.0
3.1 3.2 3.3
4.0
4.5 4.4 4.5
4.2
4.4 4.5 6.0
6.2
6.0
茄子的平均重量是多少?
15
平均值
• •
茄子 个数
=
平均值
=
平均值 - 总体或样本的平均值。样本用 x ,总体用 表示。
^
xi
0 0
5
8
1
0
X
5
5
5
5
平均值相同!
R
17
0 6 20 25 R = 极差 = X高 - X低
直方图
除了中心值和极差 ,我们还要知道其它更多信息吗?
• 极差是足够具体吗?
59 62 65 63 67 71 64 64 64 68 68 70 66 62 60 61 66 62 64 64 63 67 64 68 66 67 65 66 67 67 63 65 64 68 66 69 64 61 66 65 65 68 65 65 63 63 65 68 66 58 63 66 64 67 63 64 65 63 66 60 64 64 70 65 65 66 62 63 69 64 65 66 68 67 64 59 60 65 66 65 70 64 65 71 64 64 69 66 66 73
90个女工的 平均身高
把 数据标 在下面
x
57 60
18
x
65 70 75
直方图
15
Fre q u e n cy
10
5
0 60 65 70 75
height
19
离散程度的测量
极差= 最大值- 最小值 均方差=与平均值差的平方的平均值 标准 偏差=方差的平方根,提供与平均值 的标准的距离的 测量。
为了有效的分析,离散变量要求更多的数据点
10
练习
在下列的例子边,画圈选择A=“离散”或V=“连续变量”
A A
V V
1. 销售的准确性 2. 数据输入的准确性 3. 销售区域 4. 用“通过”/“不通过”量具测直径 5. 焊膏厚度 6. 直供协议 7. 网板厚度 8. 供应商产品的缺陷数 9. 计划部下达合同的变更次数