六西格玛的基本统计概念
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i=1
n-1
课堂举例: 计算样本{1,3,5,4,7 }的方差和标准差
(使用下面的表作为向导。)
首先计算平均值X:
i
xi
xi - x
(xi - x)2
1
2
3
4
5
Totals
方差 (s2) =
n
( X i - X )2
i =1
n-1
样本的公式
方差 - 与平均值之差的平方的平均值。一般用s2或^2来表示。
15
举
例 计算平均值、方差和标准差
n
xi
x = i=1 n
平均值
Baidu Nhomakorabea
s2 =
n
( X i - X )2
i=1
s=
n-1
方差
n
( X i - X )2
i=1
n-1
标准差
课堂举例: 计算样本{2, 6, 4 }的方差和标准差 首先计算均值: (2 + 6 + 4) / 3 = 12 / 3 = 4
6
数据的两种类型
解决办法
连续数据
离散数据
问题
• 连续 (可变) 数据 使用一种度量单位,比如英寸或小时。
• 离散 (属性) 数据是类别信息,比如““ 通过” 或““ 未通过”。
举例:
部件号
1 2 3 4 5
离散 通过 通过 未通过 通过 未通过
连续
2.031 2.034 2.076 2.022 2.001
i
xi
(xi-4) (xi-4)2
1
2
-2
4
2
6
2
4
3
4
0
0
和
12
0
8
方差 (s2) = 8 / (3 - 1) = 4
标准差 (s) = sqrt(4) = 2
16
课堂练习
计算平均值、方差和标准差
x= 均值
n
xi
1
n
s2 = 方差
n
( X i - X )2
i=1
s=
n-1
标准差
n
( X i - X )2
波动的产生是很自然的,意料之中的,是统计学的基础
5
统计学的作用
统计学用以下方法处理误差:
统计描述
用图表和几个总结性数字(均值、方差、标准差)描 述一组数据。
统计推理 试验设计
确定结果之间的差异何时可能是由于随机误差引起 的,何时不能归因于随机误差。
(置信区间和假设检验)。
收集并分析数据,以估算过程变化的 影响。
六西格玛的基本统计概念
1
统计概念
解释以下基本统计概念。 1. 波动(偏差) 2. 连续数据和离散数据 3. 平均值、方差、标准差 4. 正态曲线 5. 用Z值将数据标准化 6. 中心极限定理 7. 过程能力
- 使用Z值作为衡量工序能力的指标 - 通过改进关键值Xs来改进Y 8.稳定性因子
2
波动
所有的人不会都是同样的高度; 所有的葡萄不可能同一天采摘 问题: 你期望存在波动吗?什么类型的波动?
离散数据也可以是分类数据。如:销售地区、生产线、班次和工厂。
离散数据不能更进一步精确地细分。
9
离散数据
离散数据举例:
有凹痕的部件数量
通过/未通过
申诉决议
产出
生产线不合格品数量
及时交货
连续数据与离散数据进行比较的解释:
• 一般来说,连续数据比离散数据更可取,因为你可以利用更少的数据获 得更多的信息。
7
连续数据(也称为可 变数据)
连续数据以参数的形式,比如尺寸、重量或时间,说明一个产品或过程的 特性。测量标准可以有意义地不断分割,使精确度提高。
你能举出我们用来获得连续数据 的三个器具例子吗?
相对于仅仅知道部件是否合格而言, 连续数据可以提供更多的信息。
8
离散数据(也包括属性 或类别数据) 离散数据是某件事发生或未发生的次数,以发生的频数来表示。
4
观测值变化(续)
我们预期观测值会有差异。如果没有差异,我们就会产生怀疑。
如果所有地区的手机销售量是一样的,那么我们就会怀疑是数据库出了 问题。.
如果我们测量10台电冰箱,得到同样的能耗测量结果,我们就会怀疑测 量是否正确。
这种变化使我们的工作更具挑战性!
一般来说,我们不能相信来自一个数据点的结果。通常我们收集多个数据点,而 且非常注意如何选取这些样本,以减少偏差。
11
统计学术语
总体 - 全组数据,全部对象。
- 一个总体中的元素数量用N来表示
样本 -总体的一个子集
- 样本的元素数量用n 来表示
-
平均值 - 总体或^样本的平均值
- 总体的平均值用来表示 - 样本的平均值用X 或来表示
方差 - 数据与^其平均值之间差值的平方的平均值 。(它代表该
.
举例:给定一个样本:{1,3,5,4,7 },平均值就是:
x = (1+3+5+4+7) = 20 = 4.0
5
5
样本的平均值等于4。
14
统计学术语和定义
标准差 -衡量数据分散程度的一个指标。一般用表示总体,用s 或 表示^样
本。
=
N
( X i - )2
i=1
N
总体的公式
S= =
3
观测值变化
当重复进行测量的时候,通常会得到不同的答案, 这就是波动! 1. 系统波动
预期的和可预测的测量结果之间的差异。 举例: 夏季和冬季的空调的销售量不同。
2. 随机波动
不可预测的测量结果之间的差异。 举例:具有同一种设计的两台冰箱,由同一个技术人员、在同样的 气温条件下、使用同样的测量仪器,在两个不同的日子对其能量消 耗进行测试…...可能得到两个不同的结果。
• 如果不能得到连续数据,就可以对离散数据进行分析,发现结果,作出 判断。.
离散数据需要更多的数据点才能进行有效的分析
10
应用你所学到的东西
请在下面的例子旁,写出它是“连续”还是“离散” 1 销售订单准确度 2 数据输入准确度 3 销售地区 4 使用“合格/不合格”测量仪器得到的孔径 5 孔径 6 应答中心对话时间 7 制冷氟利昂的重量(克) 8 每百万部件中有缺陷部件的数量 9 装配线缺陷(ALD)
组数据的分散程度)
- 总体的方差用 表示
- 样本的方差^用s2或表示
均方差是方差的 (正) 平方根。 (它也代表该组数据的分散程度)1。2
统计学术语和 定义
总体 - 全部对象.
举例 – 1998年5月在深圳生产的所有的21英寸彩电
样本 -代表总体的一个子集数据。
举例 - 1998年5月在深圳生产的一百二十台21英寸彩电
XXXXX
XXXXX
举例X: X X X X
XXXXX
XXXXX
这个矩阵代表25个X的总体。画上圆圈的 那些是由总体中的六个X组成的样本。
13
统计学术语和
定义
平均值 - 总体或样本的平均值。
用x或^来表示样本,用来表示总体。
n
xi
平均值的公式
x=
1
n
,
在这里X1是样本的第一个点,
Xn是样本的最后一个点。