六西格玛基本统计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计思想
统计思想是 遵守以下四种根本原则的学习,思考和实践的一种哲学。
所有作业是相互关联的工序的系统
例) 线路板作业过程
原料投入
贴插装
清洗喷胶
所有工序中都存在散布
同样原料
同样生产工艺
可避免原因
发生散布
不可避免原因
同样作业者
同样方法
调查散布和减少散布的活动
减少工序散 布的活动
减少产品质量 散布
统计思想
程的 影响。
第二部分
数据分类
数据的种类
连续型的
• 不间断的 • 总是可以以更小的单位来测量 • 经常与测量系统一起出现
举例 – 时间, 重量, 金额, 长度
离散型的
• 不可以以更小的单位来测量 • 只能选择几个有限的数值
举例 – 二元的: 男/女, 好/坏, Yes/no – 分类的: 周一-周日, 地点 (Paris, London,
六西格玛内训课件 基础统计
基础统计理论
1 统计目的 目录
2 数据分类 3 统计概述 4 基本图表 5 六西格玛度量的种类
第一部分
统计目的
你看到了什么?
你需要整个图片!
数据的重要性
数据是来自观察的,由一个过程所搜集得来的数据可让 我们描绘过程,了解过程,改善过程甚至控制过程.
数据驱动决策和行动
Beijing, ...) – 计数: 一张发票上的错误数目, 一个月内
发生意外的次数
连续型数据
益处 : 1.能够为使用相对小范围抽样的过程提供详细的信息 2.适用于低缺陷率 3. 能够预估发展趋势和情况 缺点 : 1.通常较难得到数据 2.分析更为复杂
离散型数据
益处 : 1. 容易得到数据,并且计算方法简单
260 230 240 236 248 248 252 278 265 262
拉拔强度的均值是多少?
10个观测值的均值为:
均值
x
n xi
i 1
260
230
240 ...262
n
10
均值
练习四 199X年一个行动中,战机进行了3000次战斗,总共
• 样本标准差
s x
描述计量型数据集
一组计量型数据能显示以下3个特性: ➢中央趋势 (均值, 中值, 众数) ➢变异(全距, 标准差, 方差) ➢形状
参数和统计量符号
Mean 均值
总体(参数) 样本(统计量)
μх
Variance 方差
σ s2
σ Standard Deviation标准差
s
百度文库
Proportion 比例
Data
数据对六西格玛很重要
使用统计学来解决真实的问题
真实的问题 统计学问题
统计学 解决方案
真实的 解决方案
▪ 把问题转换为数 字 (Y)
▪ 定义 Y 的规格(可 接受范围)
▪ 理解(xi) 与流程输 出(Y)的关系 Y = f(x1, x2, x3...)
▪ 影响流程表现的关 键因子是什么?
▪ 找到因子(xi)的 ▪ 控制输入 (xi) 避 水平和操作窗口, 免输出/缺陷 保证输出 (Y) 是 在可接受范围内
过程偏差
– 确定过程是否稳定 如果过程不稳定,鉴别并消除不稳定的要因 – 确定过程的平均值的位置 - 它在目标线上吗? 如果不在,确定影响平均值的变量,并决定最优的
设 置以达到目标值 • 估计总散布的幅度 - 与顾客的要求(规格限)比起来,是可接受的吗? 如果不是, 确定散布源,而后消除或减少他们对过
结论:偏差是自然存在的,被期望的并是统计的基础
统计领域中偏差的处理
统计领域用下列方法处理偏差
➢ 描述型统计--用图表或总结性的数字(中心值,方差,标准偏差) 来描述一系列数据的特征. ➢ 统计推论--当结果的差异可能因为随机偏差或不能归属为随 机偏差时所作的决定。(置信区间和假设检验) ➢ 试验设计(DOE)--收集并分析数据,以估计过程并改变效果.
2. 数据容易理解
3. 数据随时可得 缺点 : 1.无法显示缺陷怎样发生及过程如何变化
2.不适合低缺陷率(需要大量的抽样)
3.不能预测发展趋势和情况
连续型数据 连续数据 通常为正态分布 实际数值 实际定义严谨 需少量抽样
数据类型比较
离散型数据 计数数据 通常为二项式分布或泊松分布 合格/不合格 数据定义较差 需大量抽样
偏差
当重复测量时,经常产生不同的结果,这就是偏差
偏差的类型: ➢ 通常原因的偏差:
测量中的差异是被期望的并可以预测的 ➢ 特殊原因的偏差(随机):
测量中的差异是不可预测的
偏差
我们是期望能够观察出偏差的,如果没有偏差那肯定会有问题 如果所有的区域的产品的销售量完全相同,我们将怀疑数据的真 实性. 偏差的存在使我们的工作更有挑战性 我们通常不相信来源于单个数据的结果,通常收集多个数据并注意 收集的方法以减少偏差
π
p
中心趋势 均值 中值 众数 四分值
数据位置测量
均值
样本均值
➢若样本(样本量为n)的观测值为x1,x2,…xn,则样本均 x
值为:
x x1 x2 ... xn
n xi
i 1
n
n
➢ 类似地,一个有着大量但限个(N个)观测值的总体,
其总体均值 为:
N xi
i 1
N
练习三 10个连接线的拉拔强度为 :
顾客满足
费用降低
考虑判断失误的错误
注意从样本数据的结果判断时发生错误
举例:去年公司的顾客满意率为80%,今年调查了100位顾客,有 85位顾客表示满意,满意率达到85%。能否说今年的顾客满意率比 去年提高了5%?
统计思想不是单纯的数字组合或计算,而是为质量革新而思考的方法,也是 思考的过程。 统计思想不是统计知识或工具,更不是软件的具体操作,而是学会用统计思维 看待和分析问题,避免只看到表面层次的现象就去下结论作决策。
第三部分
统计概述
统计学基本术语
总体
总体 想要测量对象的全部
参数 用总体的所有数据计算出的数值(如均值, 标准差), 称为总体的参数
参数 • 总体平均值 • 总体标准差
σ x
统计学基本术语
总体
样本 从总体抽出的部分数据
统计量
样本
用样本的所有数据计算出的数值(如均值,
标准差), 称为样本的统计量
统计量 • 样本平均值
练习: 这是什么种类的数据 ?
▪ 申请贷款所需要的时间 ▪ 每张发票上的错误数目 ▪ 每张发票上的缺陷百分比 ▪ 一天内销售酒的数量 ▪ 导线的长度 ▪ 办公室的地点 ▪ 申请贷款所需要的时间 (天) ▪ 销售人员一天内拜访的客户数量 ▪ 赢得招标的百分比 ▪ 销售人员的销售额 ▪ 销售人员的名字