六西格玛之分析阶段S848卡方检验p23
六西格玛方差分析214601705
Descriptive 统计与正态
检验
堆叠资料与方差 等同性检验
资料是否为正态分布? 小P-Value(<0.5)值,资料为非正态分布 注意样本大小的问题
正态
非正态
Bartlett Test (F-Test) Ho:σ2A=σ2B
Leven’s Test Ho:σ2A=σ2B
Small P-Value(<0.5) 方差不相等
方差相等
1 Way ANOVA Ho: μA=μB=μC
1 Way ANOVA If N>25 or transformed) Kruskal-Wallis/Moods Median (Med A=Med B=Med C)
方差不相等 1 way ANOVA (See MBB) Kruskal-Wallis/Moods Medians (Med A=Med B=Med C)
i=1 j=1
i=1 j=1
i=1
六西格玛方差分析214601705
One-way ANOVA : Cycle times versus Factor
Analysis of variance for CycleTim
Source Week Error Total
DF
SS
3 1032.48
96 110.36
六西格玛方差分析214601705
和以前相同——但只针对一个 Level
Customr1,2,3的资料
六西格玛方差分析214601705
分析Roadmap:3个或更多样本
+3 Level X 的比较
研究 Stability (若可行) 研究 Shape 研究Spread 研究Centering
精选6sigma统计数据分析教程培训教材gka
统计基础
六西格马突破步骤
定义
测量
分析
改进
控制
步骤 1 - 选择输出特性 - 定义过程输入/输出变量步骤 2 - 确定绩效标准步骤 3 - 定义测量系统步骤 4 - 建立过程能力步骤 5 - 定义绩效目标步骤 6 - 定义差异来源步骤 7 - 查找潜在因素步骤 8 - 发掘变量之间相互关系步骤 9 - 建立操作公差范围步骤 10 - 重新验证测量系统步骤 11 - 重新计算过程能力步骤12 - 实施过程控制
变异性的测量 - 公式
极差: 在某一数据集合中最大值同最小值之间的数字化的距离样本方差 (s2 ; s2 ): 每一单个数据同均值的差的平方和的平均值标准偏差 (s ; s): 方差的平方根。通常表示数据的分散程度。它越小,数据分散程度越小,加工精度越好。
计算机可以胜任所有艰难的工作
变异性练习
统计 – 测绘数据的益处
统计是工具. 象其它工具一样,它们同样可以被误用,导致令人误解的,歪曲的,或不正确的结论。仅能够计算是不够的,我们必须对数据作出正确的解释。统计中一项重要的分析工具就是不断描绘数据。
变异性, 中心度, 和稳定性
变异某一过程的差异有多大?众所周知,每一过程都会有一定的移动,但不是每一个移动都会得到完全相同的结果。通常我们采用标准变差对过程的差异进行衡量。这是我们的重点。其它关于差异的参数有:极差 (最大之与最小值之差)偏差平方和
数据基础: 需解答的问题
什么是数据? 什么是不同类型的数据? 为什么连续性的数据会更好? 什么是数据采集计划? 什么是合理的分组?
数据基础: 问题总结
数据是相关主题的单个事实或事实的集合体 数据有两种:计数型和计量型 计量型数据之所以比计数型数据好是因为其所提供的信息要更丰富。 一个数据采样计划是采集同项目有关的,必要的数据大纲 合理分组是对某一过程的相同类别负荷逻辑的挑选。
六西格玛 第6章 分析(含补充参考答案)
第6章 分析
LSL -6σ
Cp: 2.0 cpk: 1.5
USL
x-
+6σ
分析阶段概述
6 Sigma
1.分析阶段工作内容
(1)流程分析。流程步骤的详细分析,如绘制微观流程图,明晰每 一个关键步骤的KPIV和KPOV。区分出哪些是 增用基本描述性统计图表,如直方图、柏拉图 、散点图、饼图、雷达图等,对输入变量的影响做初步评价;运用多 变异图比较多个X的影响,直观的看哪些关键X重要,哪些不重要。
6.2.2 点估计和区间估计
6 Sigma
置信水平:如果将构造置信区间的步骤重复多次,置信区间中包含总体 参数真值的次数所占的比率,称为置信水平,或称为置信系数。
在构造置信区间时,比较常用的置信水平为90%、95%、99%三种, 分别对应显著性水平α 为0.1、0.05、0.01。
置信区间的宽度随置信系数的增大而增大。
X
μ
σ X Z1α / 2 n
σ X Z1α / 2 n
9
6.2.2 点估计和区间估计
如果抽取的样本均值如
X
图所示,则以
样本均值 X 为中心, σ
以 Z1α / 2 n 为半区
间宽度构造的置信区间 没有包含总体均值μ。
6 Sigma
σ X Z1α / 2 n
μσ X Z1α / 2 n
10
σ Z1α / 2 n
μ Z1α / 2
σ n
μ
1-α
σ Z1α / 2 n
μ Z1α / 2
σ n
8
6.2.2 点估计和区间估计
实际工作中,只进行一 次抽样,如果抽取的样 本均值如图所示,则以
样本均值 X 为中心,
6西格玛分析课件
检验统计量 拒绝域 z z1 x 0 z z z
n
1 2
z z
Z检验
σ未知 大样本 n 30
0 0 0
Байду номын сангаас
z
x 0 s n
z z1 z z
1 2
T检验
未知
1 , 2
ts
z
x y
1 1 n m
t t1 (n m 2) t t (n m 2)
w
t t
z
1 2
(n m 2)
近似Z 检验
未知 m,n大样本
1 , 2
x y
2 s2 sx y n m
z z1 z z
研究问题的 真正原因
探索性数据分析(exploratory data analysis, EDA) 分析数据全过 程的早期阶段 过程分析
推测阶段
提出关于原因 的假设阶段
证实或排除 原因阶段
探索性数据分析
推测阶段 排列图 趋势图 直方图 多变异图
提出关于原因 的假设阶段
证实或排除 原因阶段 因果逻 辑分析 统计假 设检验 试验 验证
原来的冷拉钢筋生产线上的钢筋平均抗拉强度为 2000kg,标准差为300kg。希望经过调整参数后, 钢筋的平均抗拉强度能有所提高。项目团队实施 改进后抽取了25根钢筋,测得钢筋平均抗拉强度 为2150kg。问:能否断言,钢筋平均抗拉强度确 有提高?
是 我们所看 到的不同 还是
所取样品的不同
流程变化的不同
α
2
2
z H0 : 0 , H1 : 0
六西格玛的计算公式解读
6西格玛1西格玛=690000次失误/百万次操作2西格玛=308000次失误/百万次操作3西格玛=66800次失误/百万次操作4西格玛=6210次失误/百万次操作5西格玛=230次失误/百万次操作6西格玛=3。
4次失误/百万次操作7西格玛=0次失误/百万次操作什么是6西格玛”σ”是希腊文的字母,是用来衡量一个总数里标准误差的统计单位。
一,以4西格玛而言般企业的瑕疵率大约是3到4个西格玛,相当于每一百万个机会里,有6210次误差。
如果企业不断追求品质改进,达到6西格玛的程度,绩效就几近于完美地达成顾客要求,在一百万个机会里,只找得出3。
4个瑕疪。
6西格玛(6Sigma是在九十年代中期开始从一种全面质量管理方法演变成为一个高度有效的企业流程设计、改善和优化技术,并提供了一系列同等地适用于设计、生产和服务的新产品开发工具。
继而与全球化、产品服务、电子商务等战略齐头并进,成为全世界上追求管理卓越性的企业最为重要的战略举措.6西格玛逐步发展成为以顾客为主体来确定企业战略目标和产品开发设计的标尺,追求持续进步的一种质量管理哲学。
6西格玛的主要原则(一在推动6西格玛时,企业要真正能够获得巨大成效,必须把6西格玛当成一种管理哲学。
这个哲学里,有六个重要主旨,每项主旨背后都有很多工具和方法来支持。
6西格玛的主要原则(二真诚关心顾客。
6西格玛把顾客放在第一位.例如在衡量部门或员工绩效时,必须站在顾客的角度思考。
先了解顾客的需求是什么,再针对这些需求来设定企业目标,衡量绩效.6西格玛的主要原则(三根据资料和事实管理。
近年来,虽然知识管理渐渐受到重视,但是大多数企业仍然根据意见和假设来作决策。
6西格玛的首要规则便是厘清,要评定绩效,究竟应该要做哪些衡量(measurement,然后再运用资料和分析,了解公司表现距离目标有多少差距。
6西格玛的主要原则(四以流程为重。
无论是设计产品,或提升顾客满意,6西格玛都把流程当作是通往成功的交通工具,是一种提供顾客价值与竞争优势的方法。
6西格玛管理项目辅导数据分析的第二阶段:分析原因
6西格玛管理项目辅导数据分析的第二阶段:分析原因一、六西格玛管理数据分析原因在绘制流程图的过程中,团队成员就会产生很多的疑问,会提出形形色色的问题。
在这个阶段中,先要根据流程图识别流程中明显存在的问题,再进行量化分析。
1、识别流程中明显存在的问题流程冗余:不同流程中的不同环节提出了相同的活动和结果。
流程中断:流程中前后环节信息的中断。
如顾客和供应商之间没有及时沟通,造成顾客对产品货源信息的中断。
流程瓶颈:流程中因为某个环节不能及时完成任务而延误整个流程。
流程循环:流程中某环节的输出产品有缺陷,必须送回其上游环节,或另设“返工”直到必需的工作完成为止。
检验这一步往往是返工循环的起始点。
2、量化分析①价值分析在现代商业社会中,任何一件产品都为顾客提供了价值,商品的生产过程就是创造价值的过程。
价值分析通过外部顾客的角度来识别流程中的每个环节是否是满足顾客需求。
企业在进行价值流程图分析时,首先要挑选出典型的产品作为深入调查分析的对象,从而绘制出信息流程和实物流程的现状图,然后再绘制理想的价值流程图,通过将现状图与理想状况图相比较,发现当前组织生产过程中存在的问题点,进而针对问题点提出改进措施。
②时间分析对于流程时间维度的分析可能会带给你意外的惊奇:流程中往往有许多时间是空闲着的,并不是人闲坐在那里,而是忙的事情并不能创造价值。
等待、多余的动作、无意义的工步、重复的搬运、批次生产和返工使得流程变得漫长。
在完成六西格玛分析过程的推测时,团队已经对何时、何地、问题如何暴露出来有了一定的了解,同时对潜在原因也有了初步分析。
天行健咨询指出本阶段的任务就是关注问题的定义,组织探查、分析工作,透过问题的表面现象进行深入研究,找出问题的真正潜在原因,了解事物的本质。
只有确保找到所要研究问题的真正潜在原因,以后才能真正找到解决办法。
二、六西格玛分析阶段最常用的分析工具是因果图和关系图它们为找到根源性原因提供了方向,但使用这些工具时有两点要注意:一是它们仅仅帮助团队进行系统的思考并发现问题可能的潜在原因,仍需收集数据才能证实究竟什么才是问题的真正原因。
六西格玛分析阶段
中位数(1/2分位)-Q2 25%的数(1/4分位)-Q1
Q1-Max{Minimum, Q1 - 1.5 IQR}
注:箱子的高度——内四分位极差 IQR = Inter Quartile Range= Q3-Q1
Histogram直方图
主要应用在了解数据的形状及形态 便于掌握数据的集中倾向、位置、平均、分布等
把关键因素(X’s)压缩到
分析 改进 控制
4-8 3-6 2-4
确认重要 X’s
重要 X’s最佳化 重要 X’s 控制
4~8个左右之后, 在改进 阶段找出最适合的条件
最佳化的过程
分析阶段的步骤
制定数据收集计划 确定X的量化指标,数据类型、以及数据收集目标 根据X的特点确定采用的分析方法,可以每个因子单独验证(如比较分 析),也可以几个因子合在一起验证(如多变量分析、回归分析、DOE) 制作数据收集表,包括X及其响应(Y)的数据,确定收集的样本量 如需要通过试验来收集,如通过人为改变X的状态来观察Y的变化,还 需要做好试验计划
多变量分析
比较分析
均值检验:1-sample t, 2-sample t, Paired t (样本中同一 个体测量两次前后比较-总体不独立), ANOVA(正态总体>=2)
方差检验:Test for Equal variance-F test(正态总体=2), Bartlett’s Test(正态总体>=2),Levene’s Test(非正态总 体)
图表分析的步骤
选定要分析的变量 搜集及整理数据 进行图表分析 结果解释
重点:可靠数据的收集和正确的图表解释
选择要分析的变量
我们要分析的变量来自测量阶段的结果, 在利用图表分析前我们首先要确定变量的类 型、分析的目的、选择什么方法等
SPSS学习系列24. 卡方检验
24. 卡方检验卡方检验,是针对无序分类变量的一种非参数检验,其理论依据是:实际观察频数f 0与理论频数f e (又称期望频数)之差的平方再除以理论频数所得的统计量,近似服从2χ分布,即)(n f f f ee 2202~)(χχ∑-= 卡方检验的一般是用来检验无序分类变量的实际观察频数和理论频数分布之间是否存在显著差异,二者差异越小,2χ值越小。
卡方检验要求:(1)分类相互排斥,互不包容; (2)观察值相互独立;(3) 样本容量不宜太小,理论频数≥5,否则需要进行校正(合并单元格、增加样本数、去除样本法、使用校正公式校正卡方值)。
卡方校正公式为:∑--=ee f f f 202)5.0(χ卡方检验的原假设H 0: 2χ= 0; 备择假设H 1: 2χ≠0; 卡方检验的用途:(1)检验某连续变量的数据是否服从某种分布(拟合优度检验); (2)检验某分类变量各类的出现概率是否等于指定概率; (3)检验两个分类变量是否相互独立(关联性检验); (4)检验控制某几个分类因素之后,其余两个分类变量是否相互独立;(5)检验两种方法的结果是否一致,例如两种方法对同一批人进行诊断,其结果是否一致。
(一)检验单样本某水平概率是否等于某指定概率一、单样本案例例如,检验彩票中奖号码的分布是否服从均匀分布(概率=某常值);检验某产品市场份额是否比以前更大;检验某疾病的发病率是否比以前降低。
有数据文件:检验“性别”的男女比例是否相同(各占1/2)。
1. 【分析】——【非参数检验】——【单样本】,打开“单样本非参数检验”窗口,【目标】界面勾选“自动比较观察数据和假设数据”2.【字段】界面,勾选“使用定制字段分配”,将变量“性别”选入【检验字段】框;注意:变量“性别”的度量标准必须改为“名义”类型。
3. 【设置】界面,选择“自定义检验”,勾选“比较观察可能性和假设可能性(卡方检验)”;4. 点【选项】,打开“卡方检验选项”子窗口,本例要检验男女概率都=0.5,勾选“所有类别概率相等”;注:若有类别概率不等,需要勾选“自定义期望概率”,在其表中设置各类别水平及相应概率。
精选6sigma工程能力分析正态性验证gbk
1) 考虑公差范围的Gage R&R的值为( 32.06 )%,测量者引起的误差与测量设备引起的误差 哪一个较大,为什麽(把分析结果拷贝,并解释)?
2) 分析 / 解释 考虑公差范围的Gage R&R的结果.
Total Gage R&R=32.06%>20%,测量系统需要改善。
部品间,测量者间以及部品与测量者间的影响哪个较大? (用图形表示)
3)选择ANOVA方法
4)输入公差范围1
2)选择命令
1)输入数据
5)O K,O K
Gage R&R %ContributionSource VarComp (of VarComp) Total Gage R&R 0.003875 9.12 Repeatability 0.001625 3.82 Reproducibility 0.002250 5.29 C2 0.001660 3.90 C2*C1 0.000590 1.39 Part-To-Part 0.038632 90.88 Total Variation 0.042507 100.00 StdDev Study Var %Study Var %ToleranceSource (SD) (5.15*SD) (%SV) (SV/Toler) Total Gage R&R 0.062249 0.32058 30.19 32.06 Repeatability 0.040311 0.20760 19.55 20.76 Reproducibility 0.047434 0.24429 23.01 24.43 C2 0.040740 0.20981 19.76 20.98 C2*C1 0.024296 0.12512 11.78 12.51 Part-To-Part 0.196550 1.01223 95.33 101.22 Total Variation 0.206172 1.06179 100.00 106.18 Number of Distinct Categories = 4
卡方检验
浙江大学医学院流行病与卫生统计学教研室
沈毅
卡方检验基础
2值的计算:
( A E) E
供了完整的支持,此处只涉及两分类变量间关联程度的指
标,更系统的相关程度指标见相关与回归一章。
浙江大学医学院流行病与卫生统计学教研室
沈毅
两分类变量间关联程度的度量
相对危险度RR:是一个概率的比值,指试验组人群反应阳性概率 与对照组人群反应阳性概率的比值。数值为1,表明试验因素与
反应阳性无关联;小于1时,表明试验因素导致反应阳性的发生
小 结
3.Kappa一致性检验对两种方法结果的一致
程度进行评价;配对检验则用于分析两种
分类方法的分类结果是否有差异。
浙江大学医学院流行病与卫生统计学教研室
沈毅
小 结 4.分层卡方检验是把研究对象分解成不同层次,按 各层对象来进行行变量与列变量的独立性研究。可 在去除分层因素下更准确地对行列变量的独立性进
浙江大学医学院流行病与卫生统计学教研室 沈毅
小 结
2.关联程度的测量:卡方检验从定性的角度分析是否存在 相关,而各种关联指标从定量的角度分析相关的程度大小。 不同的指标适合不同类型的变量。 RR值是一个概率的比值,是指试验组人群反应阳性概率与 对照组人群反应概率的比值。用于反映试验因素与反应阳 性的关联程度。 OR值是比值的比。是反应阳性人群中试验因素有无的比例 与反应阴性人群中试验因素有无的比例之比。在下列两个 条件均满足时,可用于估计RR值:①所关注的事件发生概 率比较小(<0.1),②所设计的研究是病例对照研究。 浙江大学医学院流行病与卫生统计学教研室 沈毅
六西格玛之分析阶段 S8 48 卡方检验 p23
( Chi-square-Test )
卡方检验 -0-
路径位置
Define
Measure
Analyze
Step 7- Data 收集
Step 8- Data 分析 Multi Vari Central limit Hypothesis testing Confidence interval ANOVA, T-test Chi-square Correlation,regression
卡方检验 -6-
步骤#1
我们必须建立一个观察频率表,把我们的两个变量分
成两个等级。
年龄: 年老 & 年轻 雇佣实际: 雇佣 &不雇佣
然后我们收集数据来进行分析.
被雇佣
未被雇佣
年老
30
150
年轻
45
230
卡方检验 -7-
步骤#2
计算列和行的合计
年老 年轻 合计
被雇佣
30 45 75
未被雇佣
150 230 380
卡方检验 -22-
选择练习 - 2
Zip和Jaz之间是否有联系? 他们是否有相似的问题?
Zip
Jaz
Door Jams
32
135
Damaged Media
32
80
Software
42
98
你下一步要做什么?
卡方检验 -23-
•
1、有时候读书是一种巧妙地避开思考 的方法 。20.8. 1520.8. 15Saturday, August 15, 2020
合计
75
未被雇佣
.0_0_0_6 .0_0_0_4 380
合计
180 275 455
西格玛分析工具应用统计技术课件.ppt
Production Process
Service Process
Machines Methods Materials
Man Measurement Environment
Policy Procedure
Plant People Measurement Environment
4
特性要因图
特性要因图制作方法
5、双样本假设检验
双样本Z检验:用于单样本Z检验法适用于大样本容量条件下对两个总体 均值的测试。要求样本容量n>30,且两个样本是独立的, 总体标准差已知。
双样本t 检验:双样本t检验法适用于小样本容量条件下对两个总体均值 进行测试。总体标准差未知。
6、多样本均值假设检验
若需要同时检验多个样本均值有无差异,这时就需要用到方差分析ANOVA
[特性要因图制订的阶段]
1) 将问题或希望的结果放入效果箱子中。 2) 讲给予结果影响的4种6个左右的核心原因 放入群体原因箱子中。 3) 对核心原因中提问为什么会出现那样的原因对此的应答应从大到小详细记入。 4) 通过检讨要因补充重复或遗漏的内容。 5) 选定3-5个的重要原因 用数据检证。
一般的范畴
2、置信区间
在分析和解决实际问题时,要取得分析对象的全部数据是非常难的, 有时也是不现实的,为此需从总体中抽取一定数量的样本,取得样本 的测量数据,再通过样本数据对总体数据进行估计。区间估计方法就 是在已知样本状况时,估计总体值的可能区间的方法。一般估计要求 有比较高的“可信程度”,如95%的可信度。
• 标准正态 分布图象
8
直方图
标准正态分布验证:
[ Stat > Basic Statistics > Display Descriptive Statistics ]
六西格玛黑带知识点(卡方检验、卡方分布)
一、***卡方检验、卡方分布B假设宽严程度相同。
卡方值较大,同时,P值小于0.05显著,因此,显著不同MINITAB分析步骤新制作表格题目:BA. 将C2及C3两列数据放入卡方检验表,进行卡方检验B. 将C2及C4两列数据放入卡方检验表,进行卡方检验C. 将C2及C5两列数据放入卡方检验表,进行卡方检验D. 将C3及C4两列数据放入卡方检验表,进行卡方检验B、C、DA. 卡方检验的P值小于0.05,则说明3条生产线的不良率没有显著差异B. 卡方检验的P值小于0.05,则说明3条生产线的不良率有显著差异C. 卡方贡献最大者在生产线1行中不良数项上,其值为8.352,1号生产线的不良数23高于期望的12.7,这说明1号生产线不良率显著高于其他条生产线D. 卡方贡献次大者在生产线2行中不良数项上,其值为4.259,2号生产线的不良数15低于期望的25.4,这说明2号生产线不良率显著低于其他条生产线CA.把C7、C8两列输入MINITAB,进行卡方检验B.把C7、C9两列输入MINITAB,进行卡方检验C.把C2列当作行因子,把C3列当作列因子,把C1列当作层因子,进行卡方检验D.把C1列当作行因子,把C3列当作列因子,把C2列当作层因子,进行卡方检验卡方为六个相加,DF=3-1题目:某企业在下料过程中需要从一块钢板上截出一些边长为X的正方形块料。
已知X服从正态分布,工程师们关注的关键质量特性是正方形块料的面积X^2,他们想了解块料面积的分布,有关块料面积应服从的分布,下列说法正确的是:AA. 块料面积一定不再是正态分布B. 块料面积仍是正态分布C. 块料面积通常会是双峰分布D. 块料面积一定是指数分布变量可以被分为连续性变量(定距、定比)和分类变量,后者又被细分为有序、无序变量两种。
对于各组所在总体的定量变量(即连续性变量)的平均水平,可以使用t检验和方差分析方法进行比较,秩和检验则用于比较各组所在总体为有序分类变量的分布情况是否相同。
六西格玛中分析阶段的作用及常用工具
分析阶段就是六西格玛“D-M-A-I-C”与“D-M-A-D-V”流程中得一个中间环节,同时就是非常重要得环节。
因为要解决问题,首先得发现问题得原因。
在实际工作中,多数问题得原因就是未知得。
六西格玛选项原则中就有一条就是:“根本原因未知,即所有得六西格玛项目在实施项目前其改善对象得问题原因就是未知或最少就是未确切知道得。
得确,对于比较简单得问题,不用六西格玛方法也可以很好解决,这时就无须选其为六西格玛项目。
比如生产线停线多发,原因就是物料供应不及时,或某个设备常发生故障。
此问题原因清楚,解决方案已知,显然没必要选作六西格玛改善项目。
反过来说,所有六西格玛项目均为问题较严重、客户抱怨大,或对公司造成重大损失得项目,其原因复杂,用普通方法无法分析或无法找到根本原因,无法知道最佳解决方案。
一、分析阶段得作用六西格玛管理法得解决方案就是基于数据,通过定义问题、测量现状、分析原因、实施改善、进行控制,即D-M-A-I-C模式展开项目运作。
对于普通方法无法分析得问题,六西格玛管理法采用一整套严密、科学得分析工具进行定量或定性分析,最终会筛选出关键影响因素x's。
只有筛选出关键得x's,改善阶段才会有得放矢。
所以分析质量得高低直接影响到改善效果与项目成败。
分析阶段在六西格玛项目中得位置如同疾病治疗过程得诊断阶段一样,只有找到病因了,后续才能对症下药,否则可能毫无效果或适得其反。
二、分析阶段得输入"D-M-A-I-C"模式中,各阶段衔接严密,环环相扣,后一个阶段得输入即为前一阶段得输出。
因此,分析阶段得输入为测量阶段得输出。
其输入(同时就是测量阶段得输出)为:1、过程流程图。
在六西格玛测量阶段为把握现状,需绘制详细得过程流程图以对过程全貌有准确把握,这样测量得结果才能反映过程实际。
现在得一般公司均有各个过程得详细流程图,可直接使用。
2、过程输出得量化指标即项目y。
过程输出得量化指标就是六西格玛项目得改善对象。
六西格玛的统计与分析方法
精品ppt模板
What is 城市轨道交通 urban rail transport
精品ppt模板
算出过程输出的平均值和标准差,用这两个参数 可以计算过程的西格玛水平,表示过程满足顾客 要求目标值的能力。计算公式是:
What is 城市轨道交通 urban rail transport
精品ppt模板
精品ppt模板
百万机会缺陷数的计算
例1
职能: 财务
产品: 财务报表
缺陷: 记录不准确
百万机会缺陷数(DPMO)的公式为
缺陷数: 56个
单位缺陷数×1,000,000
单位: 每个条目
每单位中出错机会
单位数: 50,000
出错机会:2
DPMO=(0.001×1,000,000)/2=500
What is 城市轨道交通 urban rail transport
精品ppt模板
What is 城市轨道交通 urban rail transport
精品ppt模板
假如一位顾客通过电话订购了4个汽车备件,希望5天内交付。那么,对 交付过程来说,关键的顾客要求CTQ是及时交付订货,顾客要求的规范 限USL是从接电话之日起5个工作日内,过程的缺陷是备件超过5天发出 。对这次电话订货来说,有4个缺陷机会,因为每一个备件都可能延迟 发出。如果该电话销售部门6个月内共收到电话订货20个,每个订货4件 ,其中未能准时发货的5件。那么,该过程的:
一种是k数值总数的平方根取整数一种是k133lgn通常数据数值适当组数50100610100250712250以上1020精品ppt模板四决定组距组距rn最大值最小值组数508455053组距一般取25和10的倍数因最小单位是01这里决定取05为组距10精品ppt模板五决定组界最小一组的下组界最小值测量值的最小位数x05最小一组的上组界最小一组的下组界组距最小第二组的下组界最小的上组界以此类推把数据记录下来六求出各组中心值中心值上组界值下组界值2记录下来七计算各组数据的个数精品ppt模板八次数分配表组别组界中心值次数分配次数1454545954570224595464546203346454695467064469547454720115474547954770196479548454820227484548954870178489549454920994945499549707104995504550203115045509550701合计100精品ppt模板九制作直方图记入产品名规格数据搜集时间数据量精品ppt模板直方图的看法1
六西格玛流程稳定性分析及过程能力分析
200举0举办办晚晚会会
管管理理者者想想收收回回奖奖励励.. 2001
凝聚优势资源,体现顾客价值
对对人人类类而而言言::疏疏于于用用控控制制图图分分析析数数据据是是已已知知的的增增加加费费用用、、 耗耗费费努努力力和和降降低低士士气气的的最最好好方方式式。。”” --DDrr..DDoonnaaldldJJ..WWhheeeelelerr
C
C
B
8
A
凝聚优势资源,体现顾客价值
例题
下列数据是生产模具产品的压缩强度的测量资料.请检验流程是否稳定
零件
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
强度
128 127.5 122 148.5 141.5 123.5 144 128.5 142 136 113 123.5 124.5 135.5 135.5 135 127.5 123 136.5 130
凝聚优势资源,体现顾客价值
LCL
示例
3 2 1
2000年 4月 ***厂公司晚会上
• 工厂的废品率达到年度的降低1.5% • 总经理给全厂颁奖 • 仪式在餐厅进行:为所有的人准备了各种点心和饮料! • 总经理讲演:“每个人都应为你们取得的成就感到骄傲”
晚晚会会时时间间
废废弃弃水水平平((%%))
11 22 33 44 55 66 77 2000
经经理理想想收收回回奖奖励励.. 2001
2000年11月
• 到11月, 废品率上升到2.6% ─ 年度最高点,总经理决定采取措施
• 召集一次“特别会议”,要一次性并永久性解决这个问题
• 在作完一个关于废品重要性的生动报告后,总经理走了。
SPSS 卡方检验课件
学习交流PPT
29
学习交流PPT
30
结果1:男性卡方检验p=0.000 女性p=0.584
学习交流PPT
31
结果2:风险估计,男性组OR=14.043,95%置信区 间不包括1。女性OR=1.222, 95%置信区间包括1。 提示,对于男性而言吸烟史发生肺癌的危险因素,
女性则不是。
学习交流PPT
学习交流PPT
22
• 文件diagnosis.sav为例
• 操作过程:
• 分析
• 统计描述
•
交叉表
• 行变量:treat_b
• 列变量:treat_a
• 统计量:McNemar
Kappa
学习交流PPT
23
结果解释:McNemar 检验结果p=0.057,两法诊断 结果差异无统计学意义
学习交流PPT
学习交流PPT
33
• 结果3:OR的均一性检验,用两种方法比较性别之 间OR是否存在差异(p=0.001)。说明男性高于女 性
学习交流PPT
34
• 结果4:又称协变量分析,将性别当做协变量,即 剔除性别这个影响后吸烟与肺癌的关系。结果显 示在剔除性别影响后,吸烟和肺癌仍然显著相关, 即吸烟史导致肺癌的危险因素。
学习交流PPT
43
• 练习2:某医师研究物理疗法、药物治疗和外用膏 药三种方法治疗周围性面神经麻痹的疗效。
• 问题1:三种疗法的有效率有无差别
• 问题2:如果三种疗法存在差异,是否任意两组疗 法均有差别
学习交流PPT
44
素材猫
学习交流PPT
45
spss18.0 卡方检验
学习交流PPT
1
主要内容
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
•年老 •年轻
•被雇佣
•75•x 180 •= 29.6
•455
•___
•未被雇佣
•___ •___
•合计
•75
•380
•单元的期待频率是:
•(列合计)× (行合计) •总计
•合计
•180 •275 •455
步骤 #3 (继续) •如果这两个因素真的不相关,29.6 正是我们所期望的
•年老 •年轻
分析路径
•Χ2 无关性检验
•收集数据
•运行 Minitab •表格 卡方检
验 命令
•评价 P 值
•检查偶然性 •表格
•作出结论
用 Minitab 分析数据
用 Minitab 分析数据
•卡方检验: Hired, Not
•在观测计数下方给出的是期望计数 •在期望计数下方给出的是卡方贡献 • Hired Not 合计 • 1 30 150 180 • 29.67 150.33 • 0.004 0.001 • 2 45 230 275 • 45.33 229.67 • 0.002 0.000 •合计 75 380 455 •卡方 = 0.007, DF = 1, P 值 = 0.932
•合计
•180 •275 •455
•你做完了这个表格!
步骤 #5
•将差值平方 •(O-E)^2
•年老 •年轻 •合计
•被雇佣
•(.4)*(.4)=.16 •_.0_9_ •75
•未被雇佣
•._0_9_ •._0_9_ •380
•你做完了这个表格!
•合计
•180 •275 •455
步骤#6
•计算相对的差值的平方 •(O-E)^2 / E
•150 •230 •380
•合计
•180 •275 •455
步骤#3
•建立一个 观察频率表.也就是说, 如果这2个因素真的不相关,
•这个表会显示出什么?
•年老 •年轻
•被雇佣
•未被雇佣
•我们应该怎么做?
步骤 #3 (继续)
•建立一个 期望频率表. 也就是说, 如果这2个因素真的不相关,
•这个表会显示出什么?
步骤#1
•我们必须建立一个观察频率表,把我们的两个变量分
•成两个等级。
•年龄: 年老 & 年轻 •雇佣实际: 雇佣 &不雇佣
•然后我们收集数据来进行分析.
•被雇佣
•未被雇佣
•年老
•30
•150
•年轻
•45
•230
步骤#2
•计算列和行的合计
•年老
•年 轻
•合计
•被雇佣
•30 •45 •75
•未被雇佣
•合计
•被雇佣
•29.6 •4_5_.3_ •75
•未被雇佣
1•5_0_._3 2•_2_9_.7
•380
•合计
•180 •275 •455
•你做完了这个表格!
步骤 #4
•从观察值中减去期望值 •(O-E)
•年老 •年轻 •合计
•被雇佣
•30-29.6=.4 •-_0_.3_ •75
•未被雇佣
•-_0_.3_ •_0_.3_ •380
•年老 •年轻
•被雇佣
•.16 / 29.6 = .005 •.0_0_2_
•未被雇佣
.•0_0_0_6 .•0_0_0_4
•合计
•75
•380
•合计
•180 •275 •455
•你做完了这个表格!
所以怎么样? •相对的方差的和是一个Χ2分布!
•0 •1 •2 •3 •4 •5
•如果不相关,我们期望这个差值接近于0。随着我们做得越来越深入 ,这两个变量看起来就越像相关了。为了帮助我们作出这个判断,我 们将依靠P值。
•Step 9- Vital Few X’的选定
•Improve •Control
目 标
介绍无关性Χ2 -检验的基本概念 把无关性Χ2 -检验和 MAIC 路径联系起来
记住这个例题?
•人事部想调查人的年龄(年老和年轻)和被雇佣与否之间是否有关联 •什么是 Y ?被__雇__佣_________ 数据类型 ? _____分_立_____ •什么是 X ? _年__龄__________ 数据类型 ? ____分__立________
•Ho: 数据是无关的 (没有关联) Ha: 数据是相关的 (有关联)
•如果 P 值 <0.05 , 就推翻 Ho
理论
•让我们查看一下我们的例子…. •假设我们要决定 年龄 和 雇佣实际 相关或不相关,
因而我们的假设描述如下... •Ho: 年龄 和雇佣实际 不相关 •Ha: 年龄 和 雇佣实际 相关
注意: 观测值和期望值与刚才的计算结果 是相同的
你将做出什么样的判断?
一个 P-值 !
另外一个例子 . . .
•年老
•年 轻
•被雇佣
•45 •45
•未被雇佣
•135 •230
你将作出什么判断?
Χ2 注释
•Χ2 是我们本星期所学的最不容易识别,通常也是比较“难分析” 的工具。但当我们处理记数性数据时会发生同样的事情。 •为了进行Χ2-检验你必须有至少 5个期望频率值,或使用 Minitab 。 •你收集的数据必须确保是随机性的. 小心其他的隐藏因素 (X).
六西格玛之分析阶段 S848卡方检验p23
2020年6月2日星期二
路径位置
•Define
•Measure •Analyze
•Step 7- Data 收集 •Step 8- Data 分析
Multi Vari Central limit Hypothesis testing Confidence interval ANOVA, T-test Chi-square Correlation,regression
回顾
介绍无关性Χ2-检验的基本概念 将无关性Χ2-检验与MAIC路径相联系
选择练习 - 1
•
测量系统评价
•
以下关联是不良数的监控过程Βιβλιοθήκη •# 合格•
Al
232
•
Eric
590
•
Debbie
45
#不合格 434 1199 83
•
作业者与产品等级之间是否有联系呢?
•
如果有联系,是什么造成了差异?
•
下一步你该做什么?
•你将采用什么类型的工具 ? __________Χ_2_____________
数据
•年老 •年轻 •合计
•被雇佣
•30 •45 •75
•未被雇佣
•150 •230 •380
•合计
•180 •275 •455
•在此你如何做出判断?
假设
•根据无关性Χ2-检验, 统计学家假设在现实生活中 绝大部分变量之间是无关的,因此: