解读Minitab的正态概率图
解读Minitab的正态概率图_一文中注解3-正态概率图图纸的说明
本文是对解读Minitab的正态概率图一文中注解3-正态概率图图纸的说明1 上图的H0假设1) 上图单组数据为34,35,36,37,38,39,40,40,41,42,43,44,45,46共N=14个2) 计算得平均值为Xbar=40,标准差为s=3.741657 (图示为3.742)3) 上图的H0假设数据源自正态分布,相对H1就是非正态分布4) 基于正态分布的假设,所以根据样本数可以估计此正态分布的2个参数,平均值μ为40,标准差σ为3.7416572 正态分布的特性x 、z与累积分配函数1) 正态分布z值有人称z score,是正态分布的变量x,转换为标准正态分布时对应值为z,关系是为z=(x-μ)/σ2) 正态分布下变量x,经转换为标准正态分布对应值z,就可经由正态分布数值表或软件等求得x的累积分配函数(cdf),cdf一般统计符号写成F(x)= P(X≦x),P就是X≦x累积机率,正态概率图的纵坐标Percent就是F(x)3) 鼠标移到Minitab蓝色直线上,就会出现如下图中的黄底的Percent与x数值表4) Percent与x数值表说明黄底的Percent与x数值表,Percent就是F(x),F(x)是指定的解于0与1之间,表上所示数值系为%,透过标准正态分布,就可求F(x)的反函数z,然后以公式x=zσ+μ得到x值3 正态性检定使用的正态概率图图纸1) 下表为手工计算,结果与minitab的Percent与x数值表相符的作成蓝色参考值线的数据x、z、F(x)关系表如下表,表中系先指定F(x),就是表中Percent栏,然后基于正态分布求x=F-1(x),再使用正态分布标准化公式计算z=(x-Xbar)/s2) 若以Percent vs x畫散佈圖是S型曲線並非直線,如下圖,所以常態機率圖的繪製有點竅門3) 理解正态概率图图纸解读正态概率图的第一要务是理解所谓机率图图纸,常用有常态与Weibull二种机率图图纸,下图是正态概率图图纸的示意图,图中蓝色直线是基于H0的正态分布假设下,自样本数据去估计平均Xbar=40与标准差s=3.741657,并制作x、z、F(x)关系表(如上表)所作成4 正确制作正态概率图图纸步骤1) 作z vs x 作散布图为了能够显示一直线,于是以z vs x 作散布图,并于每个点上,标出该数据x 对应的F(x)值,每一个点上也画出网格线如下图,观看网格线,似乎类似对数坐标(实际上并不是)2) 將各點百分比值F(x)作為新座標Y軸3) 若将纵坐标Y轴隐藏或者是移到次坐标轴,而将数据卷标F(x)值作为纵坐标Y轴的坐标刻度,此时就是正态概率图纸5 正态概率图的应有认识一张正态概率图表面上为F(x) vs x,实质上还是存在z vs x关系,构成正态概率图的二个轴分别为1) 排序数据x2) 数据x对应累积比例(标准正态分布的百分位数值)至于数据x置于横轴或纵轴,不同软件表现不同,Minitab放在横轴,JMP放在纵、横轴均可指定,而Excel是放在在纵轴。
Minitab中如何制作正态分布及Xbar-R控制图ppt课件
正态分布 X-Bar-R控制图
1
1. 将数据复制进Minitab中
2
2. 按图示路径找到正态
3
3. 获得如下提示框,左键将“C1测量数据” ,点击“选择”; 子组大小为:1(子组大小>1);输入规格上下限,点击“选项”,将想要的标题输入, 点击“确定”,获得正态分布图形
4
5.当有多列数据时,重复步骤1~2的方式;然后获得如下窗口,选择“子组跨数列”, 将“C1~C4的数据”选择,输入规格上下限,点击选项将标题输入后点击“确定”
5
6. 获得图形
6
Xbar-R
1. 将数据输入到minitab工作表中,按图示路径找到Xbar-R
7
2. 选择“子组的观测值位于多列的同一行中”,并将C1~C4的数据选择后, 点击“Xbar-R选项”,点击“检验”,按要求选择不同的检验要求后点击确定,再点击 “选项”,将想要的标题输入,点击“确定”,获得Xbar-R图形(如下页列与列之间长度应相同 添加上下限时不要在对边界打钩
10
minitab-正态性测定案例
பைடு நூலகம்
P-value > 0.05->正态分布(P越大越好) 本例:P=0.022,数据不服从正态分布。 原因:1、Data分层混杂; 2、群间变动大;
M--工序能力分析(连续型):案例:Camshaft.MTW ①工程能力统计:
短期 工序能力
长期 工序能力
X平均=目标值 -> Cp=Cpm X平均≠目标值 -> Cp > Cpm
②求解Zst(输入历史均值):
历史均值:表示强行将它拉到中心位置 ->不考虑偏移->Zst(Bench)
③求解Zlt(无历史均值):
无历史均值: ->考虑偏移->Zlt(Bench)
* Zshift=Zlt(Bench)- Zlt(Bench)=12.13-1.82=0.31
工序能力分析:案例:Camshaft.MTW 另:capability sixpack工具
Minitab之制图
实测性能
PPM < LSL
153846.15
PPM > USL PPM 合计
134615.38 288461.54
预期组内性能
PPM < LSL
87051.05
PPM > USL PPM 合计
84251.36 171302.41
预期整体性能
PPM < LSL
164507.47
PPM > USL PPM 合计
UCL=188.0386
36
24 12
0 187.6
187.7
187.8
187.9
188.0
单独值
187.9 187.8
_ X =187.8193
187.7
187.6
LCL=187.6001
1 6 11 16 21 26 31 36 41 46 51
Minitab制图 制图准备:
1.收集需制图数据资料,并打开Minitab
实测性能
PPM < LSL
153846.15
PPM > USL PPM 合计
134615.38 288461.54
187.6 187.7 187.8 187.9
预期组内性能
PPM < LSL
87051.05
PPM > USL PPM 合计
84251.36 171302.41
预期整体性能
PPM < LSL
点击标签
Minitab制图
二、概率图:
99
95 90 80 70 60 50 40 30 20 10 5
百分比
K18螺孔位置度的概率图
正态 - 95% 置信区间
解读正态概率图-_Anderson-Darling检定
1Anderson-Darling 检定用来检定数据是否来自特定总体 1) 特定群体包括常态、指数、Weibull 等分配 2)Anderson-Darling 检定比较经验 CDF 与理论的距离而进行检定。
2以 Anderson-Darling 检定正态分布的适配性 1)H0:数据来自正态分布 2)统计量为
解读正态概率图- Anderson-Darling 檢定
本文是对解读 Minitab 的正态概率图 /space.php?uid=31197&do=blog&id=76288一文中注解 5Anderson-Darling 检定的说明
检定数据是否来自特定总体的方法称为适配度检定(Goodness of Fit tests),检定的 方法是基于分配的 pdf(如卡方检定)或 cdf(如 Anderson-Darling 检定)
(3) AD 栏的合计为2/(1 + 0.75/n + 2.25/n2),若 AD > CV 则拒绝 H0 1)通常直接计算 AD’=AD/(1 + 0.75/n + 2.25/n2),若 AD’> 0.752则拒绝 H0 2)本例 n=14,所以 AD’= 0.133538/(1 + 0.75/14+ 2.25/142)= 0.142225 3)不同文献对判定基准的数值与计算公式有不同论述
PDF 文件使用 "pdfFactory Pro" 试用版本创建
3) 计算 AD 的方法如下表 (1)将数据 x 给予排序,结果如下34,35,36,37,38,39,40,40,41,42,43,44,45,46, 并估计 H0成立时的正态分布平均值、标准差的估计值分别为40.00与3.741657 (2)求数据 x 所对应 Ln[F(x)],Ln[1-Fn+1-i(x)]、ADi
解读正态概率图-绘制小样本数据检验常态性
解读正态概率图-绘制小样本数据检验常态性
本文是对解读Minitab的正态概率图/space.php?uid=31197&do=blog&id=76288一文中注解4 红色散点图图点绘法的说明
1将数据x给予排序
结果如下34,35,36,37,38,39,40,40,41,42,43,44,45,46
2求数据x所对应累积比例(标准正态分布的百分位数值)
1) 百分位数值的估计有多种方法多,其中最简单的是假设上述14个数据,是平均地从总体
所抽出,所以使用100%÷n可求得平均Cdf栏,如下表
2) 但统计学家认为根据经过排序后的order statistic(or rank statistic)其期望值以median rank或mean rank 估计,但估计方法确有很多种说法,譬如NIST是以uniform order statistic medians估计,Minitab是以( i-0.3)/(n+0.4)估计,而JMP估计方法又不同,因此各家软件的正态
概率图绘制结果细节上会有不同,但因为都是推估也都是近似值而已,本文以Minitab的估计
法列表如下
3根据上表所推估累积比例与x值作散点图
检查各x值的散点非常靠近参考直线,可确定H0成立
附注:因未使用计算机绘图,故可以将推估累积比例值换算为标准正态分布的z值,如下表这样就可运用计算机准确地绘出散点图的图点。
Minitab15简单应用教程_图文.
1选择含组,并单击确定。
步骤
5:在图形对话框中输入数据
此时出现“散点图-数据源”对话框,提示输入要在图形中使用的变量。
数。
• 3D散点图-在X、Y和Z变量定义的三个维度
中标绘单独的观测值。
• 3D曲面图-类似于3D散点图,但它显示连续
曲面或网格而非单独的数据点。
教程概述
用图形表示数据
用图形表示数据
您对负载和时间这对变量之间的关系感兴趣。由于变量之一是时间的测量值,因此可能倾向于使用时间序列图,但注意数据不是在一段时间内收集的,而是在不同时间收集的。您可能测量一段时间内的股票市场或单个患者的心率。在研究中,您收集了有关一段时间内许多不同区组的木材在不同时间的信息,而非单个区组的信息。您选择绘制散点图。
10在偏移下选择自定义。
11在水平中,输入0.02,并单击确定。
步骤16:创建布局
从同一图形对话框中创建多个图形时,可以单独地显示各个图形,也可以用多图形选项在同一页上显示各个图形。但是,除非以后创建布局,
否则在创建不同类型的图形时您只能在不同页上显示这些图形。为了进行演示,您要在同一页上显示箱线图和散点图。
1选择图形>散点图。
步骤4:使用图库
在选择要创建的图形类型后,必须用图库缩小选择范围。这些库提供常用的图形变异,从而可以创建根据您的需要定制的且输入最少的图形。
图库选项将有所不同,以适合所创建的图形,但通常提供以下版本:
•简单-用于没有类别分组变量的情况
•含组-用于具有类别分组变量的情况
•
多个Y
-当类别图中包括多个变量时
要使正态概率图出现在活动窗口中请选择窗口催化剂产出的效应和系数的估计已编码单位系数标效应系数常量7481256129210000温度13806925610270795压力141270625612760025催化剂3038151925615930000温度压力01300625610020981温度催化剂11305625610220832压力催化剂133766925612610031温度压力催化剂01300625610020981102439press3358rsq8614rsq预测4455rsq调整7401对于产出方差分析已编码单位来源自由度seqssadjssadjms4496194496191498731428000172069720692402322901550060060060000981残差误差839508395010494纯误差839508395010494合计15605644产出的系数估计使用未编码单位的数据系数常量606667温度0079167压力483333催化剂26667温度压力0004167温度催化剂0045833压力催化剂433333温度压力催化剂0004167别名结构温度压力催化剂温度压力温度催化剂压力催化剂温度压力催化剂分析因子设计对话框中单击确定输出将显示在会话窗口中而残差图将显示在图形窗口中
Minitab使用小结(一)--正态分布图
1) 将数据COPY到“工作表"的C1列中;若是横向(列)数据,可以使用数据→堆叠→列(将多列数据堆叠成一列);
2) 选择所需需堆叠列C1—C30,堆叠后的数据可以存储在“新的工作表”中或就储存在“当前工作表"的某一列中,如第一列C1中;可选择“使用变量名";在新表中生成数据,不破坏原始数据:
3、计算实例:
规定上限USL=0。253
规定下限LSL=0。247
Max=0.254
Min=0。247△x=Βιβλιοθήκη .007avg=0.251
б=0.002(可在EXCEL中使用函数STDEV选择取样的数据得到)
请计算CPU,CPL,CP,CPK四项。
计算公式及结果如下:
计算方法一:
Cpu=(USL-Average)/3σ
=(0.253-0。251)/(3*0。002)=0.33
Cpl=(Average-LSL)/3σ
=(0。251—0.247)/(3*0.002)=0。67
Cp=(USL-LSL)/6σ
=(0.253—0.247)/(6*0。002)
=0。5
Cpk=Min(Cpu,Cpl)
=Min(0。67,0.33)=0。33
计算方法二:
X=avg=0.251 T=USL—LSL=0.006 U=(USL+LSL)/2=0.250
Ca=(X-U)/(T/2)=(0.251—0。250)/(0。006/2)=0。33
Cp=T/6σ=0。006/(6*0。002)=0。5
Cpk=Cp*(1—|Ca|)=0。5*(1—0。33)=0。33
5) 计算取样数据至少应有20~25组数据,方具有一定代表性。
minitab常用图表解析
170以下占比 0.04% 0.11% 0.18% 0.05% 0.04% 0.06%
205以上占比 0.00% 0.11% 0.35% 0.05% 0.00% 0.00%
主轮时间 0 40 90 130 200 248
备注:散布图中两组变量的对应数至少在30个以上,最好50个,100个最佳。 此为示例。
常用工具栏和菜单栏
根据输入的格式丌同会显 示丌同的数列类型
柏拉图的使用
柏拉图主要用于分析,发现主要问题。
收集各项质量特性缺陷 列成表 输入到MINITAB中
MINITAB绘出图形
找出关键的Y特性
1. 数据录入表格内(手动输入或者粘貼的方式)
2. 选择柏拉图选项,并在弹出的对话框进行选择。
C2-T列 C3列
更深入的分析可以考虑制程能力分析。
正态分布图的使用
正态分布图的主要用于判定数组的集中性、均匀性,并综合评价其的能力水平。 我们一般用CPK值来评价过程的制程能力。 Cpk的评级标准:(可据此标准对计算出之制程能力指数做相应对策) A++级 Cpk≥2.0 特优 可考虑成本的降低
A+ 级 2.0 > Cpk ≥ 1.67 优 应当保持之
3. 生成图形并进行分析。
前三项不良为D级+破片、边缘、线痕,提供改善方向。
因果图的使用
因果图主要头脑风暴法找出可能的原因,进行改善。 例:以切片的掉片、掉棒为例。 数据组: 人
胶水配比出错
机
设备抖动严重
料
砂切割力弱,切 割深度丌均匀
法
切割深度过深
环
粘晶房温湿度超 标
胶层偏厚
晶棒、玻璃板表 面没有擦拭干净
砂浆冷却水异常, 胶水里存在异物 冷却效果差,切 割温度过高
Minitab 操作
Minitab 操作1、柏拉图:找主要因子,大于或等于80%为主要因子。
路径:统计----质量工具----柏拉图(选已整理成表格的缺陷数据)2、正态分布:正态检验三种方法①概率图:图形---概率图(看P值,P大于0.05说明服从正态分布);②图形化汇总: 统计---基本统计量----图形化汇总(看P值,P大于0.05说明服从正态分布);③正态性检验: 统计---基本统计量----正态性检验3、产生随机数据:计算----随机数据(然后再选所需要产生何种数据)4、数据堆叠:数据---堆叠5、计算中行统计量、列统计量分别于计算所在行或列的均值、和、标准偏差等6、文本、数字转换:数据---更改数据类型7、概率计算:计算---概率分布----正态----累积概率8、分位数的计算:计算---概率分布----正态----逆累积概率9、稳定性:统计---控制图---单值的变量控制图----单值(单值控制图选项中S限制)10、测量系统分析①量具研究:统计—质量工具---量具研究---量具R&R研究(交叉)注:非破坏性测试用交叉,破坏性测试用嵌套.②属性一致性分析(合格与不合格)统计---质量工具---属性一致性分析③量具线性与偏倚研究:统计——质量工具——量具研究——量具线性与偏倚研究(看所有的P值,所有P值小于0.05时)11、非正态数据与正态数据转换①正态性检验,②如非正态,转换成正态分布:统计—控制图---BOX-COX12、过程能力分析统计---质量工具---能力分析13、置信区间的算法:①正态总体均值的置信区间(σ已知)用1Z单样本:统计—基本统计量—1Z单样本输入的标准差为已知的总体标准差;样本数量为所取的样本量;均值为样本的均值;请注意选取置信水平②正态总体均值的置信区间(σ未知)用1t单样本:统计—基本统计量—1t单样本请注意汇总数据中的样本数量为所取的样本量;均值为样本的均值;标准差为样本的标准差;请注意选取置信水平④比率P的置信区间用1P单样本:统计—基本统计量—1P单样本(试验数为样本量,事件数为要计算的概率的数)⑤正态总体方差和标准差的置信区间用单方差:统计—基本统计量—σ2单方差(请注意用汇总数据,及置信水平)14、假设检验第一步:首先建立原假设及备择假设;第二步:进行检验;①正态总体均值检验(σ已知)用1Z单样本:统计—基本统计量—1Z单样本输入的标准差为已知的总体标准差;样本数量为所取的样本量;均值为样本的均值;请注意选取置信水平及假设检验,并输入假设的均值及选取相应的备择假设。
正态分布分析
正态分布以平均值为中心呈对称分布的钟形曲线。
正态分布是最常见的统计分布,因为许多物理、生物和社会方面的测量值都自然近似于正态。
许多统计分析均要求数据来自正态分布总体。
例如,居住在宾夕法尼亚州的所有成年男性的身高近似于正态分布。
因此,大多数男性的身高都将接近于 69 英寸的平均身高。
高于和矮于 69 英寸的男性的数量相近。
只有一小部分身材特别高或特别矮。
平均值 (μ) 和标准差 (σ) 是定义正态分布的两种参数。
平均值是钟形曲线的波峰或中心。
标准差决定数据的散布情况。
大约有 68% 的观测值与平均值相差不到 +/- 1 个标准差;95% 与平均值相差不到 +/- 2 个标准差;而 99% 的观测值与平均值相差不到 +/- 3 个标准差。
就宾夕法尼亚州男性的身高而言,平均身高为 69 英寸,标准差为 2.5 英寸。
大约68% 的宾夕法尼亚男性身高介于66.5(μ- 1σ) 和71.5 (μ+ 1σ) 英寸之间。
大约95% 的宾夕法尼亚男性身高介于64(μ- 2σ) 和74 (μ+ 2σ) 英寸之间。
大约99% 的宾夕法尼亚男性身高介于61.5(μ- 3σ) 和76.5 (μ+ 3σ) 英寸之间。
过程能力生产或提供满足根据客户需要定义的规格的产品或服务的能力。
例如,影印机制造商要求橡胶辊筒的宽度必须介于 32.523 cm 与 32.527 cm 之间,才能避免卡纸。
能力分析揭示了制造过程满足这些规格的程度,并提供有关如何改进该过程和维持改进的见解。
在评估过程能力之前,必须确保过程是稳定的。
不稳定的过程是无法预测的。
如果过程稳定,则可以预测将来的性能并改进其能力。
应定期测量并分析过程的能力。
能力分析有助于回答以下问题:∙过程是否满足客户规格?∙过程将来的性能如何?∙过程是否需要改进?∙过程是保持了这些改进还是回复到了原来的未改进状态?可使用过程指标(如 Cp、Pp、Cpk 和 Ppk)来分析过程能力。
解读正态概率图-正态概率图纸的秘密
解读正态概率图-正态概率图纸的秘密本文是对解读Minitab的正态概率图一文中注解3-正态概率图图纸的说明1上图的H0假设1)上图单组数据为34,35,36,37,38,39,40,40,41,42,43,44,45,46共N=14个2)计算得平均值为Xbar=40,标准差为s=3.741657 (图示为3.742)3)上图的H0假设数据源自正态分布,相对H1就是非正态分布4)基于正态分布的假设,所以根据样本数可以估计此正态分布的2个参数,平均值μ为40,标准差σ为3.7416572正态分布的特性x、z与累积分配函数1)正态分布z值有人称z score,是正态分布的变量x,转换为标准正态分布时对应值为z,关系是为z=(x-μ)/σ2)正态分布下变量x,经转换为标准正态分布对应值z,就可经由正态分布数值表或软件等求得x的累积分配函数(cdf),cdf一般统计符号写成F(x)= P(X≦x),P就是X≦x累积机率,正态概率图的纵坐标Percent就是F(x)3)鼠标移到Minitab蓝色直线上,就会出现如下图中的黄底的Percent与x数值表4)Percent与x数值表说明黄底的Percent与x数值表,Percent就是F(x),F(x)是指定的解于0与1之间,表上所示数值系为%,透过标准正态分布,就可求F(x)的反函数z,然后以公式x=zσ+μ得到x值3正态性检定使用的正态概率图图纸1)下表为手工计算,结果与minitab的Percent与x数值表相符的作成蓝色参考值线的数据x、z、F(x)关系表如下表,表中系先指定F(x),就是表中Percent栏,然后基于正态分布求x=F-1(x),再使用正态分布标准化公式计算z=(x-Xbar)/s2)若以Percent vs x畫散佈圖是S型曲線並非直線,如下圖,所以常態機率圖的繪製有點竅門解读正态概率图的第一要务是理解所谓机率图图纸,常用有常态与Weibull二种机率图图纸,下图是正态概率图图纸的示意图,图中蓝色直线是基于H0的正态分布假设下,自样本数据去估计平均Xbar=40与标准差s=3.741657,并制作x、z、F(x)关系表(如上表)所作成4正确制作正态概率图图纸步骤1)作z vs x作散布图为了能够显示一直线,于是以z vs x作散布图,并于每个点上,标出该数据x对应的F(x)值,每一个点上也画出网格线如下图,观看网格线,似乎类似对数坐标(实际上并不是)2)將各點百分比值F(x)作為新座標Y軸3) 若将纵坐标Y轴隐藏或者是移到次坐标轴,而将数据卷标F(x)值作为纵坐标Y轴的坐标刻度,此时就是正态概率图纸5正态概率图的应有认识一张正态概率图表面上为F(x) vs x,实质上还是存在z vs x关系,构成正态概率图的二个轴分别为1)排序数据x2) 数据x对应累积比例(标准正态分布的百分位数值)至于数据x置于横轴或纵轴,不同软件表现不同,Minitab放在横轴,JMP放在纵、横轴均可指定,而Excel是放在在纵轴。
解读正态概率图- Anderson-Darling检定
解读正态概率图- Anderson-Darling檢定本文是对解读Minitab的正态概率图/space.php?uid=31197&do=blog&id=76288一文中注解5Anderson-Darling检定的说明检定数据是否来自特定总体的方法称为适配度检定(Goodness of Fit tests),检定的方法是基于分配的pdf(如卡方检定)或cdf(如Anderson-Darling检定)1Anderson-Darling检定用来检定数据是否来自特定总体1)特定群体包括常态、指数、Weibull等分配2)Anderson-Darling检定比较经验CDF与理论的距离而进行检定。
2以Anderson-Darling检定正态分布的适配性1)H0:数据来自正态分布2)统计量为3) 计算AD的方法如下表(1)将数据x给予排序,结果如下34,35,36,37,38,39,40,40,41,42,43,44,45,46,并估计H0成立时的正态分布平均值、标准差的估计值分别为40.00与3.741657(2)求数据x所对应L n[F(x)],Ln[1-Fn+1-i(x)]、ADi(3) AD栏的合计为0.1335383计算判定基准CV= 0.752/(1 + 0.75/n + 2.25/n2),若AD > CV则拒绝H01)通常直接计算AD’=AD/(1 + 0.75/n + 2.25/n2),若AD’> 0.752则拒绝H02)本例n=14,所以AD’= 0.133538/(1 + 0.75/14+ 2.25/142)= 0.1422253)不同文献对判定基准的数值与计算公式有不同论述4检定结果常以P-value表示Minitab计算P-value公式为P-value = C1 + C2 × exp (C3 + C4 AD’+ C5 AD’2)其中C1~C5为系数,基于AD的分配得知,当AD’<0.2时C1=1; C2=-1; C3=-13.436; C4=101.14; C5=-223.73,所以P-value=1+1×exp(13.436+101.14×AD’+223.73×AD’2)=0.9720395本文结论本文的AD与P-value计算与Minitab的输出一致的。
minitab实验之试验设计(2)解读
分析要点三:分析评估各项效应的显著性。计算结果显示,4个主效应中,加热温度、加热时间和保温时间是显著的,只有转换时间不显著;6个2因子水平交互效应中,只有加热时间*保温时间是显著的。说明本例中还有不显著的自变量和2因子交互作用,改进模型时应该将这些主效应和交互作用删除。
加热温度*保温时间3.062 1.531 1.500 1.02 0.337
加热时间*转换时间1.263 0.631 1.500 0.42 0.685
加热时间*保温时间7.113 3.556 1.500 2.37 0.045
转换时间*保温时间0.837 0.419 1.500 0.28 0.787
S = 6.00146 PRESS = 1778.45
稳健参数设计(robust parameter design)(也称健壮设计、鲁棒设计,简称参数设计)是工程实际问题中很有价值的统计方法。它通过选择可控因子的水平组合来减少一个系统对噪声变化的敏感性,从而达到减小此系统性能波动的目的。过程的输入变量有两类:可控因子和参数因子。可控因子是指一旦选定就保持不变的变量,它包括产品或生产过程设计中的设计参数,而噪声因子是在正常条件下难以控制的变量。在做参数设计时,就是把可控因子的设计当做研究的主要对象,与此同时让噪声因子按照设定的计划从而系统改变其水平的方法来表示正常条件下的变化,最终按照我们预定的望大、望小或望目地目标选出最佳设置。田口玄一博士在参数设计方法方面贡献非常突出,他在设计中引进信噪比的概念,并以此作为评价参数组合优劣的一种测度,因此很多文献和软件都把稳健参数设计方法称为田口方法(Taguchi design)。
使用Minitab进行正态转换
使用Minnitab进行正态转换西北农林科技大学资环学院小华哥Ⅰ发现问题附带的数据“正态转换”中有一列数据这列数据在SPSS中进行K-S检验,其结果是不符合正态检验。
Sig值为0.048<0.05拒绝原假设。
Ⅱ解决问题为了使数据符合正态,我尝试了对数、指数等转换,但依旧不符合正态分布。
后得知在Minitab中可以进行Box-Cox转换,且Box-Cox变换在ArcGIS中就自带,就省了用其它变换,还要做逆变换的一步。
因为可以利用在Minitab中获取的变换参数,在arcgis中做,arcgis会自动进行逆变换。
一、将数据粘贴到minitab工作表中,为了保证数据不会出现丢失,像spss一样,所以我们在Excel中定义好数据类型和长度。
或者保守的做法是用minitab的导入命令“文件-打开工作表”文件类型设置成Excel就行了。
二、打开后发现数据保留的小数为4个,而原始数据为7个。
为了保证经度,设置数据长度。
单击C1行,右键单击-格式列-数字-固定小数位,将小数位设置为7。
三、①设置新数据的存放列,在工作表的C2下面双击,输入新的转换数据的存放列名称,我设置成BOX-COX——②minitab中单击“控制图——Box-Cox”③数据数据列,选择输入数据,子组大小设置为30,这个应该是正态柱状图的柱子个数,赵师姐建议使用30。
④选择“最优或取整”,软件会自动帮助计算得最佳参数λ。
在输出数据栏,选择刚刚在数据表建立的新字段“BOX-COX”中。
点击确定⑤会得到以下结果,核心参数是估计值0.98,也就是软件的最优λ值。
⑥在BOX-COX处新增了数据,这就是转换后的数据,这里有一个问题,因为软件默认采用的是取整的λ,而不是估计值,所以精度不够高,再加上原始数据十分接近正态分布,因此导致区整值为1,1表示什么也不做。
由下可知前后数据是一样的。
因此我们要手动根据最优的λ(0.98)手动计算。
⑦结果如下,并按照“二”的方法,把BOX-COX的小数保留为7位。
解读正态概率图-_Anderson-Darling检定
(3) AD 栏的合计为0.133538
3计算判定基准 CV= 0.752/(1 + 0.75/n + 2.25/n2),若 AD > CV 则拒绝 H0 1)通常直接计算 AD’=AD/(1 + 0.75/n + 2.25/n2),若 AD’> 0.752则拒绝 H0 2)本例 n=14,所以 AD’= 0.133538/(1 + 0.75/14+ 2.25/142)= 0.142225 3)不同文献对判定基准的数值与计算公式有不同论述
1Anderson-Darling 检定用来检定数据是否来自特定总体 1) 特定群体包括常态、指数、Weibull 等分配 2)Anderson-Darling 检定比较经验 CDF 与理论的距离而进行检定。
2以 Anderson-Darling 检定正态分布的适配性 1)H0:数据来自正态分布 2)统计量为
计算ad的方法如下表1将数据x给予排序结果如下3435363738394040414243444546并估计h0成立时的正态分布平均值标准差的估计值分别为4000与37416572求数据x所对应lnfxln1fn1ixadiad栏的合计为01335383计算判定基准cv07521cv则拒绝h01通常直接计算adad1225n2若ad0752则拒绝h02本例n14所以ad013353810751422514201422253不同文献对判定基准的数值与计算公式有不同论述4检定结果常以pvalue表示minitab计算pvalue公式为pvalueexpc3c4adc5ad2其中c1c5为系数基于ad的分配得知当ad02时c11
Hale Waihona Puke PDF 文件使用 "pdfFactory Pro" 试用版本创建
解读Minitab的正态概率图
解读Minitab的正态概率图已有371 次阅读2009-11-5 20:41 |个人分类:Minitab|关键词:Minitab在DOE、Regression、统计检定时常需要用到正态分布的假设,检定一组数据是否取自正态分布,进行常态性检定最简单方法就是采用正态概率图。
最近很多贴文询问Minitab正态概率图的坐标系统、意义与手工绘制等议题,因涉及分配概率图的理解与使用,因此撰文剖析,如下图是以一组14个样本数据所画的正态概率图本图原始数据,经排序后如下34,35,36,37,38,39,40,40,41,42,43,44,45,46图上有5个注解,依序说明之注解1:Probability Plot of x,表示此图是一组数据,放在名为x的栏位上,下方有Normal 表示本项检定的H0是Normal –正态分布,当然H1就是非正态分布注解2:Mean 40表示数据平均值,StDev 3.742(计算结果3.74166)表示数据标准差,N 14表示数据数,这些计算式依据一般基本统计的公式计算而得注解3:蓝色直线是画在正态分布机率图纸上,是一条参考线,以判断是否H0成立详细解说如下1)鼠标移到Minitab蓝色直线上,就会出现如下图中的黄底的Percent与x数值表2) Percent与x数值表中,Percent为正态分布累积分配函数(CDF),数值是介于0与1之间,表上数值为%值,习惯上是以F(x)表式之,而x为F(x)的反函数3)若直接以Percent与x( inv F(x))数值表作散布图不会得到依直线,而是S型曲线4)在Percent与x( inv F(x))数值表多加一栏z,其值为x( inv F(x))的标准化,z=( inv F(x)) –40)/3.741665)以x( inv F(x))为横轴,z为纵轴作散布图+回归线,可得一直线,将每个点以Percent作为数据卷标6)隐藏纵轴z,改用Percent的数据标签,就是一般的正态概率图纸** 此处须要另文说明解读正态概率图-正态概率图纸的秘密**注解4:红色散布图图点是将样本数据排序后,以median rank估计出该点的CDF值,根据CDF数值求出标准正态分布的反函数z值,再以x vs z绘出散布图(参考注解3)** 此处须要另文说明解读正态概率图-绘制小样本数据检验常态性**注解5:Anderson-Darling常态性检定以辅助图型判断** 此处须要另文说明解读正态概率图- Anderson-Darling检定**延伸阅读:用Excel做简易的正态概率图(Normal probability plot)例。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
解读Minitab的正态概率图
P值是MINITAB通过某种分布(F、T等)转换过来的一个值,正是由于概率中有太多的分布,一般对统计学不是很清楚的人是很难记住这些分布的。
通过转换,在MINITAB中,就只需看一个值,即P值,一般取0.05。
通过它来做假设检验,而假设检验又有很多类型,不是一下子能讲清楚的。
就LZ问题而言,从图中得出来的P值为0.84,大于0.05,可认为数据为正态分布(虽然样本量少了点)。
至于P值到底如何而来,AD值代表何意,就个人见解而言,LZ可以先不到这个深度。
Anderson-Darling 统计量,测量数据服从特定分布的程度。
分布与数据拟合越好,此统计量越小。
使用Anderson-Darling 统计量可比较若干分布的拟合情况,以查看哪种分布是最佳分布,或者检验数据样本是否来自具有指定分布的总体。
例如,可以使用Anderson-Darling 统计量为可靠性数据分析在Weibull 和对数正态分布之间进行选择,或者检验数据是否符合t 检验的正态性假设。
其实看一下Minitab帮助什么都有。
AD值代表你的真实的量测数据的累计分布与理论正态的累计正态分布的面积差,AD值越小,说明你的数据越接近正态分布数据。
在DOE、Regression、统计检定时常需要用到正态分布的假设,检定一组数据是否取自正态分布,进行常态性检定最简单方法就是采用正态概率图。
最近很多贴文询问Minitab正态概率图的坐标系统、意义与手工绘制等议题,因涉及分配概率图的理解与使用,因此撰文剖析,如下图是以一组14个样本数据所画的正态概率图
本图原始数据,经排序后如下
34,35,36,37,38,39,40,40,41,42,43,44,45,46
图上有5个注解,依序说明之
注解1:Probability Plot of x,表示此图是一组数据,放在名为x的栏位上,下方有Normal表示本项检定的H0是Normal –正态分布,当然H1就是非正态分布
注解2:Mean 40表示数据平均值,StDev 3.742(计算结果3.74166)表示数据标准差,N 14表示数据数,这些计算式依据一般基本统计的公式计算而得
注解3:蓝色直线是画在正态分布机率图纸上,是一条参考线,以判断是否H0
成立
详细解说如下
1) 鼠标移到Minitab蓝色直线上,就会出现如下图中的黄底的Percent与x数值表
2) Percent与x数值表中,Percent为正态分布累积分配函数(CDF),数值是介于0与1之间,表上数值为%值,习惯上是以F(x)表式之,而x为F(x)的反函数
3) 若直接以Percent与x( inv F(x))数值表作散布图不会得到依直线,而是S型曲线
4) 在Percent与x( inv F(x))数值表多加一栏z,其值为x( inv F(x))的标准化,z=( inv F(x)) – 40)/3.74166
5) 以x( inv F(x))为横轴,z为纵轴作散布图+回归线,可得一直线,将每个点以Percent作为数据卷标
6) 隐藏纵轴z,改用Percent的数据标签,就是一般的正态概率图纸
** 此处须要另文说明解读正态概率图-正态概率图纸的秘密 **
注解4:红色散布图图点是将样本数据排序后,以median rank估计出该点的CDF 值,根据CDF数值求出标准正态分布的反函数z值,再以x vs z 绘出散布图(参考注解3)
** 此处须要另文说明解读正态概率图-绘制小样本数据检验常态性**
注解5:Anderson-Darling 常态性检定以辅助图型判断
** 此处须要另文说明解读正态概率图- Anderson-Darling檢定**。