数据变换
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据变换
许多分析都需要正态性假设。如果数据为非正态,有时您可以应用函数以使数据近乎正态,以便可以完成分析。
例如,假设您需要针对比萨饼送货所需的时间执行能力分析。尽管存在最小时间(下限),但可能没有最大时间(上限),因此数据可能会向右侧偏斜。
比萨饼送货时间向右偏斜,而且未呈正态分布。取倒数以使数据更服从正态分布。倒数是使用方程 Y = 1/X 来获得的。因此变换后的数据 = 1/送货时间。概率图显示变换后的数据更加符合正态分布。
根据数据,存在许多不同的函数(如平方根、对数、幂、倒数或反正弦),可以应用这些函数来变换数据。在您不确定要尝试哪种变换时,Minitab 可以提供帮助。
Minitab 提供了两种数据变换方法:
·Box-Cox 变换 - Minitab 仅查找最优指数变换。(W = Y**Lambda,Minitab 将使用此公式查找 lambda 的最佳值)。尽管 lambda 的最佳估计值可能是 -5 到 5 之间的任何数字,但在任何实际情况下,您都需要一个与容易理解的变换对应的 lambda 值,如平方根(lambda 为 0.5)或自然对数(lambda 为 0)。
Box-Cox 变换很容易理解,但是作用非常有限,而且通常找不到适合的变换。而且,此变换仅适用于正数据。
·Johnson 变换 - Johnson 变换与 Box-Cox 变换使用的算法不同。Johnson 变换函数是从 Johnson 系统中的三个系列的函数中选择的。由于函数通过更改参数可涵盖大量分布,因此 Minitab 通常会找到可接受的变换。Minitab 选择的系列称为“最佳变换类型”。
如果 Box-Cox 算法找不到合适的变换,请尝试 Johnson 变换(或假设数据服从非正态分布,并且使用其他分布,而不变换数据)。Johnson 变换函数较为复杂,但对于查找合适的变换而言功能非常强大。
注意Box-Cox 变换利用数据位于子组中(当子组 > 1 时)这样一个事实;但Johnson 变换不利用这个事实。这就是“子组内”分析只能使用 Box-Cox 变换的原因所在。