散点图
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
散点图
[概要]介绍了散点图的概念、用途、适用情况,结合实例利用Minitab软件作为数据分析工具介绍了散点图的绘制步骤、分析与判断以及应用时的注意事项。
[字数]4000。
[正文]散点图是质量管理的老七种工具之一,也称为散布图或相关图,它是研究成对出现的变量间的相互关系的坐标图。质量管理中经常需要研究两个变量之间的关系,如棉纱的水分含量与伸长度之间的关系,热处理时钢的淬火湿度与硬度的关系,冶炼某种钢时钢液的含碳量与冶炼时间的关系,零件加工时切削用量与加工质量的关系等等。根据我们的经验,这些变量存在着比较密切的关系,但这些关系又不像数学公式和物理公式那样能够精确表达,散点图是研究这种变量间关系的一种图形工具。在散点图中,通常将成对出现的数据以坐标点的形式标注在坐标轴上,以形成“点子云”。通过研究点子云的分布状态,可以推断出变量间的相关模式。……
散点图
散点图是质量管理的老七种工具之一,也称为散布图或相关图,它是研究成对出现的变量间的相互关系的坐标图。质量管理中经常需要研究两个变量之间的关系,如棉纱的水分含量与伸长度之间的关系,热处理时钢的淬火湿度与硬度的关系,冶炼某种钢时钢液的含碳量与冶炼时间的关系,零件加工时切削用量与加工质量的关系等等。根据我们的经验,这些变量存在着比较密切的关系,但这些关系又不像数学公式和物理公式那样能够精确表达,散点图是研究这种变量间关系的一种图形工具。在散点图中,通常将成对出现的数据以坐标点的形式标注在坐标轴上,以形成“点子云”。通过研究点子云的分布状态,可以推断出变量间的相关模式。
在质量改进过程中,散点图作为因果图/因果矩阵的后续工具,通过将影响因素和质量特性的各对数据用直角坐标系表示成图形,直观观察当因素发生变化时质量特性相应出现的变化情况,以判断两个变量间是否存在关系,即X是否是造成问题Y的一个影响因素。如果存在影响,进一步分析这种影响关系的类型和程度,为后期建立影响因素和质量特性的回归方程提供直接的启发和帮助。散点图适用于X和Y都是连续型数据的情况。
我们通过一个例子来说明散点图的应用过程,包括散点图的绘制和分析判断。
示例:某质量改进小组通过前期分析认为,车床转速是影响加工产品表面抛光情况的一个影响因素。为了验证这种推测是否合理,小组收集了不同转速下的产品表面抛光量,数据见表4.21-1,该数据保存在“散点图.MTW”的“表面抛光量1”和“车床转速1”。
表1 表面抛光数据
序号表面抛光量1 车床转速1
1 45.44 225
2 42.0
3 200
3 50.10 250
4 48.7
5 245
5 47.92 235
6 42.79 237
7 52.26 265
8 50.52 259
9 45.58 221
10 44.78 218
1.散点图的绘制
利用Minitab软件绘制散点图的步骤如下:
①打开数据文件“散点图.MTW”。
②点击图形>散点图,选择“简单”,并点击确定。如图1所示,“散点图”对话框中提供6种散点图绘制模式,“简单”、“包含回归”“包含连接线”绘制的是没有分组变量的散点图,“简单”只提供原始的两个变量的坐标图,“包含回归”除包含坐标点外,还绘制拟合坐标点的回归直线,“包含连接线”则是除显示坐标点外,还用折线将坐标点连接起来。“含组”、“包含回归和组”“包含连接线和组”则是在同一张图形上同时显示两个变量在不同层下的散点图,以观察不同层下X与Y的关系。先看“简单”这种散点图模式。
图1 “散点图”对话框示意图
③在“Y变量”中选择要分析的响应变量“表面抛光量1”,在“X变量”中选择要分析的影响因素“车床转速1”,点击确定。如图2所示。需要说明的是,可以同时选择多对“Y变量”和“X变量”,即可以同时绘制多张散点图。
图2 “散点图-简单”对话框示意图
得到的散点图如图3所示。
图3 表面抛光量与车床转速的散点图
2.散点图的分析与判断
散点图的绘制比较简单,更主要的工作是根据绘制的散点图来分析两个变量之间的关系,观察和解释散点图展示出的变量间的相关模式,散点图的分析与判断方法有对照典型图例法、简单象限法和相关系数判别法等。这里我们仅介绍对照典型图例法和相关系数判别法。当结果显示两个变量间存在比较密切的关系,并且这种关系能够有合适的工程背景解释时,应进一步进行回归分析来建立变量间的回归方程,详细内容参见第二十四课“回归分析”。
(1)对照典型图例法。散点图所显示的两个变量间的关系各种各样,但大致可以分为以下六种模式,如图4所示。如果变量Y 随着X 的增大而有明显的增大趋势,则称两个变量强正线性相关,如果变量Y 随着X 的增大而有明显的减小趋势,则称两个变量强负线性相关。如果变量Y 随着X 的增大而有一定的增大趋势,则称两个变量弱正线性相关,如果变量Y 随着X 的增大而有一定的减小趋势,则称两个变量弱负线性相关。
如果变量Y 随着X 的变化杂乱无章地变化,则称两个变量不相关,如果变量Y 随着X 的变化而有明显的非线性趋势,则称两个变量非线性相关。把实际绘制的散点图与下述图中的典型模式进行对照,就可以得到两个变量之间是否相关及相关程度的结论。本例中,表面抛光量与车床转速呈明显的强正线性相关关系,表明车床转速是影响表面抛光量的一个主要因素,转速越高,表面抛光量越大。
图4 六种常见的散点图模式
(2)相关系数判别法。通过观察散点图,虽然可以对变量间的相关模式做出大致的估
计,但是由于缺乏客观的统一判定标准。这种判断方法的可靠性较低,只是一种定性判断的方法,容易出现不同人有不同判别结果的情况。为了提高判断的精度,在实际工作中,常采用相关系数检验法,通过计算相关系数,并对相关系数是否为0进行显著性检验来判断相关的类型和相关的程度。
相关系数是对变量之间线性相关关系密切程度的度量,刻画了散点图上点子围绕直线的密切程度。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ。若是根据样本数据计算的,称为样本相关系数,记为 r 。样本相关系数r 的计算公式如下:
∑∑∑===−−−−=n
i i n i i
n i i i
y y x x y y x x r 12
121
)()())((ˆ 从相关系数的计算公式容易看出,r 的取值范围为[-1,1],当r >0时,表明两个变量呈正相关,当r <0时,表明两个变量呈负相关。|r |的大小刻画了两个变量间线性相关的程度,|r |越趋于1表示线性关系越密切,|r |越趋于0表示线性关系越不密切。Minitab 软件的“统计>基本统计量>相关”模块可以计算两个变量间的相关系数,并进行相关系数检验,告诉我们两个变量间是否确实存在一定的线性关系。利用表面抛光量的例子示例软件相关系数检验的过程,步骤如下:
①打开数据文件“散点图.MTW ”。
②点击统计>基本统计量>相关,在“变量”栏中选择要分析的变量,可同时输入多列,软件将同时输出这些变量两两间的相关系数。这里选择“表面抛光量1”和“车床转速1”,并点击确定。如图5所示,默认时,软件自动选择“显示p 值”,即进行相关系数检验,输出每一相关系数对应的 P 值,P 值小于给定的显著性水平,表示相应的两个变量间存在线性相关关系。
图5 “相关”对话框示意图
会话窗口的输出如图6所示,“表面抛光量1”与“车床转速1”间的相关系数等于0.883,检验的P 值等于0.001,小于默认的显著性水平0.05,表明表面抛光量与车床转速间存在较强的正线性相关关系。
图6 相关系数检验的输出结果
需要注意的是有时相关系数不能正确刻画两个变量间的关系,一般应先绘制散点图,再进行相关系数检验,两者结合来评价两个变量间的关系,图7示意了几种不宜用相关系数描