散布图
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8.8
89.1 -
批号
16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
添加剂“A?(g) 产出率(%)
8.4
89.4
8.2
86.4
9.2
92.2
8.7
90.9
9.4
90.5
8.7
89.6
8.3
88.1
8.9
90.8
8.9
88.6
9.3
92.8
8.7
87.2
9.1
批号
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
添加剂“A?(g) 产出率(%)
8.7
88.7
9.2
91.1
8.6
91.2
9.2
89.5
8.7
89.6
8.7
89.2
8.5
87.7
9.2
88.5
8.5
86.6.9
8.9
88.4
8.8
87.4
8.4
87.4
-
四、散布图的相关检验
2、符号检验法(中值法)
Y (%)
93 92 91 90
89
88 87 86 85
散布图中位线
Ⅱ
n2=5
●
●
●● ●
●
Ⅲ
●
n3 =10
P
●● ●
●
● ●
●●
● ●
●
● ●
● ●
●
●
●
●●
●
Ⅰ
n1=10
Q
●
Ⅳ
n4 =5
8.0
8.5
9.0
9.5
-
X(g)
四、散布图的相关检验
2、符号检验法(中值法)
表2 散布图的横、纵坐标的范围应基本相等
Y 应基本相等
Y的数据范围
X的数 据范围
-
二、散布图的绘图步骤
4、描点
把数据组(X,Y)分别标在直角坐标系相应的位置上。 ①如两组数据相同,其点子必重合,则用○或○表示; ②如三组数据相同,则用○● 3表示。
93
●
●
●
92
产出率百分比
91
●
●
90
○●
●
●
●
●
数据一般要在30组以上,且数据必须是对应的,并记录 收集数据的日期、取样方法、测量方法等有关事项。
案例收集了30组对应数据
-
二、散布图的绘图步骤
3、在坐标纸上建立直角坐标系
①为便于分析相关关系,两个坐标数值的最大值与最小值之 间的范围应基本相等。见表2。 ②若分析对象的关系,属于因素与质量特性值之间的关系, 则X轴表示因素,Y轴表示质量特性值。
-
五、相关系数及其检验
• r值
(+) 正的相关关系 () 负的相关关系 接近0时几乎没有相关关系
r 接近 -1
r 接近 +1
• 为调查相关关系,需要数据构造为成对的2个变量数据
-
五、相关系数及其检验
• 一般表示为 (总体的相关关系),其范围是 1 1
• 一般情况下我们无法知道的正确的值,因此使用从样本推 断的值r.r从
因为S>Sα,所以添加
18 3 19 3
4 40 11 13 62 20 22 84 30 32 4 41 11 13 63 20 23 85 30 32
剂”A“的重量和产出率
2 2
0 1
3 4
5 5
42 12 14 64 21 23 86 31 33 43 12 14 65 21 24 87 31 33
不存在相关系数R。
四、散布图的相关检验
2、符号检验法(中值法)
符合检验法是利用“符号检验表”检查点子云的形态, 以判断相关关系及其程度的一种定性分析方法。符号检验法 的分析结果要比对照典型图法准确。
符号检验法分析步骤(结合下表来说明) ①在散布图中作一条平行于X轴的中位线Q,平分散布图中所 有的点子,使上下点子数基本相等。 ②在散布图中作一条平行于Y轴的中位线P,平分散布图中所 有的点子,使左右点子数基本相等。
-
一、散布图概述
3、散布图的用途:
①用来发现和确认两组数据之间的关系并确定两组相 关数据之间预期的关系。 ②通过确定两组数据、两个因素之间的相关性,有助 于寻找问题的可能原因。
-
二、散布图的绘图步骤
案例:表1-6 列出了添加剂的重量与产出率的数据,请根据这 些数据描绘出散布图并进行分析。
表1 添加剂“A”的重量和相应的产出率
如查清确实属于上述等原因造成的,则应将这些点删 除。如果原因不明,就不能删除,变量之间很可能包含着我 们认识不到的规律。
5、记入必要信息
填写散布图标题、数据来源及其它必要事项。
-
三、作散布图的注意事项
1、明确在什么范围内相关
当X在很小范围内提取时,即使X和Y之间有相关关系,有时 也常常呈现不相关的状态,因此这时X需在足够大的范围提取。
•
• •••••••••••••••••••••••••••••••••••••••••••
论作出总判断。
8 0 0 30 7 9 52 16 18 74 25 28 9 0 1 31 7 9 53 16 18 75 26 28
对于上表的案例:
10 0 11 0
1 32 8 9 54 17 19 76 26 28 1 33 8 10 55 17 19 77 27 29
12 1 2 34 9 10 56 17 20 78 27 29
如下公式得出且范围是 -1 r 1 .
一般样本大小(30个以上)为基准 如果 |r|> 0.80 时具有强的相关关系 如果 0.3 >|r|> 0.80 时具有弱的相关关系. 如果 |r|< 0.30 时认为没有有效的关系.
-
五、相关系数及其检验
2、相关的类型和大小
强的正相关
•
•
•• •• ••
89
●
●●
●
88
●
●
●
87
●
●
86
85
8.0 8.5 9.0
9.5
添加剂“A”,g
-
表3:此散布图示出了添加剂“A”的质量与产出率之间存在着弱正相关的关系。
二、散布图的绘图步骤
4、描点
当散布图上出现明显偏离其他数据点的异常点时,应查 明原因,以便决定是否删除或校正。所谓异常点就是散布图 上出现远离群点的点。对于这种点的出现,要查明原因。一 般来说产生这种现象的原因是由于测量的误差、数据记录错 误或操作条件的变化等。
S=10,
13 1 14 1
2 35 9 11 57 18 20 79 28 30 2 36 9 11 58 18 21 80 28 30
15 2 3 37 10 12 59 19 21 81 28 31
查右表知:Sα=9,
16 2 17 2
3 38 10 12 60 19 21 82 29 31 4 39 11 12 61 20 22 83 29 32
有时在试验条件下X、Y相关,而在实际生产条件下X、Y不 相关,这样不能把相关的结论扩大至更广泛的范围内。
●●●●●●●●●●●●
●● ●●
●
● ●● ●
● ● ●●
●●●●● ● ●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
-
三、作散布图的注意事项
4、假相关
有时存在这样的情况,观察散布图明明有相关,但从技术 上看,直接提出的原因与结果之间都没有关系。
比如,可能与民列原因之外的原因相关,而错误的认为与 所列原因相关,这就叫假相关。
-
四、散布图的相关检验
绘出散布图后,应对其观察和分析,来判 断两个变量之间的相关关系。散布图的定性分 析一般有两种方法: 1、对照典型图法
●●
●
●
● ● ●●● ●● ● ●● ●
● ● ●●
●●●●● ● ●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●● ● ● ●●● ●●●●●
●●
●●●
●● ● ● ●●● ● ● ●● ●●●●●● ●
若有:S≤Sα ,判为强相关(显著相关)
S>Sα ,判为弱相关(-不显著相关)。
四、散布图的相关检验
2、符号检验法(中值法)
相关检验表
N 0.01 0.05 N 0.01 0.05 N 0.01 0.05 N 0.01 0.05
总判断:结合的判断结
28 6 29 7
8 50 15 17 72 24 27 8 51 15 18 73 25 27
◆令:n1+n3=n+ ; n2+n4=n- ;
s=Min(n+,n-),即s为n+、n-之中的最小值。
◆查符号检验表得判断值Sα。
在符号检验表中查得与n和α相对应的判断值Sα。
其中:n点数的总和(恰好在中位线上的点子不计算): n=n++n-。
α:显著水平α,也称作风险度,是与置信度β相对应的参数α+ β=1。 α:一般取0.01、0.05,意谓着判断错误的风险率是0.01(1%)和0.05(5%)
y
●●
●●●●
● ●●
●
●
●
● ●
●●
(e)不相关
不相关。
x X与Y无任何关系。
y
●
●
●
●
●
● ●●
●
●
●
●
●
非线性相关。
-
●
●●
x ●
(f)非线性相关
X、Y之间可以用直线表示。一般 只要控制住X,Y就会行到相应控 制。 除X因素影响Y外,还要考虑其他 因素(一般可进行分层处理,寻找 X以外的因素)。
●●●●●●
●
●● ● ●
●●● ● ●
●●
异常值
-
三、作散布图的注意事项
3、分层的必要性
在下图中,从全体座标点看不至相关,然而,从“*”与 “×”将座标点分层,则发现各自皆有相关。
反之,整体好像相关,而分层后层内没有相关的情况存在, 所以作散布图前应考虑分层,且以不同的记号表示分层后的座 标点。
92.5
8.7
91.2
8.8
88.2
8.9
90.4
二、散布图的绘图步骤
1、选定分析对象
分析对象的选定,可以是质量特性值与因素之间的关系、 质量特性值与质量特性值之间的关系、因素与因素之间的关 系。
本例选定的分析对象是添加剂的重量与产出率的关系, 它们是因素与质量特性值之间的关系。
2、收集数据,填入数据表。
对照典型图法是散布图分析中最粗略的分析法,把绘好的 散布图与典型图对照,可判断出两个变量之间的相关关系。
利用对照典型图法,可判断出案例添加剂“A”的重量与产 出率之间存在着弱正相关关系。
-
四、散布图的相关检验
图形
表4 常见的散布图形状与分析
X与Y的关系
说明
y
● ●●
●
● ● ●●
●
● ●
● ● ●
27 6 7 49 15 17 71 24 26 93 33 36
五、相关系数及其检验
1、相关系数的定义。
相关系数:表示两个变量x与y的相关程度。
r=
(Xt X)(Yt Y) (Xt X)2 (Yt Y)2
式中r为相关系数,∑(X-X)2 为 X的离均差平方和, ∑(Y-Y)2 为Y的离均差平方和,∑(X-X) (Y-Y)为X与Y的离均差乘积之和, 简称离均差积之和,此值可正可 负。以此式为基础计算相关系数 的方法称积差法。
••••••••••••••••
••••••• •
•
中间程度的正相关
•
•• •••••••••••
•••••••••••••••••••••••••••••••
•
| r | = 0.936
••
••••••••••••••••••••••••
•• •
• • ••••
强的负相关
| r | = 0.560
是弱正相关。
22 4 23 4
5 44 13 15 66 22 24 88 31 34 6 45 13 15 67 22 25 89 31 34
24 5 6 46 13 15 68 22 25 90 32 35
25 26
5 6
-
7 7
47 14 16 69 23 25 91 32 35 48 14 16 70 23 26 92 33 36
散布图(Scatter Diagram)
-
目录
一、散布图概述 二、散布图的绘图步骤 三、作散布图的注意事项 四、散布图的相关检验 五、相关系数及其检验 六、练习
-
一、散布图概述
1、定义:
描述两个因素之间相关关系的图形,称为散布图,又叫相关图
2、相关的概念:变量之间存在的关系,有下列几种还情况。
①完全相关关系:这种关系一般可用一个不变的数学公式来表 达。 ②相关关系:变量之间存在密切关系,但又不能由一个(或几个 )变量的数值精确地求另一变量的数值,称这类变量的关系为相 关关系。 ③不相关:事物之间没有关系。
●●● ● ● ●●● ●●●●●
●●
●●●
●● ● ● ●●● ●
● ●● ●●●●●● ●
●
●● ● ●
●●● ● ●
●●
-
三、作散布图的注意事项
2、异常值的处理
在散布图上如果出现下图所示的偏离集体很远的点,则该点 可认为是异常值,有必要追究其原因。
作为异常值的原因,除了测量差错或记录的疏忽外,常常 是操作条件的变化造成的,由此可找到工序改进的线索。
●
●
x ●
(a)强正相关
y
●
●
● ● ●
●
●● ●● ●
●
●
x ● ●
(b)强负相关
y
● ● ●
●
●● ●
●
●
●
x ●
●
(C)弱正相关
强正相关。 X变大,Y也变大。
强负相关。 X变大,Y变小;X变 小,Y变大。
弱正相关 X变大,Y大致变大。
y
●
●●
●
●●
●● ●
● ●
●
●
●
(d)弱负相关
弱负相关。
x X变大,Y大致变小。