距离度量及相关性分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、 计算styucvdsk 和ustupcsfsk 之间的编辑距离
st y uc vd sk
u stu p c sf sk 插入了一个u ,st 不变,删除一个y ,u 不变,插入一个p ,c 不变,v 修改为s,d 修改为f ,sk 不变
styucvdsk 和ustupcsfsk 之间的编辑距离为5
2、 对于下面的向量x 和y ,计算指定的相似性或距离度量。
a) X=(1,1,1,1),y=(2,2,2,2),余弦、相关、欧几里德
余弦:
∥X ∥= 12+12+12+12= 4=2
∥Y ∥= 22+22+22+22= 16=4
X ∙Y= 1×2 + 1×2 + 1×2 + 1×2 =8
cos(x.y)=8=1 相关系数:
X 0=
1+1+1+1=1 Y 0=2+2+2+2=2 cov(x,y)= 1−1 ∗ 2−2 + 1−1 ∗ 2−2 + 1−1 ∗ 2−2 + 1−1 ∗ 2−2 3=0
σx = 1−1 2+ 1−1 2+ 1−1 2+ 1−1 2=0 σy = ( 2−2 2+ 2−2 2+ 2−2 2+ 2−2 2)4−1
=0 ρxy =0
欧几里德:
2−1 2+ 2−1 2+ 2−1 2+ 2−1 2=2
余弦相似度、相关系数、欧几里得分别是1,0,2;
b) X=(0,1,0,1),y=(1,0,1,0), 余弦、相关、欧几里德、jaccard
余弦:
∥X ∥= 02+12+02+12= 2
∥Y ∥= 12+02+12+02= 2
X ∙Y= 0×1 + 1×0 + 0×1 + 1×0 =0
cos(x.y)=
0 2× 2=0
相关系数:
X 0=
0+1+0+1=0.5 Y 0=1+0+1+0=0.5 cov x,y = 0−0.5 ∗ 1−0.5 + 1−0.5 ∗ 0−0.5 + 0−0.5 ∗ 1−0.5 + 1−0.5 ∗ 0−0.5 4−1=−1 σx = 0−0.5 2+ 1−0.5 2+ 0−0.5 2+ 1−0.5 2= 1 σy = 1−0.5 2+ 0−0.5 2+ 1−0.5 2+ 0−0.5 24−1= 13 ρxy =−
13 3× 3
欧几里德:
2222=2
Jaccard:
x 2=02+12+02+12=2
y 2=12+02+12+02=2
X∙Y=(0×1)+(1×0)+(0×1)+(1×0)=0
ℐx,y=
xy
22
=
=0
余弦相似度、相关系数、欧几里德、Jaccard系数分别是0,-1,2,0;
c)X=(0,-1,0,1),y=(1,0,-1,0), 余弦、相关、欧几里德
余弦:
∥X∥=02+(−1)2+02+12=2
∥Y∥=12+02+(−1)2+02=2
X∙Y=0×1+−1×0+0×(−1)+1×0=0
cos(x.y)=
2×2
=0
相关系数:
X0=0−1+0+1
4
=0
Y0=1+0−1+0
4
=0
cov(x,y)
=
0−0∗1−0+−1−0∗0−0+0−0∗−1−0+1−0∗0−0 =0
σx=0−02+−1−02+0−02+1−02
4−1
=2
σy=1−02+0−02+−1−02+0−02
4−1
=2
ρxy=cov(x,y)
=
2×2
=0
欧几里德:
2222=2
余弦相似度、相关系数、欧几里德分别是0,0,2;
d)X=(1,1,0,1,0,1),y=(1,1,1,0,0,1), 余弦、相关、jaccard
余弦:
∥X∥=12+12+02+12+02+12=4=2
∥Y∥=12+12+12+02+02+12=4=2
X∙Y=1×1+1×1+0×1+1×0×0×0+1×1=3
cos(x.y)=
3
2×2
=0.75
相关系数:
X0=1+1+0+1+0+1
6
=
2
3
Y0=1+1+1+0+0+1
6
=
2
3
cov(x,y)
=1−23∗1−23+1−23∗1−23+0−23∗1−23+1−23∗0−23+0−23∗0−23+1−23∗1−23
6−1
=1 15
σx=1−
2
3
2
+1−2
3
2
+0−2
3
2
+1−2
3
2
+0−2
3
2
+1−2
3
2
=
4
σy=1−
2
3
2
+1−2
3
2
+1−2
3
2
+0−2
3
2
+0−2
3
2
+1−2
3
2
6−1
=
4
15
ρxy=cov(x,y)
σx∗σy
=
1
15
4
15×
4
15
=0.25
Jaccard:
x2=12+12+02+12+02+12=4
y2=12+12+12+02+02+12=4
X∙Y=1×1+1×1+0×1+1×0×0×0+1×1=3
ℐx,y=
xy
22
=
3
=0.6