GIS中地图注记尺寸和文字信息的损失
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
G IS中地图注记尺寸和文字信息的损失
[日本]Yuk i o Sadah iro
地图注记是地理信息系统中不可缺少的组成内容。它将与空间目标有关的各种属性联系起来,如目标的名称、面积、周长等。G IS中都有将注记配置的功能。
地图注记的可读性取决于多种因素。字符尺寸是其中最重要的影响因素之一,通常大字符往往比小字符易读。但当地图注记以较大尺寸显示时,就会出现注记相互压盖或超出屏幕显示范围之外的现象,从而造成由地图注记所表达的文字信息部分损失。如果选用较小尺寸的字符,信息损失就可以避免,但这会在很大程度上影响字符的可读性。为了解决这个问题,所采用的计算机自动注记配置算法通常包括以下步骤:
(1)由G IS用户确定地图注记尺寸;
(2)由G IS实现注记的自动配置;
(3)利用配置算法将压盖的注记的总数尽可能减少。
但是即使采用这些智能算法,注记压盖有时也不能降低到使它们都可读的要求。Fo r m ann和W agner于1991年讨论了注记只允许配置在四个角位置的情况。研究结果表明若按给定的尺寸进行注记配置而不造成压盖,即使所有的注记都具有相同的矩形形状也是不可能的。
本文分析了地图注记自动配置时,字符尺寸与信息损失之间的关系。目的在于研究字符尺寸为多大时能在一定的程度上控制文字信息的损失,并要在使用自动注记配置算法时为字符尺寸的确定提出一种算法,以避免过多的注记压盖。本文提出了一种统计的方法来分析字符尺寸与信息损失之间的关系。
首先我们定义一个结构并在此基础上分析字符尺寸与文字信息损失之间关系。假设G IS将数据显示在宽为X0、高为Y0的矩形区域A内,面积为S0。L i为区域A内点P i(i=1,…,N)的注记所占区域。该区域被定义为包含了注记的最小矩形框,其水平边与A的水平边平行。L i的宽度和高度设为X i和Y i,面积为S i,则S i=X i×Y i。
再定义几个概念用来表示文字信息的量。由G IS提供的全部文字信息称为‘总体信息’记为I TO TAL,此参数定义为区域A内与点有关的全部地图注记面积的总和。用公式可表示为
I TO TAL=∑
N
i=1
S i(1) G IS用户获得的文字信息量可通过两个指标来度量:I V IS,称作‘可见信息’,它被定义为区域A中区域L i的面积的总和。此参数可通过从I TO TAL中减去落在区域A之外的L i的面积得到。I L EG,称作‘可读信息’,它被定义为没有被其他注记压盖的区域L i的面积总和。它们用公式可分别描述为
I V IS=∑
N
i=1
area[A∩L i](2)
I L EG=∑
N
i=1
area[A∩L i-∪
j∈M,j= i
L j∩L i](3)其中M表示集{1,…,N}I V IS、I L EG分别表示G IS 用户从系统中获得的文字信息的上限值和下限值,但这两个值不足以估算传输的有效性,即信息的绝对值。因此要能估算出G IS中文字信息传输的有效性还需引入两个指标:‘可见率’R V I S和‘可读率’R L EG。前者是I V IS与I TO TAL的比值,后者是I L EG和I TO TAL的比值。它们反映了注记自动配置过程中超出屏幕的注记以及压盖的注记的值。
下面是使用统计的方法推导出的R V I S和R L EG 的期望值并用它们构成字符尺寸的数学表达式。利用这些参数就可以度量和估算文字信息的损失量了。
可见率R V I S的期望经推导可用以下公式表示(过程从略)
E[R V IS]=
∑N
i=1
(2X0X i+2X i X i′-X2i-2X′2i)(2Y0Y i+2Y i Y i′-Y2i-2Y′2i)
4S0∑
N
i=1
S i
(4)
当注记进行自动配置时,注记的位置与其相关点的关系通常如图1所示。
当这些位置都不能得到时,注记可配置在图1 (b)位置。但是由公式(4)可发现:注记配置在图1
24 测 绘 通 报 1999年 第2期
(a )位置时I V IS 的期望值最小,但配置在图1(c )位
置时注记的可见性最好。从最大可见性的角度看,注记配置在图1(b )或图1(c )上要比配置在图1(a )上更理想
。
图1 点与其注记之间的位置关系
若考虑所有的注记都具有相同的高度Y 和宽度rY ,并且注记配置在其相关点的右上方的情
况,公式(4)就可以化简为
E [R V IS ]=1-(rY 0+X 0)2S 0Y +r 4S 0
Y
2
(5)公式(5)表明R V I S 的表达式是关于字符尺寸的二次方程。当字符尺寸与显示器尺寸相比很小时,R V IS 的表达式与Y 成线性关系。
根据公式(5),假设计算机显示屏的分辨率为640×480个像素,如果可见率要达到95%,这时字
符的尺寸应该是多少呢?表1说明了结果。
表1 可读比率取一定值时所要求的字符尺寸(r 是
注记宽度与高度的比值)
E [R V I S ]
r
35710
1520
0.8061.8341.8631.5923.0815.9212.140.8545.8231.1123.5217.2111.899.080.9030.0220.5615.5711.417.906.040.9514.9310.197.735.683.933.010.99
2.96
2.02
1.54
1.13
0.78
0.60
可读率R L EG 的期望值可用如下公式描述(推
导过程从略)
E [R L EG ]=
1
∑
N
i =1
S i
∫X 0x =0
∫
Y 0
y =0
P i (x ,y )×
∏
i ∈M ,j ≠i
{1-P j (x ,y )}d y d x (6)
P i (x ,y )是区域A 内点(x ,y )被注记区域L i 压盖
的概率,P i (x ,y )
∏
i ∈M ,j ≠i
{1-P j (x ,y )}是点(x ,y )
被某个注记压盖的概率。P i (x ,y )=1
S 0
m in{X i ,x +X i ′,X 0-x +X i -X i ′}m in{Y i ,y +Y i ′,Y 0-y +Y i -Y i ′}
公式(6)比较常用,但从该公式很难直观地理解字符尺寸与注记可读性之间的关系,并且由于公式中含有求和与求最小值使得计算时间比较长。基于以上原因,我们在两种特定情况下进行分析:所有注记具有相同尺寸;所有注记具有相同高度且都标注在点的右上方。
当注记具有相同形状和尺寸时,设所有注记的宽度、高度都为X 、Y ,注记的位置在其相关点左下X ′,Y ′处,注记面积为S 。经推导得到可读率的期望的近似值,推导过程中假设地图注记区域与屏幕相比很小从而忽略S S 0(推导过程略)
E [R L EG ]≈
1S 0S
[S (X 0-X )(Y 0-Y )+
N Y
N +1(Y 0-Y )(X
2
+2X X ′-2X ′
2
)+[N X N +1
(X 0-X )(Y 2+2X Y ′-2Y ′
2
)+1
4
(X 2+2X X ′-2X ′2)(Y 2+2YX ′-2Y ′
2)]](7)
当(X ′,Y ′
)=(0,0),(X ,0),(Y ,0),(X ,Y )时,可读率的期望值最小,当(X ′,Y ′)=(X 2,
Y 2)时,可读率的期望值最大。这说明从可读性角度讲,图1(c )位置比图1(a )位置更理想。
当注记配置在点的右上角时,可读率就可被化简且不再是近似值
E [R L EG ]=
N S S 0(1-S S 0
)N -1
(X 0-X )(Y 0-Y )+
1
(N +1)S {S 0
-(N S +S 0)(1-S S 0
)N
}(X Y 0+X 0Y -2S )-N S
∑
N
i =1
(
N i )(-S S 0
)
i +11
(i +2)2(8)
根据公式(8)可以检验字符尺寸与可读率之间的关系。假设显示器的分辨率为640×480个
像素,N 个点任意范围分布在屏幕上,注记区域是矩形且高、宽比为1 5。结果如图2所示,当一个目标显示在屏幕上且可读率等于可见率时,字符尺寸与ER L EG 几乎成线性关系,当点目标数变多时,它们的关系变成逻辑曲线。
当注记具有相同高度且配置在相关点的右上方时,设注记i 的宽度、高度分别X i ,Y i ,面积为S i ,经推导得到R L EG 的期望值(过程略)
E [R L EG ]=
E [I 1,0″]+
∑N
i =1
E [I 2,i ″]+E [I 3,0″]+
∑N
i =1
E [I 4,i ″]∑N
i =1
S i (9)
其中I i ,j ″是显示在子区域A
i ,j
″内的可读信息量。
341999年 第2期 测 绘 通 报