关于Microstation与AutoCAD数据转换方法的研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

关于Microstation与AutoCAD数据转换方法的研究
1、相关定义
1.1、元数据的定义
元数据,最常见的定义是:”关于数据的数据”(Data about data) [14]。

更准确一点说: 元数据是描述流程、信息和对象的数据[15]。

这些描述涉及像技术属性(例如,结构和行为)这样的特征、业务定义(包括数据字典和分类法)以及操作特征(如活动指标和使用历史)。

1.2、多维数据模型概念
石油基础数据数据仓库的主要功能是提供复杂的联机分析处理操作,而多维数据模型可以快速地解决多维数据的存储与度量值之间的关系,从而有效地对数据进行深层次的分析[27]。

下面从不同角度定义石油基础数据数据仓库多维数据模型。

[定义5-1]:石油基础数据数据仓库多维数据模型即多维数据立方体,它的数据集合定义为一个4元组关系,其中: (1)W表示m个维的集合,即W={w1,w2,w3, ,wm},wi为从域domdim(i) 中抽取的维名; (2)D表示n 个度量的集合,即D={d1,d2,d3, ,dn},其中mi表示从域dommeasure(i) 的度量中抽取的度量名; (3)S表示k个属性的集合,即S={s1,s2,s3, ,sk},其中si为从域domattribute(i) 中抽取的属性名; (4)一对多映射f,表示每个维对应一个属性集合。

不同维之间对应的属性集合交集为0,即i,j,i j,f(wi)∩f(wj)=0; (5)度量集合D与维集合W的交集为0,即D∩W=0;
44 (6)度量属性集合D依赖于维集合W,即W和D之间存在函数关系
F:DOM(w1) × ×DOM(wn)→DOM(d1)× ×DOM(dk),其中DOM(wi)是维wi的值域,DOM(di)是度量属性的值域。

[定义5-2]:多维数据集的一个维是一个二元组w=(L,≤),其中L表示组成维w所有层的集合,≤是定义在L上的全序关系,满足对于任意li,lj∈L(1≤i≤n,1≤j≤n),或者有li≤lj或者有lj≤li成立[3]。

以能源基础数据为例,对世界各国能源数据进行分析,其数据模型的特点如下: (1)采用石油数据维、天然气数据维、煤炭数据维、时间维、国家维,用户可以根据能源数据指标如石油储产比、天然气储产比、煤炭储产比等角度来进行分析。

(2)此数据模型的度量值包括石油储产比、天然气储产比、煤炭储产比、石油消费量、天然气消费量、煤炭消费量、炼油能力等。

(3)石油数据维度表中包含有石油_id、国家_id、国家名称、石油产量、石油储量、石油消费量、炼油能力、石油价格、日期等字段;天然气维度表包含了天然气_id、国家_id、国家名称、天然气产量、天然气储量、天然气消费量、天然气价格、日期等字段; 煤炭数据维度表包含了煤炭_id、国家_id、国家名称、煤炭产量、煤炭储量、煤炭消费量、日期等字段;时间维表包含了时间_id、日期字段;公司能源维度表包含了公司石油产量、公司石油储量、公司天然气产量、公司天然气储量、日期等字段来描述。

因此,能源基础数据的多维数据模型可以表示如下: 石油基础数据数据仓库多维数据分析模型=(W,D,S,f)。

W={w石油数据维,w天然气数据维,w煤炭数据维,w时间维,w公司数据维}, 其中w 石油数据维=({石油_id,国家_id,国家名称,石油产量,All},石油_id≤国家_id≤All);w天然气数据维=({天然气_id,国家_id,国家名称、天然气
产量,All},天然气_id≤国家_id≤All);w煤炭数据维=({煤炭_id,国家_id,国家名称,煤炭产量,All}, 煤炭_id≤煤炭_id≤All);w时间维=({月,年,All},月≤年≤All),w公司数据维=({公司_id,自编码,公司名称,公司石油产量,公司规模,All},公司_id≤自编码≤All)。

D={石油储产比R/P,天然气R/P,煤炭储产比R/P,石油消费量,炼油能力,天然气消费量、煤炭消费量}。

S={s石油,s天然气,s煤炭,s时间},其中s原油={dom(石油数据维度表)},s天然气={dom(天然气数据维度表)},s煤炭={dom(煤炭数据维度表)},s时间={dom(时间维度表)}。

对能源基础数据分析的映射f表示如下: f(石油数据)={石油_id,国家_id,国家名称,石油产量,石油储量, }。

f(天然气数据)={天然气_id,国家_id,国家名称,天然气产量,天然气储量}。

f(煤炭数据)={煤炭_id,国家_id,国家名称,煤炭产量,煤炭储量, }。

f(公司数据)={自编码,公司_id,公司名称,公司石油产量,公司石油消费量,公45 司天然气产量,公司天然气消费量,公司规模, }。

f(时间)={年,月}。

由以上内容可知,石油基础数据分析满足前面的多维数据模型定义,为了物化数据立方体,需要对各个维和每个度量赋值。

在多维数据集合不发生变化的情况下,取遍所有的维层次可获得能源主题不同综合程度的分析情况[3]。

1.3、数据仓库基本概念
3.2.1 数据仓库的定义3.2.1 数据仓库的定义数据仓库一词最早出现于20 世纪80 年代。

在1993 年,被称为”数据仓库之父”的
William Inmon 首次在其所著的《Building the Data Warehouse》一书中系统地阐述了数据仓库的定义。

即数据仓库是面向主题的、集成的、非易失的、不可修改的且随时间变化的数据集合[18,19,20]。

它与传统的事务型数据库不同,也就是说数据仓库是一种分析型处理数据库,其数据一般来自多个异构的、完整的、稳定的数据集合,然后将这些数据集合进行有效的集成,再以不同的主题划分重组,从而发现隐藏在数据背后的关联和规律, 最后为企业的决策提供可靠的、有效的依据[13,21]。

1.4、参数化设计的定义
参数化设计就是指在原始图形和修改后图形的拓扑结构保持不变的基础上, 用一组参数来约束尺寸的关系,通过尺寸驱动或特征驱动,而得到修改后的设计- 38 - 天津大学硕士学位论文第五章利用用户图形数据库进行参数化绘图设计思路[28] 。

可见参数化设计是以约束为核心,以尺寸驱动为特征的。

参数化设计的过程可以认为是改变参数值后,对约束进行求解的过程。

参数化设计方法与传统方法相比最大的不同在于它存储了设计的整个过程, 可以设计出一族而不是单一的产品模型。

参数化设计使得工程设计人员不需要考虑细节而能尽快地勾出设计的草图,把注意力集中在设计对象的形状和拓扑关系上,通过变动某些约束参数而不必运行产品设计的全过程来更新产品设计。

参数化设计系统的功能主要有[29] : (1) 几何参数化模型自动导出精确的几何模型。

它不要求输入精确的图形, 只需要输入
一个草图,标注一些几何元素的约束,然后通过改变约束条件来自动地导出精确的几何模型。

(2) 通过修改局部参数来达到自动修改几何模型的目的。

这对于大致形状相似的一系列零件,只需要修改一下某个参数,便可生成新的零件,从而大大提高了零件生成的效率,在成组技术中利用这些手段是非常有益的。

1.5、数据库概念模型分析
数据库概念模型分析的主要目标是针对AutoCAD 图形实体的各种数据结构在SQL Server 中建立与之对应的表项,设计合理字段用来接收存储相应数据, 设置主键约束满足完整性规则等。

图4-3 SQL Server 数据库中建立的数据表如图4-3 所示,我们为AutoCAD 中每个实体(包括图形实体和非图形实体) 都建立了相应的数据库表,用来存储用户应用程序从AutoCAD 数据库中提取来的数据。

各个数据库表含义如下: acr_info_tab 表用于记录AutoCAD 中的弧实体的相关数据。

circle_info_tab 表用于记录圆实体的相关数据。

ellipse_info_tab 表用于记录椭圆实体的相关数据。

layer_info_tab 表用于记录图层的相关属性。

- 25 - 天津大学硕士学位论文第四章MFC ARX 和SQL-Server 数据库相结合进行AutoCAD 二次开发line_info_tab 表用于记录直线实体的相关数据。

linetype_info_tab 表用于记录线型属性相关数据。

mxb_info_tab 表用于记录工程图中明细表内相关字符串信息。

polygon_info_tab 表用于记录正多边形实体的相关数据。

point_info_tab 表用于记录点实体的
相关数据。

polyline_ainfo_tab 表用于记录多义线实体的相关属性数据。

polyline_info_tab 表用于记录多义线实体的相关图形数据。

rect_info_tab 表用于记录矩形实体的相关数据。

scale_info_tab 表用于记录尺寸标注实体的相关数据。

text_info_tab 表用于记录文本字符串实体的相关数据。

tuzhi_info_tab 表用于记录由用户输入的相关图纸信息。

图4-4 为直线实体建立的数据表我们以直线实体为例:设计了如图4-4 所示的数据库表,用来存储直线实体的相关数据。

每一个具体字段意义如下: id 字段记录了AutoCAD 图形数据库中相应直线实体的ObjectId 号。

tuzhi_id 字段记录了由用户输入的图纸编号。

startpoint_X ,startpoint_Y,startpoint_Z 三个字段分别记录了直线实体起点坐- 26 - 天津大学硕士学位论文第四章MFC ARX 和SQL-Server 数据库相结合进行AutoCAD 二次开发标的X 方向,Y 方向,Z 方向的坐标值。

endpoint_X,endpoint_Y,endpoint_Z 三个字段分别记录了直线实体终点坐标的X 方向,Y 方向,Z 方向的坐标值。

color 字段记录了直线实体的颜色属性值。

linetype 字段记录了直线实体的线型属性值。

linetype_scale 字段记录了直线实体的线型比例属性值。

visibility 字段记录了直线实体的可见性。

layer 字段记录了直线实体所在图层名。

line_weight 字段记录了直线实体的线宽属性值。

主键设置原因:在一张AutoCAD 图纸中,通过ObjectId 号可以唯一的确定一个实体,但当对多张图纸进行存储时,AutoCAD 不能保证分配给每个实体的ObjectId 号唯一,因此我们引入可以唯一确定一张CAD 图纸的tuzhi_id 字段, 这样就能保证ObjectId 的唯一
性,所以我们设置id 字段和tuzhi_id 字段为表的主键。

1.6、模型定义
基于对以上页面描述语言文档的认识和分析,并且结合设计目标,提出了通用文档模型(General Document Model)(简称GDM)。

我们以UML 的Class 图为工具,将该通用文档模型分为三个层次和部分加以说明:通用文档GdmDocument、资源管理GdmResourceManager 和元素GdmElement。

1) 通用文档GdmDocument 18 图3-1 通用文档GdmDocument 类图概要Fig.3-1 General Document GdmDocument High Level Class Diagram 通用文档GdmDocument 类是所有文档类的根类,起到包装所有文档内容的组织作用,如图3-1 所示。

它主要由代表每一个页的GdmPage 类和一个资源管理GdmResourceManager 类组成。

GdmDocument 类内只会保留一些文档本身的信息。

而GdmResourceManager 类就是用来管理所有和该文档相关的资源,是整个文档范围的。

页面内所有要使用的资源都是通过GdmResourceManager 类来获得的。

GdmPage 抽象类是该通用文档模型的核心,代表着每一个真实的页面,内含各种页面描述语言的所有元素,GdmElement 类就是代表各种元素的抽象类。

更重要的是,GdmPage 抽象类也是后面会阐述的转换系统架构中各个组件处理文档的独立作业单位。

所以,其中保存了除了资源以外尽可能多的页面信息。

比如页白边大小,很多时候对于一个文档来说,该信息是固定的,但是有的页面描述语言也支持中间页面发生改变,该页面生成时
就需要记录下对该页面有影响的变化。

而EndGdmPage 只是一个虚拟的空页面,只是起到信号作用, 表明该文档处理结束了。

它一般是由解读该文档的组件生成,并记录了该文档的总页数, 然后告知后续组件该文档处理完毕,如果后续组件需要做文档结束处理,在审核了总页数之后就可以进行文档结束处理了。

2) 资源管理GdmResourceManager GdmDocument GdmResourceManager GdmPage EndGdmPage GdmElement 19 图3-2 资源管理GdmResourceManager 类图概要Fig.3-2 GdmResourceManager High Level Class Diagram 资源管理GdmResourceManager 类是用来管理所有和文档相关的资源,如图3-2 所示。

其工作包括生成资源、读取和解析资源、组织和调配资源等。

其中ResourceFactory 抽象类是总的资源工厂,负责生成不同的资源对象,还分为内部资源工厂InlineResourceFactory 抽象类和外部资源工厂OutlineResourceFactory 抽象类。

具体实现随页面描述语言文档或者其他输入文档的不同而不同。

同时所有资源都以统一的资源类GdmResource 来封装。

而资源主要可分为图像(点阵图)、图形(矢量图)、字体和表单(在有的页面描述语言中称为页面片断或宏)等,分别由GdmResImage 抽象类、GdmResFont 抽象类和GdmResForm 抽象类等代表。

具体的实现类比如有,AFP 文档的AfpGdmResImage、PDF 文档中的PdfGdmImage 等。

其中表单GdmResForm 抽象类又是由元素GdmElement 抽象类组成,同时还具有一些类似于程序语言一样的函数调用功能, 比如输入输出参数,环境保存与恢复等。

3)
元素GdmElement InlineResourceFactory OutlineResourceFactory GdmResImageGdmResFont GdmResForm GdmResourceManager ResourceFactory GdmResource GdmElement 20 图3-3 元素GdmElement 类图概要Fig.3-3 GdmElement High Level Class Diagram 元素GdmElement 是包含了所有页面描述语言文档内的各种元素的基本抽象类,包括有文本元素TextElement、直线元素LineElement、图表元素GraphElement、注释信息元素CommentElement、表单引用元素FormRefElemen 和其他的元素等。

如图3-3 所示。

其中表单引用元素FormRefElement 类只是表单资源类GdmResForm 的包装类,从而可以使其具有一般元素的性质而置于页面之中。

图表元素GraphElement 根据页面描述语言文档的共性还可以分为位图元素ImageElement,矢量图元素V ectorElement,模板元素PatternElement 和条形码元素BarcodeElement 等。

其中矢量图元素又是由矢量路径V ectorPath 和矢量点V ectorPoint 组成,具体的矢量路径还可分为直线、曲线、多边形等实体V ectorPath 类,这里就不再具体说明了。

事实上,整个元素类型的组成结构要远远比这个复杂得多,并且随着适用的页面描述语言文档的种类增加,还会相应的增加新的子元素的种类。

GdmElement TextElement LineElement CommentElement GraphElement FormRefElement ImageElement V ectorElement PatternElement Other Elements V ectorPath VectorPoint BarcodeElement GdmResForm 21
1.7、相关定义
前驱节点:如图 3.2 所示,元件X2 在元件X1 的右侧,则称元件X1 是元件X2 的前驱节点,同理可得后继节点的定义,即元件X2 是元件X1 的后继节点。

分支:若某个元件有多个后继节点,此称此元件为分支,如图3.2 所示元件X1 有两个后继节点X2 和X6,则称节点X1 为分支。

归并:若某个元件有多个前驱节点,则称此元件为归并,如图 3.2 所示元件X4 有两个前驱X3 和X5,则称元件X4 为次归并。

简单梯级:不存在分支的梯级,即只有串联关系的梯级。

复杂梯级:具有分支或归并的梯级。

正向拆分:将多输出梯级从输入开始(从左母线开始)进行拆分,将其拆分成多个简单梯级。

逆向拆分:将多输出梯级从输出线圈开始进行逆向拆分,将其拆分成多个单输出梯级。

层:定义左母线所在的层为第 1 层;设梯级中的第N(N = 1,2, )个元件在第i 层, 若元件N 只有一个后继节点N+1,且节点N+1 有且仅有一个前驱节点N,则元件N+1 18 与元件N 同属第i 层;若节点N 有多个后继节点,则所有的后继节点相对于节点N 属第i + 1 层;若节点N 只有一个后继节点N + 1 且节点N + 1 有多个前驱节点,则节点N + 1 相对于节点N 属第i -1 层。

断层梯级:输出节点所处的层根据不同的计算方式其结果不同。

完整梯级:输出节点所处的层根据不同的计算方式其结果相同。

断层梯级:输出节点所处的层根据不同的计算方式其结果不同。

如图 3.3 所示,图3.3(b)是图3.3(a)的拓扑图表示,由于母线节点只有一个后继节点X1 且X1 只有一个前驱节点,所以节点X1 与母线同属于第 1 层;由于
节点X1 有三个后继节点X2,X5,X6,根据层得定义可知,它们属于第 2 层;由于第 2 层的节点X2 只有一个后继节点X3,且节点X3 有两个前驱X2,X5 因此节点X3 属于第1 层;节点X4 所处的层相对于第 1 层的节点X3,它属于第0 层,相对于节点X6,它处于第 1 层。

输出节点Y1 按照不同的计算方式结算出了不同的结果,因此图 3.3 所示梯级为断层梯级。

X1 X2 X3 X4Y1 ( ) X5 X6 (a) X2 2 X1X5 X3X4 1Y1 1 210011 X6 2 (b) 图3.3 (a)一个断层梯级.(b)该断层梯级的拓扑图表示. 19
1.8、心算的定义
心算(mental calculation) 指的是在没有外界工具(如纸笔、计算器等)的帮助下所进行的算术操作活动,是我们日常生活中一项重要的思维活动和技能,近年来已经成为心理学家高度关注的研究主题。

心算包括一系列的认知加工过程,一般认为心算过程主要包括编码(coding)、运算(operation)和反应(response)三个阶段(刘昌等,2008)。

编码是将外部刺激转化为内部表征,运算指提取答案(简单的问题)或者运算加工(复杂的问题),反应指给出答案并做出反应。

1.9、数据质量的概念和评价指标
目前,数据质量问题已引起广泛的关注。

什么是数据质量呢?数据质量问题并不仅仅是指数据错误。

文献[23]把数据质量定义为数据的一致性(consistency)、正确性(correctness)、完整性(completeness)和最
小性(minimality)这 4 个指标在信息系统中得到满足的程度。

一般说来,评价数据质量最主要的几个指标是: 准确性(Accuracy):准确性是指数据源中实际数据值与假定正确数据值的一致程度; 完整性(Completeness):完整性是指数据源中需要数值的字段中无值缺失的程度; 一致性(Consistency):一致性是指数据源中数据对一组约束的满足程度; 唯一性(Uniqueness):唯一性是指数据源中记录以及编码是否唯一; 适时性(Timeliness):适时性是指在所要求的或指定的时间提供一个或多个数据项的程度; 有效性(V alidity):有效性是指维护的数据足够严格以满足分类准则的接受要求。

1.10、数据库概念设计
数据库管理系统(DBMS)软件的实现都是基于某种数据类型的,因此数据模型是数据库系统的核心和基础。

人们需要把现实世界中的事物直接转化为计算机识别的对象, 即抽象为数据概念模型。

概念模型的描述工具有E-R 模型图。

白洋淀水环境信息系统概念模型是对现实世界白洋淀水环境及其周围地物的认识和抽象,转化为数据库中的数据模型。

数据库建立过程如图9 所示。

根据数据内容,白洋淀水环境信息数据库中设计有多个主题的数据表,数据表名称及内容如表 2 所示。

图9 数据库建立过程18 第 3 章白洋淀水环境管理信息系统总体设计表 2 数据库中数据表及其内容数据表名称数据表内容数据类型用户信息数据表用户信息,包括用户名、密码等属性数据基础地理信息数据表行政边界、湖泊边界、居民点分
布、水系分布矢量数据社会经济数据表人口数量、畜禽养殖区、垃圾区、污水排放口、矢量数据水体中的总氮、总磷、氨氮、CODCr、BOD、PH、水质监测信息数据表属性数据水温、Chl-a 等;底泥中总氮、总磷等水质标准数据表GB 3838-2002 地表水标准(Ⅲ、Ⅳ、Ⅴ) 属性数据污染源和污染物排放村庄生活污水排放量、村庄生活垃圾产生量、畜属性数据数据表禽养殖污水产生量水环境模型信息数据表水环境模型参数描述属性数据统计分析数据表监测数据统计分析、水质评价和水环境容量计算属性数据
1.11、数据的概念
《数学辞海》中对数据给出这样的解释,数据是对客观事物、事件的记录、描述,是可由人工或自动化手段加以处理的数字、文字、图形、图像、声音等符号的集合[16]。

从定义中我们可以明显看出数据是注重形式的,其有一定的可处理性。

马费成教授在《信息管理学基础》中认为数据是载荷或记录信息的,按照一定规则排列组合的物理符号。

它可以是数字、文字、图像, 也可以是声音或计算机代码[17]。

M.Alavi 和D.E.Leidner 认为数据是原始的,除了存在以外没有任何意义[18]。

数据是没有被解释的符号。

不同领域的学者对数据的理解不同,自然科学领域的学者认为数据是以数量形式给出,是实验、测量、观测、调查等的结果,如实验数据、观测数据和统计数据等。

管理学领域中对数据的研究普遍观点是数据是事实的数字化、编码化、序列化和结构化。

数据是形成信息的基础,是客观事物的记
录。

笔者认为,数据可以是数字、符号或代码等的表示形式,单个数据本身是没有具体意义的,但在特定的环境下,多个数据具有特定含义的。

数据是一种资源,它可以作为结构单元被存储和利用。

2、相关背景
2.1、选题背景
助设计(CAD)和地理信息系统(GIS)技术都已取得长足的发展。

CAD 作为二维或三维图形绘制及相关几何绘制工具,主要强调自动设计制图的过程与方法。

CAD 主要应用于项目规划设计、设施管理与建筑设计等,也常应用于基础地理数据和规划编制成果数据的制作。

GIS 以数据库的形式进行存储与管理,并在图形编辑与拓扑方面遵循一定的规则,强调空间分析,并能很好地应用于专题制图、适宜性评价与网络分析。

从人类思维认知过程来看,CAD 主要用于对客观还不存在的物体进行设计,而GIS 用于对客观已经存在的物体建模,以理解、分析管理资源和实施。

当前,GIS 行业正如火如荼地发展,构建一个优秀的GIS 系统,关键是数据,而GIS 数据的来源多种多样,包括航空摄影、卫星遥感(RS)、全球定位系统(GPS)、基础测绘以及原有的历史图件,在国土、交通、石油、地质、水利、建筑、城市规划、冶金等行业,CAD 软件至今仍被广泛使用,而这些部门的很多人只熟悉AutoCAD 软件,对GIS 的概念、GIS 软件都很陌生,但是这些行业多年来积累了大量的CAD 图纸数据,而他们又迫切地希望构建GIS 系统,来实现对设施的规划和管理以及对资源的合理分
配和利用。

比如某钢铁企业需要构建管线GIS 系统,以实现对厂区内管线的规划和设计,同时实现管网数据的录入、浏览、分析、查询、统计、编辑、测量、数据转换、制图、打印、三维可视化等。

那么这就涉及到了CAD 数据和GIS 数据的共享问题。

我们可以将原有的CAD 数据转换为GIS 格式的数据录入到我们的GIS 系统中,同时对GIS 数据进行必要的处理, 例如赋予合适的坐标系统,地图投影变换,建立拓扑关系,添加相应的属性数据,建立地理索引实现空间数据和属性数据的关联,以实现对数据的查询、统计和分析,最后进行数据检查后方能录入到地理数据库中。

此外,由于该钢铁企业的员工还是希望使用AutoCAD 进行管线的设计,那么我们就可以满足他们的需求,让他们先在AutoCAD 软件中进行设计,然后我们可以把设计好的管线图转换成GIS 格式的管线图,然后利用GIS 强大的空间分析功能进行管网的设计、分析(比如碰撞检测)、三维可视化等;同时我们也可以把在GIS 系统中编辑后的管网数据转换为CAD 格式,继续在CAD 软件中进行编辑,然后再重新转换为GIS 格式导入到GIS 系统中,从而实现管网数据的局部更新或全部更新。

但是,实现CAD 数据与GIS 数据的共享工作是很困难的。

具体表现为以下几点: (1)CAD 和GIS 在数据模型方面存在很大差异。

CAD 侧重于图纸的设计,例如冶金1 行业厂区管网的设计、建筑行业各种建筑的规划设计等,主要用于生成标准的规划图纸, 忽略图形的属性数据。

CAD 数据主要以文件形式存储,例如*.dxf、*.dwg 文件,不以关系数据库的方式存储。

CAD 图形元素要么是点、线、要么是面(由连续的线组成)。

CAD 图形仅仅包含使之绘制的信息,即线宽、线型、颜色以及它所属的图层。

GIS 数据是“Spatially informal”。

考虑了相邻和其它空间关系,简而言之:CAD 数据仅是图形,而GIS 数据是空间数据库。

(2)CAD 要素按图层来组织,这些层表示点、线、面和注记(与shapefile 相比s,hapefile 中的每个图层代表一种类型的要素),每个图形属于某个图层,这样,相似类型的图形元素能被浏览、隐藏、冻结、移动以及一起编辑。

因为对CAD 图层来说没有可被接受的命名转换和对图层名称长度的限制,对于一些新用户来说弄懂CAD 图层名的含义很困难。

新用户面对的另一个困难是很多CAD 图形都包含不完全”干净”的图层。

如杂散线或点, 它们应属于一个图层但会出现在一个毫无关系的图层上,或者在图形绘制过程中使用的冗余线或点,但它们不代表实际的要素。

这些不一致在CAD 里面不是大问题,但在GIS 里会导致数据失真甚至会破坏数据库。

(3)CAD 图形比GIS 数据在大比例尺地图上要精确地多,但经常使用与GIS 不同的坐标系统。

在美国,对多数NPS GIS 数据来说,标准坐标系统和椭球是通用横轴墨卡托投影(Universal Transverse Mercator,即UTM)NAD 83,而标准CAD 坐标系统是国家平面坐标系统(State Plane)。

有时,CAD 图形并没有坐标系统,也就是通常指的使用一种任意的、当地的平面坐标(原点在(0,0)),使用ArcGIS,CAD 数据可被重新投影到一个新的坐标系统或者坐标系统未知。

CAD 数据可被手动处理,通过空间校准。

识别CAD 图形的坐标系统对CAD 完全转换到GIS 格式是尤为重要的。

(4)因为CAD 数据仅仅是图形,所以经常很难知道其作。

相关文档
最新文档