shp文件讲解
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
shp文件格式内部结构
ESRI shp文件格式内部结构(2008-09-01 15:18:24)标签:杂谈
Shape文件是ArcGIS的基础文件类型,存储了非拓扑几何和属性信息。Shape文件支持点、线、区域的几何特征,由于不需要处理拓扑数据结构文件头,在编辑等方面具有更快的处理速度。本文通过对ESR I公司发布的
原版资料ESRI Shapefile Technical Descrip tion的翻译解读,剖析Shape文件的结构,利用VB写出直接
生成Shape文件的代码。
2 Shape文件结构
2. 1 Shape文件的文件构成Shape文件由3 个文件构成: 主文件、索引文件、数据文件。
其中主文件的后缀必须是. shp;索引文件的后缀必须是. shx;数据文件的后缀必须是. dbf,这3个
文件共同组成Shape文件。各文件中存储的数据相互联系又各有区别。主文件中是Shape的位置信
息;索引文件是对主文件的索引,指出主文件中记录在文件中的位置信息;数据文件中包括Shape的具
体位置和属性信息。
2. 2 . shp文件的结构
. shp文件由文件头和文件记录构成(图1) ,其中文件大部分结构见表1。
文件头
记录头记录内容
记录头记录内容
记录头记录内容
记录头记录内容
···
···
记录头记录内容
图1 . shp文件的结构
其中Shape类型是ArcGIS定义的图形类型,具体可以参考Shapefile Technical Descrip tion。
每个记录由记录头、记录内容两部分组成。记录头部分由两部分组成: 0~3字节是长整型的记录
数, 4~7字节是记录内容的长度。文件头中的文件长度与记录头中的记录长度均以字( 2 字节)为单
位。记录内容对不同的Shape类型定义不一样,但原理是相同的。因篇幅所限,这里以记录点(point)
类型为例进行说明。点( point)类型的每个记录的记录内容为: 0~3字节长整型的Shape类型、4~11
字节双精度的X坐标、12~19字节双精度的Y坐标。所以记录头中的记录长度就是2 + 4 + 4 = 10个
字长,文件头中文件长度就是50 (文件头长) +总记录数3 14。
表1 . shp文件的文件头结构
位置字段名称数据数据类型字节顺序
0 文件代码9994 32位整型big - endian
4 保留0 32位整型big - endian
8 保留0 32位整型big - endian
12 保留0 32位整型big - endian
16 保留0 32位整型big - endian
20 保留0 32位整型big - endian
24 文件长度文件长度32位整型big - endian
28 版本1000 32位整型little - endian
32 Shape类型Shape类型32位整型little - endian
36 范围框最小X值双精度little - endian
44 范围框最小Y值双精度little - endian
52 范围框最大X值双精度little - endian
60 范围框最大Y值双精度little - endian
68 范围框最小Z值双精度little - endian
76 范围框最大Z值双精度little - endian
84 范围框最小M值双精度little - endian
92 范围框最大M值双精度little - endian
2. 3 . shx文件结构
. shx文件的结构与图1所示的. shp 文件在总体结构上相同,但内容有所区别。文件头的定义与
1shp一致,但文件长度指的是. shx的文件长度,所以这一项的数值是不同的。每1 个记录没有记录
头,内容有2部分组成: 0~3字节表示记录存储位置,以离文件开始处的字数来表示,即50 +记录数
3 14;记录长度,在点(point)类型中为10。2.
4 . dbf文件结构有关描述. dbf文件是Shape文件中的数据存储文件,其
格式是dbase iv的数据文件,具体的格式说明在许多网站都有说明,但在Shape 文件中的. dbf有一些特殊的规定。
①前缀必须与. shp和. shx文件一样。
②每1个图形特征必须在1个记录内。
③记录的顺序必须与. shp中的记录顺序一样。
④在. dbf文件头中的年份值是以1900年为基
础的,即其数值表示年份与1900的差。
3 用VB编写直接写Shape文件的方法及代码
在编写程序时要特别注意的是在一般的机器中写文件的字节顺序是little - endian方式,即小的在
低地址,大的在高地址;而big - endian正好相反,所以对big - endian方式的要人为加以转换,本文编写
了little2big( )函来实现。下面是以点类型为例用VB写Shape文件的代
码: txt2 shape ( ) 。
Function little2big ( x1 As Long, myt1 As Byte,
myt2 As Byte, myt3 As Byte, myt4 As Byte)
myt1 = Int( x1 / (2 ^ 24) )
myt2 = Int ( ( x1 - ( Int ( x1 / (2 ^24) ) ) 3 2 ^
24) / (2 ^ 16) )
myt3 = Int ( ( x1 - myt1 3 2 ^24 - myt2 3 2
^ 16) / (2 ^ 8) )
myt4 = x1 - myt1 3 2 ^ 24 - myt2 3 2 ^ 16
- myt3 3 2 ^ 8
End Function
Private Sub txt2 shape ( )
Dim jdattribute (0 To 100) AsDouble‘定义点位
置的x
Dim wdattribute (0 To 100) As Double‘定义点
位置的y
Dim zmattribute (0 To 100) As String‘定义点位
置名称,如站名
Dim ylattribute (0 To 100) AsDouble‘存点的属
性值,如站点雨量
Dim filelen As Long‘文件长度
Dim records As Long‘记录数
Dim xmin AsDouble‘最小x值
Dim xmax AsDouble‘最大x值
Dim ymin AsDouble‘最小y值
Dim ymax AsDouble‘最大y值
Dim zm AsVariant‘以下为临时变量
Dim temp As String
Dim lin0 As Long
Dim dblin0 AsDouble
Dim myt1 AsByte‘用于传递转换到big形式的
字节临时变量
Dim myt2 As Byte
Dim myt3 As Byte
Dim myt4 As Byte
为了减小篇幅,本文省略信息的读入过程,即认
为这些信息已经读到zmattribute ( ) 、jdattribute ( ) 、wdattribute ( ) 、ylattribute ( ) 、records等数组、变量,直接从写文件开始。
Open (workfile + " shp " ) For Binary As #5打
开文件,workfile为文件名前缀,下同
′开始写文件头
filelen = records 3 14 + 50‘算出文件长度
Call little2big ( 9994, myt1, myt2, myt3, myt4)
‘将9994转换成big形式。
Put #5, , myt1′写9994的4 个字节