空间数据库是指
地理信息系统在计算机物理
存储介质上存储的与应用相关的
地理空间数据的总和,一般是以一系列特定结构的文件的
形式组织在存储介质之上的。空间数据库的研究始于20 世纪 70年代的
地图制图与
遥感图像处理领域,其目的是为了有效地利用
卫星遥感资源迅速绘制出各种经济
专题地图。由于传统的
关系数据库在空间数据的表示、存储、管理、检索上存在许多缺陷,从而形成了空间数据库这一数据库研究领域。而传统
数据库系统只针对简单对象,无法有效的支持
复杂对象(如图形、图像)。空间数据库是某区域内关于一定空间要素特征的
数据集合,是
GIS在物理介质上存储的与应用相关的空间数据总和。
空间数据库的特点
1、数据量庞大
空间数据库面向的是
地理学及其相关对象,而在
客观世界中它们所涉及的往往都是地球表面信息、地质信息、大气信息等及其复杂的现象和信息,所以描述这些信息的
数据容量很大,容量通常达到 GB级。
空间信息系统要求具有强大的信息检索和
分析能力, 这是建立在空间数据库基础上的,需要高效访问大量数据。
3、空间数据模型复杂
空间数据库存储的不是单一性质的数据,而是涵盖了几乎所有与地理相关的
数据类型,这些数据类型主要可以分为 3 类:
(1)
属性数据:与通用数据库基本一致,主要用来描述地学现象的各种属性,一般包括数字、文本、日期类型。
(2)图形
图像数据:与通用数据库不同,空间数据库系统中大量的数据借助于图形图像来描述。
(3)
空间关系数据:存储
拓扑关系的数据,通常与
图形数据是合二为一的。
4、属性数据和空间数据联合管理。
5、空间实体的属性数据和空间数据可随时间而发生相应变化。
6、空间数据的数据项长度可变,包含一个或多个对象,需要嵌套记录。
7、一种地物类型对应一个属性
数据表文件。多种地物类型共用一个属性数据表文件。
空间数据库的设计
数据库因不同的应用要求会有各种各样的组织形式。数据库的设计就是根据不同的应用目的和用户要求,在一个给定的应用环境中,确定最优的
数据模型、处理模式、存贮结构、
存取方法,建立能反映现实世界的
地理实体间信息之间的联系,满足用户要求,又能被一定的DBMS接受,同时能实现
系统目标并有效地存取、管理数据的数据库。简言之,
数据库设计就是把现实世界中一定范围内存在着的应用
数据抽象成一个数据库的具体结构的过程。
空间数据库的设计是指在
数据库管理系统的基础上建立空间数据库的整个过程。主要包括
需求分析、
结构设计、和
数据层设计三部分。
1、需求分析
需求分析是整个空间
数据库设计与建立的基础,主要进行以下工作:
了解用户特点和要求,取得设计者与用户对需求的一致看法。
2.需求数据的收集和分析:
包括
信息需求(
信息内容、特征、需要存储的数据)、
信息加工处理要求(如
响应时间)、
完整性与安全性要求等。
3.编制用户需求说明书:
包括
需求分析的目标、任务、具体需求说明、
系统功能与性能、
运行环境等,是需求分析的最终成果。
需求分析是一项技术性很强的工作,应该由有经验的专业技术人员完成,同时用户的积极参与也是十分重要的。
在需求分析阶段完成
数据源的选择和对各种
数据集的评价
2、结构设计
指
空间数据结构设计,结果是得到一个合理的
空间数据模型,是空间
数据库设计的关键。空间数据模型越能反映现实世界,在此基础上生成的
应用系统就越能较好地满足用户对数据处理的要求。
空间数据库设计的实质是将地理
空间实体以一定的组织形式在
数据库系统中加以表达的过程,也就是
地理信息系统中空间实体的模型化问题。
概念设计是通过对错综复杂的现实世界的认识与抽象,最终形成空间数据库系统及其应用系统所需的模型。
具体是对
需求分析阶段所收集的信息和数据进行分析、整理,确定地理实体、属性及它们之间的联系,将各用户的
局部视图合并成一个总的全局视图,形成独立于计算机的反映用户观点的
概念模式。概念模式与具体的DBMS无关,
结构稳定,能较好地反映用户的信息需求。
表示
概念模型最有力的工具是
E-R模型,即
实体-联系模型,包括实体、联系和属性三个基本成分。用它来描述现实地理世界,不必考虑信息的
存储结构、
存取路径及存取效率等与计算机有关的问题,比一般的数据模型更接近于现实地理世界,具有直观、自然、语义较丰富等特点,在地理
数据库设计中得到了广泛应用。
2.逻辑设计
在概念设计的基础上,按照不同的
转换规则将概念模型转换为具体
DBMS支持的数据模型的过程,即导出具体DBMS可处理的
地理数据库的
逻辑结构(或
外模式),包括确定
数据项、记录及记录间的联系、安全性、完整性和一致性约束等。导出的逻辑结构是否与概念模式一致,能否满足用户要求,还要对其功能和性能进行评价,并予以优化。
从E—R模型向关系模型转换的主要过程为:
②确定并写出实体内部属性之间的数据关系表达式,即某一
数据项决定另外的数据项;
③把经过消冗处理的数据关系表达式中的实体作为相应的主关键字
④根据②、③形成新的关系。
⑤完成转换后,进行分析、评价和优化。
3.物理设计
物理设计是指有效地将空间数据库的
逻辑结构在
物理存储器上实现,确定数据在介质上的物理
存储结构,其结果是导出地理数据库的
存储模式(
内模式)。主要内容包括确定记录
存储格式,选择文件存储结构,决定存取路径,分配
存储空间。
物理设计的好坏将对
地理数据库的性能影响很大,一个好的物理存储结构必须满足两个条件:一是地理数据占有较小的存储空间;二是对数据库的操作具有尽可能高的
处理速度。在完成物理设计后,要进行
性能分析和测试。
数据的物理表示分两类:
数值数据和字符数据。数值数据可用
十进制或
二进制形式表示。通常二进制形式所占用的存贮空间较少。字符数据可以用
字符串的方式表示,有时也可利用代码值的存贮代替字符串的存储。为了节约存贮空间,常常采用
数据压缩技术。
物理设计在很大程度上与选用的数据库管理系统有关。设计中应根据需要,选用系统所提供的功能。
4.数据层设计
大多数
GIS都将数据按逻辑类型分成不同的数据层进行组织。数据层是GIS中的一个重要概念。GIS的数据可以按照
空间数据的
逻辑关系或专业属性分为各种逻辑数据层或专业数据层,原理上类似于图片的叠置。例如,
地形图数据可分为地貌、水系、道路、植被、
控制点、
居民地等诸层分别存贮。将各层叠加起来就合成了地形图的数据。在进行
空间分析、数据处理、
图形显示时,往往只需要若干相应图层的数据。
数据层的设计一般是按照数据的专业内容和类型进行的。数据的专业内容的类型通常是
数据分层的主要依据,同时也要考虑数据之间的关系。如需考虑两类物体共享边界(道路与行政边界重合、河流与地块边界的重合)等,这些数据间的关系在数据分层设计时应体现出来。
不同类型的数据由于其应用功能相同,在分析和应用时往往会同时用到,因此在设计时应反映出这样的需求,即可将这些数据作为一层。例如,
多边形的湖泊、水库,线状的河流、沟渠,点状的井、泉等,在GIS的运用中往往同时用到,因此,可作为一个数据层。
数据字典用于描述数据库的整体结构、数据内容和定义等。数据字典的内容包括:
2.各数据层详细内容的定义及结构、数据命名的定义。
3.
元数据(有关数据的数据,是对一个数据集的内容、质量条件及操作过程等的描述)。