您的当前位置:首页正文

地理信息系统原理及应用文档1

2021-12-08 来源:爱go旅游网


地理信息系统原理及应用

第一章:绪论

§1.1 地理信息系统基本概念 1.数据与信息

数据(Data):通过数字化并记录下来可以被识别的符号,用以定性或定量地描述事物的特征和状况。数字、文字、符号、图形、影像、声音等都是数据。

信息(Information):用数字、文字、符号、语言等介质来表示事件、事物、现象等的内容、数量或特征。

2.信息与数据的区别与联系

数据与信息:两者在词义上的差别:数据是信息的表达形式(载体),信息则是数据的内容(内涵)P8;

数据处理与解释:数据处理:为数据解译服务。数据解译:从数据中获取信息。如:遥感图像的解译。

信息的特征:客观性、适用性、传输性、共享性(P8)。

3.地理信息与地理信息系统

地理数据是与地理环境要素有关的物质的数量、质量、分布特征、联系和规律等的数字、文字、图像和图形等的总称.(p8)

地理信息:是地理数据所蕴含和表达的地理意义。

地理信息的特征:属于空间信息。具有空间定位特征(区域性)属性特征(多层次性)时序性特征(动态变化性)。 地理信息系统

信息系统(IS—Information System):能对数据和信息进行采集、储存、加工和再现,并能回答用户一系列问题的计算机系统。 地理信息系统(GIS—Geographical Information System)定义:多个定义教材:(P10)

以地理空间数据库为基础,在计算机软硬件的支持下,对空间相关数据进行采集、管理、分析、模拟和显示,并采用地理模型分析方法,适时提供多种空间和动态的地理信息,为地理研究和地理决策服务而建立起来的计算机系统。

FICCDC(美国联邦数字地图协调委员会):由计算机硬件、软件和不同的方法组成的系统,该系统设计用来支持空间数据的采集、管理、处理、分析、建模和显示,以便解决复杂的规划与管理问题。

地理信息系统的基本概念:GIS是一种计算机系统;包括地理数据采集、地理数据管理、地理数据处理和分析、地理数据可视化表达与输出等子系统。

GIS的操作对象:地理数据(或空间数据spatial data)。

GIS的技术优势:空间数据综合分析与表达

地理信息系统的类型

按研究范围分类(P10)全球GIS

区域GIS 局部GIS

按数据模型:矢量型 栅格型 混合型

按研究内容:

a专题地理信息系统(Thematic GIS) 具有有限目标和专业特点的GIS。如:水资源管理信息系统、农作物估产信息系统、水土流失信息系统、地籍地理信息系统、管网地理信息系统、人口管理信息系统、环境管理信息系统„„

b区域地理信息系统(Regional GIS) 主要以区域综合研究和全面服务为目标。如:城市GIS、省级市GIS、居住小区信息系统、校园信息系统、数字地球„„

地理信息系统工具(GIS—Tool)

具有GIS基本功能的软件包,也称GIS开发平台或外壳。如:ARCGIS;MapInfo;CityStar;MapGIS;GeoStar;SuperMap„

§1.2地理信息系统的基本构成 一、系统硬件

①数据处理设备:数据的处理与计算 ②数据输入设备:数据录入 ③数据输出设备:数据输出

数据处理设备:客户机/服务器(C/S) 这是网络软件运行的一种形式。通常,采用客户机/服务器结构的系统,有一台或多台服务器以及大量的客户机。服务器配备大容量存储器并安装数据库系统,用于数据的存放和数据检索;客户端安装专用的软件,负责数据的输入、运算和输出。 客户机和服务器都是独立的计算机。当一台连入网络的计算机向其他计算机提供各种网络服务(如数据、文件的共享等)时,它就被叫做服务器。而那些用于访问服务器资料的计算机则被叫做客户机。严格说来,客户机/服务器模型并不是从物理分布的角度来定义,它所体现的是一种网络数据访问的实现方式。采用这种结构的系统目前应用非常广泛。如宾馆、酒店的客房登记、结算系统,超市的POS系统,银行、邮电的网络系统等。

数据输入设备:图形手扶跟踪数字化仪(简称数字化仪)

数字化仪是在专业应用领域中一种用途非常广泛的图形输入设备,是由电磁感应板、游标和相应的电子电路组成。当使用者在电磁感应板上移动游标到指定位置,并将十字叉的交点对准数字化的点位时,按动按钮,数字化仪则将此时对应的命令符号和该点的位置坐标值排列成有序的一组信息,然后通过接口(多用串行接口)传送到主计算机。

通俗来说,数字化仪就是一块超大面积的手写板,用户可以通过用专门的电磁感应压感笔或光笔在上面写或者画图形,并传输给计算机系统。 在许多的专业应用领域中,用户需要绘制大面积的图纸,仅靠CAD系统是无法完全完成图纸绘制

的,在精度上也会有较大的偏差,因此必须通过数字化仪来满足用户的需求。 高精度的数字化仪适用于地质、测绘、国土等行业。普通的数字化仪适用于工程、机械、服装设计等行业。 输入计算机的数据是矢量数据 大幅面图形扫描仪

丹麦著名的CONTEX公司是大幅面工程扫描仪的专业生产商,其产品遍布世界各地。CONTEX以欧洲特有的严谨认真的设计制造风格,生产出世界上分辨率最高、性能价格比最优、销量最大的高品质大幅面扫描仪,其产品OEM给许多国际著名的CAD、GIS、图象等外设供应商,并广泛支持第三方应用软件,是各种图纸管理软件及处理软件的首选输入设备。它在国内市场的装机量达80%,遍布GIS、机械、建筑、电子、水利、勘测、石油、化工、市政、邮电、出版、电力、航天、档案、纺织、管道线路布置等各个领域。 输入计算机的数据是栅格数据

数据输出设备:绘图仪

计算机显示器 CRT显示器 LCD显示器 网络设备 局域网模式:部门或单位内部GIS建设 专线连接 资源共享较方便 GIS的组成—硬件—应用模式

广域网模式:用户分布地域广泛,不适合专线连接 公共通讯连接 资源共享方便

局部范围为局域网,通过若干通道与广域网连接

二、系统软件

GIS功能软件 基础支撑软件 操作系统软件 GIS的组成—软件结构 GIS功能软件——分类

GIS基础软件平台:具备丰富GIS专业功能的通用型GIS软件。

ESRI(美国环境系统研究所):ArcGIS MapInfo公司: MapInfo

Intergraph公司:GeoMedia 超图公司:SuperMap 地公司:MapGIS 吉奥公司:GeoStar

GIS应用软件:①GIS功能软件——分类 ②GIS基础软件平台

GIS应用软件:利用GIS基础软件平台上提供的GIS数据处理与分析功能、针对某一具体应用开发的信息系统软件。

土地信息系统 交通信息系统 人口信息系统 水土流失信息系统……..

GIS功能基础软件——平台功能

空间数据输入与编辑 空间数据管理 空间数据处理与分析 空间数据输出 图形用户界面

基础支撑软件

系统库软件:提供基本的程序设计语言以及数学函数库等用户可编程功能。如:C++运行库和编译系统。

数据库软件:用来管理空间数据,包括图形数据和属性数据。流行数据库软件主要有Oracle、Sybase、Informix、DB2、

1

SQL Server、Ingress等。目前GIS软件中通常采用商用数据库管理空间数据,一个有发展前景的模型是面向对象数据模型,可实现图形和属性数据的联合管理。 Oracle、Informix、Ingress等关系数据库管理软件都相继增加了空间数据类型。而ESRI公司的SDE(Spatial Database Engine)也是基于关系数据库的空间数据管理平台。 操作系统软件 系统软件主要是计算机的操作系统以及各种标准外设的驱动软件,目前流行的有Windows系列(Windows XP、 Windows Vista )、UNIX等。系统软件关系到GIS软件和开发语言使用的有效性,是GIS软硬件环境的重要组成部分。

三、空间数据

GIS的操作对象为空间数据

空间数据特征:几何、属性、时间数据;

空间数据组织:矢量结构、栅格结构

(P12);

空间数据管理:几何数据:文件 属性数据:关系数据库

四、系统开发、管理与应用人员

GIS的开发是以人为本的系统工程。业务

素质与专业知识是GIS工程及应用成功

的关键。不但对GIS的技术和功能有足够

的了解,而且要具备组织管理的能力。技

术培训、硬件维护与更新、系统升级、数

据更新、文档管理、数据共享建设等。

五、应用模型

是应用地理信息系统的功能为某一特定

的实际工作而建立的解决方案。

依据对客观世界的认识,经过从概念到计

算机信息表达的映射,形成计算机中可以

运行的软件功能序列。

§1.3 GIS的功能简介

基本功能:

数据采集与编辑 数据存储与管理 数

据处理与变换 空间分析与统计 产品

制作与显示 二次开发与编程

应用功能:

数据采集与编辑 数据分层(点、线、面)

数字化 空间数据编辑 数据存储与管

理 数据的集成过程

几何数据与属性数据组织 空间数据的

拓扑关系

数据结构: 矢量结构、栅格结构、栅格/

矢量结构,决定着GIS的数据分析能力、

效率和精度

数据管理:层次模型、网络模型、关系模

空间数据库的定义

数据的访问与提取

空间数据查询:位置查询;属性查询;拓

扑查询

数据更新与维护

数据处理与变换

目的:保证数据在入库时在内容上的完整

性, 逻 辑上的一致性。

方法:数据编辑与处理、错误修正:

数据变换:投影变换; 数据平移、旋

转、缩放、几何纠正 数据重构: 数据格式转化(矢量、栅格转化,不同数据格式转化) 数据拼接 数据剪裁 数据压缩 数据抽取:类型选择;窗口提取、布尔提取、空间数据内插 空间分析与统计 叠合分析(overlay):在统一的空间参照系下,把同一区域的两个或两个以上的地理图层重叠在一起进行的图形运算和属性运算,以产生空间区域的多重属性特征或建立地理对象之间的空间对应关系。易于进行多条件的查询、地图剪裁、地图更新和统计分析。

空间分析与统计 缓冲区分析(Buffer)是对选中的一组或一类地图要素(点、线或面)按设定的距离条件,围绕其要素而形成一定缓冲区多边形实体,从而实现数据在二维空间得以扩展的信息分析方法。

缓冲区应用的实例: 污染源对其周围的污染量随距离而减小,确定污染的区域; 为失火建筑找到距其 500 米范围内所有的消防水管等; 道路噪声影响范围就是沿道路建一定宽度的缓冲区,车流量决定缓冲区半径; 城市道路扩宽时,计算需拆迁的房屋及赔偿估算; 某地区有危险品仓库,要分析一旦仓库爆炸所涉及的范围,这就需要进行点缓冲区分析。 空间分析与统计 数字地形分析(DTM, Digital Terrain Model ) 是地形表面形态属性信息的数字表达,是带有空间位置特征和地形属性特征的数字描述。数字地形模型中地形属性为高程时称为数字高程模型(Digital Elevation Model,简称DEM)。 产品制作与显示 将GIS处理和分析的结果,输出为各种地图、图像、图表、文字等。 二次开发与编程 GIS的空间分析技术与手段是有限的,而实际应用模型是无可枚举的,任何GIS都应提供二次开发工具。 为满足不同的用户需要,GIS提供专用的脚本语言开发环境,供用户在自己的编程环境中调用GIS函数库,或者系统将某些功能做成组件形式供用户开发语言调用。 定制菜单、程序与可视化界面等 GIS二次开发环境: 专用工具:如Arc/Info的AML语言; 通用语言:如VC++、VB、Delphi等 组件开发:如MapInfo的MapX; 用户可方便地编制自己的GIS应用系统 GIS的功能—功能实现

二次开发

GIS的空间分析技术与手段是有限的,而实际应用模型是无可枚举的,任何GIS都应提供二次开发工具。

为满足不同的用户需要,GIS提供专用的脚本语言开发环境,供用户在自己的编程环境中调用GIS函数库,或者系统将某些功能做成组件形式供用户开发语言调用。

定制菜单、程序与可视化界面等 GIS二次开发环境: 专用工具:如Arc/Info的AML语言; 通用语言:如VC++、VB、Delphi等 组件开发:如MapInfo的MapX; 应用功能:资源管理 区域规划 国土监测 辅助决策…… 资源管理

资源的清查、管理和分析是GIS应用最广泛的领域,也是目前趋于成熟的主要应用领域。

其主要任务是将各种来源的数据和信息有机地汇集在一起,在一个连续无缝的方式下管理大型的地理数据库,这种功能强大的数据环境允许集成各种应用,最终用户通过GIS的客户端软件,可直接对数据库进行查询显示、统计、制图,以及提供区域多种组合条件的资源分析,为资源的合理开发利用和规划决策提供依据。 区域规划

GIS为城市与区域规划人员提供各种地理数据;

GIS软件城市与区域规划人员提供强大的分析工具。例如:

通过对交通流量、土地利用、人口数据等的分析,预测将来的道路等级;

根据地质、水文和人文数据,进行路线设计;

帮助政府部门完成总体规划…… 国土监测

GIS利用多时相的RS数据,可以有效用于森林火灾的预测预报、洪水灾情监测和淹没损失估算、土地利用动态变化分析和环境质量的评估依据等。 辅助决策

商业应用:利用GIS能够迅速有效地管理空间数据,进行空间可视化,确定商业中心位置和潜在市场的分布,寻找商业地域规律,研究时空变化趋势等。 GIS 的相关学科(P15)

GIS特征(与相关软件的区别与联系) GIS与CAD、CAM

GIS与数据库管理系统(DBMS) GIS与管理信息系统(MIS) GIS与遥感信息处理系统(RS) GIS与机助制图系统、地图数据库 GIS特征(续)

GIS与CAD、CAM: 坐标参考系统

处理图形、非图形数据;

对空间对象的空间相关关系建立和处理 CAD不能建立地理坐标系统和完成地理坐标变换;

2

CAD处理多为规则图形,而GIS为非几何图形;

CAD图形功能强而属性处理能力弱,而GIS图形与属性的操作比较频繁,且专业化特征比较强;

GIS的数据量比CAD大得多,数据结构、数据类型复 杂,数据之间联系紧密; CAD不具备地理意义上的查询和分析能力;

GIS与MIS

对属性数据进行管理和处理 对图形数据进行存储

GIS对图形和属性数据共同管理、分析和应用;

MIS一般只处理属性数据,对图形数据以文件形式进行管理,图形要素不能分解、查询,图形与数据之间没有联系;

管理地图和地理信息的MIS不一定就是GIS,MIS在概念上更接近DBMS。 GIS与RS处理系统

遥感数据是GIS的重要信息源。经过遥感信息系统处理的遥感信息,或进入GIS系统作为制图的背景图象,或是与经过分类的信息协同GIS与遥感的集成分析。 遥感图象信息处理系统是专门用于对遥感数据进行处理的软件,主要强调对遥感数据的几何处理、灰度处理和专题信息提取,具有较强的制图功能,可设计丰富的符号和注记,虽有空间叠置分析功能,但由于缺少实体空间关系的描述,难以进行空间实体的空间关系查询、属性查询及网络分析等。 面向位置的特征

遥感图象处理系统不能看作是GIS。 GIS与机助制图系统、地图数据库 GIS的主要技术基础

强调空间数据的处理、显示与表达 空间分析能力

GIS包含数字制图系统的全部功能

地图数据库若空间分析能力较强,可升格为GIS;而GIS若空间分析能力较弱,则退化为地图数据库。

1.4 GIS的发展概况

国际上GIS的起因与发展

起因:地理学的发展与人类生产技术的进步密切相关。

文字描述(如:南阳商场在人民路与新华路交叉口附近)

地图—地理学的第二代语言

地图的优点:由数学决定的结构 特殊的符号系统 经过地图综合

地图的不足:数据损失 图幅及其边缘的限制 数据不易恢复 静态、更新慢 不便于研究多要素之间的复杂关系 地理信息系统的产生 :

现代科学方法 :系统论、信息论、控制论

现代高新技术 :计算机技术、空间技术和自动化技术

现代科学方法和现代高新技术的形成与应用为GIS的产生提供了先决条件,也预

示信息时代的到来。

国外不少人认为,19世纪以来普遍应用的地图和专题图就是一种模拟式的地理信息系统。照此定义,我国的地理信息系统的产生可追溯到宋代的地理图碑,它刻绘了山脉、长江、黄河、长城以及全国各级行政机构,是宋代的中国地图。 到上世纪50年代,随着电子计算机科学的兴起和它在航空摄影测量学与地图制图学中的应用以及政府部门对土地利用规划与资源管理的要求,使人们开始有可能用电子计算机来收集、存贮和处理各种与空间和地理分布有关的图形和有属性的数据,并通过计算机对数据的分析来直接为管理和决策服务,这才导致了现代意义上的地理信息系统的问世。 GIS—地理学的第三代语言 1956年,奥地利测绘部门首先利用电子计算机建立了地籍数据库,随后各国的土地测绘和管理部门都逐步发展土地信息系统(LIS)用于地籍管理。

1963年,加拿大测量学家R.F.Tomlinson首先提出了地理信息这一术语,并于1971年建立了世界上第一个GIS——加拿大地理信息系统(CGIS),用于自然资源的管理和规划。

稍后,美国哈佛大学研究出SYMAP系统软件。由于当时计算机水平的限制,使得GIS带有更多的机助制图色彩,地学分析功能极为简单。 与此同时,国外许多与GIS有关的组织和机构纷纷建立,例如,美国1966年成立了城市和区域信息系统协会(URISA),1969年又建立起州信息系统全国协会(NASIS);国际地理联合会(IGU)于1968年设立了地理数据收集和处理委员会(CGDSP)。这些组织和机构的建立为传播GIS知识,发展GIS技术起了重要的推动作用。

地理信息系统的发展的四个阶段 60年代起源于北美: 1956年,奥地利测绘部门首先利用电子计算机建立了地籍数据库,随后各国的土地测绘和管理部门都逐步发展土地信息系统(LIS)用于地籍管理。

1963年,加拿大测量学家Roger Tomlinson(罗杰.汤姆林森,加拿大地理测量学家,早期从事计算机制图研究) 首先提出了地理信息这一术语,并于1971年建立了世界上第一个GIS——加拿大地理信息系统(CGIS),用于自然资源的管理和规划,于70年代初投入产品生产 。 Tomlinson被誉为“地理信息系统之父”, 稍后,美国哈佛大学计算机图形与空间分析实验室研究出SYMAP系统软件。由于当时计算机水平的限制,使得GIS带有更多的机助制图色彩,地学分析功能极为简单。

与此同时,国外许多与GIS有关的组织和机构纷纷建立,例如,美国1966年成立了城市和区域信息系统协会(URISA),1969年又建立起州信息系统全国协会(NASIS);国际地理联合会(IGU)于1968年设立了地理数据收集和处理委员会(CGDSP)。这些组织和机构的建立为传播GIS知识,发展GIS技术起了重要的推动作用。

地理信息系统的发展的四个阶段: ⑴70年代是GIS发展的巩固阶段:人机图形交互

美国1970-1976年,美国地质调查局就成立了50多个地理信息系统,作为地理、地质、水资源等领域空间信息的工具。

DIME(Dual Independent Map Encoding,双重独立地图编码),美国人口调查局建立的为人口调查目的而设计的一种拓扑编码结构),加拿大、英国、西德、瑞典和日本等国对地理信息系统的研究均投入了大量的人力、物力、财力,研究不同专题、不同规模、不同类型的各具特色的地理信息系统。

召开一系列国际学术研讨会(P4) 软件公司活跃:Jack Dangermond创立的ESRI 公司开发出ArcInfo软件。 ⑵80年代为地理信息系统的大发展和推广应用阶段:

计算机的迅速发展和普及,地理信息系统也逐 步走向成熟,并在全世界范围内全面地推向应用阶段。

1987年美国成立了国家地理信息与分析中心(NCGIA)。

GIS软件商业化:先后开发了ArcInfo、Genamap、System9等GIS软件。

GIS应用,不再受国家限制,并开始由于解决全球化问题

⑶90年代至今为地理信息系统的应用普及时代 :

地理信息系统已成为许多机构必备的工作系统,尤其是政府决策部门在一定程度上由于受地理信息系统影响而改变了现有机构的运行方式、设置与工作计划等。从美国的 “国家信息基础设施:行动计划(National Information Infrastructure ,简称NII)” 建设到数字地球的提出,由“数字地球”细化到“数字中国”、“数字省区”、“数字城市” 、“数字小区”直到“企业信息化”、“电子商务”、“数字通讯”、“虚拟现实”等众多的信息化领域的工作已全面铺开。

⑷20世纪社会服务阶段:

网络GIS:由于计算机的软硬件均得到飞速的发展,网络已进入千家万户。

移动GIS: GIS在我国的发展

①准备阶段:1978年到1980年,进行舆论准备,正式提出倡议,开始组建队伍、组织个别实验研究。

②起步阶段:1981年到 1985年,理论探索和区域性实验研究。并在此基础上制定国家地理信息系统规范。

③初步发展阶段:1986年到90年代。地理信息系统的研究被列入我国“七 五”攻关课题,并且作为一个全国性的研究领域,已逐步和国民经济建设相结合,并取

3

得了重要进 展和实际应用效益。

④快速发展阶段: 90年代末到现在。理论日趋成熟,应用日益广泛,三维GIS、WEBGIS走向应用,GIS市场开始形成。 GIS发展态势

GIS已成为一门综合性技术;

“3S”一体化:与CAD、多媒体、通信、因特网、虚拟现实、办公自动化等相结合,过程综合的信息技术。 GIS产业化发展势头强劲;

GIS产业对象包括:硬件、软件、数据采集与转换、电子数据、遥感数据获取与处理、系统开发与集成、咨询与技术服务。 85%联邦机构和地方政府机构使用GIS 20世纪90年代全球GIS产业以每年15%~40%的速度增加。

我国GIS产业发展也已被确定为国家信息产业中重要的发展方向。

http//nfgis.nsdi.gov.cn(国家基础地理信息系统网)

GIS网络化已构成当今社会的热点; 网络地理信息系统(Web-GIS)指基于Internet平台、客户端应用软件采用网络协议、运行在Internet上的地理信息系统。一般由多主机、多数据库和多个客户端以分布式模式连接在Internet上而组成,一般有以下四个部分:Web-GIS浏览器(browser)、Web-GIS服务器、Web-GIS编辑器(Editor)、Web-GIS信息代理(information agent)。Web-GIS开拓了地理信息资源利用的新领域,为GIS信息的高度社会化共享提供了可能,是传统GIS发展的新机遇。

地理信息科学(Geographic Information Science)的产生和发展;

地理信息机制是其理论研究的主体 地理信息技术是其研究手段

全球变化、区域可持续发展是其主要的应用领域

§1.4 GIS的发展概况

基础理论

地理信息系统是传统科学与现代技术相结合而产生的边缘学科,因此它明显的体现出多学科(地理学、测绘学、计算机科学、数学、认知理论、信息图谱等)交叉的特征,这些交叉学科的基础理论同样构成地理信息系统的基础理论体系;

各国政府设立相应的组织机构来引导GIS理论研究,如美国国家自然科学基金委员会(NSF)支持成立了国家地理信息与分析中心(NCGIA)等,研究重点包括空间关系、空间数据模型、空间认知、空间推理、地理信息机理和地理信息不确定性等;

李德仁院士在《空间信息系统的集成与实现》一书中,扼要叙述了地球空间信息学的七大理论问题:

地球空间信息学的基准; 地球空间信息标准;

地球空间信息的时空变化理论; 地球空间信息的认知; 地球空间信息的不确定性;

地球空间信息的解译与反馈; 地球空间信息的表达与可视化。

作业与思考

什么是GIS?它具有什么特点? GIS与其它信息系统有什么区别? 简述GIS的构成。 简述GIS的发展。

你认为GIS可应用到哪些行业?其应用前景如何?

第三章 空间数据获取

3.1概述

数据采集在GIS中的地位 GIS数据:内容 数字线化数据

地形测图思想:点、线、面 影象数据 数据源丰富 生产效率高

直观详细记录地表自然现象 数字高程模型 属性数据

是什么,判读和考察 详细描述信息

空间数据采集的主要任务 数据采集在GIS中的地位 数据采集任务

将现有的地图、外业观测成果、航空像片、遥感图片数据、文本资料等转换成GIS可以接受的数字形式。

数据库入库之前进行验证、修改、编辑等处理,保证数据在内容和逻辑上的一致性。(数据质量控制)

不同的数据来源要用到不同的设备和方法。

数据的转换装载

数据处理:几何纠正、图幅拼接、拓扑生成等

3.2 空间数据及其特征 3.2.1空间数据

数据处理与解释:P36 空间数据概念:P36

空间特征:GIS独有的数据类型,刻画空间对象的位置、形状和大小等几何特征 表示:绝对描述—坐标(直角坐标、经纬度)相对描述—空间关系

专题特征:除空间特征、时间特征外的其它特征

时间特征

3.2.2 空间数据的特征

1)以统一的坐标系统进行空间定位

地理数据必须具有标准坐标系中的参考位置。坐标系统的选择根据具体应用要求可以选择局部、全国或国际通用坐标系统。但不管如何选取坐标系统,系统之间应能进行转换。

在我国,依照国际惯例并结合我国的具体实际,一般采用与我国基本图系列一致的地图投影系统,就是大比例尺时的高斯-克吕格投影(横轴等角切圆柱投影)和中小比例尺时的Lambert投影(正

轴等角割圆锥投影)

2) 空间数据与非空间数据相结合

空间数据用来描述目标的空间特征,如坐标、周长、面积、曲率等;而目标的非空间特征则用属性来表示。 3)空间数据间存在复杂的关系

地理数据之间的关系是复杂的。例如,消防工作不仅需要很快找到失火的地点和消防栓位置,还要知道哪个消防队离火场最近,这就是我们通常所说的拓扑关系。复杂的关系不可能全部存储,有些要通过计算获取。 4)地理数据具有时效性

地理数据具有周期性和时间性,过时的信息不具备现势的意义,但可以作为历史保存。因此,目前在信息系统中经常以时间属性标注数据特征,而在地理信息系统中增加时间表达维则会增加数据处理的难度。

3.3 GIS的数据来源—分类表 3.4 地理信息系统数据输入 属性数据的输入 空间数据的输入

空间与属性数据的连接

3.4.1 属性数据输入 (1)与空间数据同时输入

键码法- 根据数字化仪标示器上的键盘,将数字化要素的特征码输入数字化程序。

直接输入法-利用计算机的数字键盘将数字化要素特征码输入给数字化程序。 特征码清单法-在数字化仪右上方设置

一块菜单区域,每个矩形方格为一种要素的菜单选项,当数字化图形时,先在菜单选项中取点,程序将坐标换算成菜单编号,再编码得到相应特征码。

(2)属性数据单独输入到文本文件中

3.4.2 空间数据输入

1.手工键盘输入2.跟踪数字化输入3.扫描数字化输入4.现有数据转换 1.手工键盘输入

键盘输入就是通过手工在计算机终端上输入数据。实际上就是将图形元素点、线、面实体的地理位置数据(各种坐标系中的坐标)通过键盘输入数据文件或程序中去。实体坐标可以用地图上的坐标网或将其他格网复盖在材料上量取,这是最简单又不用任何特殊设备的图形数据输入法。

跟踪数字化输入 (1) 数字化仪简介

数字化仪由电磁感应板(操作平台)、坐标输入控制器(标示器)和接口装置组成。目前,市场上数字化仪的规格按其可处理的图幅面积来划分,有A0、A1、A3等幅面。典型的用于制图的数字化仪是A0规格,其幅面为1.0m×1.5m。较小的数字化设备称为数字化板。 (2) 数字化过程

根据GIS软件所提供的数字化仪设备驱动程序和数字化仪的类型,作好数字化

4

仪安装工作,给数字化仪加电,将准备好的数字化原图固定于数字化桌上,输入原图的比例尺,定义用户坐标系(原点和坐标轴),确定地图投影方式,选择数字化方式,确定数字化范围,即用标示器将X、Y最小值的点和X、Y最大值的点数字化。数字化时必须按照不同的专题内容分文件、分图层有顺序地数字化,幅面较大的图件,可分块数字化。 (3) 数字化方式

点方式数字化时,只要将标示器十字丝交点对准数字化原图上要数字化的点,按下标示器上相应的按键,记录该点x、y坐标。每记录一次坐标,操作员需要按键一次。点方式主要用于采集单个点和控制曲线形态的特征点(端点、极值点、拐点),如控制点、三角点、水准点、独立地物中心点等,折线的始点、终点、转折点,居民地街区拐角点等。

流方式数字化时,将标示器十字丝交点沿曲线从起点移动到终点,让它以等时间间隔或等距离间隔方式记录曲线上一系列密集的离散点坐标,操作员无需对每个点都按键一次,仅在曲线的始点和终点各按一次相应的按键即可,对于不规则的曲线图形,如河流、等高线、海岸线等,常使用流方式数字化。 (4) 数字化精度

数字化仪设备使用时间过长导致精度降低或不符合标准的设备均会影响输入数据的精度。数字化仪的分辨率对数字化误差有决定性的影响。最大偏差不应超过3至6个分辨单位,即标定分辨率为0.025mm的数字化仪,测试时的最大偏差应在±0.07mm至0.15mm范围内,否则数字化仪的质量就太差。

数字化方式对数字化精度也有影响,流方式比简单的点方式的位置误差要大,流方式等间隔记录点则不能正确地数字化尖锐的弯曲顶点,常常切割这类弯曲部分,误差较大。

操作员人为误差主要指操作员的经验技能、生理因素和工作态度等。

人工制作编稿原图过程中必然会有误差产生,这些误差随着图数转换而进入计算机的数据中。 扫描数字化输入

(1) 扫描仪简介(2) 扫描前准备(3) 矢量化处理(1) 扫描仪简介

绝大多数扫描仪是按栅格方式扫描后将图像数据交给计算机来处理。扫描仪可分为滚筒式、平板式、CCD直接摄像式三种,其中大幅面的地图以滚筒(卷纸)式用得最多。目前市场上常见的A0幅面的滚筒式单色分灰度扫描仪的分辨率为400~800dpi,操作的精度要高。普通的扫描仪大都按灰度分类扫描,高级的可按颜色分类扫描。 (2) 扫描前准备 ① 原图准备② 记录格式③ 光孔孔径④ 计算坐标差 ① 原图准备

由于扫描数字化是采样头对原图进行扫

描。

扫描数字化,首先要选择色调分明,线划实在而不膨胀的地图作为原图;

其次要在图上精确划定数字化的范围,标出坐标原点;

最后要清理图面,如修净污点,连好线划上的断头。 ② 记录格式

选择数据扫描数字化仪的数据记录格式有两种,一种是数字格式,也就是每个网格记录一个二进制数“0”或“1”,它适用于对黑白或彩色线划地图数字化;一种是连续格式,每个网格记录一个灰度值(0~255个灰阶),这适用于对像片数字化。 ③ 光孔孔径(分辨率)

扫描仪采样头中透光孔的孔径有好多规格,12.5μ×12.5 25μ×12.5μ 50μ×25μ (μ(微米)=1/1000毫米),它用来控制网格的大小,也就是用以控制分辨率,孔径越小,网格就越小,分辨率就越高,数据量也就越大。根据地图的精度要求,应选择具有一定的分辨率,数据量又不致过大的孔径。通常选择100μ×100μ(或50μ×40μ)的孔径,即地图上0.1毫米粗的线划一般只占1至2个网格。 ④ 计算坐标差 当原图经过定向,固定的在滚筒(或平台)上之后,要算出扫描仪原点和原图原点之差,以便控制记录装置。 (3) 扫描矢量化处理 现有数据转换

任何信息系统总要利用已有数据,以减轻信息收集、编码、输入的工作量。除了利用本单位、本部门的现成资料外,常用的、通用的数据供社会共享已成为一种趋势。特别在发达国家,有很多政府机构或私人公司已经开始向社会公开提供数据服务,这种服务大致有五类信息:基本数字化地图、自然资源数据、地面数字高程、遥感数据、与人口统计相结合的空间、属性、地址数据。这些数据服务可以减少在数据收集与数据输入方面多付出的劳动,对GIS普及将起到了有力的促进作用。

3.4.3 空间与属性 数据的连接

在数据编辑的基础上,确定空间数据和非空间属性数据连接的关键字,然后将非空间属性输入到文本文件中,空间数据通过手扶跟数字化或扫描矢量化后,再经检查、线和连接点、细化处理、变形纠正过程建立起多边形,最后将唯一的识别符加入到图形实体中,实现空间与非空间的连接,建立起多边形矢量数据库。 3.5 空间数据转换 空间数据转换的目的:

空间数据转换的内容: 定位信息 空间关系 属性信息 空间数据转换方法

外部数据交换文件:如ARC/INFO的E00文件。(图3.2)

空间数据交换标准(图3.3)

Open GIS(图3.4) 3.6空间数据模型

模型:将系统的各个要素通过适当的筛选,用一定的表现规则描述出来的简明映象,是对现实世界的简化表达(如地球仪) 。模型通常表达了某个系统的发展过程或发展结果。

模型的几种形式:①物理模型:由物理模拟过程表达。②图象模型:由某种图象或图象运算的集合表达。

③数据模型:由数学语言建立的、能反映真实世界信息的数据集。

空间数据建模的步骤(层次)

①概念数据模型②矢量数据模型③栅格数据模型④逻辑数据模型:根据概念模型确定的空间数据库信息的内容(空间实体及相互关系)⑤结构化数据模型(层次数据模型;网络数据模型)⑥结构化数据模型(关系数据模型)

⑦物理数据模型:逻辑模型的计算机实现过程。

3.7空间数据质量控制

一. 空间数据质量的内容

二. 空间数据质量问题的评价与来源 三. 常见的空间数据源的误差分析 四. 空间数据的质量控制 一. 空间数据质量的内容 1.数据质量的基本概念:

准确性(accuracy):即一个记录与它的真实值之间的接近程度;

精度(precision):即对现象描述的详细程度;

空间分辨率(Spatial resolution):指最小的可分离单元或最小的可表达单元。对栅格数据,指图像象元大小;对于矢量数据,指坐标点的密集程度。 比例尺(scale):是地图上一个记录的距离和它所表现的“真实世界的” 距离之间的一个比例。

误差(error): 空间数据与其真值之间的差异。

不确定性(uncertainty): 关于空间过程和特征不能被准确确定的程度,是自然界各种空间现象自身固有的属性。在内容上,它是以真值为中心的一个范围,这个范围越大,数据的不确定性也越大。如:如某种土壤类型边界划分的模糊性,某种土地利用类型边界变动的频繁性。 2. 基本内容: 微观部分(见后) 宏观部分 适用性 微观部分

定位精度(见后)

物体的地理位置与其真实地面位置之间的差别; 偏差;精度; 属性精度 离散变量; 连续变量; 逻辑一致性

5

微观部分

主要是独立的数据元素的质量因素。

(1)定位精度

定位精度认为是在数据集合(如地图)中物体的地理位置与其真实的地面位置之间的差别。

检验方法:按规定的方式选择一些样本点与另外一个独立的精度更高的信息源的定位坐标进行比较。

定位精度由两部分组成:偏差与精度。

偏差是描述真实位置与表达位置的系统差别,理想的偏差应当是零。偏差通常由样本点的平均位置误差度量。 精度是数据元素位置误差的描述,通常用对选取的样本点的标准离散差的计算来估计。

(2)属性精度

属性可以是离散的或连续的变量,离散的变量只能取有限的几个值而连续变量则可取任意若干值。 宏观部分

完整性(见后):数据层的完整性;数据分类的完整性;数据检验的完整性; 时间性:原始资料的日期

数据档案:原始数据及处理这些数据所使用的处理步骤

宏观数据质量指数据集合整体部分的质量。宏观控制包括三个方面:完整性、时间性和数据档案。 (1)完整性

关于数据的完整性,可以分为层的完整性、分类的完整性和检验的完整性。

层的完整性是指所感兴趣的研究区域的数据不能100%覆盖或属性不完整等;另一方面是由于研究区域内数据变化没有及时得到更新,造成数据的不完整。

分类的完整性主要是如何选择分类才能表达数据,这可以参考所使用的数据分类标准进行评估。

数据检验的完整性主要指对野外数据测量成果和其他独立数据源数据的检验。 (2)时间性

对于许多的地理信息来说,时间是一个严格的因素。如人口统计、土地利用等。

一些数据非常依赖于它们的采集周期。例如,在一个种植多种作物的区域,作物的生长类型在一年内是随季节变化的,对于制作土地类型覆盖图来说,时间信息将会影响所获取的作物类型信息。 数据质量的时间因素最常用的报告形式是原始资料的日期。例如: 航空摄影时间

地形图测量与更新时间

(3)数据档案

主要是指数据集合生产历史,原始数据以及处理这些数据所使用的处理步骤。 适用性

费用方面的适用性

可获得性:表现在使用和获取数据的难易程度。例如: 费用太昂贵;人的素质较低,计算机不普及; 数据的获取受到个别部门或单位的限制等。

二.空间数据质量问题评价与来源 1.空间数据质量评价:

2.空间数据质量问题的来源:

3.各数据阶段所对应的主要误差来源 1.空间数据质量评价:7个方面 1)数据情况:对数据的来源\\内容及其处理过程等作出准确\\全面\\详尽的说明。

2)位置的精度:指空间实体的坐标数据的精度,包括平面精度、高程精度、接边精度、图像分辨率等。

3)属性精度;指空间实体的属性精度,包括要素分类与代码的正确性、要素属性值的准确性及其名称的正确性等。

4)时间精度:指数据的现势性,可通过数据更新的时间和频率来表现。

5)逻辑一致性:指地理数据关系上的可靠性,包括数据结构、数据内容及拓扑上的内在一致性。

6)数据完整性:指数据在范围、内容及结构等方面满足所有要求的完整程度,包括数据范围、空间实体类型、空间关系分类、属性特征分类等方面的完整性。

7)表达形式的合理性:指数据抽象、数据表达与真实世界的吻合性,包括空间特征、专题特征和时间特征表达的合理性等。

2.空间数据质量问题的来源

1)空间现象自身存在的不稳定性 2)空间现象的表达

3)空间数据处理中的误差(见后) 4)空间数据使用中的误差(见后) 3)空间数据处理中的误差

1)地图投影变换

2)地图数字化和扫描后的矢量化处理 3)数据格式转换 4)数据抽象 5)建立拓扑关系

6)与主控数据层的匹配 7)数据叠加操作与更新 8)数据集成处理 9)数据的可视化表达

10)数据处理过程中误差的传递与扩散

3.各数据阶段所对应的主要误差来源 三:常见的空间数据源的误差分析

1. 误差类型: 逻辑误差; (见后) 几何误差; 时间误差; 属性误差. 2. 误差分析: (见后) 地图数据的质量问题; 遥感数据的质量问题; 测量数据的质量问题. 2. 误差分析

1)地图数据的质量问题:地图固有误差\\材

料变形产生的误差\\图像数字化误差.

2)遥感数据的质量问题:观测过程中的几何畸变等\\图像处理和解译过程的混合像元判读所带来的属性误差等.

3)测量数据的质量问题:包括系统误差\\操作误差等.

四:空间数据的质量控制(P47) 1. 传统的手工方法: 2. 地理相关法:

3.元数据方法:什么是元数据? 3.8 空间数据标准(P48) 数据交换(见教材) 数据质量(见教材)

元数据(metadata):概念:是关于数据的数据。用以描述数据集或数据库的内容、数据的组织形式、数据的存取方式等。是描述数据的数据。在地理空间数据中,元数据是说明数据内容、质量、状况和其它有关特征的背景信息。

纸质地图的元数据主要表现为地图类型、地图图例,包括图名、空间参照系和图廓坐标、地图内容说明、比例尺和精度、编制出版单位和日期或更新日期、销售信息等。

用途:数据目录;数据共享;内部文件记录。

第四章 空间数据表达

4.1空间对象及其定义

1.0维空间对象:点状地物;结(节)点 2.一维空间对象:拓扑弧段;无拓扑弧段;线状地物

3.二维空间对象:无拓扑面片;有拓扑面片;面状地物;象元

4.三维空间对象:体状地物;体元

4.2 空间对象关系 1)点——点关系

相合; 分离; 一点为其它诸点的几何中心; 一点为其它诸点的地理重心。 2)点——线关系 点在线上:可以计算点的性质,如拐点等; 线的端点:起点和终点; 线的交点; 点与线分离:可计算点到线的距离。 地理要素之间的空间区位关系 3)点——面关系

点在区域内,可以记数和统计; 点为区域的几何中心; 点为区域的地理重心; 点在区域的边界上; 点在区域外部。 4)线——线关系

重合; 相接:首尾环接或顺序相接; 相交: 平行。 5)线——面关系

区域包含线:可计算区域内线的密度; 线穿过区域: 线环绕区域:对于区域边界,可以搜索其左右区域名称; 线与区域分离。 6)面——面关系

包含:如岛的情形; 相交:可以划分子区,并计算逻辑与、或、非和异或; 相邻:计算相邻边界的性质和长度; 6

分离:计算距离、引力等。 4.3空间数据的计算机表示

现实世界 模型 实物模型 符号模型 数学模型 数据建模 数据组织方式(如:数据分层,属性组织) 选择数据结构(矢量/栅格)

数据结构编码(数据结构的实现) 4.4空间数据结构的类型

数据结构:矢量结构和栅格结构。

矢量结构:用点、线、面表现地理实体,其空间位置由所在的坐标参考系中的坐标定义。

栅格结构:空间被规则地划分为栅格(通常为正方形);地理实体的位置用它们占据的栅格行、列号来定义;栅格的值代表该位置的属性值;栅格的大小代表空间分解能力。

4.5空间数据结构的建立

数据结构在GIS中对于数据采集、存储、查询、检索、应用分析等操作方式有着重要的影响。

空间数据编码是空间数据结构的实现。 高效的数据结构,应具备如下几个方面的要求(P54):

4.6空间对象的矢量表达

矢量数据结构:是利用欧几里得几何学中的点、线、面及其组合体来表示地理实体空间分布的一种数据组织方式;通过记录坐标的方式尽可能精确地表示点、线、多边形等地理实体;

点:只记录其在特定坐标系下的坐标和属性代码 ;

线段:用一系列有序的、足够短的直线、顺序相接表示,为一个有序的坐标对序列。

多边形:由一系列多而短的直线段组成的、首尾相连的坐标对 。

定义:矢量数据结构通过记录空间对象的坐标及空间关系来表达空间对象的位置。 点:空间的一个坐标点; 线:多个点组成的弧段;

面:多个弧段组成的封闭多边形;

获取方法:1.定位设备(全站仪、GPS、常规测量等)2.地图数字化3.间接获取 栅格数据转换

空间分析(叠置、缓冲等操作产生的新的矢量数据)

矢量数据表达考虑内容 矢量数据自身的存储和管理 几何数据和属性数据的联系

空间对象的空间关系(拓扑关系) 矢量数据表达 简单数据结构 拓扑数据结构 属性数据组织

矢量数据结构 :分为简单数据结构(也称面条数据结构)、拓扑数据结构和曲面数据结构;

拓扑数据结构最重要的技术特征和贡献是具有拓扑编辑功能,包括多边形连接编辑和结点连接编辑。

面实体

多边形矢量编码,不但要表示位置和属性,更重要的是能表达区域的拓扑特征,如形状、邻域和层次结构等,以便使这些基本的空间单元可以作为专题图的资料进行显示和操作。 (一)实体数据结构

只记录空间对象的位置坐标和属性信息,不记录拓扑关系。又称简单数据结构或面条(Spaghetti)结构。

存储:

独立存储:空间对象位置直接跟随空间对象;

点位字典:点坐标独立存储,线、面由点号组成 特征

数据按点、线、面为单元进行组织,数据结构直观简单;

公共边重复存储,存在数据冗余,难以保证数据独立性和一致性;

无拓扑关系,主要用于显示、输出及一般查询;

岛或洞只作为一个简单图形,没有与外界多边形的联系;

多边形分解和合并不易进行,邻域处理较复杂;

适用范围:

制图及一般查询,不适合复杂的空间分析 实例:

ArcView的Shape文件 MapInfo的Tab文件

简单的矢量数据结构—面条结构(Spaghetti)

简单的矢量数据结构 拓扑数据结构

矢量数据表达—拓扑数据结构

不仅表达几何位置和属性,还表示空间关系

表达对象:关联关系 表达方式 全显式表达 部分显式表达 拓扑关系物理实现 直接存储 串行指针

拓扑关系与数据共享 采用拓扑关系的原则 空间数据的拓扑关系 在GIS中,凡具有网状结构特征的地理要素,都存在节点、弧段和多边形之间的拓扑关系。

拓扑定义:指图形保持连续状态下变形,但图形关系不变的性质。将橡皮纸任意拉伸,压缩,但不能扭转或折叠。 拓扑种类:

拓扑关联: (不同类要素之间)如:结点与弧段:V9与L5,L6,L3; 多边形与弧段:P2与L3,L5,L2 拓扑邻接: (同类元素之间) 多边形之间、结点之间。 邻接矩阵

重叠:-- 邻接:1 不邻接:0

拓扑种类: 拓扑关联: 拓扑邻接

拓扑包含:指面状实体包含了哪些线、点或面状实体。 简单包含 多层包含 等价包含

拓扑关系的意义:

对于数据处理和GIS空间分析具有重要的意义,因为:

1)拓扑关系能清楚地反映实体之间的逻辑结构关系,它比几何关系具有更大的稳定性,不随地图投影而变化。

2)有助于空间要素的查询,利用拓扑关系可以解决许多实际问题。如某县的邻接县,--面面相邻问题。又如供水管网系统中某段水管破裂找关闭它的阀门,就需要查询该线(管道)与哪些点(阀门)关联。 3)根据拓扑关系可重建地理实体。 拓扑结构:全显式表达 拓扑结构:部分显式表达 双重独立式 编码(DIME)

这种数据结构最早是由美国人口统计局研制来进行人口普查分析和制图的,简称为DIME(Dual Independent Map Encoding)系统或双重独立式的地图编码法

链状双重独立式编码--拓扑数据结构

在拓扑结构中,多边形(面)的边界被分割成一系列的线(弧、链、边)和点(结点)等拓扑要素,点、线、面之间的拓扑关系在属性表中定义,多边形边界不重复。

矢量数据结构(续)

拓扑结构:拓扑关系与数据共享

维护数据的一致性 矢量数据结构(续)

拓扑结构:是否需要拓扑结构? 应用目的

制图或一般查询,可不要拓扑结构 空间分析,则应建立拓扑关系 服务对象和系统数据结构 面状目标:面-弧、弧-面 网络目标:点-弧、弧-点

矢量数据结构:属性数据表达与组织 属性特征类型

类别特征:是什么

说明信息:同类目标的不同特征 属性特征表达

类别特征:类型编码

说明信息:属性数据结构和表格 属性表的内容取决于用户

图形数据和属性数据的连接通过目标识别符或内部记 录号实现。 4.7 空间对象的栅格表达

栅格数据模型是基于连续铺盖(Regular Tessellations)的,它是将连续空间离散化,以规则或不规则的铺盖覆盖整个空间。

栅格数据结构:基于栅格模型的数据结构

7

一、定义:

栅格数据结构:是以规则的阵列来表示空间地物或现象分布的数据组织,组织中的每个数据表示地物或现象的非几何属性特征。

点用一个栅格单元表示;

线状地物用沿线走向的一组相邻栅格单元表示,每个栅格单元最多只有两个相邻单元在线上,各栅格的值相同; 面或区域用记有区域属性的相邻栅格单元的集合表示,每个栅格单元可有多于两个的相邻单元同属一个区域。 二、栅格数据的特点

用离散的量化栅格值表示空间实体; 属性明确,位置隐含;

栅格边长决定了栅格数据的精度; 数据结构简单,易与遥感结合; 多层数据叠合操作简单; 图形质量低且数据量巨大;

难以建立地物间的拓扑关系,网络分析比较困难。

(a)中a点与c点之间的距离是5个单位,但在 (b)中,ac之间的距离可能是7,也可能是4,取决于算法。如以像元边线计算则为7,以像元为单金大会则为4。同样, (a)中三角形的面积为6个平方单位,而 (b)中则为7个平方单位,这种误差随像元的增大而增加。 三、数据获取方式 目读法

从扫描仪获取数据; 从摄象机获取数据; 从遥感获取数据;

从矢量数据转换为栅格数据。 四、栅格取值原则

栅格是均质(只能取一个值)、最小的单元;但实际上,一个栅格可能对应与实体中几个不同的属性。

中心点法:用处于栅格中心处的地物类型或现象特性决定栅格代码 (C);

面积占优法:以占矩形区域面积最大的地物类型或现象特性决定栅格单元的代码 (B)

长度占优法:通过栅格中心画一横线,用横线所占最长部分的属性作为本栅格元素的代码(C);

重要性法:根据栅格内不同地物的重要性,选取最重要的地物类型决定相应的栅格单元代码 五、栅格数据层

在栅格数据结构中,栅格是最小单位,每个格网只能取值一次。

同一研究区域,需要表达多种地理要素属性时,需要把每一种属性放在单一平面格网上,用多个栅格平面表示该区域的多种地理属性。

矢量、栅格数据结构的比较

作业与思考题

空间数据有哪些基本的拓扑关系?

空间数据结构可分为几类?各有何优缺点?

思考:矢量数据结构的编码方法。

第五章 空间数据的处理

空间数据的坐标变换; 空间数据结构的转换; 矢量数据的图形编辑; 拓扑关系的自动建立; 空间数据压缩与重分类 空间数据的内插方法; 数字高程模型的生成

§5.1 空间数据的坐标变换

空间数据的变换即空间数据坐标系的变换,其实质是建立两个平面点之间的一一对应关系,包括几何纠正和投影转换,它们是空间数据处理的基本内容之一。对于数字化地图数据,由于设备坐标系与用户确定的坐标系不一致,以及由于数字化原图图纸发生变形等原因,需要对数字化原图的数据进行坐标系转换和变形误差的消除。有时,不同来源的地图还存在地图投影与地图比例尺的差异,因此还需要进行地图投影转换和地图比例尺的统一。 几何变换

1、比例尺变换:乘系数 2、变形误差改正:

通过控制点利用高次变换、二次变换和仿射变换加以改正 3、坐标旋转和平移

即数字化坐标变换,利用仿射变换改正。

4、投影变换: 三种方法。

5.1.1 几何纠正:为了实现数字化数据的坐标系转换和图纸变形误差的改正,现有的GIS软件一般具有仿射变换、相似变换、二次变换等几何纠正功能。 1、高次变换

其中A、B代表二次以上高次项之和。上式是高次曲线方程,符合上式的变换称为高次变换。式中有12个未知数,所以在进行高次变换时,需要有6对以上控制点的坐标和理论值,才能求出待定系数。 2、二次变换

当不考虑高次变换方程中的A和B时,则变成二次曲线方程,称为二次变换。二次变换适用于原图有非线性变形的情况,至少需要5对控制点的坐标及其理论值,才能解算待定系数。

3、仿射变换:实质是两坐标系间的旋转变换。

设图纸变形引起x,y两个方向比例尺不同,当x,y比例尺相同时,为相似变换。

求解上式中的6个未知数,需不在一直线上的3对已知控制点,由于误差,需多余观测,所以,用于图幅定向至少需要四对控制点。 仿射变换举例

它的主要特征为:同时考虑到x和y方向上的变形,因此纠正后的坐标数据在不同方向上的长度比将发生变化。 三、地图投影变换

假定原图点的坐标为x,y(称为旧坐标),新图点的坐标为X,Y(称为新坐标),则由旧坐标变换为新坐标的基本方程式为: 1

1)反解变换法(又称间接变换法) 2)正解变换法(又称直接变换法) 2、数值变换法

利用若干同名数字化点(对同一点在两种投影中均已知其坐标的点),采用插值法、有限差分法或多项式逼近的方法,即用数值变换法来建立两投影间的变换关系式。

例如,采用二元三次多项式进行变换: 通过选择10个以上的两种投影之间的共同点,并组成最小二乘法的条件式,进行解算系数。

3、数值解析变换法

当已知新投影的公式,但不知原投影的公式时,可先通过数值变换求出原投影点的地理坐标φ,λ,然后代入新投影公式中,求出新投影点的坐标。即:

§5-2 空间数据结构转换

栅格、矢量结构相互转换

矢量结构与网格结构的相互转换,是地理信息系统的基本功能之一,目前已经发展了许多高效的转换算法;但是,从栅格数据到矢量数据的转换,特别是扫描图像的自动识别,仍然是目前研究的重点

对于点状实体,每个实体仅由一个坐标对表示,其矢量结构和栅格结构的相互转换基本上只是坐标精度变换问题,不存在太大的技术问题。线实体的矢量结构由一系列坐标对表示,在变为栅格结构时,除把序列中坐标对变为栅格行列坐标外,还需根据栅格精度要求,在坐标点之间插满一系列栅格点,这也容易由两点式直线方程得到。线实体由栅格结构变为矢量结构与将多边形边界表示为矢量结构相似,因此以下重点讨论多边形(面实体)的矢量结构与栅格结构相互转换。

5.2.1 矢量格式向栅格格式的转换

矢量格式向栅格格式转换又称为多边形填充,就是在矢量表示的多边形边界内部的所有栅格点上赋以相应的多边形编码

矢量格式向栅格格式的转换算法

内部点扩散算法:该算法由每个多边形一个内部点(种子点)开始,向其八个方向的邻点扩散,判断各个新加入点是否在多边形边界上,如果是边界上,则该新加入点不作为种子点,否则把非边界点的邻点作为新的种子点与原有种子点一起

8

进行新的扩散运算,并将该种子点赋以该多边形的编号。重复上述过程直到所有种子点填满该多边形并遇到边界停止为止。

特点:扩散算法程序设计比较复杂,并且在一定的栅格精度上,如果复杂图形的同一多边形的两条边界落在同一个或相邻的两个栅格内,会造成多边形不连通,这样一个种子点不能完成整个多边形的填充。

复数积分算法 :对全部栅格阵列逐个栅格单元地判断该栅格归属的多边形编码,判别方法是由待判点对每个多边形的封闭边界计算复数积分。对某个多边形,如果积分值为2i,则该待判点属于此多边形,赋以多边形编号,否则在此多边形外部,不属于该多边形。

特点:算法可靠,但极费机时。 射线算法 :射线算法可逐点判断数据栅格点在某多边形之外或在多边形内,由待判点向图外某点引射线,判断该射线与某多边形所有边界相交的总次数,如相交偶数次,则待判点在该多边形外部;如为奇数次,则待判点在该多边形内部(如图)。 射线算法的优缺点 : 运算量大;

射线与多边形边界相交时,有一些特殊情况会影响交点的个数,必须予以排除(如图)。

扫描算法 :是射线算法的改进,将射线改为沿栅格阵列列或行方向扫描线,判断与射线算法相似。扫描算法省去了计算射线与多边形边界交点的大量运算,大大提高了效率。

特点:占用内存较大;扫描线与多边形相交的各种特殊情况仍然存在。 单个多边形的转换

由多边形边界上某点开始顺时针搜索边界线,当边界上行时(图a),位于该边界左侧的具有相同行坐标的所有栅格被减去a;当边界下行时(图b),该边界左边(前进方向看为右侧)所有栅格点加一个值a,边界搜索完毕则完成了多边形的转换。

多个多边形的转换

事实上,每幅数字地图都是由多个多边形区域组成的,如果把不属于任何多边形的区域(包含无穷远点的区域)看成编号为零的特殊的多边形区域,则图上每一条边界弧段都与两个不同编号的多边形相邻,按弧段的前进方向分别称为左、右多边形,可以证明,对于这种多个多边形的矢量向栅格转换问题,只需对所有多边形边界弧段作如下运算而不考虑排列次序:当边界弧段上行时,该弧段与左图框之间栅格增加一个值(左多边形编号—右多边形编号);当边界弧段下行时,该弧段与左图框之间栅格增加一个值(右多边形编号—左多边形编号)。 边界代数法的特点:

与前述其他算法的不同之处,在

于它不是逐点判断与边界的关系完成转换,而是根据边界的拓扑信息,通过简单的加减代数运算将边界位置信息动态地赋给各栅格点,实现了矢量格式到栅格格式的高速转换,而不需要考虑边界与搜索轨迹之间的关系,因此算法简单、可靠性好,各边界弧段只被搜索一次,避免了重复计算。

5.2.2 栅格格式向矢量格式的转换

多边形栅格格式向矢量格式转换就是提取以相同的编号的栅格集合表示的多边形区域的边界和边界的拓扑关系,并表示由多个小直线段组成的矢量格式边界线的过程。

从栅格单元转换为几何图形的过程为矢量化;

(一)要求(矢量化过程应保持):

1) 栅->矢转换为拓扑转换,即保持实体原有的连通性、邻接性等;

2) 转换实体保持正确的外形。 (二)方法

方法一:实际应用中大多数采用人工矢量化法,如扫描矢量化(该法工作量大,成为GIS数据输入、更新的瓶颈问题之一)。 方法二,程序转化转换(全自动或半自动) 过程为:

1、边界提取2、二值化 3、二值图像的预4、细化:1)剥皮法 2)骨架法5、跟踪 6、拓扑化处理 方法二,程序转化转换(全自动或半自动) 栅格格式向矢量格式转换通常包括以下四个基本步骤:

多边形边界提取:采用高通滤波将栅格图像二值化或以特殊值标识边界点;

边界线追踪:对每个边界弧段由一个结点向另一个结点搜索,通常对每个已知边界点需沿除了进入方向的其他7个方向搜索下一个边界点,直到连成边界弧段;

拓扑关系生成:对于矢量表示的边界弧段数据,判断其与原图上各多边形的空间关系,以形成完整的拓扑结构并建立与属性数据的联系;

去除多余点及曲线圆滑:由于搜索是逐个栅格进行的,必须去除由此造成的多余点记录,以减少数据冗余;搜索结果,曲线由于栅格精度的限制可能不够圆滑,需采用一定的插补算法进行光滑处理,常用的算法有:线形迭代法;分段三次多项式插值法;正轴抛物线平均加权法;斜轴抛物线平均加权法;样条函数插值法。 多边形栅格转矢量的双边界搜索算法 (1)边界点和结点提取: 边界点的6种情形:

如果窗口内四个栅格有且仅有两个不同的编号,则该四个栅格表示为边界点 . 结点的8种情形 :

如果窗口内四个栅格有三个以上不同编号,则标识为结点(即不同边界弧段的交汇点),保持各栅格原多边形编号信息。 双边界搜索算法

(2)边界线搜索与左右多边形信息记录: 边界线搜索是逐个弧段进行的,对每个弧

段由一组已标识的四个结点开始,选定与之相邻的任意一组四个边界点和结点都必定属于某一窗口的四个标识点之一。首先记录开始边界点的两个多边形编号,作为该弧段的左右多边形,下一点组的搜索方向则由进入当前点的搜索方向和该点组的可能走向决定,每个边界点组只能有两个走向,一个是前点组进入的方向,另一个则可确定为将要搜索后续点组的方向。

双边界搜索算法

(3)多余点去除:多余点的去除基于如下思想:在一个边界弧段上的连续的三个点,如果在一定程度上可以认为在一条直线上(满足直线方程),则三个点中间一点可以被认为上多余的,予以去除。多余点是由于栅格向矢量转换时逐点搜索边界造成的(当边界为直线时),多余点去除算法可大量去除多余点,减少数据冗余。

双边界搜索算法的优点

双边界结构可以唯一地确定搜索方向,从而大大地减少搜索时间,同时形成的矢量结构带有左右多边形编号信息,容易建立拓扑结构和与属性数据的联系,提高转换的效率。

第五章 空间数据处理

5.3 矢量数据的图形编辑

图形编辑:又叫数据编辑、数字化编辑,是指对地图资料数字化后的数据进行编辑加工,其主要目的是在改正数据差错的同时,相应地改正数字化资料的图形。

图形编辑是一交互处理过程, GIS具备的图形编辑功能的要求是:

1)具有友好的人机界面,即操作灵活、易于理解、响应迅速等;

2)具有对几何数据和属性编码的修改功能,如点、线、面的增加、删除、修改等; 3)具有分层显示和窗口操作功能,便于用户的使用。 数据检查与清理 数据的检查:

指拓扑关系的检查。包括检查结点是否匹配、是否存在悬挂线(线段过长或过短;伪结点;线段的断裂);多边形是否闭合(多边形裂口)等。 数据清理: 用自动的方法清除空间数据的错误。

矢量图形的编辑

“碎屑”多边形或“条带”多边形(Sliver Polygon):一般由于重复录入引起,由于前后两次录入同一条线的位置不可能完全一致,造成了“碎屑”多边形。另外,由于用不同比例尺的地图进行数据更新,也可能产生“碎屑”多边形。 不正规多边形

是由于输入线时,点的次序倒置或者位置不准确引起的,在进行拓扑生成时,同样会产生“碎屑”多边形。

9

二、编辑操作 1、结点的编辑 1)结点吻合(Snap)

或称结点匹配、结点咬合,结点附和。 方法:

A、 结点移动,用鼠标将其它两点移到另一点;

B、 鼠标拉框,用鼠标拉一个矩形,落入该矩形内的结点坐标通过求它们的中间坐标匹配成一致;

C、 求交点,求两条线的交点或其延长线的交点,作为吻合的结点;

D、自动匹配,给定一个吻合容差,或称为咬合距,在图形数字化时或之后,将容差范围内的结点自动吻合成一点。

一般,若结点容差设置合理,大多数结点能够吻合在一起,但有些情况还需要使用前三种方法进行人工编辑。 2)结点与线的吻合

在数字化过程中,常遇到一个结点与一个线状目标的中间相交。由于测量或数字化误差,它不可能完全交于线目标上,需要进行编辑,称为结点与线的吻合。 编辑的方法:

A、 结点移动,将结点移动到线目标上。 B、 使用线段求交;

C、 自动编辑,在给定容差内,自动求交并吻合在一起。

3)需要考虑两种情况

A、 要求坐标一致,而不建立拓扑关系;如 高架桥(不需打断,直接移动)

B、 不仅坐标一致,且要建立之间的空间关联关系;如 道路交叉口(需要打断) 4)清除假结点(伪结点)

由且仅有两个线目标相关联的结点成为假结点。

有些系统要将这种假结点清除掉(如ARC/INFO),即将目标A 和B合并成一条,使它们之间不存在结点;

但有些系统并不要求清除假结点,如Geostar,因为它们并不影响空间查询、分析和制图。 2、图形编辑

包括用鼠标增加或删除一个点、线、面实体,移动、旋转一个点、线、面实体。 1)删除和增加一个顶点

删除顶点,在数据库中不用整体删除与目标有关的数据,只是在原来存储的位置重写一次坐标,拓扑关系不变。

增加顶点,则操作和处理都要复杂。不能在原来的存储位置上重写,需要给一个新的目标标识号,在新位置上重写,而将原来的目标删除,此时需要做一系列处理,调整空间拓扑关系。 2)移动一个顶点

移动顶点只涉及某个点的坐标,不涉及拓扑关系的维护,较简单。 3)删除一段弧段 复杂,先要把原来的弧段打断,存储上原来的弧段实际被删除,拓扑关系需要调整和变化.

3、数据检查与清理

数据检查指拓扑关系的检查,结点是否匹配,是否存在悬挂弧段,多边形是否封闭,是否有假结点。

要求系统能将有错误或不正确的拓扑关系的点、线和面用不同的颜色和符号表示出来,以便于人工检查和修改。 数据清理则是用自动的方法清除空间数据的错误.

例如给定一个结点吻合的容差使该容差范围内的结点自动吻合在一起,并建立拓扑关系。给定悬挂弧段容差,将小于该容差的短弧自动删除。在Arc/info中用Data Clean 命令,在Geostar中选择整体结点匹配菜单。

4、撤消与恢复编辑

Undo,Redo功能是必要的。但功能的实现是困难的。当撤消编辑,即恢复目标,要恢复目标的标识和坐标、拓扑关系。这一处理过程相当复杂.

因此,有些GIS不在图形编辑时实时建立和维护拓扑关系,如Arc/Info等,而在图形编辑之后,发Clean 或Build命令重新建立拓扑关系。这样,在每次进行任何一次编辑,都要重新Clean 或Build,对用户不便。

三、关键算法 1、点的捕捉

设光标点为S(x,y),

某一点状要素的坐标为A(X,Y)

可设一捕捉半径D(通常为3~5个象素,这主要由屏幕的分辩率和屏幕的尺寸决定)。

若S和A的距离d小于D则认为捕捉成功,即认为找到的点是A,否则失败,继续搜索其它点。

乘方运算影响了搜索的速度,因此,把距离d的计算改为:

捕捉范围由圆改为矩形,这可大大加快搜索速度。

2、线的捕捉

设光标点坐标为S(x,y),D为捕捉半径,线的坐标为(x1,y1),(x2,y2),„(xn,yn)。通过计算S到该线的每个直线段的距离d。.

若min(d1,d2,„dn-1)<D,则认为光标S捕捉到了该条线,否则为未捕捉到。 加快线捕捉的速度的方法:

1)在实际的捕捉中,可每计算一个距离di就进行一次比较,若di<D,则捕捉成功,不需再进行下面直线段到点S的距离计算了。

2)把不可能被光标捕捉到的线,用简单算法去除。

3)对于线段也采用类似的方法处理。 4)简化距离公式:

点S(x,y)到直线段(x1,y1),(x2,y2)的距离d的计算公式为:

3、面的捕捉

实际上就是判断光标点S(x,y)是否在多边形内,若在多边形内则说明捕捉到。 判断点是否在多边形内的算法主要有垂线法或转角法。

垂线法的基本思想是从光标点引垂线(实际上可以是任意方向的射线),计算与多边形的交点个数。

若交点个数为奇数则说明该点在多边形内;若交点个数为偶数,则该点在多边形外。

加快速度的方法:

1)找出该多边形的外接矩形,若光标点落在该矩形中,才有可能捕捉到该面,否则放弃对该多边形的进一步计算和判断。 2)对不可能有交点的线段应通过简单的坐标比较迅速去除。

3)运用计算交点的技巧。

§5-4 拓扑关系的自动建立 一、点线拓扑关系的自动建立 1、在图形采集和编辑中实时建立

2、在图形采集和编辑之后自动建立,其基本原理与前类似。

二、多边形拓扑关系自动建立 1、链的组织

1)找出在链的中间相交的情况,自动切成新链;

2)把链按一定顺序存储,并把链按顺序编号。

2、结点匹配

1) 把一定限差内的链的端点作为一个结点,其坐标值取多个端点的平均值。 2)对结点顺序编号。 3、检查多边形是否闭合

通过判断一条链的端点是否有与之匹配的端点来进行.

多边形不闭合的原因:

1)由于结点匹配限差的问题,造成应匹配的端点未匹配;

2)由于数字化误差较大,或数字化错误,这些可以通过图形编辑或重新确定匹配限差来确定。

3)还可能这条链本身就是悬挂链,不需参加多边形拓扑,这种情况下可以作一标记,使之不参加下一阶段拓扑建立多边形的工作。

二、多边形拓扑关系自动建立 4、建立多边形 1)概念

a、顺时针方向构多边形:指多边形是在链的右侧。

b、最靠右边的链:指从链的一个端点出发,在这条链的方向上最右边的第一条链,实质上它也是左边最近链。a的最右边的链为b

c、多边形面积的计算

当多边形由顺时针方向构成时,面积为正;反之,面积为负。

2)建立多边形的基本过程

1° 顺序取一个结点为起始结点,取完为止;取过该结点的任一条链作为起始链。 2° 取这条链的另一结点,找这个结点上,靠这条链最右边的链,作为下一条链。 3° 是否回到起点:是,已形成一多边形,记录之,并转4°;否,转2°。

10

4°取起始点上开始的,刚才所形成多边形的最后一条边作为新的起始链,转2°;若这条链已用过两次,即已成为两个多边形的边,则转1°。 例:

1°从P1开始,起始链定为P1P2,从P2点算起,P1P2最右边的链为P2P5;从P5算起,P2P5最右边 的链为P5P1,...形成的多边形为P1P2P5P1。

2°从P1开始,以P1P5为起始链,形成的多边形为P1P5P4P1。

3°从P1开始,以P1P4为起始链,形成的多边形为P1P4P3P2P1。

4° 这时P1为结点的所有链均被使用了两次,因而转向下一个结点P2,继续进行多边形追踪,直至所有的结点取完。共可追踪出五个多边形,即A1、A2、A3、A4、A5。

5、岛的判断

找出多边形互相包含的情况. 1°、计算所有多边形的面积。

2°、分别对面积为正的多边形和面积为负的多边形排序。

3°、从面积为正的多边形中,顺序取每个多边形,取完为止。若负面积多边形个数为0,则结束。

4°、找出该多边形所包含的所有面积为负的多边形,并把这些面积为负的多边形加入到包含它们的多边形中,转3°。

正面积多边形包含的负面积多边形是关键.

1°、找出所有比该正面积多边形面积小的负面积多边形。

2°、用外接矩形法去掉不可能包含的多边形。即负面积多边形的外接矩形不和该正面积多边形的外接矩形相交或被包含时,则不可能为该正面积多边形包含。 3°、取负面积多边形上的一点,看是否在正面积多边形内,若在内,则被包含;若在外,则不被包含。 6、确定多边形的属性

多边形以内点标识。内点与多边形匹配后,内点的属性常赋于多边形.

§5-5 图形的裁剪、合并和图幅接边 一、图形的裁剪--开窗处理 1、方式:

正窗:提取窗口内的数据。 开负窗:提取窗口外的数据子集。 矩形窗和多边形窗。 2、算法:

包括点、线、面的窗口裁剪---计算机图形学。

而不规则多边形开窗------相当于多边形叠置处理。

二 .图幅数据边沿匹配处理

由于空间数据采集的误差和人工操作的误差,两个相邻图幅的地图的空间数据在结合处可能出现逻辑裂隙与几何裂隙。

逻辑裂隙指的是当一个地物在一幅图的数据文件中具有地物编码A,而在另

一幅图的数据文件中却具有地物编码B,或者同一物体在这两个数据文件中具有不同的属性信息,如公路的宽度、等高线的高程等。

几何裂隙指的是由数据文件边界分开的一个地物的两部分不能精确地衔接。

图幅接边:在GIS中,需要把单独数字化的相邻图幅的空间数据在逻辑上和几何上融成一个连续一致的数据体,这就是GIS中的图幅接边(图形拼接)问题。图幅接边包括几何接边和逻辑接边。 图幅接边—形成无缝数据库

几何裂缝:指由数据文件边界分开的一个地物的两部分不能精确地衔接。--几何接边

逻辑裂缝:同一地物地物编码不同或具有不同的属性信息,如公路的宽度,等高线高程等。---逻辑接边 1、识别或提取相邻图幅。--要求图幅编号合理

2、几何接边

二、图幅数据边沿匹配处理

图形合并 一幅图内的多层数据合并在一起;

或将相邻的多幅图的同一层数据合并. 涉及到空间拓扑关系的重建。对于多边形,由于同一个目标在两幅图内已形成独立的多边形,合并时,需去除公共边界,属性合并,具体算法,删去共同线段。 实际处理过程是先删除两个多边形,解除空间关系后,删除公共边,再重建拓扑。 3、逻辑接边

1)检查同一地物在相邻图幅的地物编码和属性值是否一致,不一致,进行人工编辑。

2)将同一地物在相邻图幅的空间数据在逻辑上连在一起。

a、索引文件,建立双向指针。 b、关键字,空间操作的方法。

§5-6 空间数据压缩与重分类 一、数据压缩

矢量数据压缩(去冗余/抽稀) 栅格数据压缩

5.6.1矢量数据的压缩 1、 Douglas—Peucker

压缩效果好,但必须在对整条曲线数字化完成后才能进行,且计算量较大; 2、垂距法

每次顺序取曲线上的三个点,计算中间点与其它两点连线的垂线距离d,并与限差D比较。若d<D,则中间点去掉;若d≥D,则中间点保留。然后顺序取下三个点继续处理,直到这条线结束。

压缩算法好,可在数字化时实时处理,每次判断下一个数字化的点,且计算量较小;

3、偏角法

4、间隔取点法 二、曲线光滑(拟合)

是假象曲线为一组离散点,寻找形式较简单、性能良好的曲线解析式。

插值方式:曲线通过给定的离散点。如拉

格朗日插值,三次样条曲线

逼近方式:曲线尽量逼近给定离散点。如贝塞尔和B样条曲线。 5.6.2栅格数据的压缩 栅格数据编码

栅格数据的直接编码方法 栅格数据的压缩编码方法 栅格数据的编码方法

空间数据编码是空间数据结构的实现,即将根据地理信息系统的目的和任务所搜集的、经过审核了的地形图、专题地图和遥感影像等资料按特定的数据结构转换为适合于计算机存储和处理的数据的过程。由于地理信息系统数据量极大,一般采用压缩数据的编码方式以减少数据冗余。

(一)栅格数据直接编码

这是最简单直观而又非常重要的一种栅格结构编码方法,通常称这种编码的图像文件为网格文件或栅格文件,栅格结构不论采用何种压缩编码方法,其逻辑原型都是直接编码网格文件。直接编码就是将栅格数据看作一个数据矩阵,逐行(或逐列)逐个记录代码,可以每行都从左到右逐个象元记录,也可以奇数行从左到右而偶数行从右向左记录,为了特定目的还可采用其他特殊的顺序。 直接编码可分为:

显式存储:每个栅格同时储存其行号、列号及属性值。

(I1 , J1 ,A1,„, In , Jn , An, „)

隐式存储:隐含行、列号,顺序存储栅格属性值。

(A1 , A2 ,A3 , „ , An , „) (二)栅格数据压缩编码

压缩目的:以尽可能少的数据量记录尽可能多的信息 压缩类型: 信息无损压缩:是指编码过程中没有任何信息损失,通过解码操作可以完全恢复原来的信息

信息有损压缩:是指为了提高编码效率,最大限度地压缩数据,在压缩过程中损失一部分相对不太重要的信息,解码时这部分难以恢复。

栅格数据压缩编码方法之一 链码(Chain Codes):弗里曼链码[Freeman]或边界链码 ,适用于对曲线和多边形边界进行编码。 方法:

八方向定义:东=0,东南=l,南=2,西南=3,西=4,西北=5,北=6,东北=7等八个基本方向 。

编码:线标号,起始行,起始列,属性码,方位1,方位2,„,方位n, „

线标号,起始行,起始列,属性码,方位1,方位2,„,方位n, „

„„ 弗里曼链码——练习1

链式编码的特点:链式编码对多边形和线

11

状地物的表示具有很强的数据压缩能力,且具有一定的运算功能,如面积和周长计算等,探测边界急弯和凹进部分等都比较容易;缺点是对叠置运算如组合、相交等则很难实施,对局部修改将改变整体结构,效率较低,而且由于链码以每个区域为单位存储边界,相邻区域的边界则被重复存储而产生冗余。

栅格数据压缩编码方法之二 游程编码(Run-Length Codes)

基本思路:对于一幅栅格图像,常常有行(或列)方向上相邻的若干点具有相同的属性代码,因而可采取某种方法压缩那些重复的记录内容。

游程:一行(列)中,属性相同的连续栅格,称为一个游程。 思路:将栅格矩阵中的行序列 x1,x2,x3,„, xn 映射成整数对序列。即:(c1,l1),(c2,l2),„, (cn , ln).

根据数据结构的不同,可分为: 游程长度编码:Ci—属性,Li —游程的连续长度。

游程终止编码:Ci—属性,Li —游程的终止点列号。

游程长度编码——练习 游程长度编码 游程终止编码

游程编码的优、缺点

游程编码的优点:在对“多对一”的结构,即许多像元同属一个地理属性值的情况下大大改善了传统编码的存储情况。游程长度编码栅格加密时,数据量没有明显增加,压缩效率较高,且易于检索、叠加、合并等操作。这种编码方法最适合于小型计算机,同时也减少了栅格数据库的数据输入量。

游程编码的缺点:计算期间的处理和制图输出处理工作量都有所增加。 栅格数据压缩编码方法之三 块码 (Block Codes)

块码是游程长度编码扩展到二维的情况,采用方形区域作为记录单元,每个记录单元包括相邻的若干栅格,数据结构由初始位置(行、列号)和半径,再加上记录单位的代码组成。

即(I1,J1,L1,C1,„.,I2,J2,L2,C2,„.) 块码 示例

压缩率:随着图形复杂程度的提高而降低效率,就是说图斑越大,压缩比越高;图斑越碎,压缩比越低 块码 的优缺点

块码在合并、插入、检查延伸性、计算面积等操作时有明显的优越性。然而在某些操作时,则必须将其解码,转换为基本栅格结构才能顺利进行。 栅格数据压缩编码方法之四

四叉树 编码(Quadtree Encoding) (一)思路:

四叉树又称四元树或四分树,四叉树将整个图像区(2n×2n )逐步分解为包含单一类型的方形区域,最小的方形区域

为一个栅格象元。分割的原则是,将图像区域划分为四个大小相同的象限,而每个象限又可根据一定规则判断是否继续等分为次一层的四个象限,其终止判据是,不管是哪一层上的象限,只要划分到仅代表一种地物时,则不再继续划分,否则一直划分到单个栅格象元为止。

最上面的那个结点叫做根结点,它对应整个图形。总共有4层结点,每个结点对应一个象限,如2层4个结点分别对应于整个图形的四个象限,排列次序依次为南西(SW)、南东(SE)、北西(NW)和北东(NE),不能再分的结点称为终止结点(又称叶子结点),可能落在不同的层上,该结点代表的子象限具有单一的代码,所有终止结点所代表的方形区域覆盖了整个图形。

四叉树中象限的尺寸是大小不一的,位于较高层次的象限较大,深度小即分解次数少,而低层次上的象限较小,深度大即分解次数多,这反映了图上某些位置单一地物分布较广而另一些位置上的地物比较复杂,变化较大。正是由于四叉树编码能够自动地依照图形变化而调整象限尺寸,因此它具有极高的压缩效率。 采用四叉树编码时,为了保证四叉树分解能不断地进行下去,要求图像必须为2n×2n的栅格阵列,n为极限分割数,n+1为四叉树的最大高度或最大层数,图7-4(c)为23×23的栅格,因此最多划分三次,最大层数为4,对于非标准尺寸的图像需首先通过增加背景的方法将图像扩充为2n×2n的图像。 (二)四叉树的生成方法 1、 自上而下(top-down): 四叉树从上而下(形成)(从整体开始) 由叶结点找Morton码。

A、分割一次,增加一位数字,大分割在前,小分割在后。所以,码的位数表示分割的次数。

B、由Morton找出四叉树叶结点的具体位置。

2.自下而上(bottom-up) 一种按位操作的方法:

如行为2、列为3的栅格的MD(行、列从0开始编号) 步骤:

(1)行、列号为二进制 Ib= 1 0 Jb= 1 1 (2)I行J列交叉

1 1 0 1 = 13 (3)再化为十进制.

实质上是按左上、右上、左下、右下的顺序,

从零开始对每个栅格进行自然编码。 把一幅2n×2n的图像压缩成线性四叉树的过程

1°、按Morton码把图象读入一维数组。 2°、相邻的四个象元比较,一致的合并,只记录第一个象元的Morton码。循环比较所形成的大块,相同的再合并,直到不能合并为止。

3°、进一步用游程长度编码压缩。压缩时只记录第一个象元的Morton码。 右图的压缩处理过程为: 1°、按Morton

Morton码:0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

象 元 值: A A A B A A B B A A A A B B B B

2°、四相邻象元合并,只记录第一个象元的Morton码。

0 1 2 3 4 5 6 7 8 12

A A A B A A B B A B

3°、由于不能进一步合并,则用游程长度编码压缩。

0 3 4 6 8 12 A B A B A B (三)四叉树的存储方法 1)常规四叉树

记录这棵树的叶结点外,中间结点,结点之间的联系用指针联系。 每个结点需要6个变量:

父结点指针、四个子结点的指针和本结点的属性值。

指针不仅增加了数据的存储量,还增加了操作的复杂性:如层次数(分割次数)由从父结点移到根结点的次数来确定,结点所代表的图像块的位置需要从根节点开始逐步推算下来。所以,常规四叉树并不广泛用于存储数据,其价值在于建立索引文件,进行数据检索 2)线性四叉树

记录叶结点的位置,深度(几次分割)和属性。

地址码(定位码、Morton码) 四进制、十进制 优点:

存贮量小,只对叶结点编码,节省了大量中间结点的存储,地址码隐含着结点的分割路径和分割次数。

线性四叉树可直接寻址,通过其坐标值直接计算其Morton码,而不用建立四叉树。 定位码容易存储和执行实现集合相加等组合操作。

四叉树编码的优点:

四叉树编码具有可变的分辨率(能够自动地依照图形变化而调整象限尺寸 ),并且有区域性质,压缩数据灵活,许多运算可以在编码数据上直接实现,大大地提高了运算效率,是优秀的栅格压缩编码之一。

八叉树编码

八叉树结构就是将空间区域不断地分解为八个同样大小的子区域(即将一个六面的立方体再分解为八个相同大小的小立方体),同—区域的属性相同。八叉树主要用来解决地理信息系统中的三维问题。

栅格数据压缩编码总结

12

对数据的压缩是以增加运算时间为代价的。在这里时间与空间是一对矛盾,为了更有效地利用空间资源,减少数据冗余,不得不花费更多的运算时间进行编码,好的压缩编码方法就是要在尽可能减少运算时间的基础上达到最大的数据压缩效率,并且是算法适应性强,易于实现。 链码的压缩效率较高,已接近矢量结构,对边界的运算比较方便,但不具有区域的性质,区域运算困难;

游程长度编码既可以在很大程度上压缩数据,又最大限度地保留了原始栅格结构,编码解码十分容易;

块码和四叉树码具有区域性质,又具有可变的分辨率,有较高的压缩效率,

四叉树编码可以直接进行大量图形图像运算,效率较高,是很有前途的方法。在此基础上已经开始发展了用于三维数据的八叉树编码等。 三、空间数据的重分类

按照重分类、边界消除、合并这三个步骤实现依据属性聚合区域的目的。 例:希望从一个数据层中得到土壤类型分布图,原始数据层中的多边形是根据更细的类别划分的(从图(a)可见,大写字母表示土壤类型的分类,小写字母表示植被类型的分类,每个多边形中土壤类型和植被类型完全一致。)

(1)按照土壤类型这个属性项对原始数据层重分类。

(2)如果两相邻多边形具有相同土壤类型,则删除它们间的分界弧段,这就是边界消除。

(3)重建拓扑,将没有分界弧段的相邻多边形合成一个。

§5-7 空间数据插值

通过已知点或多边形分区的数据,推求任意点多多边形数据的方法,成为空间数据的内插。

分类:点的内插 区域内插 一、点的内插:

内插:在已观测点的区域内估算未观测点的数据的过程;

外推:在已观测点的区域外估算未观测点的数据的过程.——预测。 (一)边界内插

首先假定任何重要的变化都发生在区域的边界上,边界内的变化则是均匀的、同质的。

边界内插的方法之一是泰森多边形法。 泰森多边形法的基本原理是,未知点的最佳值由最邻近的观测值产生。 (二)整体内插

是一种多项式回归分析技术。多项式回归的基本思想是用多项式表示线或面,按最小二乘法原理对数据点进行拟合,拟合时假定数据点的空间坐标X、Y为独立变量,而表示特征值的Z坐标为因变量。 1、当数据为一维时, 1)线性回归:

2)二次或高次多项式:

2、数据是二维的:趋势面分析 二元二次或高次多项式 (三)局部分块内插

利用局部范围内的已知采样点的数据内插出未知点的数据。 1、线性内插

将内插点周围的3个数据点的数据值带入多项式,即可解算出系数a0、a1、a2 。 2、双线性多项式内插

将内插点周围的4个数据点的数据值带入多项式,即可解算出系数a0、a1、a2、a3 。 当数据是按正方形格网点布置:

3、双三次多项式(样条函数)内插

是一种分段函数,每次只用少量的数据点,故内插速度很快;样条函数通过所有的数据点,故可用于精确的内插;可用于平滑处理。

双三次多项式内插的多项式函数为:

将内插点周围的16个点的数据带入多项式,可计算出所有的系数。 (四)逐点内插(移动曲面法):

1、移动平均法:在局部范围(或称窗口)内计算n个数据点的平均值.

二维平面的移动平均法也可用相同的公式,但位置Xi应被坐标矢量Xi代替。 窗口的大小对内插的结果有决定性的影响。

小窗口将增强近距离数据的影响; 大窗口将增强远距离数据的影响,减小近距离数据的影响。

当观测点的相互位置越近,其数据的相似性越强;当观测点的相互位置越远,其数据的相似性越低。 2、加权移动平均法:λi是采样点i对应的权值

加权平均内插的结果随使用的函数及其参数、采样点的分布、窗口的大小等的不同而变化。通

常使用的采样点数为6—8点。对于不规则分布的采样点需要不断地改变窗口的大小、形状和方向,以获取一定数量的采样点。

3、克里金(Kriging)法: 相关知识

区域化变量:当一个变量呈现一定的空间分布时,称之为区域化变量,它反映了区域内的某种特征或现象。区域化变量与一般的随机变量不同之处在于,一般的随机变量取值符合一定的概率分布,而区域化变量根据区域内位置的不同而取不同的值。而当区域化变量在区域内确定位置取值时,表现为一般的随机变量,也就是说,它是与位置有关的随机变量。

区域化变量具有两个显著特征:即随机性和结构性。首先,区域化变量是一个随机变量,它具有局部的、随机的、异常的特征;其次,区域化变量具有一定的结构特点,即变量在点x与偏离空间距离为h的点x+h处的值Z(x)和Z(x+h)具有某种程度的相似性,即自相关性,这种自相关性的程度依赖于两点间的距离h及变量特

征。除此之外,区域化变量还具有空间局限性(即这种结构性表现为一定范围内)、不同程度的连续性和不同程度的各向异性(即各个方向表现出的自相关性有所区别)等特征。

地统计(Geostatistics)又称地质统计,是在法国著名统计学家G. Matheron大量理论研究的基础上逐渐形成的一门新的统计学分支。它是以区域化变量为基础,借助变异函数,研究既具有随机性又具有结构性,或空间相关性和依赖性的自然现象的一门科学。凡是与空间数据的结构性和随机性,或空间相关性和依赖性,或空间格局与变异有关的研究,并对这些数据进行最优无偏内插估计,或模拟这些数据的离散性、波动性时,皆可应用地统计学的理论与方法。

地统计学与经典统计学的共同之处在于:它们都是在大量采样的基础上,通过对样本属性值的频率分布或均值、方差关系及其相应规则的分析,确定其空间分布格局与相关关系。但地统计学区别于经典统计学的最大特点即是:地统计学既考虑到样本值的大小,又重视样本空间位置及样本间的距离,弥补了经典统计学忽略空间方位的缺陷。

(四)逐点内插(移动曲面法):

克里金(Kriging)法:克里格方法的适用范围为区域化变量存在空间相关性,即如果变异函数和结构分析的结果表明区域化变量存在空间相关性,则可以利用克里格方法进行内插或外推;否则反之。其实质是利用区域化变量的原始数据和变异函数的结构特点,对未知样点进行线性无偏、最优估计。无偏是指偏差的数学期望为0,最优是指估计值与实际值之差的平方和最小。也就是说,克里格方法是根据未知样点有限邻域内的若干已知样本点数据,在考虑了样本点的形状、大小和空间方位,与未知样点的相互空间位置关系,以及变异函数提供的结构信息之后,对未知样点进行的一种线性无偏最优估计。

常用的Kriging方法 普通Kriging:

该种方法和反比例加权插值基本相同,只是权重不是一个任意的距离函数,而是基于模型变量图。P102-103 插值的权重之和为1; 表面不太光滑。 简单Kriging:

权重之和不等于1; 表面更加平滑。 通用Kriging:

离散点的平均值不固定;

应用一个“漂移”项来模拟离散点的平均值;

插值的残差被加到漂移上来计算估计值 不同克里格方法适用的条件:

当数据不服从正态分布时,若服从对数正态分布,则选用对数正态克里格;若不服从简单分布时,选用析取克里格。当数据

13

存在主导趋势时,选用泛克里格。当只需了解属性值是否超过某一阈值时,选用指示克里格。当同一事物的两种属性存在相关关系,且一种属性不易获取时,可选用协同克里格方法,借助另一属性实现该属性的空间内插。当假设属性值的期望值为某一已知常数时,选用简单克里格。当假设属性值的期望值是未知的,选用普通克里格。

叠置法: Vt=∑Usats/bs

式中:t为目标区各个分区的序号 s为源区各个分区的序号

Us为分区s的已知统计数据 ats为t区与s区相交的面积 bs为s区的面积 比重法

1) 在源区上叠加一张格网,格网尺寸的大小应保证具有足够的内插精度

2)将源区各个分区的平均人口数赋予相应分区各个格网点 3)按公式z i,j=(z i-1,j+z i+1,j+z i,j+1+z i,j-1)/4得到相邻的四个格网点的平均值 4)将各个分区的格网点值相加,设为Us’,计算其系数 p= Us/ Us’,并将各个格网点值乘以p,得到调整后的各个分区的格网点值。

5)依此过程继续下去,直到Us与 Us’的值很接近,或者相应分区的格网点值比较一致时,便可以计算目标区的内插值。

§5.7 空间数据插值

三、数字高程模型(DEM)的生成 1、DEM的含义:

DEM(Digital Elevation Models),是国家基础空间数据的重要组成部分,它表示地表区域上地形的三维向量的有限序列,即地表单元上高程的集合,数学表达为:z = f(x,y)。 DTM:当z为其他二维表面上连续变化的地理特征,如地面温度、降雨、地球磁力、重力、土地利用、土壤类型等其他地面诸特征,此时的DEM成为DTM(Digital Terrain Models)。

2.DEM的表示法

1)数学方法用数学方法来表达,可以采用整体拟合方法,即根据区域所有的高程点数据,用傅立叶级数和高次多项式拟合统一的地面高程曲面。也可用局部拟合方法,将地表复杂表面分成正方形规则区域或面积大致相等的不规则区域进行分块搜索,根据有限个点进行拟合形成高程曲面。

2)图形方法

(1)线模式:等高线是表示地形最常见的形式。其它的地形特征线也是表达地面高程的重要信息源,如山脊线、谷底线、海岸线及坡度变换线等。

(2)点模式:用离散采样数据点建立

DEM是DEM建立常用的方法之一。数据采样可以按规则格网采样,可以是密度一致的或不一致的;可以是不规则采样,如不规则三角网、邻近网模型等;也可以有选择性地采样,采集山峰、洼坑、隘口、边界等重要特征点。

3.DEM的主要表示模型 1) 等高线法

等高线通常被存储成一个有序的坐标点序列,可以认为是一条带有高程值属性的简单多边形或多边形弧段。由于等高线模型只是表达了区域的部分高程值,往往需要一种插值方法来计算落在等高线以外的其他点的高程,又因为这些点是落在两条等高线包围的区域内,所以,通常只要使用外包的两条等高线的高程进行插值。

2) 规则格网法(Grid)

规则网格,通常是正方形,也可以是矩形、三角形等规则网格。规则网格将区域空间切分为规则的格网单元,每个格网单元对应一个数值。

规则格网法是把DEM表示成高程矩阵,此时,DEM来源于直接规则矩形格网采样点或由不规则离散数据点内插产生。

结构简单,计算机对矩阵的处理比较方便,高程矩阵已成为DEM最通用的形式。高程矩阵特别有利于各种应用。 对于每个格网的数值有两种不同的解释。

第一种是格网栅格观点认为该格网单元的数值是其中所有点的高程值,即格网单元对应的地面面积内高程是均一的高度,这种数字高程模型是一个不连续的函数。

第二种是点栅格观点,认为该网格单元的数值是网格中心点的高程或该网格单元的平均高程值,这样就需要用一种插值方法来计算每个点的高程。计算任何不是网格中心的数据点的高程值,使用周围4个中心点的高程值,采用距离加权平均方法进行计算,当然也可使用样条函数和克里金插值方法。

Grid系统也有下列缺点:

地形简单的地区存在大量冗余数据; 如不改变格网大小,则无法适用于起伏程度不同的地区;

对于某些特殊计算如视线计算时,格网的轴线方向被夸大;

由于栅格过于粗略,不能精确表示地形的关键特征,如山峰、洼坑、山脊等;

3) 不规则三角网(TIN) 法 (实验用了该法)

TIN(Triangulated Irregular Network)表示法利用所有采样点取得的离散数据,按照优化组合的原则,把这些离散点(各三角形的顶点)连接成相互连续的三角面(在连接时,尽可能地确保每个三角形都是锐角三角形或是三边的长度近似相等--Delaunay)。

TIN模型根据区域有限个点集将区域

划分为相连的三角面网络,区域中任意点落在三角面的顶点、边上或三角形内。如果某点不在顶点上,该点的高程值通常通过线性插值的方法得到(在边上用边的两个顶点的高程,在三角形内则用三个顶点的高程)。所以TIN是一个三维空间的分段线性模型,在整个区域内连续但不可微。

因为TIN可根据地形的复杂程度来确定采样点的密度和位置,能充分表示地形特征点和线,从而减少了地形较平坦地区的数据冗余。

不规则点集生成TIN

对于不规则分布的高程点,可以形式化地描述为平面的一个无序的点集P,点集中每个点p对应于它的高程值。将该点集转成TIN,最常用的方法是Delaunay三角剖分方法。生成TIN的关键是Delaunay三角网的产生算法。(邬伦:《地理信息系统——原理方法和应用 》,科学出版社,2004 年2月)

Voronoi图,又叫泰森多边形,它由一组连续多边形组成,多边形的边界是由连接两邻点线段的垂直平分线组成。N个在平面上有区别的点,按照最近邻原则划分平面:每个点与它的最近邻区域相关联。Delaunay三角形是由与相邻Voronoi多边形共享一条边的相关点连接而成的三角形。Delaunay三角形的外接圆圆心是与三角形相关的Voronoi多边形的一个顶点。Delaunay三角形是Voronoi图的偶图 Delaunay三角网的特点

对于给定的初始点集P,有多种三角网剖分方式,而Delaunay三角网有以下特性: 1)其Delaunay三角网是唯一的;

2)三角网的外边界构成了点集P的凸多边形“外壳”;

3)没有任何点在三角形的外接圆内部,反之,如果一个三角网满足此条件,那么它就是Delaunay三角网。

4)如果将三角网中的每个三角形的最小角进行升序排列,则Delaunay三角网的排列得到的数值最大,从这个意义上讲,Delaunay三角网是“最接近于规则化”的三角网。(最小角最大化) TIN的存储

TIN的数据存储方式比格网DEM复杂,它不仅要存储每个点的高程,还要存储其平面坐标、节点连接的拓扑关系,三角形及邻接三角形等关系。TIN模型在概念上类似于多边形网络的矢量拓扑结构,只是TIN模型不需要定义“岛”和“洞”的拓扑关系。 4、DEM 特点

与传统地形图比较,DEM作为地形表面的一种数字表达形式有如下特点:

1)容易以多种形式显示地形信息。地形数据经过计算机软件处理过后,产生多种比例尺的地形图、纵横断面图和立体图。而常规地形图一经制作完成后,比例尺不

14

容易改变或需要人工处理。

2)精度不会损失。常规地图随着时间的推移,图纸将会变形,失掉原有的精度。而DEM采用数字媒介,因而能保持精度不变。另外,由常规的地图用人工的方法制作其他种类的地图,精度会受到损失,而由DEM直接输出,精度可得到控制。

3)容易实现自动化、实时化。常规地图要增加和修改都必须重复相同的工序,劳动强度大而且周期长,而DEM由于是数字形式的,所以增加和修改地形信息只需将修改信息直接输入计算机,经软件处理后即可得各种地形图。 5、DEM应用

1)作为国家地理信息的基础数据; 2)土木工程、景观建筑与矿山工程规划与设计;

3)为军事目的而进行的三维显示; 4)景观设计与城市规划;

5)流水线分析、可视性分析; 6)交通路线的规划与大坝选址; 7)不同地表的统计分析与比较; 8)生成坡度图、坡向图、剖面图、辅助地貌分析、估计侵蚀和径流等;

9)作为背景叠加各种专题信息如土壤、土地利用及植被覆盖数据等,以进行显示与分析;

10)与GIS联合进行空间分析; 11)虚拟现实(Virtual Reality);

此外,从DEM还能派生以下主要产

品:平面等高线图、立体等高线图、等坡度图、晕渲图、通视图、纵横断面图、三维立体透视图、三维立体彩色图等。 6.DEM建立

A、数据获取与处理 1)数据采集

建立DEM,首先必须量测一些高程点的三维坐标。数据的采集密度和采点的选择决定DEM的精度。

采点方式:1.选点采集2.随机采集3.沿等高线采集4.沿断面采集

数据来源:1.地面测量2.地形图数字化采集3.航空相片采集4.机载测高仪采集 按自动化程度:人工、半自动、自动 2) 数据处理

用各种方法采集到得数据需要经过必要的数据处理才能提供应用。数据处理是以数据点作为控制基础,用某一数学模型来模拟地面,进行内插加密计算,确定三角网或格网结点处的特征。

数据处理方法:1. 格式转换2. 坐标系变换3. 数据编辑4. 数据分块5. 数据内插 。

B.构建DEM

1)人工网格法 : 在地形图上蒙上格网,逐格读取中心点或交点的高程值。 2)三角网法

对有限个离散点,每三个邻近点联结成三角形(TIN),每个三角形代表

一个局部平面,再根据每个平面方程,

可计算各格网点高程,生成格网DEM。 3)立体像对法 4)曲面拟合法

根据有限个离散点的高程,采用多项式或样条函数求得拟合公式,再逐个计算各点的高程,得到拟合的DEM。可反映总的地势,但局部误差较大。 可分为:

整体拟合:根据研究区域内所有采样点的观测值建立趋势面模型。特点是不能反映内插区域内的局部特征。

局部拟合:利用邻近的数据点估计未知点的值,能反映局部特征。 5)等值线插值法 不不同模型之间的转换 邬伦:《地理信息系统——原理方法和应用 》,科学出版社,2004 年2月 格网DEM转成TIN 等高线转成格网DEM

利用格网DEM提取等高线 TIN转成格网DEM

第七章 空间数据分析

数字高程模型分析 空间叠合分析 缓冲区分析 网络分析

空间分析模型与空间决策支持 空间数据统计分析

(一) 基于DEM的信息提取 1、坡度(slope)

定义为地表单元的法向量与Z轴的夹角,即切平面与水平面的夹角。

在计算出各地表单元的坡度后,可对不同的坡度设定不同的灰度级,可得到坡度图。

2、坡向(Aspect)

坡向是地表单元的法向量在水平面上的投影与X轴之间的夹角。

在计算出每个地表单元的坡向后,可制作坡向图,通常把坡向分为东、南、西、北、东北、西北、东南、西南8类,再加上平地,共9类,用不同的色彩显示,即可得到坡向图。

3、地表粗造度(破碎度)

是反映地表的起伏变化和侵蚀程度的指标,一般定义为地表单元的曲面面积与其水平面上的投影面积之比。 CZ = S表面积/S投影面积

根据地面粗糙度的定义,求每个栅格单元的表面积与其投影面积之比,可以用如下方法来完成。如图,假如ABC是一个栅格单元的纵剖面,α为此栅格单元的坡度,则AB面的面积为此栅格的表面积,AC面为此栅格的投影面积(也既是此栅格的面积),根据公式:Cosα=AC/AB 则可得出此栅格单元的地面粗糙度M为: M =“AB面的面积”/“AC栅格单元的面

积”

= (AC * AB )/ (AC * AC) = 1 / Cosα 即:

1)求出Slope of DEM

2)使用栅格计算器Calculator,公式为: 1 / Cos([Slope of DEM]*3.14159/180)

4、高程变异分析

包括平均高程、相对高程、高程标准差,高程变异。

高程变异:为格网顶点的高程标准差与平均高程的比值。

( 二)基于DEM的可视化分析 1、剖面分析 1)意义:

常常可以以线代面,研究区域的地貌形态、轮廓形状、地势变化、地质构造、斜坡特征、地表切割强度等。

如果在地形剖面上叠加其它地理变量,例如坡度、土壤、植被、土地利用现状等,可以提供土地利用规划、工程选线和选址等的决策依据。 2)绘制

可在格网DEM或三角网DEM上进行。 已知两点的坐标A(x1,y1),B(x2,y2),则可求出两点连线与格网或三角网的交点,并内插交点上的高程,以及各交点之间的距离。然后按选定的垂直比例尺和水平比例尺,按距离和高程绘出剖面图。 剖面图不一定必须沿直线绘制,也可沿一条曲线绘制。

2、通视分析:通视分析是指以某一点为观察点,研究某一区域通视情况的地形分析。

1)方法:

a、以O为观察点,对格网DEM或三角网DEM上的每个点判断通视与否,通视赋值为1,不通视赋值为0。由此可形成属性值为0和1的格网或三角网。对此以0.5为值追踪等值线,即得到以O为观察点的通视图。

b、以观察点O为轴,以一定的方位角间隔算出0°~360°的所有方位线上的通视情况。对于每条方位线,通视的地方绘线,不通视的地方断开,或相反。这样可得出射线状的通视图。 2)关键算法

均是判断格网或三角网上的某一点是否通视(即两点是否可见)。(两点是否可见的算法)

3)通视分析示例

两点是否可见的算法: a)倾角法

格网DEM为例,O(xo,yo,zo)为观察点,P(xp,yp,zp)为某一格网点,OP与格网的交点为A、B、C。

15

OP的倾角为α

观察点与各交点的倾角为βi (i=A,B,C)

若tgα>max(tgβi , i=A、B、C),则OP

通视

否则,不通视。 b) 剖面图: 两点连线是否与剖面相交。 3、地形三维图绘制

4、地貌晕渲图绘制 5、模拟飞行

(三)流域水文特征及土木工程

用于工程项目中的开挖填方、线路勘测设计、水利建设工程等。

§7.6 空间叠合分析 (Spatial Overlay Analysis)

1. 概念:在统一的空间参照系下,把同

一区域的两个或两个以上的地理图层重叠在一起进行的图形运算和属性运算,以产生空间区域的多重属性特征或建立地理对象之间的空间对应关系。

2. 分类: 按照应用目的:1.空间合成叠

加2空间统计叠加3.按照图层的数据结构4.矢量数据叠加5.栅格数据叠加 根据叠合对象图形特征的不同:1.点与多边形的叠加2.线与多边形的叠加3.多边形与多边形的叠加

空间合成叠加 作用:

1、用于搜索具有几种地理属性的分布区域;

2、对叠合后产生的多重属性进行新的分类

空间统计叠加 作用:

用于提取某个区域范围内某种主题属性内容的数量特征。

线与多边形的叠加

(line-in-polygon overlay)

线与多边形的叠加,先进行线与多边形的求交,用多边形边界将线目标切割,并对切割后的线段重新编号,建立线段与多边形的归属关系,并建立起线状目标的属性表(包含原线目标的属性和被叠置的面状目标的属性

多边形与多边形的叠加

(polygon-on-polygon overlay)需要把参与叠加的多边形的边界全部进行边界求交运算和切割。然后根据切割的弧段重建拓扑关系,必要时再抽取属性。

§7.6 空间叠合分析

(Spatial Overlay Analysis) 3.多边形矢量数据叠加分析——

ARCGIS9.2中的空间叠加分析的几种操作命令

图层擦除(Erase)

图层擦除是指输入图层根据擦除图层的范围大小,将去除参照图层所覆盖的输入图层内的要素,最后得到剩余的输入图层;属性数据保留了原来输入图层的属性。从数学的空间逻辑运算的角度来说,即A-A∩B(A为输入图层,B 为擦除层)

识别叠加(Identity)

输入图层和另外一个图层进行识别叠加,在图形交迭的区域,识别图层的属性将赋给输入图层在该区域内的地图要素,同时也有部分的图形的变化在其中。

交集操作(Intersect)

交集操作是得到两个图层的交集部分,并且原图层的所有属性将同时在得到的新的图层上显示出来。在数学运算上表现为,A∩B(A,B 分别是进行交集的两个图层)。

均匀差值(Symmetrical Difference) 在矢量的叠置分析中也有为了获得两个图层去掉它们之间的公共部分,而只需要非重叠部分,新生成的图层的属性也是综合两者的属性而产生的。利用数学的空间逻辑运算的方式表示就是:A∪B-A∩B (A,B 为输入的两个图层)。

修正更新(Update)

进行多边形叠合,输出图层为一个经删除处理后的图层与一个新特征图层进行合并的结果。

注意:该操作只更输入原图层的几何形状,属性信息保留了原图层属性

图层合并(Union)

图层合并就是把一个多边形按另一个多边形的空间格局分布几何求交而划分成多个多边形,同时进行属性分配,将输入图层对象的属性拷贝到新对象的属性表中。图层合并从数学角度来表示就是:A∪B (A,B 为输入的两个图层)

4、栅格数据的叠置分析(raster data overlay analysis)

1.前提:参与叠加的栅格图层应具有统一的栅格数据格式、统一的空间参考(包括地图投影、椭球体、基准面等)、统一的比例尺和统一的分辨率(像元大小)。

2. 栅格数据的叠加分析操作主要通过栅格之间的各种运算实现。可以对单层数据进行各种数学运算如加、减、乘、除、指数、对数等,也可通过数学关系式建立多个数据层之间的关系模型。例如:a、b、c等表示不同专题要素层上同一坐标处栅格的属性值,f函数为关系模型 ,A为叠加后输出层的属性值,则A=f(a,b,c…..)

基于不同的运算和叠加方式,栅格叠加变换的几种类型:

局部变换(local operations)点变换

每个像元的输出值仅与此(空间位置的)像元本身有关,而与其它像元无关。局部变换的运算函数包括基本代数运算、三角运算、指数、对数、幂运算、概要统计(最大值、最小值、值域、总和、均值、中位数、标准差等)等。详见P162表5-7

邻域变换(neighborhood operations)邻域变换

输出栅格层的像元值主要与其相邻像元值有关。通常通过定义矩形、圆形、环形、楔形邻域,中心栅格的值利用邻域栅格(亦可包括中心栅格)的值计算得到。其运算函数包括概要统计(最大值、最小值、值域、总和、均值、中位数、标准差等)、最多数、最少数、类别数等,详见P162表5-9。

分带变换(zonal operations)区域变换

把具有相同值或相似要素的一组栅格作为整体进行分析,带即可以空间上相邻也可空间上不相邻。其运算函数主要包括概要统计量,如最大值、最小值、值域、总和、均值、中位数、标准差、最多数、最少数、类别数等。

分带变换应用:利用分类区统计可以计算具有某一相同属性的数据所包含的另一属性数据的统计信息。 例如:

16

可以计算每个污染区的平均人口密度; 计算同一高程处植被类型的种类,或可以计算同一种植被类型下高程的平均值。 以下为以某一地区坡度分类区为分类区数据集,土地利用类型为被分类数据集(下图),计算同一坡度分类区内土地利用类型的种类。

坡度分级图为分类区数据集,土地利用类型为被分类数据集,计算同一坡度分类区内土地利用类型的种类。

直方图的直方条数等于分类区个数,并以 Zone Field 字段值分类区代码作为直 方条的标示。

§7-5 缓冲区分析(spatial buffer

analysis)

一.缓冲区及其作用

缓冲区分析(Buffer):是对选中的一组或一类地图要素(点、线或面)按设定的距离条件,围绕其要素而形成一定缓冲区多边形实体,从而实现数据在二维空间得以扩展的信息分析方法。 缓冲区应用的实例:

污染源对其周围的污染量随距离而减小,确定污染的区域;

为失火建筑找到距其 500 米范围内所有的消防水管等;

道路噪声影响范围就是沿道路建一定宽度的缓冲区,车流量决定缓冲区半径; 某地区有危险品仓库,要分析一旦仓库爆炸所涉及的范围,这就需要进行点缓冲区分析等等。

作用: 缓冲区分析是GIS的基本空间操作功能之一,一般应用于求地理实体的影响范围,即邻近度问题。

一. 基于矢量数据的缓冲区的建立

从原理上来说,缓冲区的建立相当的简单。

对点状要素直接以其为圆心,以要求的缓冲区距离大小为半径绘圆,所包容的区域即为所要求区域;

线状要素和面状要素则比较复杂,它们缓冲区的建立是以线状要素或面状要素的边线为参考线,来做其平行线,并考虑其端点处建立的原则,即可建立缓冲区,但是在实际中处理起来要复杂的多。 二. 基于栅格的缓冲区建立

算法比较简单,核心问题是距离变换。

§7-9 网络分析(spatial network analysis) 一.概念

网络分析的基础是图论和运筹学。 二、网络的组成

1、网络:是一系列联结的弧段,形式物质、信息流通的通道。 2、网络基本要素:

1)结点:网络中任意两条线段的交点。 2)链:连通路线,连结两点的线要素,

是资源运移的通道。

3)转弯:在连通路线相连的结点处,资源运移方向可能转变,从一条链上经结点转向另一条链。 4)停靠点(站点):网络中资源的上、下结点。

5)中心:收发资源的结点处的设施,如河流网络中的水库,公共汽车停车场。 6)障碍:资源不能通过的结点。 3、属性

1)阻碍:资源在网络中运行的阻力。 2)资源需求量:网络中与弧段和停靠点相联系资源的数量,如某条街所住的学生数。

3)资源容量:网络中心为弧段的需求能容纳或提供的资源总数量,如接收的学生总数。

4、网络要素的表示 3)停靠点、中心的属性

停靠点:直接在相应的结点上附上需求量属性,负为下卸,正值为装载,

中心:资源最大容量、服务范围和服务延迟数(在其它中心达到某个数量时才提供服务)。

三·网络分析 (一)路径分析

1、最短路径分析含义:在网络中从起点经一系列特定

的结点至终点的资源运移的最佳路线,即阻力最小的路径。 2、路径分析包括:

1)静态求最佳路径:在给定每条链上的属性后,求最佳路径。

一般分析从p1到p2共有n条路径,计算各路径上的权数之和,取最小者为最佳路径。

2)N条最佳路径 给定起点、终点,求代价最小的N条路径,事实上,理论上只有一条,实际上需选择N条近似最佳路径。

3)最短路径或最低耗费路径

确定起点、终点和要经过的中间点、链,求最短或耗费最小路径。 4)动态最佳路径分析

实际中权数可能是变化的,可能会临时产生一些障碍点,要动态计算最佳路径。 3、核心算法

求两点间的权数最小路径,常用的算法是Dijkstra。

(二) 连通分析---最小生成树 1、含义:

连通图:如果一个图中,任意两个节点之间都存在一条路。

树:若一个连通图中不存在任何回路,则称为树。

最小生成树:生成树是图的极小连通子图。

生成树T的权数:设T为图G的一个生成树,若把T中各边的权数相加,则这个和数称为生成树T的权数。在G的所有生成树中,权数最小的生成树称为G的最小生成树。

2、应用:

类似在n个城市间建立通信线路这样的连通分析问题。

图的顶点表示城市,边表示两城市间的线路,边上所赋的权值表示代价。对n个顶点的图可以建立许多生成树,每一棵树可以是一个通信网。若要使通信网的造价最低,就需要构造图的最小生成树。

3.构造最小生成树的依据有两条

1)在网中选择n-1条边连接网的n个顶

2)尽可能选取权值为最小的边。

4、算法(Kruskal,克罗斯克尔算法,也叫“避圈”法)

设图G是由m个节点构成的连通赋权图,则构造最小生成树的步骤如下:

1)先把图G中的各边按权数从小到大重新排列,并取权数最小的一条边为T中的边。

2)在剩下的边中,按顺序取下一条边。若该边与T中已有的边构成回路,则舍去该边,否则选进T 中。 3)重复2),直到有m-1条边被选进T中,这m-1条边就是G的。

(三)资源分配—定位与分配问题 1、含义:

定位与分配模型 :是根据需求点的空间分布,在一些候选点中选择给定数量的供应点以使预定的目标方程达到最佳结果。---最佳分配中心,最优配置。 包括:

定位问题是指已知需求源的分布,确定在哪里布设供应点最合适的问题;

分配问题是确定这些需求源分别受哪个供应点服务的问题。 2、算法

在运筹学的理论中,定位与分配模型常可用线性规划求得全局性的最佳结果。由于其计算量以及内存需求巨大,所以在实际应用中常用一些启发式算法来逼近或求得最佳结果。

如P—中心的定位分配问题:在m个候选点中选择P个供应点为n个需求点服务,使得为这几个需求点服务的总距离(或时间或费用)为最少。 3、应用:

实际应用中,选择供应点时,并不只是要使总的加权距离为最小,有时需要使总的服务范围为最大,有时又限定服务的最大距离不能超过一定的值,因此仅仅是P中心模型不足以解决更多的实际问题,需要进行修改、扩充。 (四)流分析 1、概念:

1)流:资源在结点间的传输。

2)流分析:按照某种优化标准(时间最少、费用最低、路程最短或运送量最大等)设计资源的运送方案。

3)最小费用最大流量:不仅要考虑使网

17

络上的流量最大,而且要使运送流的费用或代价最小。

2、为了实施流分析,就要根据最优化标准的不同扩充网络模型

例如:把结点分为发货中心和收货中心,分别代表资源运送的起始点和目标点。这时发货中心的容量代表待运送资源量,收货中心的容量代表它所需要的资源量。弧段的相关数据也要扩充,如果最优化标准是运送量最大,需要设定边的传输能力;若是费用最低,则要设定边的传输费用等。

3、计算:网络流理论是它的计算基础。

§7-9 空间分析模型

一 空间分析建模—专业应用模型 1、定义:

空间分析模型是: 指用于GIS空间分析的数学模型,是在GIS空间数据基础上建立起来的模型,是通过作用于原始数据和派生数据的一组顺序的、交互的空间分析操作命令,对一个空间决策过程进行的模拟。

如国家森林公园选址需要建立相应选址模型。

数据源已知,包括公路铁路分布图(线状地物),森林类型分布图(面状),城镇区划图(面状),需要得到国家森林公园候选地址信息提取的模型。

2、空间分析与应用模型的关系

空间分析是基本的,解决一般问题的理论和方法,而一般应用模型是不可枚举的,是复合、复杂的,解决专门问题的理论和方法,它的解决应以空间分析的基本方法和算法模型为基础。(局部与整体的关系)

3、空间分析模型的意义

(1)空间分析模型是联系GIS应用系统与专业领域的纽带,必须以广泛、深入的专业研究为基础;

(2)空间分析模型是综合利用GIS中大量数据的工具,数据的综合分析和应用主要通过模型来实现;

(3)空间分析模型是分析型和辅助决策型GIS区别于管理型GIS的一个重要特征,是解决空间分析和辅助决策问题的核心。

4、地理信息建模系统(geographic information modelling system,简称GIMS)

是研究如何根据给定条件(如已知数据和约束条件)自动生成解决问题(如确定候选地址)的整个操作过程。它能支持面向用户的空间分析模型的定义、生成和检验的环境,支持与用户交互式的基于GIS的分析、建模和决策,GIMS是目前GIS研究的热点问题之一。

自动空间建模极为复杂,目前,GIS空间建模是GIS的一个重要的研究方向。 5、空间建模现状:

通用GIS空间分析功能与各种领域专用模型的结合主要有三种途径:

1) 松散耦合式(外部空

间模型法)

2) 嵌入式(内部空间模

型法)

3)混合型空间模型法

是前两种方法的结合,即尽可能利用GIS提供的功能,最大限度地减少用户自行开发的工作量和难度,又保持外部空间模型法的灵活性。

6、GIS中常用空间分析模型

1) 相关分析模型---用来分析研究各种地理要素数据之间相互关系的一种有效手段。

2) 趋势面分析模型—-用来将现象的空间分布特征及其区域变化趋势模拟出来。 3) 预测模型--反映地理要素的动态发展规律,并用于预测分析。---常用回归模型。 4)聚类模型——描述各种地理要素数据之间的近似程度,相似的可合并。

二、空间决策支持---GIS空间分析的主要目的

1、空间决策支持定义

是应用空间分析的各种手段对空间数据进行处理变换,以提取隐含于空间数据中的某些事实和关系,并以图形和文字的形式直观地加以表示,为现实世界中的各种应用提供科学、合理的支持。

2、GIS解决空间问题的一般步骤 1)明确目的、要求;

2)收集(准备)数据并建库; 3)确定GIS空间分析步骤; 4)输出结果 ;

例1:道路拓宽改建过程中的拆迁指标计算

1)明确分析的目的和标准

目的:计算由于道路拓宽而需拆迁的建筑物的面积和房产价值; 道路拓宽改建的标准是:

a)道路从原有的20m拓宽至60m; b)拓宽道路应尽量保持直线;

c)部分位于拆迁区内的10层以上的建筑不拆除。

2)准备进行分析的数据

涉及两类信息:一类是现状道路图;另一类是分析区域内建筑物分布图及相关的信息;

3)进行空间操作

a) 选择拟拓宽的道路,根据拓宽半径,建立道路的缓冲区。

b) 将此缓冲区与建筑物层数据进行拓扑叠加,产生一幅新图,此图包括所有部分或全部位于缓冲区内的建筑物信息。 4)进行统计分析

a) 对全部或部分位于拆迁区内的建筑物进行选择,凡部分落入拆迁区且楼层高于10层以上的建筑物,将其从选择组中去除,并对道路的拓宽边界进行局部调整。

b) 对所有需拆迁的建筑物进行拆迁指标计算。

5)将分析结果以地图或表格的形式打印输出

例2:辅助建筑项目选址 1)建立分析的目的和标准

目的:确定一些具体的地块,作为一个轻度污染工厂的可能建设位置。 工厂选址的标准包括: a) 地块建设用地面积不小于10000平方米;

b) 地块的地价不超过1万元/平方米; c) 地块周围不能有幼儿园、学校等公共设施,以免受到工厂生产的影响。 2)从数据库中提取用于选址的数据

一类为全市所有地块信息的数据层;另一类为全市公共设施(包括幼儿园、学校)的分布图。

3)进行特征提取和空间拓扑叠加

从地块图中提取满足条件a)b)的地块,并与公共设施层数据进行叠加。 4)进行邻域分析

对叠加结果进行邻域分析和特征提取,去掉周围有幼儿园、学校等公共设施的地块,选择满足要求的地块。

5)将选择的地块及相关信息以地图和表格的形式打印输出。

§7-4 空间统计分析

一. 统计图表分析

能被用户直观地观察和理解数据。

统计表格是详尽地表示非空间数据的方法,不直观,但可提供详细数据,便于对数据进行再处理。

二、属性数据的集中特征数----找出数据分布的集中位置 1、频数和频率 将变量xi(i=1,2,„,n)按大小顺序排列,并按一定的间距分组。

频数:变量在各组出现或发生的次数; 频率:各组频数与总频数之比;

用以表示事件出现的次数和频率,事件的分布状况。

2、平均数:反映了数据取值的集中位置,通常有简单算术平均数和加权算术平均数。

3、数学期望:反映数据分布的集中趋势。 4、中数:有序数据集中出现频率占半数的数据值。

5、众数:众数是具有最大可能出现的数值。

三、属性数据的离散特征数

描述数据集的离散程度,相对于中心位置的程度

1、 极差:是一组数据中最大值与最小值

之差;

2、 离差,平均离差与离差平方:

1) 离差:一组数据中的各数据值

18

与平均数之差;

2) 平均离差:将离差取绝对值,

然后求和,再取平均数

3) )离差平方:离差求平方和; 平均离差和离差平方和是表示各数值相对于平均数的离散程度的重要统计量。 3、 方差与标准差 1) 方差:

是均方差的简称,是以离差平方和除以变量个数求得的,记为σ2;

2) 标准差:标准差是方差的平方根;

4、变差系数:

用来衡量数据在时间和空间上的相对变化的程度,它是无量纲的量。 为标准差除以平均数取百分。 二. 统计数据的分类分级

1、系统聚类法:根据距离,将相似的样本归为一类,把差异大的样本区分开来。 距离:表示相似程度,可以欧氏距离,绝对值距离、相似系数距离等。

基本思想:首先是n个样本各自成一类,然后计算类与类之间的距离,选择距离最小的两类合并成一个新类,计算新类与其它类的距离,再将距离最小的两类进行合并,这样每次减少一类,直到达到所需的分类数或所有的样本都归为一类为止。

2.最优分割分级法—针对有序样本或可变为有序(排序)的样本

n个数据按大小顺序排列后,有(n-1)个“空隙”,如分成k个等级,则需(k-1)个分级界线。因此,n个数据分成k级的可能分法有 种。

对于每种分级,可按定义为各级内数据的离差平方和之和的误差函数公式来计算分级误差的大小,选择级内离差平方和为最小而级间离差平方和为极大的一种分级方法为最优。

离差:一组数据中的各数据值与平均数之差称为离差。

主成分分析:

是通过数理统计分析,求得各要素间线性关系的实质上有意义的表达式,将众多要素的信息压缩表达为若干具有代表性的合成变量,这就克服了变量选择时的冗余和相关,然后选择信息最丰富的少数因子进行各种聚类分析,构造应用模型。 设有n个样本,p个变量。将原始数据转换成一组新的特征值——主成分,主成分是原变量的线性组合且具有正交特征。即将x1,x2,„,xp综合成m(m<p)个指标zl,z2,„,zm,即

z1=l11*x1+l12*x2+...+l1p*xp

z2=l21*x1+l22*x2+...+l2p*xp ..................

zm=lm1*x1+lm2*x2+...+lmp*xp 这样决定的综合指标z1,z2,„,zm分别称做原指标的第一,第二,„,第m主成分,且z1,z2,„,zm 在总方差中占

的比例依次递减。而实际工作中常挑选前几个方差比例最大的主成分,从而简化指标间的关系,抓住了主要矛盾。

主成份分析这一数据分析技术是把数据减少到易于管理的程度,也是将复杂数据变成简单类别便于存储和管理的有力工具。地理研究和生态研究的GIS用户常使用上述技术,因而应把这些变换函数作为GIS的组成部分。

层次分析法(AHP)

AHP方法把相互关联的要素按隶属关系分为若干层次,请有经验的专家对各层次各因素的相对重要性给出定量指标,利用数学方法综合专家意见给出各层次各要素的相对重要性权值,作为综合分析的基础。例如要比较n个因素y={yl,y2,„,yn }对目标Z的影响,确定它们在z中的比重,每次取两个因素yi和yJ,用aij表示yi与yJ对Z的影响之比,全部比较结果可用矩阵A=(aij)n*n表示,A叫成对比矩阵,它应满足:

aij>0,aji=1/aij (i,j=1,2,...n) 使上式成立的矩阵称互反阵,必有aii=l。

判别分析

判别分析与聚类分析同属分类问题,所不同的是,判别分析是预先根据理论与实践确定等级序列的因子标准,再将待分析的地理实体安排到序列的合理位置上的方法,对于诸如水土流失评价、土地适宜性评价等有一定理论根据的分类系统定级问题比较适用。

判别分析要求根据已知的地理特征值进行线性组合,构成一个线性判别函数Y,即:

式中,Ck(k=l,2,„,m)为判别系数,它可反映各要素或特征值作用方向、分辨能力和贡献率的大小。只要确定了Ck,判别函数y也就确定了。Xk为已知各要素(变量)的特征值。

19

因篇幅问题不能全部显示,请点此查看更多更全内容