还剩14页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
第四章GIS的数据获取地理数据的基本特征地理数据的三个基本特征是空间时间和专题属性。时间和专题属性特征为非空间特征。1、空间特征:空间特征是地理信息系统或空间信息系统所独有的。空间特征是指空间地物的位置形状大小的几何特征以及与相邻地物的空间关系。2、专题特征:专题特征指空间现象和空间目标的属性特征它是指除了时间和空间特征以外的空间现象的其它特征。3、时间特征:空间数据总是在某一特定的时间或时间段内采集得到或计算得到的。一、空间数据集及数据源的种类1、数据源。是指建立GIS的地理数据库所需的各种数据的来源主要包括地图、遥感图像、文本资料、统计资料、实测数据、多媒体数据、已有系统的数据等。可归纳为原始采集数据、再生数据和交换数据三种来源。1、地图数据 地图是GIS的主要数据源因为地图包含着丰富的内容不仅含有实体的类别和属性而且含有实体间的空间关系。地图数据主要通过对地图的跟踪数字化和扫描数字化获取。地图数据不仅可以作宏观的分析用小比例尺地图数据而且可以作微观的分析用大比例尺地图数据。在使用地图数据时应考虑到地图投影所引起的变形在需要时进行投影变换或转换成地理坐标。地图数据通常用点、线、面及注记来表示地理实体及实体间的关系如:点——居民点、采样点、高程点、控制点等。线——河流、道路、构造线等。面——湖泊、海洋、植被等。注记——地名注记、高程注记等。地图数据主要用于生成DLG、DRG数据或DEM数据。2、遥感数据影象数据 遥感数据是GIS的重要数据源。遥感数据含有丰富的资源与环境信息在GIS支持下可以与地质、地球物理、地球化学、地球生物、军事应用等方面的信息进行信息复合和综合分析。遥感数据是一种大__的、动态的、近实时的数据源遥感技术是GIS数据更新的重要手段。遥感数据影象数据用于提取线划数据和生成数字正射影象数据、DEM数据。3、文本资料文本资料是指各行业、各部门的有关法律文档、行业规范、技术标准、条文条例等如边界条约等。这些也属于GIS的数据。4、统计资料 国家和军队的许多部门和机构都拥有不同领域如人口、基础设施建设、兵要地志等的大量统计资料这些都是GIS的数据源尤其是GIS属性数据的重要来源。5、实测数据 野外试验、实地测量等获取的数据可以通过转换直接进入GIS的地理数据库以便于进行实时的分析和进一步的应用。GPS全球定位系统所获取的数据也是GIS的重要数据源。6、多媒体数据多媒体数据包括声音、录像等通常可通过通讯口传入GIS的地理数据库中目前其主要功能是辅助GIS的分析和查询。7、已有系统的数据 GIS还可以从其它已建成的信息系统和数据库中获取相应的数据。由于规范化、标准化的__不同系统间的数据共享和可交换性越来越强。这样就拓展了数据的可用性增加了数据的潜在价值。2、数据集。一个结构化的相关数据的__体包括数据本身和数据间的__。数据集__于应用程序而存在是数据库的核心和管理对象。GIS的主要数据集。数字线划数据DLG、数字扫描数据DRG、影像数据DOM、数字高程数据DEM和属性数据包括____数据、专业数据。二、空间数据采集的任务 空间数据采集的任务是将现有的地图、外业观测成果、__像片、遥感图像、文本资料等转换成GIS可以处理与接收的数字形式通常要经过验证、修改、编辑等处理。 不同数据输入需要用到不同的设备。例如对于文本数据通常用交互的方式通过键盘录入也可用扫描仪扫描后用字符识别软件自动录入;对于矢量地图数据可用平板数字化仪采用手扶跟踪的方法输入也可用扫描仪扫描成图像后用栅格数据矢量化的方法自动追踪输入;等等。GIS软件的这一部分还应具有数据转换装载的功能即能把其它GIS或专题数据库中的数据通过转换装载到当前的GIS系统中。 这一部分GIS软件的数据处理工作主要是几何纠正、图形和文本数据的编辑、图幅的拼接、拓扑关系的生成等即完成GIS的空间数据在装入GIS的地理数据库前的各种工作。三、空间数据主要采集技术在GIS的几何数据采集中如果几何数据已存在于其它的GIS或专题数据库中那么只要经过转换装载即可;对于由测量仪器获取的几何数据只要把测量仪器的数据传输进入数据库即可测量仪器如何获取数据的方法和过程通常是与GIS无关的。 对于栅格数据的获取GIS主要涉及使用扫描仪等设备对图件的扫描数字化这部分的功能也较简单。因为通过扫描获取的数据是标准格式的图像文件大多可直接进入GIS的地理数据库。 从遥感影像上直接提取专题信息需要使用几何纠正、光谱纠正、影像增强、图像变换、结构信息提取、影像分类等技术主要属于遥感图像处理的内容。因此以下主要介绍GIS中矢量数据的采集。GIS中矢量数据的采集主要包括地图跟踪数字化与地图扫描数字化。1、地图跟踪数字化 跟踪数字化是目前应用最广泛的一种地图数字化方式是通过记录数字化板上点的平面坐标来获取矢量数据的。其基本过程是:将需数字化的图件地图、航片等固定在数字化板上然后设定数字化范围、输入有关参数、设置特征码清单、选择数字化方式点方式和流方式等就可以按地图要素的类别分别实施图形数字化了。 由于跟踪数字化本身几乎不需要GIS的其它计算功能所以跟踪数字化软件往往可以与整个GIS系统脱离开因而可单独使用。 地图跟踪数字化时数据的可靠性主要取决于操作员的技术熟练程度操作员的情绪会严重影响数据的质量。操作员的经验和技能主要表现在能选择最佳点位来数字化地图上的点、线、面要素判断十字丝与目标重合的程度等能力。为了保持一致的精度每天的数字化工作时间最好不要超过6小时。 GIS中的地图跟踪数字化软件为了获取矢量数据应具有下列基本功能:1°、图幅信息录入和管理功能 即对所需数字化的地图的比例尺、图幅号、成图时间、坐标系统、投影等信息进行录入和管理。这是所采集的矢量数据的数据质量的基本依据。2°、特征码清单设置 特征码清单是指安放在数字化仪台面或屏幕上的由图例符号构成的格网状清单每种类型的符号占居清单中的一格。在数字化时只要点中特征码清单区的符号所在的网格就可知道所数字化要素的编码以方便属性码的输入。地图跟踪数字化软件应能使用户方便地按自己的意愿设置和定义特征码清单。3°、数字化键值设置 即设置数字化标识器上各按键的功能以符合用户的习惯。4°、数字化参数定义 主要是指系统应能选定不同类型的数字化仪并确定数字化仪与主机的通讯接口。5°、数字化方式的选择 主要是指选择点方式还是流方式等进行数字化。6°、控制点输入功能 应能提示用户输入控制点坐标以便于进行随后的几何纠正。 2、地图扫描数字化 扫描数字化是目前较为先进的地图数字化方式也是今后的发展方向但要实现完全自动化还要做大量艰巨的努力目前所能提供的扫描数字化软件是半自动化的还需做相当的人机交互工作。地图扫描数字化的基本思想是:首先通过扫描将地图转换为栅格数据然后采用栅格数据矢量化的技术追踪出线和面采用模式识别技术识别出点和注记并根据地图内容和地图符号的关系自动给矢量数据赋属性值。 根据目前的技术水平首先要对所扫描的彩色地图进行分版处理通常分为黑版要素、水系版要素、植被要素和地貌要素也可以直接对分版图进行扫描然后由软件进行二值化去噪音等处理经常需要进行一些编辑以保证自动跟踪和识别的进行;在软件自动进行跟踪和识别时仍需要进行部分的人机交互如处理断线、确定属性值等有时甚至要人工在屏幕上进行数字化。 与地图跟踪数字化相比地图扫描数字化具有速度快、精度高、自动化程度高等优点正在成为GIS中最主要的地图数字化方式。 地图扫描数字化的自动化程度高但必须具有一些对扫描后的地图数据的预处理能力同时由于其最后结果同地图跟踪数字化的结果是相同的因而还必须具有地图跟踪数字化所具有的一些功能。因此其基本功能可描述为:1°、地图扫描输入功能 即能使用各种扫描仪把地图扫描数字化为栅格数据。2°、图像格式转换和图像编辑功能 能接受不同格式的栅格数据并具有基本的图像编辑功能。3°、彩色地图图像数据的分版功能 能够将所扫描的彩色地图图像分成不同要素版的图像数据以便于跟踪和识别。4°、线状要素的矢量化功能 能够对线状要素进行细化、断线修复、跟踪也即具有自动提取线状要素中心线的功能。由于目前的自动化程度还不够高经常需要进行人机交互诸如在多条线的交叉点找到粘连及断开处原实体连续担图形中断处桥下河桥中路……需人机交互指明继续追踪的方向。5°、点状符号和注记的自动识别功能 应该能对点状符号和注记字进行自动识别但完全自动化目前仍有困难因此有时需要人工在屏幕上进行数字化。6°、属性编码的自动赋值应能对已数字化的要素自动根据其符号特征赋以相应的编码包括等高线的高程。这方面目前还需要较多的人机交互。7°、图幅信息录入与管理功能同地图跟踪数字化一样地图扫描数字化也需要录入图幅信息以便于管理和质量控制。8°、要素编码设置功能为了能进行属性编码的自动赋值以及人机交互地进行属性编码赋值都必须针对不同的要求进行地图要素的编码设置。9°、控制点输入功能为了进行数字化后的数据纠正必须具有控制点输入功能。3、属性数据的采集 属性数据在GIS中是空间数据的组成部分。例如道路可以数字化为一组连续的象素或矢量表示的线实体并可用一定的颜色、符号把GIS的空间数据表示出来这样道路的类型就可用相应的符号来表示。而道路的属性数据则是指用户还希望知道的道路宽度、表面类型、建筑方法、建筑日期、入口覆盖、水管、电线、特殊交通规则、每小时的车流量等。这些数据都与道路这一空间实体相关。这些属性数据可以通过给予一个公共标识符与空间实体__起来。 属性数据的录入主要采用键盘输入的方法有时也可以辅助于字符识别软件。 当属性数据的数据量较小时可以在输入几何数据的同时用键盘输入;但当数据量较大时一般与几何数据分别输入并检查无误后转入到数据库中。 为了把空间实体的几何数据与属性数据__起来必须在几何数据与属性数据之间有一公共标识符标识符可以在输入几何数据或属性数据时手工输入也可以由系统自动生成如用顺序号代表标识符。只有当几何数据与属性数据有一共同的数据项时才能将几何数据与属性数据自动地连接起来;当几何数据或属性数据没有公共标识码时只有通过人机交互的方法如选取一个空间实体再指定其对应的属性数据表来确定两者之间的关系同时自动生成公共标识码。 当空间实体的几何数据与属性数据连接起来之后就可进行各种GIS的操作与运算了。当然不论是在几何数据与属性数据连接之前或之后GIS都应提供灵活而方便的手段以对属性数据进行增加、删除、修改等操作。4、数据格式转换因GIS软件的原因不同的GIS软件对空间数据定义和存储结构的差别GIS数据库中的数据格式之间存在不兼容的问题。即不同的GIS软件所支持的数据存储格式不能直接相互利用。需经过格式转换才能相互被对方使用。数据格式转换的内容数据格式转换的内容包括三个方面的内容:空间定位信息即几何信息主要是实体的坐标。空间关系信息几何实体之间的拓扑或几何关系数据。属___几何实体的属性说明数据。数据格式转换的方式A、通过外部数据交换文件进行。大部分GIS工具软件都定义了外部交换文件格式如:ARCINFOE00;__pInfoMID;AutoCADDXF;MGEASCIILoader等。系统文件格式的转换需经过三次转换才能完成。B、通过标准空间数据文件转换。实现二次转换。C、通过标准的API函数进行转换。实现一次转换。5、空间数据质量、评价、精度及控制《1》、什么是GIS的数据质量GIS的数据质量是指数据适用于不同应用的能力。指GIS中空间数据几何数据和属性数据在表达空间位置、专题属性和时间特征时所能达到的准确性、一致性、完整性以及三者统一性的程度。《2》、GIS数据质量研究的目的 GIS数据质量研究的目的是建立一套空间数据的分析和处理的体系包括误差源的确定、误差的鉴别和度量方法、误差传播的模型、控制和削弱误差的方法等使未来的GIS在提__品的同时附带提__品的质量指标即建立GIS产品的合格证制度。《3》、研究GIS数据质量的意义 研究GIS数据质量对于评定GIS的算法、减少GIS设计与__的盲目性都具有重要意义。如果不考虑GIS的数据质量那么当用户发现GIS的结论与实际的地理状况相差较大时GIS会失去信誉。《4》、GIS的数据质量的基本特点1准确度:即测量值与真值之间的接近程度可用误差来衡量。2精度:即对空间数据描述的详细程度数据的紧密程度。精度低的数据不一定准确度低。3不确定度:指空间数据不能精确测得当真值不可测或无法知道时就无法确定误差因而用不确定性取代误差。1°统计上用标准差反映可能的误差因此可以用标准差反映测量值的不确定性。2°大比例尺地图上获得的数据的不确定性比小比例尺的小3°高空间分辨率遥感图像上得到数据的不确定性比低分辨率数据的小。4相容性:指两个不同来源的数据在同一个应用中使用的难易程度。1°两个相邻地区的土地利用进行拼接若两图边缘处不仅边界衔接良好而且类型也一致则称两图相容性好反之数据不相容。这种不相容可以通过统一分类和统一标准来减轻。2°不同比例尺的地图数据不相容。3°如果两种不同方法制作的林业图中的一个图的分类体系可以转化成另一个图的分类体系那么前一个图与后一个图是相容的。5一致性:指对同一现象或同类现象的表达的一致程度。同一条河流在地形图上和土壤利用图上形状就不同。6完整性:是指具有同一准确度和精度的数据在特定空间范围内是否完整的程度。一般来说空间范围越大数据完整性的可能性就要差。7可得性:指获取或使用数据得容易程度。8现势性:指数据反映客观现象目前状况的程度。《5》、空间数据误差1定义:测量值与真值之间的接近程度用误差来表示当真值不可测或无法知道时误差就不能确定因而用不确定性取代误差。数据误差的大小即数据的不确定程度是一个积累的量。误差分为系统误差和随即误差统误差易纠正随机误差只能逐一纠正或采取不同处理手段来避免随机误差的产生。2主要误差的来源p63
①数据搜集阶段:野外测量误差:仪器误差记录误差辐射和几何纠正误差遥感数据误差:信息提取误差原始数据误差地图数据误差:坐标转换误差制图综合误差印刷误差
②数据输入阶段:数字化误差:仪器误差操作误差不同系统格式转换误差:栅格-矢量三角网-等值线
③数据存储阶段:数值精度不够:数据存储有效位不能满足要求格网或图像太大空间精度不够:地图最小制图单元太小
④数据处理阶段分类间隔不合理插值误差多层数据叠加引起的误差传播多源数据综合分析误差比例尺太小引起的误差
⑤数据输出阶段:输出设备不精确引起的误差输出的媒介不稳定造成的误差
⑥数据使用阶段:对数据包含的信息的误解对数据信息使用不当3数据的误差类型p63-64几何误差属性误差时间误差逻辑误差1逻辑误差:河流和道路不能穿过房屋森林和湖泊不能重合等对数据进行质量控制和质量保证或质量评价一般先从数据逻辑性入手检查逻辑误差有助于发现不完整的数据和其他三类误差。2属性误差的例子:多边形边界两旁的属性类型应该不同。3时间误差的例子:早发生林火的植被长势比晚发生林火的区域应该差。4几何误差:点误差线误差A、点误差:关于某点A的误差即为测量位置xy与其真实位置x0y0的差异。点误差可以通过计算坐标差和距离的方法得到。Δx=x-x0Δy=y-y0或ΔD=Δx2+Δy2B、线误差:·如道路河流市政或行政边界线等在真实世界中容易找到的这一类的线性特征的误差主要产生于测量和对数据的后续处理。·如按数学投影定义的经纬线按高程绘制的等高线或气候区划线于土壤类型界线。这一类线性特征的线误差及在确定线的界限时的误差被称为解译误差。·解译误差与属性误差直接相关若没有属性误差则可以认为那些类型界线是准确的因而解译误差为零。另一个角度:线误差为:p67·直线―――骨头型误差分布带模式·折线―――车链型·曲线―――串肠型·直线混和的线·直线的误差分布一般以线的起点和终点处最大而中点误差最小。·而折线表达的曲线误差一般在线段中点处大而在折线线段端点处小·曲率大的曲线段容易引起大的误差。5属性误差属性数据可以分为命名次序间隔和比值四种测度中的一种。·间隔和比值测度的属性误差可以用点误差的分析方法进行分析·用准确度评价方法来评价定性数据的属性误差利用遥感分类中常用的准确度评价方法来评价定性数据的属性误差命名数据:土地覆盖图土地利用图土壤图次序数据:坡度土壤侵蚀度·属性数据的不确定性的一个例子如土地利用类型某个土地利用类型中其他土地利用类型到底含有多大的比例而这种比例在空间上的分布是变化的因此在根据这类土地利用类型图进行统计得到的__一般会有偏差。PAGE。