6.2. 功能和架构

发布日期 : 2025-10-12 13:01:53 UTC      

访问量: 909 次浏览

地理信息门户是基于其元数据目录的。 以此为基础,地理信息门户给管理者、内容提供者(发布者)和用户提供了一系列的功能。 本节结合Esri GeoportalServer和ArcGIS Portal两个产品来介绍现代Geoportal的功能和特点。

Geoportal Server于2003年发布,目前是个免费的开源软件(下载网址是 http://sourceforge.net/projects/geoportal/ ),其用户主要是政府部门,被美国地理信息一站式门户和欧洲地理信息门户等项目所采用。 ArcGIS Portal是一个新的产品,它起源于ArcGIS Online( ArcGIS. com)云GIS的兀数据目录管理系统。 早期是一个针对ArcGIS用户社区的共享门户,能与ArcGIS系列产品方便地集成, 简单易用,强调对Web服务的支持,引起了一些部门的兴趣,被美国环境保护局、农业部等政府部门采用, ArcGIS Portal也于2011年成为一个正式产品。

6.2.1. 门户的功能 #

早期的地理信息门户主要是为了共享和下载数据。 目前,Web服务成为地理信息共享一种重要方式, 支持地理Web服务的査询和使用也成为地理信息门户的一个重要发展方向。 Web服务作为地理空间信息的共享方式具有很多优点。 对使用者来说,他们可以直接使用服务而不必购买软件载入数据,这样更为容易;对发布者来说, 他们可以控制Web服务的访问权限和使用量,能较好地保护知识产权;另外, Web服务可以实时或近实时地发布数据,能获得较好的时效性(详见第3.1节以及第7.1节)。

地理信息门户面向发布者、管理者和用户,为他们提供不同的功能

Fig. 6.4 地理信息门户面向发布者、管理者和用户,为他们提供不同的功能 #

  1. 发布者所需的功能

  • 创建账户:加人某些用户组;

  • 创建元数据:能创建遵从一定标准的元数据;

  • 发布元数据:能将元数据发布到门户的目录中;

  • 管理元数据:能列出自己发布的元数据,并对它们进行修改和删除;

  • 保护元数据:允许发布者指定他们的元数据是否公开给所有的用户,或者仅共享给某些特定的用户组;

  • 其他功能:对于那些已经有本单位、本地区或本专题地理信息门户的发布者, 应当提供注册功能,允许他们把自己的门户网站的信息注册到总门户中, 以实现自动的、批量的元数据发布。

  1. 管理者所需的功能

  • 管理账户:浏览账户列表、创建组群、管理用户权限、吊销和恢复账号;

  • 管理元数据:审阅发布者发布的元数据,能够进行批准、否决、修改和删除;

  • 其他功能:管理和检查元数据批量收割进程。

  1. 用户(信息的使用者)所需的功能

  • 创建账户;

  • 查询元数据:能根据关键字、内容类型或格式、空间范围和时间范围进行查询检索, 并能对查询结果按照相关性或者其他属性进行排序显示(图6.5);

  • 阅读元数据:能查看原始XML格式或转换过的、更易于阅读的HTML格式;

  • 下载数据:对可在线下载的数据,能够点击链接,下载数据;

  • 预览和使用Web服务:能够预览地图服务,能够把多个地图服务组合起来;

  • 其他功能:存储搜索条件,当有新的元数据满足查询条件时,能够接收电子邮件通知, 能够存储自己创建的地图。

地理信息门户软件产品不仅需要提供以上功能,而且要提供编程接口,以便开发者对其进行定制或配置, 以满足不同用户单位的具体需求(图6. 5)

ArcGIS Online门户网站支持地理信息资源的注册、查询、结果显示(左)和聚合应用, 另外还提供了编程接口(右),以支持二次开发

Fig. 6.5 ArcGIS Online门户网站支持地理信息资源的注册、查询、结果显示(左)和聚合应用, 另外还提供了编程接口(右),以支持二次开发 #

6.2.2. 元数据标准和元数据2.0 #

元数据,是“关于数据的数据”,是对实体数据的描述。 地理空间元数据指的是描述地理空间数据、Web服务或其他地理空间资源的信息。

  1. 元数据对于地理信息门户的重要性

地理空间元数据,通常以XML的格式存储, 它描述地理空间数据或者其他类型资源的“何人、何时、何地、做什么、为什么”等信息(FGDC ,2006)。 对象级元数据能够描述一个单一的数据实体, 而集合级元数据能够描述一系列的实体组合(Goodchild and Zhou,2003)。 地理空间元数据通常包含以下内容。

  • 数据识别:数据的标题、引文、摘要、目的和关键字;

  • 数据质量:数据的定位精度、数据完整性和一致性;

  • 空间参考:坐标系和空间范围;

  • 时间信息:数据采集的时间、数据内容的有效时间范围;

  • 分发信息:有关分发者的联系信息和如何获得数据的信息, 例如,信息资源的格式、下载数据或使用Web服务的URU

元数据在数据归档、评估、管理、发现、传输和分发中有重要的作用。 元数据对地理信息门户有以下的作用(! ^01^1676131.,2〇05;^111〇08161’0111&11(1213-tanova, 2008) 。

  • 数据发现:地理信息门户可以搜索元数据目录, 并返回匹配的记录以及关于如何访问和获取这些地理空间资源的信息。

  • 数据评估:一旦你发现了数据资源,你需要确定它与你的具体应用需求是否相符, 如它是否具有足够详细的空间分辨率和合格的质量来满足你项目的需求? 这些问题可以从元数据中找到答案。

  • 数据利用:元数据通常包括数据集文件大小、数据格式或Web服务类型、所需要的软件工具等, 它们可以帮助你使用这些资源。

  • 用户和数据发布者之间的简单协定:数据发布者可以在元数据中表明使用限制, 例如,一个Web服务每天可以接受的限量、版权归属要求和责任范围等, 可以帮助避免和解决可能的纠纷。

  1. 空间元数据标准

正如图书馆的图书目录卡需要有一致的栏目一样,元数据也需要具有统一的格式。 地理信息元数据的主要国际标准如下,一个地理信息门户网站往往支持一种或多种元数据标准(图6. 6)。

  • 都柏林核心元数据(Dublin Core):这是一个描述多领域信息资源的简单标准。 这个标准是1995年在美国俄亥俄州的都柏林市制定的,后被国际标准化组织(ISO)确立为ISO国际标准。 该标准的最大优点是简单性和易用性, 它主要由15个数据元素组成,包括标题、创建者、日期、主题、简介和权限等。 都柏林核心元数据是应用最广的元数据标准,但是由于其元素有限, 往往需要使用资源描述框架(RDF)对其进行扩展,以支持地理信息的描述。

  • FGDC数字地理空间元数据内容标准(CSDGM,简称FGDC元数据标准), 是由美国联邦数据委员会下设的元数据工作组于1992年起草的。 时任总统克林顿于1995年发布行政令,要求所有联邦机构使用这个标准。 CS-DGM被美国和很多国家广泛采用。该元数据标准有7个主要部分, 即标识信息、数据质量信息、空间数据组织信息、空间参考信息、实体和属性信息、分发信息、 元数据参考信息,共有400多个元素。需要注意的是, 目前,美国政府正在从FGDC元数据标准转向基于ISO地理元数据标准的北美地区专用标准。

  • ISO地理元数据标准:ISO/TC 211技术委员会制定和批准了一系列国际元数据标准。 ISO 19115(2003年)元数据规范包括14个部分和400多个数据元素; ISO 19139(2007年)元数据标准提供了一个通用的描述、验证和交换地理信息的规范。 ISO标准被很多国家采用,一些国家在ISO标准的基础上, 从ISO元数据标准中选择出来一些必要的元素和可选的元素,组合成自己的专业标准, 如美国、加拿大和墨西哥定义了基于ISO 19115和19119的北美地区专用标准。

Esri Geoportal Server是一个免费的开源地理信息门户网站软件产品。 它支持都柏林核心、FCDC及多种ISO元数据规范

Fig. 6.6 Esri Geoportal Server是一个免费的开源地理信息门户网站软件产品。 它支持都柏林核心、FCDC及多种ISO元数据规范 #

(3)元数据2.0

地理元数据标准大都比较复杂,往往需要填写60多项甚至100多项信息才能符合FGDC和ISO的最低标准。 虽然有些软件,如ArcGIS桌面,可以帮助用户去创建标准的元数据, 但是创建标准的元数据仍然是一项繁重的任务,困扰着许多数据发布者,也影响了地理信息的共享。

在Web 2.0时代,自下而上的信息流动已经是一种普遍现象。 例如, 人们很积极地在Youtube网站、Flicki网站及其他网站上发布自己拍摄的视频和照片,这很大程度上得益于这些共享网站所采用的极为简单的元数据。 如果这些网站要求用户填写多达几十项到上百项的元数据信息才能发布视频和照片, 这将阻碍绝大部分人的参与和共享。 这种现象给地理信息的共享一个启示,那就是,为了鼓励和方便人们共享地理信息, 地理信息元数据规范应当简化 (Hogeweg,2009b) 。

Goodchild等(2008)提出了“地理元数据2. 0”的概念,认为新的地理元数据应以用户为中心,以简单实用为主要目标,便于贡献者创建和用户理解。 最近流行的标签(tag)和用户评论(comment)代表了元数据2. 0的发展方向 (图6.7)。

ArcGISOnline门户网站使用“元数据2.0”风格的元数据, 发布者只需要提供少量信息(如左图所示),快速发布内容, 发布者也可以编辑元数据(如右图所示),添加更多详细信息,并支持用户对元数据进行评论

Fig. 6.7 ArcGISOnline门户网站使用“元数据2.0”风格的元数据, 发布者只需要提供少量信息(如左图所示),快速发布内容, 发布者也可以编辑元数据(如右图所示),添加更多详细信息,并支持用户对元数据进行评论 #

  • 标签:很多视频、照片和博客网站都让发布者自由填写一些关键词, 可以是关于内容、主题、作者、时间和地点等的标签。从专业人士的角度讲, 这些元数据往往是非正式的,不完整的。 然而,这些标签可以让用户快速地评估这个资源是否是自己需要的。

  • 用户评论或评分(rating):例如,在线商店提供用户对产品的评论, 这些评论从用户所关心的角度评价产品的优缺点, 对于其他用户来说是一种很独特的、具有实用价值的元数据。

6.2.3. 分布式与集中式元数据目录架构 #

大型的地理信息门户网站,如国家和区域级的,通常涉及许多分中心,如下级单位或合作伙伴的门户网站。 如何与这些分中心整合,这涉及分布式或集中式元数据目录的架构。

  1. 分布式数据目录

采用分布式数据目录的地理信息门户需要执行分布式的搜索,即分别搜索多个分目录,以便得到完整的结果。 典型的例子是美国90年代所开发的国家地理空间数据交换仓库(NGDC ), 它有几百个联邦和州政府、大学以及国外的分中心节点。 NGDC采用了分布式目录的架构(图6. 8),每个参与者有自己的元数据目录和服务器,称为“节点”,这些节点都被注册到NGDC的服务器中。当用户在NGDC的门户网站上查询时,需要选择一个或多个节点,然后服务器把用户的查询条件发给被选择的节点,由这些节点分别执行查询,查询结果在NGDC的服务器上合并后展示给用户。

分布式目录的地理信息门户,如美国90年代的国家地理空间数据交换仓库, 需要搜索多个分目录,以便得到完整的结果

Fig. 6.8 分布式目录的地理信息门户,如美国90年代的国家地理空间数据交换仓库, 需要搜索多个分目录,以便得到完整的结果 #

NGDC是空间数据基础设施建设中的一个知名的成功案例,它曾是美国地理数据的最主要的查询门户和分发机制。 尽管很成功,但它也具有一些分布式目录的局限,包括

  • 难以进行全局搜索:用户必须在几百个节点中选择有限的几个进行查询, 那些没有被选中的节点往往也有满足用户需要的数据。

  • 性能上的限制:当多个节点被选中进行查询时,它要等到最慢的那个节点做出回应后, 才将这些结果合并显示。

  • 难以对结果进行统一的排序:不同的节点有不同的匹配和排序算法, 在一个节点中得分高的结果可能在另一个节点中得分较低。当来自不同节点的结果被合并时, 难以保持排序指标的一致性。

  • 对数据提供者要求高:每个数据提供单位需要有专业人员来搭建和管理分节点。

  1. 集中式数据目录

随着信息技术的发展,数据库存储大量元数据和进行全文检索的性能大大提高, 大型集中式数据目录正变得普遍和流行起来。 对于具有多个分中心的大型地理信息门户,如果每个单位已经有了自己的目录, 总门户网站可以采用自动收割(类似搜索引擎的网络爬虫)的方式,按照适当的时间频率,如每周一次或每月一次, 把分中心的元数据采集和存储到总中心,如美国地理信息一站式门户就支持这种方法(图6.9)。

Esri GeoportalServer提供元数据收割功能, 能自动、定期地把分中心的元数据收割和发布到总中心的元数据目录中。 用户的数据搜索在总中心的目录数据库中执行,而不是搜索每个分中心的目录

Fig. 6.9 Esri GeoportalServer提供元数据收割功能, 能自动、定期地把分中心的元数据收割和发布到总中心的元数据目录中。 用户的数据搜索在总中心的目录数据库中执行,而不是搜索每个分中心的目录 #

集中式数据目录克服了分布式的局限,具有以下优点。

  • 容易进行全局搜索:每次搜索是在总中心的目录中,对所有的元数据记录进行搜索, 用户并不需要选择和舍弃部分节点。

  • 容易对结果进行统一排序:搜索结果是从一个数据库中获得, 并很容易地按照相关性或者其他属性进行排序。

  • 高性能:搜索仅在总中心的数据库中进行,不需等待分中心完成查询。 尽管中心式目录可能具有庞大的数据量,但只要系统进行合适的设计和优化,仍然可以实现高的性能。

  • 对数据提供者的技术要求比较低:数据提供者不需要有自己的地理信息门户。 他们的元数据可以放在一个Web上的文件夹里,就可以被收割到总中心的目录中。

美国地理信息一站式门户是一个集中式目录的代表。 它有上百个分中心,如美国人口普查局、地质调查局、国家海洋与大气管理局以及国家公园管理局, 都有成千上万的元数据记录。 若他们需要一条一条地发布自己的元数据,那将是极为繁琐和低效的。 基于ArcGIS Geoportal Server,该门户允许发布者注册他们的分中心(图6. 10),并能自动、定期地连接到这些分中心的服务器,把它们的元数据采集过来。

美国地理信息一站式门户允许发布者注册自己的分中心, 如协议类型、连接网址和收割频率等。(致谢:data,gov)

Fig. 6.10 美国地理信息一站式门户允许发布者注册自己的分中心, 如协议类型、连接网址和收割频率等。(致谢:data,gov) #

6.2.4. 案例介绍 #

地理信息门户有不同的类型。 按级别可分为部门的、地方的、国家的或者全球的;按主题可以分为综合性或专业性的;按格式可以有着重在线数据下载的、着重Web网络服务的等。 不同类型的门户有不同的特征和不同的设计理念。 例如,跨部门的政府门户网站往往比较强调国家和国际标准, 如ISO元数据标准;而一个单位或企业内部的门户网站更强调便利性,对元数据标准的要求则相对次要。 Esri Geoportal Server和ArcGIS Portal是两个有代表性的地理信息门户产品,两者都提供编程接口、支持二次开发;两者有些不同的特点,适用于不同的需求。 鉴于两个产品都在迅速发展,功能在不断改进,本节对它们作简要介绍。

  1. Esri Geoportal Server

Esri Geoportal Server目前是个免费的开源软件(下载网址是http ^/source-forge, net/projects/geoportal/) ,其用户主要是政府部门,被美国地理信息一站式 门户和欧洲地理信息门户等项目所采用。其特点是

  • 强调规范:支持都柏林核心, FGDC,ISO 19115、19119、19139等元数据规范以及欧洲和北美等专用标准(图6. 5), 也包括对OGC 多种Web资源格式 如WMS等的支持。

  • 便于实现“一站式”门户,支持分布式目录和中心式目录,发布者可以注册自己的分中心, 指定收割频率等。

  1. ArcGIS Portal

ArcGIS Portal 起源于 ArcGIS Online( ArcGIS. com)云 GIS 的元数据目录管理系统。 它具有以下特点:

  • 简单易用:使用“元数据2.0”风格的元数据,发布者只需要填人标题、标签(关键词)、描述和URL, 就可快速发布地理资源。查询方式简单,查询结果易读、易预览、易叠加。用户可以评论元数据, 以此与元数据的拥有者和其 他用户进行交流。

  • 强调对Web服务等Web资源的支持:支持ArcGIS Server的Web服务、OGC WMS标准的服务、 KML以及用户创建的Web应用和移动应用等的注册、查询和使用。 其地图浏览器支持对这些Web资源的预览、聚合、定制显示符号和信息窗口, 并提供模板以便用户创建Web应用。

  • 与ArcGIS系列产品包括ArcGIS. com云GIS的无缝集成: ArcGIS Desktop可以直接把Web服务发布和注册到ArcGIS Portal中。 ArcGIS Portal中的地理资源可供ArcGIS系列产品的客户端 (如桌面、智能手机和平板电脑版、ArcGIS Explorer、ArcGIS 的 JavaScript/Flex/Silverlight接口)进行查询、 显示等方法调用。用户可以把CSV、TXT、GPX (GPSExchange)、 Esrishapefile(压缩的zip文件)、ArcGIS图层文件(lyr)、 地图包(mpk)和图层包Upk)等直接通过浏览器上传到ArcGIS.com云GIS之中, 供用户下载、浏 览和聚合使用(详见第7章)。

  • 安全管理:发布者可以加入已有的组、建立新组、邀请其他用户参加自己创建的组、 批准或拒绝想要加人自己组的申请者。数据发布者可以选定自己发布的每一条资源与哪个组共享, 或是共享给所有的用户(图6. 11)。

得益于以上特点,ArcGIS Portal被一些政府部门采用以搭建政府的地理信息门户网站。 这些政府应用也对它提出了新的要求, 特别是在对标准的支持和对元数据收割的支持上,ArcGIS Portal在这方面进行了改进。 它目前可以支持任何OGC Web服务元数据的发布,能支持WMS和KML的在线显示和聚合。 通过整合Esri Geoportal Server元数据编辑器, 可以支持FGDC和ISO等标准的元数据编辑、发布和查询;通过整合Geopartal Server的元数据收割功能, 能自动采集分中心的兀数据。 这些进展和扩充方向已经在美国geo. data,gov和geo¬platform, gov 等项 目中显示出来 。

ArcGIS Portal允许数据发布者选定自己发布的每一条资源是共享给所有的用户,还是只共享给某些用户组

Fig. 6.11 ArcGIS Portal允许数据发布者选定自己发布的每一条资源是共享给所有的用户,还是只共享给某些用户组 #

《地理信息系统原理、技术与方法》  97

最近几年来,地理信息系统无论是在理论上还是应用上都处在一个飞速发展的阶段。 GIS被应用于多个领域的建模和决策支持,如城市管理、区划、环境整治等等,地理信息成为信息时代重要的组成部分之一; “数字地球”概念的提出,更进一步推动了作为其技术支撑的GIS的发展。 与此同时,一些学者致力于相关的理论研究,如空间感知、空间数据误差、空间关系的形式化等等。 这恰好说明了地理信息系统作为应用技术和学科的两个方面,并且这两个方面构成了相互促进的发展过程。