GIS 中重新映射值和过滤


发布日期 : 2022-03-09 02:22:15 UTC

访问量: 165 次浏览

通常,有些数据很大,其中一部分是较好的信息,但用处甚微, 有些只需要朝着正确的方向轻推。很多时候, 我们有需要更精细分类或重新映射的值的信息。 如果您访问地理信息系统 (GIS) 软件的帮助页面, 会发现它们具有执行统计重新映射的工具或建议一种方法, 该方法涉及将信息作为字段硬编码到属性中。当与客户合作时, 他不断改变对功能应如何分类的想法,这将会导致一个大问题。

在企业中,产品所有者、数据科学家、 开发人员甚至解决方案架构师通常都对如何对数据进行分类 以使其符合计划或其他地方使用的其他类别有发言权。 即使您自己工作,可能也会发现使用可以多次更改 而不影响核心数据的单独文件效果更好。 最好的方法是创建一个查找表。

为什么要创建查找表?这不是创造更多信息吗?通过创建查找表, 可以在使用许多不同的地理空间格式时轻松地对其进行操作和调整, 同时最大限度地减少对核心数据的干扰。同样在大多数 GIS 中, 加入 CSV 文件比继续输入并再次编辑更容易。

创建查找表就像打开一个空白 CSV 文件一样简单, 添加两个字段(“之前”字段和“分类”字段), 然后将表中的当前值复制并粘贴到之前的字段中, 在后面的字段中,输入分类值。

![](https://www.osgeo.cn/static/upload/4d/4dedc770-9f4f-11ec-bb95-00163e0533f4_m.jpg)

如何使用查找取决于您使用的系统。 如果使用 geopackage、shapefile 或 Esri 地理数据库, 则可以使用 GIS 中的连接功能来组合数据。连接是虚拟的, 可以编辑引用的 CSV 文件。当所有更改完成后, 只需导出数据,更改将设置到新数据中。

![](https://www.osgeo.cn/static/upload/62/621fd166-9f4f-11ec-83a4-00163e0533f4_m.jpg)
原始数据和为对城镇规模进行分类而创建的 CSV;点击图片可放大

示例:使用外部 CSV 对城镇规模进行分类,根据名称加入。 上面显示了原始数据和为对城镇规模进行分类而创建的 CSV。 下面显示了如何在 QGIS 中连接数据和结果表。

![](https://www.osgeo.cn/static/upload/70/70f79dc2-9f4f-11ec-af54-00163e0533f4_m.jpg)
在 QGIS 上加入数据;点击图片可放大

更高效的程序是 PostGIS;可在 GIS 中使用上述方法, 也可以仅使用 QGIS 将 CSV 文件拖放到数据库中, 创建“视图”。对于那些不是结构化查询语言 (SQL) 用户的人来说,视图实际上就是这样: 从表中选择信息并使用其中的视图。很棒的是,可将其用作数据。 因此,PostGIS 的最佳实践是创建原始数据的视图, 根据之前的字段将其连接到新表中。

我们经常使用来自权威机构和第三方数据提供商的查找表, 但很少自己创建,尽管在实践中,当您考虑更广泛的业务需求时, 事实证明它们可能是一种宝贵的资源。

创建查找表的一项经济利益是转售价值。 通常有一些行业专业知识可以添加到其他地方无法获得的数据中。 通过创建查找表,您可以转售该表而无需提供全部数据。 通过开放英国唯一财产参考编号 (UPRN) 和地形标识符 (TOID), 这一点变得更加容易。这允许提供可以链接到地理数据的几何形状的信息表。 英国政府提供的当前 EPC 或能源绩效证书数据就是一个例子。 这包含英国每个经过能源审查的家庭和企业的能源信息。 目前,它约占英国建筑物的 80%。 数据以一组具有 UPRN 字段的 CSV 文件形式提供。 这可以与使用开放产品或其专有产品的军械测量数据相匹配, 以创建具有几何形状的数据。