访问量: 917 次浏览

什么是地理人工智能?
GeoAI 是地理空间人工智能, 它是一种用于模拟未来结果的人工智能或机器学习。 它运行在 GIS 技术(一种地理信息系统)上, 并且经常利用统计建模、计算机视觉和模拟工具。 使用 GeoAI 技术的公司可能对市场规划、选址、价格优化、产品选择或资产维护感兴趣, 他们会分析各种数据,内容如下:
场景可以非常简单, 例如,如果在某个地方设立一个急诊诊所, 那么设想可以服务多少病人? 临近的这段铁轨应该什么时候安排维修? 它们也可能很复杂, 如果在这个市场上开两家店, 可以期望获得多少收入?在全国范围内开设快餐店的正确地理位置是什么? 如今,我们拥有了计算能力, GIS 拥有模拟这些场景的地理空间功能, 这是预测未来的有力方式。
一旦业务负责人在 GIS 中模拟结果, 那么可能会建造一家新商店或关闭一家现有商店, 对管道进行预防性维护以管理风险, 或改变产品在特定市场的定价策略。
位置数据作为 GeoAI 的引擎
对于一些商业领袖来说, 地理在 GeoAI 中有什么作用呢? 位置是许多决策的基本要素, 商店开在哪里,管道或电力线需要维护的地方,货物的分配方式。 如果您在不考虑位置因素的情况下查看数据, 那么将无法理解问题或机会的所有重要方面。
技术趋势 - 合成数据
合成数据是最新的 AI 流行语, 一种创建虚拟信息来训练 AI 模型的方法。 它并非没有缺点,合成数据的有用程度取决于用来创建它的参数, 因此它可能不擅长模拟意外情况。
人工智能 (AI) 技术的最新进展、高质量数据的大规模可用性, 以及有效处理这些数据硬件和软件的进步, 正在将一系列领域从计算机视觉和自然语言处理转变为自动驾驶和医疗保健。 例如,高分辨率地理数据和高性能计算技术的可用性以及深度学习, 推动了快速准确的目标检测方面的进步。 GeoAI 工作的最新示例包括地形特征的检测和密集分布的建筑物足迹, 从扫描的历史地图中提取信息, 语义分类(例如 LiDAR 点云), 空间插值的新方法, 以及交通预测的进展。 同样,机器学习和自然语言处理正在促进从非结构化(文本)数据中提取地理信息, 例如新闻文章和维基百科以及多个地名词典中自然特征的匹配。
与此同时, 语义网技术、本体论和关联数据, 正被用于改进地理信息检索和构建高级地理知识图谱以进行地理丰富以及空间数据基础设施的语义支持服务。 通过结合交通摄像头和其他传感器收集的实时信息, 多种技术的结合有助于将自动驾驶汽车与智能交通系统相结合。 正如这些示例所展示的, 快速进展并不孤立于特定的下游任务或数据类型。 相反,我们正在观察人工智能技术如何渗透到科学的许多方面和活动中。

人工智能技术在地理学和地球科学中的应用并不新鲜。 1997 年就有关于地理人工智能的突出示例。 甚至在此之前, 一些优秀的专家已讨论人工智能在 80 年代解决地理问题中的潜在作用。 自早期以来发生的变化不能仅仅归因于新颖的计算架构和先进的方法, 例如生成对抗网络等。
人工智能技术当前的成功同样是由数据创建和共享的新文化引起的。 在过去十年中收集和管理的数据呈指数级增长, 并不局限于任何特定类型或媒介, 而是多模态和高度异构的。 例如,由于技术限制和隐私问题, 社会感知作为人类通过智能手机等近身设备主动或被动发出的数据痕迹的使用在 80 年代是不可想象的。 虽然遥感等领域自早期以来一直是(大)数据密集型的, 但非常高分辨率的仪器不仅提供了更多的数据, 而且大大增加了可以区分的类别的数量, 例如单个汽车和碎片。 同样,数百万接近实时的汽车轨迹、图像、评论、推荐、新闻、学术文献和各种传感器观测的(公开)可用性改变了那些依赖大量(高质量)标记数据的人工智能技术游戏规则。
总之,GeoAI 作为空间数据科学的一个子领域, 利用技术和数据文化的进步来支持创建更智能的地理信息以及用于各种下游任务的方法、系统和服务。 这些包括图像分类、对象检测、场景分割、模拟和插值、链接预测、(基于自然语言的)检索和问答、即时数据集成、地理丰富等。
GeoAI 研究也将有助于更普遍地问答和智能数字助理, 这是因为空间数据的可用性和重要性不断增加, 数字助理也正在迅速成为我们日常生活的一部分, 使得这些系统能够访问过多的上下文信息, 并能够回答更个性化的问题。 例如,未来的用户可能不会询问埃菲尔铁塔的建造日期或开车到机场需要多长时间, 而是询问他们父母可能去过的度假地点, 例如一本关于他们目前驾车经过地区的有声读物, 或者只是一家位于市中心但安静的酒店。 这些和类似的问题需要一个额外的步骤, 即识别用户的位置、与其他特征的距离、拓扑关系的推理、理解模糊的认知区域等。 因此,当前的方法, 例如那些直接利用句子嵌入模型的方法或其他形式的计算文本相似度, 可能达不到要求。
机器学习和人工智能方法在通常被称为社会感知的领域也发挥着重要作用。 它可以定义为使用(用户生成的)数字内容来更好地了解人类动态。 社会感知已应用于从识别人类移动模式在内的一系列任务, 并探索社交网络结构, 以解决城市规划问题。 社会感知的过程涉及语义签名的创建, 从人们的数字生活与其身体活动互动时留下的数字痕迹中提取的多维数据签名(即空间、时间和主题特征)。 这种数字痕迹越来越多地通过传感器丰富的移动和物联网设备产生和收集。 当今移动设备上可用的传感器过多, 这意味着生成的数据不仅包括与个人位置有关的信息, 还包括环境温度、亮度、噪音水平等属性。 通过这些设备收集的大量数据, 以及实际内容的异质性, 使这些数据特别适合通过 GeoAI 中的新技术进行分析。
推进 GeoAI 研究需要高质量的地理空间数据集。 许多 AI 模型,尤其是深度神经网络, 需要在大量标记良好的训练数据上进行训练。 机器学习社区早就认识到模型的质量遵循“垃圾进,垃圾出”的原则, 即经过训练的模型与训练数据的质量一样好。 从这个角度来看,数据不再仅仅是计算工具可以挖掘的资源, 而是正在成为工具的一部分。 高质量的数据集, 例如 ImageNet , 已成为开发新人工智能方法的关键推动因素。 地理领域有幸拥有许多公共领域的高质量数据集, 例如美国地质调查局的国家土地覆盖数据集(NLCD)和美国人口普查局的美国社区调查(ACS)数据, 更不用说许多可用的遥感图像、全球数字高程模型 (DEM) 和国家水文数据集 (NHD)。 随着数据文化的改变, 越来越多的公司也开始分享他们的地理空间数据, 例如微软的美国建筑足迹数据,Yelp 的兴趣点(POI)数据, 优步和滴滴的车辆轨迹数据。 这些和其他共享的地理空间数据集可以成为开发未来 GeoAI 模型的有用资源。