访问量: 268 次浏览
近年来,在使用扫描图像读取数据的自动化方法方面取得了重大进展。 这种方法有助于自动索引文本,以便它们可以搜索和机器可读。 然而,当涉及到地图数据时,到目前为止只有有限的工作。
新方法不仅可以检测位置名称并使其可搜索, 而且现在可以恢复现代地图中大部分缺失的数据。
makKurator 项目是一个有助于使旧地图提供可索引和可读的文本和可视数据的新项目。 该项目一直在使用将地图标签与给定空间相关联的深度学习度量方法。
读取地图的自动化方法面临的一项挑战是确定位置标签, 包括具有多个单词名称的位置标签,并将给定文本与特定位置相关联。 通过确定给定地点与其标签之间的适当距离度量,包括术语之间的距离, 以便清楚地表明这些术语是相关的,可以将文本分类到所指示的适当位置。
在这种新方法中,视觉预测器分割给定区域并在文本项和 位置的边界区域之间建立联系。关键输出包括一个概率图, 它使用文本标签对给定的地图像素进行分类, 以便可以在一定程度上建立联系。
新方法的一个主要好处是它使地图特征和数据, 包括那些由文本指示的,可以在地图内和地图之间进行搜索, 从而可以在数据之间建立联系。例如, 如果想在旧地图上搜索 1000 英尺以上的高度, 那么仅使用图像作为输入数据就可以实现, 其中高度将从视觉数据和标签中自动提取。
这项工作最近使研究人员与 Rumsey Map Collection 之间的 合作成为可能,这将使地理参考地图能够通过文本进行搜索。 这使其成为可以使用基于文本的搜索进行搜索的最大地图存储库, 可以有效地使旧地图在搜索和识别感兴趣的地方时 与 OpenStreetMap 一样可用。
最近的方法还支持深度学习方法, 例如使用具有数据增强功能的卷积神经网络 (CNN), 只需使用现有的地理形状位置就可以更好地分类和了解地理。
例如,通过地图提供国家或大陆的形状, 可以根据地理名称对这些地理特征进行分类。 这有助于限制训练数据需求的数量, 使研究人员更容易创建可以在地图上创建自动位置检测的方法, 包括仅扫描过的旧地图。
近年来,学者们在利用历史地图进行各种特征识别和提取方面也取得了进展。 例如,了解旧道路的位置对于重建一个地区的地点和历史数据可能很重要。
使用旧地图,研究人员已经能够使用完全卷积网络从旧地图中提取旧道路和小径, 这些网络使用带注释的道路数据进行预训练,用于训练数据。 然后,这些模型可以从不同时期的地图中识别出不同类型的道路。
其他工作还实现了旧地图上给定符号的自动识别和分类, 以便它们可以数字化并用于更现代的地图绘制。 与道路识别和地图增强工作类似, 使用 CNN 变体的深度学习使符号能够更容易地被识别, 从而可以对它们进行分类以供使用。
我们越来越多地看到学者们在寻找新的方法来自动对关键地图特征进行分类, 同时还利用地图中的文本数据,以便文本和其他信息可以被索引和搜索。 这现在使旧地图成为更强大的资源, 因为它们变得与使用类似方法的现代数字地图一样有效。
通过利用深度学习,研究人员可以从历史地图中提取大量新数据, 包括文本和视觉数据, 将我们的现代世界与发生变化或现代地图中缺少信息的景观和地区联系起来。