克里格插值法——这个预测很强

kriging prediction standard error1

用克里格塑造一个传奇的预测模型

是时候给自己塑造一个年龄预测模型了。预测很强 克里格.

在你创建一个良好的预测表面的过程中,你需要先了解一些关键的概念,然后才能进入克里格。

这些概念是什么?

阅读以下内容获取 step-by-step 克里格的核心知识。

让我们从一些基础知识开始

要真正理解克里格,你必须知道 插值 是。和所有的插值一样,我们在预测其他位置的未知值。

用插值法 inverse distance weighting 你在做预测,却没有说你有多确定。

下面是一个例子:

我们通过取最近三个输入点(12、10和10的值)的反加权距离来预测紫色点。根据距离,我们计算每个输入点的距离,得到11.1的值。

((12/350) + (10/750) + (10/850)) / ((1/350) + (1/750) + (1/850)) = 11.1

IDW Power 1

这正是 确定性的 插值工作。简单地说,它使用一个预定义的函数和 这就是它.

但它不能告诉你你有多确定。

什么是克里格插值?

如果天气预报员预报说明天要下雨,你有多确定会下雨?

换言之:

克里格不仅告诉你具体地点的降雨量,还会告诉您在特定位置**有多少降雨**的**概率**。

您可以使用输入数据构建一个带有半变异函数的数学函数,创建一个预测曲面,然后通过交叉验证验证您的模型。

地质统计学不仅提供了一个最佳的预测面,它还提供了一个置信度的度量,来衡量预测的真实性。

kriging prediction standard error2

同时,克里格可以生成预测曲面和曲面,这些曲面和曲面描述模型预测的效果:

预测 :这个曲面直接预测您正在克里格化的变量的值。
预测误差 :如果用更高的错误标准描述标准错误,则输入数据不多。
概率 :概率曲面在超过阈值时突出显示。
分位数 :此图面以第99个百分点表示最佳或最差情况。

克里格的关键是半变异函数

克里格依赖于 semi-variogram . 简单地说,半变异函数可以量化 autocorrelation 因为它根据距离来绘制所有数据对的方差。

**更接近的事物**可能更相关,并且具有较小的半方差。尽管**远处的事物**相关性较低,并且具有较高的半方差。

但在一定距离 (范围) 自相关变得独立。当这种变化水平降低时,它被称为 (窗台) . 这意味着你的数据点之间不再有任何空间自相关或关系。这个概念是 Tobler’s First Law of Geography .

variogram nugget range sill

同样,这里的目的是拟合一个曲面,例如一个模拟整体大规模趋势的多项式。然后,围绕这个趋势,我们有克里格出现的残差的可变性。

根据半变异函数的结果,可以选择球形、圆形、指数、高斯或线性的半变异函数。或者,如果你能为一个数学模型做一个理性的辩护,那么你就选一个。

kriging models

阅读更多: What is a Semi-Variogram: Nugget, Range and Sill

在你开始之前,检查你的数据

在开始进行克里格之前,您的数据需要先满足此条件,然后再进行**普通克里格**操作。

如果数据符合某些标准,克里格是最佳的插值技术。但是如果它们不符合这个标准,你可以按摩它或者选择一个完全不同的插值技术。

  • 您的数据需要 正态分布

  • 数据需要 固定的

  • 您的数据不能有任何 趋势

以下步骤是检查数据是否符合此条件的方法。首先,我们建议画出你的观点,并从低到高进行象征。在我们的示例中,我们使用在农田中采集的土壤水分样本:

Kriging Soil Sample Points

假设1你的数据呈正态分布

当我们不探索 空间 在这个测试中,我们只检查值是否是完全正态分布的。换句话说,您的数据值是否符合钟形曲线形状?

探索这一点的方法之一是使用 直方图 . 在ArcGIS中,单击地理统计分析>探索数据>直方图。

此时,您可以检查柱状图中是否有任何异常值,以及它看起来有多像钟形曲线。在我们的例子中,它看起来有一个相当好的正态分布。

kriging histogram

或者,您可以使用 正常QQ图 . 一个普通的QQ图比较了你的数据和正态分布数据的排列方式。如果所有点都具有完全正态分布,则所有点都将落在45°线上。在我们的例子中,数据遵循直线。

kriging normal qq plot

如果你的数据没有正态分布呢?

在这种情况下,您必须应用转换,如对数或弧sin,直到它变为正常。你可以做一个正常的分数转换,而不是选择你自己的转换,这对你来说是一个很大的工作。正态分数转换非常强大,现在它是默认的方法 简单克里格 在ArcGIS中。我们将在下面更详细地解释这一点。

假设2你的数据是固定的

你的数据必须是固定的,这意味着什么?

这意味着局部变化在地图的不同区域不会改变。例如,在不同位置相距5米的2个数据点 相似差异 以你的测量值。在地图的不同区域,方差是相当恒定的。克立格法不适用于突变和断线。

您可以使用`voronoi map <../ index.html?p = 12107>`__来检查数据的平稳性,该熵以熵(邻居之间的差异)或标准差表示,并寻找随机性。在ArcGIS中,单击地统计分析>浏览数据> Voronoi地图。

阅读更多: How to Sketch a Voronoi Diagram with Thiessen Polygons

在我们的例子中,我们确实看到了少量的集群。总的来说,对于熵和标准偏差,voronoi图显示数据集看起来足够稳定。

kriging voronoi entropy

如果你的数据不是固定的,你会怎么做?

经验贝叶斯克里格法 可以单独处理局部差异。EBK在不同的领域将克里格作为一个独立的基础过程来执行,而不是在整体上相似。它仍然执行克里格,但它是在本地完成的。

ArcGIS中的克里格实例

浏览完以上标准的数据后,可以单击地理统计分析>地理统计向导。

讽刺地说,现在的乐趣真正开始了。

步骤1选择克里格/共克里格

现在你有了 地统计分析向导 开,克里格是在地质统计学方法。前面提到过,这是因为你用半变异函数建立了你的最佳预测面,并且可以估计一个置信度的度量,来判断预测是真的可能性有多大。

注意,如果您选择一个输入,它只是 克里格。但是当你添加第二个变量时,它突然变成**协同克里格**。

如果有2个或更多的变量与山区降水量的变化有关,那么可以将高程数据作为 协变量 降雨量。在这种情况下,您可以使用辅助信息改进预测。

geostatistical wizard

步骤2选择克里格类型

现在,让我们 后退一步 一秒钟来理解所有的选择意味着什么。这一步有相当多的内容需要吸收。

普通克里格 是ArcGIS 10.0中的默认值。现在由于正态分数变换, 简单克里格 是默认值。特别是,简单的克里格使用正态分数转换将数据转换为标准正态分布。

如前所述,这是进行克里格化的基本标准之一。对于基本用户,您的最佳选择是采用简单的克里格方法。但其他更复杂的 克里格类型 存在:

通用克里格 结合趋势面分析(漂移)和普通克里格的趋势会计
指标克里格 使用二进制数据(0和1)进行普通克里格运算,如城市和非城市单元。
概率克里格 使用二进制数据(类似于指标克里格)并估计一系列截止点的未知点。

最后,您可以在此步骤中手动设置转换类型和趋势移除。例如,如果您希望将转换更改为日志,则可以在此时进行更改。

kriging type

步骤3使用半变异函数的模型数据

在这个例子中,我们使用原始克里格进行演示。地理统计向导生成一个带有蓝色十字的半变差函数,显示每对点的平均变化。

滞后大小是将成对位置分组到其中的距离类的大小。根据经验法则,可以将滞后大小乘以滞后数,使其等于所有点之间最大距离的一半。如果您的点不是聚集的,您可以运行“平均最近邻居”工具,它告诉您点之间的平均距离。

ArcMap已将功能添加到 优化所有这些参数 为你。单击“优化”按钮时,它将为每个参数找到导致最小均方根误差的值。对于用户来说,测试每个场景都是一个反复的尝试。最后,通常最好使用软件认为最好的半变异函数模型。

对于我们的研究领域,半变异函数是这样的:

kriging semi-variogram

步骤4用克里格权重映射模型

当您对所安装的半变异函数满意后,向导将提供一个具有更多参数的预览曲面来自定义输出。克里格所做的是用最近邻点的加权平均值预测每个位置的响应。但首先,您必须设置要在您的 搜索半径 .

尽管有很多关于克里格中半变异函数有多重要的讨论,但这一步对地图的输出影响很大。如果你改变这些参数中的任何一个,它真的可以改变表面的外观和感觉。

如果选择其中一个切片 扇形 这样可以确保每个切片中都包含要估计的点。例如,如果使用四片饼图并将相邻饼图设置为5,则每个饼图将使用5个点(总共20个)进行局部估计。由于没有完美的集合公式,所以关键是要来回移动并检查预测值,以了解您对输出的感觉。

Searching Neighborhood

步骤5检查交叉验证结果

这个 cross-validation 克里格的步骤将获取一个输入数据点并将其从数据集中抛出。使用所有剩余的点,它将预测运行回该位置。同样,您知道真正的值是什么,这个过程使用所有剩余的值来预测这个值。

对于交叉验证,它将遍历所有输入点,直到完成为止。然后,它创建 残差 比较实际值和模型的预测值。这张表显示的是您的模型有多强大。

那么真值和预测值有多接近呢?换句话说,您的模型与数据的匹配程度如何?要想全面了解这些,请检查 root-mean-square standardized ,因为它应该接近1。此外, root mean square error 应该尽可能小。

kriging results

动态地质统计层

由于输出是一个地质统计层,所以它是动态的,这意味着您可以将其输出类型更改为预测、预测错误、概率或分位数。或者,如果不喜欢优化的输出,您甚至可以返回到地质统计层并更改参数。

克里格有一门科学和艺术。

这不仅是你如何从一个半变异函数中选择你的模型,而且是你如何设置垃圾箱的数量和其他设置。这是 克里格艺术 .

当您表示克里格曲面时,例如选择间隔数,它会对结果产生不同的影响。当更多的类提供更多的细节时, data classification 方法(如分位数或等间隔)以不同的方式排列数据。

kriging prediction standard error

克里格的预测很强。

空间预测涉及到随机性的某些组成部分。在对数据集进行推断时,这对于地理统计学至关重要。

你的克里格重量是根据变异函数来估计的。更具体地说,它是从您选择的模型派生出来的。估计曲面的质量反映在权重的质量中。你需要一个能给出无偏预测和最小方差的权重。

换句话说,克里格找到了空间模式。然后,它根据该空间模式预测未知值。通过这些预测,克里格产生了误差或不确定性的度量。这意味着您可以估计预测面上的置信度,它们是真实的,而不是因为随机机会。

因为你不仅要定制你的数学函数来构建一个,而且你还要使用统计分析的力量——即半变异函数。

克里格法是一种地质统计学方法,在给定一组测量值的情况下,预测一个地理区域的值。它被用于采矿、土壤、地质和环境科学。

没有一种千篇一律的方法适用于每个人。因为它与您的数据相关,所以只有您可以决定这些设置是什么以及如何最好地生成预测图面。