访问量: 407 次浏览

回归模型中的一些术语:
回归公式:
y = β0 + (β1 × x1 ) + (β2 × x2 ) + … + (βn × xn ) + ε
让我们通过构建栖息地适宜性指数 (HSI),
也称为资源选择函数 (RSF)来实施 ArcGIS 回归工具。
利用308个沼泽鹿的 GPS 定位数据,
研究沼泽鹿与景观的关系。
需要注意的是:这是一个带有虚构数据的假设场景。
需要我们回答的问题如下:
生境适宜性指数:HSI 是一个数值指数,
代表特定生境对选定物种的支持能力。
为什么要创建 HSI?
土地资源经理使用 HSI 来对景观做出更好的决策。
如果 HSI 显示沼泽鹿更喜欢湿地栖息地类型,
土地资源管理者则可以保护这些类型的栖息地。
土地资源管理者可以禁止基础设施的开发,
因 HSI 显示了特定栖息地支持沼泽鹿的能力。
我们可以外推 HSI 来预测其他地区的沼泽鹿。
沼泽鹿的解释变量是什么?
这可能是回归建模最困难的部分。
我们需要调查沼泽鹿的潜在栖息地类型。
这就是专家建议派上用场之处。
以下是研究的发现:

沼泽鹿生活在漫滩、草原和潮湿森林等沼泽栖息地,
它们更喜欢有大量覆盖物作为保护的区域,
例如芦苇床或草丛较高的地方。
该物种主要分布在靠近永久水源的地方。
根据文献,沼泽鹿选择自然植被和水域。
但是有没有什么地貌特征可能会扰乱沼泽鹿呢?
或许可用空间回归分析来探索这些自变量。
我们研究区域的特点是自然植被和开阔水域。
一条道路穿过单元格 A6-F6,
这可能会造成潜在的干扰。
露营地也存在于单元格 B3、C7 和 D7 中。

每个点代表沼泽鹿的 GPS 位置。
从视觉上看,
道路和露营地附近的沼泽鹿似乎更少了。
另一个观察结果是沼泽鹿在存在湿地的单元格 D2 和 D3 中显得更密集。

这张热点图证实,
靠近道路的鹿数量较少,
与平均值的偏差小于 -2 个标准差。
沼泽鹿在单元格 D2 附近更密集。
除了这两个低点和热点之外,
研究区似乎没有更多的空间格局。
我们可以利用回归分析来回答这些类型的问题,
使用空间回归来模拟沼泽鹿和土地特征之间的空间关系。
第一步是对每个网格单元格的自变量和因变量进行分组。
我们不能将沼泽鹿的位置视为点。
该表必须包含每个网格单元的鹿、露营地和湿地的数量。
下表是使用 OLS 预处理表的示例。

使用“空间关系建模”工具包中的“普通最小二乘回归”工具。

运行 OLS 工具后,
预测模型的残差将添加到显示中。
残差本质上是模型中的误差。
在继续之前,让我们仔细看看残差到底是什么。
如果查看单元格 A1(左下角),
在这个网格单元格中发现了 9 只鹿。
OLS 模型根据单元格中的树木、湿地、草地、道路和露营地的数量构建权重。
这些权重是 Beta 系数值。
当我们将权重代入回归公式时,
单元格 A1 中估计有 6.98 只鹿。
当从 9 中减去 6.98 时,
得到的余数为 2.01。
换言之,该模型将实际值低估了 2.01。


可以将露营地的低负 β 系数 (-3.56) 解释为沼泽鹿避开的区域。
道路也有负值 -0.52,
这意味着鹿不会选择这些网格。
沼泽鹿更喜欢湿地作为合适的栖息地。
这个模型证实了这个信念。
我们可以手动将 Beta 系数模型插入回归模型。
结果就是预测值。
在此示例中,
它是网格单元中鹿的预测数量。
Y = β0 +(β1 × x1)+(β2 × x2)+…+(βn × xn)+Ε
A1=5.916744+(-0.524393×0)+(0.056088×30)+(-3.558805×0)
A1=7.59
此 OLS 模型的调整 R 平方值为 0.795。
即可以解释 79.5% 的变化。
另一个有趣的统计数据是方差膨胀因子 (VIF)。
如果 VIF > 7.5,
则表明解释变量之间存在冗余。
我们的 HSI 模型满足了这些标准,
VIF < 2.0。
星号 (*) 表示该系数具有统计显着性 (p < 0.05)。
沼泽鹿 HSI 的 p 值 < 0.0001,
这意味着系数具有统计显着性。
当此检验具有统计显着性 (p < 0.05) 时,
模型预测有偏差(残差不呈正态分布)。
Jarque-Bera 统计分数为 0.721。
当 OLS 回归模型工具在报告末尾给出警告 000851 时,
这意味着应处理空间自相关 (Moran's I) 工具以确保残差不在空间上自相关。
空间自相关将告诉我们低、高预测是否是随机的。
没有模型可以完美地预测,
并且总是会高估和低估。
空间自相关调查 OLS 模型是否随机分布。

当单击 “确定” 时,
该工具将生成报告。
双击报告,
并确保结果是随机的。


我们利用空间回归工具在沼泽鹿、露营地、道路和湿地之间建立了空间关系。
回归工具研究了这些因素之间的关系并为每个变量生成权重。
这些权重被代入回归公式以计算和预测鹿的数量。
方差膨胀因子、z 分数、Jarque-Bera 和 Moran's I 确保了空间回归模型的稳健性和统计显着性。
回归模型显示沼泽鹿如何选择湿地作为合适的栖息地。
它还表明沼泽鹿倾向于避开露营地和道路。
这对土地资源管理者很有用,
可以限制露营地和道路的开发以保护此类鹿,
回归模型还可以预测其他地区的沼泽鹿。