访问量: 119 次浏览
我们正处在一个信息变革的时代。 数据,作为推动这场巨大变革的原材料, 不是在地表之下经过千百万年形成并被发现的, 而是通过传感器和其他数据采集设备源源不断地收集起来的。 例如,NASA的对地观测系统(earth observing system,EOS) 每天都要产生1TB的数据。
卫星图像是空间数据的典型例子。为了从卫星图像中提取信息, 数据处理必须在一个空间参考框架下进行, 这个空间参考框架可以是地球表面。然而, 卫星并不是空间数据的唯一来源, 地球表面也不是可参照的唯一框架。 一块芯片也常常作为—种参照框架。在医疗成像中, 人体就可以视为空间参照框架。事实上, 连一笔超市交易都可以作为空间数据的例子, 只要这笔交易包含了诸如邮政编码这样的信息。 对空间数据的査询或者命令称为空间査询。例如, “列出拥有超过万种图书的书店名称”是一个非空间査询, 而“列出明尼阿波利斯市方圆10英里以内的书店的名字” 则是一个空间査询。
当前,数据通过数据库管理系统(database management system,DBMS) 进行存储和管理。数据库及其管理软件是信息时代的成功案例, 它们已渐渐渗透到我们日常生活的各个方面。如果没有它们, 现代社会将会止步不前。然而,尽管它们取得了令人瞩目的成功, 但业内专业人士普遍认为,大部分现有的DBMS无法管理空间数据, 或者在管理空间数据的时候难以使用。为什么会这样呢? DBMS通常是作为存放商业和财会数据的简单而有效的仓库。 关于雇员、供应商、顾客和产品的信息可以利用DBMS 安全地进行存储并有效地进行检索。可能的査询集合是十分有限的, 数据库则为了高效地回答这些査询而进行组织。因此, 可以顺利地将DBMS从商务领域移植到政府机构和学术管理部门。
驻存在这些庞大数据库中的数据比较简单,通常包括数字、 姓名、地址、产品描述等信息。这些DBMS能胜任那类为其量身设计的任务。 比如,像“就销售额而言,列出1998年前十位顾客”这样的一个査询, DBMS可以很快回答出来,即使它需要扫描一个很大的顾客数据库也是如此。 这样的命令通常称为“査询”,虽然它们不是某种“询问”。 数据库无需扫描所有的顾客,它会利用索引来缩小搜索范围, 就像我们查阅图书时所做的那样。而另一方面, “列出居住在离公司总部50英里以内的顾客” 这样一个相对简单的查询则会难住数据库。 要处理这个查询,数据库就必须把公司总部和頸客的地址 变换到一个能够计算和比较距离的适当参照系统中, 可能是经纬度坐标系。然后,数据库扫描整个顾客列表, 计算顾客住所和公司之间的距离。如果距离小于50公里, 保存该顾客的名字。这个过程无法利用索引来缩小 因为传统的索引无法处理多维坐标数据的排序问题。 这样,一条简单、合理的业务査询就会将DBMS置于无望的尴尬境地。 因此,迫切需要能处理空间数据和空间査询的数据库。