基于GIS和图像识别的城市空间形态识别研究
摘 要:图像识别技术是人工智能领域发展最迅速的技术之一,可以根据观测到的图像,分辨并提取其中的信息,以适应人们的各项复杂需求。本文以城市空间形态为主要研究对象,利用GIS(地理信息系统)与图像识别技术,以地球图像信息为载体,分别用无监督识别和半监督识别的方法,实现了对城市多种空间形态的识别与自动分类,并对无监督与半监督的分类结果进行了比较分析。
关键词:图像识别技术;地理信息系统;无监督识别;半监督识别;城市空间形态
Urban Spatial Morphology Recognition Based on GIS and Image Recognition
WANG Luying
(College of Architecture, Harbin Institute of Technology, Harbin, 150001, China)
Abstract: Image recognition technology is one of the fastest-developed technologies in the field of artificial intelligence. It can distinguish and extract information based on observed images to meet people's complex needs. This paper takes urban spatial form as the main research object, and uses GIS (geographic information system) and image recognition technology to use the image information of the earth as the carrier, and uses unsupervised recognition and semi-supervised recognition methods to realize various spatial forms of the city. Identification and automatic classification, and comparative analysis of unsupervised and semi-supervised classification results.
Keywords: image recognition technology, geographic information system, unsupervised recognition, semi-supervised recognition, urban space form
在人工智能领域飞速发展的今天,图像识别技术作为其中重要且技术较为成熟的一部分,已经可以跨专业应用在各个领域,目前已广泛应用于如生物医学、卫星遥感、机器人视觉、货物检测、目标跟踪、自动驾驶等领域中。主要的识别技术包括指纹识别、人脸识别、文字识别、医疗影像识别等[1]。但是在建筑学、城市规划、景观规划等设计类专业中也逐步需要用到图像识别技术来帮助识别空间、物体、环境以辅助设计及研究工作。城市范畴的图像识别工作一般是基于GIS技术实现的,GIS是一种使用计算机软件来处理并研究空间数据的技术。因此,本文以地理信息和空间数据为分析基础,结合图像识别技术中无监督式和半监督式两种方法,实现了对哈尔滨主城区的城市空间进行自动识别与分类,未来可用于分析并提取城市空间形态以指导规划设计。
1 地理信息数据的采集与预处理
1.1 地理信息数据的采集
地理信息数据源指建立GIS的地理数据库所需的各种数据的来源,主要包括地图、遥感图像、文本资料、统计资料、实测数据、多媒体数据、已有系统的数据等。其中遥感技术是更新GIS数据库的重要方法,得到的数据源面积更大、更动态、更接近实时数据。且遥感数据含有丰富的资源与环境信息,可以结合图像识别技术获得更多有意义的信息。
本次研究选择了来自美国的Landsat卫星数据库中的遥感影像数据作为数据源。LANDSAT是美国NASA的陆地卫星计划(1975年前称“地球资源技术卫星-ERTS”),从1972年开始发射第一颗卫星LANDSAT-1,已发射8颗。最新的Landsat8于2013年2月11号成功发射,携带有两个主要荷载:OLI和TIRS。其中OLI(全称:Operational Land Imager ,陆地成像仪)由卡罗拉多州的鲍尔航天技术公司研制;TIRS(全称:Thermal Infrared Sensor,热红外传感器),由NASA的戈达德太空飞行中心研制。该卫星可以收集到的数据特性更多,且包含11个波段,最大空间分辨率能达到15m,所以选择了Landsat8遥感影像数据来研究。下面表1是Landsat 8的11个波段设计及各波段主要作用。在Landsat官网上下载到遥感影像数据后,即可以使用SCP插件导入到GIS中,并且进行分类识别。
1.2 地理信息数据的预处理
获取到的遥感影像为多个方形拼合而成,因此用SCP插件导入Landsat数据文件后,需要根据待分析的城市行政区范围地图裁剪landsat文件,得到用于分类识别的文件格式。得到的文件视觉上为黑白灰颜色分布的图像,但是实际上数据信息都隐藏在不同的波段中,因此需要提取11个波段系列(band set)的栅格图。根据11个波段的不同作用与图像信息,选择不同波段组合,可以得到不同功能作用的色彩显示模式。例如下图图1为真彩的显示模式为4-3-2三个波段按顺序叠加而成的,类似与平时看到的卫星地图的颜色。改变波段组合顺序,还可以显示其他多种颜色模式,查看城市不同空间要素的区分。例如,波段组合6-5-4为植被分析的模式,如下图图2所示。
2 无监督的城市空间形态识别
2.1 计算用于无监督识别的NDVI栅格图
虽然波段组合可以显示出各种不同模式的效果,但是每张图像的所有信息依然只能被肉眼识别,无法被计算机分层识别并利用。因此需要通过一个便于提取特征的图让计算机来识别不同的空间要素信息。而归一化植被指数NDVI是目前应用最广泛的植被指数,它基于植物的光谱特征,将可见光与近红外遥感光谱观测波段进行组合运算,可使植被从水和土中分离出来,且结果被限定在[-1,1]之间,避免了数据范围过大或过小或不统一所带来的问题。
NDVI的计算表达式为:
其中NIR和R分别为近红外波段和红外波段处的反射率值。
NDVI值在-1附近时表示地面覆盖为云、水、雪等,对可见光高反射;NDVI为-0.1 - 0.1表示有岩石或裸土等,NIR和R近似相等;NDVI为正值,且在0.2 - 0.4时表示有植被覆盖,且随覆盖度增大而增大,接近1时表示茂密的植被。这样可以用非线性的方式增强NIR和R的反射率的对比度,便于图像识别分类。得到的NDVI栅格计算结果是黑白对比的,如图3所示,也可以改变显示色彩分级使其数值正负区分看起来更明显。为了检验该图用于图像自动分类识别是否合适,需要查看该图数据的柱状图中点值的分布情况,如图4所示,可以看到各数值分布差异性较大,适合用于图像识别。
2.2 聚类计算与识别
这里选择最常用的聚类算法之一均值偏移(Mean shift)聚类算法,它是一种爬山算法(hill climbing algorithm),即局部择优的方法。该算法是指从当前的节点开始,和周围的邻居节点的值进行比较。如果当前节点是最大的,那么返回当前节点,作为最大值(即山峰最高点);反之就用最高的邻居节点来,替换当前节点,从而实现向山峰的高处攀爬的目的。如此循环直到达到最高点。该算法的优点是避免了遍历,通过启发选择部分节点,从而达到提高效率的目的。缺点是因为不是全面搜索,所以结果可能不是最佳。
但是通过前面NDVI计算数值的柱形图分布可以看到,对于本次实验,因为只有一个最明显的峰值,因此做4-5次随机实验即可得到最优解,从而避开唯一的小峰值。根据NDVI可以区分出来的城市空间形态,聚类类别数量设定为五类。计算结束时会自动添加cluster栅格图层,按0-4分为五阶黑白分层,如图5所示。通过调试各个分类的颜色,可以看出每个颜色对应的城市空间形态类别,并设置为常用的经验用色,如图6所示。
为了避免算法自身缺点导致找错峰值,整个聚类分析计算与识别的过程重复了4次,并且与各种城市空间形态的特征比对,例如水域、城区、植被、耕地是否真实合理,确认了该图像识别结果的准确性。
3 半监督的城市空间形态识别
3.1 建立训练用SHP文件与特征提取列表
在提取了波段序列(band set)后新建训练用SHAPE FILE,在植被的红外显示模式(如图7)下,用SCP插件创建ROI选区选取水体,自动选取水体并保存到特征列表中,重复操作几次选取不同水体区域,增加特征提取的准确性。选取结果如图8所示。再切换到真彩模式,便于选出绿色植被和城市建筑,同理每个类别选择2-3个以提高特征提取的准确性,提高最后的识别率。最终把水体、草地类植被、树丛类植被、各个种类房屋、耕地及废弃用地希望区分出来的城市空间形态都用同种方式提取到特征列表中。选好的特征列表的光谱特征折线图见图9,从图中可以看到选取的各个类别存在较明显的聚类性,可以用于图像识别。
3.2 聚类计算与识别
这里选择了SCP插件中提供的光谱角填图(Spectral Angle Mapping,简称SAM)分类技术。该技术是Kruse在1993年提出的,是一种监督分类技术。该算法是将图像波谱直接同参考波谱匹配的一种交互式分类方法,是一种比较图像波谱与地物波谱或波谱库中地物波谱的自动分类方法[2]。这种方法基于的思想是把光谱反射比当作多维空间的一个矢量,若出现光照或者阴影,则该矢量的长度会变化,但是其角度方向保持不变。而在多维光谱空间中,不同光谱角度方向是不同的,因此可以利用光谱角度来为多光谱分类。
图像识别分类完成后会自动生成classification图层,显示所有分类结果,同样按照描述城市空间常用的颜色来调整配色,最终结果如图10所示。
4 无监督与半监督识别结果对比分析
4.1 无监督式识别结果分析
从无监督式图像识别城市空间形态分类结果图6中可以看到,哈尔滨市区范围有一条十分清晰的西北向水域,城市呈放射式发展,密集城区外围有大面积植被与耕地。使用计算机识别分类后,各类型空间都可以单独提取出来用作其他分析或应用。从人眼判断,与该城市原本的形态基本一致,说明该图像识别方法准确率较高。
4.2 半监督式识别结果分析
从半监督式图像识别城市空间形态分类结果图10中可以看到,西北向的水域很清晰地识别了出来,城市大体上也是表现出放射状发展,城区十分密集,且居住功能延伸性很大,绿植和耕地混杂在一起。该方法识别分类后,各类型空间同样可以单独提取出来用作其他分析或应用。从人眼判断,该识别结果城区过于密集,且没有表现出街道路网,房屋建筑的分布在外围一些位置出现的不合理,虽然整体分类倾向没有问题,但是不同类别的边界范围是有问题的,说明该图像识别方法准确率一般,可用于观看大趋势与城市整体形态。但是不适用于细致分析每一种城市空间形态类型的面积分布、功能特点等。
4.3 无监督与半监督识别对比分析
两种基于GIS的图像识别技术识别结果对比可以看出,无监督式虽然只分了五类,但是各类别识别准确率较高;而之前认为识别率会更高的半监督式分类方法反而识别率偏低。具体比较来看,两次结果在城市建筑上区别最大,可能的原因在于有监督分类时对城市建筑的特征选取有误差,可能把建筑和道路路网选到了一起,因此识别结果中二者会粘连到一起,导致建筑密度、面积都过大。而无监督式分类虽然没有提前让计算机知道要分的类别是什么,但是反而该算法自动将同类的要素归在一起,以NDVI的值为标准很清晰地分开了。
因此,本次研究说明了在图像识别过程中,无监督识别有可能比监督识别的准确率更高,在人的先验知识对分类不明晰,或者无法准确标记特征时,可以优先选择无监督识别查看分类状态,再结合实际情况选择进一步图像识别的算法和方式。
5 结论与展望
本文研究了图像识别技术基于GIS平台在城市空间形态分类识别与分析中的应用,以哈尔滨为例,分别使用无监督式和半监督式图像识别方法进行了实验,两种方法均能识别出城市空间形态的整体关系,但是针对每一种要素,无监督识别的结果准确率更高。两种方法的结果之间存在一些差异是由两种方法各自的特点导致的,其中由人造成的误差影响很大。本次实验结果可以看到,基于GIS的图像识别方法十分有效,未来应用十分广泛,不仅可以辅助城市规划设计,而且对城市防灾与灾害风险控制方面有很大作用,值得未来深入研究。
分享让更多人看到
推荐阅读
相关新闻
- 评论
- 关注