【论文摘要】耦合深度学习和多源空间大数据挖掘的深圳市精细房价模拟

# SYSU_BIGDATA 本科毕业论文摘要集

# 作者:张金宝

# 年级:2013级GIS

# 指导教师:黎夏 教授


【摘要】

城市决策人员以及城市研究相关人员在进行精细政策调整以及决定住房补贴等调控政策的实施时,精细尺度的城市房价是非常重要的参考资料,因此对于城市精细房价的研究也显得尤为重要。前人对于城市房价的研究大部分都在宏观层面上进行分析,少有人进行精细房价空间分布等微观尺度研究,造成这种现象的主要原因是数据的缺失和缺乏有效的模型。本文创新性地将深度学习引入到房价模拟中,基于深度学习中的卷积神经网络(Convolution Neural Network, CNN)提出一种联合挖掘的卷积神经网络模型(Convolution Neural Network for United Mining, UMCNN)进行融合多源空间数据,并利用随机多尺度采样方法克服数据量小和遥感影像中存在的多尺度问题,基于多尺度多源空间数据集与离散化后的房价数据将UMCNN训练好后作为特征提取器,结合随机森林拟合模型(Random Forest, RFA)进行房价模拟,组成一套有效的数据挖掘框架。利用从中国最大的在线房地产市场“搜房网”收集的房价数据以及高分辨率遥感数据、高德感兴趣点(Point-of-interest, POIs)、OpenstreetMap(OSM)路网等多源空间数据,本研究尝试得出5米分辨率的深圳市精细房价空间分布。

结果表明,相对于其他6种不同的多源空间数据挖掘的特征组合方法,本研究所提出的基于UMCNN的挖掘框架有效的融合了不同数据源中的自然物理属性以及社会经济信息,取得了最高的房价拟合精度 (Pearson R = 0.922, OA = 85.82%),模拟得到的房价空间分布也基本符合深圳市目前的房价空间分布情况,并且通过一些区域的细节对比,发现房价模拟结果也合理的体现出房价分布存在的复杂的空间异质性。另外,通过与真实房价的统计对比,发现真实和模拟房价的频率分布曲线非常相似,在50,000元/平方米左右房价的峰值也通过本文的框架很好的模拟出来,证明了本文所提出的模型在房价模拟方面的合理性和有效性。总体来说,本研究首次将深度学习引入到房价模拟中,为耦合多源空间数据进行城市相关研究提供了一种新的思路,并且得到了深圳市的精细房价空间分布数据,这一结果数据填补了目前城市精细房价的缺失,在今后的研究中可以通过引入更多的多源空间信息为中国的房价政策和居住问题相关的研究提供支持。


【关键词】 

房价,空间大数据,遥感,深度学习,卷积神经网络


【图片】

【深圳市房价制图结果】


【深圳市房价制图结果-细节】






【毕业前SYSU_BIGDATA送一句话】

风可以吹起张白纸,却无法吹走一只蝴蝶,因为生命的力量在于不顺从。

——冯骥才




欢迎关注我们的公众号SYSU_BIGDATA: