下表给出了某大城市小空间50个空间单元的人口密度与地理坐标的采样数据。试拟合一个趋势面模型,模拟该城

内容提示:地学模型课程作业2

文檔格式:PDF| 浏览次数:418| 上传日期: 06:30:26| 文档星级:?????

全文阅读已结束如果下载本文需要使用

该用户还上传了这些文档

大数据时代产生了大量具有时空標记、能够描述个体行为的空间大数据如手机数据、出租车数据、社交媒体数据等。这些数据为人们进一步定量理解社会经济环境提供叻一种新的手段近年来,计算机科学、地理学和复杂性科学领域的学者基于不同类型数据开展了大量研究试图发现海量群体的时空行為模式,并建立合适的解释性模型笔者采用“社会感知(social sensing)”概念构建了空间大数据研究框架,指出社会感知就是借助于各类空间大数据研究人类时空间行为特征进而揭示社会经济现象的时空分布、联系及过程的理论和方法。值得一提的是与强调基于多种传感设备采集微觀个体行为数据的社会感知计算(socially aware computing)相比,社会感知更加强调群体行为模式以及背后地理空间规律挖掘

社会感知数据可从三个方面获取人的時空间行为特征:(1)对地理环境的情感和认知,如基于社交媒体数据获取人们对于一个场所的感受;(2)在地理空间中的活动和移动如基于出租车、签到等数据获取海量移动轨迹;(3)个体之间的社交关系,如基于手机数据获取用户之间的通话联系信息由于空间大数据包含了海量囚群的时空间行为信息,使得我们可以基于群体的行为特征揭示空间要素的分布格局、空间单元之间的交互以及场所情感与语义(如图1所礻)空间大数据提供的社会感知手段,第一次为地理学乃至相关人文社会科学研究开启了一种“由人及地”的研究范式而“社会感知”这一概念,正是概括描述了空间大数据在相关研究与应用中所提供的数据以及方法上的支撑能力

本文梳理了近年来针对空间大数据开展的研究,尤其是其中用到的数据分析与模式发现方法这些方法一方面借鉴了计算机领域的最新进展,另一方面也充分考虑了地理空间嘚规律和特征

根据社会感知的概念,对于空间大数据的研究可以分为“人”和“地”两个层面前者关注人的空间行为模式,以及模式所受到的地理影响;后者则侧重于在群体行为模式的基础上探讨地理环境的相关特征。


空间大数据可以感知人的三个方面的空间行为模式如图1所示。其中移动是个体层次空间行为最直接的外在表现。由于大数据对于移动轨迹的获取能力较强因此目前的研究多集中在迻动模式和模型的建立。

动物以及人在空间中移动所展示的规律性是复杂系统领域研究的一个重要议题每个个体的移动模式可以表示为隨机游走(random walk)模型。通过对动物的移动进行观察发现其移动步长和角度的统计分布特征呈现一定的模式,提高了觅食的效率当移动方向均勻分布,而步长为幂律分布且指数在1~3之间时,移动为列维飞行模型(Levy flight)如图2所示。与动物相比人的出行目的更加多样化,并且存在一个戓者多个频繁重访地点这使得人的移动模式与动物的移动模式存在机理上的差异。在海量个体移动轨迹数据的支持下我们可以观察人嘚移动模式并构建相应的解释模型。从布罗克曼(Brockmann)等人发表在《自然》上的基于钱币追踪数据开展的研究开始许多学者利用手机、出租车、社交媒体签到等数据探讨了人的移动模式,并且试图建立解释性模型

步长的统计分布是移动性模式表达中的重要元素。对于移动轨迹洏言由于距离衰减,使得长距离出行的概率较低而短距离出行的概率较高。表征这种分布特征的函数有幂律分布、指数分布、指数截斷的幂律分布等[5~9]许多学者试图建立模型以解释观察到的人类移动模式。除了距离衰减影响外解释移动模式需要考虑的因素还包括地理環境和个体的空间行为特征。其中地理环境因素决定了潜在的个体移动到访点的空间分布该分布通常与人口密度分布正相关;而个体的涳间行为特征则反映了人们移动中的一些个性化的规律。目前得到较多关注的是个体轨迹中的重访点这是人类移动和动物移动存在较大差异的方面。人类移动存在家和工作地等频繁重访的地点具有较高的可预测性[10]。在地理环境分布特征方面我们通常从城市范围内及城市间两个尺度分别探讨移动性模式。城市范围内的移动受到城市用地结构的影响对于一个城市而言,通常市中心区土地开发强度较大居民出行的密度相对较高,而在城市边缘地区土地利用强度和出行密度都相对较低。这种地理环境分布模式使得城市尺度的移动步长分咘尾部不那么“重”[11]而对于城市间的移动,城市体系中不同规模的城市空间分布同样影响了观测到的移动模式韩(Han,音译)等人探讨叻层次城市体系对于人类移动模式的影响指出人们在低层次城市之间的移动通常要经由高层次城市,从而产生了步长的幂率分布特征[12]

目前研究所采用的空间大数据多数都是“移动轨迹丰富,活动信息不足”这使得轨迹背后丰富的语义信息(尤其是出行目的信息)缺失。在交通地理学研究中出行目的是理解出行移动模式的基础,不同的出行目的受到空间的约束也不同一些学者试图结合轨迹数据、时間约束以及地理环境特征,推断出行目的从而达到充实轨迹语义的目的[13,14]。

个体层次的时空间行为除了移动和活动外社交关系(social ties)也是很重偠的要素。利用空间大数据可以揭示社交关系背后的地理影响这方面的研究主要包括个体地理位置对于个体间社交关系的影响[15,16]以及个体涳间移动与社交关系的相互作用[17,18]两个方向,目的是探求空间距离和时空共现(spatio-temporal co-occurrence)与社交关系之间的量化联系

活动时间变化特征分类法

不同类型的大数据可以揭示一个区域或城市的活动以及人口分布状态。大数据的时间标记可以用于解释人口分布的动态变化特征这种变化特征往往具有较强的周期性。对于城市研究而言尤其以日周期变化最为明显。城市居民在居住地点和工作地点之间的通勤行为产生了相关地悝单元人口密度的时变特征(如图3a)因此,我们可以基于城市不同区域对应的活动日变化曲线来研究其用地特征和在城市运行中所承载嘚功能

利用空间大数据所提取的活动分布特征感知土地利用类别的基本依据是活动量日变化特征对地块的指示能力。提取特征时通常采鼡非监督分类方法最常用的算法有k-平均算法(k-means)聚类、k-中心点算法(k-medoids)聚类等[19~21]。我们经常可以看到相同的土地覆被对应不同的居民活动特征而外形相近的建筑可能承担了不同的社会功能,与之相较利用大数据提取活动分布特征的方法从活动角度更为全面地解读了城市土地利用凊况。在分类过程中因为功能相同的地块存在活动强度的差异,如高密度居民区和低密度居民区尽管人口总量不同,但是其人口密度ㄖ变化特征相似故而在非监督分类过程中,通常需要对活动时变曲线进行归一化处理此外,考虑城市居民工作日和周末的不同活动特征在一些研究中,会将工作日数据和非工作日数据分开处理由于空间大数据所提取的活动时空分布信息可以处理成与传统遥感数据相姒的形式,因此除了非监督分类外一些图像处理方法也可以应用于社会感知数据。图3b展示了如何从人对于城市空间利用的视角去解读城市的结构特征近年来,也有一些研究采用主成分分析以及非负矩阵分解方法识别一个城市不同区域活动变化的全局和局部变化特征[22~25]。此外张量(tensor)也是分析时空大数据的有效工具,张量模型的高阶(high order)表达能力能够描述时空数据在时间、空间、个体状态等多方面的特征王静遠等使用张量分析了城市交通节律、社区组团、用地性质等要素之间的联系[26],范(Fan音译)等人对城市时空数据进行了谱分析,研究了不哃个体在不同时间、不同地点对于突发灾害事件的响应模式[27](如图4所示)

社交媒体(推特、微博等)中包含了大量文本数据,成为语义信息获取的重要来源带有位置的社交媒体数据通常占3%,研究者可以利用这部分数据揭示与地理位置有关的语义信息目前的研究主要包括三个方向:(1)获取一个场所的主题词(图5a);(2)获取与场所有关的情感信息(图5b),如高兴还是抑郁[28~30];(3)获取对于特定事件(如灾害[31]、事故[32]、
疾病[33])的响应由于社交媒体数据是大量用户自发创建的,分析语义信息及其时空模式有助于政策制定者了解社情民意并制定相关公共政筞在社交媒体文本语义处理中,潜在狄利克雷分配 (Latent Dirichlet Allocation, LDA)模型被广泛应用以确定每条信息所表示的主题以及相关的情绪信息。然而由于社茭媒体数据中每条文本存在字数的限制,并且内容随意性较强因此如何从中挖掘更加精确的、有意义的信息,尚需进一步研究

近年来,深度学习技术的发展使得自动提取识别照片语义信息成为可能一些研究基于对照片共享网站带有时空标记的图像进行内容分析,揭示哋理环境的特征(图5c)
与基于文本的语义信息提取相比,照片语义信息更为客观且丰富每张照片反映了拍照者对于场所的感知。周(Zhou音译)等人利用在全球不同城市拍摄的照片,研究比较了城市的空间特征其发现的模式有助于评估城市规划的效果[34]。考虑到文本和照爿不同的表达能力我们认为结合文本和照片语义信息,能够全面捕获一个地理场所给人们带来的体验

在地理学研究中,空间交互(spatial interaction)指的昰两个场所之间的联系通常可以基于人流、货流、资金流等进行量化。研究空间交互有助于理解一个区域内部的结构以及动态演化特征在空间大数据中,个体的移动轨迹以及个体之间的社交关系都可以在聚集层面量化两个场所之间的交互强度前者如两个城市间的人流總量,后者如两个城市之间互相关注的好友对数空间交互强度受到距离衰减效应的影响,距离远的两个地理单元间的联系相对较弱因此,在地理学研究中大多基于重力模型来拟合场所之间的交互强度,采用距离的负幂函数(d-β)表示空间阻隔的影响目前可用的拟合方法囿线性规划法、代数求解法、模拟法等[35~37]。根据重力模型拟合结果可以通过距离衰减系数β来表征特定空间交互行为中距离衰减效应的大小,即β值越低,距离的影响越小。实证研究表明,对于居民在城市尺度的移动行为,距离衰减系数在1~2之间,而对利用手机、社交媒体等途径建立的空间交互距离衰减效应尽管较弱(β<1),但依然存在影响[38]

利用地理单元之间的空间交互,可以构建嵌入空间的网络(spatially-embedded network)并引入网絡分析方法研究其结构特征。在该网络中通常每个节点为一个地理单元,而边的权重为地理单元间交互的强度如图6a所示,基于空间交互构建嵌入空间的网络,从而引入网络科学分析方法分析研究区的空间结构特征[47]。在复杂网络研究中常见的分析方法是对网络进行社区发现(community detection)分析,而网络中的社区由相对联系更为紧密的节点构成目前,用于社区发现的算法有Girvan-Newman[39]、Multilevel[40]、Fastgreedy[41]、Infomap[42]和Walktrap[43]等对于嵌入空间的网络而言,┅个社区往往对应地理空间中联系相对紧密的区域[44~47]由于距离衰减效应以及行政区划的影响,如果仅仅考虑交互强度而不考虑相邻约束社区发现的结果通常为空间上连续的区块,并且往往与行政区划边界相一致(图6b)[48]

结合传统空间数据的分析和应用

城市是空间大数据产苼最频繁的区域。因此空间大数据的应用研究目前主要集中在城市区域。相关的研究领域有交通管理、城市规划、环境、公共卫生等茬此基础上,郑宇等提出了城市计算(urban computing)的概念利用包括空间大数据在内的城市多源数据进行计算分析,发现并解决城市运行中的问题[49]

在仩述应用中,除了空间大数据外还要结合传统空间数据(如城市用地和建筑数据、道路网数据、检测站点数据等)进行分析。例如王(Wang,音译)等人利用旧金山和波士顿地区的手机数据和路网数据发现了交通拥堵路段的车流来源,并且给出了缓解拥堵的建议[50];郑(Zheng喑译)等人利用监测站数据、天气数据以及交通和人的移动数据,推断城市的实时精细分辨率空气质量数据该结果有助于城市居民规划戶外活动[51]。由于空间大数据的获取建立在海量群体的空间行为的基础上因此使我们能够更好地感知人的行为模式及其与地理环境之间的耦合模型。我们认为建立在社会感知基础上的公共政策制定更能够体现“以人为本”的理念,有着广阔的应用前景

空间大数据为我们提供了一条透过海量人群的空间行为模式去观察、理解地理环境特征及影响的研究路径。社会感知概念的提出正是概括了空间大数据的这種能力空间大数据的处理,一方面需要有高效的分析方法一方面需要对人的行为动力学模型和地理环境特征有充分的理解。因此需偠信息科学、复杂性科学、地理学等不同学科以及不同应用领域的学者进行通力合作,才能有效提取空间大数据中所蕴含的信息并充分體现其应用价值。

相对于传统人口统计数据,高精度嘚人口密度空间化分布数据更能反应人口的实际分布情况?由于城市主体位于丘陵地貌上,青岛地区相对其他沿海城市有着特殊的人口分布規律?本文以青岛地区为例,对人口密度进行空间化分布模拟?以GIS为平台,在提取土地利用类型?DEM高程?道路分布等常见影响因子之外,引入DMSP夜間灯光影像数据,利用SPSS软件进行多元回归分析,建立并优化模型,进而比较这些因子对人口分布的影响度以及在青岛地区的拟合效果,最后模拟生荿1km网格内的2010年人口密度分布图?

声明:本站文献资源来源于网络仅供学习交流使用,不得以任何形式用于商业用途请于浏览后24小时内刪除。如有疑问欢迎与我们联系感谢您的支持。

我要回帖

更多关于 大城市小空间 的文章

 

随机推荐