我院校友董磊博士,近期以通讯作者及共同第一作者身份,在 Nature 杂志发表了一项研究,利用大规模城市人口出行数据,发现了任何地点的访客数量与其到访距离和访问频率的平方成反比。这项工作通过将人口流量进行频谱分解,揭示了人类移动过程的“距离-频率”普遍性规律,增进了对人类出行模式的理解。同时,该研究利用人口流动数据和模型阐释了经典城市地理学理论(如中心地理论,Zipf 法则),对城市规划、交通规划、流行病建模等领域的研究均有启发。
Nature 同期刊发评论文章,指出这项研究“identified a key component that was missing from existing theoretical frameworks of human mobility” — that is, the visitation frequency. … this finding, valid for various urban systems, “provides a general framework for describing and predicting mobility flows across timescales”.
图1:波士顿的人流可视化(线条宽度代表访问人数,颜色代表访问频率,山峰高度代表特定地点的吸引力)。
1. 过往对人类出行规律的研究
给定两个地点,如何预测两地间会有多少人出行?对于这个问题,科学界早有关注。早在1885年,地理学家Ernst Ravenstein 就凭经验指出,有两个关键因素可以解释两地之间往来的个体数量:两地间的距离、来源地和目的地的社会经济属性。例如,出行者的数量往往随着距离的增加而减少,而人口密集(更有社会经济活力)的地方吸引了更多的人前往。
这一经验此后被归纳为人类出行的“引力模型”,其表达式类似于万有引力公式,即两个城市之间旅行者数量与两个城市的人口数的乘积成正比,与两地之间的距离的平方(或其他幂律以及指数函数形式)成反比。此后在引力模型的基础上,还发展出了介入机会模型、辐射模型、矢量场模型等。
2. 到访频次和距离之间存在普遍模式
与以往的人类出行模式研究主要分析距离、人口规模等因素不同,该文章将一个长期被“忽视”的重要因素——到访频率(visitation frequency)纳入了分析框架。作者们问了一个简单的问题:对居住在 A 地的居民而言,一个特定时间 T 内,一共有多少人会访问 i 地 n 次。
图2:人数出行的频率和距离的普遍模式(Credit:Nature)
通过对全球五个不同地区的超过800 万名匿名手机用户的位置数据进行分析,作者们发现,一个地点的访问人数与居民的居住地到该点的距离的平方成反比 r-2,同时与访问频率的平方成反比 f-2。进一步,我们可以将两点间的访问人数用如下公式表示:
上式代表到 i 地居住地距离为 r 的居民一定时间内访问 i 地 f 次的人数,系数μi代表一个地点的吸引力(attractiveness)。通过对多个城市的大规模数据集的分析,可以得到η ≈ 2(图3)。
图3:波士顿地区的例子。
(a 图) 通过统计居住地距离Back Bay 在 [r,r+dr)圆环上的居民到访Back Bay 的次数(f),我们可以分别得到访问人数ρ和距离(b 图)、频率(c 图)的幂律关系。同时,将距离和频率相乘,我们可以发现,所有数据点落在了一条斜率为-2 的直线上,这也证明了公式(1)的有效性。(d)图中的截距,对应的就是Back Bay 地区的“吸引力”μi。
为了确保结果的普遍性,研究人员收集了2006-2013年间五个不同的手机数据集来进行验证。使用的手机数据集涵盖了四大洲的7个城市:波士顿(北美洲)、新加坡(亚洲)、达喀尔(非洲)、阿比让(非洲),以及葡萄牙的里斯本、波尔图和布拉加(欧洲)。这些城市人口、地理位置、文化、气候等条件差异很大,但分析结果全都指向了相似的规律。
论文共同作者之一,圣塔菲研究所前所长Geoffrey West教授从“能量守恒”的角度评论该发现:人们选择出行的距离和出行的次数,其实是在做最优化。人类在出行中分配的平均能量是相同的,即便他们尝试了不同的距离或频率。
作者们进一步分析了地点吸引力μi的空间分布。通过使用简单的城市聚类算法(city clustering algorithm),作者们发现,城市中地点吸引力的大小分布符合Zipf 法则,也就是说,城市中会有一个大的中心组团,还会有许多小的组团,这些组团的面积分布是一条斜率为-1 的直线(图4)。
图4:“吸引力”在城市中的空间分布与结构,右图为通过城市聚类算法提取出的不同“组团”的空间分布。
3. 对城市人口出行模式预测的意义和应用
根据该论文的研究,任何地点的访问者数量,都与他们的访问频率和出行距离乘积的平方呈反比关系,访问频率提高或出行距离增加,相应访问者数量就会减少。这与引力模型有相似之处。就像大行星的引力一样,一个拥有精美博物馆和著名商店的城市广场,会吸引更多来自更远地方的游客。这些“外地游客”的往来尽管不像家住附近的游客那么频繁,但其数量比例是由模型决定的。
在应用层面,该文提出了名为rf-scaling(距离-频率标度)的分析框架。利用该框架,我们可以评估城市中任何一个位置,到访人群中有多少人来自1、2或10公里以外,有多少人每个月来1次、2次或10次。
这一研究在新冠疫情期间有着特殊意义,该研究得出的规律将有助于政策制定者预估不同选择所带来的社会和经济影响,不同地区对人流管控的强度(比如可以控制出行距离,也可以控制出行频率),也应有相应区别。
在建筑与城市规划领域,该研究有助于辅助“15分钟生活圈”概念的落地。因为按照出行模式,我们可以知道15分钟的步行范围内,人们出行的距离、频率、空间分布之间的相互关系,这有助于我们针对性的进行社区规划与设计——重组适于步行的社区周围物理空间。
参考文献:
论文链接:
https://www.nature.com/articles/s41586-021-03480-9
评论文章链接:
https://www.nature.com/articles/d41586-021-01355-7
论文通讯作者兼共同第一作者董磊博士,本科(2007年入学)和博士毕业于清华大学建筑学院,曾于北京大学和麻省理工学院从博士后研究。