摘要

长期以来,人们普遍预期,大型、人口密集且国际化程度高的地区能够促进不同社会经济背景个体之间的混合与接触。然而,由于以往衡量社会经济混合程度的方法依赖于静态的住宅数据,而非人们在工作场所、休闲场所及居住社区中的真实接触情况,这一假设难以得到验证。在本文中,我们开发了一种衡量接触隔离的指标,用以捕捉这些日常互动中的社会经济多样性。利用手机移动数据,我们再现了美国 960 万人在 16 亿次真实接触中的情景,并在 382 个大都市统计区(MSA)和 2829 个县中测量了接触隔离。我们发现,在十大 MSA 中,接触隔离比人口少于 10 万的小型 MSA 高出 67%。这意味着,与预期相反,大型国际化地区的居民接触到的社会经济多样性个体范围更小。其次,我们发现,大城市中社会经济隔离的加剧源于其提供了更多针对特定社会经济群体的差异化空间选择。第三,我们发现,当城市的中心(如购物中心)被定位为连接不同社区的桥梁,从而吸引各种社会经济地位的人群时,这种隔离加剧的效应会被抵消。我们的研究结果挑战了人文地理学中一个长期存在的假设,并强调了城市设计如何既能阻碍又能促进不同个体之间的接触。

研究领域:城市科学,复杂网络,人类移动性

大数据透视地理| 来源


论文题目:Human mobility networks reveal increased segregation in large cities. 论文地址:https://doi.org/10.1038/s41586-023-06757-3

引言

研究背景:在美国,经济隔离程度非常高,收入影响着一个人的居住地、婚姻对象以及他们会遇到并结交的朋友。这种极端的隔离带来了高昂的代价。它降低了经济流动性,导致了广泛的健康问题,并加剧了政治两极分化。尽管有各种旨在减少经济隔离的改革措施(如补贴住房),但长期以来,人们认为不断推进的城镇化及其引发的偶然混合是减少隔离的最有力动态之一。这种“国际化混合假设”预期,在大城市中,人口多样性的增加、空间的限制以及便捷的公共交通将使不同背景的个体在物理空间上更加接近,从而减少日常社会经济隔离。例如,纽约市地铁曾被誉为一个混合场所,每天都有多样化的人群在此交汇。

研究空白:尽管国际化混合假设看似合理,但大城市也为自我隔离提供了新的机会,因为它们的规模足够大,使人们能够寻找并找到与自己相似的人。关于城镇化与社会经济混合之间关系的这些对立假设尚未得到验证,因为测量现实世界中个体之间的路径交汇和接触一直是个难题。只有通过分析手机地理定位数据到设备层面,这种接触的测量才成为可能。尽管手机数据已被用于多种研究目的,但由于难以确定个体的社会经济地位(SES)、判断双人接触发生的时机以及收集足够的数据来比较不同城市或县,全国范围内的社会经济混合与城镇化研究尚未开展。

研究概述:在此,我们仔细检验了国际化混合假设及其背后的动态。为了评估这一假设并理解城镇化与隔离之间的关系,我们使用了手机移动数据,以去识别化的 GPS 定位信号形式呈现(见方法部分的“SafeGraph”章节)。通过这些数据,我们捕捉了个体之间基于地理位置的接触,这些个体可能具有相似或不同的社会经济地位。这使我们能够开发出城市和县级的隔离指标,反映人们去往何处、何时前往以及途中与谁相遇。我们首先通过识别一个人的居住位置及其月租金价值来确定其社会经济地位。接着,我们构建了一个动态网络,捕捉每个人在日常生活中与他人的接触。我们的网络包含了 15亿条边(代表物理空间中的接触)和 956 万个节点(代表个体,即手机),覆盖美国 382 个大都市统计区(MSA)和 2829 个县。每一条带有时间戳的边表示两个个体在路径上相遇并接触(即他们在同一时间出现在同一地点)。我们分析了这些数据,以估计接触隔离的程度,即在美国每个地理区域(MSA 和县)内,不同经济地位的个体相互接触的程度。我们的接触隔离指标扩展了传统的静态隔离测量方法,捕捉了人与人之间在空间和时间上局部化的接触多样性。

研究结果

更现实的隔离测量方法

为了估计每个人的SES,我们首先通过夜间手机定位信号推断他们的家庭位置(图 1a),然后获取该位置的估计月租金价值(图 1a)。这种方法在估计个体 SES 时比传统的基于社区层面人口普查平均值的方法更为准确。接下来,我们识别每对个体相遇并相互接触的实例,定义为两台设备在 T 分钟内相距 D 米以内。尽管我们的主要发现对 D 和 T 的具体选择具有稳健性(补充图 5-8),但我们主要分析使用 D=50 米和 T=5 分钟,因为国际化混合假设关注的是视觉接触。这种方法,据我们所知,提供了迄今为止分辨率最高的接触测量,与之前的基于 GPS 的研究相比。


图1: 接触隔离揭示不同社会经济背景人群的接触可能性及大都市区隔离加剧a, 对960万个体(手机用户),通过夜间位置推断家庭地址及SES(租金或等值租金),并通过路径交叉事件(同时同地)识别接触对。b, 全国范围的16亿次接触网络覆盖2829个县和382个MSA,与传统社区分类指数(假设仅接触家庭普查区居民)形成对比,示例展示旧金山50人社区的跨区接触。c, 接触隔离定义为个体SES与其接触者平均SES的相关性(0为无隔离,1为完全隔离),以旧金山和纳帕为例,前者隔离度高2.2倍(P < 10⁻⁴,95% CI = 1.6–2.8×)。d, 大型MSA隔离更高,人口与隔离呈正相关(Spearman相关系数 = 0.62,P < 10⁻⁴),十大MSA比人口少于10万的小型MSA隔离高67%(P < 10⁻⁴,95% CI = 49–87%)。e, 美国2829个县的接触隔离差异显著,与人口规模和密度正相关。

每个地理区域的经济隔离通过一个人的 SES 与其通过路径交叉接触到的所有人的平均 SES 之间的相关性来衡量。这种相关性通过拟合线性混合效应模型来估计,该模型消除了衰减偏差,即使观察到的接触数据稀疏,也能确保接触隔离的无偏估计(扩展数据图 1)。由此产生的接触隔离测量(图 1b, c)范围从 0(完全融合)到 1(完全隔离),是对广泛使用的社会经济隔离测量——社区分类指数的推广。社区分类指数相当于一个人 SES 与其家庭普查区内所有人平均 SES 的相关性,而我们的接触隔离测量则相当于一个人 SES 与其遇到的所有人(无论是在其家庭普查区内还是外)的平均 SES 的相关性。因此,这两个测量之间的关键区别在于,社区分类指数假设接触均匀且仅发生在同一家庭普查区的共同居民之间,而接触隔离则捕捉了人们在日常生活中导航时的真实接触。

大城市的极端隔离

我们发现,与国际化混合假设相反,大型 MSA 的接触隔离更高(图 1d)。MSA 人口与 MSA 隔离之间的斯皮尔曼相关系数为 0.62(P < 10⁻⁴),人口最多的十大 MSA 比人口少于 10 万的小型 MSA 隔离程度高 67%(P < 10⁻⁴,95%置信区间(CI)= 49-87%)。这一结果具有稳健性。我们通过用密度而非人口规模重新计算相关性验证了这一点(斯皮尔曼相关系数=0.45,P < 10⁻⁴;补充表 7),通过控制潜在混杂因素(扩展数据表 1 和补充表 7),通过改变分析的粒度(图 1e 和扩展数据图 4),以及通过测试接触隔离的多种规格(补充表 6 和补充图 2-10)进行了验证。一致的结果表明,更大、更密集的城市隔离程度更高,这与假设这些城市通过吸引多样化个体并以迫使他们相互接触的方式限制空间来促进社会经济混合的观点相悖。我们的结果支持相反的假设:大城市允许居民寻找与自己更相似的人。促成这一发现的关键进步是我们对时间和空间的细粒度接近测量(补充图 66)。

探索接触隔离

我们的方法还允许比较传统的静态隔离测量(社区分类指数)与我们的动态测量。所有 MSA 的接触隔离中位数比相应的传统静态估计值低 38%(P < 10⁻⁴,95% CI = 37-41%)(图 2a(顶部))。我们通过将测量分解为涉及两个、一个或两个都不是在家庭普查区内的接触部分来解释这一结果(图 2a(底部))。接触隔离较低是因为当人们冒险走出家庭普查区时,他们会经历更多的多样性。例如,当两个人都离开家庭普查区时,接触隔离比两个都在家庭普查区内时低 50%(P < 10⁻⁴,95% CI 48-53%)。在自己的社区内,人们与社会经济最相似的邻居相遇,但这对整体接触隔离影响不大,因为只有 2.4%的接触(95% CI = 2.4-2.4%)发生在两个人都处于家庭普查区内时。最后,我们观察到,不仅总体接触隔离在大城市中较高,而且其每个组成部分在大城市中也较高(补充图 10)。


图 2: 接触隔离动态揭示空间社会经济差异导致大城市隔离加剧 a, 接触隔离比社区分类指数低 38%(P < 10⁻⁴,95% CI = 37–41%),分解显示区内接触(同质效应)隔离最高,区外接触(访客效应)降低隔离,因区内接触仅占 2.4%。b, 隔离随联系强度增加,5 次以上接触的隔离中值为 0.57。c, 隔离因地点类型而异,高尔夫球场隔离最高(中值 0.42),表演艺术中心和体育场最低(中值 0.16–0.17)。d, 大型 MSA 居民 10 公里内餐厅数量更多,促进自我隔离。e, 大型 MSA 餐厅访客 SES 变异系数高 63%(P < 10⁻⁴,95% CI = 37–100%),反映更大社会经济差异。f, 大型 MSA 餐厅内接触隔离更高,此关系在城市中心和社区尺度上同样显著。

我们通过联系强度(图 2b, c)和不同兴趣点(POI)量化接触隔离的变化。联系越强的关系隔离程度越高(图 2b)。我们还发现 POI 级别的隔离变化很大(图 2c;参见方法部分的“按活动分解隔离”章节)。我们通过 POI 类别(例如餐厅)中包含的差异化 POI 服务于较小且社会经济上同质的社区的程度来解释 POI 级别隔离的变化(图 2c)。我们使用到最近 POI 的平均旅行距离和 POI 总数来操作化 POI 类别的差异化程度(斯皮尔曼相关系数 = -0.75,P < 0.001(旅行距离);斯皮尔曼相关系数 = 0.69,P < 0.01(POI 数量);扩展数据图 3a, b)。例如,在中位数 MSA 中,宗教组织所需的旅行距离比体育场少 92%(P < 10⁻⁴,95% CI = 92-93%),数量是体育场的 16 倍(P < 10⁻⁴,95% CI = 8-18 倍)。因此,宗教组织能够针对更窄的社会经济社区,因此比体育场隔离程度高 75%(P < 10⁻⁴,95% CI = 58-87%)。在少数情况下,一个 POI 类别即使只有少量 POI,也可能表现出显著的隔离(例如高尔夫球场),这是由于其他因素(如公共与私人区分)导致的经济差异(扩展数据图 3c)。下面,我们将展示空间的社会经济差异与隔离之间的联系对于解释大城市为何更隔离至关重要。

大城市中的空间差异化

为了理解为什么大都市区支持隔离,我们以休闲 POI 内的隔离为例。全服务餐厅提供了一个说明性的例子(图 2d-f),展示了在其他休闲场所(补充图 22)和其他分析尺度中广泛存在的隔离诱导动态。我们发现,较大的 MSA 为其居民提供了更多的休闲选择:十大 MSA 的平均居民在其家 10 公里范围内拥有的餐厅数量是小型 MSA(定义为人口少于 10 万的 MSA)平均居民的 22 倍(P < 10⁻⁴,95% CI = 11-39 倍;图 2d)。这些选择在社会经济上也更加差异化。当餐厅的 SES 定义为访问该餐厅并与他人相遇的所有人的中位 SES 时,十大 MSA 中“餐厅 SES”的变异系数比小型 MSA 高 63%(P < 10⁻⁴,95% CI = 37-100%;图 2e)。因此,大型 MSA 不仅为其居民提供了更多的餐厅选择,这些餐厅在社会经济上也更加差异化。例如,在像纽约这样的大城市,根据选择的餐厅不同,一顿饭可能花费 10 美元、100 美元或 1000 美元。这些过程意味着十大 MSA 中餐厅的接触隔离比小型 MSA 高 29%(P < 10⁻³,95% CI 8-49%;图 2f)。我们在许多 POI 类型和涉及城市中心(例如广场、购物中心、木板路)以及社区的高级别尺度上发现了类似结果。

通过城市设计缓解隔离

我们的结果表明,当经常访问的 POI (我们称之为“中心”) 被定位在靠近不同社区的位置时,可以缓解隔离。这些中心将作为附近高 SES 和低 SES 社区居民之间的桥梁,使他们能够轻松访问这些中心并相互相遇 (图 3c) 。我们开发了桥梁指数来衡量中心是否位于这种桥梁位置。我们的指数测量如果每个人只访问离他们家最近的中心,各组人相互遇到的经济多样性。它通过将个体按离他们家最近的中心聚类,然后测量这些集群内的经济多样性来计算 (扩展数据图 7) 。由此产生的指数范围从 0 到 1,其中 0 表示每个中心附近的个体具有统一的 SES,1 表示每个中心附近的个体与整个区域的多样性一样。


我们为商业中心(如广场、购物中心、木板路)计算了桥梁指数,因为我们发现它们是常见的接触中心:在所有 382 个 MSA 中,大多数(56.9%,95% CI = 56.9-56.9%)接触发生在靠近商业中心 1 公里范围内,尽管只有 2.5%的土地面积在商业中心 1 公里范围内(图 3c)。结果显示,我们的桥梁指数与接触隔离密切相关(斯皮尔曼相关系数 = -0.78,P < 10⁻⁴;图 3d)。桥梁指数最高的十大 MSA 比最低的十大 MSA 隔离程度低 53.1%(P < 10⁻⁴,95% CI = 44-60%)。这一发现同样具有稳健性:即使在控制种族、人口规模、经济不平等和其他许多变量后,中心桥梁效应仍然强烈且显著(P < 10⁻⁴)。因此,鼓励开发商将中心(如购物中心)定位在不同住宅社区之间的分区法律和相关政策可能减少接触隔离。我们已经确定了几个以这种方式增加融合的大城市,并展示了一个说明性例子(图 3c, d),其中北卡罗来纳州费耶特维尔中位置良好的中心连接了不同个体。

随着大城市的持续增长和扩展,考察它们是否促进社会经济混合显得尤为重要。尽管人们常认为大城市通过增加密度来推动混合,但我们发现接触多样性与城市规模呈负相关。这一结果表明,规模至关重要。我们已证明,由于大城市能够维持针对特定社会经济群体的场所,它们成为了同质性生成的机器,其隔离程度远超小型城市。我们还发现,一些城市能够缓解这种隔离效应,因为它们的中心位于能够吸引来自不同社区人群的桥梁地带。我们之所以能够检测到这些同质性区域(以及桥梁中心的抵消效应),是因为我们开发了一种动态的经济隔离测量方法,捕捉了家里、工作场所和休闲场所的日常社会经济混合。

这种测量接触隔离的新方法虽然较静态方法有所改进,但仍存在局限性。例如,我们难以确定关系的强弱,因为我们不得不以物理接近度作为接触的代理。在这方面,令人放心的是,我们的核心结果在更严格的时间、距离和关系强度阈值下依然成立,并且与关键的下游结果相关联。同样重要的是,寻找并分析补充数据集,以覆盖我们数据集中未充分代表的子群体(例如无家可归者群体)。现有证据表明,我们的样本在许多关键的种族、经济和人口变量上分布均衡,但手机市场渗透率仍未完全覆盖,GPS 定位数据的分布在时间上也不均匀。最后,我们的 SES 测量依赖于住房消费,这一指标并未完全涵盖 SES 的概念。再次令人放心的是,我们的分析方法改进了传统的社区层面推算,在多种替代 SES 测量下依然稳健。

这一切表明,动态隔离数据足够丰富,能够克服许多看似局限的问题。我们在此采取的动态方法可以进一步扩展,以研究不同人群中隔离来源的差异,并开发一套更完整的工具来减少隔离和改善城市设计。

方法

数据集与数据处理

数据来源与初步处理

我们的研究主要依赖 SafeGraph 提供的美国成年智能手机用户去识别化 GPS 定位信号,涵盖 2017 年 3 月、7 月和 11 月的 9175 万用户和 617 亿次定位信号,每条信号包含纬度、经度、时间戳和用户 ID。尽管非随机样本,该数据在地理、种族、收入和教育分布上均衡,广泛应用于人类移动研究,存储于安全服务器,处理遵循 SafeGraph 政策和斯坦福大学伦理指南。为确保可靠性,我们剔除了少于 500 次定位的用户、不准确度超 100 米的信号及重复用户,最终为 1218 万用户推断家庭位置,其中 956 万用户关联至租金估计值。

家庭位置与 SES 推断

家庭位置通过夜间(18:00-09:00)静止信号(移动少于 50 米)推断,利用线性插值平滑数据,取中位数纬度和经度,70%用户获高信度位置。SES 推断使用 CoreLogic 房地产数据库(覆盖 99%美国住宅)匹配最近住宅地址,再通过 Zillow 数据库(含 1.19 亿物业租金估计)查询租金,79%用户获租金数据,质量控制剔除异常后保留 956 万用户,其人口统计特征与美国总体一致。

接触网络构建与标注

接触定义为两用户 5 分钟内相距 50 米的 GPS 信号交汇,采用 k-d 树计算 15.7 亿次接触,时间取时间戳最小值,位置取经纬度平均值。接触地点通过 SafeGraph Places(550 万 POI 的边界和 NAICS 分类)标注为家庭、休闲 POI 或中心,辅以 TIGER 数据库的道路和铁路信息,以及美国人口普查(2013-2017)的地理和人口特征支持。

分析

接触隔离与估计

接触隔离为某区域内个体 SES 与其接触者平均 SES 的皮尔逊相关系数,优于传统社区分类指数,动态捕捉真实接触。为避免数据稀疏偏差,采用线性混合效应模型计算无偏估计,结果更可靠。

隔离分解

通过时间戳按小时分解隔离,揭示日间变化;按 POI 类别分解,分析休闲活动隔离差异,聚焦餐厅、体育场等高频场所。

桥梁指数

桥梁指数衡量中心(如商业中心)促进经济多样性接触的能力,计算居民按最近中心聚类的经济多样性(基尼指数)加权平均值,范围 0(完全隔离)至 1(完全桥梁),反映中心对隔离的缓解作用,商业中心因高接触密度被选为分析对象。

假设检验

使用 10000 次自举法计算假设检验和置信区间,Steiger’s Z 检验比较预测力,斯皮尔曼相关系数用双侧 t 检验,未调整多重比较 P 值。

城市科学读书会

随着工业化和现代化的发展,世界范围内的城市化率不断提高,越来越多的人口聚集在城市,使得交通拥堵、环境污染、资源短缺等城市问题日益严峻。 我们迫切需要对城市的基本运行规律有科学的认知。 近十几年来,智能手机、物联网、卫星遥感可以帮助获取高精度的城市数据; 机器学习、人工智能的发展,为处理大规模多源异构数据提供了技术手段。 此外,复杂科学从演生视角,在不同时空尺度上研究城市现象的基础规律,丰富了城市科学的理论框架; 基于复杂系统的模拟方法也在实践中有广阔的应用前景。

在这个大背景下,集智俱乐部由北京大学助理教授董磊联合明尼苏达大学助理教授朱递、中南大学地球科学与信息物理学院教授李海峰、北京航空航天大学计算机学院博士寄家豪共同发起,分享、讨论和梳理“城市作为复杂系统”的理论、研究方法及应用,希望促进相关领域学者的交流,推动交叉学科间的合作,促进城市科学的发展和研究。读书会已完结,现在报名可加入社群并解锁回放视频权限。

详情请见:

1.

2.

3.

4.

5.

6.

ad1 webp
ad2 webp
ad1 webp
ad2 webp