中国地震  2017, Vol. 33 Issue (4): 602-612
基于手机位置数据的四川九寨沟7.0级地震人流分析
李东平1, 黄乐2, 陈海鹏1, 刘倩倩1     
1. 浙江省地震局, 杭州市西湖区塘苗路7号 310013;
2. 杭州远眺科技有限公司, 杭州 311121
摘要:2017年8月8日四川九寨沟7.0级震后,浙江省地震局利用大数据采集了1031.99万条手机位置记录和4.46万个空间格网位置。本文结合24hr连续定位的手机数据,使用手机位置数据分别对九寨沟灾区人口从时间和地理维度上进行了量化分析,估计了多维人口分布的偏差,同时,探讨了剔除微观误差数据用户来估算灾区通讯基站退服分布的方法。该项工作为震后快速获取灾区人口实时动态分布提供了有效途径,同时也为地震灾害评估提供了较准确的依据。
关键词手机数据    人口分布    地震应急    九寨沟7.0级地震    
Change of population distribution during the Jiuzhaigou MS7.0 earthquake emergency period based on mobile phone location data
Li Dongping1, Huang Le2, Liu Qianqian1, Gong Jun1     
1. Earthquake Administration of Zhejiang Province, Hangzhou 310013, China;
2. Hangzhou Overlooking Technology Co., Ltd, Hangzhou 311121, China
Abstract: On August 8, 2017, Earthquake Administration of Zhejiang Province collected 10, 319, 900 mobile location records and 44, 600 spatial grid positions after the MS7.0 earthquake in Jiuzhaigou, Sichuan. The mobile phone location and 24 hours of continuous data were used to analyze the time and geographical dimensions of the disaster areas in Jiuzhaigou. The author estimates the deviation of the multidimensional population distribution. At the same time, the method of estimating the distribution of the communication base station in the disaster area is also discussed. The distribution of earthquake disaster population provides a relatively accurate basis for earthquake disaster assessment.
Key words: Mobile phone location data     Population distribution     Earthquake emergency     The MS7.0 Jiuzhaigou earthquake    
0 引言

2017年8月8日21时19分46秒四川省阿坝州九寨沟县发生7.0级地震,浙江省地震局第一时间发布震中手机人口热力图,并利用手机位置大数据对震区人口分布、震后人流变化进行了分析,取得了较理想的效果。

人口时空分布是地震灾害应急救援的重要依据。尤其是大震发生后数小时的黑箱期内,如何快速准确获取灾区人口信息是震后灾情速判的关键,人口数据的精度会直接影响到灾害评估结果的准确性(聂高众等,2012帅向华等,2014)。长期以来,由于数据源的限制,准确生成人口数量的空间分布一直是一个难题。目前,国内用于地震灾害快速评估的人口数据主要是以第6次人口普查为基础衍生的千米格网数据或乡镇级行政区划的人口平均密度数据,其精度与实际灾害调查结果差距较大,满足不了灾情速判的需求。此类数据基本为静态,更新时间间隔为年,不能准确反映实时人口数量和位置。若能根据相对可靠的实时信息对灾害作出快速估算,则可提高应急决策指挥和抢险救灾的效率。人口空间位置表达也包含了静态以及其空间位置的动态变化。近年来,手机等的高普及率使得大规模持续采样的移动设备定位数据为估计更高时空分辨率的人口分布提供了一种新的途径。Android系统因其免费开源、开发维护成本低、使用简单等特点,已被广泛作为移动智能应用的开发平台。近年来,GPS和北斗卫星导航系统的定位服务在手机终端应用中成为主流配置,智能手机普及、位置分享服务、基于位置服务、大规模分布式数据存储与计算框架等的出现与发展,使得实时获取精准的海量手机位置信息成为可能,利用手机移动定位估算实时人口已成为一种可操作的相对精确的方法(匡文慧等,2010;张子民等,2010)。自2013年以来,国外陆续有运营商开展移动网络的位置数据分析应用工作,美国运营商Verizon通过收集用户使用过的APP、访问过的网站及所处的地理位置等信息提供商业咨询。法国电信运营商Orange的高速公路监测项目、西班牙电信公司Telefonica的智慧足迹项目为用户提供位置衍生信息。2014年11月乌镇世界互联网大会上,国内移动大数据的综合分析展示了动态人员流量大数据分析平台,同年12月,移动位置大数据在上海外滩踩踏事件应急中为政府提供了决策信息。

1 手机位置大数据的原理

随着智能手机的普及(谷歌发布的《The Consumer Barometer》报告显示,中国智能手机普及率达66%)和移动互联网的发展,互联网已经进入了移动互联时代。加之全球定位系统的发展与普及,基于位置的服务的产生与发展已成必然。基于位置服务不仅为用户带来了便利,而且为商业智能分析、公共事务管理、学术研究等提供了新的数据源与可能性。全球的大量用户每天都产生海量的信息用以共享,这些共享的信息可以通过应用接口获取,手机位置共享服务产生的地理相关数据已为GIS带来了新的变革(吴士锋等,2016)。以移动网络共享数据作为数据源进行研究涉及到的最基本问题是数据的获取以及对其进行分析、计算的支持平台。人口数据估算是将地理围栏技术运用到消息推送中,当用户进入到地理空间范围内时,即可获取并统计用户的位置信息,通过在不同时段、不同地区的模型模拟,就可推断出当前的人口数量。移动网络中共享信息体量庞大,对大量数据的存储、分析都是不小的挑战。由于受数据获取难度以及数据存储、分析能力的限制,针对用户位置信息的研究多专注于个体移动模式研究以及预测,其在个体移动模式的分析,结合用户的社交网络应用信息,对公共事务管理应用如用户画像、服务推荐、市场预测等方面有很好的应用效果。基于大量数据的支持,对更大尺度上人的活动进行研究,则对城乡规划、人口分布、社会经济指标等更有意义。

2 数据预处理

本项工作以2017年8月8日四川九寨沟7.0地震灾区为研究区域。此次地震震中为33.20°N、103.82°E,位于九寨沟核心景区。震中东距九寨沟县城39km,距松潘县66km,距舟曲县83km,距文县85km。此次地震的最大烈度为Ⅸ度,等震线长轴总体呈NNW走向,Ⅵ度区及以上总面积为18295km2。我们以震中为中心,在东西长500km、南北长360km的范围内共采集了1031.99万条手机位置记录、44573个空间格网位置数据。采集范围覆盖了Ⅵ度及以上区域。震中为景区,常住人口比例较小,大量的是短期居住外地游客,游客在微观时空移动非常频繁,不同时段也存在着巨大的人流差异。所以,我们提取了分时段内的人口信息,具体是从8日21:00时开始,提取每隔1hr的数据覆盖,共计24个时段,这样可以比较全面地体现震区人员的动态分布情况。本次工作中由于数据量庞大,精度和效率相互矛盾,采用高精度虽然可以更加详细地表述人口分布,但是会出现计算量过大的问题,而且此次地震震中位于山区,山体的遮蔽效应对手机位置精确定位造成一定影响,如果过分追求精度反而造成一定量的重复计算点并影响计算效率。为了更快地对震区人口进行分析,兼顾精度和效率,我们选取了200m格网的精度进行人口分布分析。

3 基于密度分析的人口分布模拟 3.1 核密度分析原理

在200m格网内,人口并不是完全均匀分布的,这就需要用数学方法进行人口密度模拟。我们将格网中心看做1个点,该点的值为格网内人口数,通过计算点值密度来表示人口密度分布。点密度常用的计算方法有3种:样方密度法、核密度法和Voronoi图密度法。样方密度法是在被模拟地区的空间内随机选取若干个样方,通过统计每个样方内的个体数,计算出每个样方的密度,以所有样方密度的平均值作为大面积密度。但是随机取样会掺入一定的主观性,使得模拟结果偏大(禹文豪等,2015)。该方法适用于人口静态的取样调查,对于流动性强、密度大的人口,模拟效果不好。Voronoi图密度法是将数值点作为Voronoi图发生元,计算几何空间里的一种基于距离的平面划分。在平面上有n个不重合种子点,把平面分为n个区域,使得每个区域内的点到它所在区域的种子点的距离比到其它区域种子点的距离近,每个区域称为该种子点的Voronoi区域。Voronoi图单元连接处的密度变化突兀,忽略了空间现象发生的连续性,对于人口分布估计也有一定局限性。

核密度方法可以解决以上问题,核密度值随中心辐射距离的增大而逐渐变小,考虑了点对它周围位置影响的距离衰减作用。概念上每个点上方覆盖着1个平滑的曲面,在点所在位置表面值最高,随着距离的增加表面值减小,直到距离等于搜索半径时值为0。输出栅格的每个像元值为所有叠加在该像元上的表面值之和(劳昕等,2013)。由此,核密度估计法将1个点集转化为表现出连续密度变化的表面,进而可以将离散的点集转化成平滑的密度变化图,从而显示出其空间分布模式。图 1为核密度计算样例。由图 1可见,密度值越高,则表明该点的聚集程度越高。核密度分析对于人口分布的模拟有明显的优势,人口分布具有集群性,距中心位置越远,人口分布密度越小。

图 1 核密度计算样例
3.2 核密度空间计算方法

在计算中,每个点所在位置处表面值最高,曲面与下方的平面所围成的空间的体积等于此点的值,每个输出栅格像元的密度均为叠加在栅格像元中心的所有核表面的值之和。核密度方法的计算方程为

$ f(s) = \sum\nolimits_{i = 1}^n {\frac{1}{{{h^2}}}} \left( {\frac{{s - {c_i}}}{h}} \right) $ (1)

式中,f(s)为空间位置s处的核密度计算函数;h为距离衰减阈值;n为与位置s的距离小于或等于h的要素点数;k函数则表示空间权重函数。式(1)的几何意义为密度值在每个核心要素ci处最大,并且在远离ci过程中不断降低,直至与核心ci的距离达到阈值h时核密度值降为0。核密度函数中存在2个关键参量,即空间权重函数k与距离衰减阈值h。大量的研究表明,空间权重函数的选择对点模式分布结果的影响不大,需要注意的是距离衰减阈值的选择。在实际中,阈值h的设置主要与分析尺度以及地理现象特点有关。较小的距离衰减值可以使密度分布结果中出现较多的高值或低值区域,适合于揭示密度分布的局部特征;而较大的距离衰减值可以在全局尺度下使热点区域体现得更加明显(禹文豪等,2015bESRI中国信息技术有限公司2011限公司,2011)。

3.3 基于核密度分析的人口分布模拟

我们采用核密度法,利用采集的手机点位数据模拟了东西长500km、南北长360km范围内的人口分布。图 2为基于手机数据的九寨沟人口模拟分布。由图 2可见,震中附近人口稀少,只有在漳扎镇、九寨沟县城、川主寺镇有一定量人口分布,尤其在震中以西人口密度非常低,几乎没有大的居民点分布。人口集中在较远的东部地区,距震中比较远,其中,武都市距震中101km,广元市距震中197km,其余仅零星沿地形沟底、交通线有少量的人口分布。我们进一步取震中附近的极灾区,为了方便分析,对数据作三维处理。图 3为8日21时震中附近人口热力三维图。由图 3可见,震中附近21:00时九寨沟景区只有零星的人员分布,机场人员也不是很多,周边塔玛村、干海子村有一定人口,人口主要集中在漳扎镇。

图 2 基于手机数据的九寨沟人口模拟分布

图 3 8月8日21:00时震中附近人口热力三维图

为了反映地震前后的人口变化,我们将8日震后22:00时的人口密度与震前21︰00时的进行了对比,计算了2个时段的密度差值,这样可以比较客观地反映地震造成的通讯中断和人员移动情况。图 45分别为震区、极震区震后与震前手机密度变化。由图 4可见,地震发生后震中附近九寨沟县等高烈度区人口密度明显下降;由图 5可见,距震中较远的地区人口密度没有太大变化,总体上减少和增加处于相对平衡。在震区漳扎镇(沟口)、九寨沟县城、301省道(机场-漳扎镇段)及周边、301省道(九寨-文县段)及周边的人口密度则出现急剧下降,213国道(松潘到若尔盖县段)也出现了连片的手机密度大幅减少情况,可以判断出现了基站退服和电力中断的情况。在九寨沟县去往平武县的205省道,人口密度有一定增加,九寨沟县城外围人口有一定增加,说明震后半小时已经开始有游客在向景区外疏散。

图 4 震区震后与震前手机密度变化示意图

图 5 极震区震后与震前手机密度变化示意图
3.4 灾区分值段人口变化分析

地震发生后,灾区人口分布是一个动态变化的过程,从震后基站退服影响人口数开始,到通讯和电力抢修,再到后来的沿交通线向外疏散,人口的数量和位置一直在发生变化。

干海子村距震中较近,也是灾情较重的一个村,地震中破坏严重的天堂大酒店就在这个区域,震后通讯和电力受损严重,几乎完全中断,直到9日上午通讯和电力经过抢修部分得到恢复。黄龙机场没有停电,人流相对其他地区下降较缓,根据相关媒体报道,机场采取了一定措施,对滞留机场的人员进行了疏散,部分分散到附近的宾馆,少量人员机场过夜。图 6为机场、景区、干海子村人口时序变化。由图 6可见,9日6:00点以后,进港客机和灾区集中过来的疏散人口使人流出现了明显上升的现象。进入9日晚间,机场人流又开始下降。图 7为漳扎镇人口时序变化。由图 7可见,漳扎镇酒店区人员集中,景区游客大部分集中在这里,震后基站退服较多,在紧急维修后,人员呈净流出状态。

图 6 机场、景区、干海子村人口时序变化

图 7 漳扎镇人口时序变化

我们统计了Ⅶ度区范围内14个乡镇人口的24h变化(图 8910),它们分别是漳扎镇、南坪镇、双河镇、白河乡、黑河乡、郭元乡、勿角乡、宝华乡、大录乡、陵江乡、玉瓦乡、马家乡、罗依乡、草地乡,并对14个乡镇进行了大致分组。因震区人口分布极不均匀,漳扎镇、南坪镇人口震前大于10000人,而其他乡镇震前均少于1000人,其中,陵江乡、马家乡、草地乡震前各只有不到200人,所以,将人口大于1万的漳扎镇、南坪镇分为1组,大于450人但小于1万人的双河镇、白河乡、宝华乡、郭元乡、勿角乡为1组,小于450人的大录乡等为1组。

图 8 大于450人但小于1万人的乡镇(沿国道的乡镇)人口时序变化

图 9 小于450人的乡镇人口时序变化

图 10 大于10000人的乡镇人口时序变化

震后由于基站退服、停电等原因,人口数急剧减少。此次震后通讯抢修非常迅速,应急通讯车进入震区后,震后通讯得到部分恢复,8日午夜24:00时左右随着通讯恢复,人口数开始缓慢地增长,在9日凌晨06:00时左右,从景区疏散的人口和进入灾区的救援力量叠加,由图 8可见,沿省道的几个乡镇白河乡、勿角乡、宝华乡、双河镇、郭元乡等人流出现急剧增长,在9日17:00时左右,这几个乡镇的人口开始回落,到19:00基本稳定。人口少的乡镇基本不沿省道,由图 9可见,其人口变化一致性较好,基本为震后人口急剧减少,8日午夜24:00时左右开始稳定缓慢增长,基本可以反映出震后通讯和电力逐步恢复的过程。由图 10可见,漳扎镇、南坪镇震后人口都急剧减少,8日午夜24:00左右开始恢复,其中,南坪镇是县政府所在地,到9日凌晨01:00时左右,基站大部分恢复,此后一直为缓慢增长的过程,从震前的19495人增加到24hr后的20146人,增加的人应该主要为进入的救援力量和景区撤出的人口。漳扎镇是极灾区,大部分区域都是Ⅸ度、Ⅷ度区,与其他乡镇不同的是,在通讯部分恢复后一直是人员流出的状态,特别是9日7:00~17:00人口流出加速,截至9日21:00时漳扎镇人口由28569人变为5209人,除救援力量外,滞留人员已经基本疏散。

3.5 灾区基站退服情况的模拟

历次大地震极灾区都出现了移动通讯基站退服的现象,如2008年汶川8.0地震造成四川移动3429个移动通信基站退服,2010年玉树7.1级地震时当地移动通信基站退服率达到70%以上,2013年芦山7.0级地震时303个基站退服,2014年鲁甸6.5级地震时61个移动通信基站退服。一般认为,在Ⅷ度以上区域才会出现基站退服(程明超等,2017),此次九寨沟7.0级地震震后,极灾区最高烈度为Ⅸ度,并且也出现了通讯中断的情况,其中,九寨沟县范围内出现大面积基站退服和光缆中断表 1为九寨沟县基站退服情况。由表 1可见,县域内43.74%的基站存在退服现象。

① 四川省通信管理局, 2017, 四川省通信管理局九寨沟7.0级地震通信保障速报

表 1 九寨沟县基站退服统计

通过对比地震前后基于手机的人口数量的减少,可以估算出大致的基站退服比例和分布范围。我们在震区划分了1.5km×1.5km的格网,统计每一个格网中震前、震后人口数的变化量R

$ R = ({N - K})/{N} $ (2)

式中,N为震前人数;K为震后人数;R为变化量(退服率),R值越大,代表退服率越高,地震灾害越严重。由于震后个别地区会出现人员聚集的情况,导致个别的单元格内震后手机数增加,在计算中R会因此为负数,但总体上还是由震中向外手机数逐渐减少。此次地震计算所得R最大值为85.9%,主要分布在干海子村和漳扎镇,可见这2个区域灾情最严重,可能其部分区域出现了基站全部退服的情况。由于手机仍旧可以通过卫星、WIFI、蓝牙等其他通讯手段提供位置信息,所以,退服率一般不会为100%。我们在成图过程中,为了方便分析剔除了R < 0格网,也就是人口增加的格网,并将增加的数值平均分配到周围相邻的格网,与最终烈度调查结果叠加。图 11为基于手机数量变化的基站退服模拟分布图。由图 11可见,其结果与后来的实地调查结果非常接近,手机减少50%以上的网格基本都分布在Ⅶ度区内,整体略有向西北溢出的情况。距震中较远的东部人口密集地区,手机数呈现普遍的轻微减少的情况,这与夜间随着时间推移部分人关机的情况吻合。本次数据对基站退服情况模拟得非常好,完全可以采用手机人口减少比例来推断基站退服,进而推断出极灾区的分布范围(聂高众等,2012邓砚,2005)。

图 11 剔除干扰、基于手机数量变化的基站退服模拟分布图

在烈度图正式公布后,我们也计算了不同烈度区在震前、震后的根据手机模拟的人口变化情况,同时为了剔除由于夜间关机对退服的影响,我们还计算了7日同时段、同地区的手机人口变化情况,在计算最终结果时,将7日的数据作为基数减去,因此,可以得出8日真实的退服情况。表 2为基于手机人口数据的基站退服模拟。由表 2可见,Ⅵ度区退服率为18.35%,而7日退服率为19.09%,退服率反而减少了1.03%,也就是说,震后该区域,手机关机率比前一天减少,一部分人受到此次地震影响,关机比以往推迟。同样方法,剔除基数后最终计算Ⅶ度区有28%退服,这与传统认为的在Ⅷ度区才会出现通讯基站退服的观点相悖。在Ⅷ度、Ⅸ度区,我们认为受地震影响强烈,在22:00时关机的人数较少,统一将基数人为定为5%,这样Ⅷ度、Ⅸ度区最终结果分别为52.40%、61.24%,震后手机减少受多种情况的影响,但是基站退服是最主要的因素,所以,以上结果基本可以客观反映不同烈度区的基站退服率。

表 2 基于手机人口数据的基站退服模拟
4 结论

(1) 手机人口热力数据时效性较好,数据准确度高,可用于地震应急实际工作中。此次九寨沟7.0级地震在手机位置数据的支持下,实时获取了震中区的人口分布模拟数据。经过数十次大小地震的检验,数据模型已经比较成熟,后期经过各个渠道的验证,本次数据接近实际人口情况。手机位置数据能够满足地震发生后数小时内在实际受灾情况无法得到确切信息的时间内为政府救灾提供可靠依据的需求。

(2) 智能手机使用率与人口估计偏差具有显著的关联。九寨沟地震灾区存在极端情况,部分西北部山区、南部山区人口极少,而且人员构成差距明显,西北部山区主要是60岁以上老人和儿童,智能手机使用率较低,人口值被低估。震中附近漳扎镇和九寨沟县城人口较密集,漳扎镇主要为游客,智能手机使用率较高,如果使用统一模型则会出现震前数据一定程度上被高估。本次对漳扎镇和山区人口的模拟则采用了不同模型。

(3) 核密度方法可以比较客观地模拟人口热力分布。核密度分布模型对人口分布模拟较好,其方法相对其他方法更适用于人口群体分布和流动特征,在对震前沟口地区微观人口分布模拟过程中,很容易得出漳扎镇宋城演艺区人口最集中、其次是天堂口广场九寨沟喜来登大酒店附近的结论,根据各方面信息反馈,情况符合实际。

(4) 基站退服引发了大量的人口“假消失”现象。此次地震震级大,达到了7.0级,震中最大烈度为Ⅸ度,极灾区出现了供电中断和基站退服情况,直接导致我们获取的手机数据在震后出现断崖式下降,大量的人口在震后突然“假消失”,越接近震中,这种现象越明显。在通讯和电力得到抢修后,手机位置数据开始缓慢上升,判断基站退服率对于第一时间估算极灾区有很大指示作用。

(5) 基于手机的人口数据在未来地震应急中大有可为,其不仅可震时估计人口的分布情况,而且利用其包含的丰富属性信息,我们还可对震中人口来源地、人口矢量移动、交通线滞留情况等作详细分析,这是以往地震应急中所无法想象的。因此,通过对手机数据的挖掘可以延伸更丰富的应用,更好地为地震应急服务。

参考文献
程明超, 夏彦龙, 郑山锁. 2017, 通信基站机房地震易损性分析. 砖瓦(4): 66–72.
邓砚, 聂高众, 苏桂武. 2005, 地震应急的影响因素分析. 灾害学, 20(2): 27–33.
匡文慧, 杜国明. 2011, 北京城市人口空间分布特征的GIS分析. 地球信息科学学报, 13(4): 506–512.
劳昕, 沈体雁, 温锋华. 2013, 长三角与珠三角就业密度分布比较研究. 城市发展研究, 20(12): 137–142.
聂高众, 安基文, 邓砚. 2012, 地震应急灾情服务进展. 地震地质, 34(4): 782–791. DOI:10.3969/j.issn.0253-4967.2012.04.020
帅向华, 胡素平, 郑向向. 2014, 基于互联网信息快速估计汶川地震有感范围. 地震地质, 36(4): 1094–1105.
吴士锋, 李肖红, 吴晓曼, 等. 2016, 基于位置的社交网络服务信息流的导引作用及空间影响研究. 世界地理研究, 25(1): 159–165.
禹文豪, 艾廷华. 2015, 核密度估计法支持下的网络空间POI点可视化与分析. 测绘学报, 44(1): 82–90. DOI:10.11947/j.AGCS.2015.20130538
张子民, 周英, 李琦, 等. 2010, 城市局域动态人口估算方法与模拟应用. 地球信息科学学报, 12(4): 503–509.
ESRI中国信息技术有限公司, 2011, Arc GIS桌面应用帮助, 北京: ESRI. 2011-9-6. http://help.arcgis.com/zh-cn/arcgisdesktop/10.0/help/index.html#//009z0000000s000000/.