中国地震  2022, Vol. 38 Issue (4): 632-650
基于MDT的地震滑坡道路可通行性空间分布快速评估方法研究
白仙富1,2, 戴雨芡1, 聂高众3, 徐硕2, 曾宁2     
1. 中国地震局昆明地震预报研究所, 昆明 650201;
2. 云南省地震局, 昆明 650224;
3. 中国地震局地质研究所, 北京 100029
摘要:如何预测地震滑坡道路可通行性空间分布是快速评估中的一个难题, 为解决这一问题, 本文提出一种基于MDT的地震滑坡道路可通行性空间分布快速评估方法。该方法包括3个步骤: ①定制路段单元, 将路段作为地震滑坡道路可通行性评估的基本单元, 利用GIS将评估区内的道路划分成路段, 制作每条路段两侧180m的缓冲区; ②对路段进行地震滑坡属性赋值, 统计各缓冲区范围内不同地震滑坡敏感性水平的像元数量, 将统计结果作为对应路段的地震滑坡属性; ③路段可通行性空间分布推断, 利用MDT模型计算道路可通行性, 最后进行地震滑坡道路可通行性空间分布制图。利用该方法对我国2008年汶川MS8.0、2014年鲁甸MS6.5和2012年彝良MS5.6、MS5.7地震灾区进行研究。其中, 汶川地震灾区用来进行地震滑坡道路可通行性空间分布快速评估方法的建立和方法有效性的评价, 鲁甸地震灾区和彝良地震灾区则用来对所建立方法在相似区域可移植性的评价。通过计算P值来检验模型的统计学显著性, 并通过计算kappa值来评价模型反演结果与实际情况的一致性。结果表明模型计算出的道路可通行性是判断地震灾区道路是否因地震滑坡中断的良好指标; 在允许一定误差的情况下, 利用MDT模型进行地震滑坡道路可通行性空间分布快速评估的方法可以移植到其他相似区域。
关键词地震滑坡    道路可通行性    MDT    快速评估    
Rapid Evaluation of Road Traffic Capacity with Influence by Earthquake-induced Landslide Using MDT
Bai Xianfu1,2, Dai Yuqian1, Nie Gaozhong3, Xu Shuo2, Zeng Ning2     
1. Kunming Institute of Earthquake Prediction, China Earthquake Administration, Kunming 650201, China;
2. Yunnan Earthquake Agency, Kunming 650224, China;
3. Institute of Geology, China Earthquake Administration, Beijing 100029, China
Abstract: The evaluation of roads damage and the traffic function state have a very important impact on the earthquake relief work. The decision-maker can make a better reasonable and effective earthquake relief strategy with a better understanding of the road traffic capability conditions. However, this question has long been plaguing scientists engaged in the earthquake disaster risk assessment. So far there is no better solution yet. To solve this problem, the authors develop a new method of rapid assessment of the traffic capacity(TC)mapping influenced by EIL using MDT. The method consists of three major procedures: ①Customizing road section(RS). The RS is regarded as the basic unit of the TC evaluation influenced by EIL. On GIS platform, roads in the study area are divided into basic units, in which a buffer(180m)for each RS is created; ②Calculating the number of each earthquake-induced landslide susceptibility level's cells on every buffer. The calculated results are taken as the RS's landslide attribute; ③Using MDT to make TC map. To test our new model, four historical earthquake events, i.e. 2008 Wenchuan, Sichuan MS8.0 earthquake, the 2014 Ludian, Yunnan MS6.5 earthquake; and the 2012 Yiliang, Yunnan MS5.6 and MS5.7 double earthquakes, are selected for the case study, in which the Wenchuan earthquake case is for testing the effectiveness of our new model. The other two cases serve for testing the practicability of our model for the future earthquake disasters in other places in China. P-value and kappa coefficient were used to examine the model's statistical portability. The results show that the computed TC values are good indicators of blocked-road occurrences, and the MDT can be extrapolated to other study area and the developed approach can be used in various magnitude earthquake events.
Key words: Earthquake-induced landslides     Traffic capacity     MDT     Rapid evaluation    
0 引言

道路可通行性空间分布信息对减少地震灾害损失的应急救援决策拟定和减轻地震灾害风险的区域规划均有重要影响。以应急救援为例,如果道路遭到破坏,耽误救援力量进入时间,会使那些本可以通过及时救助生还的伤员失去救助机会(兰日清等,2009常燕敏,2013)。地震发生时,影响道路可通行性的自然因素主要有两方面,一是地震动直接造成桥梁、隧道和路基破坏,二是地震滑坡、泥石流等次生地质灾害对道路的冲毁或掩埋。针对地震动直接破坏道路的快速评估技术,已有大量研究成果。与之相比,以地震滑坡为代表的地震次生灾害造成的道路可通行性快速评估研究尚未成熟。基于决策树最大信息增益比的C4.5方法在汶川地震高烈度区地震滑坡道路中断风险评估的初步研究表明,可以利用地震滑坡敏感性水平数据对道路可通行性进行评估(An et al,2015)。C4.5方法所使用的地震滑坡敏感性水平数据是不同地震烈度(Ⅵ~Ⅺ)设定下90m×90m的栅格产品数据,滑坡敏感性水平从低到高分为5个等级,对应的栅格数据属性值为1~5。但汶川地震高烈度区的这项研究在决策树的每个分类结点上,只检验单一地震滑坡敏感性水平像元数量的影响,忽略了信息系统中广泛存在的属性间的关联作用,导致决策树模型剪枝代价过大,最大的缺点在于因缺少了对低烈度区应有的关注从而降低了研究结果的通用性。为了改进或部分改进这些不足,本文提出一种基于MDT(Multivariate Decision Tree,多变量决策树)的地震滑坡道路可通行性空间分布快速评估方法。该方法的基本思路是根据研究区的地震烈度包络线提取地震滑坡敏感性水平空间分布栅格数据,然后统计每条路段两侧180m缓冲区范围内各地震滑坡敏感性水平的像元数量,将统计结果作为路段的滑坡属性,利用所建立的路段滑坡属性与路段通行状态之间的MDT关系进行地震滑坡道路可通行性空间分布推断(图 1)。

图 1 地震滑坡道路可通行性空间分布快速评估的基本思想

以期通过本方法的建立,提出一套更为普适和更高精度的地震滑坡道路可通行性空间分布快速评估方法,满足当前地震应急辅助决策拟定和地震灾害风险定量评估等工作对地震滑坡道路可通行性空间分布定量信息的紧迫需求。此前,国家地震社会服务工程应急分项、国家科技支撑计划(白仙富等,2015)和大中城市地震灾害情景构建等一系列重大项目中的地震滑坡敏感性研究产出了我国不同地震烈度影响下的地震滑坡敏感性水平数据集,用于服务震后地震滑坡敏感性快速评估等工作。这些数据集为90m×90m的栅格数据,根据滑坡发生概率的大小,将评估像元的滑坡敏感性水平分为5个等级:极低、较低、中等、较高和极高,对应着像元属性值1、2、3、4、5。数据集作为研究区地震滑坡敏感性水平空间分布栅格数据提取的重要来源,有3个共同的关键特点:滑坡敏感性的地震动影响参数为地震烈度;敏感性水平由低到高分为5个等级,相应的像元属性值为1~5的整数;数据为栅格数据,每个像元代表地面90m×90m的区域。对一个地区来说,空间范围内的滑坡敏感性水平越高的像元越多,发生地震滑坡的可能性越大,因此一定地表空间内的地震滑坡敏感性水平及其像元数量代表着该区域发生地震滑坡的可能性。

1 方法和数据

基于MDT的地震滑坡道路可通行性空间分布快速评估方法,其评估对象的基本单元为路段,路段的可通行性分为可通行和不可通行两种。可通行是指道路没有因地震滑坡毁坏,车辆可以通过,不可通行则表示道路被地震滑坡掩埋或冲毁,车辆无法通行。对地震滑坡道路可通行性空间分布快速评估,实际上是利用MDT模型根据路段缓冲区范围内不同滑坡敏感性水平的像元数量组合进行道路可通行性分类。该方法包括3个基本步骤(图 2):①研究区路段定制,即利用GIS将矢量化的线状道路划分为路段,并制作每条路段两侧180m的缓冲区;②研究区地震滑坡敏感性水平数据建立,根据研究区烈度包络线(基于快速评估的结果)提取地震滑坡敏感性水平空间分布数据,统计各缓冲区范围内不同滑坡敏感性水平的像元数量,将统计结果作为滑坡属性赋值给对应路段;③利用样本数据建立的地震滑坡道路可通行性MDT模型计算路段的可通行性,并对研究区地震滑坡道路可通行性空间分布快速评估结果进行制图。

图 2 基于MDT的地震滑坡道路可通行性空间分布快速评估流程
1.1 路段的定义与处理

道路交通通常是一个网络系统,在整个网络中,交通节点把交通线相互连接起来,两个节点之间可以有一条或多条交通线。我们把道路网络上仅连接两个节点之间的线定义为路段(图 3),并将其作为地震滑坡道路可通行性评估的基本单元。路段两端的节点类型包括城市、乡镇、村庄、匝道进出口、公路交叉口(含十字路口)、环岛、车站等公路起始点(图 4)。将路段作为评估的基本单元,其原因是路段上任何一个位置发生中断都意味着不能用该路段进行两个节点之间的人员和物资运输。按照该约定,使用GIS工具将矢量化的线状道路要素分割为路段数据,并进行编码和相关字段的处理。其中,路段的可通行性字段类型为逻辑型,即面向地震滑坡影响的路段可通行性只能分为可通行或不可通行两类。

图 3 路段示意图

图 4 交通运输网中几类节点示意图
1.2 滑坡影响距离与路段缓冲区

地震发生时,当公路所处位置恰好发生滑坡或道路上侧的滑坡体向下运动掩埋、冲毁公路,可能造成路段毁坏,导致车辆无法通行。公路下方的滑坡则不一定影响上侧公路的可通行性,那些发生在公路上侧的滑坡,也只有滑动的路径达到或超过公路时,才能造成道路中断。从2008年汶川8.0级地震时引发的5928个滑坡体滑动的水平投影距离看,绝大部分滑坡体滑动的水平投影距离在90~190m之间,最大值为1201m,平均值为136.6m,滑坡体位移投影距离大于180m的样本为386个,仅占样本总数的6.51%(图 5)。若将地震滑坡样本数据的投影距离去除重复值后进行平均值计算,结果为168.8m。我国川滇山区公路的一个特点为,大多数公路顺着山谷延伸,因此道路两侧的滑坡均有可能影响到路段的通行状态。为减轻本研究后续统计的冗余量,根据地震滑坡滑动距离统计结果,将影响道路可通行性的地震滑坡空间范围约定为道路两侧180m的区域。据此,在进行路段缓冲区制作时,缓冲距离为道路两侧180m,且路段两端不做缓冲(图 6)。

图 5 汶川地震滑坡滑动距离空间分布

图 6 路段缓冲区及像元统计示意图
1.3 地震滑坡敏感性空间分布与路段滑坡属性赋值 1.3.1 研究区地震滑坡敏感性数据建立

地震滑坡道路可通行性与道路和滑坡规模均有密切联系。基于研究现状,选择地震滑坡敏感性水平来表征影响道路可通行性的滑坡因子。国际上对地震滑坡敏感性评估的研究较多,已有研究中适用于快速评估的方法主要有两类,即基于Newmark位移模型及其派生模型的方法(Capolongo et al,2002Del Gaudio et al,20042012Havenith et al,2006Chousianitis et al,2014James et al,2014)和基于滑坡敏感性的相关分析法(Havenith et al,2006Kamp et al,20082010Xu et al,2012a2012b2013a2013b)。Newmark系列模型只适用于小范围区域评估(Jibson,2007),用来评估地震引起的大范围潜在滑坡并不适用。在我国,早期的研究主要根据中国历史地震次生地质灾害活动程度及发生条件,针对一定区域未来一个时段内的地震滑坡敏感性进行预判(唐川等,2001高庆华,20032007刘凤民等,2006高庆华等,20082011a2011b),这些研究成果对长期的国土规划与整治发挥了重要作用,但难以用于应急期间的地震滑坡敏感性水平快速评估。2008年汶川8.0级地震后,国内开展了大量地震滑坡敏感性数理回归研究,采用的方法包括信息量(庄建琦等,2010)与逻辑回归方法(陶舒等,2010白仙富等,2015许冲等,2019b)、层次分析法(许冲等,2019a王秀英等,2012)、模糊数学方法(王秀英等,2011)、人工神经元网络法(许冲等,2012)、影响因子确定性系数法(许冲等,2010)等。上述工作为地震滑坡敏感性研究积累了丰富的理论、方法和数据基础。本文研究使用大中城市地震灾害情景构建重点专项“地震滑坡危险性分析方法研究”最新产出的地震滑坡敏感性水平快速评估模块,来建立研究区的地震滑坡敏感性水平分布数据。该模块可以绘制我国陆地上遭遇不同地震烈度时的滑坡敏感性水平空间分布情况(图 7)。模块产出的滑坡敏感性水平栅格数据的精度为90m×90m,根据设定的烈度计算像元的地震滑坡发生概率,然后采用自然断点法将地震滑坡发生的概率划分为5个等级:地震滑坡敏感性极高、较高、中等、较低和极低,5个地震滑坡敏感性水平对应的像元值依次为5~1,像元值越大,发生地震滑坡的危险性越高。对历史地震滑坡数据的检验表明,该套滑坡敏感性水平数据是地震滑坡是否发生的良好指标。使用模块进行研究区地震滑坡敏感性水平数据的生成,就是用研究区的烈度包络线从地震滑坡敏感性水平预测数据集中提取对应烈度区的数据,然后镶嵌成整个研究区的地震滑坡敏感性水平空间分布图(图 8)。在使用该数据集进行地震滑坡敏感性水平空间分布预测时,如果研究区的地震动影响参数不是地震烈度,需要将其转换为烈度。

图 7 地震滑坡敏感性水平预测数据集(90m×90m栅格数据) 注:每个像元值代表着该空间位置的地震滑坡敏感性水平,不同的像元值用不同颜色表示

图 8 研究区地震滑坡敏感性评估流程
1.3.2 缓冲区地震滑坡敏感性水平像元信息提取

缓冲区地震滑坡敏感性水平数据的像元信息提取是在上述基础上,统计路段缓冲区范围内不同滑坡敏感性水平的像元数量,将统计结果作为缓冲区的地震滑坡属性。缓冲区内的像元如图 6所示,在缓冲区属性中,用Ai(i=1,2,3,4,5)表示缓冲区上地震滑坡敏感性水平为i的像元个数。

1.3.3 路段地震滑坡属性赋值

路段地震滑坡属性赋值是将各缓冲区上的地震滑坡属性,根据数据关联方法赋值对应给路段,作为路段的地震滑坡属性。赋值后的路段具有和缓冲区相同的地震滑坡属性。

1.4 地震滑坡道路可通行性MDT建模 1.4.1 MDT模型

MDT(Multivariate Decision Tree)是一类常见的机器学习方法,通常翻译为多变量决策树。决策树学习的目的是产生一棵处理未见示例能力强的判定树,其基本流程遵循简单且直观的“分而治之”(divide-and-conquer)策略。决策树有多种类型和不同算法,大多数决策树模型在每个结点上只检验单个属性,如CART、ID3、C4.5等,在信息系统中这种单变量决策树(univariate decision tree)默认各条件属性对决策属性的作用是独立的。而现实生活中各种信息系统中属性间的关联作用普遍存在,单变量决策树通常无法反映这种关联作用。不仅如此,单变量决策树往往剪枝的代价较大,在剪枝的过程中又会丢失一些包含重要相关信息的属性,这种限制成为提高决策树分类精度的瓶颈。为此,Murthy等(1994)提出了MDT模型。在MDT中,非叶结点不再是仅对某个属性进行决策,而是对属性的线性组合进行测试。换言之,每个非叶结点是一个形如$ \sum\nolimits_{i=1}^d w_i a_i=t$的线分类器,其中wiai属性的权重,wit可在该结点所含的样本集和属性集上学得。与传统的单变量决策树不同的是,在多变量决策树的学习过程中,不是为每个非叶结点寻找一个最优划分属性,而是试图建立一个合适的线性分类器(周志华,2016)。在本研究中,通过R软件进行地震滑坡道路可通行性MDT模型的参数计算。

1.4.2 地震滑坡道路可通行性计算

对于一个特定区域的地震滑坡道路可通行性计算,本质上可以理解为基于MDT的路段可通行性分类。为分析道路可通行性与道路两侧地震滑坡敏感性的相关性,以研究区的路段为样本,以路段两侧不同滑坡敏感性水平像元数量(即路段滑坡属性)为样本属性。路段的通行性分为两类:可通行或不可通行;现场调查得到的地震滑坡路段通行情况用于确定样本的实际可通行性。道路的地震滑坡可通行性T表示为

$ T=\{0, 1\} $ (1)

式中,当T取值为0时,表示路段因地震滑坡中断不可通行,取值为1时,则表示道路可通行。用路段的滑坡属性,即路段两侧缓冲区范围内各地震滑坡敏感性水平像元数表示地震滑坡的可能性。因此,根据地震滑坡敏感性水平分级,样本由5个属性组成,表示5个地震滑坡敏感性水平中每个等级的像元数量。根据路段属性是否满足式(2)来决定式(1)中的取值

$ t=\sum\nolimits_{i=1}^d w_i A_i $ (2)

其中,Ai表示缓冲区上滑坡敏感性水平为i的像元个数,wi表示滑坡敏感性水平为i的权重。由于本研究使用的地震滑坡敏感性数据共分5个等级,故在线性分类器中,d=5。与C4.5模型中每个结点只考虑一种地震滑坡敏感性水平像元数量不同的是,MDT模型在各结点上均考虑每个地震滑坡敏感性水平的像元数量,是各地震滑坡敏感性水平像元数量与其权重乘积的总和。

2 研究结果 2.1 研究地区

川滇地区位于青藏高原东南缘,新生代以来受青藏高原地壳物质向东侧运移和阿萨姆顶点楔入的共同作用,使得这一地区的地壳活动十分复杂,新构造变形和地震活动十分强烈,是中国大陆最显著的强震活动区域(苏有锦等,2001)。地震滑坡造成道路中断对云南和四川两省的震后交通管理策略制定十分重要。以2008年汶川MS8.0地震灾区、2014年鲁甸MS6.5地震灾区及2012年彝良MS5.7、MS5.6地震灾区为研究区,来构建地震滑坡道路可通行性快速评估模型。这里的灾区是指地震现场调查后绘制的烈度为Ⅵ度及以上的区域(图 9),与前期研究相比,研究区的范围不再仅仅是高烈度的地区,而是包含了更为完整的低烈度区域。这3个地震灾区是川滇乃至整个西南高原山地的典型区域,对我国其他多山区域也有一定的代表性。研究区中地震滑坡道路中断样本最翔实的汶川灾区用来进行地震滑坡道路可通行性快速评估方法的建立和方法有效性的评价;鲁甸地震灾区和彝良地震灾区则用来对所建立方法在相似区域开展地震滑坡道路可通行性快速评估外延适用性的评价。

图 9 研究区域
2.2 空间路段数据建立

在进行空间路段数据建立时,以灾区地震之前一年的道路数据为基础。按照上述对路段的定义,将研究区的道路划分为路段,并对路段进行唯一性编码和字段设计。通过现场调查获得了这3个地震灾区地震滑坡造成的路段中断空间分布详细信息(图 9),将那些被地震滑坡冲毁或掩埋的路段的可通行性定义为不可通行,其他路段的可通行性定义为可通行。在本研究中,我们关注的只是地震滑坡影响的道路可通行性,并不考虑其他致灾因子引起的道路通行状态,因此,有些推断为可通行的路段,实际上也可能因其他原因导致其中断而不可通行。

2.3 地震滑坡敏感性水平数据提取

为了更好地和实际情况进行对比,在提取研究区地震滑坡敏感性水平数据时,我们采用现场调查确定的地震烈度包络线,按照地震滑坡敏感性评估流程(图 8),从地震滑坡敏感性水平预测数据集(图 7)中提取对应烈度区的数据,然后镶嵌成3个地震灾区的地震滑坡敏感性水平空间分布数据(图 10)。研究区地震滑坡敏感性水平数据的提取实际上相当于3个地震灾区地震滑坡敏感性水平空间分布数据的反演。在此基础上,按照前文所述方法对研究区路段进行地震滑坡属性赋值,最终得到具有地震滑坡可通行性、地震滑坡属性的路段数据。

图 10 研究区地震滑坡敏感性水平空间分布反演
2.4 模型建立及其在汶川地震灾区的检验 2.4.1 地震滑坡道路可通行性因子分析

本研究目的是建立针对路段单元的地震滑坡道路可通行性快速评估模型,并根据路段的地震滑坡属性推断其可通行性。将汶川地震灾区的路段分为两类,一类为地震滑坡中断路段,可通行性定义为不可通行;一类为其他路段,路段没有因地震滑坡中断,可通行性定义为可通行。在路段分析中,只考虑了高速公路、国道和省道,其他公路未统计在内。对比汶川地震灾区地震滑坡中断路段的地震滑坡属性(即前文所述的缓冲区内不同地震滑坡敏感性的像元数量,图 11)和地震滑坡未中断路段的地震滑坡属性(图 12),可以看出因地震滑坡中断的路段两侧180m范围内,地震滑坡敏感性极高或较高的像元数量明显高于地震滑坡未中断路段;地震滑坡未中断路段两侧180m范围内几乎均为地震滑坡敏感性极低或较低的像元,地震滑坡敏感性极高或较高的像元极少或没有。这表明,道路两侧地震滑坡敏感性水平高的像元数量越多,道路越容易中断;相反,道路两侧地震滑坡敏感性水平低的像元数量越多,道路不被地震滑坡影响的可能性越大。图 1112表明路段两侧不同地震滑坡敏感性水平的像元数量组合是地震滑坡道路可通行性的重要依据,也间接反映出地震滑坡敏感性水平预测数据集是地震滑坡发生可能性的良好指标。

图 11 汶川地震灾区地震滑坡中断路段滑坡属性统计

图 12 汶川地震灾区地震滑坡未中断路段滑坡属性统计

为定性分析路段地震滑坡属性与其可通行性之间的关系,对两者进行列联分析。列联分析是对地震滑坡道路可通行性与其缓冲区内每类地震滑坡敏感性水平像元数量之间有无关联的推断,即是否独立。采用列联表(contingency table)对汶川研究区26151个路段的地震滑坡可通行性与其地震滑坡属性的相关性进行分析与推断,见表 1。表中T表示地震滑坡道路可通行性,T对应的值为0,表示不可通行,1则表示可通行。Ai表示缓冲区上滑坡敏感性水平为i的像元数,在进行联系分析时,将每类滑坡敏感性水平的像元数量分为等于0和大于0两类。滑坡敏感性水平像元数与道路可通行性对应的数值为满足相应条件下的路段数量。

表 1 地震滑坡敏感性与道路可通行性列联表

在进行列联分析时,原假设H0AiT独立;备择假设H1AiT相合。统计学检验上,P值(P-Value,Probability)为结果可信程度的一个递减指标,P值越大,越不能认为样本中变量的关联是总体中各变量关联的可靠指标。在许多研究领域,统计学根据显著性检验方法所得到的P值,通常认为P值为0.05是可接受错误的边界水平,一般以P<0.05为有统计学差异,P < 0.01为有显著统计学差异,P < 0.001为有极其显著的统计学差异,其含义是样本间的差异由抽样误差所致的概率小于0.05、0.01、0.001。从列联表分析可以看出,每一组的检验P值均远小于0.001,表明路段的地震滑坡属性与可通行性独立的原假设不成立。从相关系数看,A3~5T有显著的负相合关系,当A3~5大于0时,T的取值倾向于等于0,即路段缓冲区范围内滑坡敏感性水平从中等到极高的像元数量越多,则对应的路段越倾向于因地震滑坡中断;A1~2则与T有显著的正相合关系,当路段的地震滑坡属性中A1~2 的值大于0时,T的取值倾向于等于1,即路段缓冲区范围内滑坡敏感性水平为极低和较低的像元数量越多,则对应的路段越倾向于不会因地震滑坡中断。AiT的关系取决于对路段可通行性表达的约定,但无论是哪类相合,均表明两者不相互独立。地震滑坡敏感性极高的像元数量与道路可通行性的相合系数最小,表明地震滑坡敏感性极高的像元对地震滑坡道路不可通行的贡献最大。地震滑坡敏感性极低的像元数量与道路可通行性的相合系数最大,绝对值也越大,表明地震滑坡敏感性极低的像元数量对地震滑坡道路可通行性的影响最大。检验P值和相合系数表明完全可以使用路段的地震滑坡属性推断路段的可通行性。

2.4.2 地震滑坡道路可通行性MDT模型

将汶川地震灾区的路段分为两部分,其中8717条路段数据作为训练集,用来构建地震滑坡道路可通行性MDT模型,其余17434条路段数据作为测试集,用来测试模型的合理性。决策树学习的关键是从数据集中选择最优划分属性。虽然MDT模型主要是在每一个节点找到最佳线性表达,但仍需要用一个参数来衡量什么情况下所给出的MDT是最合适的线性关系。一般而言,在决策中,随着划分过程不断进行,我们希望树的分支结点所包含的样本尽可能属于同一类别,即结点的“纯度”(purity)越来越高。“信息熵”(information entropy)是度量样本集合纯度最常用的一种指标。假定当前样本集合D中第k类样本所占的比例为pk,则D的信息熵定义为

$ {Ent}(D)=-\sum\limits_{k=1}^{|y|} p k \lg _2 p k $ (3)

式中,Ent(D)的值越小,则D的纯度越高。除了信息熵之外,信息增益、基尼指数等也通常用来度量结点的纯度,在实际应用中,这些检验纯度的方法对模型的影响没有明显差别。因此,在本研究中,仍然采用信息熵的大小来评价分类器,当Ent(D)的值取得最小时,认为对应的分离器是最佳分类。根据上述约束法则,采用R统计软件完成MDT模型的构建。

根据R软件输出结果,构建地震滑坡道路可通行性MDT的分枝规则。地震滑坡道路可通行性MDT模型从根结点开始生长,共有8717个训练样本,其中实际因地震滑坡不可通行的样本739个,可通行样本7878个。依据路段的滑坡属性值是否满足式(4)对决策树根结点进行分枝

$ A_5+A_4+\left(A_3-1\right) \leqslant 0 $ (4)

从决策树根结点开始,路段滑坡属性满足式(4)的样本进入结点1,不满足的进入结点2。位于决策树结点1的路段可通行性判断为可通行,此时结点1的信息熵最小,纯度最大,树不再生长。训练集中共有7827个样本满足式(4)进入结点1,这7827个样本中实际有7805条路段为可通行,误判率不到0.3%。

依据路段的滑坡属性值是否满足式(5)对决策树的结点2进行分枝

$ A_5-1 \geqslant 0 $ (5)

路段滑坡属性满足式(5)的样本进入决策树的结点3,不满足的进入结点4。位于结点3的路段可通行性判断为不可通行,此时结点3的信息熵达到最小纯度达到最大,树停止生长。训练集中共有368个样本满足式(5)进入结点3,这368个样本中实际有363条路段不可通行,判断正确率接近99%。

依据路段的滑坡属性值是否满足式(6)对决策树的结点4进行分枝

$ 1 /\left(4-A_3\right)+1 /\left(6-A_4\right)<1 / 4 $ (6)

滑坡属性满足式(6)的样本路段进入决策树的结点5,不满足的进入结点6。进入结点5的路段可通行性判断为不可通行,此时结点5的信息熵最小而纯度最大,不再继续分枝。训练集中共有247个样本满足式(6)进入结点5,这247个样本中实际有228条路段不可通行,误判率不到1%。

依据路段的滑坡属性值是否满足式(7)对决策树的结点6进行分枝

$ 1 /\left(A_3-13\right)+1 /\left(7-A_4\right)<5 / 104 $ (7)

滑坡属性满足式(7)的样本路段进入决策树的结点7,不满足的进入结点8。位于结点7的路段可通行性判断为不可通行,此时结点7的信息熵最小而纯度最大,停止分枝。训练集中共有63个样本满足式(7)进入结点7,这63个样本中实际有56条路段不可通行,正确率为88.89%。

依据路段的滑坡属性值是否满足式(8)对决策树的结点8进行分枝

$ 1 /\left(A_2-102\right)+1 /\left(14-A_3\right) \leqslant 15 / 14 $ (8)

滑坡属性满足式(8)的样本路段进入决策树的结点9,不满足的进入结点10。位于结点9的路段可通行性判断为可通行,此时结点9的信息熵最小且纯度最高,停止分枝。训练集中共有29个样本满足式(8)进入结点9,这29个样本中有28条路段均可通行,正确率为96.55%。

依据路段的滑坡属性值是否满足式(9)对决策树的结点10进行分枝

$ 3 / 7 \leqslant A_4 / 7<1 $ (9)

滑坡属性满足式(9)的样本路段进入决策树的结点11,不满足的进入结点12。位于结点11的路段可通行性判断为不可通行,此时结点11的信息熵最小而纯度最大,决策树不继续生长。训练集中共有61个样本满足式(9)进入结点11,这61个样本中有59条路段不可通行,误判率不到4%。进入结点12的路段可通行性判断为可通行,结点12的信息熵达到最小纯度则达到最大,决策树终止分枝。训练集中共有122个不满足式(9)的样本进入结点12,这122个样本中有112条路段可通行,正确率为91.80%。

将上述地震滑坡道路可通行性的MDT判断规则绘制成传统的树结构,如图 13所示。MDT模型除了满足每个结点划分信息熵最小即纯度最高的要求外,还要保证模型评估结果具有统计学意义和能满足实际工作需要。结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法,本研究中通过计算P值来检验模型在统计学上的显著性。对是否满足实际工作的需要,可以考虑模型评估的正确率和进行kappa检验。正确率表示的是评估结果符合样本实际的比例,kappa系数反映的是模拟结果与实际情况的一致性程度,kappa系数的计算结果为-1~1,但通常kappa值落在0~1间,通行的做法是将kappa值分为五组来表示不同级别的一致性:0~0.20表示极低的一致性(slight)、0.21~0.40表示一般的一致性(fair)、0.41~0.60表示中等的一致性(moderate)、0.61~0.80表示高度的一致性(substantial)和0.81~1表示几乎完全一致(almost perfect)。利用图 13中的判断规则,对汶川地震灾区的测试集和训练集所有样本的地震滑坡道路可通行性进行了MDT推断,并与实际道路可通行情况做比较。从计算结果(表 2)看,汶川地震灾区的检验P值为2.52×10-203,远小于0.001,总体正确率达到98.50%,kappa系数达到0.91,介于0.81~1,模型评估结果与实际情况的一致性程度为几乎完全一致。可通行性为可通行的道路发生地震滑坡中断的数量仅占该类路段的0.958%,可通行性为不可通行的道路上发生地震滑坡中断的数量是其他路段的12.3倍。由此可见,MDT模型计算的可通行性是路段是否出现地震滑坡中断的良好指标。对比C4.5的决策树方法,MDT模型覆盖了更广泛的范围,且具有更高的差异显著性,即更显著的统计学意义,以及具有更高的kappa系数,即更高的一致性和更高的总体正确率。

图 13 基于汶川地震灾区建立的地震滑坡道路可通行性MDT

表 2 基于MDT模型评估的结果(汶川地震灾区)

利用上述模型,在ARCGIS中采用地震后现场调查的地震烈度计算各路段的地震滑坡道路可通行性,来反演汶川地震灾区地震滑坡可通行性空间分布(图 14(a))。与早期的研究对比,MDT模型不仅能对高烈度区的地震滑坡道路可通行性进行推断,也能较好地判断低烈度区的地震滑坡道路可通行性,具有更好的通用性。对照实际情况(图 9)发现,模型评估结果为不可通行而实际可通行的路段主要是高烈度区的少量高速公路,而模型计算为可通行但实际却因滑坡中断的主要是低烈度区的部分省道。我们认为出现这种情况的原因是在模型构建时未对道路进行分类构建,由于高速公路的地震滑坡易损性相对较低,而省道的地震滑坡易损性相对较高,但在建模时其易损性被认为是一致的,因此出现了这种情况。

图 14 研究区地震滑坡道路可通行性空间分布反演
2.5 模型在鲁甸地震灾区和彝良地震灾区的应用

以云南2014年鲁甸MS6.5地震灾区和2012年彝良MS5.7、MS5.6地震灾区为研究区域,对该方法在自然地理环境相似区域和不同规模地震影响下地震滑坡道路可通行性快速评估可移植性进行检验。将在汶川地震灾区建立的地震滑坡道路可通行性MDT模型移植到鲁甸地震灾区和彝良地震灾区时,所有数据处理方法、建模指标和模型参数均不发生变化。鲁甸地震灾区和彝良地震灾区的地震滑坡道路可通行性空间分布反演结果如图 14(b)所示。虽然鲁甸地震和彝良地震的震级、最高烈度、地震滑坡规模均远不如汶川地震严重,但由于地处高山峡谷地区,仍然出现不同程度的地震滑坡道路中断情况。从模型推断情况和实际通行状况统计结果(表 3)可以看出,鲁甸地震灾区和彝良地震灾区地震滑坡可通行性的检验P值更加接近于0,总体正确率达到99.67%,kappa系数达到0.81,一致性检验比汶川地震灾区的略低,但一致性程度仍几乎完全一致。可通行性属性为可通行的道路发生地震滑坡中断的路段仅占该类路段的1.31%,可通行性属性为不可通行的道路因地震滑坡中断的数量是其他路段的5.2倍。由此表明,计算出的道路可通行性是路段是否因滑坡中断的良好指标,可以把在汶川地震灾区建立的模型推广到具有相似自然地理环境的另一个地区,在误差允许的范围内,所建立的方法可以用于我国西南区域更大范围和不同震级影响下的地震滑坡道路可通行性快速评估。

表 3 基于MDT模型评估的结果(鲁甸地震灾区和彝良地震灾区)
3 讨论

显然,路段单元的可通行性与地震滑坡敏感性水平之间的紧密关系是本文建立地震滑坡道路可通行性快速评估方法的关键。如上所述,该模型的成立需要3个条件:①评估对象的基本单元为路段,在评估的过程中,需要将整条的道路进行路段化处理,而并非笼统地将一条道路作为一个评价单元;②路段两侧的缓冲区距离为180m,且只做路段两侧的缓冲而不包含路段两端,这个数值是根据汶川地震滑坡位移的水平投影距离统计得到的;③所使用的地震滑坡敏感性水平数据是90m×90m的栅格数据。而后者又包括2个条件,滑坡敏感性数据是基于烈度为地震动影响参数的产品数据,滑坡敏感性水平从低到高分为5个等级,相应的滑坡像元的属性值为1~5。在这3个条件中,如果评价的基本单元发生变化,或者缓冲距离和缓冲方式发生变化,亦或是使用的地震滑坡敏感性水平数据不是90m×90m的栅格数据,该方法的有效性均有可能发生变化。

在建立地震滑坡道路可通行性快速评估方法时,将道路进行路段定制,其原因为考虑路段是道路网络上连接2个节点的基本要素,理论上,路段上任何一个位置出现中断,则整条路段作为2个节点之间的运输功能也随之失效。但是,各条路段的实际长度是不一样的,这就带来一个问题:各路段缓冲区范围内的滑坡敏感性水平像元总数量也是不一样的,因此,模型仍然存在一定的误差。另外,在本研究中,对高速公路、国道、省道统一建立了一个完全相同的快速评估方法,这样的好处是能简化建模方法和减少道路可通行性快速评估时的计算量,存在的问题则是会增加评估结果的相对误差。若能统一评估单元的几何属性和针对不同公路等级给出不同的模型,有望能进一步提高模型评估的精度。

针对路段单元的地震滑坡可通行性与地震滑坡敏感性水平属性之间的关系,可以用不同模型去描述,本研究仅使用了MDT模型来建立地震滑坡道路可通行性与地震滑坡敏感性水平像元数量之间的关系,并与之前的C4.5模型进行简单比较。不同类型的模型会带来不同的评估效果,如何开发不同的模型并筛选出更有效的模型是一个亟待解决的问题。

通过对汶川地震灾区、鲁甸地震灾区和彝良地震灾区进行的方法建立与应用的初步尝试表明,本文提出的以路段为基本单元的地震滑坡道路可通行性快速评估方法是有效的,且在其他多山区域的地震损失快速评估和风险预测中也可能具有一定的应用前景。同时,该方法本质上是一种机器学习方法,当样本越大或研究区范围越广时,该方法评估结果的误差可能越小;相反,如果研究区的地震震级越小或范围越狭窄,由于路段长度的离散性等偶然性因素的影响,用该方法评估的地震滑坡道路可通行性相对误差可能存在更大的离散性。

本文提出的地震滑坡道路可通行性快速评估方法,是对现有地震地质灾害道路可通行性评估方法存在不足这一现状的探索性研究,试图能在地震后定量化计算地震滑坡导致的道路可通行性空间分布情况,以便及时制定合理的交通管制策略和启动必要的空中支援。在历史地震滑坡道路中断数据的丰富性、基础数据的现势性、模型方法的多样性等方面,本文方法可能存在一定的不足,需要在今后进一步完善和发展。

4 结论

道路可通行性空间分布的快速评估结果对减轻地震灾害风险的区域规划和减少地震灾害损失的应急救援决策拟定均有重要影响。在山高坡陡的西南地区,除了地震动的直接破坏外,地震地质灾害是影响道路是否中断的重要因素,为了发展和完善地震灾害的道路可通行性评估方法,本文提出一种基于MDT地震滑坡道路可通行快速评估方法。该方法包括3个基本步骤,首先是将评估对象的基本单元定义路段,然后对路段进行地震滑坡属性赋值,即统计路段两侧180m范围内不同滑坡敏感性水平的像元数量,将统计结果作为路段的地震滑坡危险性属性,最后,用本研究提出的路段地震滑坡属性与可通行性之间的MDT模型对路段的可通行性进行计算,根据计算结果进行研究区道路可通行性空间分布制图。

选取四川2008年汶川MS8.0地震灾区、云南2014年鲁甸MS6.5地震灾区及2012年彝良MS5.7、MS5.6地震灾区3个自然地理环境相近的区域进行地震滑坡道路可通行性快速评估方法和模型构建的研究。其中,汶川地震灾区用来进行模型的构建和模型合理性检验,鲁甸地震灾区和彝良地震灾区用来进行模型外延适用性评价。基于汶川地震灾区建立的模型,其检验P值为2.52×10-203,远小于0.001,通过模型评估的道路可通行性总体正确率达到98.50%,kappa系数为0.91,模型评估结果与实际情况几乎完全一致。可通行性为可通行的道路发生地震滑坡中断的路段仅占该类路段的0.958%,可通行性为不可通行的道路上发生地震滑坡中断的数量是其他路段的12.3倍,表明在汶川地震灾区建立的MDT模型计算的可通行性是路段是否因地震滑坡中断的良好指标。对比已有的C4.5决策树方法,MDT模型覆盖了更广泛的范围,且具有更高的差异显著性,即更显著的统计学意义,以及更高的kappa系数,即更高的一致性和更高的总体正确率。将所建立的方法和模型移植到鲁甸地震灾区和彝良地震灾区时,评估结果的检验P值为9.7×10-107,总体正确率达到99.67%,kappa系数为0.81,介于0.81~1,模型评估结果与实际情况也几乎完全一致。可通行性为可通行的道路发生地震滑坡中断的路段仅占该类路段的1.31%,可通行性为不可通行的道路上发生地震滑坡中断的数量是其他路段的5.2倍。鲁甸地震灾区和彝良地震灾区的结果表明,计算出的道路可通行性是路段是否因滑坡中断的良好指标,在允许存在一定误差的情况下,所建立的方法可以用于我国西南具有相似自然地理环境的更大范围区域和不同震级影响下的地震滑坡道路可通行性快速评估。

参考文献
白仙富、戴雨芡、余庆坤等, 2015, 地震滑坡危险性评估模型及初步应用, 地震研究, 38(2): 301-312.
常燕敏, 2013. 无人机影像在地震灾区道路损毁应急评估中的应用研究. 硕士学位论文. 成都: 西南交通大学.
高庆华, 2003, 中国21世纪初期自然灾害态势分析, 北京: 气象出版社.
高庆华, 2007, 中国减灾需求与综合减灾, 北京: 气象出版社.
高庆华、李志强、刘惠敏等, 2008, 自然灾害系统与减灾系统工程, 北京: 气象出版社.
高庆华、刘惠敏、李晓丽, 2011a, 中国地震次生地质灾害区域风险评估, 北京: 气象出版社.
高庆华、聂高众、张业成, 2011b, 论地震风险, 北京: 气象出版社.
兰日清、丰彪、王自法, 2009, 震后公路桥梁通行能力快速评估技术研究, 世界地震工程, 25(2): 81-87.
刘凤民、张立海、刘海青等, 2006, 中国地震次生地质灾害危险性评价, 地质力学学报, 12(2): 127-131. DOI:10.3969/j.issn.1006-6616.2006.02.003
苏有锦、秦嘉政, 2001, 川滇地区强地震活动与区域新构造运动的关系, 中国地震, 17(1): 24-34. DOI:10.3969/j.issn.1001-4683.2001.01.004
唐川、朱静、张翔瑞, 2001, GIS支持下的地震诱发滑坡危险区预测研究, 地震研究, 24(1): 73-81. DOI:10.3969/j.issn.1000-0666.2001.01.012
陶舒、胡德勇、赵文吉等, 2010, 基于信息量与逻辑回归模型的次生滑坡灾害敏感性评价——以汶川县北部为例, 地理研究, 29(9): 1594-1605.
王秀英、聂高众、马牧军, 2012, 地震滑坡灾害评估中地震影响因素的联合应用, 地震学报, 34(1): 76-84. DOI:10.3969/j.issn.0253-3782.2012.01.007
王秀英、聂高众、王松, 2011, 利用模糊数学方法建立汶川地震滑坡灾害评判标准, 岩土力学, 32(2): 403-410. DOI:10.3969/j.issn.1000-7598.2011.02.014
许冲、戴福初、姚鑫等, 2010, 基于GIS的汶川地震滑坡灾害影响因子确定性系数分析, 岩石力学与工程学报, 29(增刊Ⅰ): 2972-2981.
许冲、戴福初、姚鑫等, 2019a, GIS支持下基于层次分析法的汶川地震区滑坡易发性评价, 岩石力学与工程学报, 28(增刊Ⅱ): 3978-3985.
许冲、徐锡伟, 2012, 基于GIS与ANN模型的地震滑坡易发性区划, 地质科技情报, 31(3): 116-121.
许冲、徐锡伟、周本刚等, 2019b, 同震滑坡发生概率研究——新一代地震滑坡危险性模型, 工程地质学报, 27(5): 1122-1130.
周志华, 2016, 机器学习, 88-91, 北京: 清华大学出版社.
庄建琦、崔鹏、葛永刚等, 2010, "5· 12"汶川地震崩塌滑坡危险性评价——以都汶公路沿线为例, 岩石力学与工程学报, (增刊2): 3735-3742.
An J W, Bai X F, Xu J H, et al, 2015, Prediction of highway blockage caused by earthquake-induced landslides for improving earthquake emergency response, Nat Hazards, 79(1): 511-536.
Capolongo D, Refice A, Mankelow J, 2002, Evaluating earthquake-triggered landslide hazard at the basin scale through GIS in the upper Sele River valley, Sur Geophys, 23(6): 595-625.
Chousianitis K, Del Gaudio V, Kalogeras I, et al, 2014, Predictive model of Arias intensity and Newmark displacement for regional scale evaluation of earthquake-induced landslide hazard in Greece, Soil Dyn Earthq Eng, 65: 11-29.
Del Gaudio V, Pierri P, Calcagnile G, 2012, Analysis of seismic hazard in landslide-prone regions: criteria and example for an area of Daunia(southern Italy), Nat Hazards, 61(1): 203-215.
Del Gaudio V, Wasowski J, 2004, Time probabilistic evaluation of seismically induced landslide hazard in Irpinia(Southern Italy), Soil Dyn Earthq Eng, 24(12): 915-928.
Havenith H B, Strom A, Caceres F, et al, 2006, Analysis of landslide susceptibility in the Suusamyr region, Tien Shan: statistical and geotechnical approach, Landslides, 3(1): 39-50.
James N, Sitharam T G, 2014, Assessment of seismically induced landslide hazard for the state of karnataka using GIS technique, J Indian Soc Remote Sens, 42(1): 73-89.
Jibson R W, 2007, Regression models for estimating coseismic landslide displacement, Engineering Geology, 91(2~4): 209-218.
Kamp U, Growley B J, Khattak G A, et al, 2008, GIS-based landslide susceptibility mapping for the 2005 kashmir earthquake region, Geomorphology, 101(4): 631-642.
Kamp U, Owen L A, Growley B, et al, 2010, Back analysis of landslide susceptibility zonation mapping for the 2005 kashmir earthquake: an assessment of the reliability of susceptibility zoning maps, Nat Hazards, 54(1): 1-25.
Murthy S K, Kasif S, Salzberg S, 1994, A system for induction of oblique decision trees, Journal of Artif Intell Res, 2: 1-32.
Xu C, Dai F C, Xu X W, et al, 2012a, GIS-based support vector machine modeling of earthquake-triggered landslide susceptibility in the Jianjiang River watershed, China, Geomorphology, 145~146: 70-80.
Xu C, Xu X W, Dai F C, et al, 2012b, Landslide hazard mapping using GIS and weight of evidence model in Qingshui River watershed of 2008 Wenchuan earthquake struck region, J Earth Sci, 23(1): 97-120.
Xu C, Xu X W, Dai F C, et al, 2013a. Application of an incomplete landslide inventory, logistic regression model and its validation for landslide susceptibility mapping related to the May 12, 2008 Wenchuan earthquake of China. Nat Hazards, 68(2): 883~900.
Xu C, Xu X W, Yao X, et al, 2013b. Three(nearly)complete inventories of landslides triggered by the May 12, 2008 Wenchuan MW7.9 earthquake of China and their spatial distribution statistical analysis. Landslides, 11(3): 441~461.