中国地震  2019, Vol. 35 Issue (2): 389-398
地震应急数据库中人口数据预测——以乌鲁木齐市为例
谢江丽, 李帅, 姚远     
新疆维吾尔自治区地震局, 乌鲁木齐 830011
摘要:利用统计年鉴、人口普查数据、遥感影像等资料,将乌鲁木齐市按区县级行政区域为单位提取近10年的人口数据,确定各区县历年来人口分布变化情况。挖掘研究区内人口-时间变量关系,建立人口预测模型——GM(1,1)模型,预测未来2年乌鲁木齐各区县人口数据,以弥补数据库数据因滞后2年无法及时更新所导致的数据空缺。
关键词GM(1, 1)模型    人口预测    应急数据    乌鲁木齐    
Prediction of Population Data in Earthquake Emergency Database——a Case Study of Urumqi
Xie Jiangli, Li Shuai, Yao Yuan     
Earthquake Agency of Xinjiang Uygur Autonomous Region, Urumqi 830011, China
Abstract: By using statistical yearbooks, census data, remote sensing images, we extracted all population data for the past 10 years at the Urumqi City's administrative region units, and we determined the changes in population distribution over the years in each unit of the study area. By excavating the relationship between population and time variables in the study area, we established a population forecasting model(GM(1, 1)model)to predict population data in various districts of Urumqi in the next two years, and to make up for the data gaps that could not be updated in the next two years in the database.
Key words: GM(1, 1)model     Population projections     Emergency database     Urumqi    
0 引言

“十五”期间,我国31个省(直辖市、自治区)建立了地震应急指挥技术系统(何少林等,2007),其中,地震应急基础数据是整个地震应急指挥系统进行抗震救灾指挥决策的基础和核心,为地震灾害评估和了解地震灾害影响提供背景数据、为抗震救灾指挥决策提供救灾力量储备数据(姜立新等,2004)。地震应急基础数据库的数据对地震灾害损失快速评估有决定性影响,对以往的地震灾害(汶川地震、新疆伽师地震等)分析可知,其中人口分布情况会直接影响地震灾害损失快速评估的结果。地震应急数据库中的人口数据的更新具有复杂性、艰巨性和长期性的特征,无法实现随社会发展同步更新。本研究主要通过统计人口数据,采用定性描述及定量分析模型,反演出人口等在一定时间和一定地理空间中的分布状态,以弥补因数据库无法及时更新而出现的数据空缺。

1 研究区数据收集

城市在人类发展中占据着重要的地位,人作为城市最主要的组成部分,其不同的分布、集散及组合情况能够反映出城市经济发展、城市规划建设、交通运输等差异状况。乌鲁木齐市城区南边为戈壁,气候环境恶劣,因此受地形地貌、资源环境的影响,乌鲁木齐市城区发展向北边延伸,如新市区的人口聚集。随着经济水平的提高,外来人口逐渐向城市聚集,原有的市区规划已不能满足人口增长的需求,天山区、沙依巴克区等老城区必然面临着改造,因此人口变动空间格局具有历史的必然性。

本研究将乌鲁木齐市按行政区划选取天山区、沙依巴克区、新市区、水磨沟区、头屯河区、米东区、达坂城区、乌鲁木齐县等作为研究区,利用《乌鲁木齐统计年鉴》(陈志敏,200820092010王伟,2011黄国森,201220132014潘世锦,201520162017)、人口普查数据来提取人口数据(表 1)。

表 1 2007~2015年乌鲁木齐各区县人口数据

由2007~2015年乌鲁木齐市各区县人口分布比例(表 2)可见,天山区、水磨沟区、达坂城区基本保持平衡,新市区、头屯河区所占比例有所增加,沙依巴克区、米东区、乌鲁木齐县所占比例有所减少,由此可见,乌鲁木齐市人口逐渐由沙依巴克区、米东区、乌鲁木齐县转移到新市区、头屯河区。

表 2 2007~2015年乌鲁木齐各区县人口所占比例

通过对乌鲁木齐市人口变动情况的分析,可得到以下结论:近10年来主城区人口数量呈增长的趋势,但表现出“头屯河区和新市区人口数量增长率大、密度小;天山区、沙依巴克区人口数量增长率小、密度大”的区域差异格局(毛亚会等,2017)。

依据收集的人口数据,得到乌鲁木齐市各区县人口随时间变化图(2007~2015年)(图 1)。由图 1可见,相对于五普数据,六普数据波动更大,大部分地区人口呈增加趋势。头屯河区、乌鲁木齐县人口数据在2011年变化较大,经查找资料可知,由于行政区域重新规划,2个相邻区县面积相互调整,导致2010~2011年数据出现阶梯,故头屯河区、乌鲁木齐县人口数据采用2011~2015年人口普查数据。

图 1 乌鲁木齐各区县人口随时间的分布 2007~2010年为第五次人口普查(简称为五普)数据;2011~2015年为第六次人口普查(简称为六普)数据
2 理论分析与模型建立

选择具有适用性和科学性的人口预测模型是所得预测结果能够符合人口发展趋势的前提。人口预测研究的方法主要有基于微分方程的Logistic模型、基于数理统计的线性回归模型、基于矩阵法的Leslie模型。总体可概括为一元线性回归模型、多元回归模型、人口增长率法、指数函数法、幂函数法、Leslie模型、Logistic模型、灰色系统GM(1,1)模型、系统动力学等。人口预测方法有其优点和适用范围,可对不同的人口发展变化规律进行预测,因此在选择具体方法时必须结合人口预测的特点。

2.1 灰色系统GM(1,1)模型

1982年邓聚龙(1990)创立灰色系统理论以研究部分信息已知、部分信息未知的系统,并提出灰色系统预测的概念。其基本思路是,通过对原始数据进行有规则的处理,寻求数据间的内在联系,并对生成变换后的数列建立连续的微分方程动态模型,通过对该模型的求解变换得到预测结果。其中,应用较为广泛的是GM(1,1)模型,它是一个一阶单序列的线性动态模型,该模型通过五步建模灰色生成或序列算子的作用弱化原始数据的随机性,使其呈现较为明显的特征规律,对于原始数据序列较短且随机性较强的预测具有较好的效果。

对于给定的原始时间序列x(0)={x(0)(1),x(0)(2),…,x(0)(n)},经过累加生成新的数据序列x(1)={x(1)(1),x(1)(2),…,x(1)(n)},其中,${x^{(1)}}(k) = \sum\limits_{k = 1}^k {{x^{(0)}}} (i), k = 1, 2, \cdots, n$。作均值序列Z(1)(k)=0.5x(1)(k-1)+0. 5x(1)(k),构造数据矩阵B

$ \mathit{\boldsymbol{B}} = \left[ {\begin{array}{*{20}{c}} { - {Z^{(1)}}(2), }&1\\ { - {Z^{(1)}}(3), }&1\\ \vdots & \vdots \\ { - {Z^{(1)}}(n), }&1 \end{array}} \right] = \left\{ {\begin{array}{*{20}{c}} { - 0.5\left[ {{x^{(1)}}(1) + {x^{(1)}}(2)} \right], }&1\\ { - 0.5\left[ {{x^{(1)}}(2) + {x^{(1)}}(3)} \right], }&1\\ \vdots & \vdots \\ { - 0.5\left[ {{x^{(n - 1)}}(1) + {x^{(1)}}(n)} \right], }&1 \end{array}} \right\} $

构造数据向量YN =[x(0)(2),x(0)(3),…,x(0)(n)]T;则白化形式的微分方程为$\frac{{{\rm{d}}{x^{(1)}}}}{{{\rm{d}}t}}$+ax(1)=b,式中,ab为待定系数,分别称为发展系数和灰色作用量,a的有效区间为(-2,2)。应用最小二乘法可求得:a=(BTB) -1 BTYN =[ab];进而得到时间序列预测模型

$ X^{(1)}(k+1)=\left[X^{(0)}(1)-\frac{b}{a}\right] \mathrm{e}^{-a k}+\frac{b}{a} $ (1)

式(1)即为一阶累加的拟合模型。

采用灰色系统理论对2007~2015年的数据进行拟合,人口数量拟合结果见表 3。通过计算得到ab值(表 4)。

表 3 采用灰色系统GM(1,1)模型对乌鲁木齐各区人口数据预测拟合

表 4 乌鲁木齐各区县人口增长GM(1,1)模型的参数ab

表 5为精度检验等级参照表,精度等级指标预测值越小,则精度越高。由表 5可见,该预测结果的相对误差基本都达到一级或接近一级水平。利用上述模型对2016~2017年乌鲁木齐各区县人口数据进行预测,预测结果如表 6所示。

表 5 精度检验等级参照表

表 6 2016~2017年乌鲁木齐各区人口数据预测结果
2.2 一元线性回归的建立

在一定时期内人口的发展,人口的增长趋势可能会在很短的时间内变化。假设人口发展过程线上任一点基本保持不变,人口发展速度的切线斜率是一致的,即每个周期的近似线性形式可以采用一元线性回归方法。一元线性回归也叫时间序列法,其原理是利用一元线性回归来进行预测的。基本模型为y=a+bxa为回归常数,是回归直线的截距;b为回归系数,是回归直线的斜率。根据历史数据(样本)和最小二乘(OLS)可以计算出模型的参数ab(王宇等,2016)。

根据2007~2015年的原始数据,使用线性回归方法建立了预测模型(表 7)。由表 7可见,显著性概率sig大部分为0.000~0.003,相关系数为0.728~0.929,说明乌鲁木齐各区县人口与年份之间存在显著的线性关系,各区县的模型效果各不相同,说明每个区县的人口变化情况各不相同,影响因子较复杂。因此,用该模型进行乌鲁木齐各区县人口预测,表 8为对乌鲁木齐各区县人口的原始数据拟合结果,表 9为运用线性方程得出的2016~2017年乌鲁木齐各区县人口数据预测结果。

表 7 乌鲁木齐各区县人口数据一元线性回归参数

表 8 一元线性回归对乌鲁木齐各区县人口数据预测拟合

表 9 一元线性回归对2016~2017年乌鲁木齐各区人口数据预测结果
2.3 不同人口预测模型的结果验证与分析统计

通过对比乌鲁木齐各区县的统计值、灰色系统GM(1,1)模型预测值和一元线性回归模型预测值曲线图(图 2~9)发现,灰色系统GM(1,1)模型能够在更高层次上描述系统的动态过程。灰色系统GM(1,1)模型与一元线性回归预测相比,前者适当过滤了偶然的或不完整的信息和数据预测,提高了预测精度。

图 2 天山区统计值与预测值

图 3 沙依巴克区统计值与预测值

图 4 新市区统计值与预测值

图 5 水磨沟区统计值与预测值

图 6 头屯河区统计值与预测值

图 7 米东区统计值与预测值

图 8 达坂城区统计值与预测值

图 9 乌鲁木齐县统计值与预测值

将2017年乌鲁木齐统计年鉴中2016年乌鲁木齐各区县人口数据与灰色系统GM(1,1)模型预测值和一元线性回归模型预测值进行对比验证(表 10),由表 10可见,灰色系统GM(1,1)模型预测更接近统计值,相对误差更小,其具有较强的实用性和有效性,为预测乌鲁木齐各区县人口数据的理想模型。

表 10 2016年乌鲁木齐各区县人口数据和预测数据
3 结语

地震应急数据库中人口、经济等数据要求每年及时更新,但由于统计数据时间延迟,常使得数据更新周期较长。本研究主要利用数学的方法,从建立增长模型的角度,利用乌鲁木齐统计年鉴提取基础数据进行预测,以建立乌鲁木齐市一级人口数据增长模型,实现静态人口基础数据在地震发生时的动态计算,使其更接近于人口发展的统计情况;在得到统计数据之前,本研究中得到的人口数据可作为应急数据库中相关基础数据更新的补充手段,或作为进行未来几年震害预测时的参考基础数据。

参考文献
何少林、李佐唐、高安泰, 2007, 甘肃省地震应急指挥技术系统设计与实现, 地震地磁观测与研究, 28(5): 71-79. DOI:10.3969/j.issn.1003-3246.2007.05.015
姜立新、吴天安、刘在涛等, 2004, 地震现场应急指挥技术系统的结构与设计, 地震, 24(3): 35-41.
邓聚龙, 1990, 灰色系统理论教程, 武汉: 华中理工大学出版社.
陈志敏, 2008, 乌鲁木齐统计年鉴, 北京: 中国统计出版社.
陈志敏, 2009, 乌鲁木齐统计年鉴, 北京: 中国统计出版社.
陈志敏, 2010, 乌鲁木齐统计年鉴, 北京: 中国统计出版社.
王伟, 2011, 乌鲁木齐统计年鉴, 北京: 中国统计出版社.
黄国森, 2012, 乌鲁木齐统计年鉴, 北京: 中国统计出版社.
黄国森, 2013, 乌鲁木齐统计年鉴, 北京: 中国统计出版社.
黄国森, 2014, 乌鲁木齐统计年鉴, 北京: 中国统计出版社.
潘世锦, 2015, 乌鲁木齐统计年鉴, 北京: 中国统计出版社.
潘世锦, 2016, 乌鲁木齐统计年鉴, 北京: 中国统计出版社.
潘世锦, 2017, 乌鲁木齐统计年鉴, 北京: 中国统计出版社.
毛亚会、余丹林、郑江华, 2017, 近10年来乌鲁木齐市城市人口变动分析, 西北师范大学学报(自然科学版), 53(2): 118-122、134.
王宇、敬莉, 2016, 基于灰色GM(1.1)模型和一元线性回归的人口发展趋势预测——以新疆南疆三地州为例, 西部学刊, (7): 54-59.