中国地震  2024, Vol. 40 Issue (1): 132-143
连续重力观测潮汐与非潮汐信号提取与处理平台设计与实现
韩宇飞1,2,3, 石志敏1,2, 梁星辉1, 祝杰3, 邹锐3, 柳林涛1, 王勇1     
1. 中国科学院精密测量科学与技术创新研究院, 武汉 430071;
2. 中国科学院大学, 北京 100049;
3. 中国地震台网中心, 北京 100045
摘要:介绍了连续重力观测潮汐与非潮汐信号提取与处理平台的平台架构、数据库、主要功能模块、技术特点与功能特性等。该平台面向中国地震重力站网的大网运维业务需求和海量数据处理需求, 以连续重力数据处理中的潮汐信号处理、非潮汐信号处理、时频变换等科学计算为核心, 基于大数据技术实现了中国地震重力站网海量数据的自动清理、数据质量自动评估、数据产品自动产出, 产出重力潮汐因子、时频图等24种数据产品, 提升了连续重力观测数据的应用效能和地震重力站网的运行、管理和服务水平。
关键词中国地震重力站网    连续重力观测    重力固体潮    非潮汐信号    
Research and Development of Processing Platform for Continuous Gravity Observation Data Service
Han Yufei1,2,3, Shi Zhimin1,2, Liang Xinghui1, Zhu Jie3, Zou Rui3, Liu Lintao1, Wang Yong1     
1. Innovation Academy for Precision Measurement Science and Technology, CAS, Wuhan 430071, China;
2. University of Chinese Academy of Science, Beijing 100049, China;
3. China Earthquake Networks Center, Beijing 100045, China
Abstract: In this article we introduced the architecture, database, main functional modules, technical features and functional characteristics of the platform for extracting and processing gravity tidal and non-tidal signals from continuous gravity observation data. The platform meets the needs of large-scale network operation and massive data processing of China's seismic gravity station network. Through calculation of tidal signal processing, non-tidal signal processing and time-frequency conversion in continuous gravity data processing, the automatic cleaning, data quality evaluation and data product production of the massive data of China's seismic gravity station network are realized based on big data technology. Products of 24 kinds data such as gravity tidal factor and time-frequency graph were produced, which improved the application efficiency of continuous gravity observation data and the operation, management and service level of seismic gravity station network.
Key words: China Earthquake Gravity Station Network     Continuous gravity observation     Gravity solid tide     Non-tidal signal    
0 引言

重力场是地球的基本物理场,地球时变重力场包含地球系统物质分布及运移的丰富信息,直接反映了地球各圈层最基本的物质及其变化特性(孙和平等,2006),广泛应用于地震监测预报、国家基础测绘、国防建设、科学研究等领域。在科学观测台站安置高精度重力仪进行连续观测可获取长时间尺度、高采样率的连续重力时变信号,既包含由日月及近地行星等天体引起的固体地球地表重力潮汐变化信息,也包含了由板块运动、地壳形变等活动引起的非潮汐重力变化信息。

随着国家重大科技基础设施“中国大陆构造环境监测网络”的实施,我国已经建立了覆盖中国大陆的重力连续变化观测网络,75个台站、78套仪器基本均匀地分布于我国大陆12个有明显相对运动的活动块体内,为重力固体潮研究、地震监测预报业务开展等奠定了坚实基础(韩宇飞等,2020许厚泽,2010)。随着中国地震局《中国地球物理站网(重力)规划(2020-2030年)》(中国地震局,2020)的发布,我国地震重力观测将会全面提升重力站网的标准化、信息化、现代化水平,为地震等自然灾害监测、预测、地球科学研究和其他社会应用提供高精度、高可靠性、高时空分辨率的重力数据产品。然而传统的Tsoft、Eterna、Baytap-G等连续重力数据处理的软件原本是针对重力固体潮观测数据的处理软件,需通过人机交互在目视状态下完成数据处理,高度依赖处理人员的经验,效率低下且处理方法局限、分析功能较少,仅适合基于有限观测数据的个人科研应用,无法满足全国性大网观测与数据产品产出需求。

近年来,随着大数据等信息技术的广泛应用,重力观测信息化工作得到不断推进,产品产出由零散台站发展为全国重力站网海量数据的自动化产品产出。同时,标准时频变换(Liu et al,20092012)等新的数据处理技术的研究,不仅使连续重力观测数据的研究视角扩展至时间域、频率域和时频域,还使得海量数据的重力潮汐参数计算更为简洁、快速。本文介绍了连续重力观测潮汐与非潮汐信号提取与处理平台(以下简称“平台”)的设计、开发与应用情况。通过该平台的建设,实现了中国地震重力站网海量数据的自动清理、数据质量自动评估、潮汐参数自动计算、非潮汐信号评估与分析指标自动产出,提升了地震重力站网的运行、管理和服务水平,并对“十年规划”的落地提供了技术储备和条件支撑。

1 平台设计与实现

该平台是为提升中国地震重力站网的运行、管理和服务水平而设计开发的,深度对接中国地震重力站网观测业务。平台主要针对台站连续重力变化观测数据中的潮汐分量和非潮汐异常进行提取、处理和分析研究,计算获得固体潮各个分潮的理论值与提取值的比对结果并分析各个分潮的时频特征,获取同震重力效应和地震波分离的结果,计算获得非潮汐信号的方差特性以及其漂移特性、功率谱特性、连续度特征和离散度特征等,数据产品以数值、曲线或图像的形式在平台上进行展示,并为用户提供查询和下载服务。

1.1 平台架构设计

平台架构选择直接影响软件系统的性能、可维护性、可扩展性,是平台建设的基础工作。根据中国地震重力站网观测业务现状与数据产品自动产出需求,基于现有的Intel(R)Xeon(R)Gold 5120 CPU2.20GHz,内存512GB的硬件配置,综合考虑面向地震台网全网用户规模大小,数据吞吐量,现有数据存储模式以及平台的可维护性和可扩展性需求,产品生产与展示过程中的数据采集、数据获取、数据处理、产品展示独立运行需求,产品平台选择分层模式作为软件基本架构。

平台分为数据接入层、数据处理层、业务功能层和应用层,总体架构如 图 1所示。

图 1 平台架构设计图

(1) 数据接入层:我国地震重力观测数据流的各个节点上台站观测数据的汇集、存储、管理、处理、交换和应用等环节都需要使用数据库。中国地震重力站网观测数据接入中国地震台网中心地球物理数据库(DB/T 51-2012)(中国地震局,2013),以实现数据管理和共享。因此本平台的数据接入层采用异步任务处理技术、数据库查询和统计接口,对重力站网的观测数据进行接入、解析、格式转换和存储管理。

(2) 数据处理层:数据接入平台数据库后,按照数据处理规范,对数据进行预处理,数据质量评估以及产品数据产出。其中预处理主要涉及观测值粗差剔除、缺失值插值、去漂移等步骤;数据质量评估包括数据离散度、粗糙度、可用率、漂移率计算以及阿伦方差、改进阿伦方差、哈达玛方差计算;产品数据包括潮汐产品、非潮汐产品以及潮汐因子空间分布产品。最终,所有处理的数据录入数据库,供后续业务应用。

(3) 业务功能层:业务功能层主要对数据处理层生产的各项质量评估指标以及数据产品进行前端可视化功能,对生产的数据产品按照台站、时间的方式分类显示。同时提供交互式操作对数据处理层的数据处理任务进行自动任务设置以及手动任务调度,监测任务执行情况。

(4) 应用层:应用层提供业务功能层所展示的数据、图表、报告、文章以及软件工具等内容开放下载,供用户深度分析应用。用户分析后的数据图表等形成的数据报告通过接口上传,对地震事件或异常检测事件进行深度分析、展示。

1.2 数据库选择与设计

平台选择PostgreSQL作为数据库。PostgreSQL在地理信息系统(GIS)和地理空间数据方面具有强大的支持,其提供了丰富的地理空间函数和索引,能够满足产品平台的空间查询以及数据展示功能。PostgreSQL采用MVCC来实现事务的隔离性,允许多个事务并发执行且不会相互干扰,在高并发环境中表现出色。此外,PostgreSQL支持复杂查询、子查询、联合查询等高级查询功能,提供了丰富的数据类型,包括数组、JSON、hstore等,使得可以更灵活地存储和查询数据。PostgreSQL具有ACID(原子性、一致性、隔离性、持久性)事务属性,确保数据的完整性和可靠性,适用于对数据一致性要求较高的应用程序。

平台按照服务类型将数据库分为3个模式:core模式、security模式和gravity模式。其中,core模式主要对平台访问数据进行整合存储,包含data_download_day_log、data_visit_day_log、system_visit_day_log、user_day_log共4个数据表,分别存储数据下载日志,产品数据浏览日志、系统和访问日志、用户注册日志。security模式用于管理平台用户,主要负责用户信息存储、更新与维护,包含用以存储权限等级分类的role数据表,存储用户信息的user数据表以及存储用户所属权限的user_role_relation数据表。gravity模式整合了所有产品数据存储表,包含了t_processing_data、t_dq、t_earth_tide、t_var等共754个数据表,表格依据数据类型、采样间隔、测站名称进行具体命名分类,表格中存储的所有产品及其简要说明见 表 1

表 1 平台产品数据总览
2 数据处理流程及主要功能模块 2.1 数据处理流程

连续重力数据处理主要包括以下5个步骤:

(1) 数据筛选与提取;

(2) 理论固体潮计算;

(3) 数据预处理;

(4) 调和分析、时频分析、方差分析;

(5) 重力数据产品存储与输出显示。

平台数据产品的后台处理流程详见 图 2,平台数据库中的台站原始重力数据表提供数据源,经预处理(包括降采样、Nakai检验、粗差修复、突跳修复等)、数据质量评估(离散度、连续度、可用率、方差)、调和分析(理论潮汐、数据滤波、观测方程求解等)和时频计算(NTFT等)等15个计算模块处理,产出时间序列和空间分布两大类共计24种数据产品(表 1),分别存入平台数据库并按照产品的性质与物理含义显示在平台WEB页面的台站信息、潮汐产品、非潮汐产品、空间分布产品、精化数据产品、地震专题产品等界面。

图 2 平台数据产品的后台处理流程

开发了后台任务调度管理系统(图 3),用于完成数据处理的后台操作。该系统由Monthly模型、Spatiallmage处理、VAR数据处理、NTFT数据处理、TideFactor数据处理、原始数据处理6个自动执行器以及Spatiallmage处理、VAR数据处理、NTFT数据处理、TideFactor数据处理、原始数据处理5个手动执行器组成,具备平台的数据调度、处理、入库和展示的后台操作功能。同时,任务调度管理系统提供了平台运行报表,任务调度日志信息供平台运维工程师监控数据处理任务执行情况,并辅助决策启动手动执行器操作。

图 3 后台任务调度管理系统
2.2 主要功能模块

平台数据处理的主要目的是研究连续重力信号的潮汐变化特征和非潮汐变化特征等,划分为5个主要功能模块:数据读取与转换模块、数据预处理模块、潮汐异常变化特征分析模块、非潮汐异常特征分析模块和分析结果输出显示模块(图 4)。

图 4 平台总体功能设计
2.2.1 数据读取与转换模块

数据读取与转换模块主要实现不同格式、不同形式、不同来源的重力数据的读取、转换及储存等,为平台其他功能实现提供统一的数据访问接口。该模块支持多来源数据读取功能,可以通过直连方式读取现行地震系统运行重力设备、数据库的数据文件;对于读取的多种格式重力观测及其辅助观测设备(气压、温度等)的数据,可单个台站和多个台站批量转换为TSF等通用格式数据。

2.2.2 数据预处理模块

数据预处理模块针对原始重力观测数据中存在的数据缺失、观测粗差等多种干扰因素进行预处理,以保证后续数据处理的准确性和可靠性。

对于重力观测数据,尽管被观测的物理量不是随机变量,但由于其平稳性质,即长时间稳定在平均值左右,故一旦出现较大波动,可认为是粗差。因此对于观测数据中的粗差,综合应用3σ准则与格拉布斯准则进行识别与剔除。3σ准则是比较经典的去粗差方法,操作流程简单,算法设计简单,但对原始数据的平稳性有一定要求,有时可能会去除一些原始数据中的正常值。在原始数据呈正态分布的前提下,通过构造格拉布斯统计量,以一定的检验水平α来选择接受原假设还是拒绝原假设。如果原始数据存在多个异常值,则整体均值会呈现大幅度的升高或降低,利用3σ准则可能会去除比较多的正常值。而格拉布斯检验最多只检测出一个异常值,与3σ准则比较而言,格拉布斯准则具有更好的性质。但正是因为格拉布斯检验最多只检测出一个异常值,所以需要对原始数据不断地进行格拉布斯检验,直至没有异常值为止。

在对重力观测数据进行去粗差后,将异常点从原始数据中剔除,所以该点呈空白状态,即数据缺失。为了使数据保持完整状态,需要对去除粗差后的数据进行补齐操作,即插值。本平台采用三次样条插值方法,不仅实现了低阶多项式插值以避免高阶多项式扰动,还做到了在节点处保持一阶、二阶可导连续。

2.2.3 潮汐异常变化特征分析模块

重力固体潮汐是连续重力观测值中的主要成分。潮汐异常变化特征分析模块的主要步骤是通过多项式拟合消除趋势项,并进行同震重力效应探测和地震波分离,然后基于标准时频变换理论的无为原理,提取其中各个分潮,再用分潮理论值与观测得到的值进行比较分析。潮汐异常变化特征分析模块组成如 图 5所示。

图 5 潮汐异常变化特征分析模块组成
2.2.4 非潮汐异常特征分析模块

连续重力数据中的非潮汐成分与地壳运动、地幔对流、地球内部密度界面如核幔边界的变化、深部物质的变异,甚至与地球表层的因素,如断层活动、地下水、沉积物的迁移和大型工程建设都有关系,因此本平台开发了非潮汐异常特征与分析模块。该模块计算连续重力信号去除潮汐后的连续程度、功率谱特性、漂移率特性;通过阿伦方差评估重力非潮汐时间序列数据不同时段频率偏差相对于相应时段平均值的稳定性;通过改进阿伦方差改善不同类型随机误差的识别能力,解决了阿伦方差不能识别调相白噪声和调相闪变噪声的缺陷;通过哈达吗方差评估非潮汐时间序列时域频率的稳定度,对调频闪烁游走噪声和调频随机奔跑噪声收敛。

2.2.5 分析结果输出显示模块

分析结果输出显示模块主要实现上述4个模块的中间产品、最终产品和分析结果等以图形和文本形式输出和保存,并为平台用户提供浏览与下载功能。

3 技术特点与功能特性 3.1 技术特点

平台技术特点体现在数据多源、自动化运行、可靠稳定、良好的扩展性和高精度重力潮汐参数计算等方面。由于我国地震重力站网长期以来主要依托不同目的、不同来源的建设项目开展,分块设计、多头建设,各项目产品产出、技术要求等均不统一,涉及g-Phone、PET、DZW、GS等多种类型仪器,其观测数据也存在不同分辨率及不同格式等。平台采用3σ准则与格拉布斯准则等方法对原始数据进行清理,可以满足多源数据的处理;采用自动化技术,依托后台任务调度管理系统6个自动执行器,实现对无人值守的连续观测数据进行自动处理,提高了数据处理效率和质量;基于Vendikov改进的调和方法(柳林涛等,2000)实现了M2潮波10-4量级高精度重力潮汐参数计算。平台具备高度的可靠性和稳定性,可长期稳定运行,为地震重力站网数据挖掘与应用提供可靠的数据产品。同时,平台采用模块化设计,可根据需要扩展和升级数据处理和用户服务功能,保持技术的先进性和可持续发展。

3.2 功能特性

平台功能特性主要体现为:

(1) 适应海量数据的采集与存储。全国重力台站海量的连续观测数据和平台自动产出的预处理数据、地球物理参数、表、图件源源不断地汇入平台PostgreSQL数据库,PostgreSQL具备的ACID事务属性确保了数据的完整性和可靠性。

(2) 数据质量快速评估与运维决策支持。平台从原始观测数据、重力固体潮潮汐数据、重力非潮汐数据三个维度进行质量评估,计算观测数据的完整率、可用率、漂移率、粗糙度、固体潮潮波振幅因子中误差等,从而评估台站观测数据的完整性、准确性、一致性等,为台站工程师提供运维决策支持,减轻运维人员的工作负担。

(3) 产品共享与跨平台应用。平台鼓励数据共享与合作,提供开放的数据访问接口与合作机制,开放数据库接口实现数据产品跨平台应用,为“地球物理天地观测一张图”平台提供重力产品参数,实现重力、GNSS、定点形变、电离层等学科产品的联合产出;为“国家地震产品平台”提供产品级应用服务,跨平台发布区域重力背景场图、全国潮汐因子分布图、全国潮汐因子变化分布图、全国非潮汐变化序列图、振幅因子/相位滞后序列数据等重力数据产品。

(4) 用户支持与服务。平台提供全面的用户支持和服务,包括技术培训、使用指导、模型共享等,确保用户能够顺利地使用平台并获取所需的数据产品。

4 业务应用案例 4.1 数据质量自动评估

平台自动产出连续重力观测数据质量评估技术指标与产品图件(图 6),以满足全国地震重力站网运行管理业务的基本需求。平台以月为频度在每月首日自动产出上月全国重力台站观测数据的质量评估指标,从原始观测数据、重力固体潮潮汐数据、重力非潮汐数据三个维度进行质量评估。原始观测数据质量评估指标包括完整率、可用率、漂移率、粗糙度等;重力固体潮潮汐数据质量评估方法是计算固体潮潮汐参数(固体潮潮波振幅因子与相位延迟),并选取了M2潮波的振幅因子中误差作为评估指标;重力测量数据存在漂移、跳变、非潮汐变化等信号,使得重力残差数据表现为有色噪声,传统的统计方法无法收敛,因此在重力非潮汐数据的评估方面,引入阿伦方差、改进阿伦方差和哈达吗方差来描述仪器的稳定度以及噪声特性。

图 6 数据质量评估技术指标与产品图件展示界面
4.2 潮汐产品自动产出

重力固体潮是由于引潮力作用引起的地球重力场产生的随时间有规律的周期性变化。重力固体潮是重力仪观测数据的主要部分,其变化幅度可达200~350μGal,可用于精化地球模型、研究地球自转轴及惯性轴的进动和章动、高精度大地测量改正等,对于科学研究、灾害预报等具有重要意义(陈晓东,2003)。平台基于长期重力观测数据,以月为频度累积叠片式自动解算重力固体潮潮汐参数,在此基础上进一步计算台站当地理论固体潮时间序列(图 7),为重力固体潮研究及非潮汐信号处理提供支撑。经比较,平台自动产出的重力固体潮潮汐参数与传统人机交互型软件产出参数精度相当,但平台实现了自动计算,10s内即可完成人机交互若干天完成的计算任务。

图 7 平台潮汐产品自动产出示例
4.3 非潮汐产品自动产出

重力非潮汐量包含有丰富的构造运动等信息(李瑞浩,1988)。平台在预处理后的重力数据基础上,滤除主要的固体潮潮汐成分,提取重力非潮汐量,获得台站所在区域重力场连续变化值;平台自动启动快速傅里叶变换(FFT)计算,产出每月非潮汐数据的整体信号频率分布,从非潮汐时间序列转换到频率域的视角进行分析;进一步运用标准时频变换方法,产出非潮汐信号时频图,清晰反映某个时间序列信号的信号组成成份以及组成此信号的某个时间上连续的信号的频率与振幅随时间的变化情况,为地震前兆信息挖掘与研究提供数据产品支撑。

5 结语

本文详细描述了连续重力观测潮汐与非潮汐信号提取与处理平台的构架与数据库的设计、主要功能模块及其产出的数据产品的科学算法与集成测试等。该平台的核心是理论固体潮计算、调和分析计算和标准时频变换等的科学算法,在信息技术的支撑下实现了海量观测数据质量自动评估、原始数据自动预处理、重力固体潮潮汐参数自动计算、重力非潮汐数据自动评估与分析。该平台可靠稳定,具有良好的扩展性,较好地满足了中国地震重力站网海量数据的自动清理、数据质量自动评估、数据产品自动产出等需求,提升了地震重力站网的运行、管理和服务水平。目前该平台产品已经在中国地震台网中心正式部署启用,为31个地震省局及75个重力站的管理和应用人员开设了平台账号,丰富的重力产品提升了连续重力观测数据在地震行业中的应用。

随着科技的发展,研究人员越来越关注重力非潮汐信号中微弱信号的探测和研究。重力场非潮汐变化与地球动力学的板块运动、密度界面变形、地幔对流、近地表质量移动和地震的形成过程均有密切关系,因此下一步工作将着重开展非潮汐信号中极移重力、气压影响、海潮负荷影响等精确计算产品的研制,开发更丰富的数据产品,对平台进行优化迭代,进一步强化连续重力观测对震情跟踪、地震会商研判和地球动力学研究等的支撑作用。

参考文献
陈晓东. 2003. 武汉九峰台超导重力仪固体潮观测资料的预处理和分析结果. 硕士学位论文. 武汉: 中国科学院研究生院(测量与地球物理研究所).
韩宇飞、汪健、徐如刚等, 2020, 陆态网络重力测网的分形特征与地震监测能力分析, 中国地震, 36(4): 879-887.
李瑞浩, 1988, 重力学引论, 北京: 地震出版社.
柳林涛、许厚泽、孙和平等, 2000, 重力潮汐参数精密确定的小波分析方法, 中国科学: (D辑), 30(4): 442-448.
孙和平、徐建桥、黎琼, 2006, 地球重力场的精细频谱结构及其应用, 地球物理学进展, 21(2): 345-352.
许厚泽, 2010, 固体地球潮汐, 武汉: 湖北科学技术出版社.
中国地震局, 2013, DB/T 51-2012地震前兆数据库结构台站观测, 北京: 地震出版社.
中国地震局, 2020, 中国地球物理站网(重力)规划(2020—2030年), 北京: 中国地震局.
Liu L T, Hsu H, 2012, Inversion and normalization of time-frequency transform, Appl Math Inf Sci, 6(1S): 67-74S.
Liu L T, Hsu H, 2009, Time-Frequency Transform: Inversion and Normalization, Wuhan: Hubei Science and Technology Press.