中国地震  2021, Vol. 37 Issue (3): 649-658
基于PCA的地震官方微博影响力评价研究
李志恒1, 李红1, 崔昭文1, 权腾龙1, 钟普浴1, 崔华伟1, 于江薇2     
1. 山东省地震局, 济南 250014;
2. 自然资源部信息中心, 北京 100037
摘要:随着政务微博用户规模及影响力的不断提升,微博作为地震部门传播平台,在地震信息传播方面发挥着巨大的作用。本文在充分考虑地震部门行业特点的基础上,对30个地震官方微博数据进行收集,利用主成分分析法(PCA)归纳出3种地震微博的主要影响指标,即服务力主成分、交互力主成分和创作力主成分,并由此构建出地震官方微博影响力评估指标体系,在此基础上计算得出各地震官方微博的主成分指标得分和影响力综合得分,最后根据得分情况对地震官方微博影响力提出了具可行性的提升策略。
关键词地震    微博    主成分分析    影响力    评估体系    
Evaluation of the Influence of Governmental Earthquake Micro-blog Based on Principal Component Analysis
Li Zhiheng1, Li Hong1, Cui Zhaowen1, Quan Tenglong1, Zhong Puyu1, Cui Huawei1, Yu Jiangwei2     
1. Shandong Earthquake Agency, Jinan 250014, China;
2. Information Center of Ministry of Natural Resources, Beijing 100037, China
Abstract: With the rapid development of the size of government micro-blog users and its influence, the function of governmental earthquake micro-blog communication platform has become more and more important. In this paper, under full consideration of the characteristics of the seismic sector, we collected the information from 30 governmental earthquake micro-blogs, and used the principal component analysis(PCA) to analyze the main influence of three kinds of governmental earthquake micro-blog indicators. We have established an evaluation index system for the influence of earthquake official micro-blog, in which the indexes include principal component of service force, principal component of interaction force and principal component of creation force. We have calculated the principal component of seismic micro-blog influence index score and the composite score. Finally, based on the score, we proposed a feasible strategy to improve the influence of the governmental earthquake micro-blogs.
Key words: Earthquake     Micro-blog     Principal component analysis     Influence     Evaluation system    
0 引言

地震作为一种频繁发生的自然灾害,能够造成严重的人员伤亡及经济损失,因此,社会公众对地震相关信息的关注度越来越高,对地震科普知识、地震震情信息等的需求也逐渐增大。随着数字网络传播技术的快速发展,人们通过微博、微信、抖音等新媒体平台获取地震相关信息也越来越普遍。据人民网舆情监测室发布的《2019年政务指数· 微博影响力报告》统计,截至2019年12月26日,经过微博平台认证的政务微博已达179932个,其中政务机构官方微博138854个;据中国互联网络信息中心发布的《第45次中国互联网络发展状况统计报告》显示,截至2020年3月,我国在线政务服务用户规模达6.94亿,占网民总数的76.8% 。由此可知,利用网络新媒体平台进行在线政务服务,已成为包括地震部门在内的各级行政机构进行交流、发布信息、开展服务的重要渠道和手段。地震官方微博是地震部门面向社会公众服务的重要网络平台,从本质上来看其属于政务微博,主要提供震情信息及防震减灾科普服务(吴玉如,2013)。据统计,目前全国有30个省(市、自治区)建立了以各自省级地震局为认证主体的地震官方微博账号;但是,地震官方微博在实际运维过程中,尚存在许多问题,例如对关注用户的需求挖掘不足、推送信息时效性差、微博内容刻板单调、平台互动不充分及推广力度弱等(闫晓美等,2019)。地震官方微博存在的诸多问题已严重降低了其自身的影响力,因此对地震部门官方微博影响力进行比较评价研究,对提升我国地震部门微博运维服务能力和影响力水平具有重要意义。

http://www.people.com.cn/

http://www.cnnic.net.cn/

许多国内外学者曾对微博影响力及比较的方法进行研究。例如,Kwak等(2010)利用Rage Rank模型对Twitter用户影响力进行了评价,并发现粉丝数与转发数之间存在弱相关性;Lee等(2010)通过实证分析,提出了基于时间序列的Twitter影响力排序方法,该方法可对拥有潜在影响力的用户进行挖掘;杨长春等(2018)对微博影响力的影响因素进行了分析归纳,利用H指数对微博用户进行筛选,并基于层次分析法构建了政务微博影响力评价指标体系;张绍武等(2015)根据微博价值及信息传播过程中用户活跃度及产生的影响力扩散,提出了微博影响力、活跃度影响力及行为影响力的度量方法;齐超等(2014)对微博用户评论、转发和提及3种行为进行分析,利用统计分析方法将不同行为对微博影响力的贡献度进行比较,发现用户行为中最能反映微博影响力大小的是用户转发情况。

综上所述,通过对相关文献资料的阅读,发现国内外学者对微博影响力的研究主要集中在基于数学算法模型研究和基于微博用户行为研究两方面,本文综合参考现有的微博影响力评价理论,结合地震行业特点,利用主成分分析法,结合收集到的各地震官方微博的基础运维数据,构建出地震官方微博影响力评价指标体系,并测算地震官方微博影响力指标的得分水平,从而对各地震官方微博影响力进行比较评价分析,以期为地震官方微博提升传播影响力水平提供建议。

1 研究设计与方法 1.1 主成分分析法概述

主成分分析法是多元统计方法中的一种,英文简写为PCA,其利用降维思想将多个原始相关变量转化成几个不相关且正交的综合变量(即主成分),转换之后得到的每个综合变量均可反映原始变量的大部分信息(James et al,1990Robertson et al,2001朱建平,2006Yousefi et al,2017Tang et al,2018)。

1.2 数据来源

本文以新浪微博为研究平台,选取全国地震系统30个省级地震局的官方微博作为调查对象(表 1),利用Python程序和爬虫工具挖掘各个地震微博号的基础运维数据。数据包括微博总数、粉丝数、关注数、开通月数以及评估期内的微博数、原创数、评论数、转发数、点赞数。本次研究共计收集原始数据10573条。

表 1 全国省级地震局官方微博账号信息
2 地震官方微博影响力指标体系构建与分析 2.1 指标选取

在微博影响力评估指标的选取方面,已有很多学者进行过研究(李志宏等,2016刘健等,2016李勇等,2016胡媛等,2017张雪梅等,2020)。本次研究在结合前人研究成果的基础上,从微博的基本功能着手(刘清等,2014),对地震微博用户的特征行为进行调研,发现地震微博的用户行为包括地震博主行为和其他用户行为,其中地震博主行为主要包括开通微博、推送微博、关注他人微博、转发微博行为等;其他用户行为主要包括关注地震博主及转发、评论、点赞地震博主微博行为等。以这两类行为为基础,对地震官方微博影响力评估指标进行挖掘;考虑到地震微博具行业特殊性,其发布的微博多为震情信息和地震科普知识等服务社会大众的内容,故还需从其推送的微博内容上挖掘影响力指标。

本文在综合考虑地震微博特色、用户行为及数据可获得性的前提下,共选取13个影响力指标(表 2),其中部分指标数据来源于2020年6月1日至8月31日的微博。选取上述时间段是因为在选取指标时,需保证指标数据的时效性和可靠性;此外,由于各省级地震局官方微博账号的关注度和影响力受本地区的地震震情影响较大(李志恒等,2020),为反映地震官方微博账号的实际运维情况,在选取样本近期运维数据的评估期时间段时,将结合中国地震台网官方网站所示的全国震情数据选择无较大震情的时间段;最终,选取的近期运维数据的评估期时间段为2020年6月1日至8月31日。

表 2 地震官方微博影响力评估指标
2.2 基于主成分分析的评估指标体系构建

本研究使用IBM SPSS Statistics 22.0软件对指标数据进行分析处理。由于所选指标数据具不同数量级,故首先需要对数据进行标准化处理;然后再对标准化处理后的数据进行相关检验,判断能否对数据进行降维处理,即检验数据是否适合采用主成分分析法进行因子分析(曹鑫等,2020)。检验的方法为KMO检验和Bartlett球形度检验(张颖超等,2020洪增林等,2020),检验结果见表 3

表 3 KMO和Bartlett球形度检验结果

表 3可知,所选数据的KMO检验值为0.682且大于0.5,Bartlett球形度检验P值为0且小于0.01,由此可以认为所选指标数据适合进行主成分分析。在SPSS软件中对标准化数据进行主成分分析,计算各主成分的贡献率和累积贡献率,并以特征值大于1和方差大于80%为数据筛选标准,得出结果如表 4所示。

表 4 地震官方微博影响力评估指标特征值及方差贡献率

根据表 4,共筛选出3个主成分,即F1F2F3,其特征值分别为8.153、2.114、1.177,对应的各主成分的方差贡献率为58.236%、15.100%、8.407%,累积方差贡献率达81.743%,说明进行主成分分析的结果较为理想,故可将原始的13个评估指标分为3类,并用这3个主成分进行后续分析。为了对上述选取的主成分进行命名和做出更加合理的解释,可利用方差最大正交旋转对因子载荷矩阵进行旋转,得到的旋转成分矩阵见表 5

表 5 地震官方微博影响力评估指标因子载荷矩阵旋转后的成分矩阵

表 5可知,粉丝数、关注数、微博总数、更新频率(条/月)、微博数(6—8月)、日均微博数(6—8月)、震情微博数(6—8月)、地震科普微博数(6—8月)等8个指标在主成分F1中具较高载荷,以上指标体现出地震官方微博的覆盖水平及发布信息情况,能够说明地震微博的服务能力水平,故可以将F1命名为服务力主成分;在F2中,评论数(6—8月)、转发数(6—8月)、点赞数(6—8月)、反馈率(6—8月)等4个指标载荷较高,以上指标体现地震官方微博与受众之间交流、互动的情况,故将F2命名为交互力主成分;在F3中,原创率(6—8月)指标载荷较高,该指标反映地震微博的原创情况,体现创作能力,故可将F3命名为创作力主成分。根据以上分析,再结合地震官方微博影响力评估指标选取结果,可构建出地震官方微博影响力评估指标体系(图 1)。

图 1 地震官方微博影响力评估指标体系
3 地震官方微博影响力实证分析 3.1 基于主成分得分的地震官方微博影响力评估

对30个目标地震官方微博影响力及服务力、交互力、创作力进行定量评价,使用表 5中载荷矩阵的数据除以对应主成分的特征值,再将结果开平方根,得到3个主成分中每个指标对应的系数(表 6),进而可得出各主成分的得分系数公式。

表 6 主成分得分系数矩阵

表 6,得到的地震官方微博服务力F1、交互力F2、创作力F3的得分系数公式分别为

$ \begin{aligned} F_{1}=& 0.278 X_{1}+0.206 X_{2}+0.302 X_{3}+0.303 X_{4}+0.339 X_{5}+0.068 X_{6}+0.339 X_{7}+0.337 X_{8}+\\ & 0.276 X_{9}+0.157 X_{10}+0.145 X_{11}+0.114 X_{12}+0.033 X_{13} \end{aligned} $ (1)
$ \begin{aligned} F_{2}=&-0.028 X_{1}-0.321 X_{2}-0.211 X_{3}-0.007 X_{4}+0.065 X_{5}-0.028 X_{6}+0.065 X_{7}+0.076 X_{8}-\\ & 0.123 X_{9}+0.519 X_{10}+0.564 X_{11}+0.569 X_{12}+0.598 X_{13} \end{aligned} $ (2)
$ \begin{aligned} F_{3}=&-0.44 X_{1}+0.094 X_{2}+0.184 X_{3}+0.189 X_{4}+0.03 X_{5}+0.82 X_{6}+0.03 X_{7}+0.094 X_{8}+\\ & 0.123 X_{9}+0.285 X_{10}+0.182 X_{11}+0.126 X_{12}-0.029 X_{13} \end{aligned} $ (3)

将各个主成分的方差贡献率(表 4)作为定量计算地震微博影响力的权重系数,得出的地震官方微博影响力F的综合得分公式为

$ F=0.582 F_{1}+0.151 F_{2}+0.084 F_{3} $ (4)

由式(1)~(4),可定量计算出各个目标地震微博用户的服务力、交互力及创作力的具体得分数值以及地震微博影响力的综合得分数值(表 7)。

表 7 30个地震官方微博各主成分得分及影响力综合得分

根据表 7所示的结果,可以看出各省级地震局的官方微博在服务力、交互力、创作力及综合影响力得分方面差距明显。从整体上看具有不平衡性及两极分化性,例如河北省地震局和四川省地震局的官方微博在各方面指标得分均具较高水平,说明其微博运维管理较好,官方微博影响力较高,且具有借鉴性;反观综合影响力得分小于1的地震官方微博,在各方面指标得分均不高,说明其地震官方微博建设不足,存在运维方面问题,需要对地震微博运维的发展予以足够的关注。从各指标分值分布上来看,各指标得分为负数的占比较高,说明大部分地震微博影响力水平不高,尚有较大的提升空间。

3.2 地震官方微博影响力提升策略

由地震官方微博影响力综合得分公式可知,地震官方微博综合影响力水平主要受服务力、交互力及创作力水平三方面制约,三者水平的提升与否直接关系到综合影响力的大小,故可以根据本文构建的地震官方微博影响力评估指标体系(图 1)和影响力得分结果(表 7),结合对地震微博服务力、交互力、创作力得分情况靠前的地震局官方微博的分析,提出切实可行的微博影响力提升策略。

3.2.1 服务力提升策略

服务力指标对地震官方微博影响力的方差贡献率达58.236%,对地震微博影响力贡献度最大。从地震微博服务力指标得分排名来看(表 7),前五名分别是河北省、四川省、新疆、北京市、陕西省地震局的官方微博。这五家地震官方微博在服务力方面表现优秀,其微博更新频率高,在发布震情信息服务和地震科普知识服务方面取得了较好的传播效果,并且长期稳定的地震服务信息发布量形成了可观的累积规模化效应,对读者产生积极的影响作用,不仅可以留住已有粉丝,还可吸引更多读者关注,使粉丝数量不断增加,形成微博吸引粉丝良性循环,微博影响力不断增强。因此可借鉴以上分析,提出地震官方微博服务力提升策略:①找准自身服务定位,保持地震微博活跃度,适当提高地震服务信息更新频度;②挖掘受众对地震信息的需求,分析其阅读习惯,适时调整发布的微博服务信息形式及风格,提高信息质量。

3.2.2 交互力提升策略

交互力指标对地震官方微博影响力的方差贡献率达15.1%,包括微博评论数、转发数、点赞数等二级指标,反映用户与粉丝或受众之间的互动行为,对微博影响力提升具有关键作用。由表 7可知,交互力得分较高的前五名分别为四川省、江苏省、辽宁省、河北省、北京市地震局官方微博。这五家地震官方微博推送的博文能够得到受众较好的反馈,同时能引起受众的共鸣。观察其发布的微博,在内容上多具趣味性、热点性;在形式上具多样性,包括动画、视频、音频、长图、文章等。较好的博文建设使用户与受众之间形成互动效应,表现为受众对博文的认可行为,对博文的关注及二次传播行为,对博文的深度关注及表态行为。鉴于以上分析,提出地震官方微博交互力提升策略:注重博文内容及形式建设,紧抓时事热点,结合热点问题多推送形式多样、时效性强、主题有趣、普及面广、具共情力的信息。

3.2.3 创作力提升策略

创作力指标对地震官方微博影响力的方差贡献率达8.407%,主要通过微博原创率来体现。据表 7,河北省、四川省、北京市、新疆、江苏省地震局的官方微博在创作力指标方面得分较高。这五家地震微博重视原创博文内容,评估期间微博原创率分别为90.4%、88.6%、84.7%、82.8%、82.3%,创作水平较高,主要以推送自己创作的系列地震科普博文为主,并逐渐形成了地震微博品牌效应,进而提高了粉丝的忠诚度和粘度,对地震官方微博的影响力提升具有积极作用。鉴于上述分析,提出地震官方微博创作力提升策略:加强对地震微博原创内容的创作,打造体现自身特色的系列地震原创科普作品,树立自身地震微博品牌形象。

4 结论

本文以我国地震部门工作性质以及行业特点为前提,选取地震系统30个省级地震官方微博为研究样本,采用主成分分析法构建了地震官方微博影响力评估指标体系,并对其微博影响力进行了实证分析。主要结论如下:

(1) 本文建立的地震官方微博影响力评估指标体系覆盖了地震微博服务功能、内容形式、互动推广及博文建设等方面,能够全面系统地对地震微博平台进行考核,可为目前运行的各个地震微博平台提供科学的评价参考依据。

(2) 在本文构建的地震官方微博影响力评估指标体系中,地震微博的服务力对微博综合影响力的贡献率最高,其次分别为交互力和创作力。

(3) 本文在定量评价30个地震官方微博的各主成分指标得分的基础上,发现地震官方微博的综合影响力得分水平受服务力、交互力及创作力指标得分的影响,并对地震官方微博服务力、交互力及创作力的提高提出了有针对性的提升策略。

参考文献
曹鑫、阮娴静, 2020, 基于因子分析法的我国医药企业创新发展能力评价研究, 中国药房, 31(16): 1931-1937. DOI:10.6039/j.issn.1001-0408.2020.16.03
洪增林、李永红、张玲玉等, 2020, 一种基于主成分分析法的区域性地质灾害危险性评估方法, 灾害学, 35(1): 118-124. DOI:10.3969/j.issn.1000-811X.2020.01.022
胡媛、韦肖莹、王灿, 2017, 微博信息质量评价指标体系构建研究, 情报科学, 35(6): 44-50.
李勇、龚小芳、惠鸿曜等, 2016, 政务微博条件下的政民交互度评价指标体系构建, 重庆大学学报(社会科学版), 22(4): 172-179.
李志恒、宋金龙、权腾龙等, 2020, 基于WCI指数的地震政务微信公众号影响力分析, 防灾科技学院学报, 22(2): 83-90. DOI:10.3969/j.issn.1673-8047.2020.02.013
李志宏、庄云蓓, 2016, 基于PageRank算法的双维度微博用户影响力实时度量模型, 系统工程, 34(2): 128-137.
刘健、毕强、李瑞, 2016, 微博舆情信息传播效果评价指标体系构建研究——基于模糊数据包络分析法, 情报理论与实践, 39(12): 31-38.
刘清、彭赓、吕本富, 2014, 基于主成分分析法的微博影响力评估方法及实证分析——以"新浪微博"为例, 数学的实践与认识, 44(4): 49-56. DOI:10.3969/j.issn.1000-0984.2014.04.007
齐超、陈鸿昶、于洪涛, 2014, 基于用户行为综合分析的微博用户影响力评价方法, 计算机应用研究, 31(7): 2004-2007. DOI:10.3969/j.issn.1001-3695.2014.07.019
吴玉如, 2013, 地震部门微博客应用探讨, 灾害学, 28(3): 185-190. DOI:10.3969/j.issn.1000-811X.2013.03.035
闫晓美、梁向军、张正霞等, 2019, 我国地震部门微博社会网络分析, 中国地震, 35(2): 399-407. DOI:10.3969/j.issn.1001-4683.2019.02.019
杨长春、王睿, 2018, 基于H指数的政务微博影响力研究, 现代情报, 38(3): 110-115, 123. DOI:10.3969/j.issn.1008-0821.2018.03.017
张绍武、尹杰、林鸿飞等, 2015, 基于用户分析的微博用户影响力度量模型, 中文信息学报, 29(4): 59-66. DOI:10.3969/j.issn.1003-0077.2015.04.008
张雪梅、王友翠, 2020, 基于投入产出分析的政务微博舆情信息传播效率评价研究, 情报科学, 38(5): 43-48.
张颖超、薛伟莲, 2020, 基于主成分分析的辽宁省旅游区划研究, 生产力研究, (4): 62-64, 69. DOI:10.3969/j.issn.1004-2768.2020.04.016
朱建平, 2006, 应用多元统计分析, 北京: 科学出版社.
James F C, McCulloch C E, 1990, Multivariate analysis in ecology and systematics: panacea or Pandora's box?, Annu Rev Ecol Syst, 21: 129-166. DOI:10.1146/annurev.es.21.110190.001021
Kwak H, Lee C, Park H, et al, 2010. What is Twitter, a social network or a news media. In: Proceedings of the 19th International Conference on World Wide Web. Raleigh: ACM.
Lee C, Kwak H, Park H, et al, 2010. Finding influentials based on the temporal order of information adoption in twitter. In: Proceedings of the 19th International Conference on World Wide Web. Raleigh: ACM, 1137~1138.
Robertson M P, Caithness N, Villet M H, 2001, A PCA-based modelling technique for predicting environmental suitability for organisms from presence records, Divers Distribut, 7(1~2): 15-27.
Tang P, Zhang H D, Ye T H, et al, 2018, A novel method for chemistry tabulation of strained premixed/stratified flames based on principal component analysis, Appl Math Mech, 39(6): 855-866. DOI:10.1007/s10483-018-2326-6
Yousefi F, Amoozandeh Z, 2017, A new model to predict the densities of nanofluids using statistical mechanics and artificial intelligent plus principal component analysis, Chin J Chem Eng, 25(9): 1273-1281. DOI:10.1016/j.cjche.2016.10.016