日前,统计科学中心、光华管理学院和数学科学学院陈松蹊教授团队关于中国北方地区沙尘追踪检测和溯源分析的研究论文“Detecting and Evaluating Dust-Events in North China with Ground Air Quality Data”在美国地球物理学会 Earth and Space Science 在线发表。
2021年春季,中国北方地区经受数次大范围、高强度的沙尘天气侵袭。如何自动化地识别沙尘起源区域、追踪沙尘移动路径、科学合理地评价沙尘天气对中国北方地区的污染贡献对沙尘的防治和治理有着重要作用。
文章选取了2015至2020年六年春季中国北方地区的688个空气质量监测站和258个气象站点,共计一亿二百万条地面监测数据,并结合欧洲中期天气预报中心(ECMWF)的再分析风场数据,提出了一套自动识别并追踪沙尘过程的统计算法。传统的沙尘识别主要依靠卫星遥感数据,其存在时空分辨率的取舍,反演过程中同时受到天气和下垫面的影响,导致数据误差和缺失率比较大。文章提出的统计算法创新性地利用了中国近年来建成的空气质量监测网络,基于高精度的地面站点信息建模,能够实现对沙尘过程的全天候动态追踪。
研究发现,中国北方地区沙尘主要来自塔克拉玛干沙漠(42.1%),阿拉善沙漠(23.4%)以及科尔沁沙地(16.6%)。由于塔克拉玛干沙漠影响范围主要局限于新疆省内,若剔除本地影响,则阿拉善沙漠贡献了59.8%的跨省沙尘传输事件。沙尘事件对沙源地区PM10与PM2.5浓度的贡献分别达到23.3%—34.6%和18.2—33.2%,而对下风省份的影响则分别为2%—7.3%和0.8%—4.0%。文章同时分析了沙尘过程从产生到结束的污染物浓度关系,为研究沙尘事件传输过程中的化学机理提供了新的证据。回顾六年来春季时期沙尘事件的平均强度,文章认为从单位沙尘平均强度、持续时间和过沙面积来看,六年中没有明显变化。沙尘治理仍需中央、地方乃至周边国家的共同努力。
沙尘识别算法和数据
文章建立了低模型假设,高计算效率的两阶段检测模型,分别从时间维度和空间维度提取信息。一阶段检测是综合考虑PM10浓度和污染物间相关关系的多元时间序列变点识别。使用多元CUSUM检验,在各个站点找到时间序列中存在结构变化的时刻(变点),将不平稳的时间序列数据转化分割为多个平稳时段。出于区分沙尘事件和污染事件的考虑,算法主要在二阶协方差信息上进行检验。接下来的二阶段检验借助一阶段中估计的变点结果,将符合特征的变点识别为沙尘起止时刻。研究团队再利用时空聚类方法,结合风场信息和多数投票法则合并相邻的沙尘时段,构造动态的沙尘聚类。图1给出了对一个沙尘过程的识别追踪结果。
由于沙尘高发于中国北方的春季时期,文章选取了2015至2020年六年的春季、北纬32°以北的15省市国控污染物监测站点的监测数据,包括PM2.5等六种污染物浓度数据。每个污染物监测站点匹配了邻近的气象站点提供地面气象数据以及500hPa等压面的再分析风场数据。出于模型参数优化的需要,研究团队在监测数据中人为标记了占比23.3%的数据,标识了污染和沙尘过程。
图1 2017年5月2日至6日,一个通过数据与算法识别的大型沙尘过程的演进过程。图中给出12小时间隔的九张快照,红色区域标记了该沙尘过程在各个时刻的影响范围
传输网络分析
文章提出的识别算法给出了每个沙尘过程的总体“分布”,能够从中提取各种统计指标。如图2所示,借助有向图模型中的概念,文章将各个省份作为图像节点,剔除了节点内部自身指向自身的边,构建了沙尘传输网络,并计算各节点的出度(outdegree)用于衡量该省份的传输贡献。新疆作为起沙数量最多,受沙尘事件影响时长最长的省份,对整个中国北方的传输贡献有限,这可能是由于新疆特殊的盆地地形限制了沙尘的长距离传输。
图2 左图给出了剔除了自循环后的沙尘传输网络。每个节点代表一个省份,与节点同色的边代表从该节点出发指向其它节点的沙尘传输过程,边的粗细指代传输的累计小时数总数。右图给出了剔除自循环和未剔除自循环的各节点出度(outdegree),新疆的沙尘总量最大但局限在省内
沙尘时段污染物浓度相关结构变化
若将六年春季各站点检出沙尘事件的时刻作为t0时刻,将污染物浓度时间序列和相关系数序列对齐,可以分析沙尘事件中各主要污染物的演进规律。如图3所示,红色虚线标记了算法检出沙尘事件的时刻(记为0时刻),可以看出一个典型的沙尘过程以PM10浓度的迅速上升为标志。与此同时,PM10与三种人为污染物(CO、NO2和SO2)的相关性显著下降,与PM2.5的相关性基本稳定,而与臭氧的相关性小幅上升。这一相关关系的变化在非沙源地,如京津冀地区(BTH)的表现更为显著。这可能是由于沙尘事件中强风场对人为源污染物有清洗作用。文章同样发现在沙源地的沙尘过程起始伴随着近地面风速的快速增加,而传输区域则更多表现为高层风速的上升,表明起沙和传输区域的动力机制存在明显不同。
图3 一次沙尘事件中平均的化学组分演进过程,红色虚线标记了算法识别的沙尘事件起始时刻。左图:PM10浓度以及其与其它污染物的协方差。右图:六种污染物标准化浓度曲线。从上至下分别为中国北部、阿拉善沙漠以及京津冀地区的平均结果
本文的第一作者为童培峰(光华管理学院二年级博士生),陈松蹊为本文通讯作者。天普大学统计学教授汤琤咏为另一作者。
新闻来源:北京大学新闻网https://news.pku.edu.cn/jxky/0fd49794984744ee80267c71d58426d1.htm