Holder: Liping Zhu(Renmin University of China)
Time:2025-04-10 14:00-15:00
Location:WANG Xuan Lecture Theater,Zhi Hua Building-101
Abstract:
In this talk I will discuss divide-and-conquer method for massive dataset in estimating parametric functions. In many applications, the parameter of interest can be expressed as a parametric function, where each component is amenable to unbiased estimation. The outer divide-and-conquer approach, which directly averages local estimates of the target parameter, often imposes stringent constraints on the number of computing nodes to maintain statistical efficiency because of the bias of local estimates. Instead, we advocate for an alternative strategy: applying the divide-and-conquer method to estimate each function component separately before computing the final estimate. This approach, termed the inner divide-and-conquer method, enhances estimation accuracy in large-scale systems. We rigorously establish that its convergence rate achieves the same order as the pooled estimate without necessitating restrictive conditions on the number of nodes. Extensive numerical studies on both simulated and real-world datasets corroborate our theoretical findings, demonstrating the method’s practical effectiveness.
About the Speaker:
中国人民大学教授、博士生导师,学校和理工学部学术委员会委员,统计与大数据研究院院长,人民教育出版社普通高中教科书《数学》联合主编,享受国务院特殊津贴专家,国家重大人才工程入选者,国家杰出青年科学基金获得者,国家重点研发计划首席科学家,兼任中国现场统计研究会生存分析分会理事长和高维数据统计分会副理事长等。
先后受邀担任国际统计学领域顶级学术期刊《统计年刊》、国际权威学术期刊《中华统计学》和《多元分析》等副主编,以及国内统计学领域顶级学术期刊《中国科学·数学》(中、英文版)、《系统科学与数学》(中、英文版)和《应用概率统计》等青年编委、编委和副主编等。
长期从事大数据统计学基础理论、方法和应用研究。1、在高维度大数据领域,提出不依赖于切片数的累积切片估计方法、不依赖于分布条件的半参数降维方法和不依赖于模型的变量筛选方法,解决了充分降维领域“公开问题”,被认为是该领域“突破性进展”,被列为变量筛选领域“基准方法”。2. 在非线性大数据领域,提出投影相关系数度量非线性相关关系,广泛应用于类脑科学和天文学等研究中;原创性提出区间分位数相依基本思想,扩宽了(分布)独立基本概念并建立了(分布)独立与分位数独立和均值独立的联系。3.在大数据应用领域,主持开发的虚假诉讼预警甄别系统已经在四川省高级人民法院和成都市中级人民法院等10家法院部署应用示范,参与编写的人民法院信息化标准《民事案件信息技术规范》已被最高人民法院发布实施。

Your participation is warmly welcomed!

欢迎扫码关注北大统计科学中心公众号,了解更多讲座信息!