2023年10月9日至10日,“Survey Data Integration” (抽样数据融合)短期课程在北京大学镜春园82号院甲乙丙楼成功举办。本次课程有120余名本科生、研究生、青年教师及国家统计局的高层次青年人才参与。
本次活动由北京大学统计科学中心主办,并邀请海外著名统计学者爱荷华州立大学 Jae-Kwang Kim教授,系统讲授抽样数据中数据缺失和数据融合的理论及方法。旨在为从事相关领域研究的专业人士提供更为广阔的平台,提升高年级本科生、研究生及青年教师的理论水平和科研能力。

课前,统计中心新进教员邱宇谋老师为大家介绍了本次短期课程的主要内容以及主讲嘉宾。

邱宇谋主持
陈松蹊教授作开场致辞,就数据融合领域的发展与应用进行了简单介绍。他指出,在多学科交叉发展的当下,数据融合作为大数据时代的一个重要方法,正在得到更多人的关注和重视。数据融合不仅能够有效处理大数据分析与处理过程中遇到的数据缺失问题,还能在整合异构数据资料的基础上改进数据分析的结果。

陈松蹊致辞
9日下午,Jae-Kwang Kim教授为学员们介绍了抽样调查中数据缺失的理论以及相关的数据融合方法。Kim教授从经典的二相抽样入手,在单调数据缺失的假定下解释了抽样数据的问题背景,介绍了基于抽样设计的数据融合方法,并将其扩展到针对非概率样本的基于模型假设的方法,通过广义线性模型展示了方法的相合性。随后,Kim教授在一般数据缺失的背景下,介绍了诸如统计匹配、测量误差模型等方法,并基于家庭收入及支出的调查数据,利用高斯混合模型讲解了数据融合的实际样例。

Jae-Kwang Kim教授授课
10日下午,Kim教授在前一日的授课内容基础上,介绍了近年来兴起的倾向得分加权(Propensity Score Weighting)方法,包括伪随机化、条件极大似然、结果模型等。之后,Kim教授根据他与合作者在倾向得分加权方法上的相关工作,为学员们详细介绍了基于多重误差校正的数据融合方法,在放宽对数据随机缺失的假设时通过误差校正和模型校正保证了方法的相合性和鲁棒性。

课程现场剪影
在授课过程中,学员们展现出对课程内容的浓厚兴趣,在课上和课下积极参与讨论,提出了不少深刻的学术问题,在思想的碰撞中加深了对该领域的了解。Kim教授以启发式的讲解为学员们介绍了日益重要的数据融合领域,通过具体的实例展示了统计学方法在数据融合中的应用,为学员们拓宽了视野,提供了接触科研前沿问题的机会,展现了一位顶尖学者严谨的治学态度。

部分学员合影留念