关于举办天津市现场统计研究会2020年学术年会的通知
题目:高比例缺失的数据分析
主讲人:林华珍等11人
时间:2020年12月12日全天
地点:H213
讲座内容:对于实际问题,我们在数据收集过程中会面临一些不可控因素,这使得收集的数据常常有大规模缺失问题。我们将针对两种典型的大规模缺失数据:协变量缺失和结果变量缺失数据,分别设计相应的处理缺失的方法,并建立估计的理论性质。特别,针对大规模协变量缺失问题,比如一个在线小额信贷数据有93%的贷款用户都有缺失值,并且每个用户的缺失模式各不相同,我们提出了一种简单而有效的迭代最小二乘估计量。我们的方法不需要对协变量进行任何建模假设,而且由于利用了数据结构信息,估计结果有某种超有效特点;针对结果变量缺失问题,我们结合概率指标模型提出一个新的Mann-Whitney统计量来评估两组人群不匹配情况下的治疗或策略效果。我们提出的方法在理论上具有有效性和稳健性,并且能在少量样本下得到精确估计和给出统计推断。
主办单位:菲彩国际官方统计学院
欢迎广大师生踊跃参加!