时 间:2021年10月13日(周三)14:00-15:00
地 点:腾讯会议,ID:285 724 469
题 目:Model Checking in Massive Data via Structure Adaptive Sampling
主讲人:王兆军 南开大学统计与数据科学学院教授
主持人:张日权 教授
摘 要:
失拟检验在很多统计/机器学习的应用中至关重要。尽管在这些应用中,人们可以非常容易地收集到大量的观测数据,但由于测量限制的存在,要收集到所有观测的标签却是不现实的。因此,我们针对仅有有限个数的标签可以获取的情况,提出一个设计自适应的检验方法来对模型进行检测。为了能从一大类给定设计点中选出协变量子集,我们推导出了最优的抽样策略——结构自适应抽样策略。基于此抽样,我们证明了所提出的检验方法是渐近最优的。同时,大量的数值模拟和实例数据的分析结果也进一步确认了所提方法的有效性。
报告人简介:
王兆军,南开大学统计与数据科学学院教授、执行院长,博士生导师,国务院学位委员会统计学科评议组成员,国家统计专家咨询委员会委员。主要从事工业工程中统计监控与诊断、复杂数据中的变点、异常点检测、实验设计、高维数据统计推断等研究,在Journal of the American Statistical Association、Annals of Statistics、Statistica Sinica等国际顶尖及一流统计学期刊上发表数十篇专业学术论文,担任中国现场统计研究会副理事长、中国工业统计教学研究会副会长、天津工业与应用数学学会理事长、《数理统计与管理》副主编、《数学进展》和《统计信息论坛》编委等。