半监督数据的M估计(周勇)

针对半监督数据提出了一类广义的M估计方法,这里半监督数据是由相对较小的标签数据集和大量无标签数据组合而成的。通过投影技术,我们提出了一种新的估计方法,它有效地利用了无标签数据中包含的有用信息。我们证明了所提出估计量的相合性和渐近正态性,并提供了基于K折交叉验证的统计推断理论。我们推导出了用于平衡标签数据和无标签数据贡献的最优权重。通过利用无标签数据,得到了比只用有标签数据更有效的估计。相关成果发表在国际统计学顶级期刊《Journal of the American Statistical Association》。(在线发表)


1.png


发布者:张瑛发布时间:2024-04-22浏览次数:144