刘寅:A novel MM algorithm and the mode-sharing method in Bayesian computation for the analysis of general incomplete categorical data
【学术期刊】《Computational Statistics and Data Analysis》,2019年第140期。
【作者简介】 刘寅,beat365副教授,硕士生导师。主要研究方向是应用统计及数理统计,近年来主要聚焦于统计算法及复杂数据建模分析。在国内外核心期刊接收或发表论文20余篇,其中SCI论文15篇,主持并参与多项国家自科基金。
【主要观点】不完全分类数据常见于生物医学、流行病学、心理学、运动学及相关领域。本文首先介绍了一个新颖的MM算法以为广义不完全分类数据分析中极大似然估计和后验矩的求解提供优化策略,尽管数据扩充算法和Gibbs采样法作为相应的EM和ECM算法的随机化版本已经获得了较为充分的发展,但是截至目前,有关MM算法的随机化版本的讨论仍非常有限。本文在所提出的MM算法的辅助下,进一步提出一个新的接受-拒绝算法,该方法为广义不完全分类数据的后验分析提供了一种众数共享的方法。这一方法的核心思想在于构造一族以工作参数进行标注的包络密度并识别出一个特殊的包络密度,以克服传统接受-拒绝算法的四个局限。此外,本文所提出的众数共享方法具有以下三个优势:(1)可以自动建立以工作参数进行标注的包络密度族,其后验密度共享相同的众数;(2)利用有限区间 上的一维格子点搜索法,通过最大化理论接受概率得到最优工作参数,使得最优抽样密度较真实的后验密度更分散;(3)利用众数共享理论(可有效避免高维优化问题)或再次利用所提出的MM算法可以得到最优包络常数。最后,我们将本文所提出的方法应用于一个玩具模型和三个实际数据,具有较好地表现。