刘斌霞:基于删失数据的最优模型平均方法研究
刘斌霞,曾就读于beat365数理统计专业,2023年6月获得理学博士学位,指导教师为赵慧教授。2022-2023学年中南财经政法大学优秀博士学位论文获得者。
研究背景:
1、模型选择方法一直是统计学界关注的热点问题之一,有许多著名的模型选择准则。
2、模型选择方法在某些情况下存在一定的偏差,模型平均方法成为模型选择方法的有效替代和补充,从而降低预测的偏差。
3、在经济、金融、医疗等领域,删失数据广泛存在。
选题意义:
1、可以进一步丰富删失数据下的模型平均方法的相关理论研究,将右删失数据下的模型平均方法进一步拓展到现状数据及一些半参数模型中,拓宽该方法的使用范围。
2、与完全数据下的模型平均方法不同,删失数据的模型平均方法中关于渐近最优性的证明面临着新的困难和挑战,对后续在其他半参数和非参数模型下研究删失数据的模型平均方法有一定的参考价值。
主要内容:
本文主要研究了删失数据的最优模型平均方法,分别关注了目前较为常用的Mallows模型平均和Jackknife模型平均这两种方法,研究了现状数据和右删失数据这两种较为常见的删失数据。主要关注了统计分析中一些常见的模型,如生存分析中常用的加速失效时间模型、解释性强又具有灵活性的部分线性模型以及更一般的变系数模型。在给定一些正则性条件下,本文建立了所提方法的渐近最优性,同时通过有限样本的数值模拟结果和实际数据分析进一步阐述了所提出的最优模型平均方法相较于现有其他模型选择和模型平均方法的优良表现。
创新之处:
1、目前关于删失数据的模型平均方法,相关的研究工作还比较少,尤其是基于模型全局误设定的最优模型平均方法更是还在起步阶段。本文基于全局误设定的框架,研究删失数据的最优模型平均方法,这是本文的第一个创新点。
2、目前针对删失数据的模型平均方法,主要都集中于随机右删失数据,而对于区间删失这一类很重要且常见的删失数据还没有相关研究。基于此,本文分别研究了加速失效时间模型和部分线性AFT模型下现状数据的最优模型平均方法,这是本文的第二个创新点。
3、现有的针对右删失数据的模型平均方法只考虑了一般线性模型和Cox比例风险模型,而对于其他应用广泛的半参数模型,包括变系数模型、部分线性模型等还没有相关的研究。本文对于上述半参数模型下删失数据模型平均方法的探讨,也是理论上的一种创新。