协变量随机缺失和有测量误差数据下影响诊断精度的半参数模型研究

基本信息
批准号:11501472
项目类别:青年科学基金项目
资助金额:18.00
负责人:杨宝莹
学科分类:
依托单位:西南交通大学
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:彭皓,杨佳雯,张蓉
关键词:
复杂数据变量选择经验似然方法非参数函数估计FIC准则
结项摘要

As a well-accepted technique for assessing the accuracy of diagnostic test, ROC curve has been widely applied to various fields such as clinical trial study. The area under the ROC curve, AUC, is a popular one number summary index of the discriminatory accuracy of a diagnostic test. In real data analysis, there will be a lot of covariates which may affect the discriminatory accuracy. However, not every covariate is important. Including all the available covariates may reduce model’s explainability. It is necessary to select out the important ones. We will study the generalized varying coefficient partially linear model with the complete data set, covariates missing at random data set and error in covariates data set, respectively, estimate the unknown parameters and functions based on some more effective method. The efficient of the proposed methods will be illustrated through the large sample theory and simulation studies. Furthermore, to select out the covariates which may affect the estimate of AUC index, a more suitable variable selection criteria will be developed, such that the AUC estimator has the minimal mean square error. A robust estimator of AUC is obtained. The proposed methods are illustrated through the real data analysis. Our study will develop the ROC analysis methods under the complex data sets, and provide theoretical basis and technical support for the fields related to the diagnostic tests, such as clinical trial study.

ROC曲线作为评价诊断测试准确度的一种综合方法,已被广泛应用到临床医学等领域。ROC曲线下的面积AUC是衡量诊断精度的综合单值指标。实际中,影响诊断精度(AUC指标)的因素有很多,但有些因素其影响并不显著,若将其纳入模型中进行研究会降低估计的有效性,影响模型的预测能力,因此变量选择很有必要。本项目将分别在完整数据、协变量随机缺失和协变量有测量误差等复杂数据类型下,通过广义部分线性变系数模型研究协变量对诊断精度的影响,提出更有效的模型估计方法,通过理论证明、数值模拟验证新方法的有效性;探索合适的变量选择方法,挑选影响AUC估计的变量子集,使AUC估计的均方误差达到最小,并给出AUC指标的稳健估计;进一步对所提方法进行实例分析。本项目的研究丰富和发展了复杂数据下的ROC分析方法,为临床医学等诊断测试相关领域提供理论依据和技术支撑。

项目摘要

在国家自然科学基金(11501472)的支持下,我们主要研究了影响AUC估计精度的变量选择问题,半参数模型的估计问题,以及超高维数据的变量筛选方法。具体如下:a)ROC曲线下的面积AUC是衡量诊断精度的综合单值指标,我们对影响AUC估计精度的因素基于FIC准则进行变量选择。b) 我们对一些半参数模型,提出了全局非参数估计方法,即通过对局部线性方法进行全局化修正来估计半参数模型中的未知函数,我们的方法克服了维数灾难问题并有很强的适应性及有效性。c)超高维数据的分析是目前研究热点之一,其分析对传统统计理论和计算方法都具有挑战性。我们对超高维数据的变量选择方法进行研究,在无需模型假定的前提下,构造了基于条件独立性的、全新的、有理论支持的变量选择方法,通过理论性质的研究,证明了我们方法具有选择相合性。尤为重要的是当某些重要变量由于其边缘独立于因变量而被目前已有的方法漏选时,我们的方法从实际模拟验证了其优越性。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
5

低轨卫星通信信道分配策略

低轨卫星通信信道分配策略

DOI:10.12068/j.issn.1005-3026.2019.06.009
发表时间:2019

杨宝莹的其他基金

批准号:11226214
批准年份:2012
资助金额:3.00
项目类别:数学天元基金项目

相似国自然基金

1

右删失数据下带有函数型协变量的半参数模型的统计推断

批准号:11901087
批准年份:2019
负责人:郝美玲
学科分类:A0402
资助金额:25.00
项目类别:青年科学基金项目
2

测量误差数据下约束线性模型的有偏估计及变量选择研究

批准号:11426054
批准年份:2014
负责人:邬吉波
学科分类:A0403
资助金额:3.00
项目类别:数学天元基金项目
3

带约束推断的参数和半参数回归模型有偏估计及变量选择理论与方法研究

批准号:11201505
批准年份:2012
负责人:黎雅莲
学科分类:A0403
资助金额:22.00
项目类别:青年科学基金项目
4

协变量含测量误差的删失分位数回归

批准号:11201350
批准年份:2012
负责人:吴远山
学科分类:A0402
资助金额:22.00
项目类别:青年科学基金项目