长度偏差右删失数据下分位数差和ROC曲线的统计推断

基本信息
批准号:11701043
项目类别:青年科学基金项目
资助金额:25.00
负责人:荀立
学科分类:
依托单位:长春工业大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:徐平峰,袁晓惠,尚来旭,陈婷,董娜娜,崔世崇,王福友
关键词:
估计方程ROC曲线分位数差经验似然长度偏差右删失数据
结项摘要

In order to improve the efficiency of the study, the data of disease screening is usually from the patients.Therefore, the sample is often the length-biased and right-censored (LBRC) data with competing risks. With the rapid development of large data technology, the published aggregate data provides a lot of useful information for clinical study. However, the statistical inference based on mean is not robust enough because of the existence of the mean and the impact of the outliers. The statistical inference based on quantile can solve this problem better. Moreover, the improvement of computing technology has been promoting the development of quantile research. Therefore, combining the competing risks and the auxiliary survival information, the quantile-based statistical inference under LBRC data is of great theoretical and practical value to the study of major diseases, such as cancer. This project is about two quantile-based distribution characteristics: the quantile difference and the receiver operating characteristic (ROC) curve. The outline is as follows: (1) Nonparametric and semiparametric inference on quantile difference and ROC curve under LBRC data are investigated. (2) The quantile difference and ROC curve under LBRC data with competing risks are estimated. (3) Combining with the competing risks and the external data source, the influence models of the risk factors on the quantile difference and ROC curve under LBRC data are established, and the interactions among the covariates are explored.

为了提高研究效率,疾病筛选试验从患病人群中抽样,常常得到带有竞争风险的长度偏差右删失(LBRC)数据。随着大数据技术的快速发展,样本外数据源为临床个体研究提供了很多可借鉴的辅助信息。然而,基于均值的统计推断受均值的存在性和异常值的影响,不够稳健,基于分位数的统计推断可以很好地解决这个问题。而且,计算机技术的提高促进了分位数研究的发展。因此,结合LBRC数据的辅助信息、竞争风险和大数据信息,对分位数泛函进行统计推断对癌症等重大疾病的研究具有重要的理论意义和实用价值。本项目研究两个基于分位数的分布特征:分位数差和受试者操作特征(ROC)曲线。主要内容包括:(1)在LBRC数据下对分位数差和ROC曲线进行非参数及半参数推断。(2)在带有竞争风险的LBRC数据下估计分位数差和ROC曲线。(3)结合外部数据信息,建立LBRC数据下风险因素对分位数差及ROC曲线的影响模型,并探索协变量之间的交互作用。

项目摘要

基于分位数进行统计推断能够消除数据中异常值的影响,充分利用数据信息有助于提高统计推断的效率。本项目主要研究了长度偏差右删失(LBRC)数据下分位数差和受试者操作特征(ROC)曲线的统计推断问题,进一步研究了条件风险度量,同时还研究了其它复杂数据下的相关问题。我们建立了复杂数据下推断总体分布特征的基本框架,构建了感兴趣的分布特征的相合估计,建立了估计量的大样本理论,通过数值模拟和实例分析验证了我们的方法的理论意义和应用价值。.在非参数框架下,我们得到了左截断右删失数据下分位数差的核光滑估计;完成了LBRC数据下分位数差的估计方程估计和经验似然推断;得到了幂Young函数下条件风险度量的解析表达式和指数Young函数下条件风险度量的解析方程组;得到了条件风险度量的估计方程估计。在半参数框架下,我们分别完成了LBRC数据下两总体分位数差和ROC曲线的估计方程估计和经验似然推断;得到了不可忽略缺失数据下分位数回归参数的估计方程估计和加权经验似然估计;建立了纵向数据下半参数随机效应条件密度模型的变量选择算法;得到了随机缺失假设下响应变量的均值的双稳健增广估计方程估计;得到了双截断数据下回归参数的非光滑经验似然区间估计和非光滑Jacknife经验似然区间估计。关于算法研究,我们给出了结合LVglasso的广义期望模型选择算法下潜变量图模型选择的算法步骤;给出了进行局部调整时IIPS算法所使用的边数最少的图结构;证明了E-MS算法产生序列的极限点满足观测广义信息准则最小值点的必要性。本项目为相关研究提供了理论基础、指导方法和分析思路,可以用于临床医学中比较治疗效果、生物统计中分析寿命特征、风险管理中度量风险变量等问题的研究。.在本项目的资助下,项目组共完成期刊论文15篇,其中发表SCI论文8篇、CSSCI论文1篇、国内核心期刊论文4篇;在投论文2篇。项目组成员共参加国内外学术会议9人次;出国访问3人次;培养在读博士生3名、毕业硕士生10名、在读硕士生24名。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

资本品减税对僵尸企业出清的影响——基于东北地区增值税转型的自然实验

资本品减税对僵尸企业出清的影响——基于东北地区增值税转型的自然实验

DOI:10.14116/j.nkes.2021.03.003
发表时间:2021
4

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

DOI:10.3969/j.issn.1002-0268.2020.03.007
发表时间:2020
5

氯盐环境下钢筋混凝土梁的黏结试验研究

氯盐环境下钢筋混凝土梁的黏结试验研究

DOI:10.3969/j.issn.1001-8360.2019.08.011
发表时间:2019

荀立的其他基金

相似国自然基金

1

长度偏差右删失数据下剩余寿命模型的半参数推断

批准号:11501104
批准年份:2015
负责人:白芳芳
学科分类:A0403
资助金额:18.00
项目类别:青年科学基金项目
2

平均经验似然方法在右删失数据中的统计推断

批准号:11701484
批准年份:2017
负责人:梁薇
学科分类:A0403
资助金额:23.00
项目类别:青年科学基金项目
3

右删失数据下带有函数型协变量的半参数模型的统计推断

批准号:11901087
批准年份:2019
负责人:郝美玲
学科分类:A0402
资助金额:25.00
项目类别:青年科学基金项目
4

复杂区间删失数据的统计推断及其应用

批准号:11471135
批准年份:2014
负责人:赵慧
学科分类:A0402
资助金额:60.00
项目类别:面上项目