In many research fields such as epidemiology, statistical genetics, biostatistics and survey sampling, the population of interest can often be divided into a number of populations or subpopulations, according to data source, certain outcome and certain characteristics of the observed individuals. Since they belong to the same population, the subpopulations often own certain similarities or relationship; Ignoring such information would cause efficiency loss for statistical inferences. Density ratio models are a family of flexible and efficient semiparametric models that are particularly suitable for modelling between-subpopulations relationships. In this project, we shall take density-ratio-model-based empirical likelihood as a basic research tool, focus on statistical topics of general interest in related research fields, develop suitable statistical models and methods that can incorporate as sufficient information as possible in data, and finally improve the statistical inference efficiency for the whole population or for each subpopulation. We shall also apply the proposed methods in real data analyses and solve real-life problems. Meanwhile, we shall study deeply into their theoretical properties and provide persuasive theoretical support for their applications in relevant fields. Since the problems of interest have close relationships with medical science and biogenetics, the research production of this project will not only have important sense to the supplement and perfection of semi-parametric statistical methodology and theory, but also have great practical value and a great role in promoting in related disciplines.
在流行病学、统计遗传学、生物统计学和抽样调查等许多领域,根据数据来源不同、事件结果的不同或者观测个体某种内在属性的不同,所研究的总体常常可分为多个总体或子总体。由于同属一个总体,子总体之间常常具有某些相似性或者关联性;忽略了这一信息会导致统计推断效率的降低。密度比模型是特别适用于对子总体之间的关系进行建模的灵活有效的半参数模型。本项目将以基于密度比模型的经验似然为基本研究工具,针对各相关领域中的多样本数据和混合模型数据,开发能充分利用数据信息的合适的统计模型和分析方法,从而提高总体或者每个子总体的推断效果。本项目将把这些方法用于实际数据分析解决实际问题,同时深入研究其理论性质,为其在各学科中的应用提供有力的理论依据。鉴于所研究的问题与医学和生物遗传学密切相关,本项目的研究成果不仅对完善半参数统计研究方法和理论具有重要意义,而且具有较大的实际应用价值,对各相关学科的发展具有极大的促进作用。
统计分析的一个重要原则是尽量充分利用数据信息,从而实现尽量高效的统计推断。在流行病学、统计遗传学、生态学和抽样调查等许多领域,数据常常可以划分为若干性质相似的子总体;适当建模充分利用不同子总体的相似性信息可以提高统计推断效率。基于密度比模型的经验似然是实现这一思想的重要统计分析平台。本项目以密度比模型和经验似然为基本分析工具,针对多样本数据、混合模型数据、捕获再捕获数据、缺失数据、大数据子抽样样本以及荟萃分析数据等各种不同数据类型,因地制宜地开发了充分利用数据信息的统计模型和分析方法,显著提高了总体或者每个子总体的推断效果,对完善半参数统计理论以及促进各相关学科发展具有重要意义。本项目共完成31篇科研论文,包括23篇已发表或已被接受的SCI论文、4篇已发表或被接受的其他论文、以及4篇已投稿的论文。其中1篇论文发表在四大顶级国际统计杂志《Journal of the Royal Statistical Society, Series B》,7篇论文发表在统计学国际一流期刊,如《Biometrics》(4篇),《Statistica Sinica》(1篇), 《Scandinavia Journal of Statistics》(1篇),以及《Annals of Applied Statistics》(1篇); 另外各有1篇论文投稿到《Biometrics》 和《Statistica Sinica》,正在二审中。项目负责人2021年获得教育部“长江学者奖励计划”青年学者项目,2019年获得上海市人才发展资金资助计划,担任中国现场统计研究会资源与环境统计分会副理事长等多个学会职务;项目参与人刘洋博士2019年获得上海市超级博士后项目。项目组成员参加国内外学术会议并做学术报告30人次以上。新冠肺炎疫情影响了国际交流情况,本项目开展国际交流访问3人次,邀请国外专家访问6人次以上。本项目参与培养了5名博士研究生,其中2名已经顺利毕业并取得博士学位;协助培养了19名硕士研究生,其中13名同学已经顺利毕业并获得硕士学位。综合来看,本项目在学科研究、学术交流和人才培养等方面都取得了丰硕的成果。
{{i.achievement_title}}
数据更新时间:2023-05-31
路基土水分传感器室内标定方法与影响因素分析
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
基于LASSO-SVMR模型城市生活需水量的预测
基于SSVEP 直接脑控机器人方向和速度研究
高维参数和半参数模型下的似然推断
缺失数据下加速失效时间模型的经验似然推断
相依样本下的经验似然推断
空间计量经济模型的经验似然推断