Subgroup identification is important in a variety of applications including clinical trials and market segmentation. For example, it is valuable to find out whether a subgroup of patients with certain attributes can benefit from a treatment or suffer from an adverse effect more than the others in clinical trials..We will perform the study of subgroup analysis from three aspects. Firstly, we will extend the structured logistic-normal mixture model with equal variances to unequal variances since this is more realistic. Secondly, we will study the structured logistic mixture models with non-normal components including logistic and Poisson distributions. This is important because the count data and the 0-1 data are common response variables in applications. In the end, we will study how to determine the number of the mixture components in order to decide the number of potential subgroups.. The studies of the three problems above are expected to advance the statistical theory of subgroup analysis, and also provide more powerful subgroup identification algorithms for the applications in clinical trials, marketing, and so forth.
亚组分析在临床试验和市场细分等领域应用广泛,是一个重要的科学问题。传统的亚组分析是先给定亚组,然后用统计检验的方法来检测该亚组是否与整体存在不同的效应,然而亚组的属性具有不确定性。近年来研究人员更加关注如何识别一个潜在的亚组问题,比如在临床试验中识别具有加强治疗效果的亚组。本项目拟通过一个结构混合模型来刻画潜在亚组的分配及各亚组中响应变量的表征的联合分布。其主要内容包括;(1)将推广均方差的logistic-正态的结构混合模型到异方差的logistic-正态结构混合模型;(2) 将研究各成分为非正态的结构混合模型,从而研究响应变量为计数数据等情况下的亚组分析。(3)将研究如何确定结构混合模型中的混合成分的个数,从而确定潜在亚组的个数。以上问题的研究成果将丰富和完善结构混合模型的统计理论,并且对亚组分析的应用提供重要的理论支撑。
亚组分析是指,除了将所有的样本作为一个整体进行统计分析外,还对其中具有某项共同特征的部分样本(即亚组)进行分析。亚组分析在市场细分以及临床试验等需要对异质性的人群进行划分的领域具有重要的应用。在临床试验中,不同的病人对同一种药通常会有不同的反应。有些“失败”的实验药对所有病人的“平均”效应不显著,但是如果对某一个亚组有效,并且找出该亚组的特征,那么这些“失败”的药可以被开发成只针对这部分病人的“特效药”。早期的亚组分析主要关注已知亚组组别的统计分析,近年来,亚组组别的确定问题成为一个研究热点。.本课题主要研究基于模型的亚组分析,具体内容包括:(1)基于异方差的正态结构混合模型的亚组分析。该模型是对项目主持人早期提出的同方差的正态结构混合模型的推广,更符合实际数据。其中,由异方差造成的参数的极大似然估计不存在的困难通过在目标函数(即对数似然函数)中加入对方差的惩罚项来解决,相关学术论文已发表。(2)基于非正态的结构混合模型的亚组分析,包括计数数据、纵向数据等情形。其中,针对纵向数据,通过提出针对纵向数据的混合模型以及相应的类EM算法来解决参数估计等问题,相应学术论文已投稿。(3)对基于结构混合模型的亚组分析中的亚组个数的分析。混合模型中组别的个数一直是非常具有挑战性的难题,项目负责人通过贝叶斯方法来解决该问题。.该项目在经费全部或部分支持下已发表或接收4篇SCI学术文章,还有若干文章在投稿中或者积极准备中。相关研究的成果也以软件的形式(R程序包)给同行使用,促进学术同行交流和共同发展。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
混合半参数模型下生存数据的亚组分析
基于RF模型和半监督分析算法的肿瘤分子亚组模式识别方法研究
含混合数据类型的纵向结构方程模型分析
混合数据粗糙集分析的模型结构和算法研究