High tumor heterogeneity is found amongst patients or tumor cells. While, to understand and study tumor heterogeneity is the critical path towards precision medicine. An important problem in bioinformatics and systems biology is to identify tumor subpopulations or the related key molecular markers through high-throughput data. To establish more accurate mathematical models based on data geometric structures is one of the most important aspects that meet the novel demands of technological development. The project will modify and develop local data structure based algorithms mainly on three issues. Firstly, a data-driven optimization model to adaptively correct the neighborhoods will be proposed, which can distinguish chaos and heterogeneous information more accurately. Secondly, a double-constraint dimension reduction model by integrating data structure and molecular network will be proposed, to cluster samples as well as identify marker genes. Thirdly, a cross-view fusion model, which can integrate multiple omics data and keep individual data structures simultaneously, will be proposed to help systematically elucidate the heterogenous mechanism. All corresponding tools will be developed for more applications in the future.
癌症病人或细胞之间存在高度异质性,理解和研究肿瘤异质性是实现精准医疗必需破解的难题。生物信息学与系统生物学的一个重要任务就是从癌症高通量数据中挖掘相关分子特征或识别不同肿瘤亚群。利用测序数据内部的异质性几何结构建立高精度数学模型是符合当前生物技术发展新需求的重要研究方向之一。本项目针对基于数据局部结构保持建模中的三方面问题,改进和开发适用于肿瘤异质性研究的数学方法。主要包括:(1)提出数据驱动型的自适应邻域优化模型改善局部邻域构建,提高区分噪音与个体异质性信息的准确度;(2)提出基于数据结构与分子网络两者优势互补的双重约束降维模型,同时准确划分样本亚群与识别分子特征;(3)提出多组学信息融合模型,整合不同层次数据并保留各层数据的局部结构,从系统水平理解肿瘤异质性的分子机理。基于系列算法开发的相应软件将会给肿瘤异质性研究提供高效实用的分析工具。
癌症病人个体之间甚至内部表现出高度的表型异质性,这给实现疾病的精准诊断和治疗带来极大挑战。利用高通量测序数据,建立高精度数学模型,深入挖掘疾病相关的分子特征或识别不同亚型,是当前生物信息学的重要研究方向之一。本项目专注于识别数据内部的异质性几何结构,基于数据局部结构保持思想,改进和开发了适用于不同尺度的肿瘤异质性研究的数学方法。主要包括:(1)构建多组学整合模型,并利用该模型深入分析泛癌症之间的组织特异性与相似性;(2)构建多个单细胞转录组数据集整合模型,并分析了不同测序数据中单细胞群体的分子差异与谱系特点;(3)构建个性化网络控制模型,并分析比较了不同病人个体之间的分子网络差异与识别个性化疾病(驱动)基因。目前,基于系列算法开发出的相应软件,可以从GitHub上免费获取,给肿瘤异质性研究提供计算支持。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
基于分形L系统的水稻根系建模方法研究
论大数据环境对情报学发展的影响
拥堵路网交通流均衡分配模型
卫生系统韧性研究概况及其展望
基于单细胞数据的肿瘤异质性矩阵优化建模
基于局部建模技术的时空数据特征分析
基于地理加权建模的QAR大数据空间异质性研究
局部平稳面板数据的统计建模与推断