In metabolomics, selecting the differential metabolites from the time series metabolomic data and analyzing their dynamic trajectory have become a key task in bioinformatics, which is crucial in disease diagnosis, drug research/development, etc. In this proposal, we aim at developing a new ensemble clustering method based on the commonness of the dynamic change of the variables, and giving a new combinatorial feature selection technique to measure the variable groups, thus to find out the key discriminative features and get an apprehensive understanding of the whole metabolic state. Further we want to develop a robust algorithm to construct metabolomic networks, determine the key pathway(s) to reflect the biological change by tracing the dynamic topological change of the networks and analyze the whole metablomics trajectory. Finally the developed new time series data analytical algorithm will be used to discover liver cancer metabolic biomarkers and related metabolic networks. The results from this study will be helpful for other disease diagnosis, pathological research and treatment efficacy evaluation by providing a necessary bioinformatics data handling method.
在代谢组学中,从代谢时间序列数据中提取与问题相关的关键代谢成分,分析其代谢轨迹,研究其在生理过程中的网络变化关系,对疾病致病机理、药物毒性和疗效研究具有重要意义,是生物信息学的一个重要研究课题。本项目拟根据代谢数据的个体差异及共性,研制一种基于变量的代谢轨迹的融合聚类算法和一种新的在聚类基础上对变量组评价的特征选择算法,以克服现有特征选择技术对参数和样本的敏感性,确定不同时间点具有显著差异的代谢物,分析代谢水平变化趋势。研制一种稳健的代谢网络构建算法,通过动态跟踪网络拓扑特性的变化,确定代谢过程中的关键代谢成分和关键时间点,确定发生改变的关键途径,给出样本总体代谢轨迹的变化趋势,并将算法用于肝癌发生相关的人群样本时间序列代谢组学数据中,提取与肝癌发生发展相关的生物标志物。本项目的研究也为其它疾病的诊断、致病机理与药物疗效研究提供必需的信息处理新方法。
从代谢时间序列数据中提取与问题相关的关键代谢成分,分析其代谢轨迹,研究其在生理过程中的网络关系变化,对疾病致病机理、药物毒性和疗效研究具有重要意义,是生物信息学的一个重要研究课题。.本项目首先建立了基于有效范围非重叠率的代谢网络分析新方法,关联时间维度的变化,从整体上探究病变过程中通路反应的持续紊乱程度,确定疾病恶化的关键节点和预警信号。其次建立了基于差异网络的数据分析方法,从通路反应之间的关联性上寻找反映病变的重要代谢特征,提高方法的稳定性。研制了新的组合变量数据分析方法,分析变量间的水平关系,构造富含信息的线性组合,所构建的组合不只限于2个变量,而是由算法分析的结果动态确定,以更准确刻画变量之间的相互作用。发展了有效的峰匹配算法和基于离子融合方法的高分辨质谱代谢组学数据处理新策略等;提出了FS-FOGO等一系列特征选择算法,建立了“LC-MS时间序列数据处理系统”。.我们将所发展的方法用于研究肝癌发生发展过程中血清中极性、脂类等代谢组的动态连续变化,从中筛选肝癌的诊断标志物及肝癌的早期预警信号。确定的比值标志物creatine/betaine可反映体内甲基化平衡的紊乱。基于受试者操作特性曲线分析结果表明该比值能有效区分癌前高风险的硬化阶段与肝癌,可作为肝癌,特别是小肝癌的早期诊断标志物,同时与目前临床常用标志物甲胎蛋白(AFP)互补,可有效提高诊断能力。确定的LPC 18:1/FFA 20:5比值变量在非肝癌阶段平稳,而在肝癌阶段显著升高,与非肝癌阶段有显著性差异。确定的比值变量N,N-dimethylglycine/threonic acid从肝炎、肝硬化到肝癌阶段逐渐下降,在肝癌和非肝癌样本间存在显著差异,能有效区分肝炎、肝硬化和肝癌三个不同阶段,既可以作为肝病诊断的标志物,也可作为肝癌发生的早期预警信号。.项目的研究工作为疾病诊断、个性化治疗、恶性肿瘤的早期预警研究提供了数据分析的新方法。相应研究工作在国际国内著名学术期刊、国际学术会议上发表学术论文26篇(其中SCI检索18篇次);获得国内发明专利授权3项,申请4项。.
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
跨社交网络用户对齐技术综述
转录组与代谢联合解析红花槭叶片中青素苷变化机制
青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化
城市轨道交通车站火灾情况下客流疏散能力评价
高维时间序列的数据挖掘算法及应用研究
时间序列数据挖掘中的聚类模型与算法研究
基于小波变换的时间序列中的知识发现及应用研究
高维时间序列数据聚类分析及应用研究