微小RNA(MicroRNA)在基因调控过程中起着重要的作用。但是目前对微小RNA调控的具体形式和机制的研究,仍然处于起步阶段,特别是对微小RNA与转录因子和基因之间的协作调控机理认识还十分有限。由于实验数据的相对不完整性和不准确性,以及预测数据的不精确性,使得该问题成为生物信息学领域中一个重要具有挑战性的问题。不同层次组学数据的大量获得,使得整合多重数据来准确地识别多重分子协作调控元件已经成为可能。本项目中将利用最优化与图论的方法研究,如何整合多重不同层面的生物数据来识别由微小RNA、转录因子、基因所组成的协作调控元件(即协作调控模块)。研究重点是,提出数据整合的最优化模型和有效的大规模求解算法,并研究模型的稀疏性和模型参数选择等理论问题。本项目的研究不仅可以为生物学家提供可靠的计算方法和高效的软件,而且可以推动最优化理论和算法等领域的研究。
本项目主要研究整合多重大规模的生物数据包括微小RNA 和基因的表达图谱数据,微小RNA和靶标基因之间的相互作用关系,以及蛋白质相互作用网络、基因调控网络,和其他类型的数据等,来建立识别微小RNA协作调控元件(由微小RNA、转录因子和基因等组成的协作调控模块)的计算模型和识别算法。本项目主要研究了以下内容:研究了多重数据整合的重要性,建立了反映问题本质的优化模型和准确的算法;研究了具有稀疏性约束、反映生物特性的优化模型,并设计出相应的算法;研究了基于网络表示的数据整合模型和算法;研究了模型参数选择的方法以及调控元件的统计意义。研究工作按原计划顺利进行完成,取得了原创的、系统的成果。根据国内外最新为小RNA的研究和组学数据整合分析的研究热点,我们还对项目的研究内容进行拓展,并进一步考察了相关数据整合问题,取得了不错的成果。本项目的研究不仅为生物学家提供了可靠的计算方法和软件,而且对最优化理论和算法等领域的研究具有促进作用。本项目的研究成果以学术论文和发表软件包为主。项目组发表了15篇论文包括Bioinformatics 2011;Nucleic Acids Research,2012;Bioinformatics 2012a;Bioinformatics 2012b,Nucleic Acids Research,2013;Scientific Reports 2014等。其中期刊论文11篇(10篇为SCI 收录),会议论文1篇(EI收录),书籍章节3章。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于细粒度词表示的命名实体识别研究
基于多组学数据整合的肿瘤相关长非编码RNA优化筛选和调控机制研究
基于多源数据整合的耐药基因识别算法研究
基于数据挖掘技术的信号通路识别模型与算法研究
RNA竞争调控定量模型与合成基因调控元件构建