Long non-coding RNAs (lncRNAs) are important factors implicated in complex diseases, and the disease associated lncRNAs have become the hot spot in the life science and multi-disciplined scientific world. In this project, multi-level and heterogeneous data for lncRNAs and diseases are exploited to identify abnormal lncRNA patterns which are associated with complex disease. First, regarding to the high throughput sequencing data, the dimension of the data is very high, the number of the samples is small, the information density is low and the noise is high. The novel and useful data analysis and integration methods are developed to fulfill our data mining task. Second, pattern recognition theories and methods are exploited to design the algorithms for mining disease associated lncRNA patterns based on integrated data model. Third, the computational tools for abnormal lncRNA pattern recognition and the database for the annotation of lncRNA disease associations will be developed and opened for others. It can be expected that this project will promote the related theories, predict lncRNA biomarkers for complex diseases, and provide clues to biology and medicine study.
长非编码RNA作为影响复杂疾病的重要因素,其与疾病的关联研究已经成为国际生命科学及相关交叉学科研究的前沿。本项目基于多层面、异质长非编码RNA与疾病相关数据,针对长非编码RNA与复杂疾病关联问题,研究高维、小样本、稀疏、高噪声数据分析与集成方法,以及与疾病关联的长非编码RNA异常模式挖掘算法,建立长非编码RNA与疾病关联异常模式计算平台,构建长非编码RNA与疾病关联注释数据库。揭示长非编码RNA影响复杂疾病发生发展的规律,筛选复杂疾病诊断治疗的长非编码RNA相关分子标记物。本项目研究以交叉学科问题为背景,以复杂多层次生物数据为基础,以数据挖掘和模式发现理论为指导,研究长非编码RNA与复杂疾病关联问题,其预期研究成果将为生物医药领域的研究提供有价值的参考和依据,同时必然极大丰富数据挖掘和模式发现理论的研究内容。
长非编码RNA作为非编码RNA家族中的重要成员,国内外的研究人员对其功能及其与疾病的关系开展了广泛的研究,使得我们对于长非编码RNA的认识更多了一些,也对于其在复杂疾病发生发展中的作用有了更多的事实积累,也对其分子机制有了更多的探索和认知,并且也开始逐步探索其在疾病诊断治疗中的价值和现实意义。.本项目重点研究了如何通过有效的计算方法挖掘长非编码RNA在疾病发生发展过程中所体现出来的异常模式。具体研究内容包括不同场景下、基于多种类型数据的异常模式定义;不同的模式挖掘方法及其结果验证;研究长非编码RNA的功能预测方法及其与疾病和药物的关联。获得的重要成果包括(1)在统计意义上比较了mRNA与长非编码RNA二级结构方面的异同,及对其功能研究的启示;(2)基于RNA-seq表达数据,设计实现了基于信息熵的方法发现与癌症关联的异常模式,在单一癌症和泛癌症层面进行了分析,并且探索了其对于疾病诊断的积极意义;(3)基于SNP数据,挖掘与疾病关联的长非编码RNA及其在生物网络中呈现的异常模式;(4)探索新型数据的出现对于异常模式发现的意义,分别针对三维基因组数据以及单细胞测序数据,从长非编码RNA子细胞、转录调控及其功能特异性开展了一些研究工作;(5)复杂网络作为重要的建模工具,设计实现了基于生物网络的分析方法挖掘与疾病关联的长非编码RNA分子。.上述研究成果对于疾病的诊断和治疗有重要的启示作用,更进一步的基于分子机制的理论研究和生物实验验证将对疾病的诊断治疗以及药物的设计带来积极的现实意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
低轨卫星通信信道分配策略
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度
多视角识别长非编码RNA和人类复杂疾病关联预测研究
长链非编码RNA识别及其功能挖掘方法研究
基于非编码RNA调控网络的复杂疾病致病模式发现研究
基于贝叶斯生成对抗网络的长非编码RNA与疾病关联预测研究