In recent years, non-coding RNA has been attracting more and more attention due to its important role in the process of individual life, especially in development of some diseases. The way of biological experiments to verify the relationship between them and diseases is time-consuming and laborious, so we need to use more efficient mathematical models to complete correlation analysis. The project focuses on three kinds of non-coding RNA (miRNA, lncRNA, circRNA), we first utilize the method of data mining to obtain three kinds of non-coding RNA sequence information、their own expression and disease association data, then use the method of feature analysis extracting high-order features to construct RNA similarity network and disease similarity network, and then use the combination of deep learning and matrix analysis method to build three kinds of non-coding interaction prediction algorithm and non-coding RNA disease association analysis platform, which can predict the interaction relationship between non-coding and disease comprehensively and accurately, this project has important application prospect and economic benefits for biological research, disease diagnosis, prediction and inspection etc..
近年来,非编码RNA由于在个体生命过程中所起的重要作用被陆续发现而越来越受到研究者广泛关注,尤其在疾病产生发展之中扮演着越来越重要的角色而成为研究的热点。生物实验的方式验证它们之间及其与疾病之间的关联性费时费力,因而需要利用高效的数学模型和算法来进行关联性分析。本项目着眼于三种非编码RNA(miRNA,lncRNA,circRNA),首先获取和整合三种非编码RNA的自身序列、表达信息,以及它们与疾病关联性等数据,其次利用特征分析的方法挖掘数据中的高阶和非线性关系,构建不同非编码RNA之间的相似度网络以及疾病之间的相似度网络,进而利用深度学习并结合矩阵分析方法设计非编码RNA互相作用关系分析算法以及多非编码RNA与疾病关联性分析算法,开发可供同行和开源社区使用的软件平台,为非编码RNA与疾病关联性分析提供有力支持。本研究在生物基因表达分析,疾病诊断、预防以及治疗等方面具有广阔的应用前景。
近年来,随着非编码RNA在个体生命过程中所起的重要作用被陆续发现,越来越多的研究者开始对其关注并进行研究,尤其是非编码RNA在疾病产生和发展过程中扮演的重要角色已经成为研究的热点。如今,虽然已有上万个人类非编码RNA 被发现,然而除了少量非编码RNA 被研究者们了解较为完全外,大量的非编码RNA 由于复杂的分子作用机制还未被完全研究清楚。而传统生物实验的研究方法费时费力,并且每次能够关注的非编码RNA 数量有限,无法从全局的角度考察这些非编码RNA 之间及与疾病之间的关系,更加具有局限性。因此本研究从更为可行和经济的角度考量,借助数学模型和算法,寻求以计算的方式对不同非编码RNA及与疾病的关系进行建模及分析。. 本研究的目标是从miRNA、lncRNA 和circRNA 三种非编码RNA入手,获取和整合三种非编码RNA的自身序列、表达信息,以及它们与疾病关联性等数据对其进行挖掘;在分析提取三种非编码RNA特征基础上,研究它们之间的高阶和非线性关系,提高关联性分析的效果和效率;基于深度学习等数学模型提出对非编码RNA与人类疾病关联性分析的模型与方法。设计开发的数学模型和算法都应具有可移植性和广泛的应用性,可供同行和开源社区使用,可以快速低成本的为非编码RNA 与疾病关联性分析,基因表达分析提供有力支持。. 四年来研究团队一直围绕着该目标开展研究,按计划完成了研究工作,在基于深度学习的lncRNAs识别及lncRNA-protein相互作用预测方法研究、基于多序列融合的circRNA识别及其与疾病关联性分析方法研究、分子生物数据间的关联分析统计方法研究、转录因子绑定位点、启动子、DNA甲基化状态及单细胞转录因子识别方法研究、miRNA-lncRNA-疾病及miRNA-疾病-表观遗传学关联性及预测方法研究、基于深度学习的RNA二级结构预测方法研究、针对scATAC-seq数据的深度生成模型研究等方面取得了一系列研究成果。. 本研究不仅有助于揭示人类基因的作用机制,更重要的是,对于更好地了解疾病的产生与发展,对疾病诊断、治疗和预防等能起到重要推动作用。因而,此研究项目具有重要的理论研究和实际应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
基于集成深度学习的植物lncRNA与miRNA互作关系预测研究
基于基因连锁网络的人类线粒体复杂性疾病基因型—表型关联性研究
基于复杂网络时间序列分析和深度学习的脑疾病神经机制研究
基于深度学习与复杂网络的海洋锋时空特征分析及识别