The huge differences arising from organisms and individuals are ascribed to not only the genome itself but also the regulatory principles of gene switches controlling gene expression. There are about 98% non-coding genes controlling 2% protein-coding genes expression in the human genome. Especially the long non-coding RNAs (lncRNAs), which play many key roles in diverse biological processes, and are involved in human diseases. With accumulating number of lncRNAs whose functions are remained to be uncovered, to investigate their functions at large scale is an urgent and challenging task. In this project, network models and algorithms for large-scale lncRNA function prediction are focused and investigated. The biological network are constructed by analyzing and integrating multi-source lncRNA data, representing the functional links among lncRNAs and other biological molecules. The network-based algorithms with superior performance are designed to tackle the task of large-scale function prediction. Based on the function annotation of lncRNAs, function categories for lncRNAs are analyzed and clustered; the inherent relationship between the function annotation and the biological properties of lncRNA data are investigated. And that between the dysfunctions in lncRNAs and complex diseases will be analyzed and exploited for discovering lncRNAs as biomarks or drug targets. Lastly,databases and function prediction softwares for lncRNA function prediction are developed.
基因组本身尤其是控制基因开关的复杂调控机制导致了物种及个体间的巨大差异,人类基因组大约98%非编码基因参与调控2%蛋白质编码基因的表达,尤其是长非编码RNA参与调控了不同层面的基因表达,具有重要的生物功能,与重大疾病密切相关。面临数量不断增加的长非编码RNA,本项目拟开展大规模长非编码RNA功能预测问题的网络模型与算法研究。通过集成多个层面不同类型的长非编码RNA数据,研究多源数据分析、集成方法,构建反映长非编码RNA与其它生物分子功能关联的生物网络;研究基于网络模型的高效算法,实现大规模长非编码RNA功能预测;基于功能预测结果,分析其功能类别,研究长非编码RNA数据的生物特征与功能之间的内在联系,揭示隐含的生物学规律,研究功能异常与疾病的关系,探索长非编码RNA作为潜在分子标记和药物靶标的应用价值;最后开发长非编码RNA相关数据库和功能预测软件。
研究发现人类基因组大约只有3%的区域是编码区域,产生各种各样体现生命活动的蛋白质,其它非编码区域转录产生大量的非编码RNA,其中一类长度大于200nt 的非编码RNA 被称之为长非编码RNA(long non-coding RNA,lncRNA),大约62%的人类基因组序列转录产生lncRNA。LncRNA 在转录和转录后水平,在细胞质和细胞核中通过顺式或者反式调控机制发挥着重要生物功能。围绕lncRNA 的相关研究迅速成为国际生命科学领域及生物信息学交叉领域的热点、国内外共同关注的科学前沿问题。本项目针对多个层面、不同类型的lncRNA数据,研究多源lncRNA数据的集成方法,构建lncRNA分子的生物网络模型;研究基于lncRNA网络模型的分类算法,实现大规模、快速的、可靠的lncRNA功能预测;基于lncRNA的功能预测结果,发现lncRNA功能类别,挖掘lncRNA数据的生物特征与功能之间的内在关联,以及lncRNA功能失调与复杂疾病发生发展之间的关系;开发lncRNA相关数据库和功能预测软件。 研究成果主要包括三个方面,(一)网络构建与分析,包括复杂网络理论分析,网络拓扑结构分析及应用,网络可控性分析及应用;(二)功能分析及预测算法研究,包括lncRNA二级结构预测与功能关联分析,lncRNA疾病网络构建及与疾病的关联分析,lncRNA的鉴定、结构与功能研究进展,提出了lncRNA功能预测的计算框架;(三)lncRNA相关应用研究及软件工具开发,包括甲基化模式挖掘,药物重定位,生物分子标记物发现以及表型与基因型的关联分析工具开发。共计发表SCI论文15篇,其中一区1篇,二区7篇,国家发明专利1项,软件著作权2项。培养青年教师5人(均晋升副教授),博士生2人(1人留校任教),硕士生2人。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
粗颗粒土的静止土压力系数非线性分析与计算方法
基于LASSO-SVMR模型城市生活需水量的预测
低轨卫星通信信道分配策略
中国参与全球价值链的环境效应分析
潜在功能性长非编码RNA预测算法研究及应用
基于多网络融合的长链非编码RNA与疾病关系预测研究
长链非编码RNA与RNA结合蛋白的互作调控网络和功能研究
微RNA介导的长链非编码RNA的调控网络和功能研究