Genetic variation and natural selection are major driving forces of speciation and molecular evolution. Most of current studies focus on genetic variations on coding regions, but neglect those in noncoding regions. A large fraction of eukaryotic genomes consists of noncoding DNA that is not translated into protein sequence, and little is known about its functional significance and evolutionary impact. In this proposal, we aim at studying the functional impact of genetic variation and natural selection on genomic coding and noncoding regions, and developing new algorithms and computational tools. Firstly, we are going to investigate the mutational pattern and signatures in human polymorphic data as well as ICGC/TCGA cancer genomic data based on an Evolutionary Index method; Secondly, we are going to develop new approaches to detect positive selection based on coalescent tree, and the identified genes and regulatory elements will be used for downstream functional assay and phenotypic evaluation; Thirdly, we are going to build new algorithms and tools to evaluate the phenotypic impact of genetic variation using functional genomic data based on the combination of statistical and machine learning approaches. This study will help us understand the relationship between genetic variation and phenotypic variation, and will promote the improvement and development of microevolution theory.
遗传变异和自然选择是物种形成及生物进化的主要驱动力。但目前人们所关注的研究对象仍集中在蛋白编码区,绝大部分位于非编码区域的变异及所受选择压力仍未受到重视。本研究将围绕着遗传变异与选择在基因组中的作用这一核心问题,重点关注它们对基因组编码区和非编码区作用模式的区别与联系,建立新的计算方法和分析工具。本研究将基于进化索引方法,在人群多态性和ICGC/TCGA的肿瘤基因组数据中,比较在超微观、微观与宏观水平的编码区突变模式;建立基于共近祖树的分析方法,为后续适应性进化的基因及调控元件的识别提供重要工具;结合功能组学数据,利用统计和模式识别等计算生物学手段,建立遗传变异功能评估方法。这些研究将有利于我们建立遗传变异与表型变异之间的相互关系,进一步推动微进化理论的完善与发展。
遗传变异和自然选择是物种形成及生物进化的主要驱动力。但目前人们所关注的研究对象仍集中在蛋白编码区,绝大部分位于非编码区域的变异及所受选择压力仍未受到重视。本研究将围绕着遗传变异与选择在基因组中的作用这一核心问题,重点关注它们对基因组编码区和非编码区作用模式的区别与联系,建立新的计算方法和分析工具。(1)本研究建立了环形非编码RNA识别、转录本组装、可变剪接检测及定量等方法。我们率先提出基于环形RNA接合位点测序读段对的分段比对特征,进行精确识别环形RNA外显子结构和可变剪接事件。结合长读段测序分析和实验验证,全面调查了10种人类细胞系以及62种果蝇不同组织和发育时期样品中环形RNA内部结构特征。研究发现,可变剪接事件在环形RNA内部普遍存在,在定位上具有明显的核内倾向,同时表现出组织和发育阶段特异的表达模式。这些研究丰富了我们对环形RNA的组成及结构的认识,为深入解析这一崭新类型的非编码RNA分子提供了重要工具。(2)首次提出一种基于人群等位基因频率谱的监督集成算法,以实现对复杂疾病和性状相关的遗传变异进行打分识别及功能性评估。通过一系列综合测评分析,该方法对于编码区和非编码区的变异,都表现出更为出色的功能评估效果。尤其是对于非编码区致病变异的识别方面,比现有方法拥有更高的敏感度和特异度。(3)提出一个新的检测正选择的检测方法。在不同的中性进化历史条件下,该方法检测正选择的可靠程度,要明显优于其他常用方法,在保证了极低的假阳性率的前提下, 可以有效检测正选择。共发表标注SCI论文12篇,其中影响因子超过10的论文6篇,影响因子8~10的论文3篇。本项目建立的数据挖掘方法和技术已得到国内外同行的广泛关注和应用,多篇文章入选SCI高被引论文。项目负责人赵方庆获得了国家自然科学基金委优青项目资助(2017)和首届北京市自然科学基金杰青项目资助(2018),并连续两年获得中国科学院优秀导师奖(2017、2018)。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于被动变阻尼装置高层结构风振控制效果对比分析
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
基于改进LinkNet的寒旱区遥感图像河流识别方法
基于文献计量学和社会网络分析的国内高血压病中医学术团队研究
新型树启发式搜索算法的机器人路径规划
全基因组编码区遗传变异与口腔鳞癌发病风险及其机制研究
非编码基因区遗传变异识别及生物学功能挖掘
基因组非编码区变异与转录因子调控关系的计算分析方法研究
猪瘟病毒基因组3“非编码区结构与功能关系的研究