本项目研究集成基因组、蛋白质组、及蛋白质相互作用网络等多种数据源识别导致常见疾病的遗传变异的模式识别与机器学习方法。对于发生在蛋白质编码区的非同义单核苷酸多态性及其对应的蛋白质序列上的氨基酸置换,我们将致力于建立基因/蛋白质与常见疾病的关联关系,建立蛋白质功能域与常见疾病的关联关系,并在此基础上研究从分散于全基因组的遗传变异中识别导致特定疾病的非同义单核苷酸多态性的模式识别方法。对于发生在非蛋白质编码区中的单核苷酸多态性,我们将借鉴对氨基酸置换的研究成果,探索基于DNA序列保守性对致病单核苷酸多态性进行识别的机器学习方法。本项目的预期研究成果将转化为应用软件,为在全基因组尺度上识别致病非同义单核苷酸多态性提供实用的工具,为非蛋白质编码区中致病单核苷酸多态性的识别探索有效的途径,从而为应用模式识别理论与机器学习方法解决生命科学中的实际问题提供有益的借鉴。
{{i.achievement_title}}
数据更新时间:2023-05-31
Using single-molecule approach to visualize the nucleosome assembly in yeast nucleoplasmic extracts
Single-mode millijoule fiber laser system with high pulse shaping ability
DNAgenie: accurate prediction of DNA-type-specific binding residues in protein sequences
Wearable Electrocardiogram Quality Assessment Using Wavelet Scattering and LSTM
复杂系统科学研究进展
海量深网数据源入口的自动发现与集成研究
基于内聚约束的大型异构数据源集成探索式模式挖掘方法研究
面向实体信息集成的非合作半结构化深网数据源选择
城市植被多种数据源信息的三维精细重建与大规模真实感快速呈现