本项目研究集成基因组、蛋白质组、及蛋白质相互作用网络等多种数据源识别导致常见疾病的遗传变异的模式识别与机器学习方法。对于发生在蛋白质编码区的非同义单核苷酸多态性及其对应的蛋白质序列上的氨基酸置换,我们将致力于建立基因/蛋白质与常见疾病的关联关系,建立蛋白质功能域与常见疾病的关联关系,并在此基础上研究从分散于全基因组的遗传变异中识别导致特定疾病的非同义单核苷酸多态性的模式识别方法。对于发生在非蛋白质编码区中的单核苷酸多态性,我们将借鉴对氨基酸置换的研究成果,探索基于DNA序列保守性对致病单核苷酸多态性进行识别的机器学习方法。本项目的预期研究成果将转化为应用软件,为在全基因组尺度上识别致病非同义单核苷酸多态性提供实用的工具,为非蛋白质编码区中致病单核苷酸多态性的识别探索有效的途径,从而为应用模式识别理论与机器学习方法解决生命科学中的实际问题提供有益的借鉴。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
跨社交网络用户对齐技术综述
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
Everyone has a donor: contribution of the Chinese experience to global practice of haploidentical hematopoietic stem cell transplantation
Equivariant CR minimal immersions from S^3 into CP^n
海量深网数据源入口的自动发现与集成研究
基于内聚约束的大型异构数据源集成探索式模式挖掘方法研究
面向实体信息集成的非合作半结构化深网数据源选择
城市植被多种数据源信息的三维精细重建与大规模真实感快速呈现