基于深度神经网络的疾病相关突变预测方法研究

基本信息
批准号:31801108
项目类别:青年科学基金项目
资助金额:21.00
负责人:权丽君
学科分类:
依托单位:苏州大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:丁啸,商敬哲,朱文杰,陈秭宜,沈勤,袁瑶,吴春燕
关键词:
疾病相关突变癌症驾驶员突变数据挖掘深度学习
结项摘要

The key mutation in evolution may cause changes in spatial conformation, physiological function and even disease. Identification of missense mutations associated with human diseases will help to understand the mechanisms of hereditary diseases and increase the chances of early diagnosis and treatment. There are two main categories in previous studies: The evolutionary-based methods are limited by the accuracy of classification, while the machine learning methods may have serious over-fitting problem. In this project, we integrate evolutionary analysis with deep learning to systematically elucidate how missense mutations affect the development of the generalized disease and specific cancers. First, according to the maps between protein sequences, structures and functions, a new analyzes methods were developed using statistical theory and information theory for disease-associated missense mutations. Then, the method to identify disease-associated mutations is proposed for all kinds of disease based on Bayesian deep neural network. Finally, we further focus on the tumor. a deep learning model based on bidirectional recurrent neural network is constructed to predict the cancer driver mutation. In essence, this project take advantages of computational modeling to exploit the quantitative relationship between missense mutation data and disease, and further to quickly construct the analysis and prediction models for the missense mutation under different disease. In general, this study will provide a comprehensive, accurate and safe guidance of diagnosis, treatment and prevention of diseases.

进化过程中,起关键作用的氨基酸发生突变会引起构象或生理功能的变化,甚至引发疾病。识别与人类疾病相关的错义突变有助于了解遗传性疾病的机制,增加早期诊断和治疗的机会。之前的研究主要可以分为两组,依赖进化信息的方法受限于分类准确性,而依赖机器学习的方法存在过拟合现象。本项目,拟采用进化分析与深度学习相整合的研究策略,系统地阐明突变是如何影响广义疾病甚至是特定癌症的发生。首先,基于序列、结构以及功能的映射图谱,发展基于统计学理论和信息学理论的疾病相关突变分析。然后,广谱针对所有疾病的突变识别提出一个基于贝叶斯深度神经网络的模型。最后聚焦肿瘤问题,为解决癌症驾驶员突变预测构建基于双向递归神经网络深度学习模型。实质上,本项目利用计算建模的优势,充分挖掘错义突变数据中蕴藏的与疾病相关的定量信息,快速构建出不同疾病状态下的突变分析预测模型,进而为疾病的诊断、治疗和预防提供全面、准确、安全的指导能力。

项目摘要

进化过程中,突变会引起构象或生理功能的变化,甚至引发疾病。识别与人类疾病相关的突变有助于了解疾病的机制和药物设计,增加早期诊断和治疗的机会。本课题以DNA和蛋白质突变数据为基础,通过人工智能方法研究疾病与突变的构效关系。首先,我们针对人类广义疾病以及季节性流感病毒的突变数据构建模型,以准确识别疾病相关错意突变。我们的方法在涉及人类基因组2154个ORF的10635个nsSNP的大规模数据集上进行了测试,识别疾病相关nsSNP的准确率0.80,相关系数为0.601,比其他流行方法中最好的高9.1%。在移码突变和无意义突变研究中,我们进一步分析了预测结构中使用的多头注意力机制,发现多个自注意力头不仅可以学习局部和全局相互作用,而且对突变残基有较大影响的功能位点也可以被注意力焦点所捕获。这些可以为发现治疗疾病的潜在目标提供有用线索。我们还系统地度量了流感病毒主要抗原蛋白HA上每个位点在整个流感病毒进化历史中的抗原贡献,并识别出了季节性流感A(H3N2)和A(H1N1)抗原变异过程中最关键的10-15个决定性突变位点。研究发现,两种亚型病毒既采用了一致的突变策略,又有自身特异性的变异机制。同时,我们从位点角度刻画出了每个关键位点在抗原变异过程中的氨基酸突变的特征和历史,并从病毒角度描绘出了抗原变异过程中的整体关键位点突变轨迹和支配规律。此外,在研究过程中我们发现突变对蛋白质结构、功能以及复合物相互作用等具有重要影响,因此我们对受突变影响的结构和功能进行分析与预测,最终达到分析突变与疾病之间的复杂关系的目的。为此,我们使用深度学习方法改善分子二级结构相关预测,以及分子复合物的相互作用位点识别和结合亲和力预测。为了更好的服务其他科研人员,同时扩大我们研究工作的影响力,我们构建了多个疾病相关突变的分析预测在线服务平台,进而为疾病的诊断、治疗和预防提供分析和指导数据。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
5

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019

权丽君的其他基金

相似国自然基金

1

基于神经网络的短期经济预测方法研究

批准号:79270011
批准年份:1992
负责人:吴坚忠
学科分类:G0104
资助金额:3.50
项目类别:面上项目
2

基于深度卷积神经网络的快速磁共振成像方法研究

批准号:61601450
批准年份:2016
负责人:王珊珊
学科分类:F0125
资助金额:19.00
项目类别:青年科学基金项目
3

基于新型深度神经网络的图像描述理论与方法研究

批准号:61701277
批准年份:2017
负责人:李亚利
学科分类:F0116
资助金额:28.00
项目类别:青年科学基金项目
4

基于深度置信神经网络的地表覆盖质量检测方法研究

批准号:41671440
批准年份:2016
负责人:张继贤
学科分类:D0113
资助金额:65.00
项目类别:面上项目