突变导致的蛋白质-蛋白质关系抽取研究

基本信息
批准号:61906028
项目类别:青年科学基金项目
资助金额:24.00
负责人:赵哲焕
学科分类:
依托单位:大连理工大学
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
事件关系抽取强化学习蛋白质蛋白质关系抽取命名实体识别
结项摘要

Causality information between mutants and protein-protein interactions (PPIs) plays a crucial role in the field of precision medicine research. At present, a great deal of research has been done on mutant entity recognition and PPI extraction, but there is little research on the extraction of causality between them. In this study, we will extract mutations caused PPIs through the following three steps. First, deep reinforcement leaning based named entity recognition method is proposed to automatically identifies mutations and proteins from a large number of biomedical literature. Second, the relational extraction method based on triple-loss strategy is utilized to find out the PPIs between the protein entities identified in the first step. Third, the mutations and PPIs are regarded as corresponding events, and then an event causality extraction method is used to determine whether there is a causal relationship between the mutation-PPI pairs. In addition, we propose the task-oriented contextual semantic word vector which can be the base input of the above three tasks. The contextual semantic word vector will improve the tasks’ performances. Through the above three steps, the mutation-PPI pairs with causal correlations will eventually be generated and made available to precision medical experts as an important reference in their research process.

突变实体与蛋白质-蛋白质关系(Protein-Protein Interaction,PPI)之间的因果关系信息在精准医疗研究领域起着至关重要的作用。当前,对于突变实体识别和PPI抽取都展开了大量研究,但是对于它们之间因果关系的抽取研究很少。对此,本项目拟通过如下三个步骤完成突变导致的PPI抽取任务。首先,本项目提出基于强化学习框架的命名实体识别模型,从海量生物医学文献中自动识别突变和蛋白质实体。然后,利用基于Triple-loss策略的关系抽取方法从第一步识别出的蛋白质实体中找出可能存在关系的蛋白质实体对。最后,将突变和PPI看作是对应的事件,然后利用事件因果关系抽取方法判断它们之间是否存在因果关系。此外,本项目提出任务导向的上下文语义词向量训练方法,作为上述任务的输入,全面提高任务性能。通过上述三个步骤,最终将生成存在因果关联的(突变,PPI)组合,提供给精准医疗专家进一步分析。

项目摘要

精准医疗可以针对每个病人的基因、所处环境与生活习惯等的差异,给出个性化的治疗方案,是国家战略层面需要攻克的难题。想要从基因层面出发分析一个人的疾病,并给出精准医疗方案,需要获取基因突变与该突变可能导致的 PPI 信息、 PPI 与通路之间的从属关系信息和通路与疾病表征之间的对应关系。其中,基因突变与 PPI 之间的因果关系信息的获取是第一步需要解决的问题,是精准医疗研究的重要组成部分。对此,本项目针对生物医学领域的命名实体识别和关系抽取任务开展了如下研究。首先,研究上下文感知的语义词向量训练,使每个单词的分布式表示中包含当前上下文信息,提升表示能力,为候选命名实体识别和关系抽取任务提供基础输入。然后,研究基于强化学习的命名实体识别算法,将强化学习技术引入命名实体识别领域,提升生物医学实体识别的精度。最后,研究基于三元损失策略的关系抽取算法,通过主动增加负例之间的距离,提升同源关系的区分度,进而提升生物医学关系抽取的精度。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
2

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
3

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
4

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
5

丙二醛氧化修饰对白鲢肌原纤维蛋白结构性质的影响

丙二醛氧化修饰对白鲢肌原纤维蛋白结构性质的影响

DOI:10.7506/spkx1002-6630-20190411-143
发表时间:2020

赵哲焕的其他基金

相似国自然基金

1

融合指代消解和迁移学习的蛋白质交互关系抽取的研究

批准号:61173101
批准年份:2011
负责人:李丽双
学科分类:F0211
资助金额:55.00
项目类别:面上项目
2

基于信息抽取技术的蛋白质相互作用网络构建及蛋白质复合物识别研究

批准号:61070098
批准年份:2010
负责人:杨志豪
学科分类:F0211
资助金额:32.00
项目类别:面上项目
3

蛋白质-配体绑定区域预测的特征抽取及学习算法研究

批准号:61373062
批准年份:2013
负责人:於东军
学科分类:F0213
资助金额:75.00
项目类别:面上项目
4

蛋白质翻译后修饰位点物种特异性预测的特征抽取和学习算法研究

批准号:61403077
批准年份:2014
负责人:赵晓威
学科分类:F0603
资助金额:25.00
项目类别:青年科学基金项目