开放获取生物医学文献的实体关系抽取

基本信息
批准号:61602207
项目类别:青年科学基金项目
资助金额:20.00
负责人:丰小月
学科分类:
依托单位:吉林大学
批准年份:2016
结题年份:2019
起止时间:2017-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:管仁初,韩霄松,冯子玹,陈亮,王珏鑫,陈鑫,姜玥旭,崔明亮,王旭
关键词:
开放获取文本挖掘生物医学文献实体关系抽取表示学习
结项摘要

Plenty of knowledge is included in the massive open access biomedical literatures, however, entity extraction on full texts are fall into high-dimensional matrix computing, semantic change and predicate discovery problems. To address these issues, our main researches are as follows: 1. With the structure information of literature and representation learning model, a novel biomedical entity relationship extraction method based on deep learning is going to proposed. It can solve the serious sparse problem of long-tailed entity and relationship distributions. 2. For the semantic change problems, we are going to analysis the cause and classification of them. Moreover, the quantity measurement of semantic change will be designed. Then, a hybrid model of deep learning and semi-supervised learning is going to be presented for semantic change solution. 3. Generate a biomedical knowledge graph based on biomedical entities and relationships. Using path ranking algorithm and ontology extension model, we will predict the relationships between entities and discover the predicates from the muti-step path. 4. Based on the new proposed models and algorithms, an open entity relationship extraction platform will be constructed. These researches will provide the service for biologists and medical doctors.

海量开放获取生物医学文献中蕴含着大量的知识,对其进行深度挖掘意义重大。然而全文文献中的实体关系挖掘面临着高维稀疏矩阵计算、语义漂移和谓词发现问题。针对这些问题,本项目拟开展如下研究:1.提出基于文献空间结构信息和表示学习模型的深度学习实体关系抽取算法,有效处理长尾分布实体及其关系上面临的严重稀疏问题。2.针对实体关系抽取中的语义漂移问题,分析其形成原因和类别,提出度量方法,融合深度学习与半监督学习模型解决语义漂移问题。3.将生物医学实体和关系生成知识图谱,运用路径排序算法和本体扩展模型从两实体间的多步关系路径预测它们之间的关系,发现新的谓词。4.将新提出的模型和算法整理形成生物医学文献开放实体关系抽取平台,为生物学家和医学家提供服务。

项目摘要

海量的开放获取生物医学文献中蕴含着大量的知识,对其进行深度挖掘意义重大。项目致力于利用表示学习框架下的新型、高效的关系抽取技术,构建为生物学家和临床医生提供更加高效、准确的知识发现平台,使其能够快速的从海量生物医学文献数据中挖掘出更有意义和价值的知识。主要工作如下:.1.充分利用大量未标记的生物医学文献数据,深入挖掘海量生物医学命名实体之间的关系。采用残差卷积神经网络进行蛋白质关系抽取,基于表示学习、表示主题模型进行糖尿病和肥胖症关系抽取;基于主题模型的阿尔兹海默症研究趋势分析;实验结果证明了上述模型的有效性,促进了深度学习算法在蛋白质关系抽取、疾病间关系抽取以及疾病研究热点分析等领域的应用。.2.在实体关系抽取模型基础上生成生物医学知识图谱,并运用关系路径特征学习及关系路径嵌入模型补全知识图谱。大规模知识图谱中的实体规模已经数以亿计,但是由于关系稀疏,它们还远未完善。路径特征学习模型通过两阶段模型完成路径特征学习及路径预测。关系路径嵌入模型时将每个实体嵌入两种类型的潜在空间。而且,类型约束从传统的特定关系的类型约束扩展到新提出的特定路径的类型约束。上述模型对于知识图谱补全,知识表示具有重要意义。.3.基于表示学习进行关系抽取与研究热点分析模型,搭建推荐系统及知识发现平台。采用卡方特征选择及深度卷积神经网络以实现摘要的语义表示,分别完成了计算机科学及生物医学期刊论文投稿推荐系统;整理相关模型并搭建了生物医学复杂关系抽取与知识发现平台( http://www.keaml.cn/BMKnowledge/ ),为多学科交叉研究提供决策支持。.上述工作相关成果发表在Journal of Medical Internet Research(医学信息学领域排名第一),Knowledge-Based System (中科院二区期刊),International Journal of Biological Sciences(中科院二区期刊)等知名期刊上。项目执行期间共发表SCI索引论文12篇,CCF B类会议IEEE International Conference on Bioinformatics and Biomedicine上发表学术论文1篇,EI索引期刊论文1篇。获得国家发明专利授权3项,软件著作权1项。获2018年吉林省科技进步二等奖1项。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
2

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
3

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
4

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019
5

面向工件表面缺陷的无监督域适应方法

面向工件表面缺陷的无监督域适应方法

DOI:
发表时间:2021

丰小月的其他基金

相似国自然基金

1

面向开放域知识网络的实体语义关系抽取方法研究

批准号:61672057
批准年份:2016
负责人:冯岩松
学科分类:F0211
资助金额:62.00
项目类别:面上项目
2

基于知识库和深度学习的生物医学实体关系抽取研究

批准号:61772109
批准年份:2017
负责人:周惠巍
学科分类:F0211
资助金额:63.00
项目类别:面上项目
3

特定领域实体关系获取与实体链接

批准号:61562052
批准年份:2015
负责人:郭剑毅
学科分类:F0211
资助金额:39.00
项目类别:地区科学基金项目
4

藏文实体语义关系抽取理论与方法研究

批准号:61262054
批准年份:2012
负责人:于洪志
学科分类:F0211
资助金额:43.00
项目类别:地区科学基金项目