The establishment of knowledge base and knowledge graph based on the concept and techniques of big data in the domain of mineral deposit is of great significance to the research of mineral deposits. Some important knowledge is hidden in the unstructured literature. It is necessary to extract, store and visualize structured information from geological literature based on the artificial intelligence. This proposal intends to explore the technology of structured information extraction and knowledge graph establishment from big data of geological literature. The knowledge graph will be further used to make semantic information mining and knowledge inference. In this proposal, geological literature of porphyry copper deposit was select as a case study. A hybrid method combining bidirectional long short-term memory (Bi-LSTM) and conditional random field (CRF) will be introduced to make part-of-speech (POS) tagging for geological text data with a guidance from mineral deposit ontology model. Factor graph (FG) method will be trained to extract entities and their semantic linkings. The knowledge base and knowledge graph will be built based on the research of data storage of entities and their semantic linkings and visualization. This study has important scientific significance and application values for non-structural geoscience big data mining and mineral deposit research.
基于大数据思维及技术方法开展矿床领域知识库和知识图谱的构建,对人工智能在矿床学中的研究具有重要意义。矿床领域知识大多隐含在非结构化地质文本资料中,需要利用人工智能相关技术对文本进行结构性信息提取、存储和可视化表达。本项目将探索从矿床领域地质文本大数据中自动抽取三元组结构性信息与知识图谱构建的技术方法,并基于所建立的知识图谱进行语义信息挖掘和知识推理的探索性研究。拟以斑岩型铜矿床文本大数据为例,在本体模型的指导下,综合利用双向长短期记忆(Bi-LSTM)模型和条件随机场(CRF)模型方法探索矿床领域文本数据词性标识方法,并利用因子图模型(FG)抽取矿床领域实体及其语义关系,研究抽取结果的存储方法和可视化表达方式,建立矿床领域知识库和知识图谱,进而开展语义信息挖掘和知识推理的探索性研究。此项研究对非结构性地学大数据挖掘及矿床学研究都具有重要的科学意义和应用价值。
在大数据和人工智能的时代背景下,利用知识图谱等相关技术,改善地球科学研究方式,以解决复杂的地球科学问题,已逐渐成为地球科学家和信息学家的共识。地学领域知识图谱的构建主要依托非结构性地学文本大数据挖掘。本项目以斑岩型铜矿为研究对象,在本体模型的指导下,在基于深度学习的地学文本大数据实体和语义提取的基础上,构建斑岩型铜矿领域知识图谱;进而开展语义挖掘和知识发现领域探索性研究。通过本项目的开展主要取得以下主要成果:(1)建立了斑岩型铜矿领域本体模型;(2)斑岩型铜矿领域实体-语义关系令牌及训练语料数据集;(3)建立基于深度学习的斑岩型铜矿领域实体识别模型;(4)基于关系数据映射构建斑岩型铜矿领域知识图谱;(5)建立了基于关系数据映射和地学文本数据挖掘的斑岩型铜矿知识图谱构建的技术方法体系;(6)斑岩型铜矿知识图谱的可视化、知识查询、知识推理和知识发现;(7)知识图谱驱动的矿产资源定量预测探索性研究。项目的开展为地质文本大数据的挖掘和利用提供了新的思路和技术方法路线,提高了文献资料的利用效率、促进了地质信息大数据挖掘和地学智能化的发展;基于斑岩铜矿领域知识图谱的语义挖掘,从新的角度探索斑岩型铜矿的成矿规律和特征,加深对斑岩型铜矿成矿过程的理解;本项目形成的技术方法流程和成果可以为其它地学领域知识图谱的构建与应用具有明显的借鉴意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
低轨卫星通信信道分配策略
青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化
服务经济时代新动能将由技术和服务共同驱动
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比
面向特定领域文本的知识元及其关联挖掘方法研究
面向词汇功能的学术文本语义识别与知识图谱构建
基于迁移学习的地理领域知识图谱构建技术
面向特定领域的知识图谱构建与应用关键技术研究