面向地质大数据的时空主题关联检索方法研究

基本信息
批准号:41671400
项目类别:面上项目
资助金额:65.00
负责人:谢忠
学科分类:
依托单位:中国地质大学(武汉)
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:吴亮,陈占龙,杨小红,江宝得,徐永洋,朱小龙,龚希,陈浩,叶文
关键词:
信息检索多特征关联领域本体地质大数据主题
结项摘要

The data models and methods of spatial data and structured data for geological big data have been relatively mature, but a lot of geological unstructured data has not been effective retrieval and utilization. Study of spatio-temporal and thematic relevance in geological structured and unstructured data is to solve one of the key scientific problems, making the best of geological big data. Considering the combination, variability, robustness and correlation of geological data, the project intends to combine geological domain ontology and information extraction, studies spatio-temporal features extraction methods to construct spatio-temporal and thematic relevance integration model; research to improve the traditional spatio-temporal index, establish the theme-spatial association index mechanism; build problem-oriented field geological data retrieval framework. This project will provide model support for the geological data multi-relation analysis; contribute to improve the ability for geological information retrieval and knowledge discovery; provide theoretical and method support for the multi-features associative retrieval of geological big data and offer a series of thought for the ontology-oriented geological data mining.

在地质大数据中空间数据和结构化数据的模型和方法已较为成熟,但大量的地质非结构化数据未得到有效检索和利用,研究地质大数据中结构化和非结构化数据的时空和主题关联是解决地质大数据充分利用的关键科学问题之一。顾及地质数据的混合性、变异性、稳健性、相关性等特性,本项目拟将地质领域本体与信息抽取相结合,研究地质资料时空及主题特征提取方法,构建时空及主题多元特征一体化的关联模型;改进传统时空索引,建立地质大数据的主题-空间关联索引机制;构建面向领域问题的地质大数据检索框架。项目研究将为多关联地质数据分析提供模型支持,将有助于提高地质信息关联检索和知识发现的能力;将为地质大数据多特征关联检索提供理论支持与方法支撑,为面向本体的地质大数据挖掘提供方法思路。

项目摘要

在地质大数据中空间数据和结构化数据的模型和方法已较为成熟,但大量的地质非结构化数据未得到有效检索和利用,本项目研究地质大数据中结构化和非结构化数据的时空和主题关联问题,从而实现地质大数据充分利用。在地质主题信息提取方面,本项目顾及地质数据的混合性、变异性、稳健性、相关性等特性,针对地质体对象、时间信息、空间信息、主题信息、属性信息及语义信息的描述特点,构建了地质实体信息的结构化表达模型;采用深度学习模型,实现了基于循环自学习的深度学习中文分词方法及基于词典语料库生成的地质领域中文分词方法,实现对中文地质报告文本分词;设计了时空卷积的神经网络实现地质报告时空提取;构建了基于词向量的地质报告主题信息提取;在此基础上设计了时空及主题提取原型系统。在时空及主题多元特征一体化关联方面,提出了带注意力机制的层次化孪生网络模型可以有效地捕获到对匹配任务比较关键的语义信息,同时滤除不对称的非关键特征;根据地质领域的实体关系,制定了地质实体信息网络,实现了地质实体信息网络表示;引入超网络模型,从“文本-内容项-特征项”三个粒度表达知识单元之间的多元关系,构建多粒度的地质文本知识关联体系;在此基础上设计了地质大数据表示与关联原型系统;在关联关系建立基础上,构建面向领域问题的地质大数据检索框架-地质空间实体与描述文本的关联检索模型与问题驱动的地质空间与文本融合检索服务组合模型,设计了地质资料知识检索原型系统。项目研究为多关联地质数据分析提供模型支持,将有助于提高地质信息关联检索和知识发现的能力;为地质大数据多特征关联检索提供理论支持与方法支撑,为面向本体的地质大数据挖掘提供方法思路。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

DOI:10.3799/dqkx.2020.083
发表时间:2020

谢忠的其他基金

批准号:40771165
批准年份:2007
资助金额:37.00
项目类别:面上项目

相似国自然基金

1

面向大视场时域巡天观测的大数据检索与融合方法研究

批准号:U1931132
批准年份:2019
负责人:樊东卫
学科分类:A3304
资助金额:50.00
项目类别:联合基金项目
2

大规模Web共享图像的关联分析和主题检索

批准号:61103099
批准年份:2011
负责人:鲁伟明
学科分类:F0214
资助金额:21.00
项目类别:青年科学基金项目
3

面向关联数据的信息检索关键技术研究

批准号:61672361
批准年份:2016
负责人:刘杰
学科分类:F0211
资助金额:63.00
项目类别:面上项目
4

面向视频大数据检索的哈希方法研究

批准号:61872021
批准年份:2018
负责人:刘祥龙
学科分类:F0211
资助金额:65.00
项目类别:面上项目