This project is based on the application of reservoir characterization, and it is devoted to solve the problems in complex structured big oil and gas with long processing time, high percentage of noises, and large amount of manual process. In this proposed project, we aim to the study of spatial clustering method on the spatial correlated, extreme noisy, uncertain multi-valued big oil and gas data to help identify meaningful reservoir property clusters, to assist reservoir characterization. This project effectively solves the description and calculation of spatial correlation by introducing the spatial correlation and spatial entropy in the spatial network space and the new spatial data structure suitable for Map-reduce on big spatial data. Additionally, the cluster is regarded as the pattern in the data distribution, and the recursive method based on the dip test is developed to detect clusters in the data distribution. The clustering methods on the univariate and multivariable data are discussed to solve the sea of noise problem. We also introduce the quantile-based distance to consider the uncertainty of the object and the relative distribution between the objects to solving the uncertain multi-valued problem. Finally, this project establishes the ontology of spatial clustering and oil and gas domain knowledge, and puts forward the ontology-based spatial clustering methods. An interactive visualization model will be developed to reduce the human involvement.
本项目以油藏描述应用为背景,针对油田海量大数据构造复杂,处理周期久,噪音干扰大,需要大量人工参与等问题, 致力于研究探索面向油田大数据的空间相关性、 高噪音、及不确定多值特性的空间聚类方法,并结合领域知识识别有意义的油藏数据划分, 辅助油藏描述和油层识别的等决策。 本项目通过引入网络空间中的空间相关性和空间熵,以及适用于大空间数据Map-reduce的并行数据结构,有效解决空间相关性的描述和计算。同时,将划分看成是数据分布中的模式,并开发基于浸渍实验的递归方法以探测数据分布中的划分,讨论在单变量数据和多变量数上的聚类分析以解决高噪音问题。 然后引入基于使用基于分位数的距离,考虑对象的不确定性和对象之间的相对分布, 解决不确定多值的问题 。最后本项目建立空间聚类和油田数据的本体,和在此基础上提出基于本体的领域知识的空间聚类方法和过程, 同时开发出交互式可视化模型,解决需要大量人工参与的问题。
石油是我国重要的能源和经济的支柱产业,作为一种战略物资在我国国民经济发展中具有举足轻重的作用。空间聚类是一种及其重要的数据挖掘技术,可将各种地震、地质、测井数据根据空间的距离和油藏数据在非空间属性上的相似性进行分组分类,进而可根据划分归并来刻画地质属性、地震信号和油藏属性,是面向大数据油藏描述的关键步骤。本项目以油藏描述应用为背景,针对油田海量大数据构造复杂,处理周期久,噪音干扰大,需要大量人工参与等问题,研究探索了面向油田大数据的空间相关性、 高噪音、及不确定多值特性的空间聚类方法,并结合领域知识识别有意义的油藏数据划分, 辅助油藏描述和油层识别的等决策。 本项目通过引入网络空间中的空间相关性和空间熵,以及适用于大空间数据Map-reduce的并行数据结构,有效解决空间相关性的描述和计算。同时,将划分看成是数据分布中的模式,并开发基于浸渍实验的递归方法以探测数据分布中的划分,讨论在单变量数据和多变量数上的聚类分析以解决高噪音问题。 然后引入基于使用基于分位数的距离,考虑对象的不确定性和对象之间的相对分布, 解决不确定多值的问题 。最后本项目建立空间聚类和油田数据的本体,和在此基础上提出基于本体的领域知识的空间聚类方法和过程, 同时开发出交互式可视化模型,解决需要大量人工参与的问题。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
莱州湾近岸海域中典型抗生素与抗性细菌分布特征及其内在相关性
多空间交互协同过滤推荐
面向社会媒体数据的子空间聚类算法研究
复杂多视图高维数据子空间聚类方法研究
基于智能空间聚类和GPU计算的大尺度城市扩张模拟研究
高维空间海量数据快速聚类算法关键技术的研究