基于文本语境约束的XML商业报告多维分析模型研究

基本信息
批准号:61303155
项目类别:青年科学基金项目
资助金额:23.00
负责人:黄敏
学科分类:
依托单位:中国科学院大学
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:王泳,王丁,朱健鹏,王文礼,周凯,于宝
关键词:
多维分析文本语境XML链接语言相关度模型可扩展商业报告语言
结项摘要

The XML-based business reports have two characters, the XLink mechanism for cross-documents element linking and the huge text information to explain the structured table. To address the complications resulted from the two characters, this proposal focuses on the multi-dimensional analytical model for the mass XML-based business reports contextualized with textual. First, in order to fetch data for multi-dimensional analytical model, the proposal studies the method to setup index for cross-documents linking arcs and the corresponding navigation algorithm. Second, get associated textual contexts using keyword query method, and then build the domain ontology based on the dimension values of structured table and extract ontology instances from textual contexts using ontology rule-based reasoning. The relevance model is also proposed to compute the correlations between text and query conditions, extracted facts and textual contexts. Lastly, a dimensional hypercube is setup based on fact correlation, context correlation and dimensions of structured business report table. Through operations including selection, projection and aggregation based on definition of data model and fundamental operating algebra, the mass XBRL data can be processed more efficiently.

针对XML商业报告采用XLink机制进行跨文档元素关联、报告中融合大量文本信息对结构化表格进行说明的特性,研究基于文本语境约束的海量XML商业报告的多维分析模型。首先,研究支持跨文档链接弧的索引构建方法和导航算法,为多维分析模型提供数据获取机制。其次,通过关键字查询方法获取关联的文本语境,进而结合结构化表格的维度值、基于领域本体规则推理从文本中自动抽取实例,形成关注事实数据。通过建立相关度模型,获取文本与查询条件相关度、关注事实与文本语境相关度。最后,在事实相关度、语境相关度和商业报告结构化表格维度的基础上建立维度超立方体,通过定义其数据模型和基础操作代数实现选择、投影和聚合等操作,从而解决海量XBRL数据的高效分析处理问题。

项目摘要

针对XBRL商业报告采用XLink机制进行跨文档元素关联、报告中融合大量文本信息对结构化表格进行说明的特性,研究海量XBRL商业报告基于语义的融合和数据分析。采用XBRL维度技术,提出基于空超立方体实现非维度化基础元素的维度化解决方案和基于空维度去除冗余元素的解决方案,建立多维数据模型。基于语义网技术,提出并实现了基于本体的XBRL语义元模型和知识库的构建,设计实现了一种基于语义的XBRL数据到OWL数据的转换方法,具体包括:基于语义网技术构建XBRL财务报告和事实数据语义元模型、 解析XBRL分类标准构建其XML信息集及其生成算法、解析XBRL实例文档构建实例文档信息集及其生成算法、设计XBRL分类标准到OWL本体转换算法、设计XBRL实例文档到OWL实体的转换算法。在语义层面实现数据格式的融合。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
3

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
4

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
5

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016

黄敏的其他基金

批准号:61308081
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:10704019
批准年份:2007
资助金额:25.00
项目类别:青年科学基金项目
批准号:70101006
批准年份:2001
资助金额:15.00
项目类别:青年科学基金项目
批准号:61802272
批准年份:2018
资助金额:19.00
项目类别:青年科学基金项目
批准号:30970782
批准年份:2009
资助金额:32.00
项目类别:面上项目
批准号:30770262
批准年份:2007
资助金额:28.00
项目类别:面上项目
批准号:81501201
批准年份:2015
资助金额:17.50
项目类别:青年科学基金项目
批准号:30770018
批准年份:2007
资助金额:8.00
项目类别:面上项目
批准号:30540015
批准年份:2005
资助金额:10.00
项目类别:专项基金项目
批准号:61271384
批准年份:2012
资助金额:70.00
项目类别:面上项目
批准号:81360435
批准年份:2013
资助金额:51.00
项目类别:地区科学基金项目
批准号:81803031
批准年份:2018
资助金额:21.00
项目类别:青年科学基金项目
批准号:71071028
批准年份:2010
资助金额:28.00
项目类别:面上项目
批准号:60805014
批准年份:2008
资助金额:19.00
项目类别:青年科学基金项目
批准号:11004208
批准年份:2010
资助金额:22.00
项目类别:青年科学基金项目
批准号:31301267
批准年份:2013
资助金额:21.00
项目类别:青年科学基金项目
批准号:11274400
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:61675029
批准年份:2016
资助金额:60.00
项目类别:面上项目
批准号:81573464
批准年份:2015
资助金额:60.00
项目类别:面上项目
批准号:70671020
批准年份:2006
资助金额:18.50
项目类别:面上项目
批准号:81472836
批准年份:2014
资助金额:64.00
项目类别:面上项目
批准号:41101210
批准年份:2011
资助金额:26.00
项目类别:青年科学基金项目
批准号:31771722
批准年份:2017
资助金额:64.00
项目类别:面上项目
批准号:31372233
批准年份:2013
资助金额:79.00
项目类别:面上项目
批准号:61775086
批准年份:2017
资助金额:68.00
项目类别:面上项目
批准号:29000025
批准年份:1990
资助金额:3.50
项目类别:青年科学基金项目
批准号:81560538
批准年份:2015
资助金额:35.00
项目类别:地区科学基金项目
批准号:81901422
批准年份:2019
资助金额:20.50
项目类别:青年科学基金项目
批准号:91957126
批准年份:2019
资助金额:87.00
项目类别:重大研究计划
批准号:61902330
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:11404374
批准年份:2014
资助金额:24.00
项目类别:青年科学基金项目

相似国自然基金

1

基于认知语境的文本情感计算及其应用

批准号:60973068
批准年份:2009
负责人:林鸿飞
学科分类:F0211
资助金额:30.00
项目类别:面上项目
2

面向查询的XML文本自动文摘研究

批准号:60803105
批准年份:2008
负责人:刘德喜
学科分类:F0211
资助金额:19.00
项目类别:青年科学基金项目
3

基于事前约束的XML关键字查询处理技术

批准号:61472339
批准年份:2014
负责人:周军锋
学科分类:F0202
资助金额:80.00
项目类别:面上项目
4

基于隐式反馈和伪反馈的XML文本文档检索技术研究

批准号:60763001
批准年份:2007
负责人:万常选
学科分类:F0207
资助金额:21.00
项目类别:地区科学基金项目