确定性表达式及其子类的理论问题与工具研究

基本信息

批准号：61472405

项目类别：面上项目

资助金额：80.00

负责人：陈海明

学科分类：

依托单位：中国科学院软件研究所

批准年份：2014

结题年份：2018

起止时间：2015-01-01 - 2018-12-31

项目状态：已结题

项目参与者：吴鹏,郑黎晓,陆平,陈明帅,冯晓强,李慧松,彭飞飞,张帅,岳翰

关键词：

XML子类确定性表达式可判定性算法

结项摘要

Deterministic regular expressions are widely used in XML and other fields. However the related theoretical studies for this kind of expressions currently cannot meet the need of practical work. This project will study several most important problems in the theoretical studies for deterministic expressions. Presently the most difficulty in using this kind of expressions is that they do not have a syntax definition. This has become an important reason for restricting the use of deterministic expressions, and also a reason for using DTDs and XML Schemas that do not conform specifications in practice. Meanwhile, most of DTDs and XML Schemas use subclasses of deterministic expressions, such as SOREs and CHAREs. Hence the main objectives of this project are to develop syntax definitions for deterministic expressions and their subclasses, and study tools for automatically generating deterministic expressions based on these definitions. For the situation where there is not any schema for the XML files, we will study how to infer deterministic expressions or their subclasses for these files. For some important decision problems in deterministic languages, we will try to investigate theoretical properties and develop new algorithms, and hope to get some computational complexity results. For strongly deterministic regular expressions, we want to establish the relations between strongly deterministic expressions and deterministic expressions. By using these relations, we intend to design a linear time algorithm for deciding strong determinism of regular expressions, and find automata whose determinism will indicates determinism of regular expressions with counting. All these theoretical results will greatly promote the use of deterministic regular expressions in practice.

确定性表达式在XML以及其它领域有着很多应用，然而相关的理论研究目前还远不能满足实际工作的需要。本项目将对其中迫切需要解决的问题进行深入、系统的研究。目前使用确定性表达式的最主要的困难在于这类表达式没有语法定义，这已成为制约确定性表达式应用以及在实际当中使用不符合规范的DTDs和XML Schemas的重要因素。另外在实际中，还经常使用确定性表达式的一些子类。因此，本项目研究确定性表达式及其子类的语法表示问题，和基于语法的确定性表达式生成工具。对于模式缺失的情况，则需要研究确定性表达式及子类的推断问题。对于确定性语言研究中极为重要的若干判定问题，我们将进行理论与算法研究，希望得到新的复杂度结论和算法。对于强确定性表达式，则希望得到线性判定算法，并通过建立确定性与强确定性表达式之间的联系，得到带数字出现的确定性表达式的自动机刻画。这些研究结果，将对确定性表达式的更好应用产生积极而深远的影响。

项目摘要

确定性表达式在XML以及其它领域有着很多应用，本项目对其中迫切需要解决的问题进行深入、系统的研究，包括语法表示和推断问题、确定性语言与强确定性表达式的判定算法、和生成工具。本项目执行结果超额完成了研究计划，取得的主要进展和结果如下。.(1) 在确定性表达式的语法表示研究方面，1) 提出了标准确定性表达式的第一个文法。2) 证明标准确定性表达式所属的文法类为上下文无关文法。3) 给出了判定有效文法产生式的规则。上述工作，迈出了解决语法表示问题的重要一步。.(2) 在确定性语言的理论与判定算法研究方面，1) 标准确定性正则语言的判定。a) 证明了当字母表固定时判定一个最小确定性自动机是否刻画了一个确定性正则语言是NL（非确定对数空间）完全的。b) 证明了判定一个单字母表的标准正则表达式是否对应于一个确定性正则表达式是coNP完全的。2) 带数字出现的确定性正则语言的判定。我们通过研究单字母确定性正则语言的判定，给出这个问题的一个复杂度下界。3) 字符单次出现确定性正则表达式（SORE）所刻画语言的判定。给出了这个问题在不同条件下所对应的复杂度。4) 限界的字符单次出现确定性正则语言的判定。给出了该问题在不同条件下所对应的复杂度。.(3) 在强、弱确定性表达式判定算法研究方面，1) 提出了强确定性表达式的第一个线性判定算法。 2) 分别提出了无序正则表达式的第一个强、弱确定性判定算法。3) 分别提出了带无序与带数字出现的正则表达式的第一个强、弱确定性判定算法。.(4) 在工具研究方面，设计并实现了一组确定性表达式生成、判定与诊断工具。.(5) 在确定性表达式及子类的推断算法研究方面，1) 针对已有的XML子类研究中存在的不足，开展了网络数据的获取与实验研究，并得到了新的研究结果。2) 基于上述数据，提出了多个确定性表达式的新子类及其推断算法。.(6) 已发表和录用17篇研究论文。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：10.3778/j.issn.1002-8331.1903-0411

发表时间：2020

DOI：10.19328/j.cnki.2096-8655.2022.02.002

发表时间：2022

DOI：10.13973/j.cnki.robot.210412

发表时间：2022

DOI：10.7544/issn1000-1239.2019.20190386

发表时间：2019

陈海明的其他基金

批准号：61070038

批准年份：2010

资助金额：32.00

项目类别：面上项目

批准号：60573013

批准年份：2005

资助金额：22.00

项目类别：面上项目

批准号：60103008

批准年份：2001

资助金额：18.00

项目类别：青年科学基金项目

批准号：61100180

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

批准号：61872339

批准年份：2018

资助金额：63.00

项目类别：面上项目

批准号：81803804

批准年份：2018

资助金额：21.00

项目类别：青年科学基金项目

批准号：31801494

批准年份：2018

资助金额：26.00

项目类别：青年科学基金项目

相似国自然基金

支持计数与无序的扩展表达式的理论问题与应用研究

批准号：61872339

批准年份：2018

负责人：陈海明

学科分类：F0201

资助金额：63.00

项目类别：面上项目

填充曲线的解析表达式及其应用

批准号：60962009

批准年份：2009

负责人：杨晓玲

学科分类：F0113

资助金额：20.00

项目类别：地区科学基金项目

非确定性分布式系统的测试方法和工具的研究

批准号：69273027

批准年份：1992

负责人：叶新铭

学科分类：F0207

资助金额：5.00

项目类别：面上项目

GIS中图象数据位置不确定性理论问题研究

批准号：40071068

批准年份：2000

负责人：杜道生

学科分类：D0114

资助金额：18.00

项目类别：面上项目

确定性表达式及其子类的理论问题与工具研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

新型树启发式搜索算法的机器人路径规划

"多对多"模式下GEO卫星在轨加注任务规划

基于自适应干扰估测器的协作机器人关节速度波动抑制方法

基于卷积神经网络的JPEG图像隐写分析参照图像生成方法

陈海明的其他基金

无秩树结构数据和语义多态类型系统的研究

基于文法的系统的模型和检验问题研究

多种类递归函数的求值算法和优化技术研究

自适应占空比的自供电无线传感器网络无状态可靠数据收集机制研究

支持计数与无序的扩展表达式的理论问题与应用研究

基于抑制PI3K/AKT/mTOR信号通路调控CD4+Foxp3+Treg探讨银屑灵优化方治疗银屑病的作用机制

甜菜粕果胶结构诱导的界面行为及乳化特性研究

相似国自然基金