基于粒计算与语义模板的问答系统研究

基本信息
批准号:61305094
项目类别:青年科学基金项目
资助金额:25.00
负责人:徐菲菲
学科分类:
依托单位:上海电力大学
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:刘文印,Hao Tianyong,张安勤,邓莎莎,张维
关键词:
语义模板粗糙集粒计算问答系统
结项摘要

In order to improve the accuracy of question analyzing and answering thus to improve the intelligence of user-interactive question answering systems, we introduce granular computing into current question answering systems on the bais of our deep research on semantic pattern. Granular computing is an effective way to simulate human's thinking and problem solving abilities in terms of simplifying complex real world cases into multi-dimensional problems with multi-granularities. Enhanced withgranular computing and semantic patterns, the question answering systems can improve their understanding to user's questions, so that the accuracy of question answering and intelligence can be improved. This research mainly includes: since the existing pattern-based techniques do not consider pattern granularity for certain semantic requirement, we study the definition and the granulation of semantic patterns, and the method of granularity evaluation, to generate semantic patterns not only to meet the need of semantic analysis but also to cover more questions; To improve the accuracy of question classification, we address a question classification and rule extraction method based on rough sets, and the computational method of question similarity; To solve the problem of low quality of answers, we propose a hierarchical model of answers and study the clustering method for multi-answers of a same question, as well as the method of choosing proper granularity of answers. In this project, by applying granular computing and semantic patterns into question answering systems, we propose a novel solution for the high performance need of current question answering systems. The solution is of great importance to theoretic research and practical application for the research on question answering systems.

当前问答系统普遍存在问题分析不足、答案准确率低、智能性差等问题,在深入研究粒计算、语义模板的基础上,我们借助粒计算理论能发挥模拟人类思维从不同角度、不同层次分析问题的优势,采用语义和模式相结合的语义模板方法,实现基于粒计算与语义模板的问答系统,使得用户提出的问题能够被机器更深层识别和理解,从而提高问答系统的准确率与智能性。研究内容重点包括:针对目前模板技术并未考虑调整模板粒度使得问题分析准确率不高等问题,研究语义模板的定义及其粒化方法,以及模板粒度评估策略;针对目前问题分类的精度不高等问题,研究基于粗糙集的问题分类规则提取及相似问题判别方法;针对目前答案获取的准确率较低等问题,研究答案的粒度层次构建及选取标准,同一问题不同答案的聚类方法。本课题将粒计算理论与语义模板技术进行深层融合并应用到交互式问答系统中,为问答系统的研究提供一种新的有效解决方法,具有重要的理论研究与实际应用价值。

项目摘要

相较于从搜索引擎获取信息的方式,用户在交互式问答系统中通过简单的提问和回答方式快速准确的获取所需信息,而不是从搜索引擎返回的大量相关文档中繁琐地去查找信息。用户交互式问答系统虽然为人们提供了获取信息的便捷服务,但是依然存在着各种各样的问题,问题分析和答案的准确度较低是其中最显著的两个问题。为了提高用户交互式问答系统的性能,本项目以粒计算理论为指导思想,首先将语义和模式相结合,给出语义模板的定义;通过对概念的粒度化,我们提出了模板粒度的评估策略SIIPU;实验结果说明通过调整参数的值,SIIPU模板粒度评估策略能够非常有效的评价一个模板库中模板粒度的适合程度,并能帮助系统抽取出高质量的问题模板。其次,针对目前交互式问答系统的数据呈爆炸式增长,为了提高问答系统的问题分类效率和智能性,我们将粒计算的约简理论引入至问答系统,根据不同的数据特点,分别提出了基于互信息的模糊粗糙集并行约简算法、基于联合属性重要度的决策风险最小化约简算法、多决策表下的区间值全局近似约简算法;实验反映出三个算法所选取的属性均具有较强的分类能力,所获得的约简子集都是有效的。进一步,根据交互式问答系统的累积的问题,我们抽取出实词作为特征,构造了语义空间,给出特征的权值计算方法和特征语义聚类方法,提出了语义空间中问题相似度的计算方法,实验证明了所提方法具有较高的精度。最后,针对文本的高维数据流特性,我们提出了基于数据流的熵加权软子空间聚类算法EWSSC;通过实验给出了数据块粒度大小的选取方案;从实验结果来看,EWSSC算法得到了与现有批处理软子空间聚类算法近乎一致的聚类结果,但节省了更多的运行时间,同时,实验结果也表明了EWSSC算法在大规模文本数据的聚类问题中可以得到很好的应用。结合以上研究,我们搭建了一个用户交互式问答原型系统。由此,粒计算理论能发挥模拟人类思维从不同角度、不同层次分析问题的优势,是解决目前问答系统所面临主要问题的一条有效途径。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

EBPR工艺运行效果的主要影响因素及研究现状

EBPR工艺运行效果的主要影响因素及研究现状

DOI:10.16796/j.cnki.1000-3770.2022.03.003
发表时间:2022
2

复杂系统科学研究进展

复杂系统科学研究进展

DOI:10.12202/j.0476-0301.2022178
发表时间:2022
3

智能煤矿建设路线与工程实践

智能煤矿建设路线与工程实践

DOI:10.13199/j.cnki.cst.2020.07.010
发表时间:2020
4

二维FM系统的同时故障检测与控制

二维FM系统的同时故障检测与控制

DOI:10.16383/j.aas.c180673
发表时间:2021
5

末次盛冰期以来中国湖泊记录对环流系统及气候类型的响应

末次盛冰期以来中国湖泊记录对环流系统及气候类型的响应

DOI:DOI: 10.11821/dlxb201611003
发表时间:2016

相似国自然基金

1

面向问答系统的多维语义模板研究

批准号:61403088
批准年份:2014
负责人:郝天永
学科分类:F0604
资助金额:25.00
项目类别:青年科学基金项目
2

基于公理模糊集和粒计算的多元动态数据的知识发现与语义表示

批准号:61673082
批准年份:2016
负责人:刘晓东
学科分类:F0605
资助金额:62.00
项目类别:面上项目
3

基于粒计算的多元时序数据语义建模、算法及应用研究

批准号:61876029
批准年份:2018
负责人:卢伟
学科分类:F0605
资助金额:16.00
项目类别:面上项目
4

基于大数据深度语义表示学习的农业智能问答研究

批准号:31771677
批准年份:2017
负责人:陈雷
学科分类:C1301
资助金额:62.00
项目类别:面上项目