Question answering is a significant research direction in the field of natural language understanding and information retrieval. However, due to the development of natural language processing and artificial intelligence, automatic question answering can only solve limited types of questions. Therefore, it is difficult to meet the complex information needs for different users. With the surging of Web 2.0, user-generated content becomes more and more popular; how to effectively mine and utilize the web scale community question answering data, and combine these techniques with deep question answering, will greatly enhance the development of question answering. This project aims to effectively mine and utilize the community question answering data,analyzing the text content of questions and answers and the behavior information of community users. Based on the above analsis, this project focuses on the following key techniques: (1)large scale short text classification based on space compression and semantic knowledge expansion;(2)new category label dynamic generation based on shortest path;(3)question-answer retreival based on robustness phrase tranlation and large sclae graph mine;(4)best answerer recommendation based on user interest modeling and manifold ranking learning.The above achievements can not only be directly used into the community question answering systems, but also produce significant impact upon automatic question answering systems.
问答系统是自然语言理解和信息检索领域的重要研究课题,然而受限于自然语言处理和人工智能技术的水平,目前自动问答系统能够解决的问题类型非常有限,难以满足真实用户的个性化复杂信息需求。随着Web2.0的兴起,基于用户生成内容的互联网服务越来越流行,如果能对海量社区问答数据进行有效挖掘和利用,并和深层问答技术结合,将有可能有力地推动问答技术的发展。本申请以社区问答数据的有效挖掘利用为总目标,从分析社区文本内容以及用户行为两方面入手,针对社区问答系统的四项关键技术展开研究:(1)基于空间压缩和语义知识扩展的短文本问题的大类别分类;(2)基于最短路径融合的新类别标签动态生成;(3)基于高鲁棒性短语翻译模型和大规模图结构挖掘的问答对检索;(4)基于用户兴趣建模和行为弱标记学习的最佳回答者推荐。以上研究成果一方面可以直接应用于社区问答系统,提升其智能化水平;另一方面也为自动问答系统的发展产生重要影响。
问答系统是自然语言理解和信息检索领域的重要研究课题,然而受限于自然语言处理和人工智能技术的水平,目前自动问答系统能够解决的问题类型非常有限,难以满足真实用户的个性化复杂信息需求。随着Web2.0的兴起,基于用户生成内容的互联网服务越来越流行,如果能对海量社区问答数据进行有效挖掘和利用,并和深层问答技术结合,将有可能有力地推动问答技术的发展。本课题以社区问答数据的有效挖掘利用为总目标,从分析社区文本内容以及用户行为两方面入手,针对社区问答系统的四项关键技术展开研究:(1)基于空间压缩和语义知识扩展的短文本问题的大类别分类;(2)基于最短路径融合的新类别标签动态生成;(3)基于高鲁棒性短语翻译模型和大规模图结构挖掘的问答对检索;(4)基于用户兴趣建模和行为弱标记学习的最佳回答者推荐。主要研究成果包括:在国内外重要学术会议和期刊上共发表论文26篇,其中国际顶级期刊和会议论文25篇,国内核心期刊以及重要学术会议上发表论文1篇,申请国家专利7项,国际学术奖励一项(COLING 2014 Best Paper Award),国内学术奖励一项(CCL和NLP-NABD2016最佳论文奖),2014年度中国中文信息学会“钱伟长中文信息处理科学技术奖-汉王青年创新奖”一等奖。以上研究成果一方面可以直接应用于社区问答系统,提升其智能化水平;另一方面也为自动问答系统的发展产生重要影响。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
拥堵路网交通流均衡分配模型
卫生系统韧性研究概况及其展望
面向云工作流安全的任务调度方法
社区问答系统关键技术研究
基于内容分析的话题检测和追踪关键技术研究
社会化问答社区用户的持续知识行为研究
基于协同计算的社区问答意见型问题分析与答案生成研究