基于内容分析和行为分析的社区问答关键技术研究

基本信息
批准号:61272332
项目类别:面上项目
资助金额:80.00
负责人:赵军
学科分类:
依托单位:中国科学院自动化研究所
批准年份:2012
结题年份:2016
起止时间:2013-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:周光有,蔡黎,张涛,刘芳,曾道建,齐振宇,陈玉博,雪巍
关键词:
自然语言处理信息抽取问答系统文本内容分析
结项摘要

Question answering is a significant research direction in the field of natural language understanding and information retrieval. However, due to the development of natural language processing and artificial intelligence, automatic question answering can only solve limited types of questions. Therefore, it is difficult to meet the complex information needs for different users. With the surging of Web 2.0, user-generated content becomes more and more popular; how to effectively mine and utilize the web scale community question answering data, and combine these techniques with deep question answering, will greatly enhance the development of question answering. This project aims to effectively mine and utilize the community question answering data,analyzing the text content of questions and answers and the behavior information of community users. Based on the above analsis, this project focuses on the following key techniques: (1)large scale short text classification based on space compression and semantic knowledge expansion;(2)new category label dynamic generation based on shortest path;(3)question-answer retreival based on robustness phrase tranlation and large sclae graph mine;(4)best answerer recommendation based on user interest modeling and manifold ranking learning.The above achievements can not only be directly used into the community question answering systems, but also produce significant impact upon automatic question answering systems.

问答系统是自然语言理解和信息检索领域的重要研究课题,然而受限于自然语言处理和人工智能技术的水平,目前自动问答系统能够解决的问题类型非常有限,难以满足真实用户的个性化复杂信息需求。随着Web2.0的兴起,基于用户生成内容的互联网服务越来越流行,如果能对海量社区问答数据进行有效挖掘和利用,并和深层问答技术结合,将有可能有力地推动问答技术的发展。本申请以社区问答数据的有效挖掘利用为总目标,从分析社区文本内容以及用户行为两方面入手,针对社区问答系统的四项关键技术展开研究:(1)基于空间压缩和语义知识扩展的短文本问题的大类别分类;(2)基于最短路径融合的新类别标签动态生成;(3)基于高鲁棒性短语翻译模型和大规模图结构挖掘的问答对检索;(4)基于用户兴趣建模和行为弱标记学习的最佳回答者推荐。以上研究成果一方面可以直接应用于社区问答系统,提升其智能化水平;另一方面也为自动问答系统的发展产生重要影响。

项目摘要

问答系统是自然语言理解和信息检索领域的重要研究课题,然而受限于自然语言处理和人工智能技术的水平,目前自动问答系统能够解决的问题类型非常有限,难以满足真实用户的个性化复杂信息需求。随着Web2.0的兴起,基于用户生成内容的互联网服务越来越流行,如果能对海量社区问答数据进行有效挖掘和利用,并和深层问答技术结合,将有可能有力地推动问答技术的发展。本课题以社区问答数据的有效挖掘利用为总目标,从分析社区文本内容以及用户行为两方面入手,针对社区问答系统的四项关键技术展开研究:(1)基于空间压缩和语义知识扩展的短文本问题的大类别分类;(2)基于最短路径融合的新类别标签动态生成;(3)基于高鲁棒性短语翻译模型和大规模图结构挖掘的问答对检索;(4)基于用户兴趣建模和行为弱标记学习的最佳回答者推荐。主要研究成果包括:在国内外重要学术会议和期刊上共发表论文26篇,其中国际顶级期刊和会议论文25篇,国内核心期刊以及重要学术会议上发表论文1篇,申请国家专利7项,国际学术奖励一项(COLING 2014 Best Paper Award),国内学术奖励一项(CCL和NLP-NABD2016最佳论文奖),2014年度中国中文信息学会“钱伟长中文信息处理科学技术奖-汉王青年创新奖”一等奖。以上研究成果一方面可以直接应用于社区问答系统,提升其智能化水平;另一方面也为自动问答系统的发展产生重要影响。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
3

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
4

卫生系统韧性研究概况及其展望

卫生系统韧性研究概况及其展望

DOI:10.16506/j.1009-6639.2018.11.016
发表时间:2018
5

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018

赵军的其他基金

批准号:41306202
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:51775315
批准年份:2017
资助金额:60.00
项目类别:面上项目
批准号:61533018
批准年份:2015
资助金额:285.00
项目类别:重点项目
批准号:51905027
批准年份:2019
资助金额:27.00
项目类别:青年科学基金项目
批准号:41101550
批准年份:2011
资助金额:23.00
项目类别:青年科学基金项目
批准号:41661084
批准年份:2016
资助金额:38.00
项目类别:地区科学基金项目
批准号:31772771
批准年份:2017
资助金额:57.00
项目类别:面上项目
批准号:59875074
批准年份:1998
资助金额:14.00
项目类别:面上项目
批准号:30672102
批准年份:2006
资助金额:28.00
项目类别:面上项目
批准号:81672934
批准年份:2016
资助金额:57.00
项目类别:面上项目
批准号:51078333
批准年份:2010
资助金额:37.00
项目类别:面上项目
批准号:41701277
批准年份:2017
资助金额:22.00
项目类别:青年科学基金项目
批准号:61174073
批准年份:2011
资助金额:64.00
项目类别:面上项目
批准号:30671849
批准年份:2006
资助金额:29.00
项目类别:面上项目
批准号:50105011
批准年份:2001
资助金额:21.00
项目类别:青年科学基金项目
批准号:60372016
批准年份:2003
资助金额:22.00
项目类别:面上项目
批准号:60274009
批准年份:2002
资助金额:22.00
项目类别:面上项目
批准号:81760631
批准年份:2017
资助金额:32.00
项目类别:地区科学基金项目
批准号:60574013
批准年份:2005
资助金额:23.00
项目类别:面上项目
批准号:51175310
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:81371625
批准年份:2013
资助金额:70.00
项目类别:面上项目
批准号:81160515
批准年份:2011
资助金额:50.00
项目类别:地区科学基金项目
批准号:71461025
批准年份:2014
资助金额:34.00
项目类别:地区科学基金项目
批准号:51375467
批准年份:2013
资助金额:70.00
项目类别:面上项目
批准号:51407058
批准年份:2014
资助金额:27.00
项目类别:青年科学基金项目
批准号:60875041
批准年份:2008
资助金额:35.00
项目类别:面上项目
批准号:31400216
批准年份:2014
资助金额:24.00
项目类别:青年科学基金项目
批准号:61773098
批准年份:2017
资助金额:66.00
项目类别:面上项目
批准号:81871388
批准年份:2018
资助金额:54.00
项目类别:面上项目
批准号:51175452
批准年份:2011
资助金额:62.00
项目类别:面上项目
批准号:50408008
批准年份:2004
资助金额:24.00
项目类别:青年科学基金项目
批准号:60874024
批准年份:2008
资助金额:38.00
项目类别:面上项目
批准号:30870202
批准年份:2008
资助金额:39.00
项目类别:面上项目
批准号:50875156
批准年份:2008
资助金额:36.00
项目类别:面上项目
批准号:30300320
批准年份:2003
资助金额:21.00
项目类别:青年科学基金项目
批准号:21577177
批准年份:2015
资助金额:68.00
项目类别:面上项目
批准号:61070106
批准年份:2010
资助金额:36.00
项目类别:面上项目
批准号:70961007
批准年份:2009
资助金额:22.00
项目类别:地区科学基金项目
批准号:51475273
批准年份:2014
资助金额:85.00
项目类别:面上项目
批准号:41571269
批准年份:2015
资助金额:63.00
项目类别:面上项目
批准号:81472206
批准年份:2014
资助金额:80.00
项目类别:面上项目
批准号:51605438
批准年份:2016
资助金额:22.00
项目类别:青年科学基金项目
批准号:50375136
批准年份:2003
资助金额:24.00
项目类别:面上项目
批准号:59776015
批准年份:1997
资助金额:11.00
项目类别:面上项目
批准号:50575126
批准年份:2005
资助金额:27.00
项目类别:面上项目
批准号:41775117
批准年份:2017
资助金额:68.00
项目类别:面上项目
批准号:61603318
批准年份:2016
资助金额:19.00
项目类别:青年科学基金项目
批准号:51575473
批准年份:2015
资助金额:63.00
项目类别:面上项目
批准号:31072116
批准年份:2010
资助金额:8.00
项目类别:面上项目
批准号:60673042
批准年份:2006
资助金额:24.00
项目类别:面上项目
批准号:61233002
批准年份:2012
资助金额:310.00
项目类别:重点项目
批准号:39600146
批准年份:1996
资助金额:10.00
项目类别:青年科学基金项目
批准号:51609201
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:40961026
批准年份:2009
资助金额:22.00
项目类别:地区科学基金项目

相似国自然基金

1

社区问答系统关键技术研究

批准号:61672081
批准年份:2016
负责人:李舟军
学科分类:F0211
资助金额:63.00
项目类别:面上项目
2

基于内容分析的话题检测和追踪关键技术研究

批准号:60473140
批准年份:2004
负责人:朱靖波
学科分类:F0211
资助金额:23.00
项目类别:面上项目
3

社会化问答社区用户的持续知识行为研究

批准号:71601100
批准年份:2016
负责人:金家华
学科分类:G0112
资助金额:15.00
项目类别:青年科学基金项目
4

基于协同计算的社区问答意见型问题分析与答案生成研究

批准号:61303180
批准年份:2013
负责人:周光有
学科分类:F0211
资助金额:28.00
项目类别:青年科学基金项目