当前影响广泛的在线互动问答社区系统(CQA)存在答案延迟或缺失、答案不完整、噪声严重等突出问题,对存在于互联网的海量问答资源进行挖掘和整合,形成一个全面准确的问答知识库,是解决上述问题的关键。从具有不同结构和文本特点的信息源中提取问答对知识涉及自然语言处理、机器学习、文本挖掘等领域的诸多方法和技术。本项目面向互联网中异构的问答信息源,以受限领域的在线互动问答社区系统、在线论坛和普通网页等典型场景为主要对象,研究如何智能化地挖掘和整理在互联网中广泛存在的包括用户在网络交流过程中自然产生的问答资源。涉及的关键问题包括:问答对语义相关性计算、答案融合、文本特征与非文本特征的优化与融合方法、逆向问题生成、增量式在线学习以及问答挖掘的评价标准等。在此基础上,探索互联网异构信息资源挖掘的普遍规律和通用方法。本项目的实施对问答系统和自然语言处理研究以及相关互联网应用的发展有重要推动作用。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于多模态信息特征融合的犯罪预测算法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
面向云工作流安全的任务调度方法
F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度
莱州湾近岸海域中典型抗生素与抗性细菌分布特征及其内在相关性
面向异构无人系统的网络资源认知协同优化方法研究
面向异构Web信息源的语义知识获取和融合关键技术研究
面向真实环境的异构信息交互式问答理论与方法研究
面向容量增强的分层异构网络资源配置与协同优化