目前网络舆情分析相关研究大多针对普通网络信息进行,忽视了以手机短信、即时消息等为代表的网络短文本信息的研究,而恰恰是这一部分内容更能反映真实网络舆情。因此开展面向短文本内容处理的研究具有重要战略意义和社会效益。.由于文本对象所固有的多义性,面对短文本特征稀疏和上下文缺失的情况,现有处理方法无法明辨语义,形成了底层特征和高层语义间巨大的语义鸿沟。课题借鉴Marr层次化认知理论和Gestalt心理学依据,强调文本认知的层次性和整体性,注意高层描述与底层特征表达的相互关联,发展出刻画文本对象多义性的层次化表达体系。基于此,研究用户信息感知的垃圾过滤模型,实现有用信息和垃圾信息分离。并对有用信息进行基于知识本体语义空间流形聚类的话题发现。最后利用特殊上下文实现话题情感计算以判别信息倾向。研究将有助于缓解短文本底层特征稀疏性和顶层语义表达多义性间的矛盾,从而跨越语义鸿沟,解决短文本内容信息处理问题。
目前网络舆情分析相关研究大多针对普通网络信息进行,忽视了以手机短信、即时消息等为代表的网络短文本信息的研究,而恰恰是这一部分内容更能反映真实网络舆情。因此开展面向短文本内容处理的研究具有重要战略意义和社会效益。由于文本对象所固有的多义性,面对短文本特征稀疏和上下文缺失的情况,现有处理方法无法明辨语义,形成了底层特征和高层语义间巨大的语义鸿沟。课题强调本认知的层次性和整体性,注意高层描述与底层特征表达的相互关联,发展出刻画文本对象多义性的层次化表达体系。基于此,研究用户信息感知的垃圾过滤模型,实现有用信息和垃圾信息分离。并对有用信息进行基于内容计算的话题发现。最后利用特殊上下文实现话题情感计算以判别信息倾向。课题研究成果将有助于缓解短文本底层特征稀疏性和顶层语义表达多义性间的矛盾,从而跨越语义鸿沟,缓解短文本内容信息处理难题。经过三年的努力,课题组严格按照项目申请计划,圆满完成课题预期建设目标。课题组实现一套网络短文本信息过滤与分析原型系统,所开发的系统参加TREC信息检索国际测试,取得较好成绩。同时通过购买、参加国际测评和实验室收集,初步建立了可为本类研究开展提供支持的短文本信息数据库(包括短信息、电子邮件、微博、Tweets和个性化阅读信息等)。积极搭建交流平台,邀请国内外学者举办讲座研讨会,开展国内外学术交流。发表(含已录用)论文17篇,其中在国际期刊发表论文5篇,国内期刊发表论文6篇,SCI刊源3篇,EI刊源16篇。申请国家发明专利4项(3项授权,1项实审)。培养硕士研究生11名(毕业3名,在读8名)。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于国产化替代环境下高校计算机教学的研究
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
基于综合治理和水文模型的广西县域石漠化小流域区划研究
信息熵-保真度联合度量函数的单幅图像去雾方法
非牛顿流体剪切稀化特性的分子动力学模拟
面向网络舆情分析的微博社会化短文本分析技术研究
面向视频社交网络的敏感内容识别与舆情分析
面向热门争议话题的基于社交网络文本与结构的层次观点挖掘研究
面向在线新闻的公众情感计算与舆情分析关键技术