As many users tend to convey their opinions and emotions online, it is important to mine their implicit emotions. Implicit sentiment analysis of readers is benefit to identify the general public’s interest or demand, to track the dynamic status of social development, and to improve the quality of services. However, different or contrary reader emotions can be present across the span of a sentence or document with similar words for cross-domain corpus, hence cause low accuracy of implicit sentiment analysis. In this project, based on the sentence and document level, and compound semantic analysis methods, the main tasks and objectives are to: 1) design the standard and automated implicit sentiment annotation schemes at the sentence level, so as to enrich the training data of cross-domain implicit emotions; 2) develop the document level semantic analysis model for extracting cross-domain implicit emotions effectively; 3) propose the cross-domain implicit sentiment classification algorithm based on compound semantic, so as to improve the accuracy. The research in this project will tackle the challenging issues of lacking domain information and sentence level semantic in implicit sentiment annotation, in addition to improve the accuracy of implicit sentiment extraction and classification. It will also lay the foundation for developing utility systems of cross-domain implicit sentiment annotation, extraction and classification.
互联网蕴含了众多用户交流的观点与情感,从中分析读者用户的隐式情感表达在挖掘公众兴趣与需求,了解社会发展动态,提高服务质量等方面都非常重要。但对于数据分布不一致的跨领域文本,词形相似的语句或文档可能引发读者不同甚至对立的情感反馈,因此给精准地分析其隐式情感带来了极大的挑战。本项目将用句子、篇章及组合语义分析方法,重点研究如下内容:1)设计句子层的规范化与自动标注方案,以补充跨领域隐式情感分析训练数据集;2)建立篇章层的语义分析模型,实现对跨领域隐式情感的有效抽取;3)提出基于多层组合语义的分类算法,以提升跨领域隐式情感分类的精准度。研究成果不仅将解决隐式情感标注的领域及句子语义不足、跨领域的隐式情感抽取及分类不准等研究难题,还能为开发一个具有跨领域隐式情感标注、抽取及分类功能的实用系统奠定基础。
本项目针对读者视角的跨领域隐式情感分析,主要研究基于句子语义的跨领域隐式情感标注、基于篇章语义的跨领域隐式情感抽取,以及基于组合语义的跨领域隐式情感分类。(1)在基于句子语义的跨领域隐式情感标注方面,我们通过局部的one-hot词向量、领域关联的词性组合向量,以及全局的词嵌入向量构建一种混合卷积神经网络模型,从而解决词形相似的句子可能引发不同的隐式情感反馈这一难题。该文发表在CCF A类会议WWW 2017的认知计算Track。此外,基于句子层的规范化标注方案,我们提出一种情感标签优化的概率框架,以及一种基于概率图模型的标签聚合方法,以从海量网民提供的标签中自动生成高质量的情感标注。相关成果发表在Knowledge-Based Systems期刊和CCF A类会议ACL 2017上。(2)针对跨领域隐式情感抽取中数据分布不一致的难题,本人提出一种背景主题、特定上下文主题,以及上下文无关主题的篇章语义分析模型。该文发表于IEEE Intelligent Systems期刊。此外,我们基于多元情感标签、用户投票数据,以及词共现信息生成丰富的特征,提出两种有监督的情感主题模型。该文发表在CCF B类会议DASFAA 2017上,并获得最佳论文亚军奖。为了进一步提升跨领域隐式情感抽取等任务的精准度,我们提出一种基于孪生网络的有监督主题模型。该文发表在CCF B类会议EMNLP 2018上。(3)在基于组合语义的跨领域隐式情感分类方面,我们提出一种融合了词汇和篇章两层语义信息的跨领域隐式情感分类模型。该文发表于CCF B类会议CIKM 2017。此外,我们通过有向概率图等模型获取文本的篇章语义,并将其用于指导神经网络模型的参数学习。实验验证了上述组合模型在隐式情感抽取和分类中的有效性及鲁棒性。该文发表于情感计算领域的顶级期刊IEEE Transactions on Affective Computing。在本项目资助下,项目组成员已发表26篇学术论文,包括11篇SCI检索的期刊论文,1篇EI检索的期刊论文,以及12篇EI检索的会议论文。此外,获得计算机软件著作权2项。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
跨社交网络用户对齐技术综述
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
基于情感语义表示的隐式情感分析
面向在线新闻评论的跨领域情绪分析关键技术研究
意见挖掘中隐式情感的资源建设和自动分析研究
基于多源知识融合的事实型隐式情感分析研究