There are broad prospects in sentiment analysis field which can bring huge economic and social effects. With the development of social network, short texts are characterized by the features like big data volume, concise content, sparse characteristics, mixed information and etc., which make previous sentiment analysis approaches difficult to achieve better results. To tackle the above challenge, we construct a series of sentiment analysis models in the manner of sentiment elements extraction, sentiment classification and sentiment summarization for short text. The problems that can be solved in this project include: implicit aspect discovery and aspect-dependent sentiment knowledge extraction; over reliance on external resources in opinion lexicon extraction; data sparsity in sentiment classification for short text; representation and modeling of sentiment summarization for short text. The models proposed in this project can satisfy all needs of sentiment analysis from low level to high.
情感分析具有广阔的应用前景,可以带来巨大的经济和社会效益。随着社交网络的蓬勃发展,短文本具有数据量大、内容简略、特征稀疏、信息混杂等特点,这使得以往的情感分析方法在处理短文本时,难以保证其分析效果。针对上述挑战,本课题按照短文本情感要素抽取、短文本情感分类、短文本情感归纳三层不同的研究任务,构造一系列情感分析模型,分别解决隐式属性词及基于属性词的情感知识获取问题、情感词典抽取过于依赖外部资源的问题、短文本情感分类的数据稀疏问题、短文本情感归纳的表征与建模问题。本项目所研究的这一系列模型能够自底向上满足不同层次情感分析的实际需求。
1..项目背景.情感分析具有广阔的应用前景,可以创造巨大的经济和社会效益。在商业领域,生产者可以通过跟踪用户反馈来获得改进产品质量的意见,消费者可以根据网上真实的用户评论来调整个人的购买意向;在社会领域,管理者可以了解群众对各类管理措施的反馈意见,从而根据群众反馈对管理措施进行调整,政府部门也可以及时了解公众舆论,妥善、积极地处理网络舆情。.2..研究内容.针对社交文本(短文本)数据量大、内容简略、特征稀疏、信息混杂等特征,本项目研究情感要素抽取、情感分类、情感归纳三层不同的研究任务。情感要素抽取旨在从情感文本中抽取有意义的信息单元,将无结构的情感文本转化为计算机容易识别和处理的结构化文本;情感分类主要研究篇章级情感分类和属性级情感分类模型;情感归纳是在情感要素抽取和情感分类的基础上对文档进行加工处理,提取带有情感色彩的文档摘要。.3..重要结果.在本项目的资助下,申请了2项情感分析相关的软件著作权,均已授权;在国内外著名期刊和会议上发表了12篇学术论文。在情感要素抽取方面,提出一种无监督的属性词和情感知识抽取模型,无论是多领域数据集还是多语言数据集,情感分类性能均达到领域最优;在情感分类方面,篇章级情感分类模型解决了情感歧义问题,句子级情感分类模型解决了短文本数据稀疏问题、属性级情感分类模型解决了情感词的属性依赖问题;在情感归纳方面,解决了传统摘要模型没有融合观点信息的问题。.4..关键数据.在本项目的资助下,构建了两个情感分析数据集,一个是中文微博情感语料,含47374条微博,其中包括35164条正向微博及12210条负向微博;另一个是中文情感词典,含5万词条,器重包括2万个正向情感词和3万个负向情感词。.5..科学意义.情感分析是自然语言处理、人工智能、甚至认知科学领域所面临的重要研究课题之一,该研究所取得的每一个进步,都有助于加深对人类的智能、语言、思维等问题的了解,也为自然语言处理以及其他领域相关问题的解决提供了借鉴。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
面向小语种的高性能文本情感分析关键技术研究
面向聊天机器人的文本情感分析关键技术研究
时空文本数据情感挖掘关键技术研究
情感驱动的人机交互中文本语音情感信息耦合关键技术研究