With the rapid development of newly Internet social applications, microblogs have been widely applied in 250 million users and its utilization ratio in 2011 is 48.7%. Every day, millions of users share their opinion and sentiment on different topics. Automatically analyzing the user's sentimental trends and scientifically determining the tendency of the whole microblog community under a certain topic, have become the basic scientific problem on the domain of microblog computation and public sentimental analysis. Under the situation that the contents of microblog are becoming much more scattered and personalized, traditional sentimental analysis algorithm cannot work well and meet the practical requirement as its essential defect and inefficiency. This research aims on building a personality based microblog sentimental analysis algorithm, which can analyze a single tweet sentiment with its contents and the user's personal background, modelling on the sentimental characteristic of a microblog user by referencing his historical sentimental results, making sentimental summarization on a given topic and determine the whole opinion of different communities, and then making the verification based on the above research. The contribution of this research is proposing the users' personality characteristics and historical sentimental results into the sentimental analysis on short and irregular microblog message, and thus increasing the objectivity and pertinence of microblog sentimental analysis.
随着新型互联网应用的迅猛发展,微博快速崛起,用户数达到2.5亿,使用率达到48.7%,每天数以千万人通过微博分享自己对各类话题的观点与情感,如何自动感知微博主体的情感,并从宏观上科学研判微博社区对特定话题的观点倾向性,已经成为微博计算与舆情分析亟待解决的基本科学问题。微博内容的碎片化与主体化特征日益凸显,传统的情感分析算法存在本质缺陷,效率低下且效果很难满足实际需求。本课题旨在研究基于主体个性化的微博情感分析算法,主要包括:结合微博主体个性化特征,研究单条微博内容的情感分析算法;根据微博的情感波动变化,研究微博博主的情绪感知方法;针对特定话题,研究大众的情感综合研判技术;在理论研究的基础上进行算法的实践验证。本课题的主要创新体现在对短小而不规范的微博内容进行情感分析过程中,引入微博主体的个性化特征,参考博主对特定主题的历史态度,从而提高对微博内容情感分析的客观性与针对性。
基于主体个性化的情感分析研究是自然语言处理与认知分析的重要研究内容,它们衍生于主观思维,繁殖于以自然语言为载体的信息表达与传播过程,具有隐蔽性、情境性等特点,是自然语言处理、文本挖掘与心理学交叉研究领域的重要研究课题。面向微博文本的情感演化分析方法研究,对于探究自然语言背后隐藏着的信息具有重要的学术与应用价值。目前,针对微博等社交网络文本的情感演化分析理论和方法研究尚不多见,关键技术还不成熟。本项目以微博文本为研究对象,以自然语言处理与文本挖掘、情感计算为基础,对情感分析的关键技术和方法进行研究。结合微博主体个性化特征,研究单条微博内容的情感分析算法;根据微博的情感波动变化,研究微博博主的情绪感知方法;针对特定话题,研究大众的情感综合研判技术;在理论研究的基础上进行算法的实践验证。该研究的创新主要体现在对短小而不规范的微博内容进行情感分析过程中引入微博主体的个性化特征,参考博主对特定主题的历史态度,从而提高对微博内容情感分析的客观性与针对性。提出的方法对短文本情感及认知分析具有重要的科学研究价值,并可为社会网络的舆情分析提供新思路。课题组虽然完成了预定的研究任务,但随着社交网络的快速发展以及中文自然语言理解的极端复杂性和情感变换的不确定性,课题成果仍有不足之处,下一步计划在算法适应性方面继续完善目前成果。另外,在本课题资助下,项目承担单位在项目执行 期间发表了26篇学术论文(其中,在国外学术期刊上发表被SCI收录的学术论文2篇,被EI Compendex收录的国外学术期刊论文7篇,被EI Compendex收录的国际学术会议论文6篇 ),出版3部学术专著,3项专利,一名成员转为正教授,项目负责人承担了国家973子课 题,培养研究生14人。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
基于群体智能的微博情感分析研究
微博热点事件的情感趋势分析与预测研究
基于信任链的微博群体情感挖掘研究
基于用户建模的个性化微博排序研究