Starting from the demand for fine-grained orientation analysis of online users based on social media, aiming at the problems of data sparseness and lack of contextual information of large amounts of short texts, this project proposes the new solution of multi-level and multi-dimensional information aggregation for short texts which were generated in the social media. Through empirical analysis, model construction and prototype system, the proposed project summaries and describes the attributes and features of social media information, analyzes the information aggregation needs at the different stages of data integration, content aggregation and result presentation, generates contexts for social short texts based on information aggregation of contents and attributes, and constructs topic-related and group orientation analysis models. This research provides a new idea and method for processing and orientation analysis of social media information based on multi-level and multi-dimensional aggregation with their contents and social attributes.
面向基于社会化媒体信息的细粒度倾向性分析的实际需求,针对社会化短文本信息由于文字简短导致的语境缺失、特征稀疏问题,本研究提出基于多层次、多维度信息聚合解决方案。本项目综合运用实证分析、模型构建和原型系统验证等研究方法,梳理和描述社会化短文本信息属性特征,剖析从数据整合-内容聚合-结果呈现不同阶段社会化短文本信息处理和分析的聚合要求,探索基于内容聚合和社会化属性特征聚合的社会化短文本信息语境生成,构建基于主题相关性的倾向性分析和融合人群特征的群体倾向性分析模型。本项目采用多层次、多维度的聚合实现短文本信息的语境生成和情感语义分析,融合内容分析和社会化属性特征进行细粒度倾向性分析,为社会化短文本信息处理与细粒度倾向性分析提供新的思路和方法。
Web2.0技术与社会化媒体的飞速发展,改变了人们的生活和学习方式,互联网用户不仅仅是信息的接受者,亦是信息的生产者和传播者。他们通过网络社区、微博、QQ群、微信群、评论站点等各种社会化媒体表达自己对人物、事件、政策、商品、服务等的关注和观点,产生了海量的半结构化或非结构化、负载有观点和情感的社会化短文本信息。为了更好地从这些短文本信息中抽取知识、发现主题、挖掘用户情感倾向,本研究从信息聚合角度出发,剖析社会化短文本信息的内容特征、外部特征和传播特征,以微博、在线新闻评论和网络群组聊天记录这三种典型的社会化短文本信息为研究对象,分别探索基于聚合的微博短文本主题发现和情感倾向性分类,融合社会化属性特征的在线新闻评论生长规律和分布规律发现,基于用户交互关系的互联网群组信息主题发现。.. 本项目主要工作包括:(1)以微博博文为研究对象,较系统地探索这类社会化短文本信息的特点和信息处理方法,具体包括:微博用户标签与博文主题相关性研究;基于信息聚合的微博短文本主题发现研究;多特征融合的微博情感倾向性分析。(2)以在线新闻评论这类社会化短文本信息为研究对象,通过抽取评论文本中的用户信息、地理信息、时间信息、转发点赞等社会化信息,结合这些属性来研究在线新闻评论的生长规律和分布特征。结果表明,用户个体属性特征对于社会化短文本信息生成和传播扩散具有影响力。(3)以互联网群组信息为研究对象,通过对用户交互关系的识别来聚合学术型QQ群组中的聊天记录,从而解决QQ群组中聊天短文本的主题发现问题。结果表明,基于用户交互关系的信息聚合能够较好地挖掘网络非正式信息交流中的知识。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
指定话题的汉语文本主观倾向性分析
维吾尔语文本情感倾向性分析技术研究
基于文本情感和异质网络分析的社会化推荐研究
汉语文本中观点信息的提取与倾向性分析技术研究