The rise of social networks has fueled interest in sentiment analysis (also known as opinion mining). With the proliferation of comments which contain emotional colors and emotional tendency, sentiment analysis refers to identify and extract subjective information in source materials, as well as understand public opinion. As Internet penetration has increased over time, more and more Tibetan Internet users have become willing to share their subjective views on figures, events and products through the social networks. Because of the existence of language uniqueness and differences of attention focus, the sentiment analysis technology which has successfully used in Chinese and English cannot be copied directly to Tibetan. This project monitors the Tibetan topic in social networks dynamically, thus discover Tibetan emotional words and topic words, and build Tibetan hierarchical emotional vector model to express diversified moods in social networks; this project also extracts language features of Tibetan emotional expressions, and researches emotional tendency analysis based on Tibetan language features; as the Tibetan topics in social networks are usually short, colloquial and have rich emoticons, the project proposes a Tibetan topic keywords extraction method based on semantic ontology, thus to create Tibetan sentiment analysis corpus. Outcomes of the project will promote Tibetan language processing technology in the technological realization of social networks, and it will provide effective technical support in carrying out Tibetan public opinion monitoring, machine translation and information retrieval.
社交网络的发展产生了大量包含情感色彩和情感倾向性的评论,获取、处理和归纳这些主观性评价信息,了解大众舆论,是情感分析的主要研究内容。随着网络普及率的提高,越来越多的藏族网民愿意在社交网络中分享自己对人物、事件、产品的主观性观点。语言独特性和关注热点的差异,使得成功应用于汉、英等语言的情感分析技术不能直接照搬到藏语上。本项目针对社交网络中藏语话题进行动态监测,发现藏语情感词和网络流行语,构建藏语层次化情感向量模型来表达社交网络中多元化情绪;提取藏语情感表达的语言特征,研究基于藏语语言特点的情感倾向性分析方法;针对社交网络中藏语话题短文本、口语化、表情符号多等特点,研究基于语义本体的藏语话题主题词提取方法,创建藏语情感分析语料库。本项目的研究成果将促进藏语语言处理技术在社交网络中的技术实现,对开展藏语舆情监测、机器翻译和信息检索等提供有效技术支持。
随着网络普及率的提高,越来越多的藏族网民愿意在社交网络中分享自己对人物、事件、产品的主观性观点,产生了大量包含情感色彩和情感倾向性的评论,本项目针对社交网络中藏语话题进行动态监测,获取、处理和归纳这些主观性评价信息,发现藏语情感词和网络流行语,研究社会网络中藏语话题的情感分析问题。主要研究内容包括:(1)提出了构建藏语层次化情感向量模型来表达社交网络中多元化情绪;(2)提取藏语情感表达的语言特征,提出了基于藏语语言特点的情感倾向性分析方法;(3)提出了基于语义本体的藏语词义消歧技术,有效提高藏语话题情感主题词的提取准确率;(4)针对社交网络中藏语话题短文本、口语化、表情符号多等特点,提出了多特征融合的藏语话题情感分析方法;(5)创建藏语情感词库和藏语情感分析语料库。项目负责人带领研究小组严格认真执行本项目的各项研究内容,按时完成了本课题的计划研究任务和研究目标。项目执行期间,研究小组发表期刊论文17篇,其中SCI期刊论文16篇(按照中科院当年分区,一区4篇,二区6篇,三区5篇,四区1篇),中文核心期刊1篇,还有4篇论文正在审稿中。申请发明专利6项,其中授权4项。项目执行期间共培养12名研究生。在项目执行期间,项目负责人获得“国家民委中青年英才支持计划”的支持、获批1项北京市自然科学基金面上项目。以本项目执行过程中的扩展研究作为主要研究内容,获批了另1项国家自然基金面上项目。本项目的研究成果将促进藏语语言处理技术在社交网络中的技术实现,本项目研究中的情感向量模型、知识图谱构建、机器阅读理解等内容对开展藏语舆情监控、机器翻译和信息检索等技术提供有效支持,具有广泛的应用前景。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
跨社交网络用户对齐技术综述
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
黄河流域水资源利用时空演变特征及驱动要素
硬件木马:关键问题研究进展及新动向
中文社交化短文本情感分析与话题挖掘研究
社交网络中热点话题检测与传播分析研究
社交网络用户行为分析及话题演化趋势预测方法研究
动态社交网络中群体情感演化计算与分析关键技术研究