In recent years , Social media publishes and disseminates various types of information , and then provides hot topics of discussion by the people in their daily lives.This project focuses on the research of Uyghur language hot topic analysis on social media . We will carry on the research of Uyghur language social media repository ,hot topic identification model , topic detection and tracking , as well as text sentiment analysis . We will Study :(l) combination of Uyghur social media topic of the mechanism of the formation and propagation, the topic detection mode1 to integrate hot topic identification which including based on the phrase of Uyghur word segmentation, based on semantic understanding of the key words extraction algorithm and hot topic extraction algorithm; (2) the Uyghur lanuage text sentiment analysis methods based on Uyghur emotional dictionary and emotional phrase templates, emotional analysis of resource construction, the algorithms to Uyghur Emotional new words mining and emotional phrase recognition. Therefore, research on Key Technologies of Uyghur language Internet Hot Topics Detection and Analysis of both to the lmportant academic value and practical signiflcance , which can Specification of social media information and to make effective detection and guidance mechanism on hot topics, emergencies and major public opinion.
近年来社会媒体所发布和传播的信息提供了人们在日常生活中争相讨论的热门话题,对社会舆论产生了广泛的影响力。我们拟针对维吾尔语社会媒体的特点,构建维吾尔语语义网,建立维吾尔语社会媒体资源库,从维吾尔语热点话题的识别、维吾尔语文本情感分析等方面开展融合多学科的基于语义的维吾尔语网络舆情分析研究,具体内容包括:(1)重点研究如何结合并利用语义分析技术改进热点话题发现的方法,研究基于短语的维吾尔语分词、基于语义理解的主题词提取算法、热点话题提取算法等关键技术,构建维吾尔语热点话题识别模型;(2)针对热点话题的情感倾向分析,研究维吾尔语情感分析资源建设、维吾尔语情感新词挖掘以及情感短语识别等内容,提出结合语义的多策略文本情感倾向分析模型。对社会媒体中的舆情热点进行实时分析,既便于规范社会媒体信息,也有助于对热点话题、突发事件和重大舆情制定有效的检测和引导。
经过4年的研究,课题组根据维吾尔语的独特特点,在现有研究成果的基础上,以统计学与本体理论相结合作为依据,课题组开展了现代维吾尔语语义网构建、短语形态分析、舆情分析基础处理工具的开发和基于深度学习的主题词提取和文本情感分析等四个方面的研究工作。研究利用人机交互技术、统计技术和上下相关分析技术和方法,研究人机交互的维吾尔网站内容监测技术,包括由多策略采集技术、语料预处理技术、语料统计技术统、词干提取技术、数据分析技术、语义网构建、短语识别、主题词提取技术、情感分析技术。为从网络舆情分析或信息抽取、网络内容理解、智能软件研发提供科学依据。.理论与方法方面.(l)社会语言学和计算语言学相结合的角度分析维吾尔语短语。在现有的维吾尔语语法语义相结合的基础上,研究网络舆情资源动态分析所需短语识别提出方法打下基础。.(2)研究语义网构建技术方法。利用统计学、计算语言学和语法语义结合的标注方法,研究跟踪当前网络舆情实态变化,提出构建权威的维吾尔语语义网打下基础。.(3)研究网络舆情分析系统。利用(l)与(2)方法,建立网络舆情分析系统,为国家舆情分析与热点问题跟踪、语言信息安全与预警等需要,提供科学依据和探索处理的方法。 .工具方面.设计与实现网络舆情分析系统。研究利用人机交互技术、统计技术和上下相关分析技术和方法,实现人机交互的维吾尔网络舆情分析系统。建立由包括由多策略采集技术、语料预处理技术、语料统计技术统、词干提取技术、数据分析技术、语义网构建、短语识别、主题词提取技术、情感分析技术等子系统组成。.资源方面.(1)研究维吾尔语社会媒体资源库构建技术。收集的社会媒体文本语料,为维吾尔语热点话题分析案例库提供基础。.(2)研究维吾尔语情感分析资源库构建技术。从情感词典构建、情感修饰成分分析与收集、情感语料库建设这三个方面研究。情感语料库建设包括构建维吾尔语情感词典,中性词表,肯定副动词表,否定副动词表等。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
新疆汉维双语网络舆情分析关键技术研究
海量网络舆情信息获取、分析及表达关键技术研究
基于统计的维吾尔语依存句法分析若干关键技术研究
基于信息处理的维吾尔语语义分类与标注技术研究