基于语义的维吾尔语网络舆情分析关键技术研究

基本信息
批准号:61662081
项目类别:地区科学基金项目
资助金额:41.00
负责人:艾孜尔古丽·玉素甫
学科分类:
依托单位:新疆师范大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:玉素甫·艾白都拉,伊克巴尔·吐尔逊,艾山江·阿不力孜,阿不都热依木·沙力,赛买提·艾力,努尔艾合买提,阿布都萨拉木·牙森,麦丽开·阿皮孜,古丽则热·麦麦提
关键词:
话题发现热点分析情感分析语义维吾尔语
结项摘要

In recent years , Social media publishes and disseminates various types of information , and then provides hot topics of discussion by the people in their daily lives.This project focuses on the research of Uyghur language hot topic analysis on social media . We will carry on the research of Uyghur language social media repository ,hot topic identification model , topic detection and tracking , as well as text sentiment analysis . We will Study :(l) combination of Uyghur social media topic of the mechanism of the formation and propagation, the topic detection mode1 to integrate hot topic identification which including based on the phrase of Uyghur word segmentation, based on semantic understanding of the key words extraction algorithm and hot topic extraction algorithm; (2) the Uyghur lanuage text sentiment analysis methods based on Uyghur emotional dictionary and emotional phrase templates, emotional analysis of resource construction, the algorithms to Uyghur Emotional new words mining and emotional phrase recognition. Therefore, research on Key Technologies of Uyghur language Internet Hot Topics Detection and Analysis of both to the lmportant academic value and practical signiflcance , which can Specification of social media information and to make effective detection and guidance mechanism on hot topics, emergencies and major public opinion.

近年来社会媒体所发布和传播的信息提供了人们在日常生活中争相讨论的热门话题,对社会舆论产生了广泛的影响力。我们拟针对维吾尔语社会媒体的特点,构建维吾尔语语义网,建立维吾尔语社会媒体资源库,从维吾尔语热点话题的识别、维吾尔语文本情感分析等方面开展融合多学科的基于语义的维吾尔语网络舆情分析研究,具体内容包括:(1)重点研究如何结合并利用语义分析技术改进热点话题发现的方法,研究基于短语的维吾尔语分词、基于语义理解的主题词提取算法、热点话题提取算法等关键技术,构建维吾尔语热点话题识别模型;(2)针对热点话题的情感倾向分析,研究维吾尔语情感分析资源建设、维吾尔语情感新词挖掘以及情感短语识别等内容,提出结合语义的多策略文本情感倾向分析模型。对社会媒体中的舆情热点进行实时分析,既便于规范社会媒体信息,也有助于对热点话题、突发事件和重大舆情制定有效的检测和引导。

项目摘要

经过4年的研究,课题组根据维吾尔语的独特特点,在现有研究成果的基础上,以统计学与本体理论相结合作为依据,课题组开展了现代维吾尔语语义网构建、短语形态分析、舆情分析基础处理工具的开发和基于深度学习的主题词提取和文本情感分析等四个方面的研究工作。研究利用人机交互技术、统计技术和上下相关分析技术和方法,研究人机交互的维吾尔网站内容监测技术,包括由多策略采集技术、语料预处理技术、语料统计技术统、词干提取技术、数据分析技术、语义网构建、短语识别、主题词提取技术、情感分析技术。为从网络舆情分析或信息抽取、网络内容理解、智能软件研发提供科学依据。.理论与方法方面.(l)社会语言学和计算语言学相结合的角度分析维吾尔语短语。在现有的维吾尔语语法语义相结合的基础上,研究网络舆情资源动态分析所需短语识别提出方法打下基础。.(2)研究语义网构建技术方法。利用统计学、计算语言学和语法语义结合的标注方法,研究跟踪当前网络舆情实态变化,提出构建权威的维吾尔语语义网打下基础。.(3)研究网络舆情分析系统。利用(l)与(2)方法,建立网络舆情分析系统,为国家舆情分析与热点问题跟踪、语言信息安全与预警等需要,提供科学依据和探索处理的方法。 .工具方面.设计与实现网络舆情分析系统。研究利用人机交互技术、统计技术和上下相关分析技术和方法,实现人机交互的维吾尔网络舆情分析系统。建立由包括由多策略采集技术、语料预处理技术、语料统计技术统、词干提取技术、数据分析技术、语义网构建、短语识别、主题词提取技术、情感分析技术等子系统组成。.资源方面.(1)研究维吾尔语社会媒体资源库构建技术。收集的社会媒体文本语料,为维吾尔语热点话题分析案例库提供基础。.(2)研究维吾尔语情感分析资源库构建技术。从情感词典构建、情感修饰成分分析与收集、情感语料库建设这三个方面研究。情感语料库建设包括构建维吾尔语情感词典,中性词表,肯定副动词表,否定副动词表等。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
5

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015

艾孜尔古丽·玉素甫的其他基金

相似国自然基金

1

新疆汉维双语网络舆情分析关键技术研究

批准号:61040035
批准年份:2010
负责人:栾静
学科分类:F0113
资助金额:10.00
项目类别:专项基金项目
2

海量网络舆情信息获取、分析及表达关键技术研究

批准号:61171173
批准年份:2011
负责人:李建华
学科分类:F0113
资助金额:63.00
项目类别:面上项目
3

基于统计的维吾尔语依存句法分析若干关键技术研究

批准号:61262061
批准年份:2012
负责人:麦热哈巴·艾力
学科分类:F0211
资助金额:43.00
项目类别:地区科学基金项目
4

基于信息处理的维吾尔语语义分类与标注技术研究

批准号:61063036
批准年份:2010
负责人:玉素甫·艾白都拉
学科分类:F0211
资助金额:27.00
项目类别:地区科学基金项目