Cross-lingual social opinion analysis has been an important and hot research topic in recent years. However, there exist various kinds of problems in current studies, such as passivity, non-objectivity, and lack of deep understanding and analysis. This project attempts to establish a theoretical infrastructure suitable for cross-lingual social opinion analysis, develop a series of key techniques, construct relevant resources, and build a cross-lingual social opinion analysis platform, in addressing various scientific obstacles in front of its wide application. Especially, .1) To confront the discourse characteristics of social opinion, this project proposes a discource structure and topic structure-driven framework to carry out discourse-level event information extraction..2)To confront the prediction difficulty, sudden occurrence and fast change of social opinion, this project proposes an event network-driven framework to achieve accurate prediction, timely identification and fast tracking..3) To confront the multi-source and different structure characteristics of social opinion, this project proposes a Bayes network-driven framework to carry out reliability computation of its content..4) To confront the cross-lingual characteristic of social opinion broadcasting and the asymmetric of different language resources, this project proposes a series of cross-lingual techniques, such as entity linking, document inference and semantic space, to achieve social opinion analysis-driven cross-lingual information processing. .5) To confront the opinion variability of different social groups, this project proposes a social network-driven framework to achieve social group-based opinion analysis..6) To confront the lack of language recourses, this project explores large-scale naturally-annotated web resources, bootstrapping and collective intelligence to construct relevant resources in supporting smooth carry-out of this project.
跨语言社会舆情分析是智能信息处理的一个研究热点。本项目旨在建立一套适用于跨语言社会舆情分析的理论方法体系,开发一系列关键技术,并构建相关资源和实验平台,解决阻碍其发展的关键科学问题。特别是,1)针对社会舆情的篇章属性,基于篇章结构和话题结构理论,开展篇章级事件信息抽取研究;2)针对社会舆情的难预测性、突发性与多变性,基于事件关系网络,实现社会舆情的准确预测、及时发现与快速跟踪;3)针对社会舆情的多源异构性,基于贝叶斯网络,开展面向社会舆情的事件可信度计算研究;4)针对社会舆情传播的跨语言特性和不同语言资源的不对称性,探索跨语言推理机制、资源迁移和语义空间等跨语言技术,实现面向社会舆情分析的跨语言信息处理;5)针对社会群体情感的多面性,基于社会关系网络,开展社会群体情感分析研究;6)针对资源匮乏问题,基于互联网大规模自然标注资源、自举学习和群体智慧,构建相关资源,保障本项目的顺利开展。
跨语言社会舆情分析是智能信息处理的一个研究热点。针对其中存在的关键科学问题,本项目建立了一套适用于跨语言社会舆情分析的理论方法体系,研发了一系列关键技术,标注了各种资源,并构建了相关实验平台。主要研究包括:.1)篇章级事件信息抽取:基于篇章修辞结构和话题结构理论,针对社会舆情的篇章属性,系统深入开展了篇章级事件信息抽取相关技术的研究,包括事件抽取、事件关系抽取、实体抽取、实体关系抽取,突破了传统词汇级与句子级分析的限制,围绕舆情事件,为基于篇章级分析的社会舆情分析打下了扎实的基础。.2)社会舆情分析:基于社会舆情(传播效应)认知机理,首先,针对社会舆情的多源异构性,开展了事件可信度计算的研究。其次,针对社会舆情的难预测性、突发性与多变性,开展了社会舆情预测与跟踪的研究。最后,针对社会群体情感的多面性,系统深入开展了面向社会舆情的社会群体情感分析的研究。.3)跨语言信息处理:基于自然语言(语义迁移)认知机理,针对社会舆情传播的跨语言特性和不同语言之间的资源不对称性,系统深入开展了跨语言信息处理的研究。首先,以跨语言舆情信息融合为目标,研究了多语言环境下自然语言生成技术,包括单语言自动文摘、跨语言自动文摘以及文本自动生成。其次,以跨语言情感分析为目标,研究了跨语言情感分类与观点抽取,以及面向微博文本的观点分析。最后,以跨语言舆情信息语义理解为目标,研究了基于图表征的深层语义分析方法,并研制了高性能深层语义分析器。另外,探索了跨语言实体关系抽取和面向双语文本的跨语言情感分析。.4)跨语言社会舆情分析资源和平台构建:在资源匮乏的情况下,面向跨语言社会舆情分析进行了资源与平台构建,构建了单语标注语料资源和双语对齐语料资源,并集成相关技术,构建了跨语言社会舆情分析平台。同时,围绕维吾尔语,系统深入研究了面向少数民族语言的自然语言处理和社会舆情分析相关技术,极大地推动了相关研究。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
跨社交网络用户对齐技术综述
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
黄河流域水资源利用时空演变特征及驱动要素
硬件木马:关键问题研究进展及新动向
跨语言社会舆情分析基础理论与关键技术研究
跨语言敏感事件抽取关键技术研究
跨语言文本自动分类关键技术研究
面向英汉双向跨语言图像检索的文本分析关键技术研究