Due to the wide knowledge coverage and important social influence of micro-blogging, it has attracted a tremendous amount of registered users to disseminate a variety of topic-specific knowledge, in which there are numerous topic-specific experts. Topical experts have highly authority and influence on their specialized areas, hence identifying and finding topical experts is benefit for obtaining and monitoring myriad of important topical knowledge. As compared to the traditional expert finding problem, topic-specific expert finding in micro-blogging is more challenging, due to the large-scale of data, information opacity, the complexity of social relations and so on. Motivated by this, we will focus on studying the key technologies of topic-specific expert finding in micro-blogging from three different aspects: (1) How to effectively make use of different kinds of social relations for improving the accuracy of expert finding; (2) How to effectively model the associations of misinformation and multi-topical exerts for improving the performance of misinformation identification; and (3) how to effectively rank topical experts for boosting the emerging topic detection in micro-blogging, according to their time-constrained authorities. Based on these three key studies, it is helpful for reducing the social harmfulness of misinformation diffusion, and monitoring public opinion on the potential top events in advance, and thus have a profound impact on the stability and economic development of the nation.
微博社交网络具有知识覆盖面广、社会影响力大等特性,因而吸引了众多注册用户发布各种不同主题知识,其中包括大量具有不同主题知识的专家用户。主题专家通常在所属领域具有较高的权威性和影响力,因此标识和搜索主题专家能够实现对不同主题相关重要信息的有效获取和监控。微博主题专家搜索较传统专家搜索研究具有更大挑战性,其具有数据规模海量性、信息不透明性及社交关系复杂性等特性。本课题拟从三个方面研究微博主题专家搜索问题:(1)如何有效利用微博社交网络结构中多种连接关系以提升主题专家搜索精度;(2)如何有效构建可疑信息与微博多主题专家之间的映射关系,以获取专家知识从而提升不实信息甄别准确率;(3)如何有效标识微博主题专家的时效权威性,以提升热门事件预测的准确度。通过对上述问题的研究可以有效降低微博不实信息传播带来的社会危害性,并提前对可能出现的热门事件进行舆情监控,对稳定国家社会经济发展具有深远影响。
本项目针对微博数据中的数据规模海量性、信息不透明性及社交关系复杂性等挑战,研究了基于微博用户信息、用户行为信息及社交网络结构信息特征的建模方法、以挖掘出蕴含在数据中用户行为偏好、行为规律及用户在不同主题上权威性,从而有效提升微博主题专家检索的准确性,同时也做了相关拓展研究。具体而言,主要取得如下成果:1) 基于半监督学习的主题专家权威性排序问题,解决了在海量文本数据中对任意个数主题词的专家搜索问题,其平均搜索性能提升10%以上(p-value<0.05);2)基于监督学习的垃圾评论者检测问题,重点研究了如何针对用户个体及群体间关系建模以提高检测精度,其平均检测准确率提升10%以上;3)基于情绪感知的回复生成研究问题,解决了自动化感知上下文情感用于生成嵌入合理情绪文本回复问题,在回复语义分数、情感分数及回复质量上较最好方法提升16.9%,1.72%及25.81%;4) 基于图神经网络的短序列会话推荐问题,解决了短会话推荐问题中如何会话序列内物品局部关系及会话序列间物品全局关系建模来提升推荐性能问题,其推荐性能在不同数据集上平均提升4.4%;5) 基于位置感知自注意力机制的序列标注问题,解决了序列标注中如何有效对序列中词语中连续及离散上下文依赖关系建模问题,在经典基准数据集上平均提升0.1左右;6) 基于欧式空间旋转矩阵的知识表示学习,解决了知识表示学习弱解释性问题,将模型扩展到非欧空间显著提升了模型可表示性,并理论证明了模型能够对反转、对称/反对称、传递等复杂类型关系建模;7) 多模态信息表示学习问题,解决了语义与视觉信息的互注意力机制加强问题,在公测平台检测显示较现有state-of-the-art模型性能更优。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
服务经济时代新动能将由技术和服务共同驱动
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
基于图卷积网络的归纳式微博谣言检测新方法
卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比
微博社交网络alpha用户识别的关键理论与算法
基于语义理解的面向特定主题的微博舆情监控技术研究
社交化搜索技术研究
大数据环境下基于社交网络的图像搜索技术研究