社会网络中可靠的符号预测方法研究

基本信息
批准号:61672284
项目类别:面上项目
资助金额:63.00
负责人:袁伟伟
学科分类:
依托单位:南京航空航天大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:关东海,戴群,蒋玖川,周丽,何康亚,贺丹,权祯臻
关键词:
符号预测代价敏感社会网络误标记分析不平衡数据
结项摘要

Sign prediction predicts positive relations and negative relations between users of social networks. It is becoming one of the most important research issues in social network applications, especially for the socialized recommender systems and socialized sentiment analysis. Existing works of classification-based sign prediction treats the sign prediction problem as a general two–class classification issue, which includes a positive class and a negative class. The goal of these works is to maximize the classification accuracy. However, social network data from real applications may have noises and these data may also be imbalanced and cost sensitive in the sign classification. Without considering these properties, signs predicted by existing works are not reliable in the real social network applications. This project proposes a reliable classification-based sign prediction model based on the properties of real application social network data. It uses ensemble learning based method to filter out the sign noises, resamples the sign data to balance the positive signs and negative signs, and carries out the cost sensitive learning to make the sign classifier cost sensitive. It further considers the data preprocessing that combinatorial optimizes the sign classification when some properties of social networks coexist. The expected results of this project will improve the sign prediction theory and facilitate its usage in the real social network applications.

预测用户间积极关系或消极关系的符号预测问题是社会网络中的核心研究问题之一,对个性化推荐及决策等具有重要指导意义。基于分类的已有符号预测算法将其视为以最大化分类准确度为目标的一般二值(正符号类和负符号类)分类问题,未考虑社会网络中符号数据的有噪声性、不平衡性及分类代价敏感性这三个实际特性对符号分类的影响,所预测符号的可靠性无法保证。本项目拟从符号预测的可靠性角度出发,基于社会网络的实际特性,使用集成学习方法去除符号噪声、通过重采样达到正负符号的相对平衡化、进行符号误分类代价敏感学习使符号分类器具有一定的代价敏感性,并考虑三个特性组合出现时的数据预处理技术,建立旨在最小化符号误分类代价及最大化符号(尤其是负符号类)预测准确度的可靠符号预测通用模型。本项目的研究不仅对丰富符号预测模型的基础理论具备重要意义,且可有效提高符号预测研究的实用性,为其在社会网络应用中的广泛使用奠定坚实的理论基础。

项目摘要

本研究解决社交网络中可靠的符号预测方法问题,其中符号是用户间边的关联关系,分为正负号和负符号两种。在实际应用中,负符号的占比较低(通常为10%-20%左右),数据具有典型的不平衡性,同时,符号的预测具有代价敏感性,将正符号预测为负符号和将负符号预测为正符号的代价不一。首先,针对社交网络中的节点低阶信息量不足的实际特点,开展了基于图核的大规模网络中的符号预测研究。用节点间最短路径的距离控制子图的生成,并对每个节点生成k阶Krylov子空间表示生成的子图,再学习子空间的相似性进行边的分类。其次,针对社交网络中数据的稀疏性问题,开展了基于边对偶图的大规模网络中的符号预测研究,针对图的稀疏性问题,将原图中的边转换成边对偶图中的节点,根据原始图中节点之间的链接来构建边对偶图中的链接,将边分类问题转换为节点的符号预测问题。再次,针对社交网络中的社区聚集特性进行了基于社区的符号预测研究,通过学习节点的权重信息、节点的归属程度和网络的模块性信息将节点划分成不同的社区,并根据划分的社区之间的边发现弱链接,通过弱链接的属性训练分类器。最后,研究了社交网络具有多种信息的条件下的基于异构信息的用户行为分类研究中,发现潜在的恶意用户。针对图中的异构信息融合提取的困难,为每个用户提取用户属性、边、图结构以及用户行为标签信息,使得包含四种异构信息的重构损失同时最小化来计算图嵌入,通过融合多种异构信息,提高用户行为分类的性能。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
4

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
5

黄河流域水资源利用时空演变特征及驱动要素

黄河流域水资源利用时空演变特征及驱动要素

DOI:10.18402/resci.2020.12.01
发表时间:2020

袁伟伟的其他基金

相似国自然基金

1

复杂社会网络中行为传播扩散与预测方法研究

批准号:91646120
批准年份:2016
负责人:王元卓
学科分类:F0201
资助金额:43.00
项目类别:重大研究计划
2

社会化网络中恶意代码传播的建模方法与预测技术研究

批准号:61303261
批准年份:2013
负责人:李书豪
学科分类:F0205
资助金额:24.00
项目类别:青年科学基金项目
3

基于社会网络分析的机会网络可靠传输机制研究

批准号:61172087
批准年份:2011
负责人:潘达儒
学科分类:F0104
资助金额:63.00
项目类别:面上项目
4

基于图论方法的符号网络中重叠聚类算法的研究

批准号:11401346
批准年份:2014
负责人:亓兴勤
学科分类:A0409
资助金额:22.00
项目类别:青年科学基金项目