Sign prediction predicts positive relations and negative relations between users of social networks. It is becoming one of the most important research issues in social network applications, especially for the socialized recommender systems and socialized sentiment analysis. Existing works of classification-based sign prediction treats the sign prediction problem as a general two–class classification issue, which includes a positive class and a negative class. The goal of these works is to maximize the classification accuracy. However, social network data from real applications may have noises and these data may also be imbalanced and cost sensitive in the sign classification. Without considering these properties, signs predicted by existing works are not reliable in the real social network applications. This project proposes a reliable classification-based sign prediction model based on the properties of real application social network data. It uses ensemble learning based method to filter out the sign noises, resamples the sign data to balance the positive signs and negative signs, and carries out the cost sensitive learning to make the sign classifier cost sensitive. It further considers the data preprocessing that combinatorial optimizes the sign classification when some properties of social networks coexist. The expected results of this project will improve the sign prediction theory and facilitate its usage in the real social network applications.
预测用户间积极关系或消极关系的符号预测问题是社会网络中的核心研究问题之一,对个性化推荐及决策等具有重要指导意义。基于分类的已有符号预测算法将其视为以最大化分类准确度为目标的一般二值(正符号类和负符号类)分类问题,未考虑社会网络中符号数据的有噪声性、不平衡性及分类代价敏感性这三个实际特性对符号分类的影响,所预测符号的可靠性无法保证。本项目拟从符号预测的可靠性角度出发,基于社会网络的实际特性,使用集成学习方法去除符号噪声、通过重采样达到正负符号的相对平衡化、进行符号误分类代价敏感学习使符号分类器具有一定的代价敏感性,并考虑三个特性组合出现时的数据预处理技术,建立旨在最小化符号误分类代价及最大化符号(尤其是负符号类)预测准确度的可靠符号预测通用模型。本项目的研究不仅对丰富符号预测模型的基础理论具备重要意义,且可有效提高符号预测研究的实用性,为其在社会网络应用中的广泛使用奠定坚实的理论基础。
本研究解决社交网络中可靠的符号预测方法问题,其中符号是用户间边的关联关系,分为正负号和负符号两种。在实际应用中,负符号的占比较低(通常为10%-20%左右),数据具有典型的不平衡性,同时,符号的预测具有代价敏感性,将正符号预测为负符号和将负符号预测为正符号的代价不一。首先,针对社交网络中的节点低阶信息量不足的实际特点,开展了基于图核的大规模网络中的符号预测研究。用节点间最短路径的距离控制子图的生成,并对每个节点生成k阶Krylov子空间表示生成的子图,再学习子空间的相似性进行边的分类。其次,针对社交网络中数据的稀疏性问题,开展了基于边对偶图的大规模网络中的符号预测研究,针对图的稀疏性问题,将原图中的边转换成边对偶图中的节点,根据原始图中节点之间的链接来构建边对偶图中的链接,将边分类问题转换为节点的符号预测问题。再次,针对社交网络中的社区聚集特性进行了基于社区的符号预测研究,通过学习节点的权重信息、节点的归属程度和网络的模块性信息将节点划分成不同的社区,并根据划分的社区之间的边发现弱链接,通过弱链接的属性训练分类器。最后,研究了社交网络具有多种信息的条件下的基于异构信息的用户行为分类研究中,发现潜在的恶意用户。针对图中的异构信息融合提取的困难,为每个用户提取用户属性、边、图结构以及用户行为标签信息,使得包含四种异构信息的重构损失同时最小化来计算图嵌入,通过融合多种异构信息,提高用户行为分类的性能。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
跨社交网络用户对齐技术综述
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
黄河流域水资源利用时空演变特征及驱动要素
复杂社会网络中行为传播扩散与预测方法研究
社会化网络中恶意代码传播的建模方法与预测技术研究
基于社会网络分析的机会网络可靠传输机制研究
基于图论方法的符号网络中重叠聚类算法的研究