社会网络中可靠的符号预测方法研究

基本信息

批准号：61672284

项目类别：面上项目

资助金额：63.00

负责人：袁伟伟

学科分类：

依托单位：南京航空航天大学

批准年份：2016

结题年份：2020

起止时间：2017-01-01 - 2020-12-31

项目状态：已结题

项目参与者：关东海,戴群,蒋玖川,周丽,何康亚,贺丹,权祯臻

关键词：

符号预测代价敏感社会网络误标记分析不平衡数据

结项摘要

Sign prediction predicts positive relations and negative relations between users of social networks. It is becoming one of the most important research issues in social network applications, especially for the socialized recommender systems and socialized sentiment analysis. Existing works of classification-based sign prediction treats the sign prediction problem as a general two–class classification issue, which includes a positive class and a negative class. The goal of these works is to maximize the classification accuracy. However, social network data from real applications may have noises and these data may also be imbalanced and cost sensitive in the sign classification. Without considering these properties, signs predicted by existing works are not reliable in the real social network applications. This project proposes a reliable classification-based sign prediction model based on the properties of real application social network data. It uses ensemble learning based method to filter out the sign noises, resamples the sign data to balance the positive signs and negative signs, and carries out the cost sensitive learning to make the sign classifier cost sensitive. It further considers the data preprocessing that combinatorial optimizes the sign classification when some properties of social networks coexist. The expected results of this project will improve the sign prediction theory and facilitate its usage in the real social network applications.

预测用户间积极关系或消极关系的符号预测问题是社会网络中的核心研究问题之一，对个性化推荐及决策等具有重要指导意义。基于分类的已有符号预测算法将其视为以最大化分类准确度为目标的一般二值（正符号类和负符号类）分类问题，未考虑社会网络中符号数据的有噪声性、不平衡性及分类代价敏感性这三个实际特性对符号分类的影响，所预测符号的可靠性无法保证。本项目拟从符号预测的可靠性角度出发，基于社会网络的实际特性，使用集成学习方法去除符号噪声、通过重采样达到正负符号的相对平衡化、进行符号误分类代价敏感学习使符号分类器具有一定的代价敏感性，并考虑三个特性组合出现时的数据预处理技术，建立旨在最小化符号误分类代价及最大化符号（尤其是负符号类）预测准确度的可靠符号预测通用模型。本项目的研究不仅对丰富符号预测模型的基础理论具备重要意义，且可有效提高符号预测研究的实用性，为其在社会网络应用中的广泛使用奠定坚实的理论基础。

项目摘要

本研究解决社交网络中可靠的符号预测方法问题，其中符号是用户间边的关联关系，分为正负号和负符号两种。在实际应用中，负符号的占比较低（通常为10%-20%左右），数据具有典型的不平衡性，同时，符号的预测具有代价敏感性，将正符号预测为负符号和将负符号预测为正符号的代价不一。首先，针对社交网络中的节点低阶信息量不足的实际特点，开展了基于图核的大规模网络中的符号预测研究。用节点间最短路径的距离控制子图的生成，并对每个节点生成k阶Krylov子空间表示生成的子图，再学习子空间的相似性进行边的分类。其次，针对社交网络中数据的稀疏性问题，开展了基于边对偶图的大规模网络中的符号预测研究，针对图的稀疏性问题，将原图中的边转换成边对偶图中的节点，根据原始图中节点之间的链接来构建边对偶图中的链接，将边分类问题转换为节点的符号预测问题。再次，针对社交网络中的社区聚集特性进行了基于社区的符号预测研究，通过学习节点的权重信息、节点的归属程度和网络的模块性信息将节点划分成不同的社区，并根据划分的社区之间的边发现弱链接，通过弱链接的属性训练分类器。最后，研究了社交网络具有多种信息的条件下的基于异构信息的用户行为分类研究中，发现潜在的恶意用户。针对图中的异构信息融合提取的困难，为每个用户提取用户属性、边、图结构以及用户行为标签信息，使得包含四种异构信息的重构损失同时最小化来计算图嵌入，通过融合多种异构信息，提高用户行为分类的性能。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.13334/j.0258-8013.pcsee.190276

发表时间：2020

DOI：

发表时间：

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：10.13199/j.cnki.cst.2020.07.010

发表时间：2020

DOI：

发表时间：2017

袁伟伟的其他基金

批准号：61100007

批准年份：2011

资助金额：23.00

项目类别：青年科学基金项目

相似国自然基金

复杂社会网络中行为传播扩散与预测方法研究

批准号：91646120

批准年份：2016

负责人：王元卓

学科分类：F0201

资助金额：43.00

项目类别：重大研究计划

社会化网络中恶意代码传播的建模方法与预测技术研究

批准号：61303261

批准年份：2013

负责人：李书豪

学科分类：F0205

资助金额：24.00

项目类别：青年科学基金项目

基于社会网络分析的机会网络可靠传输机制研究

批准号：61172087

批准年份：2011

负责人：潘达儒

学科分类：F0104

资助金额：63.00

项目类别：面上项目

基于图论方法的符号网络中重叠聚类算法的研究

批准号：11401346

批准年份：2014

负责人：亓兴勤

学科分类：A0409

资助金额：22.00

项目类别：青年科学基金项目

社会网络中可靠的符号预测方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

多能耦合三相不平衡主动配电网与输电网交互随机模糊潮流方法

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

智能煤矿建设路线与工程实践

基于SSR 的西南地区野生菰资源遗传多样性及遗传结构分析

袁伟伟的其他基金

物联网环境下基于情景的社会化信任感知推荐系统模型研究

相似国自然基金

社会网络中可靠的符号预测方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

多能耦合三相不平衡主动配电网与输电网交互随机模糊潮流方法

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

智能煤矿建设路线与工程实践

基于SSR 的西南地区野生菰资源 遗传多样性及遗传结构分析

袁伟伟的其他基金

物联网环境下基于情景的社会化信任感知推荐系统模型研究

相似国自然基金

基于SSR 的西南地区野生菰资源遗传多样性及遗传结构分析