User modeling is an important support for government governance, enterprise decision-making and e-commerce services. The large data of multisource heterogeneous networks provides a new opportunity for user modeling. For the challenge of different online social networks coexist, the feature representation differences and the computational complexity, we base on the theory of network representation learning, do the research of multi-source data gathering mechanism from different platforms. Then, we study the mechanism of heterogeneous feature fusion and representation of three typical tasks, which are user attribute inference, relationship recognition and behavior prediction. A mechanism of network embedding base on many key structures preserving is proposed ,which is for heterogeneous network alignment. A translation-based network embedding method for relationship identification, a graph neural network with point process model for interaction prediction, a neural network with domain knowledge and spatial and temporal characteristics for recommendation are proposed. The research results have important theoretical and practical significance in public opinion monitoring, commodity recommendation, intention mining, relationship discovery and event situation prediction.
用户建模是政府治理、企业决策和电商服务等的重要支撑。多源异构网络大数据为用户建模提供了新的契机。针对网络大数据多平台并存、特征表达差异、计算复杂度高的挑战,本项目以网络表示学习为关键理论,从线索探索、算法优化、结果精化三方面,首先研究多源网络大数据汇聚机制和模型,联通不同平台的数据。然后,面向用户建模中用户属性推断、关系识别、行为预测三个典型重要任务的异构特征融合与表示的机制进行研究。将建立基于多关键结构保持的网络嵌入表示学习机制及异构网络对齐方法、具有注意力机制的空域异构特征融合的图卷积网络及属性推断、基于翻译模型的关系网络协同表示学习的关系识别、融合事件进程的图神经网络模型及交互预测、领域知识和时空特征融合的协同演化表示学习及行为预测方法等,并将在多个社交媒体平台数据上进行验证和示范。研究成果在舆情监测、商品推荐、意图挖掘、关系发现及事件态势预测等方面具有重要理论价值和应用意义。
针对用户建模中网络大数据多平台并存、特征表达差异、计算复杂度高的挑战,本项目以网络表示学习为关键理论,从网络大数据融合表征和基于数据融合表征的用户建模两个方面展开研究。针对网络大数据融合表征,建立了基于社区结构的最大化互信息的生成对抗式的图表示学习、基于多尺度特征和改进采样策略的异构网络对齐方法、基于双反馈机制的多视图子空间学习的融合表征、多视图深度特征增强的隐空间融合表征方法、基于多视图差异性和一致性的聚类融合增强学习等方法;在用户建模方面,针对属性推断,提出了融合句法信息的多头注意力胶囊网络模型用于多标签文本分类、融合语义与语法信息的中文评价对象提取模型、基于 N-Gram CNN 的多粒度增强、具有层次注意力的虚假评论检测模型、基于元路径增强的异构图注意力虚假评论检测模型等;针对关系识别,建立了节点表示序列和局部邻居表示融合的链接预测模型、链接时效感知和局部子图结构融合的动态网络链接预测模型;针对行为预测,建立了融合点模型和序列模型的、能同时预测事件和发生时间的预测算法,针对会话序列推荐,建立了序列结构和图结构协同感知的推荐模型、融合微观行为和原始兴趣的自适应多注意力会话推荐模型等。研究成果在虚假评论检测、会话推荐等多种应用场景中进行示范和验证,表现优于主流的基线模型。授权发明专利4项,软著2项,发表学术论文44 篇,其中SCI 1区期刊收录6篇,SCI、EI双收录14篇,EI单收录 11篇,CCF A、B、C类会议各1篇,中文核心期刊23篇;培养博士毕业生4人,硕士研究生16 人,1名博士毕业生获得2021年山西省优秀博士论文称号,2名硕士研究生分别在IEEE BigComp2020和2022年CCF全国大数据学术会议获得优秀论文二等奖和优秀学生论文奖。项目成果可应用于推荐、预测、创新管理、舆情监控等各种网络服务与管理领域,并可推广到精准医疗、金融服务等领域。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
论大数据环境对情报学发展的影响
跨社交网络用户对齐技术综述
基于LASSO-SVMR模型城市生活需水量的预测
拥堵路网交通流均衡分配模型
面向领域用户知识发现的数据结构化建模与多粒度融合
多设备融合的用户网络搜索行为建模与技术实现研究
面向残缺网络数据的表示学习研究
融合多网络社区身份的用户话题兴趣建模研究