With the rapid development of social media, massive rich media information has been generated, such as complicated information association between users and multimedia content. How to effectively conduct data mining for accurate user modeling and recommendations becomes the key problem to the development of modern Internet. Traditional user interest models focus on learning user interests from single relation, which cannot be applied in social media. This proposal aims to construct user interest models using rich user interactive resources in social media based on machine learning and social network analysis. The key issues includes: (1) Research on text mining based on topic model and semantic dictionary for user modeling; (2) Research on community mining based on probability model and topic model; (3) Research on user network analysis based on social network analysis and structural properties investigation; (4) Designing recommendation models to fuse different elements to improve the accuracy and explanation.
随着社会媒体广泛渗入用户网络生活,互联网产生了大量内容丰富的异质信息,如形式多样的媒体协同与用户互动。深入分析这类异质信息,进而准确理解用户的意图和兴趣,有效实现个性化信息推荐,成为时下社会媒体应用和发展的关键。传统的用户兴趣建模方法假设个体间只存在单一关系,不利于处理异质数据,本项目旨在通过机器学习和社会网络分析方法,研究基于异质关系挖掘的用户兴趣建模方法。主要研究内容包括:(1)采用主题模型结合语义词典的方式实现文本语义挖掘,以概率的形式将词语转化为用户兴趣层次化主题描述;(2)通过概率模型将用户参与社区的行为映射为用户对主题的喜好程度,实现基于社区的用户兴趣描述;(3)通过社会网络分析方法分析用户好友网络的结构特征,深入分析用户间交互模式,理解用户兴趣倾向;(4)在模型学习的不同阶段融入适当的交互元素,提出改进的潜语义生成模型融合机制,提高协同推荐的准确率和可解释性。
本研究针对社会媒体中丰富的异质关系数据,利用文本挖掘和社会网络分析方法,研究不同交互元素对用户兴趣的影响;另一方面,针对异质网络种类繁多、特性各异的问题,利用机器学习方法研究异质关系融合问题,建立有效的融合机制,为协同推荐提供核心关键技术。取得了四个方面的成果:在文本语义挖掘方面,本项目利用上下文计算上下文影响权重并作用到该词的语义中心,引起语义中心的偏移,形成该词在当前上下文的词向量表示,从而解决一词多义问题。在社区主题挖掘方面,提出了针对标签噪声的全局鲁棒性度量学习算法,引入真实侧信息作为隐变量,结合数据的潜在结构与先验信息作为2个重采样因子,建立极大似然模型,对数据样本对的潜在相似性进行推理,估计度量矩阵。在链接关系挖掘方面,本项目提出了一种基于用户特征分析及内容分析的微博用户影响力评估方法,更加全面的分析了用户影响力的组成,更准确的衡量了用户影响力。在异质关系融合方面,提出了一种基于深度学习的数据融合框架,通过中间层特征加强了模型的泛化能力,在数据量有限的情况下提高了分类的准确率。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
跨社交网络用户对齐技术综述
黄河流域水资源利用时空演变特征及驱动要素
拥堵路网交通流均衡分配模型
服务经济时代新动能将由技术和服务共同驱动
基于深度神经网络的社会媒体用户情感及兴趣挖掘方法研究
通过社会化媒体挖掘用户兴趣的方法及应用研究
基于网络社交媒体的层次化用户兴趣建模
基于用户标签和主题兴趣的社会媒体信息推荐研究