Recommendation with high quality is a key requirement to satisfy users' experience in social applications. However, data sparsity sets a high obstacle in achieving high recommendation performance. Cross domain recommendation, with advantage of using multi-source historic data from different recommenders at the same time, turns to be an important approach enhancing the recommendation quality. However, there are two difficulties: the sparsity of common data and the user privacy problem, and these raise a big challenge in cross domain recommendation. In this proposal, by using large scale public user data from social media, we investigated research on user modeling with orientation for cross domain recommendation. We firstly proposed the idea of “personality” model to fulfill the requirement for generality of cross domains and will solve the modeling problem as following: 1) by integrating semantic features of multi-aspect and non-semantic features, we try to extract user personality relevant features from both text and profile portrait in social media to enrich user presentation from multi-views. 2) A deep canonical correlation analysis framework will be carried out to build a public subspace with only common factors and removing specific factors of text and portrait features. And this guarantees the density of user model. 3)A personality embedding item-user and item-item distance learning method will be proposed to project items and user into a unified space where personality distance is measured uniformly. To sum up, a comprehensive, dense and uniformed user model will be built from social media and effectively applied in cross domain recommendation.
高质量的推荐是提高互联网应用服务用户满意度的关键指标,但是数据的稀疏性难以保障推荐的性能。跨域推荐技术,由于能够同时利用多个推荐系统中的数据,成为提升推荐性能的的重要途径。然而,共同数据稀疏和用户隐私问题却制约了跨域推荐技术的发展,对跨域推荐带来了巨大挑战。本项目充分利用社交媒体大规模开放用户资源,研究“面向跨域推荐的社交媒体用户建模”方法,首次提出对用户进行“性格”建模的思想,满足跨域推荐对用户模型通用性的要求。主要包括:1)针对跨域推荐用户模型多元化的要求,提出一种融合多种语义和非语义因素的用户行为表征方法;2)针对统一模型无法达到“抽取共有,消除特有”的问题,提出一种基于深度典型相关分析的共性特征提取方法;3)针对跨域推荐中度量一致性要求,提出一种嵌入性格的物品、用户距离学习方法。最终实现基于社交媒体,并面向跨域推荐应用的多元、共性、一致的用户建模。
本课题围绕“面向跨域推荐的社交媒体用户建模”问题,主要开展:①面向跨域推荐的多元化用户表征;②多域共性特征和特性特征提取;③多域一致性度量问题三项关键技术的研究。第一,针对用户建模的多元表征方法,本课题提出了基于强化学习的多层级多模态图文表征架构、基于自适应聚类的视觉关系检测方法和基于软注意机制的多视图融合模型等共性方法;另外,针对社交媒体用户情感和偏好,本课题还提出了视觉内容和情感的特征抽取方法和用户偏好视觉表征方法,并通过丰富的应用场景,验证了本课题所提方法的有效性。第二,针对跨域推荐中实现“共性”和“特性”差异刻画的目标,本课题提出了基于典型相关和域差异性刻画的跨域推荐架构:联合双流典型相关自编码器和正交重构的跨域推荐架构和基于希尔伯特斯密斯独立性准则的双流去噪自编码器跨域推荐架构,围绕典型相关理论和希尔伯特史密斯独立性准则,在跨域场景下实现了共性紧凑提取和特性差异分离。通过丰富的对比和消融实验,验证了本课题所提的方法抽取共性特征具有良好的泛化性。第三,针对跨域一致性度量的目标,本课题提出了基于度量学习的跨域信息嵌入方法,将多域中的用户关系实现相互映射嵌入,确保在非完整多域信息的场景中仍然能够实现度量的一致性,并在社交媒体场景下,实现了用户图像的视觉特征和社会特征的多域融合和相互嵌入。其次,本课题还利用度量学习对大规模数据集下的相似性精细刻画开展了研究,提升了哈希学习中候选目标的排序准确度。依托本课题,项目组共发表和录用论文13篇,培养硕士博士共计8人,建成基于多视角表征和跨域推荐算法和模型库1套。围绕项目成果应用,已联合海信集团成功申报并立项青岛市重点研发项目“基于人工智能的智慧社区技术研发与应用示范”一项。综上,本课题组严格遵循研究计划开展工作,完成“多元化表征”、“跨域共性/特性刻画”“一致性度量”三项具体研究目标,并在多应用场景下对本课题的成果进行了深化和外延。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
跨社交网络用户对齐技术综述
拥堵路网交通流均衡分配模型
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
基于多模态信息特征融合的犯罪预测算法研究
基于在线评论情感分析的社交媒体用户推荐
基于跨社交媒体网络行为大数据的用户建模关键技术研究
多源异构社交媒体用户关联及跨域突发热点预测方法研究
基于网络社交媒体的层次化用户兴趣建模