As the main technology to solve the textual information overload problem, the personalized article recommendation has become a hot research issue in this era of big data. Due to the limitation of existing topic models conducting coarse-grained semantic analysis only, it is very difficult for recommendation algorithms to discover and model fine-grained user preferences, and recommend personalized long-tail articles. In this project, we aim at solving this problem by utilizing the rich information of the knowledge graph to improve personalized article recommendation algorithms. Four research issues are targeted as follows. (1) Entity topic analysis of documents through collaboratively conducting entity representation learning and topic analysis; (2) Personalized entity preference analysis through collaboratively conducting entity topic analysis and low-rank factorizations; (3) Analysis of cross-domain transfer patterns of entity preference through collaboratively conducting nonlinear mapping function learning and low-rank factorizations; and (4) Analysis of personalized sequential entity preference patterns. Under the textual information overload environment, the project will recurrently improve the user service quality, enlarge the potential commercial value of social media, and promote the development of the big data platform.
文本个性化推荐系统是缓解大数据时代文本信息过载的主要方法,是信息检索领域的热点研究问题。由于现有基于主题模型的文本内容分析方法仅对文章语义进行粗粒度分析,使得文本推荐算法对用户细粒度偏好描述不准确,并难于为用户匹配长尾内容,影响推荐效果。本课题拟利用知识图谱中丰富的实体关系,解决上述问题,形成融合知识图谱的文本个性化推荐系统。具体研究内容包括:(1)通过实体嵌入表达与文本实体主题表达的协同学习,进行文本内容实体主题分析;(2)通过文本实体主题分析与低秩分解的协同学习,进行个性化实体偏好分析;(3)通过非线性迁移函数与低秩分解的协同学习,进行跨领域个性化实体偏好迁移分析;(4)通过面向嵌入表示的张量分解,进行个性化实体时序偏好分析。面对文本信息过载,本课题将有力改善用户体验,增加媒体商业价值,并为大数据平台积累更多资源,形成良性循环。
推荐系统是缓解用户面临当今信息过载问题的关键技术。本课题的主要目标是利用知识图谱实现比传统主题分析更细粒度的实体分析来理解文本内容,描述用户的细粒度偏好,匹配难于处理长尾内容,提升文本推荐算法的准确性。研究沿着从匹配知识到自动识别知识的路线进行开展,研究成果具体分为如下四个方面。.. 首先,通过匹配方式将文本的实体与现有知识库融合,验证细粒度实体分析的在推荐系统中的有效性。创新模型包括“用户行为、实体分布及实体关系的联合表示方法”等。其次,通过构建实体识别方法,对文本中未在知识库出现的实体类别进行分析,实现实体“点”级别的自动理解。创新模型包括“融合线型与树状条件随机场的实体识别方法”等。然后,通过构建关系识别方法,对文本中未在知识库出现的实体关系进行分析,实现实体与实体间“线”级别的自动理解。创新模型包括“识别关系触发词的注意力卷积神经网络”等。最后,通过构建识别事件、文本关键词、生成摘要的方法,对文本中未在知识库出现的事件进行分析,实现实体与实体间“面”级别的自动理解。创新模型包括“融合义原知识的事件识别”,“多层编码的自动摘要模型”等。.. 实验结果表明,通过匹配知识及“点-线-面”识别知识的途径,将知识谱图与推荐系统融合,能够从实体级别细粒度的理解文本内容,为用户匹配长尾文本内容,有效提升文本推荐的效果。研究成果主要包括第一标注学术论文11篇(代表性成果发表在计算机学A类会议AAAI上),第二标注学术论文1篇,已授权专利2项。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
粗颗粒土的静止土压力系数非线性分析与计算方法
拥堵路网交通流均衡分配模型
中国参与全球价值链的环境效应分析
卫生系统韧性研究概况及其展望
基于知识图谱的在线个性化商品推荐技术研究
基于知识图谱的个性化API推荐及组合技术研究
面向短文本的分布式表征和多视图融合的个性化推荐研究
融合网络环境下情景感知的个性化推荐机制