随着互联网的发展,推荐系统在众多领域中有着广泛的应用。协同过滤是目前工业界和学术界的主流方法。它利用的数据是系统中收集的用户的偏好数据,例如:用户喜欢看哪些电影。协同过滤算法假设用户的偏好随时间迁移变化不大,从而利用用户过去的偏好数据,预测用户未来可能的行为。由于各种不同原因,用户偏好数据收集比较困难,数据稀疏性(极端的情形是新用户/新对象问题;大多数问题的稀疏性大于99%)是协同过滤算法遇到的主要问题。近年来,主动学习以及利用跨领域数据的迁移学习是研究人员在一些问题中解决数据稀疏问题的两种有效工具。它们的基本思想是分别在本领域和附加的其它领域中高效的挖掘有用信息,改进原来领域学习任务的效果。在本研究中,我们沿着这两个不同的思路,并利用两种思路的互补,考虑如何利用跨领域数据,设计一种主动收集、分析能够反映用户喜好信息的模块,以解决协同过滤中的数据稀疏问题,进而提高协同过滤算法预测的准确性。
随着互联网的发展,推荐系统在众多领域中有着广泛的应用。协同过滤是目前工业界和学术界的主流方法。它利用的数据是系统中收集的用户的偏好数据,例如:用户喜欢看哪些电影。协同过滤算法假设用户的偏好随时间迁移变化不大,从而利用用户过去的偏好数据,预测用户未来可能的行为。由于各种不同原因,用户偏好数据收集比较困难,数据稀疏性(极端的情形是新用户/新对象问题;大多数问题的稀疏性大于99%)是协同过滤算法遇到的主要问题。近年来,主动学习以及利用跨领域数据的迁移学习是研究人员在一些问题中解决数据稀疏问题的两种有效工具。它们的基本思想是分别在本领域和附加的其它领域中高效的挖掘有用信息,改进原来领域学习任务的效果。在本研究中,我们沿着这两个不同的思路,并利用两种思路的互补,考虑如何利用跨领域数据,设计一种主动收集、分析能够反映用户喜好信息的模块,以解决协同过滤中的数据稀疏问题,进而提高协同过滤算法预测的准确性。依托本项目,共发表12篇学术论文,其中包括2篇IJCAI,1篇ICDM;培养了5名硕士研究生,另有一名博士研究生和多名硕士研究生在读。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
拥堵路网交通流均衡分配模型
卫生系统韧性研究概况及其展望
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
面向云工作流安全的任务调度方法
集成主动学习和众包技术的迁移学习算法研究
基于生成模型的迁移学习算法研究及其应用
基于迁移学习的多模态信息协同目标感知
基于深度学习和迁移学习的对流新生临近预报方法研究