面向海量数据的基于效用的个性化学术资源推荐系统关键技术研究

基本信息
批准号:61202321
项目类别:青年科学基金项目
资助金额:24.00
负责人:刘莹
学科分类:
依托单位:中国科学院大学
批准年份:2012
结题年份:2015
起止时间:2013-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:吴开超,菅立恒,赵熙,张振华,高洋,李小君,欧国宇,赵仁良
关键词:
效用数据挖掘推荐系统并行计算
结项摘要

Personalized academic resource recommendation system is in real demand by students and researchers. Existing systems, such as digital library systems, personalized recommendation systems, etc. cannot meet the requirements of academic users. Therefore, in this proposal, first of all, we propose a novel user profile model based on both content and behavior, which overcomes the weakness of content-based profile model that only takes into consideration the text content the user looked through. Next, in order to follow the user's interersts in content, we propose various methods to discover the patterns hidden in Web logs, comments provided by the user, and user click streams obtained at runtime when the user is browsing around in the recommendation system.Then, the user interest profile will be updated dynamically when necessary. In order to recommend different academic resources for users who share common interest in content but with different preference, we propose a utility-based model, which models a user's preference by a classification model. The utility function will be obtained through the training of the classification model. Since the number of academic resources is huge, so as the number of users, the performance is a big challenge. We propose to implement the recommendation in data parallelism and task parallelism on a cluster-based computing platform. Our system prototype will be evaluated in two real applications. This proposed system will improve the research quality of students and researchers by providing personalized academic resources, improve the theory and techniques in the domain of recommendation system.

个性化学术资源推荐系统是学生和科研人员在学习和工作中迫切需要的工具。已有的数字图书馆系统、个性化推荐系统等都没有针对学术资源和学术用户的特点展开深入的研究。为此,本项目首先要转变只从用户感兴趣的内容中提取用户兴趣的传统思路,提出将内容个性化与行为个性化相结合的用户兴趣模型。为了跟踪用户在内容兴趣方面的变化,提出动态发现用户兴趣的思路,主动地收集用户显式的、隐式的反馈,通过数据挖掘、信息检索等技术,挖掘用户最新的兴趣并适时更新用户兴趣模型。为了对行为偏好不同的用户提供个性化的推荐,提出基于用户历史行为的效用模型,并通过对模型的训练,获得效用函数,进而实现基于效用的个性化推荐。面对海量的学术资源和用户,为了解决系统的可扩展性问题和性能问题,将研究分布式的并行推荐方法。系统原型将在两个有代表性的实际应用中得到检验。本项目的研究将有利于学生和科研人员提高科研水平,丰富推荐系统的理论和技术。

项目摘要

个性化学术资源推荐系统是学生和科研人员在学习和工作中迫切需要的工具。已有的数字图书馆系统、个性化推荐系统等都不能满足学术用户的需求。为此,本项目针对个性化的学术资源推荐系统展开了深入的研究。在模型、算法、系统方面都获得了较好的成果。. 首先,原创性地提出了基于效用的资源与用户的二元向量模型,并提出了多个效用维度及其量化、归一化的方法。.在此模型的基础之上,提出了4个学术资源的推荐算法,包括(1)基于VIKOR算法的个性化学术推荐算法。推荐的结果是用户整体效用最大化和效用遗憾最小化的学术资源集合。在20万条公开的学术资源的实验中,基于VIKOR的算法比基于内容的算法在NDCG精度上提高了78.5%;(2)提出了VSRANK与社交关系效用元素相结合的算法。实验表明,NDCG排序准确度比已有的两个算法高出约15%;(3)在协同排序算法的框架中引入内容推荐算法。实验表明,NDCG排序准确度比已有的算法高出约10%;(4)提出了基于核的简单正规化线性规划分类算法。该算法可保证模型在选取合适的参数时能够获得妥协解。接下来,为了进行用户效用权重的学习和更新,原创性地提出了基于Rocchio算法的效用权重更新算法。实验表明,更新过用户兴趣的基于VIKOR的推荐算法精度提高了4.6%。为了使得模型能够满足实际应用中的大数据计算,提出并实现了基于多个图形处理器的CUDA并行协同过滤推荐算法,并深刻优化了性能,最高获得了3691倍加速比。另外,为了便于在云计算环境下展开推荐,提出并实现了云平台中间件“DM-Midware”,它支持数据挖掘、信号处理、无线通讯等应用在云平台上获得高性能、高吞吐量、高可扩展性。. 在模型和算法研究的基础之上,实现了一个具备搜索与推荐功能的学术资源推荐系统原型。系统的web前端负责用户交互与结果呈现,后台负责主要的运算。系统整合了20万条公开的学术资源。本项目所有的实验均在此系统中展开,获得了很好的使用效果。. 项目已发表期刊论文7篇,会议论文4篇,共计11篇(SCI论文3篇,EI论文4篇,国内核心期刊论文2篇)。另外,已获批2项软件著作权。本项目的研究转变了推荐系统中固有的思路,完善了理论体系;将信息检索、数据挖掘、并行计算技术相结合,促进不同学科的融合。本项目的研究对推荐系统的理论体系作出了贡献,并具有广阔的应用前景。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
4

卫生系统韧性研究概况及其展望

卫生系统韧性研究概况及其展望

DOI:10.16506/j.1009-6639.2018.11.016
发表时间:2018
5

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018

刘莹的其他基金

批准号:60873253
批准年份:2008
资助金额:30.00
项目类别:面上项目
批准号:51679130
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:31770214
批准年份:2017
资助金额:60.00
项目类别:面上项目
批准号:41875153
批准年份:2018
资助金额:62.00
项目类别:面上项目
批准号:81901394
批准年份:2019
资助金额:20.50
项目类别:青年科学基金项目
批准号:60303006
批准年份:2003
资助金额:23.00
项目类别:青年科学基金项目
批准号:50975157
批准年份:2009
资助金额:40.00
项目类别:面上项目
批准号:51878202
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:71802109
批准年份:2018
资助金额:19.00
项目类别:青年科学基金项目
批准号:31400911
批准年份:2014
资助金额:24.00
项目类别:青年科学基金项目
批准号:39580007
批准年份:1995
资助金额:8.00
项目类别:专项基金项目
批准号:21576264
批准年份:2015
资助金额:65.00
项目类别:面上项目
批准号:71671178
批准年份:2016
资助金额:48.00
项目类别:面上项目
批准号:51508113
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:81400247
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:31601434
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:51308142
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:20873003
批准年份:2008
资助金额:34.00
项目类别:面上项目
批准号:61202085
批准年份:2012
资助金额:22.00
项目类别:青年科学基金项目
批准号:81501036
批准年份:2015
资助金额:17.50
项目类别:青年科学基金项目
批准号:21776285
批准年份:2017
资助金额:64.00
项目类别:面上项目
批准号:31070784
批准年份:2010
资助金额:30.00
项目类别:面上项目
批准号:51508384
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:50545035
批准年份:2005
资助金额:8.00
项目类别:专项基金项目
批准号:81301189
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:21573012
批准年份:2015
资助金额:67.00
项目类别:面上项目
批准号:81501537
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目
批准号:51275268
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:51209125
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:81400157
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:81560455
批准年份:2015
资助金额:37.00
项目类别:地区科学基金项目
批准号:31570819
批准年份:2015
资助金额:62.00
项目类别:面上项目
批准号:20473001
批准年份:2004
资助金额:22.00
项目类别:面上项目
批准号:21306098
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:30870959
批准年份:2008
资助金额:30.00
项目类别:面上项目
批准号:31801097
批准年份:2018
资助金额:20.00
项目类别:青年科学基金项目
批准号:61772307
批准年份:2017
资助金额:68.00
项目类别:面上项目
批准号:41005067
批准年份:2010
资助金额:22.00
项目类别:青年科学基金项目
批准号:20773002
批准年份:2007
资助金额:8.00
项目类别:面上项目
批准号:71103013
批准年份:2011
资助金额:19.00
项目类别:青年科学基金项目
批准号:50275071
批准年份:2002
资助金额:25.00
项目类别:面上项目
批准号:31100160
批准年份:2011
资助金额:10.00
项目类别:青年科学基金项目
批准号:51165031
批准年份:2011
资助金额:54.00
项目类别:地区科学基金项目
批准号:30600738
批准年份:2006
资助金额:20.00
项目类别:青年科学基金项目
批准号:21877003
批准年份:2018
资助金额:63.00
项目类别:面上项目
批准号:60424003
批准年份:2004
资助金额:1.60
项目类别:专项基金项目
批准号:41175112
批准年份:2011
资助金额:60.00
项目类别:面上项目

相似国自然基金

1

面向个性化推荐服务的社交网络数据深挖掘关键技术研究

批准号:61402336
批准年份:2014
负责人:王瑞琴
学科分类:F0210
资助金额:24.00
项目类别:青年科学基金项目
2

面向FAST的海量数据处理关键技术研究

批准号:U1531246
批准年份:2015
负责人:朱明
学科分类:A1503
资助金额:200.00
项目类别:联合基金项目
3

基于人机协同的海量数据探索系统关键技术研究

批准号:61772492
批准年份:2017
负责人:谢希科
学科分类:F0202
资助金额:63.00
项目类别:面上项目
4

基于面向话题的加权社会网络的个性化推荐及检索技术研究

批准号:61170189
批准年份:2011
负责人:李舟军
学科分类:F0607
资助金额:58.00
项目类别:面上项目