面向海量数据的基于效用的个性化学术资源推荐系统关键技术研究

基本信息

批准号：61202321

项目类别：青年科学基金项目

资助金额：24.00

负责人：刘莹

学科分类：

依托单位：中国科学院大学

批准年份：2012

结题年份：2015

起止时间：2013-01-01 - 2015-12-31

项目状态：已结题

项目参与者：吴开超,菅立恒,赵熙,张振华,高洋,李小君,欧国宇,赵仁良

关键词：

效用数据挖掘推荐系统并行计算

结项摘要

Personalized academic resource recommendation system is in real demand by students and researchers. Existing systems, such as digital library systems, personalized recommendation systems, etc. cannot meet the requirements of academic users. Therefore, in this proposal, first of all, we propose a novel user profile model based on both content and behavior, which overcomes the weakness of content-based profile model that only takes into consideration the text content the user looked through. Next, in order to follow the user's interersts in content, we propose various methods to discover the patterns hidden in Web logs, comments provided by the user, and user click streams obtained at runtime when the user is browsing around in the recommendation system.Then, the user interest profile will be updated dynamically when necessary. In order to recommend different academic resources for users who share common interest in content but with different preference, we propose a utility-based model, which models a user's preference by a classification model. The utility function will be obtained through the training of the classification model. Since the number of academic resources is huge, so as the number of users, the performance is a big challenge. We propose to implement the recommendation in data parallelism and task parallelism on a cluster-based computing platform. Our system prototype will be evaluated in two real applications. This proposed system will improve the research quality of students and researchers by providing personalized academic resources, improve the theory and techniques in the domain of recommendation system.

个性化学术资源推荐系统是学生和科研人员在学习和工作中迫切需要的工具。已有的数字图书馆系统、个性化推荐系统等都没有针对学术资源和学术用户的特点展开深入的研究。为此，本项目首先要转变只从用户感兴趣的内容中提取用户兴趣的传统思路，提出将内容个性化与行为个性化相结合的用户兴趣模型。为了跟踪用户在内容兴趣方面的变化，提出动态发现用户兴趣的思路，主动地收集用户显式的、隐式的反馈，通过数据挖掘、信息检索等技术，挖掘用户最新的兴趣并适时更新用户兴趣模型。为了对行为偏好不同的用户提供个性化的推荐，提出基于用户历史行为的效用模型，并通过对模型的训练，获得效用函数，进而实现基于效用的个性化推荐。面对海量的学术资源和用户，为了解决系统的可扩展性问题和性能问题，将研究分布式的并行推荐方法。系统原型将在两个有代表性的实际应用中得到检验。本项目的研究将有利于学生和科研人员提高科研水平，丰富推荐系统的理论和技术。

项目摘要

个性化学术资源推荐系统是学生和科研人员在学习和工作中迫切需要的工具。已有的数字图书馆系统、个性化推荐系统等都不能满足学术用户的需求。为此，本项目针对个性化的学术资源推荐系统展开了深入的研究。在模型、算法、系统方面都获得了较好的成果。. 首先，原创性地提出了基于效用的资源与用户的二元向量模型，并提出了多个效用维度及其量化、归一化的方法。.在此模型的基础之上，提出了4个学术资源的推荐算法，包括（1）基于VIKOR算法的个性化学术推荐算法。推荐的结果是用户整体效用最大化和效用遗憾最小化的学术资源集合。在20万条公开的学术资源的实验中，基于VIKOR的算法比基于内容的算法在NDCG精度上提高了78.5%；（2）提出了VSRANK与社交关系效用元素相结合的算法。实验表明，NDCG排序准确度比已有的两个算法高出约15%；（3）在协同排序算法的框架中引入内容推荐算法。实验表明，NDCG排序准确度比已有的算法高出约10%；（4）提出了基于核的简单正规化线性规划分类算法。该算法可保证模型在选取合适的参数时能够获得妥协解。接下来，为了进行用户效用权重的学习和更新，原创性地提出了基于Rocchio算法的效用权重更新算法。实验表明，更新过用户兴趣的基于VIKOR的推荐算法精度提高了4.6%。为了使得模型能够满足实际应用中的大数据计算，提出并实现了基于多个图形处理器的CUDA并行协同过滤推荐算法，并深刻优化了性能，最高获得了3691倍加速比。另外，为了便于在云计算环境下展开推荐，提出并实现了云平台中间件“DM-Midware”，它支持数据挖掘、信号处理、无线通讯等应用在云平台上获得高性能、高吞吐量、高可扩展性。. 在模型和算法研究的基础之上，实现了一个具备搜索与推荐功能的学术资源推荐系统原型。系统的web前端负责用户交互与结果呈现，后台负责主要的运算。系统整合了20万条公开的学术资源。本项目所有的实验均在此系统中展开，获得了很好的使用效果。. 项目已发表期刊论文7篇，会议论文4篇，共计11篇（SCI论文3篇，EI论文4篇，国内核心期刊论文2篇）。另外，已获批2项软件著作权。本项目的研究转变了推荐系统中固有的思路，完善了理论体系；将信息检索、数据挖掘、并行计算技术相结合，促进不同学科的融合。本项目的研究对推荐系统的理论体系作出了贡献，并具有广阔的应用前景。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.16796/j.cnki.1000-3770.2022.03.003

发表时间：2022

DOI：10.12202/j.0476-0301.2022178

发表时间：2022

DOI：10.13199/j.cnki.cst.2020.07.010

发表时间：2020

DOI：10.16383/j.aas.c180673

发表时间：2021

DOI：DOI: 10.11821/dlxb201611003

发表时间：2016

刘莹的其他基金

批准号：81901394

批准年份：2019

资助金额：20.50

项目类别：青年科学基金项目

批准号：60873253

批准年份：2008

资助金额：30.00

项目类别：面上项目

批准号：51679130

批准年份：2016

资助金额：62.00

项目类别：面上项目

批准号：31770214

批准年份：2017

资助金额：60.00

项目类别：面上项目

批准号：41875153

批准年份：2018

资助金额：62.00

项目类别：面上项目

批准号：60303006

批准年份：2003

资助金额：23.00

项目类别：青年科学基金项目

批准号：50975157

批准年份：2009

资助金额：40.00

项目类别：面上项目

批准号：51878202

批准年份：2018

资助金额：60.00

项目类别：面上项目

批准号：71802109

批准年份：2018

资助金额：19.00

项目类别：青年科学基金项目

批准号：31400911

批准年份：2014

资助金额：24.00

项目类别：青年科学基金项目

批准号：39580007

批准年份：1995

资助金额：8.00

项目类别：专项基金项目

批准号：21576264

批准年份：2015

资助金额：65.00

项目类别：面上项目

批准号：71671178

批准年份：2016

资助金额：48.00

项目类别：面上项目

批准号：51508113

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

批准号：81400247

批准年份：2014

资助金额：23.00

项目类别：青年科学基金项目

批准号：31601434

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：51308142

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：20873003

批准年份：2008

资助金额：34.00

项目类别：面上项目

批准号：61202085

批准年份：2012

资助金额：22.00

项目类别：青年科学基金项目

批准号：81501036

批准年份：2015

资助金额：17.50

项目类别：青年科学基金项目

批准号：21776285

批准年份：2017

资助金额：64.00

项目类别：面上项目

批准号：31070784

批准年份：2010

资助金额：30.00

项目类别：面上项目

批准号：51508384

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

批准号：50545035

批准年份：2005

资助金额：8.00

项目类别：专项基金项目

批准号：81301189

批准年份：2013

资助金额：23.00

项目类别：青年科学基金项目

批准号：21573012

批准年份：2015

资助金额：67.00

项目类别：面上项目

批准号：81501537

批准年份：2015

资助金额：18.00

项目类别：青年科学基金项目

批准号：51275268

批准年份：2012

资助金额：80.00

项目类别：面上项目

批准号：51209125

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：81400157

批准年份：2014

资助金额：23.00

项目类别：青年科学基金项目

批准号：81560455

批准年份：2015

资助金额：37.00

项目类别：地区科学基金项目

批准号：31570819

批准年份：2015

资助金额：62.00

项目类别：面上项目

批准号：20473001

批准年份：2004

资助金额：22.00

项目类别：面上项目

批准号：21306098

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：30870959

批准年份：2008

资助金额：30.00

项目类别：面上项目

批准号：31801097

批准年份：2018

资助金额：20.00

项目类别：青年科学基金项目

批准号：61772307

批准年份：2017

资助金额：68.00

项目类别：面上项目

批准号：41005067

批准年份：2010

资助金额：22.00

项目类别：青年科学基金项目

批准号：20773002

批准年份：2007

资助金额：8.00

项目类别：面上项目

批准号：71103013

批准年份：2011

资助金额：19.00

项目类别：青年科学基金项目

批准号：50275071

批准年份：2002

资助金额：25.00

项目类别：面上项目

批准号：31100160

批准年份：2011

资助金额：10.00

项目类别：青年科学基金项目

批准号：51165031

批准年份：2011

资助金额：54.00

项目类别：地区科学基金项目

批准号：30600738

批准年份：2006

资助金额：20.00

项目类别：青年科学基金项目

批准号：21877003

批准年份：2018

资助金额：63.00

项目类别：面上项目

批准号：60424003

批准年份：2004

资助金额：1.60

项目类别：专项基金项目

批准号：41175112

批准年份：2011

资助金额：60.00

项目类别：面上项目

相似国自然基金

面向个性化推荐服务的社交网络数据深挖掘关键技术研究

批准号：61402336

批准年份：2014

负责人：王瑞琴

学科分类：F0210

资助金额：24.00

项目类别：青年科学基金项目

面向FAST的海量数据处理关键技术研究

批准号：U1531246

批准年份：2015

负责人：朱明

学科分类：A1503

资助金额：200.00

项目类别：联合基金项目

基于人机协同的海量数据探索系统关键技术研究

批准号：61772492

批准年份：2017

负责人：谢希科

学科分类：F0202

资助金额：63.00

项目类别：面上项目

基于面向话题的加权社会网络的个性化推荐及检索技术研究

批准号：61170189

批准年份：2011

负责人：李舟军

学科分类：F0607

资助金额：58.00

项目类别：面上项目

面向海量数据的基于效用的个性化学术资源推荐系统关键技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

EBPR工艺运行效果的主要影响因素及研究现状

复杂系统科学研究进展

智能煤矿建设路线与工程实践

二维FM系统的同时故障检测与控制

末次盛冰期以来中国湖泊记录对环流系统及气候类型的响应

刘莹的其他基金

tDCS通过注意力-听觉平衡补偿促进PD言语障碍恢复的作用及脑机制

P2P网络流媒体传输的用户协作问题研究

不同营养水平下混合抗生素调控铜绿微囊藻水华的基因组学机制

野牡丹科锦香草属及野海棠属的系统学研究

大气中含氧半挥发性有机物关键转化途径及气粒分配的量化表征

下一代网络中面向区分服务的可扩展组播研究

基于流固热耦合的高温高压动压机械密封机理研究

基于大数据的体育中心人群疏散模式及优化设计方法研究

工匠精神的概念、前因与结果研究：自我决定理论的视角

颜色-运动特征的绑定与视觉意识的关系

与gp130结合的信号转异分子的克隆及作用机理的研究

钯纳米胶囊限域空间催化烯烃聚合反应过程研究及产品结构调控

面向互联网信贷的基于多源大数据的个人信用评分关键技术

饱和软土中桩基础长期竖向循环弱化特性研究

CXCR2受体介导血管紧张素II诱导的心房纤维化的分子机制研究

半胱氨酸脱硫酶基因调控香菇特征香味物质的形成机理研究

基于虚拟人群仿真的大型体育场馆性能化安全疏散设计研究

针对花生四烯酸代谢网络的多靶标抑制剂设计、合成及优化

基于反射Petri网的基于服务的自适应软件系统流程一致性判定方法研究

长链非编码RNA NRON对自身免疫脑脊髓炎的调控作用机制研究

双功能离子液体纳米反应器的构筑及其催化强化CO2偶联作用机制

甘露聚糖结合凝集素对T淋巴细胞免疫功能的调节作用及其机制

可控合成单晶面Ni基双金属催化剂及其对水中联氨化合物的降解机制研究

表面纹理（texture）结构与界面摩擦的相关性及其优化研究

基于SSFP BOLD MR技术建立一种内源性对比成像无创评价心肌缺血方法的研究

15-脂氧合酶别构调控分子设计及其对花生四烯酸代谢网络的影响

基于敲减三阴性乳腺癌趋化因子受体CCR4的自封孔纳米羟基磷灰石材料的靶向治疗研究

烧结材料特性对机械密封混合润滑性能的影响

水体中抗生素与铜绿微囊藻的复合污染机制和联合毒性研究

CIP2A通过Akt调节多发性骨髓瘤地塞米松耐药的作用及机制研究

原癌基因c-Met转录调控因子的识别及其在肺癌发生中的作用机理研究

酵母细胞中鞘脂LCB调节mRNA降解机制的研究

SARS-3CL蛋白酶催化机理研究及基于二聚体界面的抑制剂设计

P、N双配体胶囊钯催化剂的可控制备及其在调聚反应中的应用研究

新基因IRAS在卵巢癌发生、发展中的作用研究

基于人类全基因组lncRNA的CRISPR筛选和RNA-seq数据的lncRNA特征分析

基于RPKI的域间源地址验证关键技术及部署优化研究

城市大气中甲醛的来源及影响臭氧生成的量化研究

基于花生四烯酸代谢网络的多靶点抑制剂设计

农村环境建设公共投资的供给机制与投资效率研究：基于经济发展水平外生的理论与实证分析

微机电系统中磨擦表面微观形貌设计与修饰研究

菊科蒲儿根属的分子系统学研究

生物材料表面结构形态与血液的界面行为、作用机理与控制

基于血清分泌组学发现肺癌及其转移的标志物

小分子对磷脂氢谷胱甘肽过氧化物酶的别构调控

Internet组播体系结构

挥发性含氧有机物在污染大气中迁移演化规律及收支量化

相似国自然基金