大数据环境下个性化服务推荐实时性提升方法研究

基本信息
批准号:61702181
项目类别:青年科学基金项目
资助金额:20.00
负责人:胡蓉
学科分类:
依托单位:湖南科技大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:姜磊,彭珍连,肖小聪,毛宜钰,陈婷,肖巧翔
关键词:
服务推荐实时性个性化大数据并行计算
结项摘要

In Internet and big data environment, a benign ecological tendency that supplies by massive services and instant requirement by large amount of users coexist has gradually appeared. As personalized service recommendation can match between services’ supplies and users’ requirements precisely and effectively, it has been receiving a considerable attention. However, the problem of real-time of the personalized service recommendation has seriously affected the satisfaction of users and the expansion rate of the service applications. In view of this issue, techniques of data mining and big data processing are to be applied to decrease the data size and parallelize the computing process for accelerating the real-time of personalized service recommendation approach. Concretely, first, a topic model is to be used to mine service features. Services will be clustered base on the feature similarity between services. And only the services which belong to the cluster that the target service belongs to are reserved. Second, Logistic model is to be used to compute a user’s interesting in a service. Users will be clustered according to the interest similarity. And only the users who belong to the cluster that the active user belongs to are reserved. Third, Bayes model is to be used to choose the effective contexts which are related to the recommendation target. These contexts will be generalized. And the users whose contexts are inconsistent with the active user will be filtered. At last, a parallel collaborative filtering algorithm is adopted to recommend service efficiently and rapidly based on filtered services and users.

在互联网与大数据环境下,已呈现出一个海量服务供给与大规模用户即时服务需求共存的良性生态。个性化服务推荐因可实现精准、高效的服务供给与需求的匹配而倍受关注,但推荐的实时性问题严重影响用户的满意度,制约服务应用的扩张速度。针对该问题,本项目拟结合数据挖掘技术和大数据处理技术,从减少需实时处理的数据量和并行化计算过程入手,研究个性化服务推荐实时性的提升方法。具体而言,首先采用主题模型从服务描述中挖掘服务特征,并根据服务特征相似度进行服务聚类,仅保留与目标服务同属一簇的服务;其次,采用逻辑斯蒂模型基于服务记录计算用户对服务的兴趣度,并根据兴趣相似度进行用户聚类,仅保留与活动用户同属一簇的用户。同时,采用贝叶斯模型选择与推荐目标有相关的有效上下文,并将之泛化为一般性概念,过滤与活动用户的上下文不一致的用户。最后,基于过滤后的服务和用户,采用并行协同过滤算法实现高效、快速的个性化服务推荐。

项目摘要

大数据环境下,用户及服务特征数据呈现体量大、增长快、多源异构、高维等特征,服务推荐的实时性问题已成为服务应用的瓶颈。针对该问题,本项目一方面,采用聚类和分类技术将服务划分为类,仅在与用户需求相关的一个或若干个类中进行推荐计算,减少需实时处理的数据量;另一方面采用并行技术和加速技术加快实时推荐计算速度,提升个性化服务推荐的实时性。主要包括:1)针对服务描述文本较短,导致主题模型训练不足的问题,提出利用Wikipedia语料库增强服务描述表达能力,实现了基于HDP主题模型和SOM神经网络的服务聚类方法;2)针对外部语料库可能引入不相关主题的问题,提出利用与组合服务主题相关的组件服务描述扩充组合服务描述,实现了基于多描述主题的服务聚类方法;3)针对服务描述所用词汇表差异可能导致语义不一致等问题,提出利用网络嵌入模型从服务关系网络中学习服务的低维向量表达,实现了关系网络增强的服务聚类方法;4)针对现有服务分类技术忽略了服务描述文本内部词与服务描述文本之间隐含的网络结构信息等问题,提出根据服务描述文档之间的词共现和词关系,构建“词&服务描述文档”异构图网络,实现了基于图卷积神经网络的服务分类方法;5)针对现有的文本表示方法没有考虑不同的词对分类的贡献不同和特征词与上下文信息之间的语序等问题,提出增强话题注意机制的分类方法;6)针对短文本建模的稀疏问题,提出利用广域学习模型对服务类别的广度进行预测,利用神经网络模型挖掘服务描述文档中单词的词序和上下文信息,实现了基于Wide和Bi-LSTM模型的服务分类方法;7)针对协同过滤算法的运行效率随用户和项目规模的增大而降低的问题,提出利用非负矩阵分解进行数据降维和特征提取的优势以及多核并行计算模式,进行维数简化和用户的相似性计算,实现了基于GPU的非负矩阵分解的并行协同过滤方法。在真实开放的数据集评估以上方法,实验结果表明,所提方法改进了服务分类、聚类的准确性以及推荐的实时计算效率。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
4

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

DOI:10.7606/j.issn.1000-7601.2022.03.25
发表时间:2022
5

针灸治疗胃食管反流病的研究进展

针灸治疗胃食管反流病的研究进展

DOI:
发表时间:2022

胡蓉的其他基金

批准号:51701097
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:21605130
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:81500778
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目
批准号:60940037
批准年份:2009
资助金额:4.00
项目类别:专项基金项目
批准号:81301655
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:81260109
批准年份:2012
资助金额:49.00
项目类别:地区科学基金项目
批准号:81860493
批准年份:2018
资助金额:34.80
项目类别:地区科学基金项目
批准号:81660288
批准年份:2016
资助金额:37.00
项目类别:地区科学基金项目
批准号:81100438
批准年份:2011
资助金额:23.00
项目类别:青年科学基金项目
批准号:81660257
批准年份:2016
资助金额:37.00
项目类别:地区科学基金项目
批准号:21864026
批准年份:2018
资助金额:41.00
项目类别:地区科学基金项目
批准号:81571460
批准年份:2015
资助金额:55.00
项目类别:面上项目
批准号:21907034
批准年份:2019
资助金额:23.00
项目类别:青年科学基金项目
批准号:81660033
批准年份:2016
资助金额:37.00
项目类别:地区科学基金项目

相似国自然基金

1

不确定环境下大数据驱动的个性化医生推荐研究

批准号:71871229
批准年份:2018
负责人:胡军华
学科分类:G0110
资助金额:48.00
项目类别:面上项目
2

移动互联环境下的精细化服务推荐方法研究

批准号:61602126
批准年份:2016
负责人:马友
学科分类:F0207
资助金额:20.00
项目类别:青年科学基金项目
3

大数据下机场旅客动态服务需求捕捉与个性化服务推荐关键技术

批准号:U1533104
批准年份:2015
负责人:张宇翔
学科分类:F01
资助金额:32.00
项目类别:联合基金项目
4

移动互联网环境下多源大数据驱动的个性化推荐效果研究

批准号:71702208
批准年份:2017
负责人:姚凯
学科分类:G0207
资助金额:18.00
项目类别:青年科学基金项目