以用户为中心的电子商务大数据偏好查询处理与优化

基本信息
批准号:61502215
项目类别:青年科学基金项目
资助金额:20.00
负责人:丁琳琳
学科分类:
依托单位:辽宁大学
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:宋宝燕,宣伟宏,刘宇,刘思平,刘爱丽,纪婉婷,杜柏松,李正道,王鑫
关键词:
大数据管理查询处理与优化分布式存储
结项摘要

With the rapid development of computer information techniques, the E-Commerce has been welcomed by people for the characteristics of convenient, fast, economy and so on. The amount of E-Commerce data increases sharply, such as the products descriptions data and the user reviews data. The characteristics of E-Commerce big data are isomerism, high-dimensionality, high relevancy and quick updating, which lead the traditional techniques of data storage and query processing cannot satisfy the practical application requirements of E-Commerce big data. How to provide the search with the user requirements has become the urgent problem. This project researches the preference query processing and optimization problem of E-Commerce big data combining the query input and the preference features of users. The important research problems are the query semantics of combining the query input and the preference features of users, data storage with isomerism and high-dimensionality, the distributed preference query processing and optimization for user-centered design. A original system of preference query processing for user-centered design will be designed in this project to verify the correctness and efficiency of the research results. The results will offer efficient theoretical supporting and solutions for preference query processing applications of E-commerce big data, which have important theoretical research significance and practical application value.

伴随着计算机信息技术的快速发展,电子商务以其方便、快捷、经济等优点迅速得到了人们的青睐,积累了大量的诸如商品描述、用户评论等电子商务大数据。电子商务大数据的异构性、高维性、相关度高和快速更新等特性导致传统的数据存储和查询处理技术无法满足电子商务大数据查询处理应用的实际需求,使得如何提供更加符合用户需求的商品搜索成为亟待解决的重要问题。本项目研究结合用户主观查询输入和用户客观偏好特征的以用户为中心的电子商务大数据偏好查询处理与优化问题,重点研究结合用户主观输入和用户客观偏好的查询语义、统筹原始数据异构性和特征向量高维性的数据存储、以用户为中心的分布式偏好查询处理与优化技术,并设计实现一个以用户为中心的电子商务大数据偏好查询处理与优化原型系统来验证研究成果的正确性和有效性。研究成果将为电子商务大数据偏好查询处理应用提供有力的理论支持和解决方案,具有重要的理论研究意义和实际应用价值。

项目摘要

本项目从电子商务大数据用户偏好分析、电子商务大数据分布式存储和索引、以用户为中心的分布式偏好查询处理与优化三个方面展开深入的研究工作。首先,在电子商务大数据用户偏好分析方面,主要研究了基于动态图模型的用户偏好计算方法、面向用户分组和特定用户的推荐方法、基于大规模图top-k兴趣子图或频繁子图的用户匹配方法等,实现了有效的用户偏好分析。其次,在电子商务大数据分布式存储和索引方面,研究了基于属性列聚类的行列并存高维大数据混合存储模型、基于极限学习机的模糊聚类方法、高维大数据的分布式划分和压缩方法、基于树形索引和环形拓扑相结合的高维大数据分层索引结构、高维大数据分层索引结构的更新和负载均衡方法等,实现了有效的高维大数据存储和索引。再次,在以用户为中心的分布式偏好查询处理与优化方面,研究了基于MapReduce的增广动态Skyline查询处理方法、MapReduce环境下基于用户偏好的top-k skyline 查询处理方法、MapReduce环境下面向用户偏好的top-k连接查询处理方法、基于MapReduce的向量空间约束连接路径查询方法、数据流中ρ-支配轮廓查询算法、双缀过滤的大数据相似性连接处理算法、MapReduce环境下基于扩展Bloom Filter的两表连接查询处理算法、基于k-skyband的top-k skyline查询处理方法、MapReduce环境下基于支配层次树的k支配skyline查询方法等,实现了大数据环境下的top-k查询、join查询、skyline查询等。在理论研究方面,在Neurocomputing、JLMC、IEEE ACCESS、电子学报、计算机科学与探索、小型微型计算机系统、计算机应用、计算机与数字工程、WISA、ICPCSEE、ICNC-FSKD、CCF大数据学术会议等学术期刊和会议发表相关学术论文28篇,其中,被SCI检索4篇次,EI检索12篇次;在原型系统研发方面,设计并实现了一个以用户为中心的电子商务大数据偏好查询处理与优化原型系统,对相关的理论研究成果进行验证,申请并公开中国发明专利3项。在学术交流方面,项目组成员和硕士研究生三年来共12人次参加了国内外重要的学术会议。在人才培养方面,协助培养硕士研究生9人,均已顺利毕业。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
2

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
3

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

DOI:10.3969/j.issn.1674-0858.2020.04.30
发表时间:2020
4

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019
5

基于混合优化方法的大口径主镜设计

基于混合优化方法的大口径主镜设计

DOI:10.3788/AOS202040.2212001
发表时间:2020

丁琳琳的其他基金

相似国自然基金

1

以数据为中心的无线传感器网络查询处理与查询优化技术研究

批准号:60503036
批准年份:2005
负责人:杨晓春
学科分类:F0202
资助金额:21.00
项目类别:青年科学基金项目
2

以用户体验为中心的移动通信网络性能优化关键技术研究

批准号:61572324
批准年份:2015
负责人:薛广涛
学科分类:F0207
资助金额:66.00
项目类别:面上项目
3

能量有效数据库系统的查询处理与优化

批准号:61070042
批准年份:2010
负责人:杨良怀
学科分类:F0202
资助金额:32.00
项目类别:面上项目
4

面向感知大数据的不确定查询处理与优化技术

批准号:61472069
批准年份:2014
负责人:信俊昌
学科分类:F0202
资助金额:83.00
项目类别:面上项目