With the popular use of mobile devices and fast development of social media sites, people have generated scalable activity trajectory data (such as a sequence of weibo message with geo location) in recent years, and such data composes not only the spatio-temporal trajectory of users, but also their behavior information, through which we can explore the contents and patterns of user activities, and finally achieve user intention oriented recommendation. The trajectory data management technologies mainly focus on the indexing, querying and matching on spatio-temporal domain, and not capable to manage trajectory data with activity descriptions efficiently, none to speak rational similarity measurement between activity trajectory and user intentions imbedded in queries. ..This project aims to investigate the data management mechanism of scalable activity trajectories. The probabilistic topic modeling approaches are expected to be used for making sense of trajectory to dig out the content and topic of user behavior in trajectory. Data mining techniques can be used to find out topic based mobility patterns. Based on the patterns, we can design elegant data model, indexes and query optimization mechanisms for activity trajectory data. Then similarity functions are designed to recommend the trajectory that can cover POIs that can meet user's intention. We will construct a prototype system and use real data to evaluate the performance of it.
随着智能终端的普及应用和社交媒体网站的发展,近年来产生了海量的行为轨迹数据(如一系列有位置信息的微博),它们既含有真实的时空轨迹信息,还蕴含丰富的用户行为信息,使得我们可以理解活动行为的具体内容和泛在规律,实现基于用户意图的精准推荐。而现有轨迹数据研究主要集中在时空维度的索引、查询与匹配,不能支持时空、文本相结合数据的有效存取,更不用说活动轨迹与用户意图的相似度度量和轨迹推荐。..本项目研究适用于海量行为轨迹数据管理的方法,首先通过主题概率模型来理解轨迹中的行为内容与主题,挖掘泛在的主体关联模式和移动模式,并在此基础上设计模式敏感的活动轨迹数据模型、索引策略和查询优化方法,采用分层概率化的方法提升数据存取性能,然后进一步结合用户意图进行活动轨迹的相关性度量,并根据实时路况进行线路适配,最终实现高性能、高精度的行程推荐,并对理论方法通过原型系统与真实数据进行验证。
用户行为轨迹的分析与挖掘是个性化、精准化LBS服务的重要技术。本项目以信息"金字塔"模型为指导,针对行为轨迹处理技术开展了系统化的研究。针对大规模的行为轨迹原始数据,我们首先开展了面向轨迹数据理解的预处理框架和系统,提出了基于深度学习和主题概率模型的轨迹行为文本内容理解方法,通过具有高表征能力的隐空间语义特征向量来表示用户行为。在轨迹数据预处理方面,我们设计了一种基于深度学习的轨迹行为理解方法和深度度量学习模型,实现在语义隐空间对数据的准确表示和相似性评估。在数据存储管理方面,我们设计了一种能够融合空间、行为语义、轨迹序列等信息的层次化索引结构,避免了高维向量表示遇到的“高维诅咒”及其导致的索引死区过大问题,因而实现高效的查询剪枝和数据检索性能,对比现有方法降低I/O近35%、CPU代价近20%。在轨迹知识挖掘方面,我们研究了行为轨迹大数据的挖掘与推荐技术,包括基于查询意图理解的个性化轨迹搜索与推荐方法、面向多目标查询语义的POI搜索算法、轨迹大数据驱动的时空模式发现、评估与异常轨迹识别算法等问题。由于对用户活动意图的理解是高质量LBS服务推荐所面临的重要瓶颈,我们的研究成果将使得系统能够更好地认知规律并理解用户,保证推荐算法的科学性和有效性。同时这样一个框架融合了时空数据库、自然语言理解、机器学习,是对现有轨迹数据管理技术的突破。..依托本项目的开展,团队一共发表了CCF A/B类相关论文20篇,其中期刊论文8篇、会议论文12篇,另获CCF C类国际会议最佳论文1次、CCF C类国际会议最佳学生论文奖1次;申请专利5项并授权1项、获得软件著作权8项;培养博士生1人、硕士生9人,其中已毕业5人;主办CCF B类国际会议1次,邀请相关领域国际学者多人交流访问。除原定计划,我们还针对本领域相关的一些研究热点展开了调研,包括基于行为轨迹数据的用户画像、用户行为的信息抽取与知识表示、基于用户行为知识图谱的模式匹配查询等技术,取得了理想的研究成果,为后续研究指明了方向。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
硬件木马:关键问题研究进展及新动向
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
动物响应亚磁场的生化和分子机制
多空间交互协同过滤推荐
面向最优时间窗推荐的网络用户行为轨迹预测研究
用户搜索意图理解、表示与匹配
面向搜索引擎的用户个性化查询意图分析
基于用户搜索意图理解的在线社交网络跨媒体精准搜索与挖掘研究