In the age of Social Web, short texts are prevalent on the web, such as microblogs, web videos/photos' brief, news brief, etc., which carris massive information and spreads aggresively through the internet. Recommending interesting short texts with their links using the data from user browsing behaviors, plays an important role in helping users to discover and access useful information effeciently. Nevertheless, such a recommendatoin with short texts as its objects, brings new challenges to traditional recommendatoin technologies and their basic hypotheses, which attracts more and more attentions from both academics and industry. Based on the scenarios of topical recommendation on microblog, and browsing recommendation on user's browsing history, the proposal considers those challenges of extremely short content, realtime streaming data, multple dependent feathures, and proposed three key research topics to tackle those challenges. Those research topics include modeling on extremely sparse and high dimentional data, on-line clustering realtime streaming data, and recommendation on the data with multiple dependent features. The purpose of the proposal aims at solving those basic problems and challenges from recommedation short text considering browsing behaviors, which help improve the current recommendation technologies, and make it widely used and produce the best possible results on the social web.
在社会化网络时代,承载着丰富信息的短文本数据被大量地产生出来,并在互联网络上迅速传播。根据用户浏览行为产生的数据,推荐用户感兴趣的短文本信息及其链接,成为帮助用户及时发现和有效地获取各种网络媒体信息的重要手段。这种以网络短文本数据为主要内容的推荐,给传统的推荐技术及其所依赖的基本假设都带来了新的挑战,并逐渐引起工业界和学术界的广泛关注。本课题的研究针对短文本篇幅短包含的内容极少、流式和时效性短、以及特征的非独立性等挑战,以微博话题的动态推荐和基于用户浏览历史的网页浏览推荐为基本应用场景,将内容特征极稀疏的高维数据建模、流式短文本数据的在线话题聚类、非独立多特征数据的推荐模型等作为课题主要的研究内容,来解决上述问题。本课题的研究旨在帮助解决,利用用户浏览行为的数据进行网络短文本推荐所面临的基本问题,进一步完善推荐技术,推动推荐系统在社会化互联网中更广泛和有效的应用。
社会化网络的时代,承载着丰富信息的短文本数据大量地产生出来,并在互联网络上迅速地传播。微博、视频、音乐、图片、新闻、评论等各种网络媒体,在信息的传播方面有着千丝万缕的联系。根据用户浏览行为产生的数据,推荐用户感兴趣的短文本信息及其链接,成为帮助用户发现和有效获取各种网络媒体信息的重要手段。这种以网络短文本数据为主要内容的推荐,给传统的推荐技术及其所依赖的基本假设都带来了新的挑战,并逐渐引起工业界和学术界的广泛关注。本项目的主要研究内容和重要成果如下:. 1)针对短文本内容稀疏、时效短、动态演化的特征,在话题模型和相似度度量的研究内容上面,提出语义概念关联学习和扩展、基于词项关联矩阵分解的话题模型、词项共现关系的概率模型BTM学习话题,以及在线学习模型oBTM和增量计算框架iBTM来建模动态演化的话题。. 2)推荐条目的观点、用户喜好,以及未来可能的流行趋势、影响力等因素在推荐质量的提高上发挥着重要的作用。因此,项目针对话题的多样性,及情感分类效果与目标话题的依赖问题,提出话题自适应的情感分类模型TASC,通过半监督的方式自适应话题相关情感词、用户层、社会网络等特征;以及考虑用户和物品信息的有监督情感分类模型SUIT。在影响力方面,提出用户影响力和易感性的传播模型LIS,以及基于自洽排序的影响力最大化方法,来有效判断推荐条目的流行趋势。. 3)最终,在短文本的推荐和排序方面,项目针对标注数据不足、多属性、上下文缺失等问题,提出基于传递闭包的半监督序对排序模型,避免了未标注数据选择时的序对冲突,有效提高半监督排序效果;考虑上下文的有监督流形排序;多属性排序的融合学习;以及基于用户浏览日志的上下文相关新闻推荐方法。. 项目执行过程中的以上成果,从基础的短文本话题模型、语义概念关联学习,来有效度量推荐内容的相似性;提取和估计推荐条目的观点、流行趋势、以及用户个性化喜好等属性特征;最终,利用半监督、多属性融合、上下文相关性对已有推荐技术进行完善,推动了推荐系统在社会化互联网中的广泛有效使用。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
拥堵路网交通流均衡分配模型
卫生系统韧性研究概况及其展望
面向云工作流安全的任务调度方法
天津市农民工职业性肌肉骨骼疾患的患病及影响因素分析
面向最优时间窗推荐的网络用户行为轨迹预测研究
考虑心理因素的用户在线行为预测及其在推荐系统中的应用研究
考虑用户网络结构与行为的平台企业定价策略研究
考虑用户偏好转移的基于动态贝叶斯网络和深度学习的动态推荐方法的研究