机器学习已经发展成为人工智能领域的一个研究热点,被广泛地应用于人工智能的各个子领域,例如数据挖掘、模式识别等。传统机器学习模型假设数据是独立同分布的。然而,在很多实际应用中,数据样本之间是有关系的,也就是说,样本之间是不独立的。例如,网页之间存在着链接关系,社交网络中的对象之间存在各种各样的关系。我们把这种样本之间存在关系的数据叫做关系数据,把基于关系数据的机器学习叫做统计关系学习。由于关系数据在不同领域不断涌现,统计关系学习已经成为一个具有重要科学意义和应用价值的研究课题。目前主流的统计关系学习模型都是静态、集中式的,不适合于对动态的海量关系数据进行处理。本项目以动态海量关系数据的智能分析为研究对象,采用隐因子模型作为基本建模工具,构建动态统计关系学习模型,设计高效的参数存储模式,实现基于云计算的超大规模分布式参数学习算法,建立一套完整的具有理论创新和实际应用的统计关系学习工具包。
本项目以动态海量关系数据的智能分析为研究对象,探索基于隐因子模型(LFMs)的统计关系学习的建模、大规模存储和计算、以及应用验证问题。本项目的实施严格按照项目申请书和计划书进行,项目组已圆满完成计划规定的研究内容,达成了预期目标。在本项目的资助下,项目组共发表(录用)论文15篇,其中中国计算机学会(CCF)推荐A类会议和期刊论文11篇,B类会议3篇;申请专利4项;出版云计算专著一部;构建了一套统计关系学习工具包。项目组在动态关系模型设计和参数学习的超大规模实现两个方面取得了若干研究成果。在动态关系模型设计方面,项目组以动态社交网络为研究对象,提出了一种以结点为中心的在线学习算法OEM,成果发表于IJCAI 2013。在参数学习的超大规模实现方面,项目组从存储和计算两方面入手,设计了一系列数据(参数)压缩和分布式数据(参数)布局策略,并提出了一系列分布式计算(学习)机制,代表性成果发表于ICML 2014, SIGIR 2014, NIPS 2014等。此外,项目组还对多关系异构网络等若干相关研究领域进行了探索,代表性成果发表于AAAI 2012、IJCAI 2013和IEEE Transactions on Knowledge and Data Engineering等。部分研究成果在淘宝等的企业级真实应用上进行了实验验证,取得了比现在工业界广泛采用的方法更好的性能。本项目研究的分布式学习是大数据机器学习的核心研究内容之一。因此,在此项目成果的基础上,项目组将进一步在大数据机器学习上进行探索。
{{i.achievement_title}}
数据更新时间:2023-05-31
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
跨社交网络用户对齐技术综述
粗颗粒土的静止土压力系数非线性分析与计算方法
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于统计关系学习的汉语指代消解研究
含有隐变量的因果结构学习与统计因果推断
基于信道信息和深度学习的隐写侦测及其博弈模型研究
基于概率统计模型的多层特征学习与推理技术研究