Big data machine learning (BDML) is one of the core problems in big data research. By representing the data with binary codes, Learning to Hash (LH) can dramatically reduce the cost for storage and communication, which can greatly improve the efficiency of the BDML systems. Hence, learning to hash has become a very hot research topic in machine learning and BDML,with wide application in data mining, pattern recognition, and information retrieval and so on. Based on the pre-study conducted in the lab of the applier, this project tries to focus on the essential problems underlying LH.The key aspects pursued by this project include model building, parameter optimization and learning, quatization strategy, and performance evaluation. The goal of this project is to build a toolbox with both theoretical and practical contributions for LH. The expected outcomes include high-quality papers on top international journals and conferences, and patent application.
大数据学习已经成为大数据研究的核心问题之一,而哈希学习通过将数据表示成二进制码的形式,能大大减少数据的存储和通信开销,从而大大提高大数据学习系统的效率。因此,哈希学习于近几年迅速发展成为机器学习领域和大数据学习领域的一个研究热点,并被广泛应用于数据挖掘、模式识别、信息检索等领域。本项目通过对已有哈希学习方法的详细调研,在申请人课题组近几年的预研和初步探索基础上,从哈希学习的本质问题入手,重点研究哈希学习的模型构建、参数优化、量化方法以及性能评估等方面的内容,突破理论和计算等关键技术,构建一套既具有理论创新又具有实际应用价值的哈希学习工具包,发表高水平学术论文,并产生具有自主知识产权的专利技术,为我国在哈希学习和大数据学习领域的发展提供技术储备,并带动相关应用领域的发展。
本项目从哈希学习的本质问题入手,重点研究哈希学习的模型构建、量化方法、参数优化以及性能评估等方面的内容。本项目的实施严格按照项目申请书和计划书进行,项目组已圆满完成计划规定的研究内容,达成了预期目标。在本项目的资助下,项目组共发表(录用)论文14篇,其中中国计算机学会(CCF)推荐A类会议和期刊论文13篇;申请专利3项;构建了一套哈希学习工具包。项目组在深度哈希学习和离散哈希学习等方面取得了若干研究成果。在深度哈希学习方面,项目组将深度学习的自动特征学习和量化(哈希编码)过程集成到统一框架,并应用于监督哈希、半监督哈希和多模态哈希等场景,成果发表于IJCAI 2016,IJCAI 2017,CVPR 2017等。在离散哈希学习方面,项目组提出了一系列直接学习离散哈希编码的参数优化策略,并应用于单模态哈希和多模态哈希等场景,成果发表于AAAI 2016,TIP 2018,TIP 2019等。本项目研究的哈希学习是大数据机器学习的核心研究内容之一。因此,在此项目成果的基础上,项目组将进一步在大数据机器学习上进行探索。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于SSVEP 直接脑控机器人方向和速度研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察
面向复杂结构数据的哈希方法研究及其应用
面向大数据的机器学习理论与方法
面向认知的多源数据学习理论与算法
面向网络大数据的跨媒体哈希检索研究