基于无限混合模型的大数据降维及其在信息检索中的应用

基本信息
批准号:61472304
项目类别:面上项目
资助金额:80.00
负责人:王秀美
学科分类:
依托单位:西安电子科技大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:牛振兴,宗汝,王楠楠,沈钧戈,赵林,王笛,高宪军,刘卫芳,丁利杰
关键词:
变分推理无限混合模型哈希函数隐变量结构数据降维
结项摘要

Dimensionality reduction is an effective way to solve the "curse of dimensionality". The development of the DR plays an important role in machine learning and computer vision. However, the traditional dimensionality reduction algorithms cannot satisfy the requirements of the big data. The distribution of the samples is non-Gaussian or non-uniform, and relationships between samples are much complex. In order to deal this kind of dataset more effectively, the project attempt to establish the DR model based on some basic theory, such as, the infinite mixture models, probability theory, graph theory and mathematical optimization theory. At the same time, Through making full use of Bayesian inference, the latent variable structure and variational inference, the project will build the non-parametric data dimensionality reduction model for above samples. Firstly, the DR model will be proposed based on infinite mixture model to deal with multi-modal and heterogeneous dataset. Secondly, an important requirement for processing multiple content modalities is the development of sophisticated joint models for evaluating the similarity and divergence between different modalities, and particularly important is the development of generative graphical models that can find the low-structure with respect to content in multiple modalities, then design the hashing function which can project the low-structure to the binary codes for fast retrieval. Finally, the variational approximation inference model based approach will be proposed to optimize the hyper-parameters of objective function. The research results will provide new ideas and new methods for dealing with complex dataset in data mining and recognition.

数据降维是解决"维数灾难"的有效途径,相关技术的发展对当前机器学习和计算机视觉等领域有着重要意义。然而,降维算法在处理当前大数据时,面临样本分布非高斯、非均匀以及样本之间相互依赖关联复杂等问题。为了能对大数据进行有效处理,本项目拟以无限混合模型、概率论、图论、优化等数学理论为基础,充分利用贝叶斯推理、隐变量结构、变分推理等方法,提出可以处理复杂数据的非参数降维算法:首先利用无限混合模型模拟大数据的多模态、异构分布特性,提出基于非参数贝叶斯推理的降维模型;其次,为了能对多源数据进行联合处理,实现数据的高效检索,设计了基于隐变量结构的生成式模型方法,找寻多源数据的内在结构相似性,进一步,针对找到的低维数据,进行哈希变换,生成二值编码,实现多源数据的快速检索;最后,提出了基于变分近似推理的模型推断方法,实现对非参数目标函数的优化。该研究成果将为面向大数据的挖掘和识别领域提供新思路和新方法。

项目摘要

本项目以海量高维多源数据为研究对象,为减小不同模态之间的语义鸿沟,可以将不同模态之间的关联进行建立,之后进行有效的检索,主要研究内容有:基于广义特征值分解的数据降维;基于矩阵分解的跨模态检索;基于深度学习和概率图模型的图象超分辨方法。针对以上内容,提出了一系列的解决方法,代表性成果有:判别广义特征分解的数据降维方法,一种约束传播半监督非负矩阵分解方法,非负矩阵分解和成对协同正则的多视图聚类方法;基于语义主题的多模态哈希方法,多模态判别式二值嵌入方法,基于类标一致矩阵分解的跨模态哈希检索方法;基于无限混合模型的超分辨重建方法,基于卷积神经网络的快速图像超分辨方法等。.本项目的研究成果包括:培养博士毕业生4名,在读博士生2名,硕士毕业生7名,在读硕士生8名;发表与课题相关的学术论文17篇;其中SCI检索(包括待检索)7篇;IEEE括IEEE Trans.常文(Regular Paper)论文4篇,其中国际会议论文10篇,包括CCF A类会议论文2篇;获得国家发明专利授权8项,在申请中国家发明专利3项。2016年获得陕西省自然科学奖一等奖一项。超分辨算法在2018计算机视觉与模式识别国际会议研讨会(NTIRE 2018)上获得了优胜者奖,2018欧洲计算机视觉国际会议研讨会(ECCVW 2018)上获得手机图像增强赛道B的第2名。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
3

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
4

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
5

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016

王秀美的其他基金

批准号:68675009
批准年份:1986
资助金额:2.00
项目类别:面上项目
批准号:61100158
批准年份:2011
资助金额:22.00
项目类别:青年科学基金项目

相似国自然基金

1

基于离散分析方法的谱图理论研究及其在高维数据降维中的应用

批准号:11601368
批准年份:2016
负责人:满守东
学科分类:A0204
资助金额:18.00
项目类别:青年科学基金项目
2

基于数据降维技术的多元波动率模型

批准号:70671002
批准年份:2006
负责人:王明进
学科分类:G0105
资助金额:18.00
项目类别:面上项目
3

基于概率图模型的数据降维算法研究

批准号:61100158
批准年份:2011
负责人:王秀美
学科分类:F0605
资助金额:22.00
项目类别:青年科学基金项目
4

检索引导的多模态数据稀疏化降维及哈希技术

批准号:61572298
批准年份:2015
负责人:张化祥
学科分类:F0605
资助金额:67.00
项目类别:面上项目