流特征下动态、联合搜索策略研究

基本信息
批准号:61773215
项目类别:面上项目
资助金额:57.00
负责人:严慧
学科分类:
依托单位:南京理工大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:於东军,钱建军,许春燕,李翔,郑玮,耿渊哲,吴中华
关键词:
特征评价特征搜索冗余特征稀疏性
结项摘要

As new services such as cloud computing and social network are emerging, data type and scale are growing at amazing speed. Big data is drawing more and more attention, and meanwhile brings crucial challenges for traditional pattern recognition methods. Streaming feature, as one of dynamic data patterns, is one of the five challenging data types for traditional feature selection technology in big data. Previous streaming feature search strategies are based on heuristic approach, and they are achieved in a simple and fast way at the cost of recognition accuracy. This project studies data and model in dynamical feature space, takes online joint feature search as target scientific problems, and explores a stable and efficient online search solution. The research contents of this project include studying: (1)search strategy for streaming features based on structural sparsity regularized model; (2)search strategy for streaming features based on adaptive substitute; (3)online joint relativity and redundancy analysis algorithm; (4)deep learning model compression algorithm based on adaptive and joint search strategy as extensive application. This project has significant importance to the extension of traditional theory and algorithm of feature selection, and promises practical application value and wide application prospect in the field of gene expression data analysis, information retrieval, model compression, and so on.

云计算、社交网络等新兴服务使数据种类和规模正以前所未有的速度增长,大数据概念受到越来越多的关注,也给传统的模式识别方法带来了巨大的挑战。其中,作为动态数据表现形态之一的流特征就是大数据挑战传统特征选择技术的五大数据类型之一。以往的流特征搜索策略往往基于启发式,以识别精度为代价换取简单快速的搜索策略实现。本项目以动态特征空间中的数据和模型为研究对象,以在线联合特征搜索方式为科学问题,探索稳定、高效的在线特征搜索路径。本项目研究内容包括:(1)基于结构稀疏正则化模型的流特征搜索策略研究;(2)基于动态替换算法的流特征搜索策略研究;(3)在线同步相关性、冗余性分析算法研究;(4)作为扩展应用,研究基于动态、联合特征搜索策略的深度学习模型压缩算法。本项目对拓展传统特征搜索理论和算法有十分重要的意义,且在基因表达数据分析、信息检索、模型压缩等领域都有重要的应用价值和广泛的应用前景。

项目摘要

本项目以动态特征空间中的数据和模型为研究对象,以在线联合特征搜索方式为科学问题,探索稳定、高效的在线特征搜索路径。取得的主要学术成果包括:(1)提出了基于一个大小固定的缓冲池的在线流特征选择算法。传统的流特征选择算法一旦认定特征是冗余的,则会剔除该特征,忽略了在流特征背景下该冗余特征可能对后续任务性能提升起作用。为此,我们通过缓冲池动态地保留和恢复特征来处理变化的特征空间,并结合了两种不同类型的特征选择器以提高预测表现的同时压缩特征空间。最终,该算法在 12 个典型的特征选择数据集上与现有流特征选择对比,获得了更加优异的分类精度和空间压缩率。(2)提出了一个结合特征选择和自表示的框架,强调对于损失项的l2,1范数最小化以及对于自表示系数矩阵的块对角正则化。我们还进一步扩展了单视图表示学习模型,将其应用于存在误差的多视图学习,称之为鲁棒多视图子空间聚类。具体来说,该算法从不同视图的数据中学习一致图,该一致图由块对角自表示矩阵编码且具有恰好 k 个连通分量(k 是集群的数量)。除此之外,我们强调对于损失函数的 L2,1 范数最小化以减少冗余特征和不相关的特征,并隐式地为每个视图分配自适应权重,而无需引入其他参数。最后,推导了一种交替优化算法来求解非凸的目标函数。最后,提出了基于增广拉格朗日乘子的优化算法。大量的实验证明了所提出的方法与几种最先进的聚类方法相比的有效性和竞争力。(3)提出了一种基于低维稀疏子空间学习的指标矩阵的新方法。从稀疏子空间学习的角度,我们将非监督特征选择问题等价于矩阵分解问题,学习到的特征权重不仅去除了冗余特征,而且捕捉到了潜在低维结构。同时,为了增强模型的鲁棒性,增加了l1范式误差项,用于抵制噪声点。此外,还证明了该方法的收敛性。大量的实验表明基于非负稀疏子空间学习的无监督特征选择比现有的一些算法更有效。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

DOI:10.7606/j.issn.1000-7601.2022.03.25
发表时间:2022
4

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
5

针灸治疗胃食管反流病的研究进展

针灸治疗胃食管反流病的研究进展

DOI:
发表时间:2022

严慧的其他基金

批准号:81302614
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:61202134
批准年份:2012
资助金额:24.00
项目类别:青年科学基金项目

相似国自然基金

1

特征选择中的全局最优搜索策略研究

批准号:61202134
批准年份:2012
负责人:严慧
学科分类:F0605
资助金额:24.00
项目类别:青年科学基金项目
2

基于增强邻域搜索策略的联合型生产调度问题算法研究

批准号:61473141
批准年份:2014
负责人:张瑞
学科分类:F0302
资助金额:76.00
项目类别:面上项目
3

网格环境下空间信息索引机制与搜索策略研究

批准号:40771165
批准年份:2007
负责人:谢忠
学科分类:D0114
资助金额:37.00
项目类别:面上项目
4

面向高动态环境的强化学习策略搜索理论与方法研究

批准号:61876077
批准年份:2018
负责人:俞扬
学科分类:F0603
资助金额:64.00
项目类别:面上项目