面向多视角多标签数据的支持张量机分类算法研究

基本信息
批准号:61472089
项目类别:面上项目
资助金额:86.00
负责人:郝志峰
学科分类:
依托单位:广东工业大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:温雯,刘伟,袁淦钊,何丽芳,谢锐,陈舜华,黄宇鹏
关键词:
特征选择与分类器融合张量核方法多视觉多标签数据支持向量机
结项摘要

With the expansion and deepening of the application of classification analysis, the problem of multi-view multi-label classification has become a critical and challenging topic of current research in many scientific disciplines, such as pattern recognition, data mining, image processing, information retrieval and bioinformatics. In this proposal, we will focus on the systematic development of theory, methods and their applications for solving multi-view multi-label classification problems based on statistical learning theory, tensor analysis techniques, multi-label learning methods, kernel methods and support vector machine (SVM) algorithms. More specifically, (1) propose a series of support tensor machine models by interconnecting feature selection with the multi-label classifier design, (2) establish performance evaluation criteria to evaluate the performance of obtained classifier models, (3) design the online incremental learning algorithms suitable for large-scale analysis, (4) put forward new kernels in the tensor product space and explore multiple kernel learning scheme associated with adaptive structural changes, (5) study label correcting algorithms under multiple veiws to improve the qualityof labels, and evaluate our approaches on public data, and further adjust and enhance our models based on the specific applications. This proposal could benefit to explore and develop the study of design and analysis of algorithms for multi-view multi-label classification,while leading to some novel techniques and fundamental theoretical basis for their applications in various fields, and providing a new theoretical perspective for SVM-based machine learning algorithms.

面向多视角多标签数据的分类问题是目前模式识别、数据挖掘、图像处理、信息检索和生物信息学等领域广泛关注和研究的重点和难点课题。本项目拟利用统计学习理论、张量学习理论、多标签学习方法、核方法以及支持向量机算法模型,从理论、技术、应用三个层面,系统地开展面向多视角多标签数据的分类算法研究。提出基于特征选择与多标签分类器设计融合的支持张量机模型;给出相应的分类器性能评估准则;设计适用于大规模数据场景的在线增量学习算法;针对张量空间构造新的核函数,并探索结构自适应的多核学习方法;研究多视角下的标签修正算法,提高标签的质量。同时根据具体的应用需求进一步扩展和增强这些算法模型,并在国际公开的测试集数据上进行评测。这些研究将探索和发展新的多视角多标签分类算法的设计与分析的研究,并为其在相关领域的应用奠定理论基础和技术支撑,为研究以支持向量机为代表的的机器学习算法开拓新的理论视角。

项目摘要

各类现实数据,包括文本、图像、视频等数据,其基本表示方式都可以抽象为多视角张量数据。目前对这类数据的智能分析技术尚不完善,尤其在(1)如何融合多视角特征获得更好的挖掘、识别效果;(2)如何优化现有学习方法的时间和空间复杂度, 这两方面还存在重要的技术瓶颈。倘若能突破多视角张量表达和学习的相关基础科学难点,有望提升智能系统的识别精度和速度,对于涉及该项技术的各类需求,具有重要的现实意义。课题组在本基金支持下,按计划稳步进行了相关研究,重点研究和探索突破以下关键科学难点:(1)研究了包括时间、空间、网络信息的数据张量化表达和学习,突破学习模型构建的难点;(2)研究了大规模数据情境下的张量机学习算法的训练时间优化问题,以流数据为例,解决张量分类器在线学习算法的训练时间过长的问题。取得了以下重要进展:提出了一种基于张量的多源缺失数据聚类方法(T-MIC),采用核矩阵获得多源张量的统一表达,在此基础上采用张量分解的方法填充了缺失数据,突破了多源缺失数据的融合聚类的难点;提出了一种保持时空信息的张量核,得到一种时空张量分类算法(STTK),给出了时空多视角数据张量表达和学习的一种新思路;提出了LCD-SVM算法,该方法基于决策树模型,将数据空间进行分解,并在分解后的数据空间中对支持张量机分别进行训练,克服了大规模数据的学习速度的瓶颈;同时项目组还探索了所提出的模型及算法在各类现实任务上的应用。在成果指标方面,发表SCI期刊论文17篇,其中SCI一区和二区期刊论文12篇;发表国际会议论文12篇,其中CCF A类会议论文4篇;发表国内一级学报期刊论文2篇;申请发明专利共10项。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

路基土水分传感器室内标定方法与影响因素分析

路基土水分传感器室内标定方法与影响因素分析

DOI:10.14188/j.1671-8844.2019-03-007
发表时间:2019
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019

郝志峰的其他基金

批准号:21101032
批准年份:2011
资助金额:23.00
项目类别:青年科学基金项目
批准号:61070033
批准年份:2010
资助金额:33.00
项目类别:面上项目
批准号:19901009
批准年份:1999
资助金额:5.50
项目类别:青年科学基金项目
批准号:10471045
批准年份:2004
资助金额:10.00
项目类别:面上项目

相似国自然基金

1

面向多示例数据标注的隐变量支持向量机研究

批准号:61202269
批准年份:2012
负责人:温雯
学科分类:F0605
资助金额:23.00
项目类别:青年科学基金项目
2

面向多示例数据的分类和多序列回归算法研究

批准号:61672169
批准年份:2016
负责人:肖燕珊
学科分类:F0607
资助金额:63.00
项目类别:面上项目
3

支持张量机的稀疏优化理论与算法研究

批准号:11901343
批准年份:2019
负责人:侯秋玲
学科分类:A0405
资助金额:24.00
项目类别:青年科学基金项目
4

不确定数据分类学习的支持向量机算法研究

批准号:61105054
批准年份:2011
负责人:谢宗霞
学科分类:F0605
资助金额:23.00
项目类别:青年科学基金项目