粗糙集中带约束的特征选择高效算法研究

基本信息
批准号:61572406
项目类别:面上项目
资助金额:63.00
负责人:陈红梅
学科分类:
依托单位:西南交通大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:刘盾,张钧波,罗川,胡节,陈华,易修文,张迎迎,蔡勇,刘东君
关键词:
粗糙集决策信息系统特征选择规则发现
结项摘要

With the high speed development and application of the information science, the complexity in the data increases. Not only multi-mode data coexist in the different kinds of applications, but also the uncertainties in data increase rapidly. How to carry out feature selection from complex data in order to improve the precision of classification and decrease the complexity of computation is a problem to be solved, which will better support decision making. Rough set theory can extract features from data effectively and delete redundant features. However, there is a few work for feature selection with constraints in the rough set theory under the complex data environment. In this project, we focus on further studying algorithms for feature selection in the complex data when decision classes distribution is unbalanced, decision attributes values are missing, data volume is big and nonlinear, which aim to improve the precision of the classification. The main contents include: 1. Studying algorithms of feature selection for unbalanced data in rough sets. 2. Studying algorithms of feature selection while decision attributes values in data are incomplete in rough sets. 3. Studying algorithms of parallel feature selection and approximate feature selection in the big data based on Boosting in rough sets. 4. Studying algorithms of feature selection in the nonlinear data based on multi-kernel learning in rough sets. It has important practical significance to solve these problems, which may help to promote the development of rough set theory, improve the ability of solving problems in the complex data and enhance the efficiency of knowledge discovery.

信息科学的高速发展和应用,数据更加复杂,不仅多模态的数据共存于不同应用中,而且数据的不确定性也急剧增加。如何从复杂数据中进行特征选择以有效提高分类精度并降低计算复杂度,更好支持决策是一个亟待解决的问题。粗糙集能有效地从数据中提取特征,删除冗余的属性,但针对复杂数据的带约束的特征选择算法研究在粗糙集中尚未有效展开。本项目针对复杂数据中决策分布不平衡、决策属性值缺失、数据量大和数据非线性等情况研究基于粗糙集的带约束特征选择高效算法,以提高分类的精度。具体内容包括:1. 粗糙集中非平衡数据特征选择算法研究;2. 粗糙集中决策属性值不完备数据特征选择算法研究;3. 粗糙集中基于Boosting的大数据并行特征选择和近似特征选择算法研究;4. 粗糙集中基于多核学习的非线性数据特征选择算法研究。这些问题的解决,对于推动粗糙集理论的发展,提高其解决复杂数据问题的能力和知识发现的效率有着重要的现实意义。

项目摘要

在数据分布复杂、不确定性攀升的大数据时代,选择有效的特征构建泛化能力强的学习模型降低计算复杂度是当前大数据处理中一个亟需解决的重要问题。本项目以粗糙集理论为主要工具,研究不同约束条件下的特征选择方法。主要取得了以下成果:(1)针对非平衡数据,给出了采用核映射、量子算法、提升学习等从算法层面和数据层面分析处理的多种方法,提出了多分类和二分类问题的非平衡数据特征选择算法;(2)针对不完备信息系统分析了不确定性度量相关动态演化机理。针对决策属性值不完备信息系统,在邻域粗糙集中提出了基于邻域熵的对称不确定性度量的特征选择方法。(3)针对大数据的特征选择,提出了互信息和邻域熵的快速近似计算方法,给出了不同情况下基于数据分治融合机理的并行特征选择算法。(4)针对数据的非线性分布,考虑不确定性决策和有效样本等因素,构建了不同的核粗糙集模型,分析了多核融合原理,提出了相应的特征选择算法。本项目共发表/录用论文60篇,其中国际期刊论文32篇,国际会议论文11篇,国内核心期刊论文17篇;论文已被SCI检索30篇(2篇待检索)、EI检索34篇、ESI高被引论文1篇;出版专著2部;申请专利6项;开发了包含非平衡特征选择、半监督特征选择、多核特征选择等算法的软件系统一套;国际会议大会特邀报告1次、国内会议特邀报告2次;承办数据挖掘相关暑期学校两次,承办国内会议1次;培养了多名研究生,获国际、国内学术会议优秀论文奖、ACM成都优秀博士论文奖各2次,IEEE和四川省计算机学会优秀学生论文奖各1次。这些成果有效地扩展了粗糙集理论的应用,为复杂不确定性数据的特征选择提供了理论分析方法与技术路线。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
2

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

DOI:10.3864/j.issn.0578-1752.2019.03.004
发表时间:2019
3

空气电晕放电发展过程的特征发射光谱分析与放电识别

空气电晕放电发展过程的特征发射光谱分析与放电识别

DOI:10.3964/j.issn.1000-0593(2022)09-2956-07
发表时间:2022
4

人工智能技术在矿工不安全行为识别中的融合应用

人工智能技术在矿工不安全行为识别中的融合应用

DOI:10.16265/j.cnki.issn1003-3033.2019.01.002
发表时间:2019
5

面向工件表面缺陷的无监督域适应方法

面向工件表面缺陷的无监督域适应方法

DOI:
发表时间:2021

陈红梅的其他基金

批准号:21806114
批准年份:2018
资助金额:20.00
项目类别:青年科学基金项目
批准号:81704058
批准年份:2017
资助金额:20.00
项目类别:青年科学基金项目
批准号:61100117
批准年份:2011
资助金额:21.00
项目类别:青年科学基金项目
批准号:61662086
批准年份:2016
资助金额:40.00
项目类别:地区科学基金项目

相似国自然基金

1

面向大数据的半监督粗糙特征选择高效算法研究

批准号:61402272
批准年份:2014
负责人:王锋
学科分类:F0607
资助金额:26.00
项目类别:青年科学基金项目
2

面向多模态数据的粗糙集特征选择及其增量算法研究

批准号:61806108
批准年份:2018
负责人:杨燕燕
学科分类:F0601
资助金额:17.00
项目类别:青年科学基金项目
3

面向复杂数据的动态决策粗糙集及其高效特征选择方法研究

批准号:61602327
批准年份:2016
负责人:罗川
学科分类:F0607
资助金额:21.00
项目类别:青年科学基金项目
4

无穷粗糙曲面反散射问题的高效算法研究

批准号:11501558
批准年份:2015
负责人:张海文
学科分类:A0505
资助金额:18.00
项目类别:青年科学基金项目