类噪声环境下特征选择算法研究

基本信息
批准号:61100081
项目类别:青年科学基金项目
资助金额:23.00
负责人:关东海
学科分类:
依托单位:哈尔滨工程大学
批准年份:2011
结题年份:2014
起止时间:2012-01-01 - 2014-12-31
项目状态: 已结题
项目参与者:杜同春,孙国振,袁翠玲,刘昱,刘星,侯祖贵
关键词:
半监督学习模糊学习监督学习特征选择类噪声
结项摘要

特征选择是重要的高维数据预处理步骤,在图像、金融、生物及医学等领域均有广泛应用。基于训练样本类别标记信息的监督学习常具有优于非监督学习的特征选择性能,但却深受训练样本类别标注准确率的影响。而在实际应用中广泛存在类噪声,即训练数据的类别标注并不完全准确,这大大降低了特征选择的精度及可靠性。已有研究尚未考虑类噪声的影响,故本项目拟原创性地展开类噪声环境下健壮的监督学习特征选择算法研究,主要内容包括:1)分析类噪声对特征选择算法性能的影响;2)分析类噪声过滤对特征选择算法性能的影响;3)结合类噪声过滤和半监督学习思想,设计显性使用噪声数据的特征选择算法;4)引入模糊学习思想,基于模糊隶属度设计隐性使用噪声数据的特征选择算法。本项目的研究成果对特征选择算法的理论发展和实际应用将起到积极的促进作用。

项目摘要

本项目展开类噪声环境下监督学习特征选择算法研究,目前,项目已按预期目标顺利完成,并取得一系列成果,主要研究成果包括:学习并分析filter类型的特征选择算法在类噪声环境下的性能,分析结果显示,在类噪声存在时,所有被研究的filter算法性能都会受到影响,并且,其性能随着类噪声比率的变大而变差,类噪声的影响在小样本集情况下尤为严重,本项目的研究成果证实了开展类噪声环境下特征选择研究的必要性;在证明类噪声对特征选择存在危害后,本项目的另一研究成果是综合分析了已有的类噪声识别算法,介绍每种算法的思想、实现方式、优缺点等,为开展类噪声检测研究打下坚实基础;在综述已有类噪声检测算法后,本研究分析了已有算法的不足,针对应用最为广泛的Majority Filtering (MF) 和Consensus Filtering(CF)算法,提出了改进。已有MF/CF算法虽然效果在同类算法中较好,但其存在的主要问题在于算法不稳定,其不稳定的主要来源是其采用的检测方式,MF/CF从原理上讲,属于单次投票方式,一次性决定样本是否为噪声,这种方式随机性较大,在某些情况下检测正确的样本,在另一环境下可能无法正确检测。因此,本项目提出了新颖的基于多次投票的类噪声检测算法,理论和实验分析显示该算法可以有效提高MF/CF的稳定性和准确性;类噪声经过检测并删除后,剩余样本的数量可能不足以进行特征选择,为了解决此问题,本项目提出了用无标计样本改进特征选择算法性能的思想。本研究基于粗糙集理论的特征选择算法,通过提出的MultiQuickReduct算法,无标记样本有效的应用到特征选择环境下,解决了监督型特征选择算法一般需要大量有标记样本的要求。本项目相关的研究成果已在英文专著Measurement,Instrumentation, and Sensors Handbook, 及Knowledge-based Systems期刊(SCI检索,影响影子3.058),Mathematical Problems in Engineering (SCI检索,影响因子1.082)等多个SCI/EI杂志中发表。依托于本项目的研究成果,申请人获得了国家自然科学基金委员会与韩国国家研究基金会2013年度联合资助合作交流项目(题目:基于生活记录的健康管理决策支持引擎研究,科学部编号:613111015)。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
2

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

DOI:10.13465/j.cnki.jvs.2020.09.026
发表时间:2020
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015
5

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

DOI:10.3864/j.issn.0578-1752.2019.03.004
发表时间:2019

关东海的其他基金

相似国自然基金

1

带类噪声的大规模张量分类算法研究

批准号:61273295
批准年份:2012
负责人:杨晓伟
学科分类:F0603
资助金额:58.00
项目类别:面上项目
2

异质空间结构与环境选择噪声下的种群分布区扩张相变研究

批准号:11575072
批准年份:2015
负责人:吴枝喜
学科分类:A2503
资助金额:58.00
项目类别:面上项目
3

非高斯噪声环境下的鲁棒分布式多任务自适应算法研究

批准号:61901400
批准年份:2019
负责人:喻翌
学科分类:F0111
资助金额:24.00
项目类别:青年科学基金项目
4

噪音环境下的多态蠕虫特征自动提取算法研究

批准号:61202495
批准年份:2012
负责人:汪洁
学科分类:F0205
资助金额:22.00
项目类别:青年科学基金项目