面向大数据的半监督粗糙特征选择高效算法研究

基本信息
批准号:61402272
项目类别:青年科学基金项目
资助金额:26.00
负责人:王锋
学科分类:
依托单位:山西大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:王俊红,庞继芳,赵兴旺,王智强,宋云胜,王杰,刘鑫
关键词:
半监督学习粗糙集特征选择大数据
结项摘要

With the coming of big data, large-scale data sets which contain only a small number of labeled samples are acquired in many practical applications, especially for biology, medicine and chemistry. Feature selection is an extremely significant data preprocessing technique in data mining. And the above “small labeled sample problems” brings new challenges for traditional feature selection approaches. The project aims to comprehensively investigate features selection for big data with small labeled samples, and construct efficient and feasible semi-supervised rough feature selection approaches. Its contents include four problems. 1) Defining uncertainty and feature significance in the context of semi-supervised. 2) Designing efficient semi-supervised rough feature selection approaches for large-scale data sets. 3) Constructing efficient semi-supervised rough feature selection approaches for high dimensional data sets. 4) Developing efficient semi-supervised rough feature selection approaches for dynamic data sets. The results of the project hopefully provide new ways for knowledge discovery of big data and can be applied in many areas such as medical diagnosis, bioengineering and social computing.

随着大数据时代的到来,许多实际应用领域中存在着只含有少量有标记数据的海量高维数据集,尤其在生物、医学以及化学等领域中更为常见。特征选择是数据挖掘中一个极其重要的数据预处理技术,而上述的“少标记数据问题”也为传统特征选择方法带来了全新的挑战。本项目拟针对大数据背景下的少标记数据集的特征选择展开系统研究,构造一系列高效可行的半监督粗糙特征选择方法。具体内容:1)定义半监督意义下的不确定性和特征重要度;2)设计面向大规模数据集的半监督粗糙特征选择高效方法;3)构造面向高维数据集的半监督粗糙特征选择高效方法;4)发展面向动态数据集的半监督粗糙特征选择高效方法。本项目的研究成果有望为大数据背景下的知识发现提供可以借鉴的新思路,并能在医疗诊断、生物工程、社会计算等领域得到应用。

项目摘要

大数据时代的到来,许多实际应用领域中存在着只含有少量有标记数据的海量高维数据集,这为传统数据挖掘技术带来了全新的挑战。本项目针对大数据背景下的少标记数据集的高效特征选择展开系统的研究,并取得了以下几方面的重要研究成果:(1) 分析并讨论了几种常见信息熵之间的联系和差异,为基于信息熵的数据处理技术提供了基础;(2) 深入探索了动态数据集中信息熵的变化,并据此设计了面向动态数据集的一系列高效动态特征选择搜索策略;(3) 进一步讨论了混合型数据集中信息熵的表示,分别设计了面向混合型数据的聚类算法和高效特征选择算法;(4) 结合粗糙集理论和信息熵的概念,借助半监督学习机制,构造了基于信息熵的半监督高效特征选择算法。这些主要研究成果为数据降维、粒度计算,数据挖掘等领域的研究提供了可以借鉴的新思路和途径,对面向少量标记数据、动态数据以及混合型数据的研究有着重要的理论意义和研究价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

DOI:10.13465/j.cnki.jvs.2020.09.026
发表时间:2020
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

DOI:10.3864/j.issn.0578-1752.2019.03.004
发表时间:2019

王锋的其他基金

批准号:81100528
批准年份:2011
资助金额:22.00
项目类别:青年科学基金项目
批准号:10878009
批准年份:2008
资助金额:34.00
项目类别:联合基金项目
批准号:21071020
批准年份:2010
资助金额:15.00
项目类别:面上项目
批准号:31871730
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:10876003
批准年份:2008
资助金额:33.00
项目类别:联合基金项目
批准号:71673270
批准年份:2016
资助金额:51.00
项目类别:面上项目
批准号:31272443
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:U1231205
批准年份:2012
资助金额:260.00
项目类别:联合基金项目
批准号:U1831204
批准年份:2018
资助金额:293.00
项目类别:联合基金项目
批准号:21301054
批准年份:2013
资助金额:24.00
项目类别:青年科学基金项目
批准号:21573185
批准年份:2015
资助金额:66.00
项目类别:面上项目
批准号:U1662114
批准年份:2016
资助金额:65.00
项目类别:联合基金项目
批准号:U1631129
批准年份:2016
资助金额:50.00
项目类别:联合基金项目
批准号:81201423
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目
批准号:31672422
批准年份:2016
资助金额:65.00
项目类别:面上项目
批准号:21206177
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:81771739
批准年份:2017
资助金额:56.00
项目类别:面上项目
批准号:50906104
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:71173170
批准年份:2011
资助金额:38.00
项目类别:面上项目
批准号:21871102
批准年份:2018
资助金额:65.00
项目类别:面上项目
批准号:11226334
批准年份:2012
资助金额:3.00
项目类别:数学天元基金项目
批准号:31100518
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:61063027
批准年份:2010
资助金额:23.00
项目类别:地区科学基金项目
批准号:71673217
批准年份:2016
资助金额:48.00
项目类别:面上项目
批准号:11301275
批准年份:2013
资助金额:22.00
项目类别:青年科学基金项目
批准号:11774030
批准年份:2017
资助金额:61.00
项目类别:面上项目
批准号:81570603
批准年份:2015
资助金额:57.00
项目类别:面上项目
批准号:81770741
批准年份:2017
资助金额:55.00
项目类别:面上项目
批准号:31872357
批准年份:2018
资助金额:59.00
项目类别:面上项目
批准号:21773200
批准年份:2017
资助金额:64.00
项目类别:面上项目
批准号:81501432
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目
批准号:31570710
批准年份:2015
资助金额:64.00
项目类别:面上项目
批准号:20903083
批准年份:2009
资助金额:10.00
项目类别:青年科学基金项目
批准号:21303149
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:11372339
批准年份:2013
资助金额:80.00
项目类别:面上项目
批准号:51271037
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:22004057
批准年份:2020
资助金额:8.00
项目类别:青年科学基金项目
批准号:30470934
批准年份:2004
资助金额:18.00
项目类别:面上项目
批准号:31471760
批准年份:2014
资助金额:88.00
项目类别:面上项目
批准号:61462053
批准年份:2014
资助金额:45.00
项目类别:地区科学基金项目
批准号:30771161
批准年份:2007
资助金额:28.00
项目类别:面上项目
批准号:81903303
批准年份:2019
资助金额:20.00
项目类别:青年科学基金项目

相似国自然基金

1

面向多模态数据的粗糙集特征选择及其增量算法研究

批准号:61806108
批准年份:2018
负责人:杨燕燕
学科分类:F0601
资助金额:17.00
项目类别:青年科学基金项目
2

面向复杂数据的动态决策粗糙集及其高效特征选择方法研究

批准号:61602327
批准年份:2016
负责人:罗川
学科分类:F0607
资助金额:21.00
项目类别:青年科学基金项目
3

粗糙集中带约束的特征选择高效算法研究

批准号:61572406
批准年份:2015
负责人:陈红梅
学科分类:F0607
资助金额:63.00
项目类别:面上项目
4

中医CPG共识专家多视角数据半监督特征选择方法研究

批准号:81904325
批准年份:2019
负责人:王丽颖
学科分类:H3121
资助金额:21.00
项目类别:青年科学基金项目