面向大数据分层分类学习的多粒度计算模型和算法

基本信息
批准号:61703196
项目类别:青年科学基金项目
资助金额:25.00
负责人:赵红
学科分类:
依托单位:闽南师范大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:杨文元,黄伟婷,余胜龙,脱倩娟,董利梅,李婵,邵东恒
关键词:
分类粗糙集粒计算
结项摘要

The challenge of data mining has increased based on the complicated data structure of big data. Recently, the data mining method for standard binary or multi-class classification problems has attracted much research interest. Most works focus on only the flat classification. However, in most important applications, tens of thousands of hierarchical classification data is organized into a tree or a directed acyclic graph. Different granularity levels are derived from different hierarchical data. The existing methods cannot directly cope with hierarchical classes. It is necessary to define the hierarchical structure for multi-granularity representation and multi-granularity computing. Based on this, with the support of the granular computing model based on fuzzy rough set, this project will systematically study multi-granularity computing model and algorithm for hierarchical classification data. Specifically, we will study the following issues. Firstly, we will study a multi-granularity representation based on hierarchical fuzzy rough sets for hierarchical classification data. Secondly, we will study feature selection methods based on different hierarchical structures. Finally, we will study multi-granularity classification models and algorithms based on different granularity schemes. To sum up, we will establish a granularity computing model for hierarchical classification data, and provide data mining solutions with low cost and low risk for applications.

大数据带来的数据的复杂化、结构化,增加了数据挖掘的挑战性。近年来,针对二分类或多分类数据的数据挖掘研究已取得了长足进展,其研究多数将类别体系扁平化,即将所有的类别看成是同一层,同一个粒度。但是大数据分类所具有类别数量成千上万,同时这些类别之间具有树状或图状的分层结构,不同的决策者所关注的类别层次不同,粒度不同。用户迫切需要能充分利用类别之间的语义关系,定义大数据的分层多粒度表示及在此结构下的多粒度计算方法。本项目拟借助模糊粗糙集理论系统地研究面向大数据分层分类学习的多粒度计算模型和算法。主要研究内容包括:1)根据数据类别的层次结构构建模糊粗糙集多粒度模型;2)提出针对层次结构多粒度模型中不同粒度下的特征评价标准及特征选择方法;3)通过权衡类别层次结构中各局部分类器建立分层分类的统一的最优分类模型。通过解决其中的关键问题,为分层分类数据多粒度应用提供高效率、低成本、低风险的数据挖掘方案。

项目摘要

本项目针对大数据类别信息的结构复杂化等需求,借鉴人类处理复杂问题的多粒度认知机理,利用粒计算工具,重点研究了面向大数据分层分类学习的多粒度计算模型,特征评价及选择,分类算法等,本项目不是以往多粒度学习方法简单地扩展,而是一个全新地挑战。.主要研究内容和贡献概括如下:(1) 利用模糊粗糙集、粗糙集等粒计算方法分别对分层数据进行研究,构建了多种面向分层分类数据的多粒度模型并提出相应的特征选择方法,如基于模糊粗糙集的大规模分层分类特征选择方法;数据与知识共同驱动的鲁棒分层特征选择方案;基于粗糙集和拉普拉斯打分的代价敏感特征选择算法。(2) 面向分层数据的数据降维方面,提出了多种面向分层分类数据的特征选择方法,如面向分类任务层次结构的递归正则化特征选择方法;基于子树的图正则化分层分类特征选择方法;基于判别分析的分层特征提取方法;基于正交变换的分层特征选择方法。(3) 面向分层数据的分类器构建方面,提出了面向分层分类数据的分类学习方法,如基于粒计算的多路径选择分层分类方法;基于局部贝叶斯风险最小化的分层分类停止机制;基于类别相关性的代价敏感学习算法。(4) 在考虑了代价的前提下,提出了多种面向分层分类数据的代价敏感学习方法,如基于多尺度信息熵的代价敏感层次分类方法;基于L2,1-范数的代价敏感特征选择方法;基于样本邻域保持的代价敏感特征选择算法。.通过研究,本项目为分层分类数据多粒度应用提供高效率、低成本、低风险的数据挖掘方案。截止目前为止,共发表与本课题相关的论文16篇,其中被SCI收录13篇。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
2

瞬态波位移场计算方法在相控阵声场模拟中的实验验证

瞬态波位移场计算方法在相控阵声场模拟中的实验验证

DOI:
发表时间:2020
3

气力式包衣杂交稻单粒排种器研制

气力式包衣杂交稻单粒排种器研制

DOI:10.11975/j.issn.1002-6819.2021.01.002
发表时间:2021
4

计及焊层疲劳影响的风电变流器IGBT 模块热分析及改进热网络模型

计及焊层疲劳影响的风电变流器IGBT 模块热分析及改进热网络模型

DOI:10.19595/j.cnki.1000-6753.tces.151503
发表时间:2017
5

金属锆织构的标准极图计算及分析

金属锆织构的标准极图计算及分析

DOI:10.16112/j.cnki.53-1223/n.2019.02.003
发表时间:2019

赵红的其他基金

批准号:81502478
批准年份:2015
资助金额:16.50
项目类别:青年科学基金项目
批准号:71103139
批准年份:2011
资助金额:19.00
项目类别:青年科学基金项目
批准号:21205132
批准年份:2012
资助金额:27.00
项目类别:青年科学基金项目
批准号:20801012
批准年份:2008
资助金额:32.00
项目类别:青年科学基金项目
批准号:41904040
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:21272044
批准年份:2012
资助金额:40.00
项目类别:面上项目
批准号:21776027
批准年份:2017
资助金额:61.00
项目类别:面上项目
批准号:70872103
批准年份:2008
资助金额:21.00
项目类别:面上项目
批准号:39970732
批准年份:1999
资助金额:13.00
项目类别:面上项目
批准号:21176035
批准年份:2011
资助金额:65.00
项目类别:面上项目

相似国自然基金

1

混合数据多粒度粗糙计算模型与算法研究

批准号:61303008
批准年份:2013
负责人:魏巍
学科分类:F0201
资助金额:25.00
项目类别:青年科学基金项目
2

面向多模态数据的多粒度计算理论与方法

批准号:61672332
批准年份:2016
负责人:钱宇华
学科分类:F0607
资助金额:65.00
项目类别:面上项目
3

面向多源数据的多粒度计算方法研究

批准号:61603173
批准年份:2016
负责人:林国平
学科分类:F0607
资助金额:22.00
项目类别:青年科学基金项目
4

多标记数据的多粒度粗糙计算理论与算法研究

批准号:61806133
批准年份:2018
负责人:李华
学科分类:F0601
资助金额:22.00
项目类别:青年科学基金项目