面向高维数据的粒计算理论与方法

基本信息

批准号：61772323

项目类别：面上项目

资助金额：63.00

负责人：魏巍

学科分类：

依托单位：山西大学

批准年份：2017

结题年份：2021

起止时间：2018-01-01 - 2021-12-31

项目状态：已结题

项目参与者：王俊红,冯凯,赵兴旺,王智强,王杰,宋云胜,王杰,崔军彪,郭鑫垚

关键词：

粒度融合数据挖掘信息粒化高维数据多粒度

结项摘要

Granular computing is an effective method in the field of intelligent information processing and complex problem solving, in which Multigranulation computing is one of the important research contents, and its solution strategy fits the actual needs of high dimensional data mining. It is very important and significant to explore new theories and methods of Multigranulation computing for high dimensional data. In this project, we are going to carry out systematic study on the data granulation, multi-granularity feature dimension reduction, multi-granularity pattern discover and application demonstration, which is aimed at solving the problems brought by sparsity, redundancy, noise in high dimensional data. Specifically, main contents of the project include: (1) Explore the granulation mechanism of high dimensional data, and give the basic strategies and algorithms of data granulation from perspective of features; (2) Investigate the method of fusing data geometry structure, and propose feature selection algorithms and feature extraction algorithms for high dimensional data; (3) By means of sparse representation and low rank representation, introduce the Multigranulation learning model and algorithm for the pattern discovery of high dimensional data; (4) Based on micro-blogging text data, develop an application demonstration for topic discovery and sentiment analysis. Aiming at the key scientific issues in high dimensional data mining. the results of this project will establish a series of Multigranulation computing models and efficient algorithms, which have important theoretical significance for high dimensional data analysis and mining, will also provide technical support for the development of relevant industry in data analysis.

粒计算是智能信息处理领域中求解大规模复杂问题的有效方法。多粒度计算则是粒计算领域的重要研究内容之一, 它的求解策略与高维数据挖掘的实际需求相契合。探索高维数据多粒度计算新理论与新方法具有重要的理论意义与应用价值。本项目针对高维数据的稀疏、冗余、高噪声等特点，从数据粒化、多粒度特征降维、多粒度模式发现与应用示范等方面着手开展深入系统的研究。具体内容包括：（1）探索高维数据的特征粒化机理，给出特征方向数据粒化的基本策略和算法；（2）研究多粒度数据几何结构融合方法，提出高维数据的多粒度特征降维算法；（3）基于稀疏表示、低秩表示等方法，构建高维数据模式发现的多粒度学习模型与算法；（4）以微博文本数据为载体，在话题抽取与情感分析方面开展应用示范。本项目瞄准高维数据挖掘中的关键科学问题，开展多粒度计算模型与高效算法研究，研究成果对数据挖掘研究具有重要理论价值，也将为数据分析产业的发展提供技术支撑。

项目摘要

高维数据是机器学习、模式识别、生物医学等领域的数据普遍存在的形式。项目针对目前高维数据挖掘时面临的维数灾难、数据冗余、以及计算代价巨大等挑战开展核心科学问题研究，从多粒度的角度出发，以机器学习和粒计算的现有方法和理论为基础，探索面向高维数据的多粒度计算理论与方法。在高维数据的特征空间粒化方面，提出了面向符号数据的层次聚类算法、基于样本对加权共协关系矩阵的聚类集成算法；在高维数据的多粒度降维方面，针对特征抽取任务，提出了自适应稀疏表示引导的无监督降维、基于稀疏表示的多视图无监督降维算法，针对特征选择任务，提出了基于区分矩阵的增量属性约简算法、基于压缩决策表的增量属性约简算法、基于信息粒化的快速Relief算法、基于区分矩阵的多粒度属性约简算法、面向多标签数据的特征选择算法，针对度量学习任务，提出了基于聚类约束的度量学习方法；在高维数据的多粒度模式发现方面，提出了基于多聚类自适应融合的无监督降维算法、自适应融合多聚类结果的半监督学习方法；在微博数据事件抽取和情感分析的应用方面，基于上述理论研究成果研发了微博情感分析原型系统。项目成果为高维数据的挖掘提供了可行的技术方法，也为粒计算理论拓展了新的研究方向和研究思路，对数据挖掘和知识发现有着重要的研究价值，也将为数据分析产业的发展提供技术支撑。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：

发表时间：2021

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：

DOI：10.14050/j.cnki.1672-9250.2017.02.014

发表时间：2017

魏巍的其他基金

批准号：61303008

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：51872170

批准年份：2018

资助金额：60.00

项目类别：面上项目

批准号：61671385

批准年份：2016

资助金额：60.00

项目类别：面上项目

批准号：31200596

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：51602245

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：61301192

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：51108006

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

批准号：41503068

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

批准号：61905045

批准年份：2019

资助金额：23.00

项目类别：青年科学基金项目

批准号：50905016

批准年份：2009

资助金额：20.00

项目类别：青年科学基金项目

批准号：51205010

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：21903034

批准年份：2019

资助金额：26.00

项目类别：青年科学基金项目

批准号：11005131

批准年份：2010

资助金额：24.00

项目类别：青年科学基金项目

批准号：51478017

批准年份：2014

资助金额：80.00

项目类别：面上项目

批准号：51678007

批准年份：2016

资助金额：62.00

项目类别：面上项目

批准号：61602197

批准年份：2016

资助金额：21.00

项目类别：青年科学基金项目

批准号：41303081

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：31570795

批准年份：2015

资助金额：65.00

项目类别：面上项目

批准号：11602263

批准年份：2016

资助金额：22.00

项目类别：青年科学基金项目

批准号：11404187

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：41802176

批准年份：2018

资助金额：25.00

项目类别：青年科学基金项目

批准号：11601423

批准年份：2016

资助金额：19.00

项目类别：青年科学基金项目

批准号：31770543

批准年份：2017

资助金额：60.00

项目类别：面上项目

批准号：51475041

批准年份：2014

资助金额：83.00

项目类别：面上项目

批准号：51808477

批准年份：2018

资助金额：26.00

项目类别：青年科学基金项目

批准号：21607063

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：51675028

批准年份：2016

资助金额：63.00

项目类别：面上项目

相似国自然基金

面向大数据的粒计算理论与方法

批准号：61432011

批准年份：2014

负责人：梁吉业

学科分类：F0607

资助金额：350.00

项目类别：重点项目

面向大数据的粒计算理论与方法

批准号：U1435212

批准年份：2014

负责人：梁吉业

学科分类：F0607

资助金额：150.00

项目类别：联合基金项目

面向大数据降维的粒计算理论与鱼群优化方法研究

批准号：61573297

批准年份：2015

负责人：陈玉明

学科分类：F0608

资助金额：63.00

项目类别：面上项目

面向高维混合数据的信息粒化与特征选择研究

批准号：61662023

批准年份：2016

负责人：舒文豪

学科分类：F0607

资助金额：38.00

项目类别：地区科学基金项目

面向高维数据的粒计算理论与方法

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于国产化替代环境下高校计算机教学的研究

基于铁路客流分配的旅客列车开行方案调整方法

一种基于多层设计空间缩减策略的近似高维优化方法

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于综合治理和水文模型的广西县域石漠化小流域区划研究

魏巍的其他基金

混合数据多粒度粗糙计算模型与算法研究

TMDCs vdW异质结构层间激子效应

基于空谱稀疏结构自适应学习的高光谱图像压缩感知重构方法研究

基于Fosmid基因组文库及转录组分析的甾体降解基因簇的挖掘与表达调控

纤维素诱导组装电化学剥离石墨烯气凝胶材料及其钠离子存贮性能研究

基于多任务概率视觉语义模型的图像场景理解

无组织面源挥发性有机物(VOCs)排放特征反演测试方法研究

氮素肥料诱导黑土脱氮过程及其微生物群落结构和功能研究

基于三维金属混合衬底结构的低阈值亚波长近红外纳米线激光器的研究

提高车用液力元件功率密度的叶栅系统设计理论研究

面向复杂装备的稳健产品平台设计方法及其应用研究

激发态芳香性的表征新方法及其在环烯烃中的应用

端粒DNA损伤修复机制对重离子诱导肿瘤细胞凋亡的调控作用

石化行业高活性VOC排放对城市O3和大气氧化性的影响研究

京津冀区域人为源挥发性有机物（VOC）排放清单化学物种分布与校验

微博社交网络中主题专家搜索关键技术研究

低分子量有机酸对纳米羟基磷灰石固定铅的影响及机理

基于Pgrac启动子突变文库筛选及元件组装的芽孢杆菌精细调控表达系统的研究

轴流压气机叶片非整阶振动现象的流固耦合机理研究

硅烯与Ag表面的作用机理及其生长机制

湖相富火山组分的混积岩致密油储层的成岩、成储机理研究

基于调和分析方法的Lipschitz区域上椭圆型方程组的L^p预解式估计及相关问题的研究

不同盐渍土生态系统中主导反硝化作用的嗜盐古菌资源及其生态调控机制

基于两相流动的车用液力缓速器动态特性预测及控制技术研究

离子阻隔型胶囊状吸附剂的制备及其分离液相中铂钯的机理研究

纳米晶嵌入式生物质碳基气凝胶的构筑及其吸附-光催化协同去除水体中氟喹诺酮抗生素的机制研究

多元特性驱动的产品族柔性化设计方法研究

相似国自然基金