Big data is in essence a technology to process the high-dimensional and multi-modal features in semi-structured and/or unstructured data. Big data is a set of techniques and technologies that require new forms of integration to uncover large hidden values from large datasets that are diverse, complex, and of a massive scale. Granular computing is a branch of data mining and it provides a series of methods for information granulation and information transformation for semi-structured and/or unstructured data, thus this theory has attracted much more attentions in recent years. In this project, we plant to systematically study the feature fusion problems of big data based on granular computing from the following four levels: data model, computing model, problem level and algorithm level. The main research topics include: 1) Granular computing based multi-channel feature extraction of image data; 2) Multi-modal feature fusion based on structural learning; 3) Multi-modal feature fusion based on multi-kernel learning; 4) The matrix iterative algorithms of the above problems. Based on the exploration and innovation of the above topics, we plan to construct the theoretical system of four levels, define and solve the core problems in the four levels, develop problem-specific efficient algorithms and provide high-efficiency, low-cost and low-risk data mining methods.
大数据本质上是对大量的半结构化、非结构化的高维多模态特征的处理。大数据是需要新处理模式才能具有更强决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。粒计算理论是数据挖掘的重要分支,为非结构化和半结构化数据提供了一系列信息粒化方式和求解方法,其研究在近年来取得了长足进展。本项目拟从数据模型、计算模型、问题和算法四个层次来系统地研究基于粒计算的大数据特征融合。主要研究内容包括:1)基于粒计算的多信道图像特征选取;2)基于结构化学习的多模态特征融合模型;3)基于多核学习的多模态特征融合模型;4)相应模型的矩阵批量迭代算法。通过这些研究内容的探索与创新,建立四个层次的理论体系,提出并解决其中的关键问题,开发具体问题的高性能算法,为实际应用提供高效率、低成本、低风险的数据挖掘方案。
维数约简是机器学习中的核心问题,如何从高维大数据中学习有效的低维表示一直是学者们研究的关键问题。本项目研究半结构化、非结构化的高维多模态特征学习的基本原理,在粒计算理论和算法的基础上,采用稀疏图嵌入的方法,对单模态的高维特征表示和多模态特征融合问题进行系统研究,对于进一步阐明特征表示与融合内在机理,改进高阶矩阵分解算法,拓展特征学习的理论和应用研究,具有重要的学术研究意义。其主要研究成果包括:1)通过稀疏图嵌入方法,提出了粒计算的多信道图像特征选择算法,能有效地从高维数据中学习有效的紧凑特征子空间;2)结合低秩近似和结构化学习,为无监督特征选择提供一个统一的解决框架,同时为含有秩约束的优化问题提出了一类优化算法;3)构建了结构化学习的多模态多图嵌入特征融合模型,提出了一个高效的矩阵批量迭代算法,为高阶的矩阵分解算法提供了一个有效的统一框架;4)将协同聚类和特征表示整合到一个学习任务中,并提出一类惩罚矩阵分解算法来优化相应的目标函数;5)从低秩恢复和结构化嵌入的视角研究协同聚类,并提出相应的高效迭代算法;6)被上述研究的激发,研究计算机视觉中显著性目标检测的特征学习问题,并得到了一系列丰硕的研究成果。通过这些研究内容的探索与创新,从数据层、模型层、问题层和算法层这四个方面出发,提出并解决了其中的关键问题,开发具体问题的高性能算法,为实际应用提供高效率、低成本、健壮的特征表示与融合方案。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
基于SSVEP 直接脑控机器人方向和速度研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应
面向大数据的粒计算理论与方法
面向大数据的粒计算理论与方法
面向高维数据的粒计算理论与方法
基于粒计算的海量数据挖掘理论与高效算法研究