Recent years have witnessed lots of functional data with the rapid development of information technology, these data widely exist in medicine, meteorology, biology and many other domains, and consist of observed functions (curves) evaluated at a finite subset of some interval. The high-dimensionality and continuity nature of functional data brings challenges for the traditional data mining methods. The project will face the classification problems of functional data, and solve the following key scientific and technical problems systematically: (1) Develop the basis representation strategy of functional data, and construct the optimization function to determine the number of basis functions based on classification performance index. (2) Explore the feature reconstruction methods of functional data, and capture the key distinguishing features of functional data based on the granulation mechanism. (3) Design the high-efficient classification algorithm of functional data, and solve the classification problems of large-scale functional data. These research topics supplement each other and form a more complete scheme for coping with the classification problem of functional data. It has important theoretical significance and practical application value for the pattern recognition of functional data.
信息技术的快速发展催生了大量的函数型数据,该类数据广泛存在于医学、气象学、生物学等众多领域,通常由观测函数(曲线)构成。函数型数据的高维连续性对传统的数据挖掘方法提出了挑战。本项目面向函数型数据的分类任务,围绕以下几个关键科学问题与技术问题展开系统深入的研究:(1) 发展函数型数据的基表示策略,结合分类性能指标构造优化函数以确定基函数的个数。(2) 探索函数型数据的特征重建方法,基于粒化机理捕捉函数型数据的关键区分特征。(3) 设计函数型数据的高效分类算法,解决大规模函数型数据的分类问题。以上研究内容相辅相成,形成了较为完整的应对函数型数据分类问题的求解方案,研究成果对于函数型数据的模式识别具有重要的理论意义和实际应用价值。
函数型数据广泛存在于众多领域。本项目关注函数型数据分类问题当中的特征重建和分类算法设计,研究了以下几方面内容:构建了一个恰当的融合函数型数据分类性能的优化函数用于指导基函数个数的选择,得到了一个泛化性能更好的线性正则化函数Logistic模型;利用Wilcoxon秩检验等方法检测出了时序数据(一维函数型数据)中的变点,得到了函数型数据的原函数曲线、一阶导数曲线和二阶导数曲线的粒化特征表示;设计了基于分布式存储和分布式计算的高效分类算法,拓展到了函数型数据的无监督分类问题中。这些研究结果完成了项目申请中所涉及的主要内容,丰富了函数型数据的模式识别理论和技术,提升了项目组成员的科研水平,为后续进一步科学研究打下了坚实的基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
拥堵路网交通流均衡分配模型
低轨卫星通信信道分配策略
青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化
水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应
高维函数型数据的检验、回归与分类
多标记数据分类及其特征选择算法研究
函数型数据的检验问题
函数型数据的统计推断