Recently, directional data has appeared in environmental engineering, earth science, information, biomedical, energy and other areas, which has attracted the attention of many scholars. Due to the structure of the distribution of the direction variables, statistical modeling and dimension reduction methods for linear variables are no longer fully applicable to such variables. Based on the high-dimensional data with directional variables, this project will investigate dependency relationships among variables and select effective variables. Data-driven nonparametric regression and dimension reduction based on the conditions covariance matrix will be used to solve these two problems. Research goal is to firstly provide dimension reduction method for the high-dimensional data with directional variables and then construct the nonparametric regression models with directional variables and then complete the writing of packages. The outcome of this project will further improve the theory of nonparametric models and dimension reduction, while providing new ways for addressing environmental.pollution monitoring, genetic testing, image texture analysis and other practical problems.
方向数据因其在环境工程、地球科学、信息、生物医学、能源等领域的广泛出现,引起了众多学者的关注。由于方向变量(directional variables)的结构分布特点,传统(线性)变量(linear variables)的统计建模和降维方法已不完全适用于此类变量。本项目将以方向变量与传统变量并存的高维数据为研究对象,拟研究(1)变量间的依存关系;(2)变量的特征提取。本项目将利用完全由数据驱动的非参数回归以及基于条件协方差矩阵的降维方法来解决上述两个问题。目标是在对方向变量与传统变量并存下的高维数据进行降维基础上,建立相应的多元非参数异方差回归模型,并编写相应程序包。本项目的成果将进一步完善非参数回归理论和高维数据降维方法,同时为环境污染监测、基因检测、图像纹理分析等实际问题的解决提供一种新途径。
本项目以生物、医学、能源和信息领域中广泛出现的方向变量与传统变量并存的高维数据为主要研究对象。项目主要研究内容:(1)变量间的相依关系。主要研究含方向变量的多元非参数异方差回归模型中回归函数和方差的估计以及置换检验问题。项目中借助局部多项式估计方法和单指标变量法分别估计方向变量条件下的协方差矩阵和条件方差;通过boostrap方法构建一个修正的统计量来分析高维数据间的置换检验问题。(2)变量的特征提取。包括含方向数据的混合数据的高维数据的降维及其分类问题。项目中借助PNS方法对方向变量进行降维,再利用logistic模型和混合核函数对含方向变量的高维数据进行分类。(3)统计方法在图像处理等方面的应用。项目中借助最小二乘核估计方法,针对图像处理中常用的Canny算法中的Sobel算子的方向梯度进行改进。其中(1)(3)部分的成果已发表在Computational Statistics & Data Analysis,Computational Statistics, Communications in Statistics-Theory and Methods以及EI检索会议中。(1)和(2)的部分论文已投稿。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
基于LASSO-SVMR模型城市生活需水量的预测
低轨卫星通信信道分配策略
基于分位数回归的高维数据降维及变量选择研究
回归框架下高维张量数据降维与协方差估计
高维数据的半参数回归建模与统计分析
回归中高维数据的“充分”降维