高维大数据可视化的散度模型、算法及评价

基本信息

批准号：61572317

项目类别：面上项目

资助金额：65.00

负责人：严京旗

学科分类：

依托单位：上海交通大学

批准年份：2015

结题年份：2019

起止时间：2016-01-01 - 2019-12-31

项目状态：已结题

项目参与者：王利生,兰守忍,陈本智,李婕妤,李爽,武亚军,陈文翔,李东来,陈振杰

关键词：

低维嵌入多重网格技术图测地距离高维大数据可视化空间划分

结项摘要

High-dimensional big data contains more comprehensive information, however, since it is unable to provide visual perception, its meaning and value are latent. This project aims to establish an observable model of high-dimensional big data in the low dimensional space, and makes the data and information processing transparent, which would help to unite human’s ability of visual perception and the computer’s powerful processing ability and would help analysts detect information hidden behind the data. Therefore, the project has important theory significance and practical value. .Facing to the existing problems in previous work, the project proposes a stochastic neighbor embedding method based on Jensen-Shannon divergence (JS-SNE), using its symmetric constraint to improve the general performance on different data sets; and presents the implementation of JS-SNE algorithm based on multigrid technique, which is close to the linear complexity, in order to adapt to the expansion of data; for high-dimensional big data, the project uses a set compression tree based on learning and encoding for efficient space partitioning and nearest neighbor search, and accordingly develops a fast approach for computing graph geodesic distance in big data; finally, based on the application of 3D shape isometric embedding, the project develops a qualitative and quantitative benchmark for evaluating different low-dimensional embedding methods for visualizing high-dimensional big data.

高维大数据尽管蕴含了更丰富全面的信息，由于无法提供直观的视觉感知，其意义和价值都是潜隐的。本项目着重在低维空间建立高维大数据的观测模型，使数据和信息处理透明化，有利于结合人脑的视觉感知和计算机的处理能力，检测和分析隐藏在数据背后的有效信息，不仅具有理论意义而且具有重大的实用价值。.本项目针对已有研究中存在的问题，拟提出基于Jensen-Shannon散度的随机近邻嵌入方法（JS-SNE），利用该散度的对称性约束改善随机近邻嵌入方法在不同数据集上的偏向性；拟提出基于多重网格技术的JS-SNE算法实现，使其具有接近线性的计算复杂度，以适应数据规模的扩大；面向高维大数据，拟利用基于学习和编码的集压缩树方法进行高效的空间划分和近邻搜索，并据此发展面向大数据的图测地距离快速计算方法；最后，拟借助三维形体的等距嵌入应用，提供一个可定性和定量评价高维数据低维嵌入和可视化方法的基准测试平台。

项目摘要

本项目试图在低维空间建立高维大数据的观测模型，使数据和信息处理透明化，有利于结合人脑的视觉感知和计算机的处理能力，检测和分析隐藏在数据背后的有效信息。研究了基于Jensen-Shannon 散度的随机近邻嵌入方法（JS-SNE）。提出了基于图距离近邻网的相似概率重构方法，使得在低维嵌入时能更好地保持高维的结构，有益于高维数据集的低维嵌入和可视化。提出了有效的高维数据的可视化方法，包括：基于ANNOY算法的快速近邻搜索算法、基于近邻关系与类别信息的概率重构算法、基于P-BGLL的可视化算法、基于Feature-Net的可视化算法。基于正常人眼底视网膜图像的大数据集合，研究了视网膜眼底图像中各类异常的智能检测方法。在三维图像数据的可视化方面，针对图像中属性相似的结构难以分离的难题，提出了改进的图像分类算法。本项目的研究结果不仅具有理论意义而且具有重要实用价值。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：

DOI：

发表时间：2020

DOI：10.19328/j.cnki.2096-8655.2022.02.002

发表时间：2022

DOI：

发表时间：2019

严京旗的其他基金

批准号：60873137

批准年份：2008

资助金额：27.00

项目类别：面上项目

批准号：60402020

批准年份：2004

资助金额：23.00

项目类别：青年科学基金项目

相似国自然基金

基于VR-GIS的城市噪声监测数据三维分析模型及可视化评价研究

批准号：40971207

批准年份：2009

负责人：韩勇

学科分类：D0114

资助金额：45.00

项目类别：面上项目

基于量子进化算法和模型组合的高维数据特征选择

批准号：61572109

批准年份：2015

负责人：杨国武

学科分类：F0210

资助金额：65.00

项目类别：面上项目

基于结构组稀疏算法的多尺度高维数据变量筛选及预测模型研究

批准号：81573256

批准年份：2015

负责人：侯艳

学科分类：H3011

资助金额：55.00

项目类别：面上项目

大数据条件下的最小散度波束形成：理论、高效算法和应用

批准号：61601284

批准年份：2016

负责人：姜雪

学科分类：F0111

资助金额：22.00

项目类别：青年科学基金项目

高维大数据可视化的散度模型、算法及评价

{{i.achievement_title}}

暂无此项成果

其他相关文献

一种基于多层设计空间缩减策略的近似高维优化方法

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于多色集合理论的医院异常工作流处理建模

"多对多"模式下GEO卫星在轨加注任务规划

基于主体视角的历史街区地方感差异研究———以北京南锣鼓巷为例

严京旗的其他基金

基于参数化表示的三维形体分析及其应用研究

三维图形网格参数化及其应用研究

相似国自然基金