Randomized algorithms are techniques which deal with large-scale data via random projections or random sampling. They have been proved to be computationally and statistically efficient in large-scale data analysis. This project is to further investigate the randomized algorithms in many problems of large-scale analysis. For specific. Firstly, we investigate the approximation algorithm on Newton's algorithm and its variants, and provide its statistical properties and the optimal strategies for randomized algorithms. Secondly, we investigate the randomized algorithms on SGD and try to provide its convergence rate. Thirdly, we provide the efficient high-dimensional classifiers via random algorithms, and investigate how to improve its accuracy. Fourthly, we investigate the randomized algorithms on matrix decomposition problems. At last we provide a clinical application of randomized algorithms to Cervical Spondylosis. By this application, we hope that our studies can provide clinical advice for surgeon.
随机算法是利用随机投影矩阵或者随机抽样对大规模数据进行压缩或者降维的一种技术。已经有大量理论和应用研究表明随机算法在处理大规模数据中很有效。本项目从多个角度继续研究大规模数据处理中的随机算法。具体包括:(1)研究基于随机算法的牛顿算法及其变体的近似计算,并研究其统计性质和最优算法选择;(2)研究Stochastic Gradient Descent的随机抽样算法,使其收敛速度更快用以快速计算;(3)研究基于随机算法的高维判别分析方法,并综合合成算法进一步减少随机算法引起的不稳定性;(4)研究大规模数据的矩阵分解,提出基于随机算法的快速矩阵分解方法。同时,本项目应用大规模数据的随机算法到颈椎病临床诊断中,为颈椎病医疗诊断提供辅助建议。
这个项目以当今大规模复杂数据和复杂模型为背景。(1) 我们提出了一个简单有效的不确定统计量用于度量复杂模型的不确定性,并研究了它具有很好的近似效果。(2) 我们提出了一个收敛速度更快的用于TD学习的梯度下降算法,并研究它的收敛性质。(3)我们提出了一个基于随机抽样的高维预测方法,联合合成方法后,该方法更简单且更有效。(4)我们也研究了矩阵数据的分解方法,以提取其不确定成分,并将该方法应用到神经元数据分析中。.该项目的研究在神经网络、神经数据分析以及推荐系统等领域都将有广泛的应用前景。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
卫生系统韧性研究概况及其展望
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
物联网中区块链技术的应用与挑战
结合图像分析的非参数随机效应模型及其在临床医学数据中的应用研究
随机扰动理论和随机算法在大规模矩阵计算中的应用
复杂系统的随机学习与分析算法及其在DNA分析中的应用
大规模SNP数据挖掘及其在复杂疾病分析中的应用研究