数据理解是机器学习和数据挖掘中的基本需求。本项目研究数据理解方面从理论到应用的三个部分:理论部分研究参数空间和函数空间的优化问题,以及对统计学习算法做性能分析。结构化数据的建模和分析部分研究半参数的学习问题和结构化输出中的半监督学习、迁移学习、结构化输出的分类等问题。在应用部分研究图像中目标的检测和分类问题。这三个部分紧密联系。理论部分对于应用部分的研究提供了指导,应用部分为理论部分提供研究背景。
数据理解是机器学习和数据挖掘中的基本需求。本项目从理论、方法和应用三个方面出发,研究数据理解若干基本问题。理论部分开展了统计学习算法的性能分析的研究工作:研究基于间隔和损失函数的机器学习问题、无约束优化的核学习问题、多核学习尺度敏感问题和稀疏多任务学习问题等四方面理论问题。方法部分在数据理解的多个领域取得成果:提出了半监督统一框架、半监督支持向量机快速算法和正则化约束下的多示例半监督学习框架等方法;提出了基于最大间隔的非监督降维与特征选择算法、最大间隔聚类快速算法、非监督大间隔判别式投影和非平衡数据学习的加权间隔方法等多种最大间隔方法;提出了子空间降维和特征选择的迹比值方法以及核子空间、张量子空间和拓扑子空间等方法;提出了弱监督学习、多示例学习、主动学习和多标签学习等方法;提出了演化聚类和演化分类学习方法以及演化学习的在线方法;提出了基于稀疏优化的一系列方法,如分段线性模型、正则化boosting、稀疏排序算法、求解正则最小二乘问题的对偶投影牛顿法、求解信任区域步长的有效多阶段共轭梯度法以及求解非负矩阵分解的有效投影牛顿法等优化方法。应用部分开展了五方面工作:研究了三种不同的图像与目标分割模型;提出了四种不同准则进行图像分类的特征选择与相似性度量;以图像标注和图像检索为目标,设计完成图像与目标分类系统;运动目标识别领域提出了一个新颖的基于语义场景模型学习的事件分析框架;提出了基于层次码本模型的光碟检索系统,使得在浩瀚的数据集下,能够快速查找到用户输入图片或者视频中出现光碟的信息。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
气载放射性碘采样测量方法研究进展
Voronoi空间数据模型若干基本问题的研究
关联成像若干基本问题研究
时空拓扑关系若干基本问题的研究
多元算子论中的若干基本问题