The framework for the spectral hashing based multi-label ensemble learning is constructed to reduce the dimension of training instances in the Hamming space while preserving the spatio-temporal correlation and assign different weights to different predicted probabilities in different feather spaces due to multi-properties of the massive sensory data. On this basis, a Locality-Sensitive Hashing (LSH) based Approximate Similarity Search algorithm in the Hamming space is studied for the characteristics of spatio-temporal correlation among the sensory data in large-scale wireless networks. Label Correlation Extension algorithm and MinHash-based label space dimension reduction algorithm are studied for the characteristics of the high correlation among the detected events. Hence, through the modelling and optimization of multi-label sensory data learning in large-scale wireless networks, we can reduce the query overhead of massive volume and high dimensional data and the computation complexity of label vectors, while further improving the label prediction accuracy, so that multiple events can be detected and estimated quickly and accurately in large-scale wireless networks.
本申请构建基于谱哈希的多标记集成学习模型,在保留大规模无线网络中感知数据时空相关性的条件下,对感知样本在海明空间中降维,并针对海量感知数据多属性特点,对不同特征空间的标记预测概率进行加权集成。在此基础上,针对感知数据时空相关性的特点,研究海明空间中局部敏感哈希LSH (Locality-Sensitive Hashing)的近似近邻查找算法;针对大规模无线网络中感知事件的关联性,研究优化的标记相关性扩展和标记向量的MinHash降维算法。因此,通过面向大规模无线网络感知数据的多标记学习建模和优化,在减少海量高维样本查询开销和标记向量计算复杂度的条件下,进一步提高多标记预测的准确度,以便对大规模无线网络中多个感知事件进行快速准确的估计和判断。
本项目研究大规模无线网络感知数据的多标记学习问题,因为无线终端感知能力越来越强,基于图像和视频逐渐成为无线网络感知数据的主要内容,并且多标记学习应用场景主要包括分类和搜索等。. 本项目1)首先研究多示例多标记学习问题,提出一种通过联合距离度量学习以改进MIML分类算法的MI(ML)2kNN方法。该方法利用训练样本的标记信息,使用距离度量学习优化样本和样本之间的马氏距离(Mahalanobis distance),然后,在多示例多标记架构下利用优化的马氏距离以提高MIMLkNN算法性能,在此基础上,本项目通过训练学习了多标记多示例环境中标记的相关性,并优化距离度量以减少正相关标记对应包的马氏距离,即优化特征的空间转换,从而提高多示例多标记kNN算法的分类性能。并在MSRC v2等数据集上验证了本项目提出的分类算法的有效性,2)为了进一步提高性能,提出一种基于集成学习模型的特征提取与分类的算法,选取卷积神经网络,尺度不变特征提取和方向梯度直方图三种图片特征提取技术,利用集成学习模型把三种方法结合在一起,以提高分类的准确度,并在卷积神经网络上引入了迁移学习,有效的解决了训练样本较少所带来的分类不准确的问题。并在手机拍摄的城市空气质量实景图数据集中,验证所提算法分类的准确度。3)在多标记搜索场景中,提出了基于锚图哈希的半监督度量学习算法,学习最优的距离度量以保留图片的语义和特征相似性,并在此基础上利用锚哈希技术把相似的图片映射成相似的二进制码元,以便于图片检索。在两个公共的大规模图片数据集中进行图片检索实验,并和常用的哈希算法进行性能对比分析,从而验证了本项目提出算法在检索的精度和时间开销方面的优越性。. 总之,本项目围绕感知数据多标记多示例学习问题,利用距离度量、标记相关性和集成学习等对模型性能进行提升,并利用图论和半监督度量学习等方法,实现了基于实际数据集的大规模多标记分类和搜索应用。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
面向大规模数据的机器学习算法研究
面向大规模数据的多示例学习
面向大规模高维复杂数据的稀疏最优化有监督学习模型与算法
面向认知的多源数据学习理论与算法