面向大规模无线网络感知数据的多标记学习模型与算法

基本信息
批准号:61571233
项目类别:面上项目
资助金额:57.00
负责人:胡海峰
学科分类:
依托单位:南京邮电大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:吴建盛,魏飞,吕斌,徐珑婷,唐川,朱力,韩硕,郑茂,高毓声
关键词:
大规模无线网络多标记学习海量高维谱哈希感知数据
结项摘要

The framework for the spectral hashing based multi-label ensemble learning is constructed to reduce the dimension of training instances in the Hamming space while preserving the spatio-temporal correlation and assign different weights to different predicted probabilities in different feather spaces due to multi-properties of the massive sensory data. On this basis, a Locality-Sensitive Hashing (LSH) based Approximate Similarity Search algorithm in the Hamming space is studied for the characteristics of spatio-temporal correlation among the sensory data in large-scale wireless networks. Label Correlation Extension algorithm and MinHash-based label space dimension reduction algorithm are studied for the characteristics of the high correlation among the detected events. Hence, through the modelling and optimization of multi-label sensory data learning in large-scale wireless networks, we can reduce the query overhead of massive volume and high dimensional data and the computation complexity of label vectors, while further improving the label prediction accuracy, so that multiple events can be detected and estimated quickly and accurately in large-scale wireless networks.

本申请构建基于谱哈希的多标记集成学习模型,在保留大规模无线网络中感知数据时空相关性的条件下,对感知样本在海明空间中降维,并针对海量感知数据多属性特点,对不同特征空间的标记预测概率进行加权集成。在此基础上,针对感知数据时空相关性的特点,研究海明空间中局部敏感哈希LSH (Locality-Sensitive Hashing)的近似近邻查找算法;针对大规模无线网络中感知事件的关联性,研究优化的标记相关性扩展和标记向量的MinHash降维算法。因此,通过面向大规模无线网络感知数据的多标记学习建模和优化,在减少海量高维样本查询开销和标记向量计算复杂度的条件下,进一步提高多标记预测的准确度,以便对大规模无线网络中多个感知事件进行快速准确的估计和判断。

项目摘要

本项目研究大规模无线网络感知数据的多标记学习问题,因为无线终端感知能力越来越强,基于图像和视频逐渐成为无线网络感知数据的主要内容,并且多标记学习应用场景主要包括分类和搜索等。. 本项目1)首先研究多示例多标记学习问题,提出一种通过联合距离度量学习以改进MIML分类算法的MI(ML)2kNN方法。该方法利用训练样本的标记信息,使用距离度量学习优化样本和样本之间的马氏距离(Mahalanobis distance),然后,在多示例多标记架构下利用优化的马氏距离以提高MIMLkNN算法性能,在此基础上,本项目通过训练学习了多标记多示例环境中标记的相关性,并优化距离度量以减少正相关标记对应包的马氏距离,即优化特征的空间转换,从而提高多示例多标记kNN算法的分类性能。并在MSRC v2等数据集上验证了本项目提出的分类算法的有效性,2)为了进一步提高性能,提出一种基于集成学习模型的特征提取与分类的算法,选取卷积神经网络,尺度不变特征提取和方向梯度直方图三种图片特征提取技术,利用集成学习模型把三种方法结合在一起,以提高分类的准确度,并在卷积神经网络上引入了迁移学习,有效的解决了训练样本较少所带来的分类不准确的问题。并在手机拍摄的城市空气质量实景图数据集中,验证所提算法分类的准确度。3)在多标记搜索场景中,提出了基于锚图哈希的半监督度量学习算法,学习最优的距离度量以保留图片的语义和特征相似性,并在此基础上利用锚哈希技术把相似的图片映射成相似的二进制码元,以便于图片检索。在两个公共的大规模图片数据集中进行图片检索实验,并和常用的哈希算法进行性能对比分析,从而验证了本项目提出算法在检索的精度和时间开销方面的优越性。. 总之,本项目围绕感知数据多标记多示例学习问题,利用距离度量、标记相关性和集成学习等对模型性能进行提升,并利用图论和半监督度量学习等方法,实现了基于实际数据集的大规模多标记分类和搜索应用。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
3

温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成

温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成

DOI:10.3724/ SP.J.1123.2019.04013
发表时间:2019
4

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015
5

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020

胡海峰的其他基金

批准号:61071092
批准年份:2010
资助金额:30.00
项目类别:面上项目
批准号:61273270
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:91116015
批准年份:2011
资助金额:26.00
项目类别:重大研究计划
批准号:91216122
批准年份:2012
资助金额:82.00
项目类别:重大研究计划
批准号:51305449
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:61403074
批准年份:2014
资助金额:26.00
项目类别:青年科学基金项目
批准号:60802069
批准年份:2008
资助金额:18.00
项目类别:青年科学基金项目
批准号:61673402
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:90816020
批准年份:2008
资助金额:70.00
项目类别:重大研究计划

相似国自然基金

1

面向大规模数据的机器学习算法研究

批准号:61175050
批准年份:2011
负责人:吴高巍
学科分类:F0603
资助金额:54.00
项目类别:面上项目
2

面向大规模数据的多示例学习

批准号:61403281
批准年份:2014
负责人:王志岗
学科分类:F0605
资助金额:25.00
项目类别:青年科学基金项目
3

面向大规模高维复杂数据的稀疏最优化有监督学习模型与算法

批准号:61877061
批准年份:2018
负责人:张志旺
学科分类:F0610
资助金额:50.00
项目类别:面上项目
4

面向认知的多源数据学习理论与算法

批准号:61632004
批准年份:2016
负责人:于剑
学科分类:F0605
资助金额:265.00
项目类别:重点项目