面向移动互联网流量的行为特征和自适应分类方法研究

基本信息
批准号:61501128
项目类别:青年科学基金项目
资助金额:19.00
负责人:刘珍
学科分类:
依托单位:广东药科大学
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:蔡先发,唐德玉,李志文,陈伟,谢晓玲
关键词:
行为特征概念漂移集成学习移动互联网流量分类多类不平衡
结项摘要

As mobile network traffic becomes larger and larger nowadays, mobile network faces how to guarantee the QoS and security of terminal apps. Internet traffic classification techniques have been shown as the important foundation of network management. However, most existing traffic classification techniques are based on wired network, which cannot be directly used for handling the challenges faced by mobile network. The obstacles are as follows. 1) It is hard to labeling the mobile network traffic class, as L7-filter cannot effectively build the ground truth for the traffic generated by new terminal apps. 2) Most flow statistical features are not stable as the mobile network environment changes constantly, and the traffic classifier cannot adapt the change of network environment. By targeting on breaking through these bottlenecks, we study the taxonomy rules of traffic classes and devise a method for obtaining the ground truth of mobile network traffic, so as to build the benchmark datasets. Through researching on the behavior modeling method for mobile terminal apps, we extract stable behavior features from behavior model. The behavior features are used to characterize the benchmark datasets and further build flow sample sets so as to be used for the following research. Applying ensemble learning, negative correlation learning and concept drift detecting theories, we study the adaptive traffic classification method. This project will provide basic theories to guide future researches on mobile network traffic classification techniques.

当前移动互联网流量呈爆炸式增长,面临如何保障终端应用的服务质量和安全等问题。互联网流量分类技术是实施网络管理的重要基础,但是目前大多研究仍然聚焦于有线网的流量分类技术,它们难以有效运用于应对移动互联网面临的问题,困难主要表现在:1)传统L7-filter方法难以胜任新型终端应用流量的类别标记,移动网络流量类别标记困难;2)移动网络环境易变,流量统计特征也随之变化,流量分类器难以适应网络环境的变化。本项以突破上述瓶颈为目标,研究适合移动终端应用的流量类别归类规则,设计移动互联网流量的类别标记方法,进而构建基准数据集;研究移动终端应用的行为建模方法,在行为模型上提取较稳定的行为特征;采用行为特征描述基准数据集,构建流样本集;在此基础上,利用集成学习、负相关学习和概念漂移探测理论,研究能自适应网络环境的流量分类方法。通过本项研究,为移动互联网流量分类技术的研究提供理论基础和科学依据。

项目摘要

当前移动互联网流量呈爆炸式增长,面临如何保障终端应用的服务质量和安全等问题。互联网流量分类技术是实施网络管理的重要基础,但是移动互联网流量分类研究面临流量数据标记困难,分类模型难以适应网络环境变化。本项目研究移动互联网流量数据标记方法、行为特征提取与选择和自适应移动互联网流量分类方法三个方面的内容。针对移动互联网流量数据标记,本项目开发了Android移动设备流量数据自动采集与标记系统,建立并公开了带有App类别标签的基准数据集;为进一步扩充标记数据集,本项目基于报文头部、报文载荷和流统计特征提出了有标记流量数据的扩充方法。针对行为特征提取与选择,本项目研究了网络流内的行为并提出了流统计特征集合;为选择稳定的最优特征子集,本项目提出了特征稳定性评估指标和特征选择算法。针对移动互联网流量自适应分类问题,本项目提出了基于模糊能力(fuzzy competence)的概念漂移检测方法,和分类模型更新方法,从而使得分类模型能自适应网络流量数据的变化。针对移动互联网流量的多类不平衡问题,本项目基于加权极限学习机提出一种混合特征级别和算法级别的不平衡学习算法;提出了一种基于客观错分代价矩阵估算的代价敏感学习方法。本项目的工作为移动互联网流量分类方法研究和移动互联网流量管理提供了重要的理论基础和技术支持。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

DOI:10.3864/j.issn.0578-1752.2019.03.004
发表时间:2019
4

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
5

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022

刘珍的其他基金

相似国自然基金

1

移动互联网流量矩阵估计的理论和方法研究

批准号:61672258
批准年份:2016
负责人:谭连生
学科分类:F0205
资助金额:62.00
项目类别:面上项目
2

面向移动互联网流量卸载的超WiFi网络与内容分发模型研究

批准号:61472046
批准年份:2014
负责人:芦效峰
学科分类:F0207
资助金额:80.00
项目类别:面上项目
3

基于数据引力分类方法的互联网非平衡流量早期识别研究

批准号:61472164
批准年份:2014
负责人:彭立志
学科分类:F0205
资助金额:80.00
项目类别:面上项目
4

面向移动互联网的软件测试改进方法研究

批准号:61370103
批准年份:2013
负责人:陆璐
学科分类:F0203
资助金额:73.00
项目类别:面上项目