In practical applications, for a given classification problem and many candidate classification algorithms, recommending appropriate algorithms for the problem is very important and also one of the challenging problems in the field of data mining. The existing recommendation models are usually constructed based on meta-learning, which employs meta-data to model the interaction between the characteristics of classification data set and the performance of the classification algorithms. The meta-learning based methods ignore the interaction between the data sets and the interaction between algorithms. And it is also difficult to construct the recommendation models while considering the user requirements. In this project, we employ the heterogeneous information network to model the interaction between data sets and classification algorithms. Then, the techniques used for heterogeneous information network are used for classification algorithm recommendation model construction. The research contents include: algorithm-data heterogeneous information network construction, network evolution with the development of the classification technique, algorithm recommendation model construction and the user-guided classification algorithm recommendation. The main contribution of the project it that, the project utilizes the analysis technologies over the heterogeneous information network for classification algorithm recommendation earlier, and it breaks through the limitations of traditional meta-learning based methods. This is beneficial to both the researchers to understanding the processing capacity of classification algorithms and users to applying classification algorithm more effectively.
在实际应用中,对于给定分类问题,面对众多的候选分类算法,如何为用户推荐合适的算法来解决该分类问题就显得尤为重要,同时也是数据挖掘领域挑战性问题之一。已有的推荐模型通常基于元学习来构建,利用元数据来描述分类数据集特征和算法性能间的关系。这种解决方式忽略了数据集间的关系以及算法间的关系,且难以将用户需求纳入到推荐模型构建过程当中。项目采用异构信息网络来对算法和数据集间的关系进行建模,充分考虑数据集间和算法间的关系,利用异构信息网络分析技术来研究算法推荐问题进而构建分类算法推荐模型。项目的研究内容包括:算法-数据集异构信息网络构建,信息网络随分类算法发展的进化演变,推荐模型构建以及用户需求指导下的分类算法推荐。项目主要贡献在于突破传统基于元学习推荐模型的局限,较早运用异构信息网络及其分析技术实现分类算法推荐模型的构建,有利于研究人员更好地理解算法处理能力和算法在实际应用中的有效运用。
如何为用户推荐合适的算法来解决分类问题是一个重要的研究问题,同时也是数据挖掘领域一个具有挑战性的问题。本项目采用异构信息网络来对算法和数据集间的关系进行建模,充分考虑数据集间和算法间的关系,利用异构信息网络分析技术来研究算法推荐问题进而构建分类算法推荐模型。主要研究内容包括:算法-数据集异构信息网络构建,信息网络随分类算法发展的进化演变,推荐模型构建以及用户需求指导下的分类算法推荐。.主要研究进展包括:1)基于算法-数据集间的异构信息网络构建,使用网络的形式对数据集和分类算法之间的关系进行建模,能够更加全面清楚的描述数据集间以及数据集和算法间的联系,蕴含的信息更加丰富;2)分类技术发展下的异构信息网络进化演变分析,分析了合适算法随分类技术发展的演化过程;3)基于链路预测的分类算法推荐,取得了更好的推荐效果;4)用户需求引导下的基于网络元路径分析的分类算法推荐,將用戶需求嵌入到算法推荐过程中。.为了获得更好的分类算法推荐效果:1)提出了一种基于单一链接预测的分类算法推荐方法,创新性地提出了使用链接预测方法的分类算法推荐方法;2)提出了集成多标签学习的分类算法推荐方法,从理论上证明了构造有效的集成学习器的充分必要条件,并根据证明所得结论构造了更有效的分类算法推荐模型。3)提出了一种改进的数据集特征提取方法及一种基于聚类的分类算法推荐方法,为构造更佳的分类算法推荐模型提供了基础。.针对所提方法,项目进行期间共发表学术论文7篇,其中SCI检索论文5篇,EI检索论文2篇,国际会议论文2篇,申请发明专利1项,培养硕士研究生3名,协助培养博士研究生2名。.项目的研究成果有助于提高分类算法推荐的效果,为用户选择分类算法提供帮助。
{{i.achievement_title}}
数据更新时间:2023-05-31
监管的非对称性、盈余管理模式选择与证监会执法效率?
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究
移动环境下基于异构空间信息网络的社会化服务推荐研究
基于隐特征抽取的异构数据分类方法研究
基于异构信息网络的服务发现与组合研究
基于深度学习的推荐算法研究