多源域集成迁移学习的研究

基本信息

批准号：61876166

项目类别：面上项目

资助金额：62.00

负责人：杨云

学科分类：

依托单位：云南大学

批准年份：2018

结题年份：2022

起止时间：2019-01-01 - 2022-12-31

项目状态：已结题

项目参与者：李昕洁,杨珀,谢诚,何臻力,谢仲文,何云,李信发,郭竞,赵航

关键词：

特征提取多源领域深度学习迁移学习集成学习

结项摘要

Supervised learning algorithms require the assumption of that training and testing datasets satisfy the same distribution, thus the classifier constructed on training dataset is capable of classifying the test dataset. However, in practical, the well trained classifiers may deal with the testing set that is distributed differently from the training set, in other words, the knowledge of the known fields (Source domain) has to be used to solve the unknown areas (Target domain), and this is the main purpose of transfer learning. Homogenous transfer learning and instance-based transfer learning algorithms have been studied intensively, however, more and more applications in our real life are producing complex and heterogeneous multi-source datasets. Due to the large differences in data distribution among multi-source domains, the features may be heterogeneous, which poses a big challenge for multi-source transfer learning. This project will start from the idea of ensemble learning and put forward a multi-source domain transfer learning model based on consensus solution to solve the following major problems: (1) For heterogeneous data distribution that may exist in multiple sources, we intend to use deep auto-encoder and mutual information to calculate the common feature space between source domain and target domain. Thus the information of the source domain can be well used. (2) By using the co-training algorithm, the reliability of sampling scheme is significantly improved during instance-transfer learning process. Thus the risk of negative transfer may be well reduced.(3) In association with feature engineering in deep learning, ensemble learning, co-training and the theory of information entropy, we construct a new fusion mechanism of multiple weak learners to further improve the robustness and accuracy of multi-source ensemble ransfer learning. As a summary, the project will put forward a more cutting-edge theoretical research on the multi-source transfer learning based on the ensemble learning, the research output will have a high theoretical and practical value.

迁移学习可以使用已知领域的知识解决不同领域的问题，通过已有的训练数据集建立的分类器可以处理与其训练数据集分布不同的测试数据集。而现实生活中越来越多的应用领域涉及到多源域数据迁移，且往往多个源域之间数据分布差异较大，如何合理并有效地利用多源域的可迁移信息成为了多源迁移学习研究的热点。本课题提出基于集成学习框架的多源域迁移学习模型，以解决以下主要问题：（1）针对多源域存在的异构数据分布，使用深度自动编码器结合互信息理论求解领域之间的共享特征空间表示。（2）引入协同训练方案，提高实例迁移中样本采集的可靠性，避免负迁移现象的产生。（3）通过集成学习思想结合信息熵理论，构造一种全新的融合函数，提高多源迁移学习的鲁棒性和精确度。综上所述本课题将在深度学习特征提取、集成学习、协同训练和互信息理论的基础上，对多源域迁移学习提出较为前沿的理论研究，其研究成果必将具有较高的理论和应用价值。

项目摘要

迁移学习打破了传统机器学习对训练数据和测试数据相同特征空间以及数据分布的假设，通过将一个领域中获得的知识有效迁移到其他不同但相似领域的学习任务中，以提高算法模型在新领域中的学习能力。然而，在实际应用中，复杂的数据分布制约了相关技术的进一步落地，如何消除领域差异，从而充分利用可迁移信息来建立高鲁棒性的迁移模型，成为迁移学习研究的热点。.本项目充分考虑源领域与目标领域在特征空间上的差异性以及分类器的可靠性和精确度的要求，构建了多个具有多视角、高鲁棒性、泛化能力强的集成迁移学习模型，取得以下成果：1）使用深度学习技术，从模型训练到特征表示，提出有效的迁移学习特征提取方法，构建了源域和目标域之间的优质共享特征空间；2）探索了协同训练机制在迁移学习中的有效切入点，可通过该机制对源域数据、目标域数据分别进行筛选来共同促进迁移模型的训练；3）研究了基于互信息、最大均值差异等源域和目标域之间的相似度度量方式，并以此建立合理的集成学习加权机制，构建了多特征、多源域等情况下的集成迁移学习模型；4）探究了集成迁移学习模型在实际应用中的可扩展性问题，在智慧医疗、智慧安防等领域进行了实际落地应用，有效推动智能计算方法的落地应用，提升云南省人工智能领域研发水平，对加速建设云南省科技强省进程、促进地区经济与社会发展具有重要战略意义。.综上所述，本项目结合迁移学习与集成学习，提出了一系列较为前沿的集成迁移学习基础研究理论，并将相关研究成果应用关于智慧医疗、智慧安防等领域，具有较高的理论和实用应用价值。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：

发表时间：2020

DOI：10.3788/CJL201946.0801003

发表时间：2019

DOI：10.13609/j.cnki.1000-0313.2022.04.019

发表时间：2022

DOI：

发表时间：2021

杨云的其他基金

批准号：81502416

批准年份：2015

资助金额：18.00

项目类别：青年科学基金项目

批准号：61663046

批准年份：2016

资助金额：40.00

项目类别：地区科学基金项目

批准号：21101168

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

批准号：21471117

批准年份：2014

资助金额：85.00

项目类别：面上项目

批准号：41271447

批准年份：2012

资助金额：75.00

项目类别：面上项目

批准号：51872325

批准年份：2018

资助金额：60.00

项目类别：面上项目

批准号：21101120

批准年份：2011

资助金额：30.00

项目类别：青年科学基金项目

批准号：61402397

批准年份：2014

资助金额：26.00

项目类别：青年科学基金项目

批准号：11201056

批准年份：2012

资助金额：22.00

项目类别：青年科学基金项目

相似国自然基金

基于多源域脑电信号特征矩阵的选择性深度迁移学习方法研究

批准号：61802177

批准年份：2018

负责人：杭文龙

学科分类：F0214

资助金额：25.00

项目类别：青年科学基金项目

多源异构数据中基于迁移学习的事件检测研究

批准号：61703109

批准年份：2017

负责人：杨振国

学科分类：F0310

资助金额：26.00

项目类别：青年科学基金项目

多源异质用户下基于迁移学习的跨领域推荐研究

批准号：71901162

批准年份：2019

负责人：吕萌

学科分类：G0112

资助金额：18.00

项目类别：青年科学基金项目

集成主动学习和众包技术的迁移学习算法研究

批准号：61603240

批准年份：2016

负责人：邵浩

学科分类：F0603

资助金额：19.00

项目类别：青年科学基金项目

多源域集成迁移学习的研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

基于多色集合理论的医院异常工作流处理建模

基于腔内级联变频的0.63μm波段多波长激光器

结直肠癌免疫治疗的多模态影像及分子影像评估

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

杨云的其他基金

肝星状细胞microRNA-199在肝硬化及肝癌发生中的作用和机制研究

针对时间序列聚类问题的特征学习与集成学习研究

新型复合碱金属硼酸盐紫外非线性光学材料的研究

软模板法合成贵金属纳米棒阵列以及表面增强拉曼光谱研究

面向国外地理信息提取的地图图像智能化处理方法研究

短波长非线性光学晶体硼酸铯钡生长及性能研究

通过选择性刻蚀可控制备贵金属纳米结构

混合式聚类集成算法的研究

中心仿射微分几何若干问题研究

相似国自然基金