Compared with the traditional single machine learning model, ensemble learning could effectively improve the prediction accuracy and robustness of the model, enhance the generalization performance. However, there are still a series of key problems to be solved in the field of ensemble learning prediction. The type, number and loss function of the base model have important influence on the prediction accuracy. In addition, how to conduct accurate and effective dynamic integration of the prediction results of multiple base models and further enhance the interpretability of the models is also an important direction in the study of ensemble learning prediction models. This study will focus on the two typical problems urgently to be solved in ensemble learning prediction research, through transforming the related problem into optimization problem. Utilizing deep learning and reinforcement learning algorithms, we would propose the novel deep feature extraction method, base model selection method and the optimal combination strategy of base models. Then, considering the characteristics and difference of regression and classification task, the whole ensemble learning model would be used on two different research fields, which are cryptocurrency and biomedical, respectively. Finally, the whole ensemble learning model would be further supplemented and improved, aiming to effectively promote the theoretical research and application of big data prediction methods.
相比于传统的单一机器学习模型,集成学习可以有效提升模型的预测精度和稳健性,增强模型的泛化性能。然而,集成学习预测领域仍存在一些亟待解决的关键问题。基模型的种类、个数以及损失函数的确定对集成学习模型的预测精度具有重要影响。此外,如何对多个基模型的预测结果进行精准有效的动态集成,进一步增强模型的可解释性,同样是集成学习预测模型研究中的重要方向。本项研究将针对这两个亟待解决的典型问题,将相关问题抽象成优化问题,结合深度学习、深度强化学习等相关算法,研究基于深度学习方法的新型数据深层特征提取方法,以及基于深度强化学习理论的基模型选择和基模型结果集成策略优化方法,构建适用于各应用领域数据特征和分布规律的自适应集成学习预测框架。考虑回归和分类任务这两种典型预测任务的特点和差异,对数字货币和生物医学两个领域的典型预测问题开展实证研究,对集成学习预测框架进行完善,推动大数据预测方法理论研究和应用的发展。
本项研究主要针对集成学习预测方法中的特征提取、基模型选择及预测结果集成等三个关键问题,研究基于深度学习理论的数据深层特征提取方法,以及基于深度强化学习理论的预测模型集成策略优化方法,构建自适应的集成学习预测框架,并针对重点应用领域的实际问题进行预测框架的实证研究。理论方面,主要是深度学习、集成学习方法的理论创新及应用;实践方面,主要是基于模型的预测结果及相关研究结论,以政策建议的形势为政府有关部门提供决策参考。.理论成果方面,在国内外主流学术期刊和重要国际会议上发表论文11篇,其中第一作者(通讯作者)5篇,SCI/SSCI检索4篇,1 篇论文入选ESI高被引论文;1篇文章被《Handbook of Financial Econometrics, Mathematics, Statistics, and Technology Machine Learning》收录,4篇文章被《中国创新战略与政策研究》一书收录,其中第一作者(通讯作者)2篇;专利和软件著作权正在推进中。二是实践成果方面,上报政策建议4份,1份被国务院参事室采纳并获国家领导人批示,3份被中科院采纳。三是其它成果,参与课题研究的3位博士研究生顺利毕业;本人担任国际会议分论坛主席2次,做报告1次,当选中国发展战略学研究会数字经济战略专业委员会副秘书长。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
基于LASSO-SVMR模型城市生活需水量的预测
中国参与全球价值链的环境效应分析
基于多模态信息特征融合的犯罪预测算法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于深度强化学习的软件持续集成测试优化技术研究
基于深度强化学习的新闻事件预测方法研究
基于深度学习的结构化预测模型研究
基于集成深度学习的植物lncRNA与miRNA互作关系预测研究