针对复杂连续系统的学习控制问题,设计一类有效的基于支持向量机的强化学习控制方法。内容包括:强化学习系统知识的表达和利用、基于概率型支持向量分类机的强化学习、支持向量机时间滚动式优化学习算法、基于在线聚类分析的个体支持向量机建立、基于多目标优化的个体支持向量机输出结论的选择性集成。通过研究,为提高系统的学习收敛速度,通过给系统融入恰当的实时、动态知识,拟提出基于支持向量回归/分类机的强化学习;为提高系统的学习精度和泛化性能,拟提出基于集成支持向量机的强化学习;通过在倒立摆平衡控制和移动机器人自主导航问题中的应用,验证上述强化学习控制方法的可行性和有效性。研究成果将深化和丰富现有的强化学习理论,进一步扩大强化学习方法的应用范围,增强其解决实际问题的能力。本项目是自动化、机器学习、统计学习与人工智能有机结合的新颖交叉研究方向,具有广阔的研究前景。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
基于LASSO-SVMR模型城市生活需水量的预测
基于SSVEP 直接脑控机器人方向和速度研究
拥堵路网交通流均衡分配模型
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
基于支持向量机的增量式强化学习技术及其应用研究
非线性系统基于支持向量机的逆系统控制方法研究
非线性系统基于支持向量机的智能建模与控制方法研究
基于结构学习的非平行支持向量机最优化方法研究