研究用于求解大规模和连续状态/行为空间序贯决策优化问题的增强学习泛化方法,并将研砍晒糜谝贫魅寺肪豆婊筒蝗范ɑ肪持械淖匝暗己健1究翁獾难芯吭诶砺凵辖俳銮垦胺夯侍獾慕饩觯栽銮垦霸诟丛佑呕涂刂莆侍庵械挠τ镁哂兄匾庖濉T诠こ淌导希杂谝贫魅讼低吃诟丛印⒉蝗范ɑ肪持刑岣咦灾鞯己侥芰τ兄匾饔谩
{{i.achievement_title}}
数据更新时间:2023-05-31
基于国产化替代环境下高校计算机教学的研究
基于综合治理和水文模型的广西县域石漠化小流域区划研究
新型树启发式搜索算法的机器人路径规划
非牛顿流体剪切稀化特性的分子动力学模拟
中国出口经济收益及出口外资渗透率分析--基于国民收入视角
结构化增强学习及其在虚拟人运动规划中的应用
基于手绘语义地图的室内泛在感知网络下移动机器人视觉交互导航研究
策略搜索强化学习方法及在移动机器人运动控制中的应用
动力学对策问题学习与预测算法及其在导航制导中的应用