首次研究首达目标总报酬随机序最优模型,在理论分析与算法方面取得重要进展,同行认为在MDP中提出了一种重要的新的优化问题;对折扣报酬的概率准则与最小风险模型提出了一个新的模型框架、解决了多年来未解决的难题:最优策略的存在性及其它基本问题,使该模型取得实质性进展;对多目标平均报酬百分位模型,完满解决了两个公开问题;将模糊准则引入MDP,建立了该准则的一般框架,聚得系列结果;首次给出基于Hopfield神经网络的寻优算法;证明了首达目标总报酬的分布函数由它的有限阶矩唯一确定的重要结论;对已有的随机神经网络模型作了实质上的推广。以上成果有重要的意义与广泛的应用背景,部分成果在国内外同类研究中是领先的。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于一维TiO2纳米管阵列薄膜的β伏特效应研究
敏感性水利工程社会稳定风险演化SD模型
内质网应激在抗肿瘤治疗中的作用及研究进展
煤/生物质流态化富氧燃烧的CO_2富集特性
粉末冶金铝合金烧结致密化过程
炼钢过程控制中混合神经网络模型的研究
聚脲合成反应速度的控制与性能研究
碳热-电化学还原方法直接炼钢的基础研究
Fe3C还原动力学与反应速度控制研究