首次研究首达目标总报酬随机序最优模型,在理论分析与算法方面取得重要进展,同行认为在MDP中提出了一种重要的新的优化问题;对折扣报酬的概率准则与最小风险模型提出了一个新的模型框架、解决了多年来未解决的难题:最优策略的存在性及其它基本问题,使该模型取得实质性进展;对多目标平均报酬百分位模型,完满解决了两个公开问题;将模糊准则引入MDP,建立了该准则的一般框架,聚得系列结果;首次给出基于Hopfield神经网络的寻优算法;证明了首达目标总报酬的分布函数由它的有限阶矩唯一确定的重要结论;对已有的随机神经网络模型作了实质上的推广。以上成果有重要的意义与广泛的应用背景,部分成果在国内外同类研究中是领先的。
{{i.achievement_title}}
数据更新时间:2023-05-31
东太平洋红藻诊断色素浓度的卫星遥感研究
高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析
基于直觉模糊二元语义交互式群决策的技术创新项目选择
黄土-三趾马红土滑坡滑带土的长期强度影响因素研究
山西省大气PM2.5 污染时空分布特征∗
分枝马氏过程的若干研究
马氏决策过程的理论与应用
风险灵敏的连续时间马氏决策过程
马氏过程边界理论的若干问题