In this project, we study the theory and applications of discrete-time Markov decision processes. The first part is on the theory of discrete-time Markov decision processes. More precisely, we focus on the existence of optimal policies under risk probability criterion, and we also consider the efficient algorithm for computing optimal policies. The second part is on applications of Markov decision processes in probabilistic Boolean networks.The main contributions of applications of discrete-time Markov decision processes are concluded in the following aspects.(1)We solve an optimal control problem by choosing the probabilities of Boolean networks in a probabilistic Boolean networks. (2)We make use of the theory of discrete-time Markov decision processes to solve optimal control problems for probabilistic Boolean networks. The aims of this project are to promote further development of theoretical and applications studies on discrete-time Markov decision processes.
基于离散时间马氏决策过程理论和应用的新进展,本项目拟在已有工作基础上,对离散时间马氏决策过程理论和应用两方面展开研究。理论研究为探索离散时间马氏决策过程风险概率准则意义下最优策略存在的更一般的条件及其算法。应用研究主要包括:(1)研究概率布尔网络中每个布尔网络被选取的概率;(2)利用离散时间马氏决策过程建模,对概率布尔网络中的最优干预问题展开研究。完成本项目中的研究内容能将离散时间马氏决策过程理论和应用研究推向深入。
本项目主要集中于马氏决策过程应用方面的研究。研究内容主要包括:(1)研究概率布尔网络中每个布尔网络被选取的概率;(2)利用半马氏决策过程建模,对概率布尔网络中的最优干预问题展开研究。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于文献计量学和社会网络分析的国内高血压病中医学术团队研究
含饱和非线性的主动悬架系统自适应控制
基于直觉模糊二元语义交互式群决策的技术创新项目选择
城市生活垃圾热值的特征变量选择方法及预测建模
基于卷积神经网络的JPEG图像隐写分析参照图像生成方法
马氏决策过程理论及其在基因调控网络中的应用
风险灵敏的连续时间马氏决策过程
连续时间马氏决策过程受约束问题的研究
马氏决策过程的理论与应用