在基础原料类电子市场环境下,研究新型而实用的动态定价方法对于辅助企业制定自身定价策略,以及为研究电子市场的价格形成机理和信息披露机制具有重要价值。研究表明:采用强化学习方法可以提高定价收益,但是将已有多智能体学习算法应用于定价问题却面临学习模型、收敛速度、算法适应性等方面的一些实际困难。本课题申请研究有效解决这些困难的新型智能定价方法。首先,从模型角度,提出扩展了的马尔科夫博弈学习模型,将状态驱动的学习扩展为效用驱动,解决学习目标不适用问题。进一步,从算法角度,通过建立基于自适应模糊推理的对手模型,将领域知识融入学习算法,提高学习初期的定价收益,解决探索和利用的两难问题。最后,应用逐步精化的思想,先在粗粒度的决策空间上学习,然后根据学习结果逐步细化,从而显著降低样本训练量,解决收敛速度慢的问题。本课题还将建立标准化仿真平台用于定价算法对比测试,并利用该平台研究定价算法的若干宏观特性。
{{i.achievement_title}}
数据更新时间:2023-05-31
肥胖型少弱精子症的发病机制及中医调体防治
EBPR工艺运行效果的主要影响因素及研究现状
外泌体在胃癌转移中作用机制的研究进展
基于铁路客流分配的旅客列车开行方案调整方法
多能耦合三相不平衡主动配电网与输电网交互随机模糊潮流方法
基于模因计算的多智能体迁移强化学习研究
基于多智能体强化学习的多机器人系统研究
基于多智能体强化学习的大规模协作关键技术研究
基于多梯度递推方法的强化学习多智能体系统跟踪控制问题研究