在基础原料类电子市场环境下,研究新型而实用的动态定价方法对于辅助企业制定自身定价策略,以及为研究电子市场的价格形成机理和信息披露机制具有重要价值。研究表明:采用强化学习方法可以提高定价收益,但是将已有多智能体学习算法应用于定价问题却面临学习模型、收敛速度、算法适应性等方面的一些实际困难。本课题申请研究有效解决这些困难的新型智能定价方法。首先,从模型角度,提出扩展了的马尔科夫博弈学习模型,将状态驱动的学习扩展为效用驱动,解决学习目标不适用问题。进一步,从算法角度,通过建立基于自适应模糊推理的对手模型,将领域知识融入学习算法,提高学习初期的定价收益,解决探索和利用的两难问题。最后,应用逐步精化的思想,先在粗粒度的决策空间上学习,然后根据学习结果逐步细化,从而显著降低样本训练量,解决收敛速度慢的问题。本课题还将建立标准化仿真平台用于定价算法对比测试,并利用该平台研究定价算法的若干宏观特性。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
涡度相关技术及其在陆地生态系统通量研究中的应用
拥堵路网交通流均衡分配模型
内点最大化与冗余点控制的小型无人机遥感图像配准
基于多模态信息特征融合的犯罪预测算法研究
基于模因计算的多智能体迁移强化学习研究
基于多智能体强化学习的多机器人系统研究
基于多智能体强化学习的大规模协作关键技术研究
基于多梯度递推方法的强化学习多智能体系统跟踪控制问题研究