为什么策略梯度法在协作性MARL中如此高效? 译者 | 朱先忠,审校 | 孙淑娟,在协作性多智能体强化学习(multi-agentreinforcement learning:MARL)中,由于其基于策略的性质,通常认为策略梯度(policy ... 网站建设# pg# 协作性# 方法 4年前340