pg

共 1 篇文章

排序

发布更新浏览点赞

为什么策略梯度法在协作性MARL中如此高效？

为什么策略梯度法在协作性MARL中如此高效？

译者 | 朱先忠,审校 | 孙淑娟,在协作性多智能体强化学习（multi-agentreinforcement learning：MARL）中，由于其基于策略的性质，通常认为策略梯度（policy ...

网站建设 # pg # 协作性 # 方法

4年前

470

小红书
抖音
花瓣
腾讯视频
哔哩哔哩
子比主题
添加应用
折叠Dock
隐藏Dock
网站提交