耗时两年,谷歌用强化学习打造23个机器人帮助垃圾分类强化学习(RL)可以让机器人通过反复试错进行交互,进而学会复杂行为,并随着时间的推移变得越来越好。之前谷歌的一些工作探索了 RL 如何使机器人掌握复杂的技能,例如抓取、多任务学习,甚至是打乒乓球。虽然...人工智能# 垃圾分类2年前320