pbt主要用来自动优化超参数,属于automl方向吧应该是。类似的还有optuna,对于小型的网络的超参数优化效果也不错。准备加上pbt来自动优化神经网络的超参数,但是pbt的实现没发现有太好的,stable baselines目前还不支持,rllib支持,Guide to Population Based Training (PBT) — Ray v1.9.0,但是rllib的使用较为繁琐。纠结