现在刚开始和导师做深度强化学习方面的东西,会和课程学习结合(主要是训练机械臂学会根据任务的难易度从简单到难自主训练),算法是SAC。一直苦于自己摸索,过程很痛苦,想找个人交流一下。