老师,您好。如果说我想要以这套代码来训练机械臂强化学习去到某点的话,我的大概思路是怎么样的呢