从本篇开始,连续3篇开始介绍跟性能指标(目标函数)有关的轨迹优化问题
先上图:
![](https://pic1.zhimg.com/80/v2-e29de800eb69b9ee947b08a682677698_720w.jpg)
解释一下三个概念:
(1)镇定:状态x(t)渐近稳定,也就是当t->∞时,x(t)->0
(2)跟踪:状态x(t)的跟踪误差e(t)=z(t)-x(t)或输出y(t)的跟踪误差e(t)=z(t)-y(t)镇定
(3)调节(Regulation):说到英语,其实在机器学习里这个英语单词被翻译为 正则化,而正则化的目的是为了 “避免过拟合”,通常有L1,L2等方法,其实在最优化里面,调节通常用的是输入的L2
![](https://pic3.zhimg.com/80/v2-80118c87b1a31b20754b5cafc6346096_720w.jpg)
这段主要是参考 西北工业大学 郭建国老师的 《现代控制理论》课程,详见可以看MOOC
我们这边还是先考虑最简单的线性系统
![](https://pic3.zhimg.com/80/v2-f363c8378995486a34c0341cc4a53a72_720w.jpg)
状态调节问题:其实就是 状态镇定 + 调节
输出调节问题:其实就是 输出镇定 + 调节
输出跟踪问题:其实就是 输出跟踪 + 调节
以下主要讨论 线性系统的二次型性能指标的轨迹优化问题
即:系统的动力学是线性系统,轨迹优化的目标函数是二次型性能指标的问题
![](https://pic3.zhimg.com/80/v2-769ded1ac161e26441100a5d98c96392_720w.jpg)
目标函数的终端指标是二次型,积分指标也是二次型
1. 有限时域线性时变系统状态调节
![](https://pic1.zhimg.com/80/v2-4693d447b38ccc3e033422fe003ae6d8_720w.jpg)
采用最优控制里面的最大值原理,按照其步骤写出来:
(1)哈密顿函数
(2)正则方程
(3)控制方程
(4)横截条件
根据横截条件,我们可以做一个假设,哈密顿算子与状态满足线性关系,于是:
![](https://pic4.zhimg.com/80/v2-5032ae1c795316e8771f9b00ab67c53b_720w.jpg)
可以得到一个结论: 矩阵Riccati微分方程,这个方程在最优化问题(最优控制,轨迹优化,最优估计)都扮演着重要的角色
求得Riccati微分方程的解(具体解法可以参考《运动感知》专栏中 《状态估计03. Riccati方程》),进而可以得到最优控制解,于是可以设计出 状态反馈,也就是实现了闭环最优控制,也就是实现了轨迹优化的闭环
2. 无限时域线性定常系统状态调节
![](https://pic2.zhimg.com/80/v2-4f221cbf98d3395235b0cae839579175_720w.jpg)
考虑无限时域,或者换句话来说,稳态性能,于是不需要考虑终端条件,只需要考虑积分条件
这里可以考虑Raccati微分方程,给定终端时刻,逆时间求解出矩阵P(t),一个重要的结论是:矩阵P(t)在远离终端时趋近于一个常数矩阵
***系统能控
3. 无限时域线性定常系统状态调节
![](https://pic2.zhimg.com/80/v2-a7a8e597dafbece9e3649318f6e34ce1_720w.jpg)
矩阵P(t)在远离终端时趋近于一个常数矩阵,于是P(t)的导数也为0,而经典的Raccati微分方程变成了Raccati代数方程
4. 有限时域线性时变系统输出调节
![](https://pic3.zhimg.com/80/v2-6e7e7df750258e59b86485e970196a76_720w.jpg)
与状态调节问题相比,唯一区别在于权值系数矩阵发生了改变
***系统能观测
5. 无限时域线性定常系统输出调节
![](https://pic1.zhimg.com/80/v2-72d54dd88db77c710cd59951c0b28ebc_720w.jpg)
进一步推广到无限时域线性定常系统的输出调节问题,要求系统能控能观测。
6. 有限时域线性时变系统输出跟踪
![](https://pic2.zhimg.com/80/v2-e2b0bead7f69e8835048ffec057b0e31_720w.jpg)
而输出跟踪问题,只是将输出项变成输出跟踪误差项,求解过程的极大值原理相似
![](https://pic1.zhimg.com/80/v2-32f126b74a6951eadc1dce5b3dc2d748_720w.jpg)
只不过此时,线性关系已经不是传统意义的比例项,而是比例项 + 偏置项的一次关系
Raccati微分方程没变,只是多了一个补充微分方程,以及补充边界条件
7. 有限时域线性定常系统输出跟踪
![](https://pic3.zhimg.com/80/v2-294145ed83a42dd3801425dde32b065a_720w.jpg)
除状态和输入项,其他的时变系数均变为常系数
8. 小结
![](https://pic4.zhimg.com/80/v2-5b044627b0d515582cd2c45aa3c1fe6b_720w.jpg)
1-7都可以总结为上图的问题
而1-7只是下图的简化
![](https://pic1.zhimg.com/80/v2-49dc6c54bd10e5046c8836e7a928d430_720w.jpg)
这一篇还存在两个坑:
(1) 矩阵Raccati微分(代数)方程如何求解?
(2) 非线性动力学系统如何求解?
且听以后填坑~~~
Reference
- 西北工业大学 郭建国 《现代控制理论》
评论(0)
您还未登录,请登录后发表或查看评论