上一章传送门:

到目前为止,对于状态反馈控制器设计方法都是基于状态变量全是已知的。然而在很多情况下,这是不可能抑或是技术上有很大难度。那么对于那些未知的状态变量,如何才能借助仅有的可测的输出变量以及已知的输入变量来求得?这就是状态观测器的思想的由来。现在依然基于线性时不变的MIMO系统来设计状态观测器。

(9.1) [公式]

其中状态变量 [公式] ,输入变量 [公式] ,被测得的输入变量 [公式],动态矩阵 [公式] ,控制矩阵 [公式] ,测量矩阵 [公式] 

9.1平凡观测器

使用受控对象本来的模型模拟受控对象(Simulation des Streckenmodells)是估计状态变量的最简单的方式。用于模拟的模型是

(9.2) [公式]

[公式] 是对实际状态变量的估计变量,直接这样设计一个观测器,称为平凡观测器(trivialer Beobachter),或者被称为模拟器(Simulator)。而模拟器究竟能模拟到什么程度,可以用观测误差 [公式] 来衡量。它能展示实际状态值和模拟器估计值之间的误差。

自然估计误差 [公式] 也会满足微分方程

(9.3) [公式]

估计误差的动态显然是由原本系统决定的,如果原本系统渐近稳定,那么误差动态也是渐近稳定的。此外,如果估计误差的衰减行为或者说是误差动态在稳定的系统里也不受影响。也就是说,如果直接使用平凡观测器并不能消去估计误差,主要的原因就是平凡观测器并没有使用输出变量 [公式] 的测量值,所以没法被影响。

9.2 完全Luenberger观测器

在平凡观测器的基础上,有改良过的所谓的Luenberger观测器。

它包含模拟器和修正器两部分。

(9.4) [公式]

图9.1 Luenberger观测器框图

Luenberger观测器有一个用输出向量误差 [公式] 来权衡以及修正观测器估计值,而观测器增益矩阵 [公式] 就是这个修正权重。继续考察新的误差微分方程

(9.5) [公式]

这是一个和前面设计状态反馈控制器类似的齐次微分方程,为了让估计误差在 [公式] 时收敛于零,只需要选择合适的观测器增益矩阵 [公式],使得合成误差动态矩阵 [公式] 的特征值都处在左半平面,即合成的误差动态是渐近稳定的。

而这个新的Luenberger增益 [公式] 就似乎和之前的Kalman增益 [公式] 类似。观察它们

(9.6) [公式]

显然, [公式] 就对应了原系统的对偶系统使用了状态反馈控制器设计后的 [公式] 。对偶系统为

(9.7) [公式]

对偶系统的反馈控制律为

(9.8) [公式]

之后可以如法炮制,类比反馈控制器来设计MIMO系统的Luenberger观测器的反馈增益。

由于MIMO系统复杂且耦合度高,这里只先讨论使用Ackermann公式来设计SISO的观测器的增益的情况。即这样的SISO系统

(9.9) [公式]

待设计的观测器模型为

(9.10) [公式]

它的误差动态方程为

(9.11) [公式]

因为对偶系统具有以下性质

(9.12) [公式]

于是仿照原来Ackermann公式,会有

(9.13) [公式]

其中 [公式] 自变量为 [公式] 特征多项式 [公式]

所以转置之后,观测器增益为

(9.14) [公式]

定理9.1 对SISO系统的状态观测器使用的Ackermann公式
当系统完全能观时,估计误差动态矩阵 [公式] 的特征值可以通过Luenberger增益任意自由配置。反馈增益向量为
(9.15) [公式]
其中 [公式] 是能观矩阵逆矩阵的最后一行,而系数 [公式] 为期望特征多项式 [公式] 的系数。

设计观测器的特征值时,为了尽快让模拟器的状态估计值逼近实际值,而不再有观测估计误差,应该尽可能让观测器的特征值的实部绝对值设计的大一点,至少误差衰减速度要比系统动态矩阵的主导特征值要更快。

测量噪声的影响

理论上来说,观测器误差动态的特征值可以设置得任意远,因为没有像设计状态反馈控制器一样得输入阈值限制。但是实际中却总会出现很多测量噪声 [公式] 直接影响到测量值。

(9.16) [公式]

如果把测量噪声再考虑进来,那么估计误差的动态为

(9.17) [公式]

所以如果让观测器增益的特征值设计过大,导致增益矩阵 [公式] 过大,由于非齐次方程动态无法收敛到零,增益矩阵 [公式]对测量误差 [公式] 反而有放大作用。

9.3 分离原理

到目前为止,控制器和观测器的设计都是分开单独设计的。当两者同时设计时,会怎么样呢?

考察线性时不变系统

(9.18) [公式]

以及对应的状态观测器

(9.19) [公式]

以及基于状态估计值 [公式] 的状态反馈控制律

(9.20) [公式]

因为之前的反馈控制增益 [公式] 以及观测增益 [公式] 都是分开设计,现在合并在一起设计的话,就要考虑它们组合在一起后的闭环系统动态矩阵的稳定性。

于是需要考察扩展状态 [公式]  [公式] 以及扩展状态方程

(9.21) [公式]

扩展状态方程同时考虑了系统状态变量以及估计误差变量的动态,而参考输入信号 [公式] 可以实现对闭环系统的导引。

图9.2 状态控制器和观测器的组合

最后合成的总系统扩展动态矩阵 [公式] 的特征值为

(9.22) [公式]

所以系统的合成动态矩阵的特征值分别为独立的反馈控制增益 [公式] 以及观测增益 [公式]两部分各自的特征值多项式乘积。这就是所谓的分离原理(Separationsprinzip),也就是说系统的状态反馈控制器和状态观测器可以分别独立设计再最后合成。

定理 9.2 分离原理
式(9.1)系统如果完全能观能控。那么合成后的闭环系统的合成的特征值多项式 [公式] 为状态控制器的特征多项式 [公式] 和观测器的特征多项式 [公式] 的乘积
(9.23) [公式]

当联合设计观测器和反馈控制器时,观测器增益后新动态特征值不是 [公式]  [公式] 比较,而是和 [公式] 的特征值比较。总的设计可以遵循以下流程:

1) 检验受控系统的能观性和能控性

2) 设计状态反馈控制律 [公式]

3) 借助 [公式] 的特征值来确定观测器极点

4) 计算检验观测器增益 [公式] 。比如借助对偶系统设计控制器时,如果选择LQR设计观测器,那应该之后借助观测器特征值来检验从3)中的预给值是否满足设计要求。

9.4 干扰信号的处理(扰动观测器)

在前文提到过对外界干扰信号的处理手段,一种是建立扰动变量串接补偿项,另一种是使用PI控制器。这两种手段都是基于扰动项是满足这样的线性形式

(9.24) [公式]

来对系统作用的,其中扰动 [公式] ,扰动输入矩阵 [公式] 。然而很多情况下可能不是恒定的扰动,但是如果能够知道干扰信号的信息对于设计扰动变量串联补偿项是很有用。有几种比较常见的扰动信号类型:恒定扰动信号,周期扰动信号以及衰减扰动信号。

恒定扰动信号

比如库仑摩擦力,扰动模型为

(9.25) [公式]

图9.3 恒定扰动信号

周期扰动信号

比如恒定频率的扰动,扰动模型为

(9.26) [公式]

图9.4 周期扰动信号

衰减扰动信号

比如反应器里的化学反应动态,扰动模型为

(9.27) [公式]

图9.5 衰减扰动信号

而当扰动信号是不可测的时候,就无法直接设计扰动变量串联补偿项,而这时候就可以使用扰动变量观测器来估计输入的干扰信号。不过这样就必须先知道扰动的类型。这样才能建立起扰动变量模型

(9.28) [公式]

从而能够联合原系统动态方程得到增广的模型

(9.29) [公式]

可以仿照之前联合设计观测器控制器时,也对这样的联合系统使用Luenberger观测器。这样估计扰动变量 [公式] 就可以得到补偿后的控制律

(9.30) [公式]

图9.6 增广的误差模型

9.5 降维观测器

完整的Luenberger观测器会估计全部的状态变量,不过会有一些状态变量,它们本身是能通过对输出变量的测量以及一些状态变量之间线性组合的关系,知晓部分的状态变量信息。比如只有一维的标量系统

(9.31) [公式]

显然可以直接从输出方程知道唯一的状态变量 [公式] 的全部信息,对于高维数的状态方程,也可以通过输出方程来获得状态变量的信息,对于一个MIMO的系统

(9.32) [公式]

其中状态变量 [公式] ,输入变量 [公式],系统动态矩阵 [公式] ,控制输入矩阵 [公式],而测量矩阵 [公式] ,但是 [公式] 。接下来我们可以把状态变量分割成通过 [公式] 能观测到的状态变量,以及不能的部分,通过可逆变换矩阵 [公式] 坐标变换,得到的新的状态变量坐标

(9.33) [公式]

其中 [公式] 对应了不能观测部分的状态变量的变换关系。所以有变换

(9.34) [公式] 其中 [公式]  [公式]

其中有矩阵块 [公式] , [公式] , [公式] , [公式] 。这种表示方法下的系统坐标被称为传感器坐标(Sensorkoordinaten),因为实际用到的传感器能测量的值就是其新状态变量的值。因为 [公式] ,现在再使用一个观测器增益 [公式] 来构造新的状态变量 [公式]

(9.35) [公式]

对其求导,得到新的状态方程

(9.36) [公式]

因为 [公式]  [公式] 都一直已知,可以把这两者一同视作输入,而未知的状态变量 [公式] 可以设计一个平凡观测器来模拟并观测

(9.37) [公式]

所以新坐标的观测误差 [公式] 可以用下面的误差动态来描述

(9.38) [公式]

而我们也能直接获得不可直接观测的状态变量 [公式]

(9.39) [公式]

定理9.3 降维Luenberger观测器
当系统的测量矩阵 [公式] 满足 [公式] ,其完全能观。那么就可以在传感器坐标下,使用减少维数的降维观测器,式(9.37)以及式(9.39)来观测并重构剩下未知的状态变量 [公式] 。其中会用到降维的观测器增益 [公式] 来任意配置观测误差的动态特性。

借助估计状态变量 [公式] 以及测量输出值 [公式] 可以在可逆坐标变换矩阵帮助下,求得原坐标下所有状态变量。

(9.40) [公式]

类比MIMO系统的控制器设计观测器增益也可以通过对测量误差预给的特征多项式,来不唯一地确定观测器误差动态。在SISO系统中 [公式] 观测器增益 [公式] 就能通过特征多项式系数比较,唯一确定了。

降维观测器最大的意义体现在,可以用更少的传感器去读取一些状态变量或者输出测量变量的实时信息,节省了开销,提高了观测器的效率。

例9 降维观测器的设计

考虑之前的线性化以后的倒立摆模型,小车位置 [公式] 以及摆动角 [公式] 。原来的状态方程为

(9.41) [公式]

原有的状态变量为 [公式]  [公式] 。为了降低观测维度,重新排列坐标顺序,假设小车的位置以及倒立摆的摆角两个状态量都能测量,则新的传感器坐标下有 [公式] , [公式] , 有新的状态方程

(9.42) [公式]

省去一些直接可读变量以后,所需的观测器是只有二阶的降维观测器。观测器增益 [公式] 需要选择

(9.43) [公式]

比如期望的特征值只需满足 [公式] ,即

(9.44) [公式]

所以最终的降维观测器为

(9.45) [公式]

本章粗略讨论了一下在控制器设计过程中出现的观测器的作用以及设计方法,下一章要讨论输出信号如何跟踪输入信号。

下一章:

善道:线性系统控制入门(十)轨迹追踪反馈控制

参考文献:

[1]Regelungstechnik B (Zustandsraummethoden) (WS 2019), Prof. Dr.-Ing. Knut Graichen

Lehrstuhl für Regelungstechnik, Friedrich-Alexander-Universität Erlangen-Nürnberg