无人驾驶轨迹跟踪仿真——线性时变模型预测代码详解

对照推导的公式,对代码进行一一详细注解,方便学习代码的同学。该代码为龚建伟《无人驾驶车辆模型预测控制》中第3章3.3.3的例子。

1 公式推导

这一部分的推导过程,比我上一篇文章的推导较简单一些,主要表现在三个方面:第1是控制量由前轮转角δ变成了角速度ω,第2是没有对状态量和控制量进行组合,第3是代价函数没有添加松弛变量。
具体的推导过程,我放上了我的手稿。
1

推导公式中的矩阵形式,以及最终的二次规划形式在后边的代码中都有所体现,我会在代码部分作出解释。

2 代码部分

代码共分为了5部分。

2.1 参考轨迹生成

参考轨迹为Y=2的一条直线

N=100;                                   %参考轨迹点的数量
T=0.05;                                  %采样周期
Xout=zeros(N,3);                         %生成N行3列的0矩阵,为参考点矩阵
Tout=zeros(N,1);                         %生成N行1列的0矩阵
for k=1:1:N
    Xout(k,1)=k*T;                       %第1列表示x值
    Xout(k,2)=2;                         %第2列表示y值
    Xout(k,3)=0;                         %第3列表示φ值
    Tout(k,1)=(k-1)*T;                   %为时刻矩阵
end

2.2 常量参数赋值

Nx=3;                                     %状态量个数
Nu =2;                                    %控制量个数
Tsim =20;                                 %文中注解仿真时间,我认为是预测时域Np
X0 = [0 0 pi/3];                          %初始位置的状态
[Nr,Nc] = size(Xout);                     %取Xout矩阵的行数和列数分别赋值给Nr和Nc
L = 1;                                    %车辆轴距
Rr = 1;                                   %轮胎直径
w = 1;                                    %车轮转速
vd1 = Rr*w;                               %参考系统的纵向速度
vd2 = 0;                                  %参考系统的角速度

2.3 定义矩阵

x_real=zeros(Nr,Nc);                       %状态量矩阵   
x_piao=zeros(Nr,Nc);                       %状态量误差矩阵
u_real=zeros(Nr,2);                        %控制量矩阵 
u_piao=zeros(Nr,2);                        %控制量误差矩阵
x_real(1,:)=X0;                            %把初始状态赋值给状态量第一行
x_piao(1,:)=x_real(1,:)-Xout(1,:);         %计算第一个状态量误差
X_PIAO=zeros(Nr,Nx*Tsim);
XXX=zeros(Nr,Nx*Tsim);                     %用于保持每个时刻预测的所有状态值
q=[1 0 0;0 1 0;0 0 0.5];                   %状态量的权重系数
Q_cell=cell(Tsim,Tsim);
for i=1:1:Tsim
    for j=1:1:Tsim
        if i==j
            Q_cell{i,j}=q;
        else 
            Q_cell{i,j}=zeros(Nx,Nx);
        end 
    end
end
Q=cell2mat(Q_cell);                         %将多个矩阵合并成一个矩阵,得到权重系数矩阵Q
R=0.1*eye(Nu*Tsim,Nu*Tsim);                 %权重系数矩阵R

2.4 MPC的预测和优化

for i=1:1:Nr
    t_d =Xout(i,3);                         %取航向角φ
    a=[1    0   -vd1*sin(t_d)*T;
       0    1   vd1*cos(t_d)*T;
       0    0   1;];                        %状态量系数矩阵
    b=[cos(t_d)*T   0;
       sin(t_d)*T   0;
       0            T;];                    %控制量系数矩阵   
    A_cell=cell(Tsim,1);
    B_cell=cell(Tsim,Tsim);
     for j=1:1:Tsim
        A_cell{j,1}=a^j;                    %A_cell为 ψ 矩阵的分量
        for k=1:1:Tsim
           if k<=j
                B_cell{j,k}=(a^(j-k))*b;    %B_cell为 θ 矩阵的分量
           else
                B_cell{j,k}=zeros(Nx,Nu);
           end
        end
    end
    A=cell2mat(A_cell);                     %合并A_cell生成 ψ 矩阵
    B=cell2mat(B_cell);                     %合并B_cell生成 θ 矩阵
    
    H=2*(B'*Q*B+R);                         %二次规划中的H
    f=(2*x_piao(i,:)*A'*Q*B)';              %二次规划中的f
   
    %% 约束条件
    A_cons=[];                              %不等式约束的系数矩阵
    b_cons=[];                              %不等式约束的值
    lb=[-1;-1];                             %自变量约束下界
    ub=[1;1];                               %自变量约束上界
    tic                                     %用来保存当前时间
    [X,fval(i,1),exitflag(i,1),output(i,1)]=quadprog(H,f,A_cons,b_cons,[],[],lb,ub);   %%二次规划函数求解
    toc                                     %用来记录程序完成时间
    X_PIAO(i,:)=(A*x_piao(i,:)'+B*X)';      %输出矩阵Y
      
      %% 输出每个时刻预测的所有的状态量
      %% i表示时刻k,预测时域值为20,则当时刻k=80开始后,预测到的时刻要超100了,所以之后都取100时刻的值。
    if i+j<Nr
         for j=1:1:Tsim
             XXX(i,1+3*(j-1))=X_PIAO(i,1+3*(j-1))+Xout(i+j,1);
             XXX(i,2+3*(j-1))=X_PIAO(i,2+3*(j-1))+Xout(i+j,2);
             XXX(i,3+3*(j-1))=X_PIAO(i,3+3*(j-1))+Xout(i+j,3);
         end
        
    else
         for j=1:1:Tsim
             XXX(i,1+3*(j-1))=X_PIAO(i,1+3*(j-1))+Xout(Nr,1);
             XXX(i,2+3*(j-1))=X_PIAO(i,2+3*(j-1))+Xout(Nr,2);
             XXX(i,3+3*(j-1))=X_PIAO(i,3+3*(j-1))+Xout(Nr,3);
         end
    end
    u_piao(i,1)=X(1,1);                     %将二次规划的第一个解的x值赋值给控制量矩阵当前时刻x值
    u_piao(i,2)=X(2,1);                     %将二次规划的第一个解的y值赋值给控制量矩阵当前时刻y值
    Tvec=[0:0.05:4];
    X00=x_real(i,:);                        %将当前时刻的状态量赋值给X00
    vd11=vd1+u_piao(i,1);                   %当前时刻的纵向速度
    vd22=vd2+u_piao(i,2);                   %当前时刻的角速度
    
    %% 基于控制量计算下一时刻的状态量
    XOUT=dsolve('Dx-vd11*cos(z)=0','Dy-vd11*sin(z)=0','Dz-vd22=0','x(0)=X00(1)','y(0)=X00(2)','z(0)=X00(3)');
     t=T; 
     %% 记录下一时刻的状态量
     x_real(i+1,1)=eval(XOUT.x);
     x_real(i+1,2)=eval(XOUT.y);
     x_real(i+1,3)=eval(XOUT.z);
     if(i<Nr)
         x_piao(i+1,:)=x_real(i+1,:)-Xout(i+1,:); %计算下一时刻的误差
     end
    u_real(i,1)=vd1+u_piao(i,1);  
    u_real(i,2)=vd2+u_piao(i,2);              %当前时刻的控制量矩阵
    
    figure(1);
    plot(Xout(1:Nr,1),Xout(1:Nr,2));          %作图参考轨迹点x-y
    hold on;
    plot(x_real(i,1),x_real(i,2),'r*');       %作图状态量x-y
    title('跟踪结果对比');
    xlabel('横向位置X');
    axis([-1 5 -1 3]);
    ylabel('纵向位置Y');
    hold on;
    for k=1:1:Tsim
         X(i,k+1)=XXX(i,1+3*(k-1));           %每个时刻的预测值x
         Y(i,k+1)=XXX(i,2+3*(k-1));           %每个时刻的预测值y
    end
    X(i,1)=x_real(i,1);   
    Y(i,1)=x_real(i,2);
    plot(X(i,:),Y(i,:),'y')                   %所有时刻的预测值x-y
    hold on;
    
end

注:代码每一个x_piao的分量在形式上是与推导中是转置的关系,所以在二次规划表达式中 f 的表达式可以看出来。如图1所示:
在这里插入图片描述

2.5 绘图

figure(2)
subplot(3,1,1);
plot(Tout(1:Nr),Xout(1:Nr,1),'k--');                      %时刻-参考点 x 值
hold on;
plot(Tout(1:Nr),x_real(1:Nr,1),'k');                      %时刻-状态量 x 值
%grid on;
%title('状态量-横向坐标X对比');
xlabel('采样时间T');
ylabel('横向位置X')
subplot(3,1,2);
plot(Tout(1:Nr),Xout(1:Nr,2),'k--');                      %时刻-参考点 y 值
hold on;
plot(Tout(1:Nr),x_real(1:Nr,2),'k');                      %时刻-状态量 y 值
%grid on;
%title('状态量-横向坐标Y对比');
xlabel('采样时间T');
ylabel('纵向位置Y')
subplot(3,1,3);
plot(Tout(1:Nr),Xout(1:Nr,3),'k--');                      %时刻-参考点 φ 值
hold on;
plot(Tout(1:Nr),x_real(1:Nr,3),'k');                      %时刻-状态量 φ 值
%grid on;
hold on;
%title('状态量-\theta对比');
xlabel('采样时间T');
ylabel('\theta')

figure(3)
subplot(2,1,1);
plot(Tout(1:Nr),u_real(1:Nr,1),'k');                       %时刻-控制量 v 值
%grid on;
%title('控制量-纵向速度v对比');
xlabel('采样时间T');
ylabel('纵向速度')
subplot(2,1,2)
plot(Tout(1:Nr),u_real(1:Nr,2),'k');                       %时刻-控制量 w 值
%grid on;
%title('控制量-角加速度对比');
xlabel('采样时间T');
ylabel('角加速度')

figure(4)
subplot(3,1,1);
plot(Tout(1:Nr),x_piao(1:Nr,1),'k');                       %时刻-控制量误差 x 值
%grid on;
xlabel('采样时间T');
ylabel('e(x)');
subplot(3,1,2);
plot(Tout(1:Nr),x_piao(1:Nr,2),'k');                       %时刻-控制量误差 y 值
%grid on;
xlabel('采样时间T');
ylabel('e(y)');
subplot(3,1,3);
plot(Tout(1:Nr),x_piao(1:Nr,3),'k');                       %时刻-控制量误差 φ 值
%grid on;
xlabel('采样时间T');
ylabel('e(\theta)');

所有图如下所示:
图2
 图2
图3
 图3

图4
图4


本文主要对文中的代码做了较为详细的注释,并针对代码,先对公式进行了推导,其中公式中的矩阵和代码中是一一对应的,在学习代码时,需要仔细对照,希望对各位学习MPC仿真的同学有用,谢谢~
参考1:龚建伟《无人驾驶车辆模型预测控制》