共轭梯度法简介

养生的控制人

分类：机器学习

发布时间 2022.03.18阅读数 4208 评论数 0

å±è½æ¢¯åº¦æ³ç®ä»

共轭梯度法是求解稀疏对称正定线性方程组的最流行和最著名的迭代技术之一。

二次函数与最优解

考虑最小化二次函数

$\phi(x)=\frac{1}{2}x^TAx - x^Tb \tag{1}$

其中 $b,x\in\mathbb{R}^n,A\in\mathbb{R}^{n\times n}$ 且假设矩阵 $A$ 是对称正定的（SPD）。该函数的最小值 $x^*$ 可以根据一阶最优条件得到，即导数为零

$\nabla \phi(x^*)=Ax^*-b=0 \tag{2}$

或

$Ax^*=b \tag{3}$

这也意味着最小化 $\phi(x)$ 等价于求解线性方程 $Ax=b$ 。由于二次函数的Hessian矩阵是半正定的，该解具有唯一性。

线搜法

线搜索方法是一类迭代优化方法，其中迭代由下式给出

$x_{k+1}=x_k+\alpha_k p_k \tag{4}$

它的思想是选择一个初始位置 $x_0$ ，然后每一步沿着一个方向走一步使得函数值满足 $\phi(x_{k+1}) < \phi(x_k)$ ，不同的方法在选择搜索方向 $p_k$ 和步长 $\alpha_k$ 有不同的策略。

最速下降法也许是最直观和最基本的线搜索法。函数的梯度是一个向量，它给出了函数增加最多的方向。最速下降法的策略是：在任何给定点 $x$ 中，函数 $\phi(x)$ 的负梯度给出的搜索方向是最速下降的方向。换句话说，负梯度方向是局部最优的搜索方向。注意对于二次函数而言它的梯度为 $Ax-b$ ，我们也将它称为系统的残差 $r$ 。

我们现在有了搜索方向，但是我们仍然需要知道沿着它走多远。很明显，自然的选择是一直走，直到函数值不再下降，最佳步长 $\alpha_k$ 的表达式很容易得到（将 $x_{k+1}=x_k-\alpha \nabla \phi(x_k)$ 带入二次函数后关于 $\alpha$ 最小化）

$\alpha_k = \frac{r_k^Tr_k}{r_k^TAr_k} \tag{5}$

重复执行找梯度、找步长直到收敛，可以看到最速下降法的相邻搜索方向是正交的。

可以看出最速下降法走的路很曲折，这种曲折的路径显然不是最优最快的，我们应该避免这种来回跑的路径！这也就是共轭梯度法要解决的问题。

共轭梯度法

首先介绍一下共轭方向法，一组向量 $\{p_0,...,p_{n-1}\}$ 关于SPD矩阵 $A$ 是共轭的可以表示为如下的共轭条件： $p_i^TAp_j =0 \quad \forall i\neq j$ 。这样一组向量是线性独立的因此可以张成整个空间 $\mathbb{R}^n$ 。进一步我们可以将最优解和初始值的差表示为共轭向量的线性组合

$x^*-x_0=\sigma_0p_0+...+\sigma_{n-1}p_{n-1}$

利用共轭性可以得到系数和步长是一致的，即

$x^*-x_0=\alpha_0p_0+...+\alpha_{n-1}p_{n-1}$

可以认为这是沿着解空间的维度逐步构建最优解。对于对角矩阵，共轭搜索向量与坐标轴重合。在每一步 $k$ 中， $x_k$ 将精确解 $x^*$ 投影到由 $k$ 个向量所张成的解空间中。

那么如何寻找共轭方向呢？

根据 $A$ 的特征向量形成一个 $A$ -共轭集，但是寻找特征向量计算量太大了；
第二种选择是修改通常的格拉姆-施密特正交化过程。这也不是最佳的，因为它需要存储所有方向。

共轭梯度法在寻找每一个共轭向量 $p_k$ 时只需要利用上一个共轭向量 $p_{k-1}$ ，而不需要记住先前所有共轭向量。每一次迭代用到的新方向是负残差和上一个搜索方向的线性组合。

$p_k=-r_k+\beta_k p_{k-1} \tag{6}$

由于负残差其实就是负梯度方向，这个寻找共轭方向的方法就称作共轭梯度法。其中系数 $\beta_k$ 可以根据共轭条件（ $p_{k-1}^TAp_k=0$ ）得到

$\beta_k=\frac{r_k^TAp_{k-1}}{p_{k-1}^TAp_{k-1}}=\frac{r_k^Tr_k}{r_{k-1}^Tr_{k-1}} \tag{7}$

红色表示最速下降法，绿色表示共轭梯度法

算法流程

计算 $r_0=Ax_0-b,p_0=-r_0$
每一次迭代 $k=0,1,2...$ 直到收敛

$\alpha_k =\frac{r_k^Tr_k}{p_k^TAp_k} \tag{8}$

$x_{k+1}=x_k+\alpha_k p_k \tag{9}$

$r_{k+1}=r_k + \alpha_k Ap_k \tag{10}$

$\beta_k=\frac{r_{k+1}^Tr_{k+1}}{r_k^T r_k} \tag{11}$

$p_{k+1}=-r_{k+1}+\beta_k p_k \tag{12}$

第一步是找出初始残差，其实就是梯度方向。如果初始解 $x_0$ 为零，那么 $r_0$ 和 $p_0$ 简单地变成 $b$ 。在for循环中，公式（8）为步长的计算。在公式（9）通过往共轭方向走一步来更新解。然后在公式（10）更新残差，公式（11）和（12）计算系数和新的搜索方向。

代码示例

这里分别利用最速下降和共轭梯度法来解一个线性方程

%% linear equation Ax=b
A = [4,-2,-1;-2,4,-2;-1,-2,3];
b = [0;-2;3];

%% 最速下降法
x0 = [0;0;0];
iter_max = 1000;
for i = 1:iter_max
    r = A*x0 - b;
    alpha = (r'*r)/(r'*A*r);
    x = x0 - alpha*r;
    if norm(x-x0)<=10^(-8)
        break
    end
    x0 = x;
end

%% 共轭梯度法
x0 = [0;0;0];
r0 = A*x0 - b;
p0 = -r0;
iter_max = 1000;
for i = 1:iter_max
    alpha = (r0'*r0)/(p0'*A*p0);
    x = x0 + alpha*p0;
    r = r0 + alpha*A*p0;
    beta = (r'*r)/(r0'*r0);
    p = -r + beta*p0;
    if norm(x-x0)<=10^(-8)
        break
    end
    x0 = x;
    r0 = r;
    p0 = p;
end

建模仿真机器学习共轭梯度法

转载原出处：https://zhuanlan.zhihu.com/p/178461470

打赏 0

上一篇：机器学习与优化基础（Machine Learning and Optimization）

下一篇：数值优化（Numerical Optimization）(2)-信赖域法

共轭梯度法简介

养生的控制人

二次函数与最优解

线搜法

共轭梯度法

代码示例

为你推荐

知识图谱实体对齐3：无监督和自监督的方法

基于Pytorch学习Bert模型配置运行环境详细流程

神经网络从0到1（五）——搭建神经网络（上）

强化学习(十七) 基于模型的强化学习与Dyna算法框架

创建Pybullet的Gym环境

综述|基于深度学习的目标检测(一)

关于作者

养生的控制人

14

0

0

1

卡尔曼估计两步法

数值优化（Numerical Optimization）(5)约束优化（二）

数值优化（Numerical Optimization）(1)

相关推荐

强化学习 1 ：基本概念

【PyTorch】构造VGG19网络进行本地图片分类（超详细过程）——项目介绍

（十八）通俗易懂理解——SVD降维（协同过滤）

学习笔记——支持向量机svm（1）最简单的支持向量机

Tensorflow暑期实践——基于多隐层神经网络的手写数字识别

强化学习中的调参经验与编程技巧(on policy 篇)

热门泡泡

30积分失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

共轭梯度法简介

养生的控制人

二次函数与最优解

线搜法

共轭梯度法

代码示例

为你推荐

知识图谱实体对齐3：无监督和自监督的方法

基于Pytorch学习Bert模型配置运行环境详细流程

神经网络从0到1（五）——搭建神经网络（上）

强化学习(十七) 基于模型的强化学习与Dyna算法框架

创建Pybullet的Gym环境

综述|基于深度学习的目标检测(一)

评论（0）

关于作者

养生的控制人

14

0

0

1

卡尔曼估计两步法

数值优化（Numerical Optimization）(5)约束优化（二）

数值优化（Numerical Optimization）(1)

相关推荐

强化学习 1 ：基本概念

【PyTorch】构造VGG19网络进行本地图片分类（超详细过程）——项目介绍

（十八）通俗易懂理解——SVD降维（协同过滤）

学习笔记——支持向量机svm（1）最简单的支持向量机

Tensorflow暑期实践——基于多隐层神经网络的手写数字识别

强化学习中的调参经验与编程技巧(on policy 篇)

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板