这一部分主要参考B站老王同志的贝叶斯滤波部分,贴上链接,建议多多支持老王成果
1. 概率论基础
![](https://pic2.zhimg.com/80/v2-dcee7524e2f099837233cc27b2f21555_720w.jpg)
首先介绍的是频率学派与贝叶斯学派
个人理解是这样的:
频率学派认为参数是固定的,而观测是随机变量,可以通过观测去估计参数,也就是所谓的最大似然估计,其理论基础是大数定律;这个类似于系统辨识中的参数估计
贝叶斯学派反之,认为参数是随机变量,而观测不是随机变量,可以通过后验去估计参数,也就是所谓最大后验估计,其理论基础是贝叶斯定理;这个就类似于状态估计啦
接下来是随机过程
需要理解随机试验,主观概率与客观概率
![](https://pic1.zhimg.com/80/v2-c9e09a93975206ce3a3bacd33043b8f8_720w.jpg)
以及随机过程中,概率的演化
![](https://pic3.zhimg.com/80/v2-9cd0a35d427f65db024ac92ef4614802_720w.jpg)
而贝叶斯学派的核心:
选择一个相当宽泛的(高熵)先验分布,反映在观测到数据前,参数的高度不确定性;通过观测数据得到一个相对狭窄的(低熵)的后验分布
2. 贝叶斯定理的三大分布
条件概率分布为:
![](https://pic2.zhimg.com/80/v2-a0a4d725cada7adc43957605d6e80741_720w.jpg)
在状态分布中三个概率分别为:先验分布,后验分布与似然分布
![](https://pic2.zhimg.com/80/v2-34cb35889895b9ee8dca82c091189e89_720w.jpg)
注意:贝叶斯推断与传感器模型无关,正比于 先验 * 似然
似然模型可以选择多种概率分布:
![](https://pic2.zhimg.com/80/v2-d174c145cd543edd9d89cd6336abf981_720w.jpg)
3. 控制与观测下的信息融合
基于机器人与环境交互下的状态方程与观测方程
![](https://pic1.zhimg.com/80/v2-2ecac5bfff3e23e0e250f3e467abab50_720w.jpg)
而信息融合也就是贝叶斯滤波的思想:
贝叶斯滤波:先验分布与似然的融合,通过观测的后验概率分布,降低预测的先验概率的不确定性(后验方差 < 先验方差)
![](https://pic1.zhimg.com/80/v2-54730fbaf2f301d6a89a3d668ce9efd8_720w.jpg)
4. 贝叶斯滤波的推导
可以参考这位大佬写的博文
以下仅仅是复制,
或者说纠正几个笔误
(1)三个Tip:其中两个是状态与噪声之间的相互独立性,一个是条件概率的推断
![](https://pic1.zhimg.com/80/v2-86b332948d45004a7e5ae79e927552f4_720w.jpg)
(2)连续变量贝叶斯定理的推导
![](https://pic4.zhimg.com/80/v2-7b701f8f10e11e195119c64ed61f210b_720w.jpg)
(3)预测步的推导
![](https://pic4.zhimg.com/80/v2-5535d9f0c799ad20b90e9b624deedd37_720w.jpg)
(4)更新步的推导
![](https://pic2.zhimg.com/80/v2-5dea222c623fb4bf231127484f69fb19_720w.jpg)
5. 贝叶斯滤波算法
![](https://pic2.zhimg.com/80/v2-7d9e18c66f32968fb5179b842767bf51_720w.jpg)
老王的B站应该是写的最好理解的贝叶斯滤波了,笔者也是跟着在学习
本文也是主要参考一下两篇,侵删
Reference
评论(0)
您还未登录,请登录后发表或查看评论