台大机器人学——林沛群 Linear Function with Parabolic Blends 轨迹规划法 1.缘由 在很多类型的任务上均需要使用直线轨迹; 轨迹中若包含多个直线段轨迹,线段间转择点速度不连续; 该方法保证直线的同时,保证直线段轨迹之间有二次连接,保证轨迹的圆滑; 初始末端速度为0 转折处,由速度为0瞬间变为某个速度,加速度趋近于∞
Minimax搜索简介 Minimax Search,直面翻译,即最小最大算法,这里面蕴含这一种对抗的思想,比如多智能体之间在一个task中存在竞争关系,一方想尽办法将这个利益最大化,另一方希望将这个利益最小化。 Minimax算法是Pessimistic的,总是觉得”对手“agent拥有完美的决策能力,所以每次决策时,希望找到对方让我方陷入最坏情况的各种策略中的较好的策略。尽量降低损失。虽
REVIEW: 贪婪最佳优先搜索算法Greedy Best-First Search 何小白:搜索算法(1)——启发式搜索1(GBFS)32 赞同 · 1 评论文章 在上一篇blog中,主要是阐述了贪婪最佳优先启发式搜索算法,并通过一个简单的路径搜索的例子对其进行了应用。可以发现,GBFS启发式算法存在以下弊端: 1️⃣GBFS由于其评价机制的问题,产生的路径不是最优的;2️⃣不完备性;3
启发式搜索(Heuristically Search) 又叫做有信息搜索(Informed Search),该算法利用问题的启发信息(所求解问题相关的辅助信息)引导搜索过程,来减少搜索范围,降低问题复杂度。 这篇博文主要介绍两种启发式搜索算法:贪婪最佳优先搜索——Greedy Best-First Search(GBFS)A*其中,GBFS是一种很基础简单的搜索算法,其基本思想——将节点表按
DCGAN教程 GAN:Generative adversarial network生成对抗网路 GAN GAN生成对抗网络,该框架可以教会一个深度学习模型来捕捉训练数据分布,并生成具有同分布的相同数据。GAN最早由lan Goodfellow在2014年首次提出。 GAN由两个不同的模型组成,一个是生成模型generator,一个是鉴别模型discriminator。其中,generator的
DDPG(Deep Deterministic Policy Gradient)是Google DeepMind提出,该算法是基于Actor-Critic框架,同时又借鉴了DQN算法的思想,Policy网络和Q网络分别有两个神经网络,一个是Online神经网络,一个是Target神经网络。DDPG算法对PG算法,主要改进有: (1)使用卷积神经网络来模拟策略函数和Q函数,并用深度学习的方法来训练
0. 前言 在上面一篇文章中,参考李宏毅老师的授课内容,已经对Policy_Based的RL方法做了详细总结,这一篇是对上一篇的补充,主要是结合Tensorflow和GYM模块,实现Policy Based的代表算法,Policy Gradients进行实现。 先放效果图,基于Policy Gradient 的Reinforcement Learning. 1. Key Points
李宏毅ML学习笔记---Reinforcement Learning总结 0. 在学习A3C之前,首先需要了解的前置知识: RL算法主要基于以下两种方法: policy-based&value-based Policy-based: Key Point: Learning an Actor/Policy (do action)
Example 1 : Revisit the RRR Manipulator 平面RRR手臂长度: , , ,下表定义initial,via,via和final points的位置: 第三杆对地的角度; 方法:以Linear Function with Parabolic Blends在Cartesian space下轨迹规划; 同样的例子以Cubic Polynomials的方法戳下
台大机器人学——林沛群 CASE 1: 中间某些区域无法到达(i.e. 在work space之外) 1 --- AB轨迹与内圈相交,没有考虑手臂的几何极限; 所以在Cartesian Space下的轨迹进行绘制,确保没有再work space之外; CASE 2: 轨迹需要高加减速(i.e. 接近奇异构型<singular configuration>) 1 --- 从A
常用的轨迹规划方法有两种:一种是Cubic Polynomials即三次多项式插值;另一种是Linear Function with Parabolic Blends带抛物线混合的线性函数。两个方法各有千秋,本文先介绍三次多项式插值方法。 Joint Angles/Cartesian下的路径规划 1.原则 轨迹:不同轨迹区段 以不同参数的函数来规划。 针对t_i和t_i+1时间段内的函
0. 手臂轨迹规划(Manipulator Trajectory Planning)引言 (1) 轨迹: 机械手臂(的末端点或者操作点)的位置、速度、加速度对时间的历程; 可进一步定义成{T}相对{G}的状态历程(和手臂种类无关,{G}也可随时间变动,比如传送带)。 (2)理想轨迹: 理想轨迹,必须是Smooth Path(i.e.,continuous with continuous firs
解决一般的手臂问题:场景,抓取goal放到固定位置(现在先考虑如何准确夹取问题) {B} 基座frame; {W} 手腕的frame; {T} 末端执行工具的frame;(施工) {S} 静止物,桌子的frame; {G} 目标物的frame;Tool如何与goal进行对应.. SITUATION: 机械手臂夹住放在桌上的杯子,移动手臂将杯子挂到墙上的杯架。 物件取放任务(包装
台大机器人学——林沛群 机械手臂轨迹规划实例 Manipulator Trajectory-Planning Example 通过一个example,是对以上所有知识的应用;在真实使用的场景具有实用意义。顺向+逆向+轨迹规划完成放杯子任务: Revisit物件取放任务:机械手臂夹住放在桌子上的杯子,移动手臂将杯子挂到墙上的杯架中。 整个过程包含了移动与转动 1. 六轴RRRRRR手臂之D
台大机器人学——林沛群 若6Dofs manipulator 具有三个连续的轴交在同一点,则手臂具有解析解。 一般会把后三轴如此设计: 前三轴——产生移动 后三轴——产生转动 PUMA机器人 EX: A RRRRRR Manipulator 因为后三轴交在同一点: STEP1 -- Positioning Structure 先解移动部分 法则:让 层层分离; 备注:i
Example 1: A RRR Manipulator 台大机器人学——林沛群 Ik(Inverse Kinematics) problem: given , 3Dofs 手臂 frame{3}对地frame{0}的Trans Matrics 现在我们已知: phi=theta_1+theta_2+theta_3 求解方法一:几何法,将空间几何切割成平面几何: 根据余
台大机器人学——林沛群 机械手臂 逆向运动学——Manipulator Inverse Kinematics 1.引言: 手臂顺向运动学 Forward Kinematics (FK) 给予 (可计算出 ),求得 或 。 2. 手臂逆向运动学 Inverse Kinematics(IK) 给予 或 ,求得。已知末端位置,反算手臂各个关节的角度。 3. 逆向运动学的求解 假设手臂有6D
台大机器人学——林沛群 之前相关课程笔记: 何小白:机器人学——学习笔记5(顺向运动学&DH表达法) 何小白:机器人学——学习笔记6(Link Transformations) 1.Review: Denavit-Hartenberg表达法(Crag Version) 1.几何关系 在这个操作顺序下面: 这个表达法不是那么直观,因为只有 是在第i个link下面,而 都是在第
台大机器人学——林沛群 EXAMPLE 1: A PRRR Manipulator 晶圆机器人 1个translation,3个rotation, 为驱动关节。 晶圆机器人DH Table EXAMPLE 2: A RRRP Manipulator SCARA机器人 3个rotation, 1个translation, 为驱动关节 SCARA机器人 DH Table 可以发现,这
台大机器人学——林沛群 进一步精准找到两个frame之间的变换关系(Transformation Matrix的量化表达式什么) 要如何借由DH表达法中的4个参数,求得Transformation Matrix? 其中,按照mapping后乘思想,可列出: 继续拆解: 连接{i}与{i-1}两个frame之间的关系 Thus: 省略了推导过程 有了i与i-1的fr
台大机器人学——林沛群 顺向运动学 Manipulator Forward Kinematics 1.定义: 运动学(Kinematics): 讨论运动状态本身,未连接到产生运动的【力】 位置(x),速度(v), 加速度(a)与时间(t)之间的关系: 移动——位置、速度、加速度; 转动——姿态、角速度、角加速度; 动力学(Dynamics): 讨论力/力矩如何产生运动 Newton's
台大机器人学——林沛群 1.Operators ——对向量(或点)进行移动或者转动 (1)仅有移动:从P1→P2: (2)仅有移动:P1→P2 Trasformation Matrix也同样适用于纯转动的case (3)移动转动复合:P1→P12→P2 注意,先转动后移动≠先移动后转动 先移后转 移动后的向量也要乘上旋转矩阵。 EX : Point 先对Z轴转30°,然后移动 到
台大机器人学——林沛群 1. 复习 该如何整合表达刚体的状态? 在刚体(Rigid Body)上建立frame,常建立在质心上 移动:由body frame的原点位置判定; 转动:由body frame的姿态判定; 如何整合转动与移动,并可以进行量化计算?——把移动和转动排列在同一个矩阵里面,即Homogeneous Transformation Matrix(齐次变换矩阵)。 Homo
台大机器人学——林沛群 1.复习:关于Rotation Matrix 三个用法: 描述一个frame相对于另一个frame的姿态 将point由某一个frame的表达转换到另一个frame(仅有相对转动变化)来表达 将point(vector)在同一个frame中进行转动 思考——空间中的Rotation是3DOFs,那要如何把一般rotation matrix所表达的姿态,拆解成3次
台大机器人学——林沛群,学习笔记1 1.导论 如何描述一个刚体(Rigid Body)的运动状态? ① 平面:移动2DOFs, 转动1DOF (Degree of Freedom) ② 空间:移动3DOFs, 转动3DOFs; 如何整合表达刚体的状态? 在刚体上建立Frame,一般建立在质心上... 移动:由body frame的原点位置判定... (刚体动到哪里,坐标动到哪里) 转
积分
粉丝
勋章
TA还没有专栏噢
第三方账号登入
看不清?点击更换
第三方账号登入
QQ 微博 微信