2021 NVIDIA CLIPORT: What and Where Pathways for Robotic Manipulation 端到端学习精细操纵+视觉-语言基础系统的多目标和多任务泛化能力的框架。二流架构(语义和空间路径),CLIPORT将CLIP的语义理解(“是什么”)与Transporter(以动作感知为中心,将桌面操作形式化为可供预测的拾取和放置的传统方法)的空间精度(“在哪里
一、NLP和CV领域的一些经典算法 nlp领域(基于LSTM和基于Transformer两种框架) Transformer(Attention is also your need):编码器解码器自注意力机制。 论文讲解: https://www.bilibili.com/video/BV1pu411o7BE/?spm_id_from=333.999.top_right_bar_window_
一、机器人领域前沿方向 具身智能与垂直大模型:指拥有自主感知、交互和行动能力的智能体,能够与环境进行实时互动,从而实现对环境的理解和适应。核心技术包括:智能体环境感知与建模、智能体自主决策与规划、人机交互、群控协作、机器学习与强化学习等技术。 人形与四足仿生机器人:指受生物学原理和生物体结构启发,设计和制造的机器人,以模仿生物的运动、行为和外貌,实现更自然、更适应性强的性能。包括四足机器人
大模型驱动多模态集群机器人相关内容
博客
泡泡
积分
勋章
精选多模态具身机器人感知与决策方向-论文精读(持续更新)
NLP、CV、多模态领域一些经典文献
大模型驱动的多模态协同机器人调研
第三方账号登入
看不清?点击更换
第三方账号登入
QQ 微博 微信