Files
daohang/OUTLINE.md
2026-02-21 10:25:43 +08:00

2.1 KiB
Raw Blame History

ROS1 + MuJoCo VLA 视觉避障 3D 导航 — 项目大纲

一、项目概述

基于 ROS1 与 MuJoCo 搭建一个 VLA (Vision-Language-Action) 视觉避障 3D 导航系统,实现圆柱形机器人在仿真环境中的自主避障与路径规划。


二、里程碑目标

🎯 目标一:基础仿真场景(当前阶段)

  • 创建 MuJoCo 仿真环境
  • 添加圆柱体机器人/代理
  • 放置若干障碍物(盒子、圆柱、球体)
  • 运行基础物理仿真

目标二:相机与视觉感知

  • 在圆柱体上添加相机传感器
  • 实现 RGB/深度图像发布
  • ROS1 /camera/image_raw 话题发布

目标三:运动控制接口

  • 圆柱体自由关节freejoint或差速模型
  • 发布 /cmd_vel 接收速度指令
  • 订阅 /odom 里程计

目标四VLA 视觉避障核心

  • 集成视觉语言模型VLM/VLA接口
  • 基于视觉的障碍物检测与语义理解
  • 语言条件避障策略(如 "避开红色障碍物"

目标五3D 导航与路径规划

  • 3D 栅格地图或点云表示
  • 路径规划算法A* / RRT 等)
  • 与 VLA 决策融合

目标六ROS1 完整集成

  • ROS1 包结构、launch、参数服务器
  • TF 变换、传感器消息标准格式
  • 可视化RViz

三、技术栈

组件 技术
仿真 MuJoCo 3.x
机器人中间件 ROS1 Noetic
视觉 OpenCV, 相机传感器
VLA/VLM 待选(如 LLaVA, RT-2, OpenVLA 等)
语言 Python 3.8+

四、目录结构(规划)

/home/pc/test/
├── OUTLINE.md              # 本大纲
├── requirements.txt
├── mujoco_scenes/          # MuJoCo 场景
│   └── cylinder_obstacles.xml
├── scripts/                # 仿真与 ROS 节点
│   ├── run_simulation.py
│   └── ros_bridge.py       # 后续
└── ros_ws/                 # ROS1 工作空间(后续)
    └── src/
        └── vla_nav/

五、依赖安装

pip install mujoco
# ROS1 Noetic 需单独安装