Files
daohang/OUTLINE.md
2026-02-21 10:25:43 +08:00

80 lines
2.1 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# ROS1 + MuJoCo VLA 视觉避障 3D 导航 — 项目大纲
## 一、项目概述
基于 ROS1 与 MuJoCo 搭建一个 **VLA (Vision-Language-Action)** 视觉避障 3D 导航系统,实现圆柱形机器人在仿真环境中的自主避障与路径规划。
---
## 二、里程碑目标
### 🎯 目标一:基础仿真场景(当前阶段)✅
- [x] 创建 MuJoCo 仿真环境
- [x] 添加圆柱体机器人/代理
- [x] 放置若干障碍物(盒子、圆柱、球体)
- [x] 运行基础物理仿真
### 目标二:相机与视觉感知
- [ ] 在圆柱体上添加相机传感器
- [ ] 实现 RGB/深度图像发布
- [ ] ROS1 `/camera/image_raw` 话题发布
### 目标三:运动控制接口
- [ ] 圆柱体自由关节freejoint或差速模型
- [ ] 发布 `/cmd_vel` 接收速度指令
- [ ] 订阅 `/odom` 里程计
### 目标四VLA 视觉避障核心
- [ ] 集成视觉语言模型VLM/VLA接口
- [ ] 基于视觉的障碍物检测与语义理解
- [ ] 语言条件避障策略(如 "避开红色障碍物"
### 目标五3D 导航与路径规划
- [ ] 3D 栅格地图或点云表示
- [ ] 路径规划算法A* / RRT 等)
- [ ] 与 VLA 决策融合
### 目标六ROS1 完整集成
- [ ] ROS1 包结构、launch、参数服务器
- [ ] TF 变换、传感器消息标准格式
- [ ] 可视化RViz
---
## 三、技术栈
| 组件 | 技术 |
|------|------|
| 仿真 | MuJoCo 3.x |
| 机器人中间件 | ROS1 Noetic |
| 视觉 | OpenCV, 相机传感器 |
| VLA/VLM | 待选(如 LLaVA, RT-2, OpenVLA 等) |
| 语言 | Python 3.8+ |
---
## 四、目录结构(规划)
```
/home/pc/test/
├── OUTLINE.md # 本大纲
├── requirements.txt
├── mujoco_scenes/ # MuJoCo 场景
│ └── cylinder_obstacles.xml
├── scripts/ # 仿真与 ROS 节点
│ ├── run_simulation.py
│ └── ros_bridge.py # 后续
└── ros_ws/ # ROS1 工作空间(后续)
└── src/
└── vla_nav/
```
---
## 五、依赖安装
```bash
pip install mujoco
# ROS1 Noetic 需单独安装
```