第4章 感知 (Perception)
第4章 感知 (Perception)课程笔记。
views
| comments
第4章 感知 (Perception)#
包含感知(1) 传感器 + 感知(2) 测距与视觉 + 感知(3) 特征提取
4.1 传感器分类 ⭐#
按测量对象分#
| 类型 | 说明 | 例 |
|---|---|---|
| 本体感受 (PC) | 测量系统内部值 | 编码器、陀螺仪、电池状态 |
| 外感受 (EC) | 测量环境信息 | 超声波、摄像头、激光 |
按工作方式分#
| 类型 | 说明 | 例 |
|---|---|---|
| 被动传感器 | 测量环境进入的能量 | CCD 摄像机、罗盘 |
| 主动传感器 | 发射能量再测量反应 | 超声波、激光、结构光 |
传感器分类总表#
| 类别 | 传感器系统 | PC/EC | 主动/被动 |
|---|---|---|---|
| 触觉 | 接触开关、减震器 | EC | 被动 |
| 光栅栏、非接触接近 | EC | 主动 | |
| 轮子/电机 | 光电编码器 | PC | 主动 |
| 电位计 | PC | 被动 | |
| 旋转变压器、同步机 | PC | 主动 | |
| 导向 | 罗盘 | EC | 被动 |
| 陀螺仪 | PC | 被动 | |
| 倾角仪 | EC | 主动/被动 | |
| 地面信标 | GPS | EC | 主动 |
| 有源光学/RF/超声信标 | EC | 主动 | |
| 主动测距 | 超声传感器 | EC | 主动 |
| 激光测距仪 | EC | 主动 | |
| 结构光 | EC | 主动 | |
| 视觉 | CCD/CMOS 摄像机 | EC | 被动 |
4.2 传感器性能特征#
基本额定值#
| 特征 | 含义 |
|---|---|
| 动态范围 | 上下界之比,常用 dB 表示 |
| 分辨率 | 两个值之间的最小差别 |
| 线性度 | 输出随输入线性变化的程度 |
| 带宽/频率 | 传感器读数速率 |
现场性能#
| 特征 | 含义 |
|---|---|
| 灵敏度 | 输出变化 / 输入变化 |
| 交叉灵敏度 | 目标参数受环境参数影响的灵敏度 |
| 准确度 | 输出与真实值的差别 |
| 精度 | 测量结果的可重复性 |
误差类型#
| 类型 | 特点 | 处理 |
|---|---|---|
| 系统误差 (确定性) | 可建模 → 可预测 | 标定消除 |
| 随机误差 (非确定性) | 不可预测 | 概率描述 |
4.3 测距基本原理#
4.3.1 飞越时间法 (Time of Flight)#
基本公式:
| 超声波 | 激光 | |
|---|---|---|
| 波速 | (声速) | (光速) |
| 3m 飞越时间 | ||
| 精度 | 受温度、镜面反射影响 | 高但昂贵 |
超声波特点:
- 频率:
- 锥形波传播,开角
- 测量圆弧段(非点),镜面反射问题
- 声速公式:
激光测距三种方式:
- 脉冲式: 直接测量往返时间(分辨皮秒级)
- 差频法: 调频连续波与反射波差频
- 相移法: ,其中
4.3.2 三角测量法#
利用几何性质确定物体距离:
- 激光三角测量 (1D): ,距离与 成正比
- 基线 越大 → 分辨率越高
- 焦距 越长 → 分辨率越高(但体积大)
4.3.3 结构光 (Structured Light)#
- 将已知光模式投影到环境
- 摄像机捕获反射光
- 简单三角测量确定距离
- 例: Microsoft Kinect (IR projector + IR camera)
4.3.4 毫米波雷达#
- 频率 ,波长
- 测距范围大(可达 以上)
- (中短距/BSD) vs (长距/ACC)
传感器对比#
| 毫米波雷达 | 超声波 | 激光雷达 | 红外 | |
|---|---|---|---|---|
| 最大距离 | ||||
| 角度测量 | 较好 | 好 | 很好 | 不能 |
| 环境限制 | 全天候 | 风沙 | 雨天 | 温度 |
| 成本 | 中 | 低 | 高 | 中低 |
4.4 里程表法与编码器#
编码器类型#
- 增量式编码器: 测量相对转动,典型分辨率 2000 脉冲/转
- 绝对式编码器: 每位置有唯一编码(格雷码),断电不丢失
里程表法#
- 积分编码器数据 → 位置估计
- 优点: 直观简单
- 缺点: 误差累积无界
- 三类误差: 路程误差、转动误差、漂移误差
4.5 导向传感器#
| 传感器 | 类型 | 原理 | 缺点 |
|---|---|---|---|
| 罗盘 | EC | 测量地球磁场 | 弱磁场,易受磁干扰,室内不适用 |
| 陀螺仪 | PC | 保持相对固定参考系方向 | 漂移 |
4.6 计算机视觉基础#
4.6.1 成像原理#
透视投影模型:
- 3D 景象 → 2D 平面(丢失长度、角度信息)
- 保留: 直线仍然是直线
- 消失点 (vanishing point): 平行线在图像中汇聚点
4.6.2 摄像机内参矩阵 #
4.6.3 镜头畸变#
- 径向畸变: 桶形畸变 / 枕形畸变
- 还包括切向畸变和法向畸变
4.6.4 张正友标定法#
- 打印模板贴平面
- 从不同角度拍摄
- 检测特征点
- 求内外参数
- 求畸变系数
- 优化求精
4.7 图像预处理与滤波#
处理流程#
图像 → 预处理(阈值化/滤波) → 边缘检测 → 聚类/分割 → 直线提取(霍夫变换) → 特征提取 → 匹配
高斯平滑#
去除高频噪声,图像 与高斯函数 求卷积:
4.8 边缘检测 ⭐常考#
Canny 边缘检测#
核心思想: 将平滑和求导结合在一个操作中
步骤:
- 图像 与 (高斯一阶导数) 卷积:
- 对 取绝对值
- 超过阈值 的 局部极值做标记
- 非最大抑制 → 单像素宽度的轮廓
常用梯度算子 ⭐重要#
Roberts (2×2):
Prewitt (3×3):
Sobel (3×3):
Sobel 中心行/列权重为 2,对噪声更鲁棒。
4.9 霍夫变换 (Hough Transform) ⭐#
用途#
从边缘图像中提取直线。
原理#
图像空间中的直线 → 参数空间中的点 。 共线点在参数空间中交于同一点 → 投票机制。
步骤#
- 产生 2D 阵列 ,初始化为
- 对每个边缘像素 ,遍历所有 :
- 若 ,则 (投票)
- 搜索 中最大值 → 对应最显著的直线
4.10 双目立体视觉 ⭐重要#
理想对齐情况#
两摄像机水平放置,基线 ,焦距 ,光轴平行。
视差:
深度公式:
关键结论#
- 深度与视差成反比 → 近物体更准确
- 视差与基线 成正比 → 大精度高(但公共视场小)
- 共轭对处于表偏振线 (epipolar line) 上
一般情况#
两摄像机间存在旋转 (3×3) 和平移 :
- 完全校准需 个共轭对(12 未知数,12 方程)
- 时最小二乘:
深度恢复(校准后)#
已知 , 和 , , :
- 构造三个方程
- 任意两个解出 和
- 得到 3D 位置
对应性问题#
- 双目视觉的关键挑战:左右图像中匹配同一物点
- ZLoG(高斯的拉普拉斯零相交):辨别特征点
- 灰度级别匹配:沿表偏振线匹配灰度波形
立体视觉实例(课件)#
- 竖直边缘滤波器:
- 深度图像: 亮 = 近,暗 = 远
4.11 景深测距#
- 锐度比较: 比较不同焦距下的子图像梯度 → 最大锐度 = 正确聚焦
- 3 台摄像机分别聚焦远/中/近,提高搜索效率
4.12 光流法#
光流约束方程:
- : 光流分量
- 仅能得到方向, 和 不唯一 → 需附加约束(光流平滑性)
4.13 误差传播#
输出协方差矩阵:
其中 是雅可比矩阵( 梯度阵的转置)。
4.14 特征提取#
环境建模层次#
| 层次 | 数据量 | 独特性 | 例 |
|---|---|---|---|
| 原始数据 | 大 | 小 | 激光扫描、灰度图 |
| 低级特征 | 中 | 一般 | 直线、圆 |
| 高级特征 | 小 | 高 | 门、车 |
直线提取方法#
- 最小二乘
- 加权最小二乘(误差与 成正比时用)
考前速记#
| 要点 | 记忆 |
|---|---|
| 传感器两维度分类 | PC/EC × 主动/被动 |
| 飞越时间公式 | |
| 双目深度公式 | |
| Sobel 3×3 | 中心列 , 中心行 |
| Canny 核心 | = 先平滑后求导 |
| 霍夫变换 | 图像空间直线 → 参数空间点,投票机制 |
| 非最大抑制 | 产生单像素宽度轮廓 |