最近有一部分工作是 2D 车道线的检测,整体路线偏传统一点,期望纯视觉和无地图,总结下遇到的技术问题。
目前市面上是有很多开源车道线检测的数据集合的,而且对应的 benchmark 指标也看起来很美好。有些数据集都能到 9x% 的指标。
但是,这些 benchmark 其实已经有一定的失真,表现好的模型未必真的有可用性,事实上可以说 benchmark 里面大部分的算法已经 overfit 那些有一定年代的数据集了。当然,新的数据集还没来得及被后来人设计算法来过拟合。
比如,随便举几个例子:
这又回到了一个很基础的问题:面对一个非定义严格的问题,SOTA 真的就一定是适合的么?
在无脑迁移 SOTA 之前,首先还是要多看看问题的定义、数据特点。从宏大叙事的角度上,数据增多后,先验产生的效益是边际递减的。从工程的角度上,当然是需要掌握一个平衡和时机。
目前换用的方法已经是非常传统的思路。随着数据的增多和训练技术的调整,在整体指标上并没有弱于之前采用的 SOTA 方法,在某些指标上甚至还更高(非公平对比,数据随时间有变化)。整个训练可以说基本没有太多 trick,很多人期望依靠某个神奇 trick 搞个大新闻的想法本身就比较不现实。大部分的模型在公开数据集上都是没有 “完全训练” 的,数据量的增加依然可以提升模型的表现。
模型本身的结构上,考虑到部署平台的限制,也依赖的是非常传统的算子。用一些新的算子或者目标平台低效的算子也确实可以在某些指标上有一点提升。但是带来的性能损失相比这点收益完全不成比例。模型容量和指标关系也是个 S 曲线,对于有算力目标的平台,现在流行的超大模型最多也只能放在离线辅助使用。
车道线的测距传统思路用的比较多的就是地平面 IPM,也是个强先验的算法。影响因素:
外参这块,可以用激光或者 IMU 辅助调整。
地面这块,其实没什么能根本解决问题的,传统的滤波稳定只能针对历史,无法预测未来;车道线平行度的限制,高速场景用一用可以。利用模型来解决的话,就是预测地面高度,兜一圈下来都能预测地面高度了,直出 3D 关系算了。
而 3D 测距实际上就是目前视觉算法的瓶颈,能够做得好的话,激光反而会落下风。但是想解决其实依赖整个系统,车型设计、下游算法对误差的容忍度都跑不掉。
在我自己看来: