上周五,Youtube上搜特斯拉之前的技术讲座的时候才发现,Andrej 在 CVPR 2021 的 Workshop 上做了一些新进展的介绍,于是就点进去学习学习了:
Andrej Karpathy (Tesla) - CVPR 2021 Wo…
我关注的是两个问题:
好在视频里面都有。
和之前的一些信息相比,似乎还是保持了一致的节奏,没有出现路线层面的变化。
几个我关注到的点:
举了几个例子,指出毫米波的问题:
这些例子指出的问题都存在。早几年前我也看过雷达厂商宣传新一代毫米波,分辨率也不低了,不过这是宣传,可能还要打个折扣。而且毫米波的特性,低速场景下噪点也容易变多。
当然,这些例子也可能是 cherry-pick 出来的。反过来,通过 Radar 补充视觉成功的例子也一样可以挑出来很多。
要注意,后面 Andrej 是强调了的,depth sensing 本身难度很大、对数据的要求很高,想玩这个,得先照照镜子。
模型在现实世界中,可以认为就是个 few-shot learning,毕竟长尾问题很难解决。SSL 的好处是可以相对低成本的学习通用特征,而且 SSL 在 few-shot learning 的领域已经超过了监督学习了。
不过随着数据量的增加,SSL 的效率可能依然不够,算力可能浪费不少在已经学习的不错的数据上了,怎么挑选数据是个大问题。这个其实在监督学习上也一样,数据量增多后,怎样提升数据效率是个必须面临的问题。无脑增加数据的边际效用会越来越小, data efficiency 在数据建设这个支柱方向上会凸显。
目前国内的主机厂可能因为技术演化路径的原因,没有 AI 方面的人才梯队,从零开始建立要付不少学费,钱倒好说,弯路走到坑里的话,机会成本就太大了。而且由于热点的原因, AI 的研发需要长期的高投入,人工费用不低,相比主机厂的省钱风格,可能未必符合企业文化。
国内主机厂也做惯了集成商,从零开始搞研发还是很反文化的。这个可能还是要天时地利人和以及战略决心。不过目前互联网有人才溢出现象,大家都焦虑、脑子正常的也没人喜欢卷,主机厂从这个角度入手,对互联网搞 AI 的同学还是有一定吸引力的。
这是一种很滑稽的场面。从务实的角度来说,技术路线激进一点,roadmap 保守一点,这样达到目标的概率更大一点。结果现在的风气可能是:一年时间量产,具体技术方案还是按照之前的老一套。而如果按照之前的老方案,又显然做不到一年量产,看起来就是自己戳自己,很矛盾。不过这已经不仅仅是技术范畴的事情了,随它去吧。
作为工程师从技术角度上看,肯定觉得应该车身上插满传感器,别说盲区,甚至每个角度都有冗余。但是这样子的方案要走量产,嗯…
Radar、Lidar本身也一样有问题。尤其是加上量产这个限制(年产量起码1万,正经量产车都是月产1万;交给用户使用;半年才能去一次4s,还要考虑4s也有改造成本的可能性),问题更多。
说安全问题,就先用视觉+毫米波把光线好的高速、快速路的场景全覆盖了,用户偶尔接管下。这总和 Lidar 没多大关系吧,这要是都搞不定,就凭这样的感知能力,加 Lidar 也搞不定城区啊。