觉非科技李东旻:探讨自动驾驶技术上下游的创新与创业机会|嘉程创业流水席199席精彩回顾
    12.02.2023 | 嘉程资本:创新者的第一笔钱 | 嘉程创业流水席
    通过原生技术的驱动,抛开汽车传统零部件的思维模式,靠大模型的思路、对数据的渴求、对算力的渴求,用这样的原生方式,驱动行业和产品的迭代,才能立于不败之地。
    近日,嘉程创业流水席第199席【探讨自动驾驶技术上下游的创新与创业机会】,邀请了觉非科技CEO李东旻分享,主题是《探讨自动驾驶技术上下游的创新与创业机会》。
    以下为正文部分:
    今天非常高兴能够跟大家分享过去我们在自动驾驶行业的实践经验,以及我们对行业变化的看法。整个自动驾驶在过去可能5~10年里非常热,而且是一个发展速度非常快的科技创新领域。如果回头看这个领域过去5~10年的发展过程并梳理和总结,我觉得可以给很多想创业或者正在创业的伙伴,从横跨周期的角度很多有意思的结论,包括技术范式、商业落地的一些变化。同时,通过这些结论也可以得到一些警醒,不要高估在短期内所达成的成果,也不要低估在长期内所能取得的产业变化。所以今天我想试图从这几个维度跟大家分享自己的认知。
    最开始大家讲的是所谓的自动驾驶的上半场和下半场,到今天我们毫无疑问已经完全进入到智能驾驶的下半场阶段。而在下半场里,行业真正发生的变化,实际上可以看到四个比较明显的特点:
    第一个就是汽车的电子电气架构发生了真正意义上渗透的快速提升。我们现在以一辆车来看,由三台电脑所控制,一台电脑控制底盘,一台电脑控制座舱,也就是方向盘里面的座舱域,第三台电脑控制智能驾驶叫智驾域。实际上今天之所以智能驾驶能够在越来越多的乘用车上落地,本质上就是因为汽车越来越像三台电脑的架构了。
    在此之前汽车是什么样的架构?汽车是由大概100~200台小电脑在控制的,每一台只控制一部分。今天变成了一个大算力+中央软件平台的架构,使得智能驾驶的软件包括功能升级能够落地在汽车领域了,这是一个基础设施的问题。觉非科技自己的解决方案也是在第三台电脑里落地的。这是我们看到第一个很明显的趋势。
    第二个趋势就是大模型和小模型在整个乘用车、算力平台上的应用。我们今天不深究到底什么样的模型最终会被智能驾驶所采用,无论它的模型算法本身是什么样的,无论是在自然语言领域的ChatGPT,还是自动驾驶领域的BEV+Transformer等等相对较大的模型,它一定会导致一个终局的结果,就是汽车变得越来越数字化。其实我们更愿意把智能驾驶的下半场称之为汽车行业数字化的进程,因为智能驾驶是数字化的典型应用之一。
    什么叫数字化的汽车?形象来理解就是汽车里所占成本的部分,越来越多的百分比会是由看不见摸不着的数字化构成。这些数字化包含什么?包含软件功能,比如FSD的自动驾驶,包含为了实现这些软件功能所需要的芯片,所需要收集的数据,所需要训练的数据,以及需要在云端建立的一个超算中心,或是需要购买的显卡,本质上都是为了生产和制造出一台数字化的汽车。
    这样的一辆数字化汽车,对于汽车产业底层的影响和决策者逻辑的变化有哪些呢?过去,我们可能经常看到一级二级市场上有人把车拆开,出一份分析报告,说明这辆车的BOM成本是多少,每个零部件的价格是多少。这其实就是基于传统零部件的汽车模式。而一辆数字化的汽车,比如以特斯拉为例,即使我们把特斯拉的车拆得一干二净,会发现所有的零部件,轮胎、仪表盘加起来,对于一辆二十多万的特斯拉车来说,也就不到十万块钱,那么剩下的钱去了哪里呢?剩下的钱难道都是特斯拉的利润吗?其实不是。本质上是因为里面有很多你看不见摸不着的东西,是在研发、生产和运营这辆车的过程中产生的成本和消耗,而这些就是数字化的部分。
    因此,当一个模型越大,汽车数字化的占比也就会越高。我们粗略估计一下,过去一辆传统的汽车数字化的占比可能不到3%~5%,而未来一辆汽车数字化的占比可能会高达30%~40%左右,也就是说,一辆20万人民币的车,有6万到8万块钱是跟汽车的智能化数字化相关的。所以,数字化实际上是在改变整个汽车零部件的供应商结构,一定会有新的基于数字化的零部件供应商出现。
    正是因为有了这样的零部件供应,我们才会发现汽车可以实现软硬分离,以及单独地进行迭代。软硬分离的迭代对主机厂而言有两个好处:
    第一个好处是,可以通过软件和硬件的单独升级,像FSD一样,延长车的生命周期。不再是只有把车卖出去,跟消费者之间发生一次交互,而是在整个车的生命周期内,在未来的3年、5年甚至10年的时间里,都会跟消费者通过功能升级,通过各种方式产生客户和企业之间的互动,这是软硬分离带来的第一个好处。
    第二个,主机厂拥抱软硬分离的根本性原因是,软硬分离能够降低成本。过去,车的零部件是软件和硬件捆绑在一起的。比如,最早的自动驾驶大概在2012、2013年用的ADAS,基本上是以色列的Mobileye公司的产品,它的摄像头单目加上软件是软硬一体的,不能够进行拆分。国际上的Tier1供应商,大多也都是采用软硬一体的方式。对于供应商而言,软硬一体的好处是可以把20%~30%的毛利锁在所谓的硬件里面,通过软件提高毛利。但是,在整个车厂或者整个汽车行业发展到今天这个规模,主机厂会思考,如何把30%的供应商的毛利打到5%,甚至打到3%。这种情况下,靠原来的模式是远远不可能的,只有靠真正意义上的软硬分离。
    那么,软硬分离的硬件,现在有谁可以制造呢?原来,这些硬件只有这些供应商能制造。而在今天,这些硬件可以找很多原来只能做代工的工厂,这些公司并不懂汽车,并不懂原来的软件和硬件在一起的时候是怎么做的,但是它们能够做到,用一个极低的毛利——通常代工厂的毛利就是在3%到5%左右——拿着图纸生产出一个质量非常高的、符合客户需要的硬件。在这样的硬件基础之上,无论是主机厂自己研发,还是通过一些所谓的战略合作伙伴进行联合开发,在这些硬件上研发出自己想要的功能,无论是智驾的功能,还是座舱的功能,还是底盘的功能,都是软硬分离的。软硬分离的第二个根本性原因,就是能大幅度地降低自己在汽车供应链里的成本,也就是降本。
    最后一点特点,大家可以看到,今天这个时代应该是中国汽车产业接近100年以来迎来的最好的机会。最早,第一波是福特,第二波是精密制造的日本丰田、本田,第三波就是电动化和智能化为主的中国汽车,接下来一定会进入到全球市场当中,占据至少30%的全球市场份额,终局是一定的,只是看最后在大盘里面谁是真正有效的玩家。
    我们看到,今天真正驱动汽车产业下半场的核心有四个因素,围绕着这四个因素,有非常多的机会,包括觉非科技自身的机会,也是基于这四个底层的原动力。
    比如,我们谈到中国车企,过去所有的企业做生意或者做业务的时候,都是优先选择合资品牌,因为觉得合资品牌有钱。今天,这个观点其实没有变,合资品牌依然有钱,但可能不是那么有钱,因为它的市场变得非常有限。但是,更重要的一点是,今天我们要获得最新的车型竞争力,如果要卖得更好,那么一定要跟中国的自主品牌的汽车合作,无论是吉利、长安、比亚迪等等大家耳熟能详的企业。过去,这些企业,在十年二十年以前,这些跨国的ABCD供应商实际上都不愿意去合作。但今天,你会发现中国车企的崛起会影响所有供应商和供应链,都会优先跟自主品牌的合作。所以,这是四个特点如何影响觉非科技、影响其他公司在做决策的一个方面。
    再比如,芯片,大家之后可以看到,我们一定会跟第三台电脑智驾的芯片产生深度的连接和捆绑,因为这是一个Intel跟当年Windows联盟的事。如果我们不能跟芯片之间深度整合,形成战略性的联盟,那么很有可能就无法抢占市场的先机。觉非科技目前已经和地平线建立了深度的战略合作关系,通过“芯片+解决方案”的方式共同形成对市场的影响力。换言之,地平线的芯片走到哪,觉非的软件就走到哪;觉非的软件走到哪,就会带着地平线的芯片推给客户。通过这样的形式,让主机厂适配和研发的成本降到更低。这是我想花了相对多一点的时间来跟大家分享的,我们在汽车产业里面看到的内容。
    我们回到觉非科技这个维度上,我们提出了一个市场上真正的机会定义,叫做软件Tier1。软件Tier1这个角色实际上在历史的汽车传统零部件的供应链当中是不存在的。原来只有一个角色叫Tier1,就是一级供应商,实际上一级供应商这个角色是负责整合,把这些功能集成在一起,然后装到车上的。
    但是今天,在数字化汽车领域里,智能驾驶的Tier1角色实际上会变得非常危险,甚至会被取代。这并不是危言耸听,因为这样的集成功能,后面一定会由主机厂自己控制。而这里就会产生一些面向智能驾驶,面向数字化的新的供应商。其中最典型的,除了芯片以外,就包括了现在看到的叫做软件Tier1,一个软件Tier1一定包含两个要素,其一是算法,其二是数据。而且这两个要素必须同时存在,缺一不可,缺任何一个要素都不构成软件Tier1单独存在的意义和壁垒。
    比如我们说软件算法,全中国所有的软件算法,包括智驾的软件算法,无一例外没有一个是自己原创的,或者说大家的算法都是同源的。从最早的单目视觉感知到激光雷达感知,到现在大家所共识且普遍都在采用的BEV +Transform所谓的大模型的软件算法,大部分都是由海外公司所发明的。所以换言之,在软件算法这个维度上面,大家的竞争优势和差异化究竟在哪里呢?本质上在干两件事情。第一,软件算法在做芯片的移植和适配,用尽可能低的成本和算力运行较大的或者效果较好的软件算法;第二,往里面喂更多的数据。换言之,数据其实就是软件算法真正的石油,驱动整个软件算法,只有这样的软件算法才具备市场的竞争力。
    今天,对于所有智能驾驶的主机厂和创业公司,包括觉非科技在内,软件算法上的战略和方向非常简单,就盯着特斯拉。特斯拉在这个行业里做了什么样的软件算法的创新,我们就更多地做移植和适配就可以了。而实际上,在软件算法层面,并不存在单独靠软件算法就能建立竞争壁垒的创业公司。
    另外一个要素就是数据。数据如果单独存在也不行,因为车上的数据其实很简单,它拿到数据的第一刻,它的价值就在衰减,也就是拿到数据的第一刻它就在折旧。数据对于车而言必须是活的数据,必须是流动的数据。就像手机导航里的实时路况一样,只有当下的数据才对当下的决策有非常大的作用,历史的数据对于大模型的训练是有帮助的。所以,我们对数据要进行分级分层,用前面的软件算法实时地像一个泵一样给出一定的压力,让它产生循环,能够构成一个活的数据。
    所以,软件算法+数据两个要素是构成一个软件Tier1单独存在,且能互为竞争壁垒的一个关键成功点,这是软件算法和数据维度构成软件Tier1的一个原因。觉非科技实际上是两条腿,一支团队专门负责软件算法跟进特斯拉,一条腿专门跟进数据服务,实现软件算法跟数据服务之间的闭环。
    今天,全行业都在对标特斯拉,这个共识实际上是在2022年年初,特斯拉AI Day发布后,行业所形成的惊人共识。以至于今天,中国汽车在智能驾驶行业里面进入到了一个“抄作业”的阶段。过去,无论是PC互联网还是移动互联网,到今天的智能驾驶,其实都是一样的,只要我们的市场进入到了“抄作业”的阶段,它的渗透、整个技能技术的提升、产品维度的提升都会非常快。我们特别感谢特斯拉,有时候开玩笑,特斯拉埃隆·马斯克实际上是智能驾驶行业的祖师爷,祖师爷赏饭吃,才有了创业公司、大公司的机会。正是因为有了特斯拉的出现,国内主机厂几乎抛开了之前所有的技术门户之见,抛开了技术上的分歧,全部选择了基于至少六颗摄像头的BEV+Transformer的方式,进行自己智能驾驶的量产。现在,行业内管这个流行叫做“重感知、轻地图”的方式,靠量产车的数据不断地在超算中心里进行训练,驱动前端的软件算法,从一个城市进入到另外一个城市,从而开通整个全国范围内的NOA领航和智能驾驶的系统,实际上,整个行业大家都在对标特斯拉。

    回到觉非科技的维度,我们对主机厂而言,用一句话告诉所有客户、主机厂,我们的价值就是,我们是来帮你实现特斯拉数据闭环的角色和供应商。如果你想实现特斯拉的数据闭环,我们可以提供一套参考算法给你,可以帮你实现数据训练你的软件算法,让你的软件算法不断地升级,不断地“重感知、轻地图”,从一个城市进入到另外一个城市,进入更多的城市,从而建立起乘用车销售的竞争力。这是从行业目前对标来看非常明显的,就是基于特斯拉的模式来进行。 
    这个行业过去也引发过一些争议和争论,也有一些同学会问,不是有很多像蔚小理这样的公司都是在做全栈自研吗?究竟这些自研是靠第三方供应商,还是靠其他的供应商实现呢?实际上,我们看到,在数字化汽车的进程里,在特斯拉的范式面前,主机厂在最近半年内都在普遍提一个词,叫缩链。
    缩链的本质其实有两层含义,第一层是我不需要那么多的供应商,特斯拉把所有的硬件、软件、各种各样的供应商,从原来一辆车需要800到1000家供应商,直接缩减到150到200个供应商,缩短了10倍以上。这是当年为什么特斯拉在造车的时候,大部分传统的主机厂不愿意跟进和不能跟进的原因,因为它动了自己供应链的根基,这是第一个缩链,它不需要那么多了。
    第二层含义是,缩链的同时,我不仅不需要那么多,而且还要替换,我要把里面的供应商,就像前面说的软硬分离也好,芯片也好,软件Tier1也好,要把这些新的围绕数字化的供应链角色引入进来。从原来100个供应链假设到20个,这20个里还要把其中的10个换成新的,整个行业是不是在发生一个剧烈的变化?
    实际上,今天无论是全栈自研的主机厂,还是选择第三方集成供应商的方案,大家普遍达成的共识就是放弃全栈自研。今天汽车的销量卷到如此程度的情况下,主机厂都会回到抓自己最核心的部分,正如大家所看到的冰山模型,主机厂实际上在负责的是冰山下的这一部分,这一部分非常庞大,决定了冰山上的应用层,无论是自动驾驶,还是智能座舱,还是动态底盘等等,这些都是在冰山之上的应用层。也就是说,这些应用层追逐技术,追逐最新鲜的产品的应用和体验,应该交由第三方去做。而主机厂真正把握的是整个汽车数字化的基座,这些基座包括了是否要建立起一个自己的数字化的训练的工厂,是否要建立一个超算中心——大家后面可以看到超算中心有多花钱,起步就是一个亿人民币,少于一个亿的基本上就不在牌桌上玩了——以及你如何做好一个非常好的编译系统,能够让这些智能驾驶的汽车的代码快速实现编译。这些东西可能对于传统的互联网和科技公司并不陌生,但是对于主机厂而言,确实有非常多的功课要去补。
    所以大家可以想象一下,所谓的全栈自研,真正意义上主机厂要抓住的是冰山下的数字化基座的部分,而把水面上的这部分选择和应用,市面上有非常多的应用层供给,挑选出最优秀的合作伙伴,用缩链的方式紧密地跟他们捆绑在一起走下去。这是今天整个汽车产业大家共识和共同采用的新的合作模式和合作方法。
    从软件和数据这两个维度来看。在软件上,觉非科技主要走的是融合计算的核心技术路径。
    融合计算主要融的是三类数据,一类是感知类的传感器,激光雷达、摄像头、毫米波;第二类是跟位置和姿态有关的,比如轮速计、惯性导航、IMU、RTK、 GPS等等,我们叫位姿类的传感器;第三类就是汽车的记忆系统,也就是车辆上已存储的静态数据,可以是传统地图供应商提供的或标准化的导航地图,这是第三类。
    所以觉非科技是把这三类信号进行处理,用各种各样AI的小模型、大模型进行实时处理。我们所运算的芯片在车载上面,比如英伟达、地平线等,在他们的芯片上,在第三台电脑的预控上实现计算结果的实时的输出。
    这里特别提到一点,我们并不做车辆的控制系统,我们认为控制系统一定是由主机厂或者比较懂汽车硬件相关的角色去实现的,所以我们公司从成立的第一天开始就不碰控制系统,专注让车辆实现特斯拉的数据闭环,无论是感知、跟踪还是预测,或是定位、规划等等。另外一端放在后台,在云端的数据层里进行相应的训练。
    另外一个要素是数据。前面已经谈到了数据的重要性,数据为什么能够对软件Tier 1构成一个核心的竞争壁垒。车的数据基本上分为两大类,车内的数据涉及个人隐私,车外的数据就是涉及测绘、地理信息系统的数据。近年来,国家对数据安全的管理趋严,针对感知算法迭代所需的道路数据,企业在采集时需要具备相应的测绘资质。觉非科技已与具备甲级电子导航地图资质的企业建立了深度战略合作,并可面向主机厂提供安全、合规、高效的数据服务。
    理解觉非科技的业务并不复杂,它就是一个三角形,这个三角形构成了我们所有的业务闭环。这也是我们与客户主机厂之间有两个业务的交集和触点。
    • 数据壁垒,是我们向主机厂提供数据及数据处理的服务和能力。
    • 工程化经验,我们将训练好的软件算法,无论是小模型还是大模型,就像前面分享的基于多传感器融合的,无论是感知、定位、预测还是记忆建图等等,提供给主机厂,让他们安装在车辆上。我们通过收取开发费和授权费的方式,获取商业利润。
    • 算法与数据之间的联动和飞轮效应,作为一个软件Tier1的竞争壁垒的闭环。我们获得了大量实际运行的数据后,不能把这些数据在客户之间来回倒卖,这是违反商业道德的。我们可以做的是用这些数据去训练算法,然后把这些算法作为成果去落地实践。这样就构成了我们自己的算法和数据之间形成的软件闭环。
    从商业化落地的角度而言,第一个阶段是在2015年左右开始的自动驾驶小模型。小模型分为每一个感知模块,无论是Camera Perception,还是LiDAR Perception,这些感知模块再到后面的融合、预测、规划、决策等等,每一个模块都可以独立地发展,达到非常好的效果。但是小模型的问题在哪里呢?如果你把每一个小模型,假设都做到了95%的准确率和召回率,达到了两个sigma,甚至三个sigma的车厂的要求,你会发现把这四个或者五个小模型的乘积只有百分之八十几,也就意味着小模型的上限非常低,100分满分它可能只能考到八十几分。这八十几分的成绩对于一些道路相对简单的场景,比如高速公路、高架、环路,没有红绿灯而且是封闭道路,在这些道路上小模型的这一套方法完全够用了。所以很多时候我会鼓励一些客户,包括我们的服务对象,先要在小模型上学会走路,再去尝试大模型,不能连走路都没学会就想跑。所以在接下来市场竞争如此残酷的情况下,小模型一定是一个降本增效的非常好的手段,谁能把小模型玩好了,它的车辆竞争力就不会输给那些大模型。大模型是打高端品牌,需要高算力的情况下才能做出非常好的东西。所以小模型也是今天真正能走量的一个很重要的特点。
    但是另外一点,站在创业者的角度,现在如果你想创业,千万别从小模型创业,因为如果没有拿到量产定点,现在连在小模型牌桌上的资格都没有。所以现在不是创业者从小模型切入的好时机。最近我还经常看到有朋友给我看双目视觉感知,创业公司是否值得投资或者去做,从我个人的角度来说基本就劝退了。因为这是一个典型的小模型的方式,这个方式你一定是有量产在手里的情况下再做会比较合适。
    另外,现在进入到了大模型阶段,大模型阶段以特斯拉为代表的BEV+Transformer是在去年2022年一季度的时候正式出台。从算法角度来说,图上是这辆车实时脑补的画面,真实的道路上面并没有画任何车道线,而这个车辆它能够在自己的系统里面脑补出它可能可以走的几条路径。大模型的好处就是没有小模块,只有一个模块,最极致的就是特斯拉前一阶段发布的v12,端到端,就一个模块,输入的是数字信号,输出的也是数字信号,中间到底怎么感知、怎么决策是完全未知。所以实际上从这个逻辑层面就解决了,我不需要乘以四个95%,就输出一个结果,这个结果输出中间没有任何的折损,全是一套大模型,几十亿甚至上千亿个参数来运行的。
    这是以特斯拉为代表的大模型方案,逐渐地越来越多的主机厂倾向于选择这种方案,大家走的技术路径基本上都是“重感知、轻地图”,就是希望能够把感知端的模型变大,参数变多,来应对比较复杂的以城市为代表的道路场景,不再是高速公路这种相对比较简单的场景了。
    这里我就想要大家知道,大模型好是好,但不是谁都玩得起的。我有时候开玩笑说,很多客户和同行在做技术规划的时候都靠公众号做技术规划,这是一个非常危险的事情。靠着公众号就能写出自己未来三年的技术演进路径,这是一个完全纸上谈兵的事情。
    首先,你要做大模型,大数据是前提。做单目摄像头通常要训练到车规级别,需要百万帧的样本数量,也就是100万帧标注好的照片,才能够达到量产的级别。激光雷达只需要几十万帧,比如20万帧到30万帧标注好的3D的激光点云的图片就可以训练好一个车量产级的点云数据。而大模型BEV+Transformer起步就是1亿帧,又因为BEV是一个俯视角,是一个上帝视角,它比前视角还有激光雷达的视角能看到的目标数要多。通常一个BEV俯视角的图,它要标注的数量平均是80个到150个目标。而单目前向的视觉,像人眼看前面一样,通常的目标数量是在20个到50个之间。如果以每一个目标3毛钱的标注费用来算,100个目标就是30块钱,而 BEV起步标注量就是1亿帧,也就1亿帧乘以30块钱,你要准备数据标注费30亿人民币才能谈得上去做量产。所以很多时候大家可能还没有想明白,只是纸上谈兵。其二,还没有算显卡,更别谈现在禁售和限售的事情。
    所以回到这个维度上来说,觉非科技做感知算法,我们从来不提供一个大模型的量产级别的感知算法,原因很简单,我们没有这么多钱去投入。我们给主机厂提供的,
    实际上是一个帮助您建立自己训练工厂的能力,我来帮您实现特斯拉的数据闭环的能力,而不是直接把训练好的模型给您。所以,这一点实际上是很多主机厂可能逐渐意识到的,他们可能没想到,做一个智能驾驶要投入这么多钱,光数据就得几十个亿,还不谈超算中心,超算中心又得几十个亿,这一砸下去,100个亿就没了。实际上,大家可能看到了LM领域的ChatGPT等等,可能一开始投入就几十亿美金就已经砸进去了。所以,为什么那么多大公司都在涌入大算力,实际上这是一个烧钱的生意。
    而在烧钱的时候,一定是要有合作的对象的,比如车厂。特斯拉为什么能做?一方面,它有钱;另外一方面,它的数据是靠它百万级别的量产车来生产的,所以它不需要在数据上花太多钱,更多的,它还发明了很多自动化标注等等的方式进行。
    只靠大算力行不行?也就是说,只靠重感知行不行呢?答案也是不行。
    这是北京首都机场高速的实际场景,包括我在内,几乎我知道的人,第一次都会被坑的一个收费站:从京密路上机场高速,必须在进ETC收费站之前,就得提前进入到左边的车道。如果你开过了ETC之后再并线,就已经过不去了,因为后面完全是水泥墩子,这个基本上感知是完全看不见的。
    还有上海,从浦东到浦西,每天最繁忙的十字路口,就是从浦东到浦西要上延安高架,出来以后,在这我自己也被罚过很多次,因为它上面有一堆的红绿灯,每一个红绿灯控制不同的车道线。
    这些人为的、复杂的给人类世界设计的交通规则,对于机器来说,训练和理解起来是相对困难和复杂的,而且具有非常大的随意性和随机性。所以,这些问题不能靠大模型的方式来解决,而是要靠汽车行驶的数据闭环、数据训练。
    所以,目前我们面向一些算力比较高的高配车型,提出了基于数据闭环的BEV+Transformer的架构,靠主机厂自己量产的大模型的感知方案,加上我们帮它做的数据闭环,实现相应的模型的升级,以及实现自己的量产,实现它轻地图的量产架构,在量产车上去落地。
    最终,要展望一下,从终局的情况下来看,我们是做一个软件Tier1,软件在里面发挥的角色,但是把时间拉长来看,以及看过去所有的行业发展,你会发现,软件一定会被平台化,无论是SaaS还是PaaS,平台往上走,一定会被云吞噬掉,现在的阿里云、腾讯云、火山云,从字节跳动这么一个今日头条应用,发展到云上面,一定会被云吞噬掉。今天我们看到的一个趋势,就是云最后一定也会被大模型给取代掉,大模型本身就包含了云,云是大模型的一部分。所有的车辆,都是大模型的一个触点,会形成无数个上百万、上千万个触点,跟大模型之间的交互。
    最终到那个时候,我想,可能真的就是每辆车是由机器控制的,而不是由人来决定,或者人在里面,可能只是一个辅助角色了。所以这个过程当中,一定只有通过原生技术的驱动,也就是要抛开汽车传统零部件的思维模式,靠大模型的思路,对数据的渴求,对算力的渴求,用这样的原生方式,驱动这个行业,驱动自己产品的迭代,最终才能立于不败之地。
    以上是我的分享,谢谢。

    Q&A

    席友:现在很多车企在推无图的纯视觉方案,这到底是为了目前把车先卖得好,短期上在方案上的妥协,还是未来无图就是一个相对终极的解决方案?

    李东旻:首先,我们要明确一点,无图的全称是无高精地图,并不是没有地图。目前全行业,包括特斯拉在内,都是有地图的,所以我们更愿意用轻图的方案,叫Lite Map,避免一些歧义。这是其一。
    其二,这一定是终极方案,因为传统的高精地图没有办法提供一个价格比较便宜且计算比较可靠的计算方法。我举一个经典的悖论,城市内的高精地图卖到主机厂,通常一辆车在整个3~5年的生命周期里,要收取1500元到2000元人民币的费用,而一个芯片才1000块钱,所以它的价格实际上是非常贵的。那么当你看到前面市政施工道路的时候,你是相信一个花了2000元买来的高清地图的结果,还是相信不到200元的摄像头所看到的结果?这就是悖论。几乎所有做自动驾驶规控的人都会毫不犹豫地选择200块钱摄像头看到的东西,而不选择2000元高精地图所看到的东西。
    所以,这里就会产生一个非常大的疑问,高精地图究竟在里面发挥的作用是什么,而且它还卖那么贵。图本身的价值是存在的,无论是降低算力,还是给车辆一些先验信息,但是它的存在方式必须发生比较大的变化。它必须靠量产车,也就是特斯拉所走的这条路径,靠已经卖出去的车的数据,能够实现快速的迭代和循环。特斯拉是全球唯一一个能做到每个月OTA升级一次的主机厂。它实际上在内部是每周迭代一次,而今天国内做的最快速更新的也只能做到一个季度更新一次,但是大家都想把车辆感知做到更新更快。理论上,你只要车辆卖得够多,数据够多,做到天级更新都行。但是现在大家普遍追求的是每个月升级一下车辆,无论是图的数据,还是感知模型,需要以月的节奏更新。那么,要实现它,就必须改变原来高精地图的存在方式,或者它所依赖的数据源,必须进入到量产车上。
    第三,生产的图精度不要那么高,因为你成本太高,你生产的图,最好是能够满足这个车的归控,它能用就最好了,不要有多余的,多余的东西其实也没有必要。因为在自动驾驶领域,所有的图都不是一个标准化的产品,主机厂A用的数据,跟主机厂B用的图,有些要素肯定是一样的,但有接近30%到40%的要素是不一样的。你只需要用低成本的方案,满足它的归控所需的东西,实现城市NOA,车辆的竞争力才是最好的。这样的情况下,消费者感知到这辆车才是聪明的。

    席友:如何看待World Model在自动驾驶的前景?

    李东旻:这个问题很前沿,World Model这种生成式数据能不能够去取代数据采集的维度?我想从这个维度来理解,基于世界的模型,它对于数据采集,或者对于大模型、自动驾驶的帮助会有多大?
    我想从两个维度来看。第一,我觉得世界模型的思维框架是非常值得借鉴的,跟ChatGPT不一样,我个人理解ChatGPT就是一个上帝,所有的东西都要进入到大框架里进行训练,训练到某一天突然就开悟了。我自己更开玩笑地说,它不是开悟了,它开始胡说八道了,取决于你怎么问它,你问的就是一个胡说八道的问题,它就跟你胡说八道地说。
    但是World Model的逻辑框架设计是值得借鉴的,它认为世界不是由一个上帝来主宰的,它可能分了几个区,有点像希腊的神话,有专门管爱情的,有专门管医学的。从这个逻辑上来讲,我觉得自动驾驶也是一样的,环境数据,就像我们提供的基于数据闭环的轻地图的思路也是一样,跟道路设施相关的,跟交规相关的这些东西,可以有统一的一套数据和一套模型来训练。在这个模型下面,可以有更加专业化的知识出现,在感知领域也会有非常多专业化的知识出现。再涉及一些更深层次的场端看,我们谈封闭场景,港口、矿区,这里甚至涉及原来的业务流程和业务体系,比如矿区怎么运行的,机场里面怎么运行的,跟这些东西相关的,可能也都会有一些业务规则,它有一个模型,可能也会更适合那个领域场景的模型,我觉得这是World Model第一个可以借鉴的很好的地方。我个人认为,也是目前大家共识的思路。
    另外一点,World Model它能不能自己生成一些数据,来降低关于数据训练或数据生成的成本,目前说实在的,我还没有明确地看到这样一个趋势,因为它的真实性和可靠度,在汽车领域还是一个相对比较高的要求。我们可以有一些4D标注的工具,可以有一些机器训练的方式,来降低标注成本,这个是可以做到的。但是,如果这个数据完全是胡诌出来的,我们始终现在还没有看到一个明显的趋势,所以我想从World Model这个问题,引申出这两个我自己的思考。
    席友:自动驾驶的长尾效应如何解决,何时能够解决?

    李东旻:我理解长尾效应其实是在谈Corner case,我觉得把它分成两个维度或者分成两个场景。
    第一个是L4领域。L4场景,其实目前我们看到,已经有行业内的解答方法,就是把车辆限制在场景里面。在广域范围内,我个人观点,比如Robotaxi,究竟能不能在全城范围内跑,在我自己眼看的5~10年的范围里面,是不太相信Robotaxi能全程跑起来的,我觉得,主要就是在限定场景里面的Corner case,说白了,就是这个场景的Corner case,是由业主来决定的,业主有Corner case,他甚至可以为了你这个车,把Corner case给解决掉,把它的场景给改变掉。无论是机场、矿,还是港口等等,都是这样的。
    另外一部分,就是所谓的L2+,或者说叫L2.9无限循环。辅助驾驶领域,实际上是最有可能大规模落地和实践的场景。在L2这个领域里面,Corner case,实际上是靠群体智慧,也就是量产车的群体智慧解决的,而这个解决,只要假以时日,实际上是能够实现的。

    嘉程资本Next Capital是一家专注科技领域的早期投资基金,作为创新者的第一笔钱,我们极度信仰科技驱动的行业创新,与极具潜力的未来科技领袖共同开启未来。

     

    我们的投资涵盖人工智能、硬科技、数字医疗与健康、科技全球化、生物科技与生命科学、企业服务、云原生、专精特新、机器人等领域。投资案例包括元气森林、熊猫速汇、寻找独角兽、店匠、士泽生物、芯宿科技、未名拾光、橄榄枝健康、硅基仿生等多家创新公司。

     

    嘉程资本旗下的创投服务平台包括「嘉程创业流水席」,「NEXT创新营」、「未来联盟」等产品线,面向不同定位的华人科技创新者,构建了大中华区及北美、欧洲和新加坡等国家地区活跃的华人科技创新生态,超过3000位科技行业企业家与巨头公司高管在嘉程的平台上分享真知灼见和最新趋势。

     

    嘉程资本投资团队来自知名基金和科技领域巨头,在早期投资阶段富有经验,曾主导投资过乐信(NASDAQ:LX)、老虎证券(NASDAQ:TIGR)、团车(NASDAQ:TC)、美柚、牛股王、易快报、PingCAP、彩贝壳、云丁智能等创新公司的天使轮,并创办过国内知名创投服务平台小饭桌。

     

    嘉程资本是创新者思考的伙伴,成长的伙伴。

     

    嘉程资本
    握手未来商业领袖
    BP 请发送至 BP@jiachengcap.com
    微信ID:NextCap2017