灵犀微光、视+AR的创始人在嘉程创业流水席分享了AR产业链的技术路径、巨头动态和应用场景。
据华为与第三方洞察数据显示,到2025年AR的市场空间将达到3000亿美金。在5G加持下,AR会优先在教育、社交、购物、出行导航和游戏等行业实现规模化应用。
无论是硬件厂商苹果、华为、小米、OPPO、VIVO,还是科技业巨头公司Google、微软、Meta,还是中国的互联网巨头公司腾讯、字节、爱奇艺等,大家都在AR领域做技术上的储备。
嘉程创业流水席第128席,灵犀微光创始人郑昱和视+AR创始人张小军,一起讨论了AR产业链的技术路径、巨头动态和应用场景。
灵犀微光从2014年开始就专注AR光学领域,尤其是光波导技术。接下来的内容我会来分享一下AR光波导技术是什么、它有哪些技术路线、各技术路线的优势和劣势是什么,以及我们灵犀在做什么,做出来的意义是什么以及为什么要做这件事情。
很多人对光波导技术比较陌生,因为它不像互联网或算法在国内处于一个相对发展较好或较快的阶段。光学的精密加工和设计其实是一个比较冷门、偏门的技术方向。
一、为什么要做AR光波导?
当前很多人都在热议元宇宙,元宇宙的终端级准入设备即AR/VR硬件。我们认为AR眼镜会成为像手机和PC端一样的现象级产品,会成为一个终端平台。灵犀从2015年开始做AR眼镜至今,在这7年的时间中大家依然在使用手机玩游戏、刷抖音,并没有发生革命性的变化。其实在2012年谷歌推出谷歌眼镜的时候,大家都会认为AR眼镜未来可以取代手机或成为下一代终端,但这么多年过去AR眼镜还是没有取代,那到底是为什么没有发生?关键问题是什么?
我认为,目前AR眼镜没有在 C端大规模使用的根本原因在于它的硬件,而不在于它的软件、算法和内容。很多头部科技公司们做出来的AR眼镜,其实跟大家想象的、在科幻片中看到的AR眼镜有很大差距,当前的AR眼镜又重又大,也不美观,这样的话它就很难成为一个消费级、现象级的产品。
所以,我认为硬件体验差是AR眼镜还没有取代手机成为终端平台的重要原因。那么在硬件上,“卡脖子”的地方又是什么呢?为什么AR眼镜会这么重、体积这么大呢?我觉得现在来看最重要的有两个方面,一是算力,AR眼镜本质上比手机算力要求更高,因为它不仅要显示手机上的所有东西,还要与现实环境相结合,AR既需要看到现实的场景,也要看到叠加的虚拟场景,这样就对现在芯片的功耗和算力提出了更高的要求。
所以总的来说,尽管很多大公司已经发布一些C端产品,但C端的标杆性产品依然非常缺乏,从2012年谷歌发布眼镜开始至今,很难看到满意的硬件形态。
上图横轴的FOV是视场角,它其实不仅代表视场角,更代表一种显示效果和体验,比如你能看到的AR画面大小。纵轴是体积,代表硬件体积的大和小。所有厂商都在探索,但是目前在第一象限还没有我们最理想的产品——体积小、显示效果好、美观,大部分产品分布于二、三象限,甚至还有四象限。
除了算力之外,还有一大原因就是它的光学。AR光学比VR复杂很多,因为不仅要看到虚拟的图像,而且还要看到真实的图像,并且还要将两者很好地结合在一起,这个难度远远超过了普通的光学设计。所以历年来,大家都在这个上面做了很多探索,包括离轴光学、棱镜、自由曲面棱镜等方案,但是这些方案还处于比较古怪的形态。
所以从2014开始,大家认为光波导技术能解决这个问题,光导技术简单来说就是把一个大的图像分割成很多小的图像,折叠压缩从我们镜片边缘耦入到镜片的中心,然后再把图像通过疏通扩展的方式扩展出来,最后返回到眼镜里。这样的话,就能够实现通过一个比较轻薄的镜片,显示相对较大的视场。
但是,由于光波导产业化进程相对于传统的光学技术来说进程较慢,而且它严重依赖制造工艺,所以现在市面上光波导眼镜仍寥寥无几。
二、光波导技术分类方向
现在主要有三种技术路线,一是几何阵列光波导,二是浮雕光栅波导,三是体全息光波导。第一种路径是利用几何光学的原理,第二、三种是利用衍射的原理。现在从综合显示效果来看,还是几何阵列光波导最佳。
主要从五个维度来做比较,一是光能利用率,对于我们的直观感受就是亮不亮,光能利用率越高,同样的能耗驱动就更亮;第二,偏色,简单来说就是颜色正不正;三,正面漏光,别人是否能看到自己正在看的画面;四,视场角,就是最终能实现的画面大小;五,厚度,很直观的就是体积、厚度。综合来看,几何阵列光波导在显示效果上确实拥有比较重要的优势。
几何反射式能够呈现镜面反射,可以像镜子一样100%还原入射光线,所以它能够很好的还原图像质量。另外两种衍射的光波导都有不同程度的问题,容易产生五颜六色的彩色条纹,以及还会有一些不清楚的地方。所以,衍射光学要完全替代几何光学是一个非常漫长的路线,衍射的方式会存在更多问题。
从显示效果、色移和清晰度上来看阵列光波导要好于衍射光波导,虽然之前也遇到过鬼影、虚像等问题,但现在都逐步得到了改善。目前来看,几何阵列光波导在显示效果对比中占有比较大的优势。
上面讨论了显示效果之后,就要考虑它的量产可行性和成本。从国内的情况来看,几何阵列光波导继承了原有光学加工的基础和设备,并在上面做了一些创新和改良,目前来看它是三种方案中量产性最好的一个。之前有人说几何光波导量产工艺复杂、量产难度难,这可能是2014年对于几何光波导的认知,其实在2014年的时候,这三种技术路线的量产难度都比较大。现在看来其实借用于传统光学加工的设备基础,几何光波导的良率问题和量产问题已经在三种当中处于领先位置。
关于几何阵列也有一些有意思的话题:
第一,为什么很多文章都讲它工艺流程复杂,量产难?其实工艺流程复杂和量产难度高是不能画等号的。如果这个算难的话,那么半导体加工的工艺流程就更为复杂,涵盖几百道工艺。像OLED屏、LCD屏也是几百道工艺,但是他们的量产很好,而且成本很低。所以,是否可以量产与工艺程序并不直接相关。
第二,为什么国外大厂,包括微软、Apple和Facebook等没有选择几何阵列光波导做第一代的产品?这个我也不知道原因,大家可以思考一下。
第三,OPPO发布了一个单色的产品,为什么OPPO选用一个单色单幕、小视场的方案来发布?这个产品是否能够成功?未来10年的AR发展中它会处于哪一个位置?这也是一个很有意思的话题。
这个就是从产业角度来看,现在光波导行业的对比。
三、灵犀微光在做什么?
灵犀微光在三个技术方向上都有布局,分别是几何阵列光波导、体全息光波导和表面浮雕技术。
最近三年,灵犀比较看好几何阵列光波导,无论B端还是C端的应用,都进行了包括重影问题解决、二维扩瞳扩展、减小体积、提高良率的技术难点突破。通过与世界光波导技术比较,灵犀的光波导技术有着高透高亮、细致轻薄、佩戴舒适和可量产的优势,可以做到60度视场角、1080p分辨率,低色移,高透光率。灵犀上一代产品有17.5克重,现在产品重量在10克以内,这基本上是业界最小的光学模组,这样做出来的眼镜就非常接近消费级。
未来,我们另外一个比较重要的方向就是体全息光波导,体全息的优势在于它能够比衍射实现更高的光效率。关于光波导的前置显示部分,目前以LCOS作为主流产品线,2012年谷歌用LCOS做出谷歌眼镜,微软用LCOS做出Hololens1,MagicLeap用LCOS做出MagicLeapone。从这个角度来看,如果最近三年要完成一个C端产品,LCOS肯定是最佳选项。
我们对体全息光波导有过比较长时间的研究,体全息光波导成本低,在效率、偏色和正面漏光上都优于表面浮雕,还可以做单片三色,而且还可以在弯曲的表面来做。但是体全息在激光曝光和材料体系的量产设备上还不够成熟,它离产业化还有一定距离。
灵犀的另一个方向是表面浮雕技术,在我看来它离产业化还有一定距离,因为衍射的问题在于它的原理性问题,效果上很难解决。衍射要做两片或三片,三片的成本比表面浮雕和阵列都要高,如果包含设备投入的话成本会更高。
灵犀的光学模组产品有AWX、AW80、AW70,AW60系列,它们主要针对消费级,重量都非常轻,在10克以内。相对于四五年前来看,无论是光学的核心技术还是软件的算法,还是基于手机做的内容都已经比较成熟,在未来三到五年会有一个爆发性的增长。这种增长至少能达到几百万台,在这个量级的基础上,从投资角度或者创业者角度来看,它都会带动产业上下游的发展。
我们希望做一些参考机型给行业内的一些开发者、下游厂商做参考,希望能给行业内提供一些借鉴价值,能够带动这个行业从1万到10万再到百万量级的增长。
目前,我们产品的应用场景方面包括B端和C端两部分,包括医疗、工业、安防、军用、娱乐、教育、旅游文化和新零售等场景。
视+AR的定位是做元宇宙空间计算平台,这是一个在以前手机和互联网时代并不存在的概念,是由元宇宙或者AR/VR引入的新概念。所以我接下来的分享就不是从上游元器件的角度展开,而是从一个软件开发空间计算平台的角度去做一个整体的行业介绍。
空间计算概念的出现是基于一种交互的需求,因为AR/VR本质上是一种交互的革命,由于交互的变革而引起的计算范式变革。其实交互很大程度上是一种空间的交互,它底层的能力就是空间计算的能力。
当前,很多人都会提及元宇宙,但是整个业界或者消费者对元宇宙也有一些误解和批评。很多人认为元宇宙会脱离现实生活,但我们看到的元宇宙其实是一个充分融合线上和线下生活的元宇宙,我们可以集两者之长。
一、EasyAR如何打造元宇宙空间计算平台?
在AR/VR的设备终端上,其实也具备一定的空间计算能力,但是受限于它本身的计算能力以及存储等各方面的限制,它所能够承载的空间计算容量非常小。我们面对的是一个非常庞大的世界,需要处理的数据和计算量非常复杂,这时候单靠计算终端上的算力远远不够,所以就必须要引入一个云端的架构。
还有一个原因是未来消费者使用的终端设备并不都来源于同一家企业,而是会应用很多家企业的产品,但我们面对的世界是同一个世界,这时候就产生了互动、互联、共享的需求,那么就需要一个基于云端的统一计算平台来进行多终端之间的互通互联。
基于以上的这些考虑,我们认为基于云端的空间计算在未来的整个市场中会占据一个较大的比例。我们公司主要定位在这个方向,希望打造一个基于云端的空间计算平台,来服务未来所有的硬件、开发者以及C端用户。
视+AR的产品分为四个板块,我们拥有一个大数据平台,这个大数据平台的核心数据是空间点云数据,即把整个现实空间通过计算机视觉的算法进行重构之后的三维点云。除三维点云之外,我们还包含一些结构化的数据,如POI、路网、用户数据、内容数据等。
在综合的大数据平台之上,我们会向用户提供三个维度的能力和工具:一是会提供SDK,能够使所有APP有能力运行在不同的硬件终端之上,同时SDK也是我们获取硬件数据的通道;二是我们会向用户提供一套完善的创作工具,因为我们不能让用户只靠编程或API去创作应用,我们一定要向他提供一系列便于使用、带界面且易于交互的工具;三是我们还有一个AR云服务,像大场景的三维重建以及基于视觉的定位能力都是运行在AR云之上的。
二、EasyAR的运营模式
接下来,介绍一下我们平台的运营模式,我们认为未来整个云端要处理的数据会非常庞大,而且遍布的领域也会极为广阔。这样的话,我们认为没有任何一家公司有能力依靠自己的力量去完成所有场景数据的搜集和建设。这时唯一可行的道路其实是要通过平台的模式借助开发者的力量。
比如我们采用的这种模式,我们把能力开放给开发者,我们的用户会根据自身需求,把对他们有帮助、有需求的场景中的数据搜集出来,并回传到我们平台上。然后平台会做一套流水线的处理,最终形成一个标准化的数据和服务,同时开放给所有的开发者,这是我们一个比较特别的运营模式。
我们认为EasyAR平台是目前国内唯一一个具备开发者生态优势的技术平台:一是用户规模,我们目前在全球拥有超过20万开发者的规模,其中60%来自于国内,40%来自于海外,我们有能力把国内的技术输出到海外去做服务。这些开发者遍布全球,包括美国、欧洲、韩国、日本、印度等,几乎每个国家都可以找到我们的用户,同时它应用的领域也非常广泛,覆盖游戏、工业、教育、营销等多个领域。
二是内容维度,我们作为一个专业性平台,需要提供非常丰富的内容,因为这有利于用户首次开发的成功,以及后续遇到问题的快速解决,同时降低他们在选择这种技术之后的使用成本。
三是生态协同的维度,因为技术、产品、规模等都可以被后来者快速超越,但是如果你跟产业的上下游有比较深入的协同,你可以遍布上下游的各个环节,那你的不可替代性会非常高。我们在这部分也做了很多工作,包括与国内外的眼镜厂商合作、与知名3D引擎合作、与运营商合作,以及还有高校和培训机构的合作等。
综合以上三个方面,我们现在应该是国内唯一一个具备开发者生态优势的空间计算平台。
三、EasyAR如何完成一个AR或者元宇宙的应用构建?
一是我们要通过消费级的硬件去采集整个现实环境的数据;二是在这个基础上去构建整个物理空间的点云地图;三是通过我们的AR云提供一个空间定位服务;四是向用户交付一个元宇宙的体验。
EasyAR平台有几个优势:第一个优势,是可以通过消费级的硬件进行采集,并不需要依赖非常专业且昂贵的激光雷达设备去采集环境中的数据。这个优势对于整个应用推广非常重要,因为采用激光雷达或者其他方式的成本会非常高,但是我们可以使用消费级的硬件,如全景相机或者用户手机就可以采集原始素材,这样我们就极大的降低了成本。
第二个优势,我们会提供全平台的支持,原因是基于用户的需求:一是终端用户的需求,因为最终用户使用的是多种设备,用户可能会通过不同的手机、眼镜甚至小程序接入元宇宙,但是大家面对的又是同一个世界,我们要在同一个世界里面进行互动、互联、互相对话,那就需要统一的服务。所以我们能够在不同硬件中使用,同时连接到我们的元宇宙服务和空间计算服务;二是创作效率的需求,因为不同的硬件厂商都有很强的意愿去开发一套自己的系统,这样对于创作者来说是效率的极大浪费,但是使用EasyAR平台去开发就可以做到一处开发、N处部署,开发者只需要开发一次,这样对于开发的效率以及成本都有非常大的优势。
第三个优势,我们不但会提供点云数据,我们还会提供环境地形。也就是把整个环境对应的稠密点云完整的呈现出来,这样才能让开发者可以更直观的去做内容创作,进而促进用户使用这个完整环境地形服务去创造应用时的效率。
四、EasyAR的应用案例
我们将相关能力都集成到了数字故宫2.0中,其中有两个比较重要的场景:一是AR实景导航,比如你到故宫里面去,你想找某个店就可以通过AR导航指引过去;二是AR的实景导览,比如你走到某个地方,想了解一下背后的故事、蕴含的文化,就可以通过AR导览的方式去呈现。
第二个场景是空间讲解,这个是我们跟天津庆王府合作的案例。天津庆王府是一个保护建筑,它跟中国所有的景点一样,都有个共同的特点——即一步一景。通过AR的方式,就可以很好的把景区中每一块石头、每一面墙背后的文化和知识等演绎出来。目前,AR眼镜的体验还远远达不到视频上录制的效果,包括它的亮度和FOV等。我们非常期待能有一款比较完美的眼镜出现,它佩戴舒适、FOV较大、对比度和亮度较好,能够还原真实现场的体验。
EasyAR交流群
我们一直致力于打造一个AR平台,不管未来它叫什么,是空间互联网亦或是元宇宙。这一定不是一家公司或者一个应用就能够实现的,它需要基于一个平台的支撑,且有千千万万的应用做出来之后,不断地进化、推陈出新,才能够形成一个虚拟和现实共存的未来。所以这也是我们一直坚持的路线,通过平台路线为未来而努力。
嘉程创业流水席是嘉程资本为创业者打造的高端、私密、平等的社交平台。在这里,大家能遇到来自各领域的优秀同道中人。自2018年下半年推出嘉程创业流水席的服务以来,承蒙广大席友厚爱,通过线上社群、直播和线下活动、交流的形式,我们接连在北京、上海、杭州、深圳举办了131场创业者流水席,迄今已服务数万名创业者和行业人士,有近千位企业家和行业专家在嘉程创业流水席分享过行业观点。
嘉程资本Next Capital是一家专注科技领域的早期投资基金,我们极度信仰科技驱动的行业创新,希望成为创新者的第一笔钱,与极具潜力的未来商业领袖共同开启创新的未来。
我们的投资领域涵盖新消费、新技术、新医疗。投资案例包括熊猫速汇、多抓鱼、十荟团、拉面说、店匠、bosie、熊猫星厨、核桃编程、橄榄枝健康等多家创业公司的天使轮或早期阶段。
嘉程资本旗下的创投服务平台「嘉程创业流水席」,致力于为科技互联网创业者和行业人士提供深度链接和一手行业信息,迄今已服务数万名创业者,汇聚了数百个创业者社群,有近千位企业家与行业专家在嘉程创业流水席分享过行业观点。
嘉程资本创始合伙人李黎是知名天使投资人,曾主导投资过乐信(纳斯达克代码:LX)、团车(纳斯达克代码:TC)、老虎证券(纳斯达克代码:TIGR)、牛股王、蜜芽、辣妈帮、PingCAP、易订货、彩贝壳、鹿客、Krazybee等明星公司的天使轮。
嘉程资本是创业者思考的伙伴,成长的伙伴。
嘉程资本
握手未来商业领袖
BP 请发送至 BP@jiachengcap.com
微信ID:NextCap2017