实域科技林四十:空间视频的过去和将来|嘉程创业流水席200席精彩回顾
12.23.2023 | 嘉程资本:创新者的第一笔钱 | 嘉程创业流水席
空间视频这种形式将会是XR中最流行的一种形式,所谓的主流就是它的数量最多,后续围绕它会出现一系列的产品以及创业机会。
 
近日,嘉程创业流水席第200席【探讨2024年MR的全新趋势与创新机会】,邀请了实域科技创始人&CEO 林四十分享,主题是《空间视频的过去和将来》。
我分享的课题是《空间视频的过去和将来》。我先介绍一下自己,我是实域科技的创始人兼CEO。我们公司专注于空间视频的录制设备和应用开发。我在VR视频行业也有七八年的从业经验,曾经参与过高端VR相机和VR视频应用的制作。今年Vision Pro发布后,空间视频应用引起了大家的广泛关注。很多人对它的形式和效果感到好奇。我今天想和大家分享一下空间视频的发展历程,以及它未来的发展趋势。
空间视频的历史脉络
首先,我们来梳理一下空间视频的历史脉络。一个重要节点是今年6月份苹果发布了Vision Pro。在2023年之前,XR市场对3D视频并没有一个统一的概念,各种形态的视频都有人尝试过,但是都没有很成功,甚至连PICO也没有成功。之前的VR视频大多采用VR180的格式,但这种格式没有出现消费级的产品和平台,即使是PICO也没有提供用户上传的接口,只能观看平台自制的视频。这就是之前的一个状况。
接下来的一个节点是Vision Pro发布后,以及10月份Quest3的发布。Quest3也是主打MR的形态。MR其实是空间视频或者VR视频的基础,它可以作为背景,让视频看起来更有立体感和冲击感。在这两个设备的推动下,XR市场对空间视频的认知基本上达成了共识,而且大家非常关注这个事情,对整个市场的升温也有很大的促进作用。
2024年到2026年的状况是我个人的预测。苹果和Meta会继续在这个方向上投入资源,XR设备也不会再只是游戏机这样的单一定位,我相信未来会有更多的应用涌现出来。在这些应用中,我认为观影可能是除了游戏之外最重要的一个应用领域。

相关名词梳理——全景/立体/体积视频

在介绍核心话题之前,我想先跟大家梳理一下相关的名称。因为这些名称可能之前没有人做过系统的整理,大家以前肯定见过这些词,比如全景视频、VR视频、空间视频、3D视频、立体视频、体积视频等等,名目繁多,看起来有点乱。我在这里帮大家梳理一下,这些东西到底是什么,怎么去归纳它?
从本质上讲,这些视频可以分为三类:
  • 第一类,我称之为没有立体感的视频。这种视频就是我们之前说的全景视频,它没有立体感,它只是一个360度的视频球,把观看者包围在其中。观看者可以上下左右地旋转视角,它是无死角的。但这种视频没有立体感,但这种视频它是没有立体感的。
  • 第二种是有立体感的视频,也就是苹果的空间视频,或者叫立体视频。立体视频和空间视频本质上是同一个东西。还有一些其他的称呼,比如3D视频和VR视频,其实这些也都是同一个东西,我们以后可以统一称之为空间视频,或者在必要的时候也可以叫立体视频,因为它们的唯一区别其实就是视野角度(FOV)的不同。除此之外,它们没有其他的区别,其他的都没有不同的地方,它就是左眼和右眼的画面不一样,给用户提供了两个画面的视频,仅此而已,没有什么特别的。
  • 第三种视频,它不仅有立体感,而且还有场景,用户能走到这个场景里面去,能看到这个视频画面里的人的背后,这种视频叫体积视频。目前苹果的空间视频并不是这个形态,现在有立体感的这一部分苹果的空间视频仅仅做到了可以看,可以看到立体效果和一个非常真实的画面,从这个场景里面走出来,但是观看者没有办法走进去,因为本质上它还是视频,并不是场景。
所以,有了这样一个梳理之后,其实大家在看到这些称呼的时候,只需要关注它们是不是有立体感的视频即可。体积视频和前面这两类是完全不同的,全景视频和我们XR领域其实关系不大,因为它没有立体效果,它完全可以在手机上或者在电脑上直接观看,只要转动一下屏幕就可以了。也就是说,它没有必要在XR设备上观看,那么我认为它和XR就没有必然的联系。
有立体感的原理,我给大家简单介绍一下。就是左右眼看到的画面不同。我们在真实看世界的时候,左右眼看到的画面也是不同的。比如说,以这个示例图为例,左眼是蓝色的部分,它能看到A和B两个正方形,同时也能看到C的一半左右。而右眼能看到A和C,但是B它只能看到一半左右。这就是我们的左右眼看到画面不一样的原因。我们的人脑会根据这个画面生成立体感和尺寸感,我们的人脑能感知到ABC的排列关系,以及ABC的完整形状是什么。所以说,立体视频的本质是让大脑接收一个画面,激活它的视觉神经系统,也可以说是一种欺骗大脑神经系统的方式。
在空间视频出现之前,整个XR领域里最流行的是VR180这种格式。这种格式的特点是,它的画面是180度的视野,从最左边到最右边,整个180度的视野全都是视频。也就是说,这个视频是半包围着观看者的,它是有立体感的,因为它是由两个不同的镜头拍出来的两个不同的画面。而这样的相机相对昂贵一些,没有1万元以下的。右边图里这两台设备基本上接近10万了,它们的应用场景是赛事直播、舞台演出或者影视级别的制作。

最右边这张图就是我们熟悉的PICO直播。因为我们PICO在视频这边市场的一些资源比较丰富,它就做了PICO直播,我相信大家应该都看过。这样的直播用的采集设备就是类似图里的设备,这种设备大部分要连接电脑,非常昂贵,也很重。所以说,它就和我们消费者关系不大,它不太可能产生UGC的内容,一定是工作室或者大的平台公司才能做的。

立体视频的不可能三角

我们之前也做过VR180,但是没有做起来。这么多年我们总结下来,本质上立体视频是存在一个不可能的三角,这三个因素是立体感、沉浸感和消费级。沉浸感是指这个画面把观看者包围的程度,也就是这个画面的FOV。消费级是指采集设备的价格,以及普通人能否使用它,能否拍出来。这三个因素是目前的硬件条件下无法同时实现的,这就是之前我们行业经历的困难。
  • 如果不考虑消费级,只追求立体感和沉浸感,那么这样的视频就是刚才我们介绍的VR180。就是PICO视频现在做的业务,以及苹果Vision Pro,它和NBA以及美国的一些赛事也有一些合作,这些体育赛事的转播应该也是这种类型。这样的转播一定是大厂或者专业的工作室才能做的。
  • 如果我在这个三角形中不追求立体感,而是注重沉浸感和消费级,我就要把这个包围性做得很好,让这个设备很便宜,人人都能拍。这样的东西叫什么?这样的东西就是全景视频。代表的产品就是Insta360,我相信大家也都知道这种产品和相机的形态,它的主要应用场景其实是运动剪辑。右边这个图就是很多运动爱好者用全景相机拍出的炫酷的视角和图片,然后分享到朋友圈或者抖音,它本质上是2D视频,不是3D,所以这和XR没有关系,因为这种视频的传播媒介,通过手机和电脑就可以传播,没有必要在VR头显里面去显示。但是也有一些公司在VR头显里面做这一类的业务,但是都不是做得很大,因为它没有给人带来真实的立体感的那种冲击性。
  • 所以如果我在这个三角形中放弃沉浸感,只要立体感和消费级,这就是苹果的空间视频。也就是说空间视频的FOV不大,很小,但是把立体感做好,再让这个采集设备便宜,这就是苹果空间视频走的方向,也是我现在创业正在做的事情。

空间视频的特点

介绍一下空间视频的特点,它相对于VR180,在立体感上有了提升。其中一个提升的原因,就是它以MR作为背景。MR的背景是真实的世界,在真实的世界里面看立体视频或者空间视频,你会有一种时空重现的感觉,感觉像是一个传送门,这个门里面是过去我用设备录下来的一段真实的世界和空间。目前苹果宣传的主要方向是家庭生活和旅行记录,而不是商业化的拍摄场景。
这类空间视频的采集相机,我给大家介绍一下,目前已经公布的是Vision Pro,但是有些开发者把Quest 3做了一些API上的处理,也可以把Quest 3的VST流截下来,它实际上也是一种空间视频。
手机目前只有 iPhone 15 Pro Max支持,但是它的问题是它只能用中间的两个水平线的镜头,一个广角一个主摄去拍。它拍出来的视频,因为这两个镜头的距离和人眼的距离差距太大了,所以它拍出的视频立体感就非常一般,只有物体离得特别近的时候,在VR里看的时候才会有立体感,一旦超过半米或者一米之外就看不出有立体感,这是它的硬件所限。不清楚它后面会不会通过一些软件算法把它变成一种更合理的形式,但总之目前的效果不是很好。
第三种的采集设备就是专用的这种采集相机,这种就是我正在做的事情,我相信将来市场上也会有其他的类型相机,可供大家去选择。
第一种头显的话,我相信大部分用户如果能用自己的头显录制的话,都会愿意尝试一下。但是毕竟戴着头显无法出门,比如说想要去外面玩或者去海边录制的时候,就会很不方便。所以我认为,未来的采集设备一定会有两种形式:一种是头显,另一种是手机或者相机。它们两个应该是相互配合的,手机或者相机可以给大家提供一个随时随地拍摄的场景,而头显则更适合在家里使用,这大概是未来的一种趋势。

空间视频将成为XR中最主流视频形式

空间视频的未来,我大概总结一下。录制设备就刚才说了两种,另外还有一种是专用的拍摄相机。我认为未来所有的XR头显都可以录制,但这个肯定是MR设备,就是类似于Quest和苹果设备,这是最近一两年的事情。AR头显,比如Rokid,可能是在三年以后都可以录制。专用的拍摄相机,这是第二类。第三类是部分手机,要看哪些手机厂商愿意为XR设备去做一些硬件上的改动,才能实现这种录制。目前只有苹果会做,后面华为、小米会不会做还不确定。
然后是传播媒介,因为立体视频它有两个画面,在手机和电脑上是无法观看的,看不到立体感,所以它的传播媒介就只能是XR头显。这样的话,它的传播媒介就比较狭隘一点,但是没有办法,没有正常的屏幕就无法呈现这种3D的效果。
最后是内容生态,由于录制设备价格下降,走向了消费级,因此一定会出现大量的UGC视频内容,这些内容可能涉及生活、运动和娱乐等方面,也必然会促成基于空间视频的内容平台这样的产品的出现。这种产品目前还没有,但我认为未来可能会有抖音TikTok或者YouTube等平台自己推出,但现在还没有,这个未来一定会实现。也就是说,我认为空间视频这种形式将会是XR中最流行的一种形式,所谓的主流就是它的数量最多。而之前我们做的VR180那种形式,主要面向的是影视以及专业化的视频,它的数量会比空间视频少很多。既然它是主流的话,后续围绕它会出现一系列的产品以及创业机会。
我大概就分享这么多,谢谢。

Q&A

席友:你体验过Vision Pro之后,对这种3D视频的概念有什么看法?将来会不会有专门的形态,让我们可以在手机或者某些硬件上录制空间视频,或者是在MR设备上体验空间视频?你觉得这样的视频具体会有什么目的?它是偏娱乐的体验还是其他类型的体验?我理解3D视频更多的是比如飞来物品的时候,这种体验挺好的,但我就在想,什么类型的视频最适合这样去做?

林四十:我觉得这个是会分阶段的,因为现在是处在初级阶段,刚刚起步的一个阶段。刚刚起步的阶段,最适合的场景就是能突出它的真实感和立体感的场景。目前能突出真实感的,就是记录个人的家庭生活、出去旅游,以及记录自己的亲戚朋友、老人、孩子等方面,主要目的是记录真实、还原真实世界,这也是目前苹果市场上宣传的方向,这是第一阶段。但是第一阶段流行起来之后,我认为会很快进入第二阶段,第二阶段就会出现运动类的,比如说滑板或者打球等。生活中运动一下,那些热爱极限运动的,可能会有一部分用户选择这样的运动场景,但是运动场景的用户就很难拿着手机或者拿着一些相对大一点的设备去拍,可能需要一些新的设备来拍摄。第三阶段就是会娱乐化,因为经过前面两个阶段之后,市场上的视频量也多了,大家看的内容也多了,自然会有人去做娱乐。比如说美颜,做一些特效,把这个人脸改造一下等等。它走到娱乐化之后,有可能就和现在的抖音、快手等平台就区别不大了,包罗万象。但我觉得未来一到两年之内,还是处在第一阶段和第二阶段之间。

席友:在MR设备上面录制和我用专业的3D摄像机去录制,有区别吗?

林四十:在这里有两个方面的区别,第一个是使用场景的区别。我们使用MR设备的时候,目前主要还是在自己家的客厅里,或者是在办公室里。很少有人会带着它出去走路或者旅游,或者是带着家人一起露营。虽然有这样的用户,但是他们可能是少数。大部分人使用MR设备应该是为了家庭和工作的需要,这就限制了它的拍摄场景。第二个是拍摄效果的区别。用MR设备去拍摄,它本质上是从VST流里面截取画面,这就导致拍摄者本身无法入镜,没有自拍的功能。如果我想要拍一个全家福,或者我想要出镜,我就得让别人带上我的设备去拍,这在逻辑上是有点问题的。另外,专用相机的画质肯定会比MR设备的画质要好一些,因为MR设备上的镜头是为了VST服务的,是第一优先级,而视频拍摄是第二优先级。从画质上来说,专用相机的画质会更优一些。

席友:工业制造领域的应用前景多大?

林四十:把立体视频应用于工业制造领域,虽然有一些案例,但是并不多。据我所知,立体视频在工业领域的主要作用是为了定位,为了3D重建,为了建立模型,或者是重建场景。这样的话,反而是VR180或者体积视频更适合一些。

嘉程资本Next Capital是一家专注科技领域的早期投资基金,作为创新者的第一笔钱,我们极度信仰科技驱动的行业创新,与极具潜力的未来科技领袖共同开启未来。

我们的投资涵盖人工智能、硬科技、数字医疗与健康、科技全球化、生物科技与生命科学、企业服务、云原生、专精特新、机器人等领域。投资案例包括元气森林、熊猫速汇、寻找独角兽、店匠、士泽生物、芯宿科技、未名拾光、橄榄枝健康、硅基仿生等多家创新公司。

嘉程资本旗下的创投服务平台包括「嘉程创业流水席」,「NEXT创新营」、「未来联盟」等产品线,面向不同定位的华人科技创新者,构建了大中华区及北美、欧洲和新加坡等国家地区活跃的华人科技创新生态,超过3000位科技行业企业家与巨头公司高管在嘉程的平台上分享真知灼见和最新趋势。

嘉程资本投资团队来自知名基金和科技领域巨头,在早期投资阶段富有经验,曾主导投资过乐信(NASDAQ:LX)、老虎证券(NASDAQ:TIGR)、团车(NASDAQ:TC)、美柚、牛股王、易快报、PingCAP、彩贝壳、云丁智能等创新公司的天使轮,并创办过国内知名创投服务平台小饭桌。

嘉程资本是创新者思考的伙伴,成长的伙伴。

 

嘉程资本
握手未来商业领袖
BP 请发送至 BP@jiachengcap.com
微信ID:NextCap2017