11月3日,嘉程创业流水席第157席【探讨游戏科技趋势中AIGC应用】,邀请了冰河物语CEO王国鸿来分享,主题是《Art to End 的 3D AIGC》。
以下是演讲正文:
很荣幸受到嘉程资本的邀约,在线上跟大家分享我们目前在3D游戏领域做的AIGC的相关应用。在讲具体的应用之前,我也是想把我对AIGC这一块的理解跟大家分享一下。
首先我认为AIGC有三种表现形式,第一种叫做无指令的AIGC,不需要人去输入任何的指令,AI模型就可以自动地去生成随机的一些结果。例如我们做了一款3D生成引擎,这个引擎的输入是批量同品类的三维模型,训练后就具备了随机输出差异化、同品类的三维模型的能力,AI学习的就是这个品类的三维mesh表示。
但是这个输出,没有任何的指令能够去控制它,到底能产生什么样的三维模型,AI最多只能控制生成出来三维模型的品类和训练集一致。这种无指令的AIGC它的商业价值就是表现得低一些。
第二种就是现在非常常见的,叫做指令AIGC。
这个指令AIGC指的是人可以给AI一些指令,比如说典型的像通过文字去生产图片的这样一些应用,人可以去给AI输入一段文字指令,例如“走在阳光下的戴眼镜的小狗和小猫”,AI就会通过这一行指令去完成一个对应的结果输出。
这种AIGC,在UGC领域中可能是一个非常有趣的应用,但是在PGC的这样一个专业流程中,它更多的是起到一个启发式的作用,尤其是制作游戏、影视的这样标准要求很高的流程。
第三种就是我今天重点介绍的,叫做基础作品+指令的AIGC。这样的AIGC指的就是我们现在已经有了一个基础的艺术作品,无论它是3D的也好,2D的也好,再通过这样一个指令让人工智能去根据基础作品生成内容。
比如说我给AI输入了一个图片,它是一个很可爱的狗坐在草地上的一张照片,我再给它输入一行指令,叫Sitting dog,想要根据图中的狗去生成一个坐下来的狗。这种情况下,AI接收到的输入有两个,基础作品和文字指令,然后它就可以根据原图生成一个坐下来的狗。
这种AIGC我们也给它起了一个名字,叫做ART2END-AIGC。
接下来重点讲一下我们在做3D AIGC时遇到的最大的三个问题。
第一个问题就是组件,其实无论现在在游戏还是影视,它去生产一个三维模型的时候,大部分是以零部件的方式去生产的,我去做玩偶也好,枪也好,它是以部件的形式去生产的,比如说玩偶他会先做鼻子,先做胳膊,先这样,再去做衣服,再去做腿最后合并成一个模型。
但是如果通过人工智能,生成出来的三维模型基本布线都是连在一起的,这样对在PGC流程中使用三维模型的专业人士来说,这样的生成结果是非常不友好的,所以这个组件是我们首先要攻克的这样一个难题。
第二个问题就是布线了,布线其实最明显的如果你通过AI去生产一个三维模型,它的布线通常是以三角面的形式去表示的,虽然生成三角面之后可以通过一些其他的方法将三角面变成四边面,但是这种属于均匀布线,对后续的绑定、渲染上色都是非常不友好的。
特别比如说像做数字人,眼睛会拥有更密集的布线,就是因为通过这种密集的布线才能表现它的这样一个生动的表现力。布线这一块,AI目前基本上没有任何一个比较好的解决方案,只是说一些通过后处理的方式去稍微改善。
第三个问题就是关于材质,目前咱们经常玩的那些,无论是3A游戏大作,还是看到了非常精美的那些影视场景,它走的都是PBR流程。PBR流程通常值的就是物理渲染,物理渲染目前大概有两套的贴图,都可以完成相同的物理渲染的效果。
第一套是通过漫反射、粗糙度,包括AO、 置换法线这些贴图,去完成这样一个渲染。
另外一套就是通过颜色、光泽、高光配合AO法线和置换去完成另外一套渲染。但无论是哪一套渲染,它都是需要一个制作步骤,通过这六张图片的组合,才能完成三维模型的非常逼真的渲染。但是如果你要通过AI去生成,它是无法分割的,很难去把对应的PPR材质完整地分割出来,这个其实也是非常难的阻碍AIGC的一点。
接下来讲一下我们在游戏行业,通过我们现在已有的这些技术突破去做的一些相关的尝试。以及我们拿的这些技术去做了非常具体的这样一个在3D领域ART2END-AIGC的这样一个案例。
我们现在在制作3A游戏的时候,大家可以看到这些游戏场景它其实做得非常好,用了大量的扫描的资产,自己建的非常精美的素材库也很多。其实在制作整个三维场景的时候,并不需要花很多时间,因为我有大量的素材库,我有很多很精美的场景,你给我一个大概的架构图,可以很快的去把三维场景给你这样一个摆出来,但是摆完之后,用渲染引擎去跑FPS的时候,就会发现非常的卡,FPS甚至到了4~5帧,一秒钟只能渲染4到5张图片。
这样的FPS在对于任何一个游戏玩家来说,都是难以忍受的。所以这个ART2END-AIGC的功能,它的输入有两个部分,ART的部分就对应的这样一个建模师已经建好的非常精美的三维场景,指令部分就是指要保证这个三维场景感官基本不变的情况下,让它变得不卡。这种情况下,人工智能引擎是如何针对这个输入和它的指令去做生成的呢?这个其实就是我们先前积累的一些关于3D生成以及材质继承,以及这样点云相似度的对比,去完成这样一个人工智能的生成。
如图所示,上面一行其实是三个山体,最左边的是原始的山体,这个原始的三体大概由接近200个左右的小的石块组成,这些小石块的三维模都是非常高精度的PBR扫描资产。
再提一个概念,在虚幻引擎里面,引擎看到这200个石头,如果200个石头彼此之间不一样,其实对它来说就是200个实例,那么这200个实例,需要一个个地去渲染,这样就很容易卡顿。但是如果相同的模型它重复200次,对这个UE系统来说,它其实就是一个实例,那么渲染的时候可以就渲染一个模型,通过一些比较简单的加减乘除,就可以把其他的另外199个模型快速地渲染出来。所以我们针对UE设计的系统,设计了一套AIGC系统,用最这套系统的功能简单的一句话概括就是:用更少的实例,结合三维的AIGC引擎,去摆回和原始三维场景差不多的感观。
包括左下第二行这个房屋建筑原来大概是用了300个左右不同的房子去堆砌起来的这样一个实景,经过我们这样一个AIGC过滤一遍之后,它其实只需要50个左右的这样一个3D资产,就可以摆回跟原来差不多的这样一个三维场景。这样原来就每秒只能渲染3~4帧的这样一些三维场景,FPS就可以指数级增长。
这样在实际的游戏的使用,玩家玩的过程中的卡顿就会大大减少。这个就是我们分享出来的一个典型的案例,谢谢大家。
嘉宾简介
王国鸿,冰河物语创始人&CEO。本科毕业于北京航空航天大学计算机系,硕士就读于清华大学软件学院;曾担任酒泉卫星发射中心数据工程师,众标科技首席算法工程师,长期致力于三维算法在游戏影视等领域的落地。
北京冰河物语智能科技有限责任公司(简称“冰河物语”/“Glacier Legend”)成立于 2020 年 11 月,是一家 AI-3D 引擎提供商,致力于以最前沿人工智能技术,为游戏、影视、XR 和元宇宙等领域赋能,自主研发了业界领先的三维场景生成、三维场景优化,材质继承等核心技术。
嘉程创业流水席是嘉程资本为创业者打造的高端、私密、平等的社交平台。在这里,大家能遇到来自各领域的优秀同道中人。自2018年下半年推出嘉程创业流水席的服务以来,承蒙广大席友厚爱,通过线上社群、直播和线下活动、交流的形式,我们接连在北京、上海、杭州、深圳举办了150场创业者流水席,迄今已服务数万名创业者和行业人士,有近千位企业家和行业专家在嘉程创业流水席分享过行业观点。
往期嘉程创业流水席线上活动现场
往期嘉程创业流水席线下活动现场
嘉程资本Next Capital是一家专注科技领域的早期投资基金,我们极度信仰科技驱动的行业创新,希望成为创新者的第一笔钱,与极具潜力的未来商业领袖共同开启创新的未来。
我们的投资领域涵盖新消费、新技术、新医疗。投资案例包括熊猫速汇、多抓鱼、十荟团、拉面说、店匠、bosie、熊猫星厨、核桃编程、橄榄枝健康等多家创业公司的天使轮或早期阶段。
嘉程资本旗下的创投服务平台「嘉程创业流水席」,致力于为科技互联网创业者和行业人士提供深度链接和一手行业信息,迄今已服务数万名创业者,汇聚了数百个创业者社群,有近千位企业家与行业专家在嘉程创业流水席分享过行业观点。
嘉程资本创始合伙人李黎是知名天使投资人,曾主导投资过乐信(纳斯达克代码:LX)、团车(纳斯达克代码:TC)、老虎证券(纳斯达克代码:TIGR)、牛股王、蜜芽、辣妈帮、PingCAP、易订货、彩贝壳、鹿客、Krazybee等明星公司的天使轮。
嘉程资本是创业者思考的伙伴,成长的伙伴。
嘉程资本
握手未来商业领袖
BP 请发送至 BP@jiachengcap.com
微信ID:NextCap2017