泥丸星李仁杰:AIGC在动画和游戏应用中是降维打击还是隔靴搔痒? | 嘉程创业流水席209席精彩回顾
03.30.2024 | 嘉程资本:创新者的第一笔钱 | 嘉程创业流水席

如果当一个游戏设计阶段就把AI当作必要因素,缺少AI,这个游戏也无法成立的情况下,那么我们将看到的是真正的AI原生游戏。

近日,嘉程创业流水席第209席【探讨2024 AI多模态领域的最新趋势和前沿动态】,邀请了泥丸星联合创始人李仁杰分享,主题是《AIGC在动画制作和游戏开发中的探索和应用——降维打击还是隔靴搔痒?》。

以下是正文内容:

我今天主要分享的是,过去从业和现在创业的经历,以及如何将AI应用于游戏和动画领域,还有国内外在这方面的现状。

从游戏到AI原生创业

我叫李仁杰,是泥丸星的联合创始人。虽然我的背景是“根正苗红”的技术出身,毕业于科大少年班,获得美国博士学位,但实际上我内心一直特别喜欢文化娱乐领域,尤其是游戏、动漫、影视。本来毕业之前想的是走学术路线,但是正好阴差阳错地有了一个可以去暴雪工作的机会,因为我长期沉迷《魔兽世界》,所以想要去我心目中的圣殿看一看,看看这种让我着迷的游戏怎么做出来的。结果没有想到在游戏界待了十几年,而且一直都是在探索技术和游戏是如何结合的最前沿。后来我从暴雪离开之后去了拳头,一不小心成为目前唯一一个既做过《魔兽世界》,又开发过《英雄联盟》的中国人。我在《英雄联盟》也是第一个做大数据的同学,从大数据基础设施建设到大数据部门,再到后来的AI部门,我参与了整个架构的建立。

AI在游戏中的运用

我先分享一些关于拳头公司早期如何利用机器学习的经验。大约是十几年前,人们还没有普遍使用“人工智能”这个术语。直到2015、2016年,AlphaGo引发了第一波AI浪潮之前,大家通常将其称为机器学习。我们最初是通过机器学习来探索游戏中的有趣案例。我可以给大家举两个例子,介绍十几年前人们是如何应用机器学习的。

第一个例子非常直观。在《英雄联盟》中,有众多的英雄角色。我们如何预测一个新英雄的受欢迎程度?或者更直接地说,一个新英雄能带来多少收入?实际上,我们的技术已经非常成熟,准确率基本可以达到95%。然而,准确率并不是最重要的。更重要的是,这些模型能够提供insights(洞察),让我们了解哪些参数和模型的可解释性是真正重要的,而哪些过去被认为重要的因素实际上并不那么重要。

过去,尽管每位设计师都非常成功,但他们的工作多少都依赖于个人经验。例如,一些设计师可能基于《英雄联盟》的男性玩家占多数这一观点,认为女性英雄会更受欢迎;而另一些设计师则可能认为怪兽类或石头类的英雄会更吸引玩家。实际上这样的因素到底是不是最重要的?

国外的游戏公司在这方面做得很好。他们即使掌握了可能影响游戏成功的关键因素,也不会制作千篇一律的英雄,因为这样会削弱游戏的趣味性。即便某种类型的英雄可能更容易大卖,他们也不会仅仅围绕这一类型进行设计。游戏需要多样化的英雄和丰富的背景故事来满足不同玩家的口味。因此,这些信息更多地指导设计师保持正确的设计思路,纠正过去的一些不正确观点。

至于《英雄联盟》中的Toxicity(“有毒”现象),由于其PVP(玩家对战玩家)的游戏性质,5v5对战中一方的失败往往会导致玩家互相指责,从而使游戏环境变得混乱,玩家间的互相辱骂对游戏氛围产生了极其负面的影响,也是整个游戏可控因素里,造成玩家流失的最大的原因。在解决玩家流失问题时,最难以克服的是未知因素。我们使用了语言模型来应对游戏环境问题,当时还没有大型语言模型,所以我们自行研发了一个简单但能覆盖所有语言的模型,而不仅限于英语。当时做的工作确实非常成功地解决了问题,还有幸被《Nature》报道。

在2015到2016年,AlphaGo出现,这时主要技术还是强化学习,再往后,OpenAI在星际争霸游戏中应用了AI,我也看到了AI在游戏领域的发展趋势。拳头公司也顺势成立了AI部门,第一步就是运用强化学习开发游戏内的AI战斗机器人。

到了2018年,我有幸结识了网易游戏的负责人,跟他们交流很多。后来,我加盟网易,帮助网易建立和带领网易人工智能实验室。网易伏羲是国内甚至于整个全世界,实际上以及到现在都是对游戏AI投入最多的。可以负责任地说,网易伏羲在游戏AI领域的投入在国内乃至全球都是领先的,因为网易不仅仅研究通用模型,更重视将AI实际应用于游戏中,解决具体问题。

可以举两个例子来说明。首先,网易很多的游戏其实都已经用到了强化学习的对战机器人,效果也非常明显。其次是自然语言处理,尽管在2018年之前,大型模型尚未出现,自然语言处理在所有AI领域中并不受青睐。当时,最先进的语言模型如Siri、小度和小爱同学,顶多也就是智能问答或者帮你写对联。

另外就是计算机视觉,因为游戏本质上是视觉化、动态互动的展现。在视觉方面,例如图像超分辨率、游戏图标生成、3D模型构建等,有很多可以操作的空间。其中,对玩家带来了非常好的游戏体验的功能就是“智能捏脸”。玩家只需上传一张照片,即可生成既符合个人特征又符合游戏美学的三维模型。《逆水寒》是全球首款推出AI智能捏脸功能的游戏,而《永劫无间》则是首个在Steam平台突破Top10的国产游戏。玩家们甚至戏称《永劫无间》为“90元的捏脸游戏”,附带一个对战游戏,这足以说明捏脸玩法的效果非常好。当然后来也在Steam上探索了非常多,包括虚拟人、多模态,以及大模型出现之后也做了非常多这样的尝试。

AI是降维打击还是隔靴搔痒?

其实我在伏羲的时候就有在考虑,AIGC在游戏和动画的过程中能起到什么作用?到底是降维打击还是隔靴搔痒?

如果直接回答这个问题,我的回答会是“都是”。这取决于应用的具体领域。最常见的应用是降本增效,例如,文生图和文生视频在过去一年多来非常流行。如果将其应用于游戏或动画制作,可以减少实际创作时间,如生成游戏图标或人物模型。但没有真正从事过游戏或者动画的同学,可能往往会把这件事情想得太简单,因为实际上它在整个游戏和动画过程中是非常复杂的流程,它不仅仅是用几句话描述需求就能生成图片或动画并直接使用。虽然它确实能降低成本并提高效率,但效果可能不如人们想象得大。

同时它又是绝对可以降维打击的。这是因为随着AI技术的不断进步,以及在未来的某一个时间,它一定会产生AI原生的游戏或者动画,这将是一种全新的类型。可以想象的场景类似于《西部世界》或《头号玩家》中描述的,所有NPC都能像真人一样与玩家互动,模仿现实世界。目前,AI作为游戏降本增效的工具,尽管在游戏早期设计阶段未被充分考虑,所以AI做得再好也只是锦上添花。但是,如果当一个游戏设计阶段就把AI当作必要因素,缺少AI,这个游戏也无法成立的情况下,那么我们将看到的是真正的AI原生游戏。

在伏羲期间,我们探索了AI原生游戏的可能性和玩法。两年前,我离开网易开始创业,我的创业项目与AI和大模型紧密相关,将这些技术应用于动画领域。从技术开发者和从业者转变为创业者,我们不仅开发技术,还自行生产内容,这就是现在的泥丸星。

谈到创业

每个人可能都有创业的梦想,但是也知道创业非常不容易,九死一生,所以也要遵循一些原则:

  • 第一个,创业的领域是否是你最为热爱的。像我前面提到的,我最喜欢文化、娱乐领域,之前十几年一直在游戏领域,后面我就想深入探索动画领域。

  • 第二个,创业方向是否符合时代发展趋势。两年前我的预判是:技术,尤其是AI技术,在游戏和动画制作领域一定会大有可为,果不其然,出现了文生图,最近出现了Sora。

  • 第三个,就是当你创业的时候,虽然创业九死一生,但还是希望它会成功,但最起码暂时在这个领域做到我们想要做到的,国内质量最好的,这一点我还是非常有信心的。

 

Q&A

席友:AIGC对于游戏和动画领域的机会?

李仁杰:要看大家想要的是什么,如果目标仅仅是降本增效,机会是有的也能赚到钱,但是不会有大家想象中的那么大。随着技术的成长,它一定会生长出自己新的领域。

为什么它没有大家想象中能带来这么大的效果?因为它首先有可以解决的问题,还有无法解决的问题。目前尚未解决的问题,例如文生图和文生视频在一致性和细节控制方面的问题,我相信未来的技术能够解决。尽管在生成单张或多张图片时,质量可能非常出色,但要生成100张保持人物一致性的图片目前还做不到。这对于游戏或动画制作来说是必要的。正因为如此,专业创作者在修改这些图片上花费的时间可能比自己绘制还要多。此外,尽管人们在创作前已有许多想法,但简单的语言描述无法完全捕捉这些细节,因此直接使用生成的图片或视频往往需要大量修改。目前,AI生成的图片和视频在细节控制方面仍有局限,这对专业创作者来说是一个挑战,但这些问题有望在未来得到解决。

有一点也是非常致命的一点,可能未来没有办法解决。因为文生图和文生视频的输入和输出的方式,也是它模型建立所决定的,输入是一段文字,优势是它可以把非常模糊的概念变成非常惊艳的表达。但是它的缺点是不符合目前创作者在已经建立的成熟的流程上面所进行的工作,因为专业的创作者在进行创作的时候,不论是画画还是做动画,都会有非常多的训练,包括灯光设置、角色塑造、情感表达等多个细节方面,而目前的AI技术尚未能够完全达到这些要求。

此外,还有一个人为因素,人很难通过语言准确描述自己的需求,这也为AI技术的应用带来了非常多的限制。因此,尽管文生图和文生视频目前非常流行,但实际上更多地被非专业创作者所使用。对于不擅长艺术的人来说,这些技术非常有用,因为它们可以将语言描述转化为具体的画作或动画,从而直接传达给专业创作者以生产出成品。对于非直接创作者来说,这些技术可以提供大量的灵感和启发,但它们不太可能直接取代专业创作,甚至达到非常大级别的降本增效。

 

席友:AIGC多模态大模型在模拟现实场景上有怎样的价值和应用?

李仁杰:在当前技术条件下,文生图和文生视频尚不适宜模拟精确的工业生产级别现实场景。它们更适合作为一种想象力的表达,比如模拟一个女性漫步在东京街头的场景可能是可行的。然而,我个人认为,Sora并不是现实世界的模拟器,它更类似于一个经验丰富的画师或动画师。这样的艺术家能够绘制出非常逼真的海浪,但可能并不了解海浪的生成和运动规律。

至于Sora视频中出现的错误,例如穿帮镜头和左右脚行走的错误,这些问题反映出当前AI技术在理解整个场景和物理规则方面还存在局限。AI生成的内容虽然在某一帧中可能看起来合适,但在连贯性和物理真实性方面仍有待提高。

 

席友:AI制作动画成熟的工作流?

李仁杰:我不敢称为成熟,我们正在探索两个主要方向:一是AI参与动画制作的工作流,还有一个是AI原生。现在还有一套完整的工业化流程,从剧本创作到二维美术设计,再到分镜、三维建模、绑定、渲染、动画制作,以及最终的灯光和合成,我们都在探索AI如何真正进行降本增效的。

还有一些可能大家看似可以去提升,但实际上在应用中还不是那么现实的。一个就是AI原生动画生成,我认为它未来不会取代传统视频的生成。以短视频为例,AI可能会开辟一个新的领域,这个领域可能会比现有领域更大,或者三分天下。举个例子,就像过去街机占据游戏市场的主导地位,随后被PC和手机游戏所取代,手机游戏现在占据了超过50%的市场份额。短视频市场虽然庞大,但它并不能完全取代中长视频内容。

 

席友:您的项目或者是未来的构想是一个什么样的商业模式?

李仁杰:这是我个人过去的经验和观点,我的感觉是做大模型,尤其是底层通用大模型的,应该不会在垂直领域上发力,因为有太多的垂直领域,可能上万个甚至上百万个垂直领域,他们不会在某一个垂直领域,除非垂直领域是对它们本身的行业极其重要的。所以我认为在通用大模型方面,他们不太可能宣布开始专门为游戏厂商或动画厂商提供服务。

能做这件事情的会有两个,一是大型企业,它们可能本身就是游戏公司,或者拥有大量来自游戏的营收。这已成为业界共识,人们普遍认为人工智能将发挥作用并值得探索。在这方面,国内企业通常领先于国外,不仅投入更多,质量也更高,而且起步更早,主要是因为国内企业多为互联网公司,更具备这种思维方式。相比之下,国外的游戏公司更专注于内容创作,而不是AI的技术上面。

另一类是创业公司,它们专门为垂直领域提供服务。我个人认为,这些创业公司的商业模式可能难以服务于头部厂商,因为头部厂商完全有能力,而且做得可能更好。所以他们应该能服务的是两种。第一个是海外的公司出海,其实海外的没有国内做得好,单指游戏AI这个领域;第二个是支持国内腰部以下的游戏公司。

 

嘉程资本Next Capital是一家专注科技领域的早期投资基金,作为创新者的第一笔钱,我们极度信仰科技驱动的行业创新,与极具潜力的未来科技领袖共同开启未来。

我们的投资涵盖人工智能、硬科技、数字医疗与健康、科技全球化、生物科技与生命科学、企业服务、云原生、专精特新、机器人等领域。投资案例包括元气森林、熊猫速汇、寻找独角兽、店匠、士泽生物、芯宿科技、未名拾光、橄榄枝健康、硅基仿生等多家创新公司。

嘉程资本旗下的创投服务平台包括「嘉程创业流水席」,「NEXT创新营」、「未来联盟」等产品线,面向不同定位的华人科技创新者,构建了大中华区及北美、欧洲和新加坡等国家地区活跃的华人科技创新生态,超过3000位科技行业企业家与巨头公司高管在嘉程的平台上分享真知灼见和最新趋势。

嘉程资本投资团队来自知名基金和科技领域巨头,在早期投资阶段富有经验,曾主导投资过乐信(NASDAQ:LX)、老虎证券(NASDAQ:TIGR)、团车(NASDAQ:TC)、美柚、牛股王、易快报、PingCAP、彩贝壳、云丁智能等创新公司的天使轮,并创办过国内知名创投服务平台小饭桌。

嘉程资本是创新者思考的伙伴,成长的伙伴。

 

嘉程资本
握手未来商业领袖
BP 请发送至 BP@jiachengcap.com
微信ID:NextCap2017