行者AI陈洪宇：以游戏为成长土壤的AI技术｜嘉程流水席164席精彩回顾

02.08.2023 | 嘉程资本NEXT CAPITAL | 嘉程创业流水席

12月22日，嘉程创业流水席第164席【探讨云游戏/游戏AI/游戏新终端的2023新趋势】，邀请了行者AI的COO陈洪宇来分享，主题是《AI在游戏中的应用》。

以下为正文部分：

今天想给大家分享的是游戏AI应用的相关经验，我们公司名是成都潜在人工智能科技有限公司，行者AI是咱们的品牌名称，公司业务主要专注于做游戏行业的AI解决方案。

开场我用游戏+AI的两个定义去跟大家聊一下。首先，今天大家聊的游戏主要是更加偏向于大众的电子游戏，我目前认为游戏行业的定义，来自于伯纳德·苏茨的《蚱蜢》，是一本偏游戏的哲学性书籍，书中认为，玩游戏就是自愿去尝试克服种种不必要的障碍。我喜欢这个定义的原因在于，大众认为游戏是有一个目标的，但它可能不太像AI的其他应用比如人脸识别目标不那么明确，在游戏里一定会有胜利方，或者一定要去达到某个关卡，所以游戏是一个非常好的土壤去运用AI；另外就是自愿尝试和克服，说明有一定的规则和规律，而且要遵守游戏的设计和规则，通过这样的方式去玩游戏，体验当中的乐趣。这也是AI变成AGI的理想过程。

下面跟大家聊一下AI的定义，目前大众的定义或者期望，AI并不仅仅作为一项技术，当然也不能从技术角度去定义，而是目前大多数是通过人们的期望或者愿景去定义的，可以模仿人类智能，大家都期望AI技术像人类那样，用比较智能的方式去处理我们想要去解决的一些问题或者任务，这也是AI落地于各个行业的时候主要会遇到的问题的根源。

简单跟大家科普一下AI的分类：CV图像处理，NLP自然语言的处理、ASR语音处理，以及KG知识图谱。这几个大的方向，在游戏里面的应用相对来说比较少，而在通用场景里会更多一些。比如CV图像处理，大多数都是会用在人脸识别上，但是CV在游戏里的应用相对来说比较少，包括NLP目前在游戏的应用更多是NLP+知识图谱，做一些智能客服的事情，或者语音助手之类的应用。所以目前来看，游戏AI还是一个相对较窄的应用赛道，我们现在用AI去做应用，主要用到的是强化学习，说起强化学习大家不知道，提到AlphaGo应该比较熟悉，其实这个就是用强化学习的技术去做的，我们接下来做的事情，或者整个游戏AI的主要技术，基本上都是强化学习触及的。

下图是游戏生命周期简单的示意图，总共分下来就主要几块，第一个是游戏智能体，这个就是游戏机器人或者叫做游戏AI，是大家可能理想当中的AI应该的样子；除此之外，我们还有游戏决策体，用AI去做测试；还有游戏数据，之前可能只是分析统计，但目前的游戏数据就是在发行运营的过程中，更多地用一些智能方案去解决，比如说买量的问题、预测用户是否流失的问题。最后，就是在安全方面的应用，这个主要是包含内容安全或者行为安全，比如说我们会去挖掘一些灰产用户出来，或者找到违规的昵称或者涉政聊天内容等等。

下面给大家分享一下游戏机器人做的事情，包括现存的难点和痛点。首先，游戏主要是分为两个类型：第一个类型，就像大家看到的五子棋，AI的处理类型叫做完全信息博弈，比如我是执黑棋的这方，我能看到白棋的每一个步骤或者动作以及棋盘上所有的信息，AI能获取五子棋这个游戏世界所有的信息，假设计算资源和时间是无穷的，它完全可以利用这些信息通过程序的方式把最优解全部算出来；另一个类型，比如大家知道的DOTA，叫做非完全信息的博弈，比如我作为其中一个英雄角色，其实是不知道对方英雄处于什么状态，不知道它现在可能偷袭我，还是在打Buff。对于这样的信息，计算机是没法通过程序的方式算出最优解的，必须得通过 AI的方式去推测、预测甚至猜测，按照目前能看到的信息，去演算出来目前能做到的最好的决策，而且这种决策和计算每时每刻都在发生。

游戏AI可以提供的应用场景，主要包含这几个类型。第一个，AI陪玩，不管是五子棋还是高尔夫、DOTA，都可以实现陪玩，对于AI来说，它其实就像一个三岁左右的小孩，有一些基础的认知和智商，会走路，会去跟人做简单的肢体交流动作，它需要通过不停的探索才能够在环境或者游戏小世界中生存下来。每一次动作触发之后，环境会给它一个反馈，不管这个探索的动作会让它受到惩罚还是奖励，反馈拿到之后，它会知道之前做的动作是好还是坏。这个逻辑可以带给整个游戏AI的应用比较好的点，首先是以前可能很多游戏会有机器人，基本是通过人类或者游戏策划的思维方式提供出来的一套规则去实现的，问题是比较固化且套路单一。也不能去覆盖到游戏场景里遇到的所有情况，特别是针对现在比较开放的游戏，很难去把所有规则写清楚或写全，而AI机器人相对以前传统机器人有先天的优势，只要训练时间或者训练量足够，基本上可以覆盖到所有的决策和面临的环境，即使面临一个陌生的环境，它都可以去做出一个相对比较正常合理的决策，这是AI一个大的改进；另外一块就是刚刚说的，它的所有的动作是AI自己去做出来的，而不会按照人类的思想方式去做，所以能够给真实的玩家带来很多很不一样的体验，这个可以提一个比较大的畅想，以前大家去玩游戏，都是策划者给游戏定义好这一条路，比如说要怎么走才能通关，或者要怎么去玩关卡才能顺利拿到奖励，如果把AI加入设计，对于所有的玩家和游戏策划同学来说，都不知道怎么去玩可能会通关，这样的方式不论好坏，一定会给游戏的玩法带来不一样的东西。利用现有的机器人在游戏里面去做更多优化方面的东西，比如说优化数值，去做平衡性测试，逻辑是基本相通的。

这个是我们现在给游戏厂商提供的游戏机器人，它适用于大多数的游戏场景，不管是竞技类型的，还是战棋类的。比如说像《王者荣耀》这样类型的游戏，它基本上是可以去覆盖到的；另一个是卡牌策略游戏，卡牌我们相对来说做的非常成熟了，因为卡牌的模式比较简单，AI应用也是比较有用的。第一人称射击游戏，这个特别有意思，给大家解说一下，这个持枪的是AI机器人，它会去找bug，找一个bug就是去打到boss，但是boss打不到它，非常有意思；还有AI足球，通过一个模型就可以控制场上5名到12名球员，而不像以前每个球员内置的模型都是不一样的，或者写的规则都是不一样的。

下面就是刚才讲到的AI在其他方面的应用，数据分析，还有灰产的挖掘，通过可视化知识图谱的方式把灰产团队、灰产账号挖掘出来，同样可以适用于怎么去找一些高潜的付费用户或者即将流失的用户。以及内容审核，比如政治性的、广告的内容，目前也是我们正在做的比较好的一些事情。

前面基本上是在2022年以前我们做的一些事情，我们从2022年开始在游戏场景中去做一个创作型的AI，而创作型AI目前来说一直是比较大的一个问题。大家都知道AI目前比较成熟的，人脸识别或者NLP相关的东西，它其实基础的一个逻辑或者原理，都是模式识别，首先得有一个数据集，我通过这些参数和大量的神经网络，去找到内在的关联和逻辑或者特征，把这些东西拿到之后，就可以拿模型去做泛化性的东西以及去推理出来新的东西，但是从0到1基本上是很难去实现的，比如说让AI凭空去生成一个人物角色，它有它这种性格，能自己去做一些喜欢的事情，这也是大家对AI最大的一个愿景和畅想。通用人工智能发展到现在，目前也比较火的ChatGPT，包括大家看到最近看到Stable Diffusion 2这样的模型出来之后，游戏中应用场景会变得越来越真实。但目前，我们基于之前研究的，包括系统去学习或者借鉴他们的思路，去做一些非常有意思的事情，主要都是创作性的东西。

下面我跟大家简单分享一下我们准备去做的引擎，后面也会去用SaaS的方式提供给更多的游戏从业者使用。第一块是三维资产的生成，大家可以看到左上边是3D环境的生成，比如说给一个井字形的分布，AI就可以用提供的素材，花草树木等等，直接去生成静态的3D场景出来，而且非常快速；另外右上边的这部分是通过AI去生成建筑，这个是唐朝的建筑，而且任意的长宽高和形状，都是可以通过输入参数去调节的，以前的基本上就是一个素材贴上去了，如果窗户要再加一个，可能就需要破坏原有3D模型的结构，比较辛苦，现在有了AI的辅助效率就非常高，可以提高70%-80%，下面这个就是我们现在目前做出来的产品，是一个唐代的洛阳城，大概是六百多平方公里，要求是生成出来的东西必须符合当代的建筑风格，基于这样的需求，我们通过AI把整个洛阳城所有的街道、宅子、河流、城门等都生成出来，这其实很大程度上解放了他们的生产力，当然他们也会在后期做更细化的调整，但是在前面可以省掉80%的重复劳动力；右下角主要是3D模型的动作生成，或者是姿态的调整，举个例子，指定一个行走的路径速度，AI可以去自动调节身体的姿态，比如转向、扭胯，或者上升的平衡，这是一个简单的视频演示，目前我们是把它做到了Unreal或者是Unity里的一个插件，可以直接去用。

接下来是2D的应用，2D相对来说大家SD会玩的比较多。这一块主要围绕着2、3个场景去做，第一个是图标的生成，大家知道现在图标是非常多的，不管是物品、道具、装备，还是技能图标，在游戏里面可能有上千个、几万个。那我们可以通过AI快速去生成，生成完之后就直接拿去用了。另外一个就是AI生成插画或者背景，就是文生成图，通过输入一段文字，然后输出跟文字相贴切或者相拟合的图片，包括去生成比较精细化的物体、角色、英雄等，目前来说是比较成熟的。

我们现在也是有开放给B端和C端玩家的平台，大家可以去试玩。输入一个文字，有各种不同的风格和艺术家，这个艺术家其实是自己可以训练出来的模型，比如说你要重新通过提示词去输入，选中自己的艺术家，就会生成之前训练出来的类似的风格，不管是这种写实类的，还是卡通、二次元，或者油画风格都可以。也会有一些高级的选项，比如说可以生成随机数，同样是一个提示词，但是输入的随机数不一样，或者细节不一样，最后生成出来的类型都是不一样的。在统一的游戏里面需要统一的风格，那用这样的方式就可以训练出来，以保证生成出来的图片、图标都是同样风格的，这个大家如果有空可以去体验一下。

另外一块，是用AI去做音乐音效的生成，我们也通过这个音效，搞了一套交互式的音乐产品出来，这个是可以给到C端用户或者B端用户直接去生成的。我们给成都的大运会做了一首主题曲，整个作词、作曲都是通过AI生成，包括人声的演唱。我们现在每个月也会发布专辑，大家可以在网易云或者QQ音乐上去搜索，叫做Cyberants，就可以搜到我们的专辑，基本上每个月的模型更新一次就会去发布一张专辑，去看一下我们AI模型的效果，大家如果有兴趣可以听一下。

基本上目前在游戏里面能够去应用到的AI比较前沿的东西，也基本上是这些，整个在全球学术方面来说，在AI这个赛道上的追赶都是非常紧密的。

另外就是简单去聊一下游戏和AI目前面临的挑战。目前我们在整个游戏应用当中，主要有三个问题：通用适配、数据泄露和保密性，以及AI不是万能的。第一个是，首先大家知道现在目前AI都是叫人工智能，或者大家说的不是这种通用人工智能的方式，所以目前不能做到通用适配，这个会给我们游戏AI的应用带来比较大的成本，不管是对我们提供服务这一方，还是对于想要用到AI的这一方来说，目前我们能够提出的解决方案，主要是游戏AI每一个品类，我们会去做一个通用模型，来作为基础底座，去解决大概80%~90%的问题，剩下10%~20%的问题，我们再通过算法工程师去调整。第二个问题是数据的问题，比如说泄露、数据共享，或者数据变得更高质、更优质，这样的一个问题，其实我们作为一个AI公司，首先在商业层面来说，肯定会做到保密，另外一方面，得有一个足够开放的心态去做这个事情，这样能达到非常好的效果，因为AI这个东西非常需要数据的喂养，如果数据不行，就算算法资源和人力资源再厉害，可能还是达不到预期效果，如果相对来说数据质量更好更多一些，其实反而比算法投入和资源投入来的更好。第三个跟第一个比较相似，AI不是万能的，通用人工智能也需要一个过程，大家应该去坚信AI是能够达到想象中的通用人工智能，但是我们现在正处于这个过程，需要大家以开放心态去理解和利用。最后再说一下，我们应当拥抱AI，参与AI，现在也有很多人相对来说不太理解AI或者是至少不太了解AI原理，或者有技术能力的同学可能会有些抵触，特别是刚才分享的AIGC、AI生成这块，担忧AI会不会把这个行业变得更乱？我觉得大家可以更加理性地看待，AI就是一个生产力工具，就是给大家提供效率的，AI最终的目标，就是让所有的打工人变得更加有尊严的去工作，而不是它会抢你的饭碗。以前大家去做，不管是图片还是模型的建构，我的创意和我的实现，基本上是不可分离的，而有了AI工具之后，它可以让创意和实现分离开来。有创意之后，可以让AI帮你去实现出来，你不用花更多的心思去调3D模型，或者去修饰一些比较小的边边角角的东西，你只需要把你的想法合理正确地告诉AI，让AI去帮你做这一部分比较繁琐的事情就OK了，这个就是我们现在在做的事情。谢谢大家。

席友：前面提到的机器人游戏APP，游戏优化的AI应用，里面提到一个叫局外遍历机器人，探索资源最大化，这块我理解得还没非常好，老师能不能再拆开讲一下？

陈洪宇：我详细讲一下，第一个是局内战斗机器人，基本上还是我们先把这个机器人先训练出来，让它能够达到人类水平的80%~90%，就可以应用到局内战斗优化里了，然后提供这样的机器人，比如说在这个游戏内核里去开100万个机器人账号，让他们自动战斗，战斗的过程中涉及到各种各样的数据，就可能会找到一些漏洞的或者和游戏策划预期不一致的数据，比如通过这个关卡，游戏策划同学期望需要20步，花费10分钟左右，但其实通过大量的机器人战斗，发现所有的机器人去玩这个关卡的时候，它需要25步，花费8分钟，这样的话整个游戏当初的策划，包括后期用这些策划点去做一些付费的引流，它是没有达到预期的。所以可以通过机器人的方式收集数据，去做这样的自动化测试。

席友：局外遍历机器人探索自由化是指什么？
陈洪宇：局外遍历更简单一点，就是我们用CV的处理方式先去探索，比如截帧，会去探索到，比如屏幕里面哪些是按钮，哪些是输入文字的，或者哪些是玩游戏当中的操作，把这识别出来之后，通过这些操作的遍历，去看游戏的需求或者应用场景。举个例子，假设在《英雄联盟》里，通过这样的程序化AI自动化的方式，去看所有的游戏皮肤在各种不同的机型里的适配，以前的自动化测试或者是人员的测试，只是看这个模型有没有漏掉或者模型穿帮，而对于AI机器人，它可以把这个模型360度无死角的整个过程全部录出来，录出来之后再通过AI的方式去识别问题，基本上可以做到这样的细节程度。包括资源最大化，更多是利用在卡牌游戏里面，比如说抽完卡之后玩家会去组卡组，策划同学能策划出来的卡组可能只是上百种，但其实本身卡就有上百张，也不能保证所有的玩家都按照预期的卡组去排，这个时候我们可以通过AI遍历的方式把所有的卡组全部取出来之后，再通过AI玩游戏去调试，或者是去看有一些可能策划同学意想不到的卡组组合，它在游戏当中的表现是不是一个bug，是不是一个比较大的版本的问题，可以做到这样。

席友：在游戏的一整套研发流程下来，目前的AI技术而言落地可行性以及带来价值，最大的环节是哪一块？绘画，3D资产，还是什么？以及有没有一些B端游戏企业大概的落地效果？
陈洪宇：明白。您现在提到这个问题，也是AIGC在游戏里面，到底使用程度有多高？能不能作为真正的生产力工具？对于这个问题，我觉得如果真正非常坚定看好AI的话，就不是去怀疑它的能力，而是怎么样去更好地去利用它。举个例子，比如说在3D模型建筑里面，我们不要求它生成出来的城墙一定是非常精美的，或者细致程度一定是非常高的，但要建造一个五十公里的城墙，把整个地图给我之后，我真的一寸一寸贴上去吗？我觉得，AI它真正的价值所在就是可以节省大量复杂的、繁琐的，但是也比较简单的工作。我们演示的这几个场景，都非常值得大家去尝试，很容易落地，包括做图标，这个图标可能没有大家想象当中那么好，但只需要达到完成度在80%，就可以节省我80%的工作量，剩下20%再去做一些修改或调整。当然对于一些比较精细化的游戏产品，他们可能觉得这个根本不入眼，这20%调整的时间，还不如重新生成新的图片来得快。我觉得这是一个场景，即使没办法让AI真的能够达到那么好的要求和效果，但是针对另外80%，一些相对来说比较短平快的游戏，只是想测试一下游戏的玩法或者这个主题大家喜不喜欢，那就可以用这样的方式去节省美术资产生成的时间。从这个角度，AI可以改善流程上的东西，或者提高试错能力。

席友：所以现在AI的能力，可能主要还是在于高频的、简单的事物上面？
陈洪宇：对。因为我们也接触到很多的游戏客户，可能对于基层的同学来说，他们还是不太愿意去接受这东西，也不去尝试。但是对于一些管理同学来说，他们其实会尝试着去玩，包括他们玩出来的东西，也都是不一样的。就像我刚说的，他们对知识产权或者美的一个理解，已经达到把控生成出来的质量就好，不需要去做生产和实现的环节。我觉得这个可以从上往下先实现，比如说美术团队内部的主管或是leader同学，先让他们去体验感受，能不能带来生产效率上的提升，如果可以达到就慢慢去推，而不是说一下子就给到一线同事，他们可能会哀声在怨的，觉得不好用，没有自己生成的好看。

席友：是的，如果自下而上地去看，我不知道有没有这样的考虑，会降低一些一线同学本身的价值，因为他们会抵触。而你上而下来去看，可能会提升整体研发的效率，这种美术leader会更乐意去接受。
陈洪宇：是的，这也确实是一个过程。现在有很多C端的用户就是喜欢去玩，他可能不是美术学，但就想要去生成一个二次元的画面，自己不会画，但是会描述，这个是整个观念上或者思想上一个很大的转变。

席友：在您这边现在已经落地的这一类，尤其是与游戏项目的合作中，咱们常见的阶段收费方式目前是什么样子的？
陈洪宇：我们去了解这个市场，包括自己技术本身的研发情况来看，是通过SaaS化的能力，用SaaS化的方式去提供的。具体的方式有两种，第一个是针对有研发能力的，我们会直接提供接口的调用方式，比如说我们现在给到一个游戏相关的，做一个短视频的东西，他上传一个类似于抖音里面的AI绘画，只要上传真人的图像，它去生成二次元的、相似的图片出来，这类AI技术是可以通过API上传的方式提供的。另外一块，像刚才讲到可能会更多给到一些leader同学去试用体验，基本上就是通过订阅的方式，比如说一个账号，一年大概付费多少钱，通过这样的付费点数，你可以在我们的平台或产品上面做AI的生产，生产完之后扣掉你的点数，我们通过这样的方式去进行商业化的。

席友：在做游戏对战battle的时候，比如说以Dota为例，要做到一个可以实现80%人的能力的机器人，训练成本大概是一个什么样的量级？大概成本的结构是什么样？
陈洪宇：我们现在的训练方式是底层的通用模型加上特有的技术模型，相当于我们先去训练出一个通用模型，这个通用模型主要的点数是它对整个环境的理解，和对游戏基础玩法规则的理解，之后，我们在这个基础模型上去做每一个不同英雄的技能或者特性，再学习和训练。现在成本的结构，主要还是在训练成本和机器消耗资源的成本上，像机器消耗资源成本说得比较详细一点，分为两部分，第一部分是GPU的消耗，这个和本身模型、模型参数量级和大小是有关系的，另外一个，因为我们做机器人是用强化学习去做的，强化学习有一个比较大的机制是每个操作、每个动作都需要去跟环境交互，所以说环境那一部分的机器消耗也是一个比较大的成本。目前我们大概的占比在3:2，就是GPU的消耗和环境交互，或者是说反馈的消耗。但是如果从本身GPU的价值来说，这边会占得更多一些，可能在4:1这样的结构。

席友：机器人因为在对战过程中肯定会发生不同的场景，不同场景下，一个模型的泛化性、主观性肯定是不一样的。以Dota为例的话，对战机器人是怎么解决不同场景下泛化性和主观性问题的？
陈洪宇：这个可能之前没提到，我们现在在这种经济性游戏里，比如Dota这种MOBA机器学习的训练，其实是分了多个模型的，比如战术是一个模型，它可以通过全局的情况，比如说对方的英雄是不是在集结，还是分路线去走，都会有个战术型的模型会去做一个总体控制。另外，每一个英雄会有相当于单独的一个小模型去做这样的事情，不是一个通用模型去控制所有角色和控制所有的战术去执行。

席友：这个还会有分场景突破的模型吗？
陈洪宇：不会分场景，战术的模式不会去分场景的。比如说战术，我可以去调度这些英雄，打团也好，抢小龙也好，或者是每一个分开去玩，它都是一个模型去控制的。

席友：在内容审核安全这块，会针对哪些内容去做？针对连麦还是针对社区，或者其他部分？
陈洪宇：我们主要针对游戏比较大的场景。第一个，按照输入文，就是文本和图片，语音相对来说做得比较少，文本基本上就是用户的昵称、房间号，以及聊天，这几类是比较常见的。社群相对来说做的不多，但基本上跟聊天是比较相似的，我们也会去做。另外就是图片，图片现在游戏里面他们做得相对也少一些，但是针对那种开放型游戏，比如现在比较多的这种元宇宙型的，它可能会上传自己的一些图片，会更多一些。

全文完

往期嘉程创业流水席线上活动现场

往期嘉程创业流水席线下活动现场

嘉程资本Next Capital是一家专注科技领域的早期投资基金，我们极度信仰科技驱动的行业创新，希望成为创新者的第一笔钱，与极具潜力的未来商业领袖共同开启创新的未来。

我们的投资领域涵盖新消费、新技术、新医疗。投资案例包括熊猫速汇、多抓鱼、十荟团、拉面说、店匠、bosie、熊猫星厨、核桃编程、橄榄枝健康等多家创业公司的天使轮或早期阶段。

嘉程资本旗下的创投服务平台「嘉程创业流水席」，致力于为科技互联网创业者和行业人士提供深度链接和一手行业信息，迄今已服务数万名创业者，汇聚了数百个创业者社群，有近千位企业家与行业专家在嘉程创业流水席分享过行业观点。

嘉程资本创始合伙人李黎是知名天使投资人，曾主导投资过乐信（纳斯达克代码：LX）、团车（纳斯达克代码：TC）、老虎证券（纳斯达克代码：TIGR）、牛股王、蜜芽、辣妈帮、PingCAP、易订货、彩贝壳、鹿客、Krazybee等明星公司的天使轮。

嘉程资本是创业者思考的伙伴，成长的伙伴。

嘉程资本
握手未来商业领袖
BP 请发送至 BP@jiachengcap.com
微信ID：NextCap2017