黄鹂智声刘志:浅谈智能音频产品的应用趋势和创新方向|嘉程创业流水席196席精彩回顾
11.16.2023 | 嘉程资本:创新者的第一笔钱 | 嘉程创业流水席

创新从哪里来?第一是最开始有技术的积累,还有深入的对用户和市场的调研和分析,然后看竞品,再看用户的购买决策的过程,一步步走下来才定义了这样的一款产品。

 

 

近日,嘉程创业流水席第196席【探讨智能硬件与智能可穿戴设备2023最新趋势】,邀请了黄鹂智声创始人刘志分享,主题是《浅谈智能音频产品的应用趋势和创新方向》。

 

以下为正文部分:

 

大家好,我是黄鹂智声的创始人刘志,从事音频产品的开发。今天我想和大家分享一下智能音频产品应用的趋势和创新方向。

 

我简单介绍一下我的背景。我2004年从清华电子系智能语音实验室研究生毕业后,就进入了智能声音领域创业,至今已有18年的创业经历。我最早是做语音识别的,我们团队开发了苹果手机上的第一款语音拨号的APP,当时还没有Siri,所以算是比较早的语音识别应用。后来Siri出来了,我们发现我们的产品缺乏自然语言理解的部分,用户体验并不好。于是我们转向了口语考试的领域,开始做CET(四六级)的口语自动评分,之后在教育行业深耕了近10年。在这个过程中,我们发现对于声音应用来说,噪声问题会严重影响效果,所以我们一直在积累这方面的技术。后来我们的公司被一家做教育的公司收购了,我就和团队一起二次创业,专注于做声音前端处理也就是收声降噪的技术和产品。这就是我的大致经历,我一直和声音打交道,但是真正做音频产品是2019年才开始的,所以在产品方面我还有很多要学习的,也希望能和大家多交流,共同进步。

 

音频市场内卷严重,Open ear异军突起

 

 

音频市场给大家的第一印象是什么?我之前只是从外界观察音频产品,直到亲自参与产品开发,这几年的经历让我有了很多感悟。

 

首先,音频市场非常庞大,除了手机等消费电子产品,耳机已经成为前三的大市场之一。但是这个市场确实是很卷,同质化现象十分普遍。大家都在寻求创新,甚至有人说这是个血海市场,而且近两年明显是下滑趋势。竞争的压力来自多个方面,一方面这是头部企业的必争之地,另一方面是华强北的低价冲击。这大概是大家对音频市场的普遍印象。

 

 

但近两年,Open ear开放式形态的耳机异军突起,引起了大家的关注。从数据上看,从2021年下半年开始,每个季度的开放式蓝牙耳机的出货量都在翻倍增长。今年上半年,国内的出货量已经接近300万台。而其他的类别,比如颈戴和头戴,都在明显下滑,真无线耳机也只是勉强和之前持平。

 

 

这里有一个很明显的问题,为什么开放式形态能够异军突起?实际上如果真的看一看用户,这个问题就不难回答。高通最近发布的《2023年音频产品使用现状调研》显示,用户使用音频产品的频率和时长都在增加,尤其我们观察到国内的用户,这几年的变化更加明显。以前,耳机这种音频产品大部分是用来听音乐的,甚至有点发烧友的意味。但是随着产品形态和用户需求的变化,用户的使用习惯也在快速变化。一旦使用的时间长了,使用的次数多了,佩戴舒适性就自然成了一个核心因素。今年的数据表明,它已经成为最大的驱动因素,而前两年还只是排在第五,第六位。这就能解释为什么开放式形态能够异军突起,赢得市场,因为它的佩戴体验更好。

 

音频产品使用现状

 

 

接下来,我们可以继续探讨用户在使用音频产品的时候,他们主要做什么?从数据上看,排在前几位的应用,依次是打电话、看视频、听音乐,以及看电影电视、玩游戏等等。总的来说,作为一个音频产品,对于用户最重要的功能是听和说,这两个功能毫无疑问是排在最前面的。

 

 

目前,用户的主要痛点也是集中在这两个方面。首先是佩戴的舒适性和续航,因为这关系到长时间使用的体验。其次是降噪和音质,就是和通话和听音的体验相关。所以,这些现有的痛点就是音频产品未来可以做创新的方向。

 

音频产品创新方向

 

 

从佩戴体验的角度来看,我们可以发现用户的需求,或者说我们作为企业可以创新的点,就是如何做到更轻巧、更无感、更合理的受力。因为耳机作为音频产品的代表,它和其他的一些消费电子产品不同,它是一个贴身佩戴的物品。它的整体体验感、佩戴的舒适性、受力的工学设计就显得尤为重要。当然,做轻做小之后,如何平衡续航能力?这其实也是一些新的问题点,如果能够解决好这些问题点,创新的idea就会涌现出来。

 

 

我们也看到,使用音频产品通话的需求是在快速增长的,所以在这里,如何提供更好的收声效果,也是一个重要的方向。收声效果从技术端来说,它涉及好几个层面。

 

  • 首先是大家都比较熟悉的ENC环境降噪。但即便是环境降噪,在不同场景当中,用户的需求也是不完全一样的。

 

  • 第二个就是超高清通话,包括高码率,因为现在通话基本上还是16K的采样编码,但是我们有很多的应用,其实是需要更高保真,甚至是立体声的通话效果。

 

  • 第三个就是音频的延时,整个收声的处理速度。怎么能够保证音画同步、更低的延时,在收声效果这一块,同样存在着很多的痛点以及还没有解决得很好的一些问题。

 

 

听音无疑是音频产品创新的最重要的方向,我们可以看到,前几年ANC技术能够迅速普及,甚至成为音频产品、耳机类产品的标配,实际上和更好的听音体验是密切相关的。但是今天的ANC还不够好,我们也知道用户对体验的需求是不断提升的。今天还会遇到很多中高频的声音处理、不同环境下的ANC的深度,以及一些啸叫的问题。当然,这里还有一个大家比较关注的问题,就是如何兼顾舒适和听音体验。比如,开放式耳机,耳朵开放的情况下如何做ANC,如何提供更好的听音体验,这还有很多待解决的问题。另外,无损音频、空间音频、3D音频,以及听觉的增强,也有很多不同的应用场景。有一部分是辅听、助听,还有一部分是在开放式的形态下,如何让用户在嘈杂的环境中能够听得更清楚,这些都属于听觉增强的范畴。在这些方面,我们认为也有很多可以创新的机会。

 

 

简单来说,对于一个音频产品,这三个大的方面在我看来基本上是兵家必争之地,尤其对于大厂来说,它们想要做的目标就是把舒适性、听音效果、收声效果,尽可能地都推进到一个均衡的水平。


对于像我们这样的创业公司应该怎么做呢?这里借用一下理想的产品三原则。从我自己的实践来说,就是做三件事:第一,看自己;第二,看用户;第三,看价值。

 

黄鹂智声:打造对用户有价值的音频产品

 

下面,我就结合黄鹂智声的案例,跟大家分享一下我们打造产品的心路历程。

 

 

  • 首先,我们要想清楚我们是谁,我们的优势是什么。黄鹂智声从一开始就定位得比较清楚,是一个收声灭噪的科技和产品的品牌。我们的核心是来自收声这一块沉淀了十几年的技术。它的核心竞争优势就是把信号处理的手段和深度学习的方法融合成一套灭噪级的收声技术方案。它的特点就是可以在降低噪声的同时,保证拾取的目标声音有更低的失真,同时在各类复杂的噪声环境中都能够稳定可靠,另外延时也控制得很低,最后还能把它做到一颗芯片上。这个技术是我在做前面几次创业的时候一直在积累的,但是当时并没有想着把它用到音频产品中,更多的是服务于做语音识别和口语测评、口语考试的应用中。后来看到市场需求的时候,才发现原来用这个技术,用户的需求是明显在提升的,而且是直接可以应用到我们音频产品的通话耳机中去的。所以,我们要想清楚我们是谁,我们差异化的竞争优势是什么。

     

 

  • 第二,我们要看我们服务谁,用户是谁。我们也经历了一段时间的探索,黄鹂智声是2019年底成立的。当时最容易看到的是类似呼叫中心这样的商务用户有清晰通话、更高清通话这样的需求。所以从一开始我们切入市场的时候,还是先从商用的头戴式耳机产品切入的。但在这几年的发展过程中,我们发现越来越多的商务办公用户是有大量的居家办公、混合办公的需求,而且他们已经不满足于传统的商务耳机形态,需要更好的产品,这是我们的第一类客户。第二类用户我们叫专业服务用户,包括教师、律师、心理咨询师这样的专业人员,他们有很多直播录课,包括在线沟通、在线咨询的需求。第三类用户就是物流快递的用户,这里包括卡车司机、网约司机、快递员。上述三类客户,他们有一个共性就是有非常多的重要通话,而且很难保证自己随时随地处在一个安静的环境。所以,我们针对的这几类用户人群都是有这样共性的需求。

     

这块市场我们也进行了分析,从整体的市场规模、渗透率以及未来发展等等几个趋势来看,我们认为市场的发展其实极具增长性。在整个红海的耳机市场里面,应该还是一个相对蓝海的区域。尤其是从市场渗透率的数据能够看到。

 

 

  • 第三,我们给这些用户创造了什么价值。可以看到,在工作场景中,使用耳机耳塞面临的典型问题基本上都和噪声有关。不论是旁边人的交谈声,附近设备的声音,车辆的噪声,还是家里孩子的吵闹声等等,基本上用户列出来的核心问题都和噪声有关。所以我们创造的价值就是让用户能够在各类复杂的噪声环境中都被听清。

     

实际上,要实现这个价值,真正往下分解它的需求也是多层次的。既有降噪深度的需求,也有实时性的需求。因为噪声的种类非常多,用户希望在各种各样的场景中,各种复杂噪声都能够去降噪。当然还隐含着一个问题,就是降噪后的音质要保持在优秀的水平。所以,真正去拆解就会发现市面上并没有足够优秀的产品来满足用户这样的需求,而恰恰这是我们能够创造的价值。所以,从这三个层面上来看,我们就有机会打造出一款对于用户有价值的产品。创新就是创造新的价值,没有满足的需求就是我们可以做的。

 

产品分析:从宏观到微观

 

 

我们在具体的战术上,要考虑产品做成什么样,保留哪些功能,在各种问题中怎么去取舍,这里我们自己内部有一个产品分析的三步走的逻辑,分别是看宏观、看中观、看微观。当然,到具体的产品层面上来说,还是要在中观和微观两个层面上看得更多。

 

 

  • 从宏观上来看,通话耳机市场的新需求是不断涌现的。在2021年我们准备打造这款产品的时候,在这个切入点上我们也做了很多的思考。我们第一个产品的雏形是类似缤特力5200这个形态,手版都做了,最后又把它否了。一方面是看到开放式耳机的需求,开放式当时还是一个相对小众的,但是我们能够明显感受到它的爆发力,包括我们对Bose那款产品做了很认真的剖析。Bose那款产品实际上是第一代的开放式耳机,但用户的反馈很差。这个时候我们仔细分析了用户到底对它哪些地方觉得不好,最终我们认为恰恰是他最想解决的佩戴舒适性的问题Bose没有做好。

     

但是这件事情让我们看到机会点在于,本身这样一个形态是能够很好地解决用户佩戴体验的一个问题的,但是Bose没有做好。而开放式形态里面最常遇到的一些问题,比如音效能否达到标准,开放之后声音音质能否满足用户的基本需求,这些方面Bose已经做得非常好了,这让我们看到开放式耳机这个品类的红利。所以我印象中当时在整个产品讨论中我们大概花了接近半年时间,对我们的目标竞品也做了非常细致的剖析,包括传统通话耳机的代表,缤特力的5200和Jabra Evolve2 65,这是两类非常典型的通话耳机。我们能够看到在有新的产品形态之前,缤特力的这一款确实是和用户需求最接近的,相对来说比较轻便,通话的效果在当时也是非常好的。但它有几个很致命的问题,它就是一个通话耳机,没有办法做别的事情。另外本身受制于单边的形态,它的佩戴体验、降噪效果等最核心的几个方面实际上都不是足够优秀的。

 

  • 另外就是看用户为什么买?用户的购买决策是什么?这里有两个关键点,第一个就是用户在工作的时候为什么使用耳塞?第二个从大的层面上来说,今天用户越来越多地希望用一款设备来满足他更多的需求。所以基于这些分析,我们对用户的购买决策做了一个排序,把舒适度排在第一,高清通话、音质、续航、易用性和稳定性这几个层面,也就是这款产品的定义、价值链条在内部做了一个梳理。

 

 

  • 接下来就是对整个产品的价值点进行逐级的分解,从佩戴的体验到通话的效果,到易用性、稳定性、音质等等去分它的一级价值点,二级价值点,做价值点的支撑。实际上这也是让我感受到从原来偏技术,转到做产品最大的收获。音频产品尤其如此,作为一款让用户贴身佩戴使用的消费电子产品,它对团队能力以及由此转化成的最终产品的竞争力要求是非常高的。单点好不足够,仅有一个非常强的通话灭噪性能对于用户来说还不足以让他去接受这个产品,不足以让他产生真正物超所值的感觉。而且单就通话一个角度,其实用户的需求是双向的,它在这种噪声环境当中,除了要让别人听清的需求之外,也要让自己听清,而且让自己听清其实是第一直接的需求。

     

开放式耳机如何解决这个问题呢?在上一代的产品中,我们是通过自适应的听觉增强设计,在噪声环境中会根据噪声的情况调节用户听到的声音,让他能够在一定程度上听得更清楚。当然,这个在我们看来还不够,所以还有很多需要优化和创新的地方。

 

实际上,真正深入到一款产品的打造时,我们还会关注很多细节,单纯一个易用性就可以往下拆分出很多。最开始可能列出了7~8个价值点的支撑,但是逐渐去砍掉,一款产品也不可能解决所有的需求,也能看到我们采用的形态对于长发的女生,尤其如果再戴眼镜可能就很不友好,在这个点上产品是需要做相应取舍的。

这就是我们做这款产品的一个心路历程,创新从哪里来,它不是凭空来的。从我的感受上来说,第一是最开始有技术的积累,还有深入的对用户和市场的调研和分析,然后看竞品,再看用户的购买决策的过程,一步步走下来才定义了这样的一款产品。也正是因为前面相对来说比较扎实的工作,所以我们的第一款开放式的通话耳机在去年年底众筹推出之后,确实取得了不错的成绩。目前这款产品已经在全球渠道逐渐铺开,而且我们也在不断地进行迭代,比较欣慰的一点就是我们之前做的工作用户其实都能看得到的。尤其是核心技术点,也收到了非常多用户的反馈,大家会惊叹于这个通话效果居然能够做到这么好。

 

“声音”创造市场新需求

 

 

因为我在声音领域做了这么多年,所以我的感受就是声音的价值真的非常大,它基本可以与视觉相比。从获取信息的来源,就是听的角度上来说,我们有20%的信息是直接来自声音,还有25%是声音和视觉的结合体。而从表达的角度上来说,基本上有声语言占了主要部分,也就是说声音是我们主要的信息输出手段。所以今天在我看来声音的价值还远远没发挥出来,音频产品的用户人群也好,应用的场景也好,真的是非常多,而且每一个细分的方向上都有很多的需求没有得到满足。无论是办公、游戏、运动,还是在开车、娱乐社交以及通行的途中,每一个细分场景里可能都会有新的需求。

 

另外就是各种音频相关的新技术,在我看来也是源源不断地在出现,尤其是像AI的技术,在这个声音当中能够看到变声、修声,类似于修复老照片,能不能把声音给它修复、美化;包括通过声音做环境检测,我们知道环境是什么样的类型,来调整整个产品里面的应用点;包括AIGC也是天然和声音有关的,因为声音一旦转成文字之后,就和大模型、文本的处理天然地连接起来。所以像语音助手、记录转写、翻译、会议纪要这样的一些功能是跟着语音过来的。当然在传感技术上,也能看到也有很多的创新都是往穿戴设备、音频的小设备里去集成,还有新材料、新工艺等等。

 

一方面是需求的变化,一方面是技术的驱动,几方面的结合。所以在我看来音频市场虽然很卷,大家也觉得创新不容易,但是只要遵循着用户的需求,再结合技术的发展,还是一定能找到越来越多的创新点。我最后用Thomas Peters的一句话来结束:今天除了创新之外的gap是越来越小,所以唯有创新才能生存。

 

 

Q&A

 

 

席友:您当时做这样一款产品的时候,是怎么考虑市场调研的?

 

刘志:我最开始做的是商用产品,在做商用产品的过程中就会接触到用户。最开始触动我的是一个偶然的机会,因为我们有海外大企业的用户,跟他们聊天的时候,他说公司给他发了七副耳机,每年一副,但没有一副是他喜欢用的。他说你看AirPods多好用,方便携带,很多功能都可以实现,但是他也很明确地说,通话效果真的不理想,因为跨国企业经常要开跨国会议,他很多时候都很苦恼,感觉很麻烦。这个点当时让我觉得很有启发的,这是第一个。第二个,我们看到另一个变化就是采购决策的变化。之前我们做的办公类产品很多是企业采购的,但在推广的过程中,我们发现越来越多的企业倾向于让员工个人购买。这就像商用笔记本,现在它越来越多地变成了个人选购的决策。这两个点让我觉得这个市场是在发生变化的。于是我们就顺着这个点往下做调研,往下做市场分析,也就是我分享的逻辑,按照这个逻辑推理下来,我们觉得有机会。这是当时整个的产品方向决策流程。


席友:您觉得现在的开放式耳机整个品类目前处于一个什么样的阶段?以及对于消费者来说,现在自主研发和从供应链拿一个公版,对于消费者来说这个差异会有多大?


刘志:我们研究开放式耳机是在2021年开始的,当时能看到有好几家相当领先的公司在做这件事。但当时我们认为它和TWS是类似的,整个行业的红利期其实会很快,因为它要解决的几个关键问题都不是有非常高的壁垒的,比如听音的效果、舒适度、供应链,基本上可以把它等同于2016年左右的TWS的路径,我们可以把开放式看成一个小型的TWS的市场,它现在肯定还是在高速增长,和TWS的增长路径和逻辑基本上是接近的。刚开始有一波创新的产品出来,然后市场迅速验证,就有一堆的山寨,一堆的白牌跟着进来打,迅速地做两极分化,我们认为它的竞争格局会复制之前的一些路径,而且速度会更快。

 

但不太一样的一点是很多大厂还在观望,它不像TWS当时是苹果做了之后一堆人涌上来。但是确实现在整个的竞争格局,我觉得跟TWS那时候不太一样的就是创新比较匮乏,TWS刚出来的时候创新还是蛮多的。一个形态一旦确定之后,因为那个时候还不像今天的开放式,各种各样的东西包括供应链实际上是建立在TWS的基础上,它们有一些不同,但是我觉得最终的市场的大的格局应该就用今天的TWS市场差不多能够预见,能够看到一些可能性。


席友:您看到接下来耳机市场可能还会有什么样的创新?你怎么看市场后面的创新趋势呢?


刘志:在我看来,耳机很考验综合能力,所以不是说在某一个点上做得特别突出就能够把整个产品做出来,你要考虑的点很多,而且如果有任何一个点不好,用户其实就是不接受的。但是创新的种子也就埋在这里面,从大的层面上来说,舒适性、听音效果、收声效果,这三个方面还有很多没有解决的问题。再到每个场景里面细分,这个问题又是很多的,每个场景里面它有很多没解决的问题。比如开放式在嘈杂环境下,让用户听得更好的问题没解决。所以这些地方的创新包含技术的,甚至包含一些材料的、工艺的等等都有可能会出现。但是你说整个大形态上的变化,我短期内是没有看到像这种从头戴式进到TWS形态、从有线到无线这个形态的,那种确实很颠覆,整个用户习惯就不一样了,甚至导致品类的用户基数一下子就不一样了,这种形态的大的颠覆式创新,现在还没有看到有这样的迹象,但是更多的是在现有的一些形态上在做微创新。但是要细化用户的几个主要的核心体验,所以这也是为什么耳机这个产品不太容易出现大家能迅速眼前一亮的东西,是因为它确实有难度,但是在我看来创新的点还是很多的。

 

全文完

 

嘉程资本Next Capital是一家专注科技领域的早期投资基金,作为创新者的第一笔钱,我们极度信仰科技驱动的行业创新,与极具潜力的未来科技领袖共同开启未来。

 

我们的投资涵盖人工智能、硬科技、数字医疗与健康、科技全球化、生物科技与生命科学、企业服务、云原生、专精特新、机器人等领域。投资案例包括元气森林、熊猫速汇、寻找独角兽、店匠、士泽生物、芯宿科技、未名拾光、橄榄枝健康、硅基仿生等多家创新公司。

 

嘉程资本旗下的创投服务平台包括「嘉程创业流水席」,「NEXT创新营」、「未来联盟」等产品线,面向不同定位的华人科技创新者,构建了大中华区及北美、欧洲和新加坡等国家地区活跃的华人科技创新生态,超过3000位科技行业企业家与巨头公司高管在嘉程的平台上分享真知灼见和最新趋势。

 

嘉程资本投资团队来自知名基金和科技领域巨头,在早期投资阶段富有经验,曾主导投资过乐信(NASDAQ:LX)、老虎证券(NASDAQ:TIGR)、团车(NASDAQ:TC)、美柚、牛股王、易快报、PingCAP、彩贝壳、云丁智能等创新公司的天使轮,并创办过国内知名创投服务平台小饭桌。

 

嘉程资本是创新者思考的伙伴,成长的伙伴。

 

嘉程资本
握手未来商业领袖
BP 请发送至 BP@jiachengcap.com
微信ID:NextCap2017