作者 | 杨丽
出品 | 雷锋网产业组
一直以来,出门问问面对的都是如何将ai普世化、平台化的问题,所谓平台型产品是不局限于某一领域、场景,且更容易获得市场、投资者的关注,而这种模式也推进了它在b端的业务演变。
遭遇风暴时,出门问问为及时调转船头尽了力。尽管c端的业务模式势能依然很强,但风暴洗礼后的出门问问俨然明白了此时的处世之道。
在保持c端强劲业务模式的同时,出门问问经过整整两年的探索,在ai tob这条路上已逐步形成势能。
ai语音合成的未来机会
近日,出门问问联合《光明日报》推出ai虚拟主播,于2020年服贸会亮相。
这一次,出门问问将目光投向到了近些年进展颇大的端到端语音合成技术。以tacotron、fastspeech等深度学习网络结构为代表,在这个基础之上,出门问问在2019年开发了自己的语音合成系统meetvoice(mobvoi end-to-end tts voice)。
据雷锋网观察,目前ai语音合成技术已广泛应用于手机语音助手、智能车载地图导航、智能家居等领域。雷锋网此前报道过某厂商,就已经可以将声音定制技术搭载在手机上,让终端消费者得以实现个性化声音的定制。
那么,在语音合成应用渐入佳境的同时,业内包括bat、科大讯飞、搜狗等科技公司基本都已涉足这一研究领域,并推出相应的产品/亚博电竞网的解决方案,试问出门问问有哪些差异化优势?
以此次与光明日报的合作为例,ai虚拟主播主要分为两部分:定制一个主播的虚拟形象(2.5d真人和3d卡通定制)和合成一个主播的音色。
通过“魔影主播”,文字内容可以转换为视频形式,也可以通过语音驱动虚拟形象说话及反馈动作。
出门问问高级技术总监叶顺平告诉雷锋网,
“在视频制作的过程中,如何能够生产一个比较专业、权威且没有错误的内容,是光明日报认为非常关键的一点。我们此前就为光明日报提供了个性化声音定制,整体的声音定制时间周期比较短,且效果还原度比较高。”
据叶顺平所述,“魔影主播”的定制时间在一周时间内就可以基本完成,在内容方面则可以进行纠错,从而产出一个零错误的音频。
除了与光明日报合作推出ai虚拟主播“魔影主播”外,出门问问还升级“魔音工坊”成为ai音频内容生产一站式亚博电竞网的解决方案。
简单来讲,用户可通过网站上传文字的方式,便可实现一站式ai音频内容生产。这与业内常见的产品模式大同小异,但出门问问提供了word编辑器模式,官方数据显示可将多音字准确率提升至100%。
同时,关键的一点是,如何将后续的场景落地进行商业价值的扩展。
如今虚拟歌姬、fm电台虚拟主持人、新闻联播主持人、电视栏目主持人等是市场中常见的产品形态,但似乎并没有激发出应有的水花。
“疫情带动了在线课堂产业的喷涌,很多老师不得不转移到线上,我们发现有些老师其实并不擅长面对摄像头,或许可以将优质老师的个人ip以ai虚拟主播的形式展示出来。”
以短视频平台配音为例,通过与配音创作者的交流,叶顺平指出,原来一个半小时的视频,可能要花四五个小时去配音,再加上后期加工总共要花费一两天,真人配音可能也需要每千字20元;现在通过ai配音不但可以降低到每千字10元甚至更少,还最终降低了创作时间提升了呈现效果。
“我们认为只要用户是愿意花时间的,其实就是愿意付费的,如果能在这一环节得到大幅提升,会产生很大的商业价值。”
不过需要指出的是,语音合成水平越高,与人声的差异越小,存在技术非法滥用的可能性就会越高,比方说人耳很难鉴别出真假声音,很可能会遭遇电话诈骗。
针对这一情况,也已有技术供应商尝试给出亚博电竞网的解决方案以应对这一情况,如实名认证、身份识别等限制技术使用,或者只授权给有控制能力的企业客户而非直接交给c端用户自定义声音内容等。
对比之下,出门问问还有很多路要走。
tob和toc两手抓
或是出门问问ceo李志飞早期曾表达过做c端的想法,也或是实现ai tob再toc要比直接toc更符合市场需求,ai tob或者toc一度是外界关注的话题点。
透过近两年的公开数据可以发现,出门问问在b端业务上的营收正持大幅上升。
叶顺平此次采访也表示,目前目前出门问问营收至少50%是来自to c,to b业务比重也在提高。“未来业绩方面,我们希望是这方面业务贡献能够进一步提高”。
作为国内最早一批进入人工智能领域的语音技术与智能硬件供应商,出门问问无疑是自带光环的。这种光环确实曾为出门问问在消费者市场带来了强烈的品牌影响力,在一线城市的核心商业中心都能看到其线下直营店的身影。
过去五年,出门问问就已经研发出多达16款产品,从系统到硬件其中多项曾拿下世界第一。如今,出门问问形成了ai智能手表ticwatch系列、ai真无线智能耳机ticpods系列、智能音箱tickasa等产品矩阵。
可以看出,出门问问在c端用户市场的势能依然很强。
但另一方面,出门问问也开始将更多研发与市场力量放到b端。
2016年,出门问问上线车载语音后视镜“问问魔镜”,后来大众出资1.8亿与之合资成立车载语音企业大众问问。从2020年开始,出门问问的车载语音交互系统已在奥迪a4l、新迈腾、帕萨特、捷达等多个全新车型应用,预计今年内总共装载100万辆车。
2016年上线的问问魔镜
车载是出门问问的第一个落地场景,这也让出门问问尝到了tob可带来的持续现金流。
实际上,智能车载行业已是当下语音交互技术供应商争夺的一个重点战场。
回顾起来,出门问问拥有在语音交互、nlp领域顶尖的世界级专家,包括ceo李志飞、cto雷欣、梁宇凌、以及入选 2019 ieee fellow的黄美玉博士等人。自诞生以来出门问问就含着google的金汤匙,其竞争对手一度是苹果siri和亚马逊alexa。
或许技术的突破或产品亚博电竞网的解决方案的构建,对于出门问问来讲从来不是最大的挑战,难的是,时间上是否允许出门问问找到合适的应用场景,并能够实现高价值空间的规模化。
现如今,出门问问面临的同样是技术之外的更大挑战——如何让b端用户有更多的品牌感知度。
以此次公布的ai音频内容生产平台“魔音工坊”为例,叶顺平最后告诉雷锋网,
“tob我们是边做边试探,如果有比较典型的企业客户案例,会加大魔音工坊这方面的投入。我们既会选择跟(有明确需求的)短视频平台尝试合作,也会面向消费者直接推出低成本短周期的声音定制,目前可能会更多偏向于后者。”
能够看出,出门问问本身一直具备ai toc的理念与实践能力,也正是因为此前积累的软硬结合能力和语音交互技术及工程能力,让公司发力b端成为一种必然选择。
(雷锋网)