雷锋网按:本文来自公众号【商业技术评论】(微信 id:biztechview),作者 rebootman,雷锋网已获授权转载。
作为ai和芯片两大领域的交叉点,ai芯片已经成了最热门的投资领域,各种ai芯片如雨后春笋般冒出来,但是ai芯片领域生存环境恶劣,能活下来的企业将是凤毛麟角,以下正文:
不久前,谷歌在i/o大会发布了其第三代tpu,并宣称其性能比去年的tup 2.0提升8倍之多,达到每秒1000万亿次浮点计算,同时谷歌展示了其一系列基于tpu的ai应用。
可以说,ai已经成为科技行业除了区块链之外最热门的话题。ai芯片作为ai时代的基础设施,也成为目前行业最热门的领域。
下面这个表是媒体统计的部分ai芯片企业融资情况:
可以看到,ai芯片已经成为资本追逐的最热门领域,资本对半导体芯片的热情被ai技术彻底点燃。在创业公司未真正打开市场的情况下,ai芯片初创企业已经诞生了不少的独角兽,多笔融资已经超过亿元。
ai技术的革新,其从计算构架到应用,都和传统处理器与算法有巨大的差异,这给创业者和资本市场无限的遐想空间,这也是为什么资本和人才对其趋之若鹜的原因。
但是,产业发展还是要遵循一定的产业规律,「商业技术评论」认为,绝大多数ai芯片公司都将成为历史的炮灰,最后,在云端和终端只剩下为数极少的几个玩家。
为何这么说,请听本社慢慢道来!
首先我们来分析下目前对ai芯片的需求主要集中在哪些方面。
先来讲讲ai目前芯片大致的分类:从应用场景角度看,ai芯片主要有两个方向,一个是在数据中心部署的云端,一个是在消费者终端部署的终端。从功能角度看,ai芯片主要做两个事情,一是training(训练),二是inference(推理)。
目前ai芯片的大规模应用主要还是在云端。云端的ai芯片同时做两个事情:training和inference。training即用大量标记过的数据来“训练”相应的系统,使之可以适应特定的功能,比如给系统海量的“猫”的图片,并告诉系统这个就是“猫”,之后系统就“知道”什么是猫了;inference即用训练好的系统来完成任务,接上面的例子,就是你将一张图给之前训练过的系统,让他得出这张图是不是猫这样的结论。
training和inference在目前大多数的ai系统中,是相对独立的过程,其对计算能力的要求也不尽相同。
training需要极高的计算性能,需要较高的精度,需要能处理海量的数据,需要有一定的通用性,以便完成各种各样的学习任务。
inference相对来说对性能的要求并不高,对精度要求也要更低,在特定的场景下,对通用性要求也低,能完成特定任务即可,但因为inference的结果直接提供给终端用户,所以更关注用户体验的方面的优化。
training将在很长一段时间里集中在云端,inference的完成目前也主要集中在云端,但随着越来越多厂商的努力,很多的应用将逐渐转移到终端。
然后我们来看看目前的市场情况。
云端市场已被巨头瓜分殆尽,创业公司生存空间几乎消失
云端ai芯片无论是从硬件还是软件,已经被传统巨头控制,给新公司预留的空间极小。下面这张图是compass intelligence公布了全球ai芯片榜单。因为ai芯片目前在终端应用极少,所以榜单头部的排名可以近似的认为就是云端ai芯片的目前市场格局。
我们可以看到,芯片巨头nvidia(英伟达)已经牢牢占据ai芯片榜首,由于cuda开发平台的普及,英伟达的gpu是目前应用最广的通用ai硬件计算平台。除了有实力自研芯片的企业(全世界也没几家),如果需要做ai相关的工作,必定需要用到nvidia的芯片。nvidia的芯片应用普遍,现在所有的ai软件库都支持使用cuda加速,包括谷歌的tensorflow,facebook的caffe,亚马逊的mxnet等。
除了一骑绝尘的英伟达,其他老牌的芯片巨头都没闲着,特别是intel通过买、买、买奋力的将自己挤到了头部玩家的位置。微软在最新的build大会上公布了基于英特尔fpga的ai方案,而英特尔的fpga业务正是通过收购altera获得的。
除此之外,我们可以看到像google这样的互联网厂商也乱入了前五。这当然要归功于上面提到的tpu,虽然谷歌不直接售卖芯片,但是谷歌通过云服务提供tpu的调用服务。谷歌很早就开源了tensorflow软件平台,这使得tensorflow成为最主流的机器学习软件平台,已经成了事实上行业的软件平台标准。而tensorflow最佳的计算环境必定就是谷歌自己的云服务了,通过软件、硬件(或者说云)环境的打通,谷歌妥妥的成为ai芯片领域的一方霸主。
现在业界争论的焦点是ai芯片的处理器架构用哪种是最好的,有前面提及的有gpu、fpga、dsp和asic,甚至还有更前沿的脑神经形态芯片。现在gpu可以认为是处于优势地位,但其他几种的处理器架构也各有优势。intel则是多方下注,不错过任何一种处理器架构。谷歌在tpu(其实就是一种asic)方面的巨大投入带来了硬件效能的极大提高,目前看来对gpu的冲击将是最大的,原因不单单是因为专用架构带来的效率优势,还有商业模式方面带来的成本优势。在半导体行业内的普遍观点是,一旦ai的算法相对稳定,asic肯定是最主流的芯片形态。看看挖矿芯片的进化历程,这个观点非常有说服力。
在云端,互联网巨头已经成为了事实上的生态主导者,因为云计算本来就是巨头的战场,现在所有开源ai框架也都是这些巨头发布的。在这样一个生态已经固化的环境中,留给创业公司的空间实际已经消失。所以地平线的余凯在前几年就对「商业技术评论」表示,云端市场是巨头的禁脔,创业公司没有任何机会。
上面说到了inference现在主要是在云端完成的,这主要是因为现在终端上基本没有合适的处理单元可以完成相应功能。所以我们发现很多ai功能都需要联网才可以使用,这大大限制了ai的使用场景。所以将inference放到终端来,让一些功能可以本地完成,成了很多芯片厂商关注的领域。
华为的麒麟970便是最早将ai处理单元引入到终端产品的芯片,其中该芯片中的ai核心,是由ai芯片创业公司寒武纪提供的ip(知识产权)。该芯片的引入,可以帮助华为手机在终端完成一些特定的ai应用,比如高效的人脸检测,相片的色彩美化等。此后,苹果,三星都宣布了在其处理器中引入相应的ai处理单元,提升手机终端的ai应用能力。
在终端上,由于目前还没有一统天下的事实标准,芯片厂商可以说是八仙过海各显神通。
给手机处理器开发ai协处理器是目前看来比较靠谱的方式,寒武纪cambricon-1a集成进入麒麟970就是一个很好的例子。由于华为手机的巨大销量,寒武纪迅速成为ai芯片独角兽。而另外一家创业公司深鉴科技此前获得了三星的投资,其ai芯片ip已经集成到三星最新的处理器exynos 9810中。
然而能获得手机大厂青睐的ai芯片厂商毕竟是少数,更多的ai芯片厂商还需要找到更多的应用场景来使自己的芯片发光发热。
一些传统ai服务厂商很容易想到将自己的服务进行垂直拓展,比如的自然语音处理厂商云知声从自己的传统语音业务出发,开发了自己的芯片unione语音ai芯片,用于物联网iot设备。
相对于语音市场,安防更是一个ai芯片扎堆的大产业,如果可以将自己的芯片置入摄像头,是一个不错的场景,也是很好的生意。包括云天励飞、海康威视、旷视科技等厂商都在大力开发安防领域的ai嵌入式芯片,而且已经完成了一定的商业化部署。
相对于云端,终端留给ai芯片创业公司更广阔的市场。但是于此同时,由于应用环境千差万别,没有相应的行业标准,各个厂商各自为战,无法形成一个统一的规模化市场,对于投入巨大的芯片行业来说,是好故事,但不一定是个好生意。
ai芯片的诞生,源于一种全新的计算需求,传统的计算架构很难满足ai计算的要求,所以新的芯片成为业界追逐的热点,这和多年前的显卡市场非常像。
曾经的pc并没有3d处理能力,cpu几乎包揽了所有的功能,但是由于人们对于3d处理需求的逐渐增加,带有3d加速功能的图形处理器越来越成为人们关注的重点。
于是一大批图形处理器企业如雨后春笋搬冒了出来。
3d显卡诞生初期市场上的玩家
然而最后,只有nvidia(也是目前的ai芯片巨头)作为独立的3d图形处理器供应商活了下来。ati被amd收购,仍然耕耘3d图形市场,和nvidia正面作战,但常年的亏损也一直困扰着这个千年老二。intel早早退场,放弃了独立显卡产品线,但由于其控制了中央处理器,其显示核心一直以集成的方式变相的和nvidia以及amd曲线作战。
nvidia之所以获得成功,有以下几方面原因。
首先在性能上,始终保持在第一梯队,在最开始几代失败的产品后,nvidia一直是最先进图形技术的代名词。当然,光有性能是不够的,当时世面上还有很多性能差不多的产品。nvidia在当时做了一件现在看来很平常的事情,就是推出了专属驱动程序——雷管,并定期的更新,使其不断的兼容最新的游戏。这在当时显卡标准混乱,游戏兼容一塌糊涂的情况下,一举奠定了其领先位置。
于此同时,nvidia拥抱了当时最大软件平台微软推出的3d 图形api接口——driect 3d,在此之前,每家显卡都有自己的3d api接口,标准极度不统一,也让开发者非常头痛,driect 3d出现结束了这个局面,所以谁对directx支持好,谁就更受市场欢迎。nvidia和ati一直和微软合力推动driectx 和显卡的换代升级,也因此坐稳了了pc显卡的领先位置。
芯片是一个赢者通吃的市场,由于高昂的研发费用,只有市场第一才能形成规模优势从而转化成成本优势,最后将其他玩家赶净杀绝,无论是传统的gpu行业还是cpu行业,都存在相同的情况。
然后我们再过来看ai芯片市场,ai云端市场,其实更接近于显卡市场的末期,主导的软硬件生态已经形成,巨头控制整个软硬件和服务市场。如果ai技术在理论层面没有新的突破,依然是以深度学习为基础进行迭代升级的话,这个局面并不容易打破。
在终端市场,更接近于显卡市场发展的初期,没有统一的api接口,没有统一的基准测试,没有成熟的应用场景。所以终端市场对于ai芯片创业公司来说,还是值得一搏的,但这也是一场硬仗,你必须在核心性能上拥有优势,或是处理速度,或是功耗控制,总得有拿的出手的杀手锏。第二,必须赌对标准,站到胜利者一边,并借此快速占领市场。谁都想成为标准的制定者,但很多时候,你必须拥护其他人的标准,甚至是竞争对手的标准,才能赢得市场。
芯片产业是一个资金密集型的产业,无论是研发,还是后期的生产,都要求极高的资金投入。如果产品没有办法规模化,将无法消化前期的高额开销,将企业拖入亏损的泥潭。
拿pc行业cpu和显卡领域的千年老二amd为例,虽然常年坐二望一,偶尔爆发短期超越,但其财报可谓惨不忍睹,亏多盈少,经常以亏损减少为荣,基本不提盈利。但也因为芯片行业能保持市场第二,已经属于不易,所以amd即使常年亏损,其战略地位仍然极具价值,仍然是芯片行业重要玩家。至于老三,好像是不存在的(就是台湾的威盛,已经毫无市场存在感)。
移动芯片领域也存在类似的情况,高通和联发科几乎垄断了整个市场,除了苹果、华为、三星、依托自己的终端优势,撑起了自己的芯片业务,其他纯粹的芯片玩家已经基本被清场,又是一个和图形处理器市场发展非常相似的过程,从百家争鸣到寡头垄断。
而在ai芯片领域,这种情况也将继续。头部玩家将吃下几乎所有市场,而第三名以外的玩家,即使能活下来,也只有喝汤的份了。
秦始皇统一中原,奠定了中国大一统帝国的统治基础,但让人神往的却是之前的诸子百家。在那个思想激昂的年代,各种思潮不断涌现,为后人提供了无限的精神财富。
在微软统治pc操作系统之前,还有很多伟大的操作系统,比如os/2、vms,beos、netware等。虽然这些系统在商业上失败了,却给整个行业留下了宝贵的财富,系统不只有一种实现方法,还有更多的可能。
ai芯片创业者们,正在用他们认为可行的方式,探索着行业的各种可能,虽然我们知道在最后,绝大多数的尝试都将失败,但这些失败将成为推动整个产业发展的动力,将技术快速转化成真正的应用,推动社会的发展。
若干年以后,当人们回顾ai行业的发展,可能会发现,最精彩的故事就发生在这个群雄并起的时代。