华为的AI野心:打造“全栈”解决方案

  本报记者 倪雨晴 上海报道

  导读

  AI战略的发布,对于华为而言,是一次新的升级,进入到智能化阶段,这不仅拓展了华为的边界,也意味着华为和国际AI巨头比肩竞争,除了基础的软硬件业务之外,未来有机会在更多的领域进行超越。

  10月10日-12日,第三届HUAWEI CONNECT 2018(华为全联接大会)如期而至,这是华为最重要的开发者大会,也是华为对外展示生态系统的窗口。和2017年一样,ICT(信息通信技术)依然是关键词,这是华为的发家之本,也是触摸其他领域的前沿阵地。不过和之前大会不同的是,AI成为了今年的主角。

  华为轮值董事长徐直军在会上系统阐述了华为的AI战略、全栈全场景AI解决方案,其中包括人工智能的Ascend(昇腾)系列芯片。

  全栈解决方案这个提法野心极大,在全球范围内来看,目前还没有能够提供全栈解决方案的公司,特别是在欧美,往往强调自己所在一个领域的专业能力。因此,华为的“全栈”更显特立独行。

  在会议期间的交流中,华为高管们反复向记者表示,“全栈”的提出是出于多场景的需求。从云端到各类终端设备,比如车载、手表、手机等,都需要AI的助力,而各场景之间也要相互关联。而合作伙伴需要设备、需要算力。

  华为公司董事、战略Marketing总裁徐文伟在接受21世纪经济报道等媒体采访时说道:“未来肯定是智能世界,原来华为做基础设施,然后做云其实是做服务,这也是趋势。现在人工智能虽然有泡沫,但是大的趋势是不变的,初级人工智能已经提高效率了,就像任总(华为创始人任正非)说的,方向大致正确的情况下要先开一枪。”

  那么,这一枪对于华为来说意味着什么?回看华为的发展历程,从最初B端的服务器、交换机业务,进入到C端手机、笔记本等终端产品。在这个过程中华为开始走近消费者,打开更广阔的空间,华为的形象也更加全面。如今AI战略的发布,对于华为而言,是一次新的升级,进入到智能化阶段,这不仅拓展了华为的边界,也意味着华为和国际AI巨头比肩竞争,除了基础的软硬件业务之外,未来有机会在更多的领域进行超越。

  解密AI芯片

  根据徐直军的介绍,华为的全栈是技术功能视角,是指包括芯片、芯片使能、训练和推理框架和应用使能在内的全堆栈方案。该方案具体由四部分组成,其一是芯片层面的Ascend,即基于统一、可扩展架构的系列化AI IP和芯片,包括Max,Mini,Lite,Tiny和Nano等五个系列。会议期间发布了昇腾910(max)和昇腾310(mini),昇腾910明年上市,昇腾310已经量产。

  其二是CANN,即芯片算子库和高度自动化算子开发工具,可以提升开发效率;其三是MindSpore,支持端、边、云独立的和协同的统一训练和推理框架;其四是应用使能,提供全流程服务(ModelArts),分层API和预集成方案。

  在这四个部分中,AI芯片和Mindspore框架最受关注,两者分别代表着算力和算法,也是人工智能的两大核心要素。首先来看AI芯片,昇腾310更多是用在边缘计算产品上,昇腾910主要用在云端来提供训练能力。在华为提供的数据中,昇腾910的性能高出英伟达V100一倍,华为称之为“目前全球已发布的单芯片计算密度最大的AI芯片”。

  对于华为的芯片性能,集邦咨询拓墣产业研究院分析师姚嘉洋接受21世纪经济报道记者采访时表示:“单以昇腾910来说,在FP16的运算效能就已经超过Tesla V100,所以不难想像在其他运算精度上的算力,应该也可以有超过Tesla V100的表现。而910采用7nm制程,这对于芯片的效能增进,会有一定程度的帮助,所以在性能优势上,确实可以辗压采用12nm制程的Tesla V100。目前来看,可以确定的是,这两款产品将可以优化华为的终端产品的竞争优势。”

  不过,一位AI芯片专家向21世纪经济报道记者分析道:“(单位计算密度)这只是其中的一个指标,并不代表最后的实际性能。计算密度主要是跟制造工艺节点和架构有关。比如你用7nm,那就肯定比10nm的高,因为晶体管小。另外,如果芯片上全都堆的是计算单元,没有复杂的数据链接和大量的片上存储单元等其他部分,算下来用于计算的面积所占比例大,自然密度就高。”

  而两枚AI芯片背后,则是华为首次对外公布的达芬奇项目,在该项目中,华为还自研了达芬奇架构,此次的AI芯片便是基于统一的达芬奇架构。一位达芬奇项目的研发人员告诉21世纪经济报道记者:“这个项目是去年正式开始的,但是之前已经设计了好几年了,由华为内部的专家主导研发。为了全自研的芯片,去年一年都在加班加点地开发。”

  此前华为的部分麒麟芯片是基于寒武纪架构,“之后应该都会用自研架构了,不会用寒武纪了,麒麟里的也会换了。”一位华为内部人士告诉记者。

  徐直军在媒体见面会上则谈道:“新的架构是根据我们对人工智能的理解和需求产生的。寒武纪的也很好,但是没有办法支持我们的全场景。我们需要云到边缘到端,还有物联网终端,全场景的需求,需要开创一个架构。市场上还没有看到相应的架构,可以做到这个。”

  事实上,华为从20多年前就开始做芯片,在徐文伟看来,华为的芯片历程有四个阶段,“最难的是在商业上决定做不做,技术上想尽办法还是有办法做的。”

  他向记者回顾道,1991年华为就做了芯片,当时要求集成度高,这是第一阶段;第二阶段是因为普通的商业芯片不能满足业务需求,但是商用芯片或者很贵、或者就是买不到,所以需要自己做;第三个阶段是基于商业判断,华为在2005年就开始做3G的手机芯片,当时华为还没有手机业务,只有数据卡,但是数据卡当时有需求,也看到了趋势,所以还是决定做了。

  “现在的麒麟是下决心要做的,可以说是基于商业决策,但其实是愿景驱动,现在可以说是第四阶段,即人工智能芯片,市场上没有几家可以买,同时我们云、边缘、端、管道等都需要有人工智能芯片。我们需要人工智能的解决方案,在场景基础上进行创新,我们的芯片是全场景覆盖、可扩展、性能高,并且在一些应用场景下功耗低。主要目的还是降低成本,提高集成度。”徐文伟说道。

  AI框架挑战

  芯片之外,华为的人工智能框架Mindspore也备受瞩目。

  众所周知,AI并不是一个单一的技术系统,而是诸多系统的智能化整合。AI 系统主要包括如下几个层面,一是业务应用层,包装好的第三方应用,或定制的应用程序及技术方案;二是智能框架层,深度学习框架基于云计算层对数据做智能化处理,是AI系统的大脑;三是云计算层,提供算力支持,在大数据层基础上对数据做各类传统形式的处理;四是大数据层,包括物理世界和线上世界的数据获取存储,比如生产数据,金融数据,社会生活数据,自动驾驶道路数据等。

  目前大部分国内的企业都处在应用层面,少部分的巨头在云方面有所成就,比如阿里云和华为云。针对人工智能的算力,国内的顶级玩家也非常少,巨头有华为、阿里的平头哥和达摩院,垂直领域有寒武纪、地平线。

  一位人工智能业内人士告诉21世纪经济报道记者:“芯片固然是人工智能的血液,但智能框架才是人工智能的大脑和灵魂,智能框架是人工智能领域的操作系统。芯片尚且可以代工,系统却代表了生态,是整个智能世界的关键。”

  芯片有很多厂商和技术流派,但操作系统全世界只有屈指可数的几个,操作系统上构建的生态决定了所有软硬件的生命节奏。目前顶级的人工智能框架都来自美国,最著名的有谷歌的TensorFlow,Facebook的pytorch,亚马逊的Mxnet,甚至连微软都开发了智能框架CNTK,可以说几乎顶级的科技巨头都在争夺这个领域的冠军。

  而人工智能框架和平台在国内触及的企业几乎没有,此前只有百度的Paddle-Paddle,阿里的PAI,但总体来说还不够强大,如今,华为的Mindspore是新晋人工智能框架,目前还没有开源。

  “整个战略里面,全栈、全场景解决方案里面,最大挑战是我们Mindspore作为计算和推理框架,未来能不能构建一个生态,大家会不会用,这是唯一的挑战。”徐直军对记者说道,“我们分析过,现在所有框架很难适应全场景,比如我们会出一个部署在端上的学习框架,这个之前是没有的。比如谷歌,主要推的是云上的人工智能,他是在云端训练,推理,但是这个框架就不能用在手机这样的端侧。你要在端侧做训练,做推理,就这个框架要小,架构要灵活,现在的Tensorflow就放不进去。边缘,未来网络里面是边学习边推理,也是需要有框架。我们找不到一个框架真正能够实现全场景,所以我们就自己做了一个,这样可以满足我自己的需求。”

  而比互联网时代操作系统更残酷的是,巨头的智能框架基本都是开源模式。在PC和互联网时代,尚且有微软和苹果是相对封闭的操作系统,只有Android是开源,这样使得其他没有掌握操作系统技术的国家有开发操作系统的动力。但在人工智能时代,谷歌,Facebook等一上来就把自己最顶级的深度学习框架开源,并且免费给算力,免费搭建社区,甚至花大力气来培训开发者,根本目的就是构建极高的迁移成本,如果顶级的开发者都被吸引到谷歌,Facebook的阵营,要再想让他们学习国内的智能框架就非常困难了。

  对公司来说也是如此,如果有现成的免费的开源技术方案,再要投入巨大人力去开发底层技术需要极大的实力和勇气。国内目前也只能期待华为、BAT这样的巨头能否有这样的决心,在输掉PC和互联网操作系统之后,在人工智能操作系统上扳回一局。

  生态与边界

  计算机世界有三个生态:一是以英特尔,微软为首的PC生态,特点是围绕在提升硬件性能,以摩尔定律为指挥棒不断升级固件来获得市场增长;二是以谷歌、苹果为代表的互联网生态,主要提供基础设施,吸引开发者进入,通过互联网服务获得用户价值;三是人工智能生态,这个生态格局未定,各家都在做前期的技术投入。目前来看,谷歌的人工智能项目最为全面和强大,其深度神经拉拢了一众开发者。

  现在,人工智能行业处在搭建生态的阶段,商业形态是第二位的,拉拢更多的开发者和上下游厂商是第一位的。华为也高调构建自己的技术生态,召开全联接大会提高自己在AI领域的声量。10月11日,华为宣布,计划在3年内发展100万开发者和合作伙伴,同时还推动成立全球行业组织高峰会议(GIO),意在促进行业组织间交流和协同,成员包括3GPP、5GAA、5GSA等16家产业组织。在应用案例上,深圳机场、招商银行、奥迪等都应用了华为的AI技术。

  姚嘉洋向记者表示:“就华为的做法来看,华为似乎有意要打造属于自己的AI生态系统,然而,过去华为本身也是伺服器供应商,如阿里巴巴、百度等,都可以算是华为的客户群,如今华为提供Mindspore框架,这对于CSP(云服务供应商)来说,某程度上会形成竞争关系,华为要如何跟国内BAT三大龙头保持‘合作大于竞争’的关系,应该会是接下来的观察指标。毕竟BAT过去在AI都有投入相应的资源与打造自己的生态系统,BAT应不会容许会有其他的竞争者来影响他们AI生态圈。”

  对于构建生态的挑战,徐文伟告诉21世纪经济报道记者:“首先要成为一个平台,且作为平台必须技术上有领先性。第二点必须具有开放性,第三必须具有公平公正性。也就是说和伙伴合作,建生态的时候,最核心的是业务要有边界。”

  可以看到,从云到端、从算法到算力、从训练到推理,华为的AI战略进行了全方位覆盖。这也引发了大家对华为边界的疑问。徐文伟则表示,华为将继续坚持“上不碰应用,下不碰数据”,今后的产业是竞合关系,不要恶性竞争,最重要的是把产业做大。

  (编辑:张伟贤)

特色专栏

热门推荐