文/ 心缘
就在未来短短一个月之内,我们即将迎来2018年业内最重磅的两大AI手机芯片发布——华为麒麟980、苹果A12。
近一年来,商业化落地已成为AI发展的一大热门主题,而智能手机领域无疑是最贴近人们生活且单一出货量最大的AI落地市场之一。自去年华为苹果先后发布AI芯片,移动AI芯片的战火已经点燃。如今,全球前几大智能手机都已具备自产手机芯片的能力,纷纷基于AI芯片构建更全面的AI应用生态,高通作为老牌造芯工厂在手机AI芯片也表现强劲。
据华为消费者业务CEO余承东透露,华为将在8月底召开的德国IFA消费者展上发布新一代旗舰芯片麒麟980,会“遥遥领先”对手,他表示先把牛皮吹出去,再看能不能做到(华为余承东放话:手机今年出货2亿 明年冲世界第一)。随着下个月苹果A12和今年年底到明年年初高通骁龙855的问世,下一代AI旗舰版芯片的战火将再度重燃,巅峰之战即将打响,而新的王者很有可能将在华为的麒麟980、苹果的A12和高通的骁龙855之间诞生!
AI性能大比拼
去年秋天,华为推出的麒麟970拔得了手机AI芯片落地的头筹,搭载这款AI芯片的华为Mate 10和Mate 10 Pro开始进入人们的口袋。麒麟970之所以敢称之为“AI芯片”,正是基于其全新HiAI人工智能移动计算架构中集成的专用AI处理单元——NPU(Neural-Network Processing Unit,嵌入式神经网络处理器)。这款NPU的计算速度比CPU快25倍,能将能耗效率提高50倍,中科院计算所孵化出的AI芯片届独角兽——寒武纪科技(Cambricon)正是该NPU的技术合作方。
据传,即将推出的麒麟980将继续沿用寒武纪IP核,新一代NPU很可能就是寒武纪在今年5月推出的第三代终端IP产品Cambricon 1M。这款NPU使用台积电7nm工艺生产,提供2Tops、4Tops、8Tops三种规模的处理器核,并支持多核互联,其8位运算效能比达5 Tops/W(每瓦5万亿次运算),性能比前任麒麟970采用的寒武纪1A高10倍,为视觉、自然语言处理及各类经典学习任务提供更加灵活高效的计算平台。
此外,华为配合NPU推出面向开发者的HiAI移动计算平台,向开发者提供其AI计算库、API等开发所需的全套工具,也支持开发者通过TensorFlow和Caffe这些第三方框架接入。
去年,在麒麟970发布两周后,苹果公布自研AI芯片A11。A11芯片上也搭载了一个专用于神经网络计算的硬件模块——“神经网络引擎(Neural engine)”,该模块采用双核设计,能以每秒最高6000亿次速度处理机器学习任务,为FaceID的人脸识别、AR物体侦测、Animoji脸部追踪、Siri语音助手等功能提供驱动。
而今年苹果的A12芯片暂时未被曝出大的升级处理,除了可能会继续沿用去年A11使用的神经网络引擎。基于AI芯片,苹果已经初步构建起围绕AI的应用生态,包括FaceID、AR增强现实技术、Siri语音助手等应用以及Core ML、Create ML等面向开发者的机器学习工具。作为下一代iPhone的“心脏”,A12的服务范围将有望扩展到更多的苹果生态之中,为用户开辟更广阔的移动端AI应用和开发的世界。
全球第二大手机厂商苹果和第三大手机厂商华为都在去年陆续推出搭载专用AI处理模块的移动AI芯片,作为安卓阵营手机芯片第一大提供商,高通自然也不会无动于衷。早在去年7月,高通就开放了骁龙神经处理引擎(NPE,Neural Processing Engine)的软件开发包SDK,开发者可以用它在骁龙600和800系列上优化AI应用。
今年2月,高通再度重磅出击,推出包含软硬件两部分的AI引擎(AI Engine),在骁龙核心架构上搭载了神经处理引擎(Neural Processing Engine,NPE)、Android NN API、Hexagon神经网络库等软件,是AI在智能手机等终端上的应用更快速、高效。
在和高通几位高管的交流中,智东西被告知,尽管出于保密需要,高通方不方便透露骁龙855的具体信息。不过,负责AI业务的高通产品管理总监Gary Brotman告诉智东西,目前高通芯片自研DSP不仅能非常高效地完成各种AI任务,而且非常灵活。
但从上一代骁龙845系列来看,高通已在其芯片中配置支持TensorFlow和Halide框架的六核移动DSP(数字信号处理器),并在几代之前就将其使用到异构计算和神经网络开发。
和华为、苹果的架构方案不同,下一代骁龙855很可能还是不会搭载独立NPU。上个月,Gary Brotman还告诉智东西,虽然高通内部有关于专用AI处理模块的研究进展,但AI算法发展飞快,芯片硬件设计往往一年半前就固定下来,一年半前的AI算法与今天完全不同,新算法出现后可能不适配于固定硬件,他认为暂时看不到搭载专用AI处理模块的手机芯片的意义。因此骁龙855很可能跟上一代骁龙芯片一样,具备更弹性的机器学习架构,分布在CPU、GPU、DPS等每个单元上,能适配市面上多种机型。
在智东西和高通Imagination、联发科以及华为海思等行业专家的采访过程中,我们得到一个普遍的结论,AI芯片确实是目前的行业趋势之一,随着手机差异化的减少,最终NPU将会变成“大家都得有”的东西。
CPU提升不明显,GPU参数飙高
据悉,麒麟980在配置上依然采用的是ARM架构,主频最高可达2.8GHz,CPU方面并没有太多的亮点,而其饱受诟病的GPU则有了较大升级。
就在上周的华为旗下手机品牌荣耀Note 10新品发布会上,荣耀总裁赵明公布了来自华为2012实验室的两项新技术:THE NINE液冷散热技术和和双Turbo技术(CPU Turbo+GPU Turbo)。
先于今年6月问世的GPU Turbo已经打通EMUI操作系统和GPU、CPU之间的处理瓶颈,使得图像处理骁龙提升60%,能耗降低30%,一扫之前在GPU表现上的颓势,缩短了和骁龙GPU的差距。
而此次首发的CPU Turbo得益于THE NINE液冷散热技术,把芯片产生的热量快速均匀分布到机身其他部位并迅速散发出去,整体散热性能提升41%,在激发CPU的极限性能的同时使CPU最高可降低10℃。
据传,麒麟980将首用华为自研GPU芯片,性能将是高通Adreno 630的1.5倍左右,在GPU Turbo加持下性能增长将达到50%-60%。如果麒麟980还配置上述THE NINE和CPU Turbo,AI计算效能可能持平甚至超越高通。
目前,苹果的A12处理器的核心数和架构信息还没有明确的消息。和华为一样,苹果AI芯片的主要短板之一也是GPU。根据前段时间曝光的跑分来看,A12在自研GPU方面做出了较大程度上的升级。A12在GPU跑分提升至21619,比上一代A11的16000提高约三分之一,同时提高手机流畅度和散热能力。不过A12在CPU方面的提升似乎并不明显。
高通的Adreno GPU一直都是业界标杆,下一代高通芯片骁龙855的GPU传闻就更加恐怖了,据说“虐杀”一众竞争对手的Adreno 630还只是高通Adreno家族的中端低功耗产品,真正杀手级别的GPU是强化版的Adreno 640和堪比PC显卡的Adreno 680。按照高通发布新品的一贯节奏,骁龙855究竟采用哪款GPU可能到年底才会正式揭晓。
7nm制程与功耗问题
目前,苹果和华为的移动AI芯片都基于ASIC的深度学习,不仅能实现更高准确率,还比GPU、FPGA等传统通用芯片方案有更低的功耗。ASIC是全定制芯片,可基于AI算法进行定制,是未来AI芯片发展的主流方向。
与它们不同的是,骁龙AI芯片并不是直接叠加专用AI计算单元,而是在骁龙平台集成AI引擎,通过多核异构计算架构,让CPU、GPU、DSP等不同模块相互配合,根据不同应用场景安排工作负载。
三款芯片都将采用7nm工艺制程,其中麒麟980和苹果A12的代工订单都交给了台积电,而高通的制作公司暂时不确定是三星还是台积电。按照惯例,华为和苹果的发布会将发布新旗舰版手机,而台积电的处理器生产工作显得至关重要。
然而,近日据台媒报道,台积电工厂因病毒感染,导致数条生产线被迫中断,此次事件被波及的包括负责28nm、16nm和7nm制程的生产基地。目前,台积电官方做出简单回应,表示各大产线已恢复正常,停产时间不超过1天。对于晶圆厂而言,每次生产投入成本极高,一旦中断很可能造成严重损失。台积电此次停工是否会对苹果AI12芯片和麒麟980芯片的供应造成影响,目前尚不得而知。
根据此前台积电在股东会议上宣布的数据,2018年是7nm制程芯片大量投入生产的一年,跟之前的10nm FinFET工艺对比,7nm制程能够在相同晶体管数量下缩减70%的芯片DIE封装尺寸,将性能约提速20%,再加上升级之后可以减少功耗在40%左右。
日前,一颗疑似苹果A12处理器的跑分数据现身GeekBench 数据库,新机型号为iPhone11,2,预装iOS 12系统,处理器为六核设计,主频为2.49GHz。
从上图可以看到,苹果A12的单核性能4673分,相较上一代A11的4100分有所提升,其多核性能为10912分,和A11的10500左右得分持平,不过考虑到距离苹果发布会还有一段时间,这份跑分成绩并不会是A12的最终成绩单。
虽然麒麟980和骁龙855的具体跑分还不得而知,但从A12的跑分信息和上图中的一些信息来看,和A12平起平坐还很困难。根据GeekBench 4数据猜想,麒麟980的单线程和多线程跑分分别约在3000分和7000分,而骁龙855的单线程和多线程得分分别约在3500分和9500分,相比之下,A12的性能表现已经相当出色。
功耗问题是手机芯片的核心问题之一,一块手机芯片无论有多强的算力,如果没有低功耗,依然面临市场的淘汰危机。在功耗方面高通仍然处于绝对优势。尽管7nm进程的工艺虽然在性能方面十分的强悍,但这可能会导致存在较为严重的发热问题,有网友爆料称A12的功耗比预期的还要高出23%,其高功耗问题还在解决中。
基带芯片:belong 765 vs 5G
在基带方面,麒麟980有可能升级为华为今年2月在MWC发布的首款8天线4.5G基带balong 765。Balong 765是全球首个支持LTE Cat.19的芯片,最快下载速度可达1.6Gbps,是全球首款TD-LTE G比特方案,也是业界唯一支持8×8 MIMO(8天线多入多出)技术的调制解调芯片,频谱效率相对4×4MIMO提升80%,能有效降低时延。
此前,全球最快的商用4G基带是高通的骁龙X24,下行速度达到了Cat.20(2Gbps),但仅支持4×4 MIMO。不过此前Balong 765偏向应用于车联网、无人机和智能工厂,是否会被麒麟980采用仍存疑。
高通更是默默藏了一个大招。据消息称,软银集团在3月发布的财报中不慎透露了高通的下一代旗舰芯片的部分信息,包括骁龙855将搭载5G基带骁龙X50。骁龙X50基带是全球首款5G调制解调器,能实现5Gbps的数据传输速度以及低至1/2ms的延时,同时还向下兼容4G的频段,有利于用户过渡。
在与高通旷日持久的专利诉讼案后,挂靠英特尔基带的苹果在基带性能上可能无法和上述两者相提并论,虽然A12处理器的基带尚未曝光,不过就之前苹果A11用的Intel XMM 7480基带来看,其速度仅450Mbps,和其他二者相去甚远。
虽然华为在基带专利方面的进展日新月异,但通讯基带芯片基本被高通垄断,华为还将继续从高通买芯片。芯片领域差距仍然不小,从零研究时间久且未必成效显著,为保证华为手机的竞争力,暂时不会再麒麟芯片一棵树上吊死。今年四月份,在华为分析师大会上,轮值董事长徐直军明确表示,华为智能手机将坚持采取高通、MTK、麒麟多芯片供应战略,确保三个芯片是相互竞争状态。
如果关于骁龙855基带的爆料属实,这与此前高通宣布的5G商用节奏基本符合,很可能到明年上半年我们就能看到5G投入商用。
当然,一切还未成定局。众所周知,近两年来,华为和高通在5G方面一直拼得最狠。去年MWC上,高通发布全球首款5G调制解调器——骁龙X50 5G调制解调器,并于去年10月份在香港宣布了基于骁龙X50 5G调制解调器芯片组,实现了全球首个5G数据连接(data call)。
而在不久之前落幕的MWC2018上,华为正式发布了首款3GPP标准的5G商用芯片巴龙5G01(Balng 5G01)和基于该芯片的首款3GPP标准5G商用终端华为5G CPE。 这意味着华为同时突破了网络和终端这两大5G商用的基础条件,成为全球首家可以为客户提供端到端5G解决方案的公司。
争分夺秒,华为将再夺头筹
华为第一次“杠过”苹果,要从去年华为发布会说起。去年9月2日,华为搞了个大新闻——发布世界首款移动AI芯片麒麟970,比去年9月12日的苹果发布会足足提前了10天。
而就今年各家新品发布会时间来看,华为将再度打响第二代旗舰手机AI芯片的头炮。根据余承东透露的消息,华为将在本月31日召开的德国IFA消费者展上推出麒麟980,目前华为发布会的海报已经在网上曝光。
按照惯例,苹果下个月将举办一年一度的秋季新品发布会,苹果的A12芯片也将携新款iPhone登场。此外,根据此前消息,高通骁龙855自6月以来已经投产,它将携手联想发布全球第一个5G手机,而该款手机有望在今年年末到明年年初问世。
虽然去年华为率先推出AI芯片,不过从手机芯片CPU、GPU等的整体把控来说,还是稍弱于苹果。不过既然去年麒麟970已经进入AI芯片第一梯队,今年说不定麒麟980能再接再厉,在性能方面缩短和其他竞品的差距,未来几年实现真正意义上的赶超也不是没有可能。
结语:AI——智能手机的下一个风口
在这个用AI讲故事的时代,AI、AR、VR等新兴技术正成为拉开智能手机之间体验差距的关键法宝。作为连接移动互联网和物联网的核心平台,智能手机也已成为AI技术落地的重要载体。从人脸识别到语音助手,从图像美化到智慧生活,手机上的AI应用正在逐渐渗透我们的生活。
为什么要给智能手机专门配置一枚AI芯片呢?原因很简单。术业有专攻,CPU、GPU有它们特定的功能,但它们都不是为机器学习任务而设计。而苹果、华为所使用的专用AI处理单元专用于大规模计算,为百家争鸣的AI应用提供更高效的运算处理能力和更低的功耗,实现软硬结合,让手机变得更加“聪明”。此外,目前市面上大多数手机上的AI应用需要通过将数据传至云端以实现训练任务,这会引发数据泄露的风险。苹果、华为、谷歌等少数公司已经能做到直接在移动终端本地运行AI任务,这不仅使得为AI应用开发者开拓更丰富的想象空间,而且有助于保护用户隐私。
在AI发展的初级阶段,各家手机厂商对AI技术落地的方式或许各不相同,但如若想要构建基于AI的应用生态,AI芯片将是不可或缺的入场券。随着AI芯片的普及,自主研发能力能让手机厂商将更多的创新技术和供应链牢牢把控在自己手中,摆脱受制于人的困局。大势当前,无论是移动AI芯片的领跑者还是追赶者,都不应有丝毫的怠慢。