华为史上最牛的中端神U——首发达芬奇架构之麒麟 810 全解析

发布者:小老鹰爱小马 2023-8-18 19:02

导语:

遥想2016年、2017年、2018年的时候,手机用户脑海里中端芯片市场的神U基本都是骁龙 625、660、710 之类的高通芯片,这段时期华为的麒麟芯片在该领域存在感还比较弱。

虽然2016年的麒麟650表现还不错,但若让其与骁龙625一较高下的话,确实是完全打不过。至于2017年推出的几款“超频版”,就更没有一战之力了。直至2018年七月份推出了一款在名字上“碰瓷”骁龙的麒麟710,情况才有了一点好转。

当然,麒麟710虽进步很大,但较骁龙710的差距也很大。就在世人以为华为在中端芯片市场上将一直被高通打压之时,2019年六月份竟蹦出了个石破天惊的中端芯片——麒麟810出来!

1,达芬奇架构

达芬奇 NPU 最早是搭载于2018年之云端 AI 芯片——昇腾910和昇腾310上的,到了麒麟810这代才首次被运用于华为终端芯片上。之前在终端芯片的 NPU 部分,华为用的都是寒武纪 IP。

而这次在麒麟810上首次采用的自研达芬奇 AI 架构,其特点是在一个Core里面同时拥有三个不同的计算单元,这样就可以针对不同的计算场景提供算力。

当然,华为做的并非简单将不同运算架构放在一个Core里,而是做出了一整套解决方案。从设计参数的选择和运算,到存储的比例,还有软件工具等,皆处理到位。

如上图所示,在达芬奇Core中,存储单元、控制单元、三个计算单元分工明确,协调一致。其中三个运算单元也是各司其职,3D Cube 负责高算力任务,2D Vector 则更灵活可完成与前者互补的工作,1D Scalar 则主管流程控制。

而在这三个计算单元中,表现最出彩的就是华为深度优化之 3D Cube 计算单元。其通过极致的算法和巧妙的定制电路,从而实现能够显著缩短计算周期的16*16*16运算结构。

打个简单比方,假如要计算一套矩阵的乘法 CPU 需要耗时 163 个时钟周期,那么 GPU 由于拥有并行计算能力就能把耗时减至 16 个时钟周期,而达芬奇架构的 3D Cube 计算单元仅需耗时 1 个时钟周期即可完成!

在 16 位浮点运算精度和 INT8 量化精度方面,麒麟810皆处于业界领先地位。落到实处,其 ETH AI Benchmark 跑分超过了 32000 分——大幅超越了高通旗舰骁龙855的25000分!

此外华为还开放了自研中间算子格式IR,其算子数量超过了 240 个!简单说就是大大增强了华为 HiAI 移动计算平台的兼容性和易用性,这是给开发者释放的友好信号。

说到 HiAI,其始于麒麟970那代。而 2.0 版本则支持更多设备并提升了性能,这为麒麟810能够实现多种 AI 功能(AI影像、AI游戏、AI美音等)提供了强大支持。

2,CPU 和 GPU

实际上麒麟810和之前旗舰端的麒麟980有很多相似之处,例如同样基于台积电 7nm 制程工艺打造,大小核架构一致且大核同样基于 Cortex-A76 架构魔改。

也就是说,麒麟810也有可以通过 AI 能力进行调频调度的能力(预测负载为大小核的灵活调度提供支持),但由于其 AI 性能更强,所以在使用流畅性和待机功耗上皆有亮眼表现。

不过,由于定位问题,麒麟810的 CPU 架构被设计成了两颗主频为 2.27 Ghz 的大核加六颗主频为 1.88 Ghz的 A55 小核之组合,比较侧重能效表现。

假如和前代麒麟710比较的话,由于各方面条件都相差甚远,其领先优势巨大也就不足为奇了。所以,胆子大一点,就和旗舰端的麒麟980比比看,这样其具体有多牛就一目了然了。

CPU单核性能方面,麒麟810落后 18%,多核性能则落后 32%。但是,麒麟980的单核峰值功耗却是麒麟810的近 1.5 倍!可见,在单核性能相差不大的情况下,麒麟810的能效表现很亮眼。

GPU方面,麒麟810集成了六核心的 Mali-G52,频率为 820 Mhz。GPU性能麒麟980领先 65%,但其峰值功耗却是麒麟810的两倍!可见麒麟810的GPU能效表现依然亮眼。

官方宣称麒麟 810 的研发历时三年,期间投入了数亿美元,有超过 1000 多名半导体设计与工艺专家参与其中,耗费了 5000 多块工程验证开发板,方才大功告成。

之所以耗费如此巨大,皆是因为在芯片设计时,物理准备、逻辑设计难度都会成倍提升,而且是非线性的指数型提升。此外还要进行各种可靠性测试,保证产品在底层应用时不会有什么问题。

其实麒麟 980 的研发过程和开发情况与此完全一致,大概率这两款芯片是一起立项的。另外,有国外调研机构说台积电 7nm 晶圆比10nm贵了接近 20%,由此可见华为是真舍得!

3,忆当年勇

接下来就看一下和麒麟 810 同年发布的主流中端芯片中,到底有没有能打的。按时间先后顺序来比,这样首先出场的就是2019年二月份发布之骁龙712。

由于这个时间点麒麟810还没出来,所以高通在放心地挤牙膏——骁龙712实际上就是2018年中端神U骁龙710的超频版,所以其打不过麒麟 810 就不奇怪了。接下来要比的就是当年四月份发布之骁龙730G。

这个就比较猛了,制程工艺和架构全面升级。落到实处,CPU整体性能方面麒麟 810 领先 10%,GPU性能则领先 13%。由于骁龙730G制程工艺为三星 8nm,所以能效方面完败。

接下来的七月份,诞生了联发科 G90T 这款游戏处理器——“发哥”也是比较牛别人都 10nm 以内的制程了他还用台积电 12nm 工艺,那么就看一下其有何特别之处吧。

CPU整体性能方面,麒麟 810 的领先优势差不多有 20%,GPU性能则继续领先 17%。至于能效表现,麒麟用全方位明显更低的峰值功耗跑出了明显更高的性能!原来“发哥”的特别之处就是——在拉胯方面从没让人失望过......

再接下来的十二月份,又诞生了基于三星 7nm EUV 工艺的骁龙765G。这次在制程工艺方面两者算是站在了同一起跑线上,因为三星这个制程的晶体管密度和台积电7nm差不多。

首先,CPU整体性能方面,麒麟710和骁龙765G可谓棋逢对手,难分伯仲。但是,在单核峰值功耗方面,骁龙却明显高过麒麟——能效表现方面掉链子了。

GPU性能方面骁龙有 9% 的小幅优势,同时峰值功耗还更低,可见在GPU性能和能效两方面麒麟都遗憾落败。由此可见,高通真正发力起来,在中端的 Adreno GPU 自研架构上也是能挤出不少牙膏的。

但是,骁龙765G比麒麟810晚了五个月发布,其商用的时间段已经是2020年了。而到了这年的三月份,麒麟820已登场,这直接将一众高通 7 系掀翻了在地——麒麟 8 系辉煌得以延续。

尾声:

搭载麒麟 810 的华为系手机虽然不是很多,但几乎款款经典,从首发机型 Nova5 算起,后面接着的就是荣耀 9X 系列、Nova5i Pro、Nova5z、荣耀20s、Nova6 SE、荣耀Play 4T Pro。

总共八款机型,至今依然有不少老用户。这多亏了华为在系统底层不懈的努力以及鸿蒙系统的持续优化,例如2019年相继推出的超级文件系统和方舟编译器,再加上之前推出的 GPU Turbo 和 Link Turbo 两大技术,用户体验自然到位。

当然系统搞得再好,处理器不行也是白搭,而这也是麒麟 810 作为中端神U的最大意义——在软硬一体方面尽职贡献自身高上限的各项潜能,不断发光发热,为用户的各项日常体验护航。

END

致力于手机知识的探索和整理

大家都在看