天玑9000性能提升多吗?

机选网 天玑9000
型号
制造工艺 4nm
架构

1*3.0ghz x2超大核

3*2.85ghz大核

4*1.8ghz小核

gpu mali-g77 mc9

按照惯例,先来看看天玑9000的一些基本参数:

制造工艺:tsmc 4nm;

cpu:1x cortex-x2 3.05ghz 3x cortex-a710 2.85ghz 4x cortex-a510 1.8ghz;

gpu:mali-g710 mc10;

ai处理器(apu):4x performance core 2x flexible core;

isp:imagiq gen 7,最高支持9 gigapixel/s吞吐,3.2亿像素摄像头;3-core 3-exp hdr-isp(3个3200像素摄像头支持,整个系统270fps的处理能力,18bit管线);4k 3-exp视频hdr支持;ai-video架构;

视频与显示:8k视频编解码器,支持8k av1视频播放;显示输出支持最高wqhd @144hz/fhp @180hz,hdr10 adaptive支持;

modem:5g rel.16,支持下行载波聚合3cc最高300mhz频宽(3x100mhz)、7gbps速率;上行r16 ul增强;ultrasave 2.0节电特性支持;

其他连接:wifi 6e(6ghz);蓝牙5.3;完整的gnss支持;

内存支持:lpddr5x-7500;

这其中有很多个“全球首发”,包括首个采用tsmc 4nm制造工艺,首个采用cortex-x2 ip,首个采用mali-g710 ip,首个支持lpddr5x 7500,首个3.2亿像素摄像头支持,首个3-cam 3-exp 18bit hdr,首个8k av1视频播放支持,首个5g下行3cc载波聚合300mhz 7gbps实现,首个r16 ul enhancement支持,智能手机上首个支持蓝牙5.3。

从整体来看,这个时间节点下,其中的大部分配置都还是相当豪华的,起码天玑9000的旗舰定位是没有疑问的。针对其中的各组成部分,我们再剖开来谈一谈。

cpu部分:首个armv9实现

从发布时间来看,这的确是市面上最早宣布的采用armv9指令集的处理器。

有关cortex-x2/a710/a510的分析,我们已经在此前的文章里做过详述。

这三个ip是今年年中arm面向大众发布的,其亮点在于都基于armv9指令集,而且基本切断了对32位aarch32执行模式的支持(除了为考虑中国市场的cortex-a710之外)。

1 3 4的配置,从此前的cortex-x1开始就比较常见了。

arm说cortex-x2在ipc上相比x1提升了16%;而a710相比前代cortex-a78的同频性能提升最高10%(且同等性能下功耗降低30%);小核心a510的改进应该是最大的,相比年迈的a55有35-50%的性能提升,峰值性能下有20%的功耗红利。

有关cpu核心更具体的架构变化,此处不再多做赘述。

尤为值得一提的是天玑9000在cpu缓存方面的提升:l3 cache容量增大至8mb,而在整个soc上面向几个主要ip的slc(system level cache)容量增长至6mb。

所以联发科在发布会上宣称,移动cpu架构的cache达成了“pc级cache设计”,达到了“14mb”——虽然我们感觉把l3 cache和slc加起来还是挺奇怪的。

这个容量变化其实并不让人意外,此前arm在发布cortex-x2的时候,推荐的l3 cache就是8mb。

而且我们在分析文章里也提到过,8mb l3 cache是这次arm新ip实现性能提升的关键。

6mb slc在android阵营里是比较大的。

相对来说,高通骁龙888的l3 cache是4mb,slc则为3mb。不过和苹果还是不大能比(a15的slc达到了32mb)。

联发科方面说14mb的cache系统,对性能提升最多能起到7%的帮助作用,而且能够降低带宽消耗25%。

宣传上,联发科还特别将14mb这个容量和intel酷睿处理器(面向笔记本)作了比较,如上图所示。

如果是11代酷睿的话,这里列出的i7处理器12mb cache应该是指llc(具体是l3 cache)。

这个对比实际上没那么公平,意义也不大:一方面在于intel酷睿处理器的l2 cache其实会更大,另一方面x86平台的cache系统在设计上和arm阵营不是一回事,比如l3 cache在系统中扮演的角色就不一样(x86这边也没有slc),再比如x86这边在l1 cache也不可能像当代arm那样做得那么大。

此外,天玑9000的cortex-x2大核l2 cache也选配了1mb,a710的l2 cache为512kb,这都是arm官方推荐的配置更大档位的方案,也能说明天玑9000的旗舰定位。

联发科提到,天玑9000“相比现在的android旗舰,峰值性能提升最高35%”,“与此同时能效提升至多37%”——这一点主要说的是cortex-x2。

这个说法还是比较模糊,具体对比对象不明。

感觉综合4nm的工艺红利,和cortex-x2的架构提升,相比x1还是很难达成35%的性能提升。

联发科给了具体的基准测试比较。这里35%是基于specint2k6的测试,系统级的性能提升。

在核心级别上,geekbench 5.0测得天玑9000单核性能提升为10%。

作为对比,arm此前在发布会上提过,cortex-x2基于specint2k6测试,相比x1,ipc提升最多16%。

所以天玑9000的具体实现相当值得做后续观察。

当然我们不清楚此处联发科具体对比的是谁。

cpu多核性能方面联发科表示天玑9000在geekbench 5.0中的跑分超过4000分。

上面这张图除了对比“android旗舰”以外,中间两个“2021旗舰”和“2020旗舰”代表的应该是iphone(因为发言人在演讲中说so we compare not just to the android flagship today, we also compared to the non-android phones which is 2020 version and 2021 version which is made by the cupertino company.)

这样的表现的确不错,不过苹果a系列的强项实际上主要在单核性能上;而且请注意采用天玑9000的手机是明年才要正式上市的。

但另一方面,比所谓今年的“android旗舰”在跑分上高出这么多,的确也是相当出彩的成绩了。

实际体验方面,联发科给了不同app在天玑9000平台之下的启动时间,与“android旗舰”的速度对比。其中netflix开启时间快了55%,一些重型负载如游戏应用的开启速度提升幅度也在12%-50%区间。

gpu:好像支持光追

gpu方面,天玑9000选择的mali-g710是10核心。事实上,arm在发布mali-g710的时候提及可配置的shader核心数在7-16个。

具体表现如何,还是要看将来产品发布时,核心频率等各方面的因素(lpddr5x 7500支持在此应该会有帮助)。

前文未提及的一点是,联发科在会上稍稍提天玑9000“实施了光线追踪特性,把pc级的游戏体验带到移动端”,但再未谈及更多信息。

前不久联发科召开的媒体分享会上,提到过光线追踪实施的进展。

不过据我们所知,mali-g710并没有硬件级的光线追踪支持——起码其中还没有光追的专用加速硬件。

我们猜测天玑9000基于vulkan api的光线追踪支持,仍然是软件级的。

但联发科此前谈到过,已经在硬件层面开始布局对未来最终光追硬件实现的逐步支持(比如cache/buffer之类,猜想天玑9000也是联发科通往完整光追硬件支持的重要一步。

性能提升方面,联发科表示天玑9000的mali-g710 gpu相比2021的“android旗舰”有最多35%性能领先,能效则最多有60%的优势。对比对象不明确,无法做出确切判断。

在具体的持续游戏性能上,联发科给了上面这张图。

这张图测试的是对某款“流行的沙盒游戏”在60fps设定、5g网络开启的情况下,持续玩24分钟,帧率上的变化情况。注意这张图的对比对象可能是iphone 13,而联发科也在会上提到对比的游戏就是《原神》。

从这张图可见,天玑9000的游戏帧率会更为平稳,受发热限制可坚持的帧率也会略高。

不过这种对比其实更考验的是系统性能,包括oem厂商的散热设计在其中占到的比重会非常大。

更多类型的游戏比较如上图,这里的“2021旗舰”看起来相当奇怪......不过若主流游戏都可满帧跑(而且是平均帧率),不管竞品是谁,天玑9000对手游爱好者而言的确是相当值得期待的。

这部分另外值得一提的是天玑9000对于lpddr5x 7500mt/s的支持。

联发科提到lpddr5x 7500相比lpddr5 5500,能够将带宽提升36%,在重度负载下让延迟降低20%。

去年和今年的旗舰手机的确大多都在用lpddr5。

lpddr5x还是相当新的方案,本月月初三星才刚刚宣布开发出了首个14nm 16gb的lpddr5x dram。

此前三星给的数字是相比lpddr5实现1.3倍处理速度提升,以及将近20%的功耗降低。

这几天,美光也刚刚宣布联发科验证了其lpddr5x dram,针对的就是天玑9000。

美光给的数字是lpddr5x峰值8.544gb/s,相比lpddr5提升至多33%的性能。

lpddr5x的采用,理论上应该也是游戏帧率得到提升的部分原因。

ai性能:比比苹果和谷歌

当代手机soc不能忽略的另一个亮点自然就是ai专核了,联发科将自家的ai专核称为apu。

这也是联发科自研ip的重要组成部分,或者说apu已经成为如今联发科在手机soc市场上实现差异化竞争的关键。

前不久的媒体分享会报道中,我们也特别提到了联发科对ai的看法,以及联发科提出的以“每瓦有效算力”来评判ai处理器的性能和效率,建议关注端侧ai inference的各位前往阅读。

这次天玑9000之中的apu采用4个性能核(performance core),加两个弹性核(flexible core),简单理解应该就是4大核、2小核的设计。上一代产品中,联发科用的是2大核 3小核方案。所以联发科宣称天玑9000在ai性能上提升了多达400%,与此同时能效(power efficiency)也提升了4倍。

似乎大部分端侧ai芯片或ip供应商对于自家芯片架构都甚少提及,联发科也没有在会上去谈自家apu的架构。

相比“2021旗舰”(这里应该又是指iphone-by cupertino company),ai性能领先66%,能效则有31%的优势。以下是跑具体的一些应用和nn时的对比:

对象检测和图片分类的确都是手机上比较具有代表性的ai应用场景,跑的是mobiledet、mobilenet v3、v2网络。

除此之外,联发科还特别将天玑9000的apu和谷歌发布没多久的pixel 6手机之上的tensor处理器作了比较。对比的是ai ethz v4——苏黎世联邦理工学院的ai benchmark,在业界也颇具名声。

联发科表示,天玑9000相比tensor,在ai性能上有至多16%的性能领先。

更具体的一些对比项目如上图,项目包括视频ai降噪、去模糊等。

isp、媒体与显示

而在手机soc之上,除了cpu、gpu和ai专核这几大件之外,芯片厂商普遍强调的还有isp(图像处理器),毕竟影像性能可是下游手机产品的宣传重点。天玑9000也不例外。

天玑9000之上的isp是联发科的第七代imagiq。联发科称其为全球首个3.2亿像素支持的isp,吞吐9 gigapixel/s。这次的新isp据说相比上一代,是全新设计的架构(completely re-design on the pipeline)。

在吞吐上这一代isp相比前代提升2倍,视频降噪性能10倍提升。

视频拍摄支持方面包括4k hdr拍摄,还有个ai-video架构。

这次的isp是个3核(3 isps)设计,每个isp(核)可处理3-exposure图片(应该是指3次不同曝光的帧或画面)。那么到视频拍摄上,就能够以hdr的方式同时捕捉3-exposure 18bit的视频(联发科表示,imagiq gen 7是全球首个能够在isp管线上实施18bit的方案)。联发科称其为全球首个实现硬件级的3-cam 3-exp 18-bit video hdr支持,3个isp(核)一起工作的话,就是每秒处理270帧画面。

对于所谓的3 exposure,联发科还在会上将其与2 exposure的方案作了对比。

联发科表示,3 exposure输出的18bit hdr画面更加接近人眼动态范围(这个对比应该是指,视频拍摄的每一帧,都以三次曝光执行hdr合成)。

当然,isp与ai的合作是现在的手机soc芯片厂商普遍在做的事情了。

毕竟ai在影像拍摄过程中正扮演越来越重要的角色。前文提到的ai-video架构应该就是联发科的方案。

天玑9000主要强调的是有个vse(视频流引擎)——这是架构层面的改进,“融合isp与apu的流处理”,“视频拍摄或大型照片处理时,不需要再频繁通过dram来交换数据”。

联发科针对这个vse并未提供更多信息,可能和增大片内cache有关。此前,我们在《手机拍照:在ai面前,1亿像素都是垃圾》一文中谈到过,麒麟9000采用一种smart cache,以及帧切片的方式实现isp与npu的数据互通,避免数据频繁通过片外存储来读写。猜测vse可能与此会比较类似。

联发科表示,vse能够将功耗降低至多17%,延迟减少至多33ms,如此一来也就能进行更多特性的视频实时录制和处理。

这样的算力与架构,是实现照片与视频拍摄质量的基础。不过影像内容创作,就isp层面更重要的还在于oem厂商所采用的算法。

在内容呈现上,关乎到soc之上显示与媒体/视频编解码模块。

视频方面,天玑9000支持8k视频编解码,其中包括8k av1格式的视频播放。对此联发科表示现如今很多视频流服务都升级到了av1。

所以将其固化为一个模块也是必然的。

显示方面,天玑9000支持最高144hz刷新率2k分辨率屏幕,或180hz的全高清分辨率屏幕显示,以及对hdr10 adaptive提供支持。

谈谈5g modem和天玑9000的低功耗

在连接(connectivity)支持上,天玑9000将wifi支持的频宽翻倍至160mhz。

这次对wifi 6e的支持,应该是真正能够发挥160mhz频宽的组成部分。另外天玑9000是智能手机中首个实现蓝牙5.3支持的芯片——估计对用户而言,蓝牙耳机降低延迟是其更有价值的一个应用场景。

无线连接的5g支持方面,这次的天玑9000虽然仍然不支持毫米波,但开始支持sub-6ghz下行的3cc载波聚合,频宽300mhz最高带宽7gbps——今年9月份,是德科技就发布消息提到过和联发科在这方面的合作,即在sub-6ghz范围内,聚合3个5g nr载波达成300mhz频宽。

此外还有对于更多5g rel-16特性的支持,包括“全球首个r16 ul enhancement”,相比rel-15在弱信号区域的上行速度能够提升最高3倍。这些特性都是联发科技术投入上的重要组成部分。

对于5g支持,联发科另一个强调的重点是持续加强ultrasave技术。天玑9000采用的是迭代版的ultrasave 2.0。

联发科表示,相比“2021旗舰”(iphone),在connected模式下功耗降低至多32%,high speed模式下功耗降低至多27%。

这里的high speed模式,在联发科的定义里似乎在于视频流这类持续高速使用5g流量的典型应用中。具体如何实现节电的,联发科在发布会上并没有提到。

谈到低功耗,这次联发科ceo rick tsai演讲中多次提到了联发科对于“低功耗”的看重,讲话开头、中间和结尾都不忘提“低功耗”,并强调在技术上要从低功耗走向高性能,难度会显著地低于从高性能走进低功耗。联发科的主场毕竟在边缘和端侧设备上,iot也是其重要市场,追逐低功耗也是应该的。

针对天玑9000,联发科表示:我们采用新的技术,新的低功耗架构,将功耗控制到最低级别。

上图的这组对比,比较的也是“android旗舰”。

具体的场景包括了飞行模式、空闲模式、音乐播放、8k视频播放、4k视频录制、游戏等。不同场景下,天玑9000可实现的功耗相比竞品有不同程度的优势。不过类似8k视频播放这种场景,大约和新加的解码模块有关吧。

而且联发科如今造旗舰手机soc芯片有个特别的优势,就是台积电在工艺上会显著的更为成熟。

n4虽然不是什么大版本迭代,但台积电在规划上会将其列为主流soc的重要制造工艺。这一点此前探讨工艺的文章里也已经介绍过。

而三星4lpe实际上可能存在更大的不确定性,因为4lpe目前是作为7lpp之后的完整迭代,包含了pitch scaling的。这会成为明年与高通的竞争中,联发科的一个重要优势项。

手机soc是其他业务的重要驱动力

天玑9000无疑肩负着联发科全面征服高端手机市场的使命,所以联发科在其中倾注了很多的技术与心血。而且此前的媒体沟通会也能清晰地看到,联发科在技术上的持续投入,以及未来手机芯片方面的规划路线,包括5g、ai、图形、图像各方面的技术,此前我们都解读过。似乎也是从这几年开始,联发科在技术上的投入和合作也显得明显更为积极。这是将市场扩张至旗舰设备的关键。我们也期待看到明年天玑9000发布之后,市场交付的答卷。

比较有趣的是,这次发布会q&a环节,不少人问及联发科未来业务的发展重点,以及在手机之外其他业务的投入情况。joe chen和rick tsai对此的解释是,联发科的其他业务增长点此前就已经开始显现:虽然手机芯片业务的增长仍然是最快的,但其他各组成部分的同比增长也都有百分之三四十。

更重要的是,手机旗舰soc“是我们的技术驱动力”,联发科在手机上的很多技术储备,正以更快的速度流向其他应用和市场。包括“我们先进工艺技术、先进封装技术方面的能力,也在其他计算业务上发挥作用”。这也为联发科发展创造了更多的机会。