R9FuryX这个命名既继承了R9这个顶级系列番号,又开创了数字命名之外的新规则。其实“Fury”这个名字对AMD来说算是熟客了—它本是罗马神话中的复仇女神,在被AMD收购前的ATI显卡早期历史上就出现过,包括高端的RageFury、性能级的RageFuryPro以及双芯版的RageFuryMAXX。尤其是双芯版的RageFuryMAXX曾经威名赫赫,堪称历史经典显卡之一。AMD如今将这个名号重新拎出来,除了借复仇这个名号向NVIDIA宣战以外,可能还有再次塑造自己的高端形象之意,回击NVIDIA的TITAN系列,树立一个对应的顶级旗舰形象。
1、多晶体管:R9FuryX使用的“Fiji”(斐济岛)核心是AMD有史以来庞大的一颗GPU核心,集成了多达89亿个晶体管,比此前的Hawaii62亿个猛增了近50%,并一举打破了NVIDIAGM200拥有80亿个晶体管的纪录。其核心面积也高达596mm2,差一点就打破了GM200601mm2的纪录成为核心晶体管数量和核心面积的双冠王。
2、大显存位宽、带宽:R9FuryX拥有高达4096bit的显存位宽,它是自显卡诞生之日起,历史上显存位宽高的型号,而且远超第二名,达到曾经旗舰显卡上使用的512bit位宽的8倍。也因为此,即使显存等效频率仅1000MHz,它也帮助R9FuryX实现了512GB/s的显存带宽,让它成为有史以来带宽高的显卡。
3、小PCB:当然是指旗舰显卡中,无论公版还是非公版,R9FuryX绝对是我们见过的PCB面积小,短的旗舰显卡。但它的安装另需预留一个120冷排挂载位,总的安装空间并不比传统超长PCB显卡少,但纵向、横向可变的安装方式相对灵活,比长显卡的空间利用率更高。
说到R9FuryX创造的显卡史上3个“”,就不得不提到头号功臣—HBM显存,正是它的成功应用,奠定了R9FuryX拥有大显存位宽、带宽的基础,并侧面协助设计师完成了高端显卡的瘦身计划。
至于核心架构上,我们暂时看不出它和HawaiiXT核心的本质区别,尤其是流处理器数量的增幅和晶体管增幅基本相当这一点,让我们更加相信GCN1.2在计算逻辑上只是GCN1.1的微小改版。另外值得注意的是,在大幅增加了流处理器数量和纹理单元的同时,Fiji核心的光栅单元依旧维持在了64个,和HawaiiXT核心完全一样,比对手GM200的96个少了50%之多。基于此,我们非常怀疑R9FuryX在光栅高压环境,例如高分辨率、高抗锯齿设定下的性能表现。同时,这种和显存位宽显得极为不和谐的搭配关系也让我们开始思考HBM带来的高带宽优势,对Fiji核心来说是不是真的不可或缺?仔细想想,在底层架构不变的情况下,显示核心对显存位宽和带宽很难有质变水平的需求,单单是在原来5000MHz512bitGDDR5的基础上,适当调整显存工作频率到6000MHz或者7000MHz很可能足够满足新核心需求了。当然,这只是我们的猜测,R9FuryX的实际性能表现,尤其是光栅等后端高负载压力时的表现有待实际测试中来检验。
对R9FuryX这种旗舰显卡来说,并不是所有游戏都值得它全力以赴,很多时候都会出现帧数过度富余的情况(低帧数都远高于60fps)。处于节能环保的理念,AMD特意为R9FuryX准备了一套智能的帧数控制系统—FrameRateTargetingControl。它能智能检测当前游戏的帧数,在帧数超过玩家设定的阈值时,它会自动关闭显卡中的部分计算单元;当帧数不足时,它会让更多的计算单元工作,直到全力以赴。总之就是以尽可能低的功耗,让帧数刚好稳定在玩家需要的帧率上的同时,获得更好的节能、低温表现。例如全力以赴的R9FuryX能在《蝙蝠侠:阿卡姆起源》中获得超过140fps的平均帧率,此时平台功耗350W。而我们开启FrameRateTargetingControl并将帧数设定在80fps后,系统会实时调整参与游戏计算的GPU运算单元数量,场景复杂、要求高时,就开启较多运算核心;场景简单、要求低时,就关闭大多数运算核心。游戏全程确保游戏帧率稳定在80fps,不会有过高的帧率。这样你体验到的游戏流畅性和平均140fps没有任何分别,但是系统功耗却从350W大幅下降到了260W左右,节能效果明显。
在GTX980发布时,NVIDIA就公布了DSR(动态超级分辨率)技术,首次让1080p等物理分辨率较小的显示器也能输出4K超高清质量的图像。原理其实很简单,就是借鉴了SSAA思路,将更高精度的4K画面缩小后输出到1080p屏幕,相当于每个像素点的渲染精度提高了4倍,自然更清晰、更细腻。
AMD的这个VSR虚拟超分辨率(VirtualSuperResolution)使用了同样的原理,渲染环节处理了4K分辨率的高精度像素,输出时可将其压缩到1080p分辨率。这样用户就能在较小分辨率的显示器上感受高精度渲染的精细。尤其是对那些没有原生支持SSAA的游戏,VSR显然能带来更好的显示效果。当然,它的问题也跟DSR一样,都只能在原本性能富余的情况下,才能带来更好的游戏体验。因为这样做的计算强度和直接接驳4K显示器是一样的,渲染压力是普通1080p分辨率的4倍。要是因此而导致帧率降低到60fps、甚至30fps以下,让游戏过程都不流畅了,那么显然就是得不偿失了。
DX12对AMD来说无疑是个双重利好,因为相比以往的API,DX12拥有更加出色的底层硬件直接调用效率,能充分发挥硬件的并发处理能力。更重要的是,这不仅仅针对显示核心,还包括在图形运算中,辅助显示核心的CPU计算部分。通过多线程指令缓冲记录技术,DX12能更好地调用更多CPU核心同时工作。这意味着AMD的多核心CPU产品能在未来的DX12游戏中充分发挥出并行处理优势,以弥补单核心性能明显不及竞争对手的劣势,缩小整体性能差距,消除显卡计算瓶颈。当然,在Windows10正式发布前,我们还没有办法完整体验和分析DX12,只能从显卡厂商的零散宣传中,挤牙膏般地慢慢窥视DX12新特性。这不,AMD又给出了异步着色和原生多GPU计算的一些信息。
值得一提的是AMD为R9FuryX定制的水冷散热器,它不同于常见的冷头-水管-冷排设计,而是通过铜管将水路巧妙地和散热底座连接了起来,借助水冷的强悍散热能力,为供电模块等元器件提供了一体式的散热覆盖。在此之前,AMD第一次在自家R9295X2上使用水冷时,都还需要借助额外的风扇来为周边模块提供散热,R9FuryX则是真正的纯水冷了。
至于外观,AMD表示公版R9FuryX的设计原则是专业、简单、时尚和优雅。可以把铝合金铸模、表面镀镍黑化、类肤材质处理以及背光LEDLOGO等等设计理解为比较专业的外壳加工。另外,外观上的一抹纯黑而不花哨,更是极简化设计的典型代表。至于时尚和优雅,在公版显卡上我们暂时看不出来。实际上在AMD的官方说明中,他们特意强调了前面板的易拆特性,只需拆卸4颗螺丝就能轻松卸下前面板。说是为了迎合即将到来的3D打印潮流,让用户能非常方便地更换自己设计的有趣的外壳,也许这算是时尚吧……好了,接下来就让我们正式进入测试环节。
处理器酷睿i74770K主板ROG玩家国度MaximusVIIFormula内存宇瞻DDR321334GB×2硬盘海盗船NeutronGTX240GBSSD+希捷桌面4TBHDD
一、相比上代旗舰R9290X提升究竟有多少二、能否撬动GM200核心王者地位?三、4GB显存是否会成为高分辨率瓶颈四、AMD有史以来的大显示核心功耗几何?五、水冷散热是否有足够惊艳的温度表现
在正式发布以前,从各种渠道流露出来不少R9FuryX的一些信息,尤其是一份测试显示它的成绩比GTXTITANX还高。结合上高达4096个流处理器的暴力规格,让不少玩家相信R9FuryX有实力和GTXTITANX一战。但在发布会上AMD宣布了R9FuryX定价5099元,依旧是“田忌赛马”策略,进攻对手4999元的次旗舰GTX980Ti和超过8000元的旗舰GTXTITANX中间的空档。AFans十分希望R9FuryX能给他们一个惊喜,性能能够更加接近GTXTITANX,带来超高性价比。不过从价格定位看,R9FuryX的真正对手无疑应该是次旗舰GTX980Ti。
坦白说,R9FuryX的测试过程有些曲折,在首发测试时,AMD为它准备了专用的15.15beta版本驱动程序,这也是我们首先用来体验R9FuryX性能的驱动,几乎是所有国内媒体首发测试时使用的驱动。不得不说这个驱动显然不够成熟,在不少项目当中,R9FuryX都不能获得一个相对“正常”的成绩,比如3DMark11中,它的表现就只比R9290X略好,提升幅度不到20%,大幅低于它在3DMark中相比R9290X大幅提升40%以上的表现。基于此,R9FuryX在不少首发测试中的表现都不尽人意,评价不佳。不知道接下来会发布的正式版驱动能否修正这个问题。仔细分析,这个问题应该更新显存系统对驱动要求更高有关。新软件还好,尤其是不少老款软件和游戏成绩,在当前驱动下,它的性能无法获得较好的发挥。整体来说就是R9FuryX显得不善应对低分辨率的情况,相对来说在4K分辨率下,它的表现更加显眼。
我们的对比首先从上代单芯旗舰R9290X开始,计算规模提高了45%,倘若性能能线性增长,R9FuryX就能获得145%于R9290X的性能。实际测试结果更佳喜人,R9FuryX在3DMark理论测试中的成绩获得了超过52%的性能提升,比计算单元的增加规模还要高。通常来说,3DMark是应用中对显示核心设计理解比较到位的软件,能较为充分地挖掘出显示核心性能。从这个角度看,R9FuryX的确如AMD所说,不仅仅是暴力增加了计算单元,还在每个单元的执行效率上有一定程度的优化。而且可以预见的是,能如此完美地发挥出比线性增长还要可观的性能,还仰仗了HBM提供的超高带宽,以及更低的数据延迟。
实际游戏对架构的优化程度显然不及3DMark理论测试软件,所以R9FuryX的游戏性能平均领先R9290X没能达到50%的幅度,而是在40%左右。尤其值得一提的是,在4K分辨率下,R9FuryX的优势更加明显,个别项目相对R9290X的提升幅度达到了70%以上。这让我们比较吃惊,因为之前的架构分析里,我们还很担心R9FuryX依旧只有64个光栅单元的设计会严重影响它的高分辨率、高抗锯齿状态下的性能表现。现在看来,并不存在高压力状态性能不佳的问题。相反的,它还能在这种高压中更好地释放出架构的整体性能优势。
在与上代R9290X的对比中,我们已经发现R9FuryX不善应对低分辨率的情况,在接下来与对手GTX980Ti和GTXTITANX的对比中,这个劣势显得更加明显。我们看到在4K分辨率的3DMarkFireStrikeUltra中,R9FuryX的成绩介于GTX980Ti和GTXTITANX之间,但面对分辨率仅1080p的3DMarkFireStrikeExtreme时,R9FuryX的表现却跌落到比GTX980Ti还低6%以上。尤其是参与测试的10款游戏中,R9FuryX基本上全都负于GTX980Ti。这样的表现显然不能让人满意,尤其是在R9FuryX定价比GTX980Ti还高100元的情况下。
就在我们略感失望之时,接下来的4K分辨率游戏测试中,R9FuryX又为我们带来一场全面逆袭的好戏。对于HBM显存,原本我们是持怀疑态度的,主要是基于两点:1当前HBM技术还不够成熟,容量难以提升,导致R9FuryX成为一个可能在4K分辨率下爆显存的旗舰显卡;2在架构并未大幅革新的情况下,现有GCN基础架构设计对显存带宽的需求量是否真的如此之高?否则是在浪费了HBM的高带宽优势的同时,还被迫接受了HBM当前容量受限的劣势。
然而实际情况却是在1080p分辨率下全面落败的R9FuryX,在4K分辨率中终于展现出了自己应有的实力。参测10款游戏,R9FuryX有5款游戏的成绩比GTX980Ti更出色,4款游戏成绩两者处于伯仲之间,仅1款落败。尤其值得注意的是,在5款胜出的游戏中,R9FuryX的成绩相当逼近GTXTITANX,尤其是《蝙蝠侠:阿卡姆起源》和《FarCry4》,R9FuryX的成绩甚至超过了对手的顶级旗舰GTXTITANX。
仔细分析,这可能基于两方面因素:1是HBM的高带宽、低延迟优势在压力相对较小的1080p下难以发挥应有的性能,不能给R9FuryX带来明显优势,只有高压力的4K下才能更明显;2是当前游戏对显存容量的需求其实并不贪婪,4GB貌似多对多数游戏来说都足够了。至少我们的测试中,就只有《GTA5》让R9FuryX遇到了爆显存问题,导致成绩不佳。
在架构分析的时候,我们看到当前Fiji使用的GCN1.2和之前的GCN1.1在功能模块上几乎完全一致,很难从结构性上看出新架构的优化程度。尤其是性能测试中,我们大多数时候看到它相对R9290X的性能提升幅度都约等于核心计算规格的提升幅度,这就让我们更难感受到核心设计的改变。直到功耗测试,我们才从中感受到了AMD在新架构上花费的功夫。
这里还值得一提的是FurMark拷机成绩,这是不少媒体衡量显卡功耗的唯一参考。在我们的测试中,R9FuryX在此项目中的表现也是相当糟糕,比GTX980Ti、GTXTITANX高出60W左右。实际上NVIDIA早从GTX400系列开始,就针对这个暴力拷机软件加入了功耗限制机制,从那以后到现在的GM200核心,都不会在这个软件中发挥出自己的真实功耗水平,这不知道成功忽悠住了多少用户。鉴于此,MC向来都只将这个传统项目保留下来,作为衡量满载核心温度的工具,而功耗成绩仅作参考。功耗成绩我们会通过3DMark运行时的功耗,和实际游戏时的功耗为准。你会看到在FurMark中和GTX980Ti、GTXTITANX功耗相差悬殊的R9FuryX,在3DMark和实际游戏中的功耗则和它们相差不多,甚至略低。也正因为此,在以3DMark成绩和功耗为基础计算的能耗比项目中,R9FuryX的表现并不像有些媒体宣传的那么不堪,已经和对手处于同一水平。
测试到此告一段落,就整体性能来说,R9FuryX无法撼动GTXTITANX的王者地位,但对GTX980Ti来说绝对是个巨大威胁。尤其是R9FuryX公版卡在散热和噪音上的优势,让对手根本无法招架。这也让我们理解了为何NVIDIA临近R9FuryX发布前才发布GTX980Ti,而且在规格削减不大的情况下,相比GTXTITANX大幅降低售价的原因。很明显NVIDIA希望借助实惠的GTX980Ti来进一步巩固自己的高端市场竞争力,降低R9FuryX甜点定价对GTXTITANX的冲击。
其实R9FuryX已经很好地完成了换代和阻击对手的任务,对比自家上代的R9290X,它获得了超过40%的性能提升,提升幅度已经相当可观。尤其是相比R9290X,它的能耗比表现拥有质的飞跃。综合性能、能耗比和性价比来看,R9FuryX毫无疑问依旧是款见缝插针的错位竞争产品。它拥有GTXTITANX90%的性能,但价格只有前者60%;与GTX980Ti的性能在伯仲之间,价格略贵却拥有绝对的低温、低噪优势。
一次大胆的尝试
另外值得一提的是,R9FuryX的小体积封装优势,更加便于开发双芯产品,AMD很可能在接下来的顶级双芯战役中获得后发先至的竞争优势。尤其是面对接下来将大面积爆发的4K和VR应用,当前的单芯旗舰都将无法招架,即使是GTXTITANX也不例外。多芯,甚至多芯多卡并联系统才是玩家们的好选择。而在多卡互联中,使用水冷的系统几乎不会受到邻近显卡的散热干扰,能在保持高频全速运算的同时,持续获得低温、低噪的极佳游戏体验。这是传统风冷不具备而R9FuryX自带的优势,这让我们更加看好它的应用前景。实际上在AMD的发布会现场,AMD就已经发布了一款高性能的小体积游戏PC。分体式水冷的小身板,让这款PC非常容易内建两张R9FuryX显卡组建CrossFierX系统。这样的小身板高性能恐怕也是对手难以复制的优势。