平衡与妥协GTX560Ti能否找回Ti系荣誉

2002年初NVIDIA正式发布了开发代号为NV25的图形芯片,取名为Geforce4800Ti,这款产品在当时获得了前所未有的成功,也极大的打击了对手ATI在中高端市场上的火热销售的Radeon8500、7500系列显卡。Ti系列不仅借助其先进的技术赢得了消费者的认同,更为NVIDIA收复了大量市场份额。Ti系列塑造了多重辉煌,特别是GeforceTi4200显卡在几年后仍然热销。

时隔9年,NVIDIA再次恢复了Ti(中文名:钛)这一名称在显卡产品中的使用,NVIDIA想要达到什么目的,NVIDIA希望厂商、市场和用户如何面对这款产品,为什么GF104、114核心要加大每个CUDA核心的发射端和纹理资源,NVIDIA面对目前的图形市场发展有哪些无奈,这些问题都会成为我们分析的重点。当然后文的测试部分我们会放出一些GF114核心对比GF104核心的性能优势。

在当年GeForce4Ti4000产品中,NVIDIA在原有的nfiniteFX图形架构引擎上做了相当完整的改进,并命名为nfiniteFXII引擎。其中在原来有的一个VertexShader的基础上,又增加了第二并行运行的VertexShader,即双VertexShader,因此可以使芯片的顶点处理速度加快一倍,使困惑图形界很久的皮毛渲染成为了可能。在人们对Shader单元发展还还有疑惑的时候,NVIDIA不但提升了VertexShader性能而且也提升了PixelShader版本从1.1到1.3,这是一种毫无疑问的技术进步。

随着微软不断提升其图形API也就是DirectX版本,业界期待一款并行计算和可编程能力极其强大的GPU,因为已经有很多程序员和图形设计师体会到了微软DirectX11在技术特性方面的转向,尽管家用机平台图形引擎由于更新缓慢等问题停滞在DirectX9.0时代,但是PC游戏和图形业界的前进速度已经远远超乎想象。

2010年7月,一款删减版的Fermi核心诞生了,它正是拥有19.5亿个晶体管的GF104核心,虽然流处理器剩下366个,显存位宽等资源都变小了,但是它凭借出色的性价比和性耗比获得了市场的认同,甚至厂商和超频用户发现在高频下运行的GTX460显卡可以获得与GTX480几乎相当的游戏性能。最后的市场反应是:精简版产品获得了认同,而代表Fermi架构全部特性的GF100却成为高功耗高发热的代名词。

GF114从何而来,有何提升

通过ZOL显卡频道昨天的芯片级首测,我们了解到GF114核心相对与GF104核心打开了屏蔽的一组SM单元并提升了频率,不过这颗芯片还是让我们有点意外,毕竟它的超频能力太强劲,且相对与GF104的发热功耗拐点有较大区别。不过GF114到底从何而来,现在的确是个问题,它是完整版的GF104还是NVIDIA重新优化设计的芯片?

目前流传作为广泛的说法是GF114核心和GF110核心一样,经过了彻底推倒重来的EDA设计,我们之前在GF110核心中分析过这些问题。如果经过了EDA设计则芯片功耗下降,工作频率带上升或加宽,这就是显卡玩家所说的低温运行、超频能力强劲等优势。

不过第二种说法相对保守很多,这种观点的坚持者认为GF114是没有经过屏蔽的GF104芯片,也就是说NVIDIA没有做任何改进只是在今年年初推出了这一批完整版的384SP芯片。毕竟GF104芯片在性耗比方面已经很优秀,优化空间较小。

下面这张表格列出的是GF104和GF114芯片的特性对比:

在补全384个流处理器和8个TMU纹理单元之后,GTX560Ti选择了继续提升频率,我们看到相对与GTX460核心和显存频率分别提升了21%和11%,而综合浮点吞吐能力则提升了38%,可以说在并行度和频率方面的提升为GTX560Ti塑造了一个满意的市场定位,或者说的通俗一些可以卖出更好的价格。

两次平衡,两次妥协

事实上GF104并不十分完美,但是它的缺憾恰好造就了这颗芯片在3D游戏方面的高性价比和性耗比。有些问题在GTX460发布之时就应该摆出来讨论,但是这些浮华的测试成绩掩盖了太多人的视线,貌似GTX460可以一统天下了。而GF104和GF114芯片偏重纹理填充、压抑Shader功能的设计思路实际上是对整个图形业界现状的妥协,或者说为了设计更符合现在图形编程环境。

让我们通过对比来看下GF100/110和GF104/114中分别SM拥有功能模块的比例。抛开GF100/110和GF104/114的整体规格不看单比SM规格,GF104/114SM的功能模块数量相比GF100/110SM的功能模块数量只多不少,也就是说GF104/114单个SM的性能要强于GF100/110单个SM,但是GF100/110拥有16个SM,而GF104/114只有8个,因此效率受到较大影响。

总体对比而言,我们可以看到每个SM中CUDACore数量和TextureUnit数量均有大幅增加,这都会增加SM的3D计算能力,从而让用户在游戏体验上获得更好的效果。不过相反每个CUDACore和TextureUnit分得的各类Cache有所减少,这应该是NVIDIAGPU架构工程师在性能、晶体管平衡取舍上得出的比例。

以上特性我们可以总结为,NVIDIA在设计GF104/114时因为晶体管数量所限,减少了SP数量,降低了运算并行度,但是为每个SP配备了更多的纹理和发射端等资源,特别是纹理单元在SM中的翻倍让GPU更加适应当前的图形环境。不过在基于GPU的高性能计算测试中,我们会明显发现GF104/114的这种思路导致性能较幅度下降。

GTX560Ti与GF114芯片概况

在显卡设计环节上,由于GF114芯片流处理器达到了384个且运行频率更高,所以需要更好的供电、散热器来辅助。本次GTX560Ti主要采用了4+1项供电和3热管铜底散热器,毕竟面对一款发热并不是很高的GPU核心,不需要在板卡设计方面投入太多成本。

在这个环节,我们使用了常用的GPU-Z软件和Furmark1.8.0软件来测试这款显卡的基本信息和满负载温度曲线。这GPU-Z软件可以帮助我们最直观的了解一款GPU的基本概况,EVEREST软件作为经典的信息识别软件,可以识别GPU基本参数特别是通用计算方面的特性。

GPU-Z第一屏可以显示显卡的GPU规格和额定频率等信息,而第二屏则可以显示显卡在低功耗模式下的自己降频特性,如果显卡不具备节能特性,则在桌面模式下不会自动降低功耗。

我们看到这款公版GTX560Ti显卡的额定频率为823/4000MHz,高于GTX460公版产品675/3600MHz。节能方面GPU频率在低功耗下能过下探到50MHz,显存达到135MHz(原始频率),这一点和GF104芯片完全一样。

性能测试的硬件、软件平台状况

测试系统硬件环境

性能测试使用的硬件平台由IntelCorei7-8703.5GHz、GIGABYTEGA-P55-UD4主板和2GB*2双通道DDR3-1600内存构成。细节及软件环境设定见下表:

我们的硬件评测使用的内存模组由宇瞻(Apacer)中国区总代理佳明国际提供,电源供应器、CPU散热器由华硕(ASUS)玩家国度官方店、利民(Thermalright)的北京总代理,COOLIFE玩家国度俱乐部提供。

THE END
1.计算机精品视频教程合集artofgioss视频百度网盘地址: https://pan.baidu.com/s/1xARb1TUg6mabDK7992yCTw?pwd=wwfx 自动驾驶—计算机视觉全课程 课程介绍:https://www.aihorizon.cn/5 百度网盘地址: https://pan.baidu.com/s/1lQtYTXn3SQB0bDKF5dPItg?pwd=veap Python强化学习实战—8类智能体 https://blog.csdn.net/duoshehuan6005/article/details/126196425
2.本地静态资源图片(背景图在真机不显示)的解决方法javascript技巧写微信小程序的时候,难免会为了赶进度而直接使用本地的图片,在模拟器上的时候可以正确显示图片,但是到手机上就无法显示图片了,下面这篇文章主要给大家介绍了关于uniapp微信小程序无法使用本地静态资源图片(背景图在真机不显示)的方法,需要的朋友可以参考下https://www.jb51.net/article/271153.htm