映众rtx4070显卡首发评测:4799元,性能依旧给力!
北京时间4月12号晚上9点,nvidia解禁了rtx4070,它也是第四款登场的rtx40系列台式机显卡。售价4799元起步,相比rtx4070ti显卡6499元的起步价低了不少,这无疑会吸引更多用户们的关注。
笔者此次评测选用的rtx4070显卡为映众rtx4070曜夜。它采用双风扇散热设计,标准双槽厚度,显卡尺寸较小。此外它还采用了单8pin辅助供电接口设计,这也足以让大量用户们眼前一亮。
单从对映众rtx4070曜夜这款显卡的初步印象,笔者认为从rtx4070开始,小尺寸的rtx40系列显卡会越来越多。如果性能依旧给力的话,那么rxt4070的人气肯定会很高。它的性能到底如何?本篇文章便带大家一探究竟。
ada lovelace架构与rtx4070
rtx40系列显卡基于英伟达新一代的ada lovelace架构设计。为了让大家更好地了解到这一显卡的升级,笔者首先会对ada lovelace架构以及所支持的一些重要技术进行介绍。
(一) ada lovelace架构核心
(ada lovelace架构核心)
(完整规格的ad102显示核心,具备144组sm单元)
(ada lovelace架构核心gpc单元)
ada lovelace架构核心配备了全新的第三代rt core(光线追踪核心)、第四代tensor core(张量核心)以及sm(流式多处理器)。根据nvidia官方的介绍,ada lovelace架构核心所采用的第3代rt core不仅将光线与三角形求交性能提高了一倍,还将rt-tflop峰值性能提高了一倍之多。第3代rt core还配备了全新的opacity micromap (omm)引擎和displaced micro-mesh (dmm)引擎,进一步提升了光追计算的性能以及减少计算开销,带来了更好的光线追踪效果表现。ada lovelace架构核心配备的第四代tensor core引入了来自专业级h100数据中心gpu的fp8 transformer引擎带来了更加强悍的ai算力。
(第三代rt core结构示意图,相比前代,增加了2个功能)
ada lovelace架构核心在sm单元上引入了shader execution reordering(ser着色器执行重排序)技术来更好的对于着色器的工作进行调度排序,在使用上可以根据不同的负载需求来执行渲染,可对负载较为统一的画面进行渲染,降低工作开销。根据英伟达官方的介绍,这一个ser功能将作为api开放给开发者使用。英伟达官方宣称,ser功能的加入至高可带来两倍rt core性能上的改善,对于光追游戏来说更可带来体验的升级。根据nvidia官方的数据,全新的sm(流式单元处理器)可带来至高两倍的性能以及能效升级,这一项升级不可谓不小。
(ada lovelace架构核心sm结构图)
ada lovelace架构核心除了第三代rt core(光线追踪核心)、第四代tensor core(张量核心)以及sm(流式多处理器)的升级以外,带来了全新的第八代nvenc双硬件编码器,这一全新的第八代nvenc双硬件编码器整合了对av1视频编码格式的支持,可以在传统的h.264等格式之外,加入了对av1这一主流新标准的支持,可以进行对于av1格式的编码与解码,有效提升了生产力方面的表现,对于创作型用户、游戏主播等群体来说更是如虎添翼。来自nvidia官方的数据显示,第八代nvenc双硬件编码器在av1的效率上比h.264编码器的效率提高了40%,这一提升非常明显。
而除了核心上的升级以外,ada lovelace架构核心还大幅度提升了其l2缓存,完成版的ada lovelace架构核心(ad102)拥有96mb的l2缓存,大容量的l2缓存带来了数据命中率的有效提升。在现阶段显存带宽提升有效的情况下,通过升级更大容量的l2缓存,可以进一步提升数据命中表现,带来性能方面的升级,根据nvidia官方的说法,大容量l2缓存的加入为gpu的一系列操作到带来了更高的收益,尤其是在光线追踪等场景下,表现更为明显。
(二) dlss 3与nvidia reflex
ada lovelace架构的一系列升级还带来了全新的dlss 3技术的独占以及nvidia reflex方面的体验提升。
dlss 3包含有dlss 2(dlss超分辨率技术),以及全新加入的dlss帧生成技术,这一项dlss帧生成技术依托于ada lovelace架构的独立光流处理器以及tensor core的ai算力。在一项技术在运行过程中,其通过光流处理器所得到的一系列数据后,以光流加速技术(optical flow acceleration,简称为ofa)来生成画面信息,而ai算力则负责来对画面进行进一步的优化,从而在游戏中加入了更多的帧画面,进行帧数的提升。
dlss 3可直接生成游戏第1帧3/4的像素以及整个游戏第2帧,相当于使用1/8的算力,就完成了整个计算过程,而通过这一个流程的循环,可在提升帧数的同时节省资源开销,进一步带来更好游戏体验。
而在dlss 3的帧生成技术上,由于可能带来延迟的增加,因此dlss 3在使用上也将通过整合nvidia reflex这一技术来降低渲染以及操作的延迟。而根据nvidia官方的说法,dlss 3通过整合nvidia reflex以及一系列的技术,可以使得游戏体验拥有媲美甚至是超越原生级的渲染、操作体验。
(三) rtx40系列显卡第四弹——rtx4070
(rtx4070显示核心架构图,具备46组sm单元)
rtx4070采用的是ad104-250显示核心,拥有5888个cuda核心,搭配12gb容量、192bit位宽的gddr6x显存。
(rtx4070ti显示核心架构图,具备60组sm单元)
rtx4070ti采用的是ad104-400显示核心,拥有7680个cuda核心,搭配12gb容量、192bit位宽的gddr6x显存。
从纸面参数上来看,这两款显卡均基于ad104显示核心设计。全新rtx4070是在rtx4070ti的基础之上,通过定向削减核心规模而来的。
5888÷7680≈0.77。按照cuda核心数量差异来衡量的话,rtx4070理论上具备rtx4070ti显卡约77%的性能水平。当然,这只是理论上。实际表现大概率会有差异。
(映众rtx4070曜夜显卡的gpu-z信息)
在频率设置上,本文选用的映众rtx4070曜夜显卡与rtx4070创始人版保持一致,gpu频率为1920mhz,boost频率为2475mhz,显存频率为1313mhz(等效21000mhz)。
映众rtx4070曜夜显卡欣赏
映众rtx4070曜夜以黑、灰色为主色调,主打轻薄双槽特色。该显卡没有设计rgb灯效,也没有什么花里胡哨的设计,低调不张扬。
由于采用的是双风扇散热设计,这款显卡的尺寸比较短,实测约25cm。加上标准双槽厚度设计,令这款显卡的安装兼容性很不错。
显卡背面设计了金属背板,上面有一些镂空设计,以便兼顾散热效果。
输出接口为三个dp 1.4a以及一个hdmi 2.1。
散热器顶部上面印有“inno3d geforce rtx”的字样。
显卡供电接口为熟悉的单8pin设计。
之前发布的rtx40系列台式机显卡均采用12vhwpr外接供电接口,但是这次rtx4070,nvidia开始允许厂商选用传统的8pin外接供电接口设计,也就是说在这次rtx4070上,传统的8pin外接供电接已回归。相信很多用户们都喜欢这种8pin接口设计,笔者也一样。
将散热器拆卸下来,露出显卡pcb,继续欣赏一下它的用料。
这款显卡虽然长度为25cm,但是它的pcb并不长。通过对比明显能够看出散热器和背板比pcb长出很多。
映众rtx4070曜夜的供电设计依旧不错。gpu左右周围共设计了13相供电,搭配电容铁素体电感、固态电容等高品质元器件,用料值得信赖。
全新的ad104-250显示核心,芯片面积为294.5平方毫米,看上去尺寸比较小。
显存是来自美光的gddr6x,单颗2gb容量。这款显卡pcb正面共设计有6颗显存,组建了12gb显存容量。
这款显卡采用的是herculez x2散热器,搭配有两枚直径约9cm散热风扇。风扇支持可拆洗 ,便于用户们日常保养清灰。此外,这款散热器支持智能风扇停转功能,在待机状态下或者轻负载状态下,它的这2枚风扇会全部停转,以便实现安静的运行效果。
这款散热器的金属主体部分比较大,不仅能够为gpu进行散热,而且还能够为显存、电感以及mos管进行散热。
纯铜镀镍底座,5根纯铜镀镍热管,加上大面积散热鳍片矩阵,可实现高效的散热。
测试平台介绍
笔者组建了一套性能出色的13代酷睿i9测试平台,用来测试显卡的性能。为了对比映众rtx4070曜夜的性能,笔者此次测试还加入rtx4070ti以及上一代rtx3070ti的成绩。
此次测试所选用的这款rtx4070ti是一款非公版显卡,其gpu频率为2310mhz,boost频率为2685mhz,显存频率为1313mhz(等效21000mhz)。
此次测试所选用的这款rtx3070ti同样是一款非公版显卡,其gpu频率为1575mhz,boost频率为1785mhz,显存频率为1188mhz(等效19000mhz)。
英特尔13代酷睿处理器搭配rtx40系列独立显卡是支持resizable bar技术的。为了充分发挥映众rtx4070曜夜显卡的性能表现,以下测试环节均是在resizable bar开启状态下进行的。
dlss 3是rtx40系列显卡带来的全新技术,在维持高画质的情况下也可以实现更为流畅的游戏表现,这也让玩家可以更好的享受4k光追游戏带来的出色画质体验。为了更好的感受rtx40系列显卡在游戏方面的升级,我们在测试rtx40系列显卡时特意选择了爱攻&保时捷(porsche design)联合设计的pd32m显示器。
这款显示器为31.5英寸,采用mini led背光技术,拥有1152个独立分区,拥有1600尼特峰值亮度,8000万:1动态对比度,并通过hdr1400认证,在画质上有着更为出色的表现。此外,pd32m拥有4k分辨率以及144hz的刷新率,支持97�i-p3色域以及99% adobe rgb覆盖,并且拥有hdmi 2.1接口,是一款旗舰级电竞显示器。
游戏性能测试
(一) 3dmark基准测试
首先是映众rtx4070曜夜在3dmark基准测试当中的表现。性能到底有多强,大家一看便知。
在3dmark time spy测试项目中,这款rtx4070的性能约为rtx4070ti的79.9%。
在3dmark port royal光线追踪测试项目中,这款rtx4070的性能约为rtx4070ti的80.7%。
对比上一代rtx3070ti,rtx4070的性能明显是要高出不少的。
(二) dlss 3基准测试
根据实测来看,在开启dlss 3之后,rtx40系列显卡实现了巨大的fps提升。其中在2k分辨率下,开启dlss性能模式之后,rtx4070已可实现超过100 fps的表现。
(三) dlss 3游戏实测
目前已有《赛博朋克2077》、《逆水寒》、《瘟疫传说:安魂曲》、《光明记忆:无线》、《生死轮回》等热门游戏大作支持dlss 3技术。此次dlss 3游戏实测,笔者将利用5款游戏进行测试。
dlss 3游戏测试版——《赛博朋克2077》
dlss 3游戏——《瘟疫传说:安魂曲》
dlss 3游戏——《巫师3:狂猎》
dlss 3游戏——《传送门:光追版》
dlss 3游戏——《f1 22》
通过上述5款dlss 3游戏来看,dlss 3技术为rtx40系列显卡带来的游戏帧数提升是巨大的。
其中在2k分辨率下,开启dlss性能模式之后,rtx4070普遍可实现超过100 fps的表现,令人满意。
此外,开启dlss技术之后,不论dlss 3还是dlss 2,pc延迟也会明显降低,这也是dlss技术的一大优势。
pc延迟越低,游戏画面流畅度自然也就越好。
(四) 其它游戏实测
接下来,笔者再测试一些非dlss 3游戏。
游戏实测——《中土世界:暗影之战》
游戏实测——《刺客信条:奥德赛》
游戏实测——《战争机器5》
游戏实测——《幽灵行动:荒野》
游戏实测——《古墓丽影:暗影》
非dlss游戏中,rtx4070也要明显强于上代rtx3070ti。
(五) 实际游戏过程中的显卡功耗测试
除了性能更强之外,rtx4070在功耗表现方面也要明显优于上代rtx3070ti。
通过实测来看,实际游戏过程中,rtx3070ti显卡的功耗不仅明显高于rtx4070,甚至也要高于rtx4070ti。
生产力性能测试
(一) av1硬件加速编解码测试
为什么av1编解码技术越来越受欢迎?理由很简单,采用av1编解码的视频能够以更低的码率,实现其它主流编解码视频相同的画质。说白了,在视频画质相同的情况下,采用av1编解码的视频文件体积会更小,以至于能够为视频创作者们节省大量的硬盘空间。
目前剪映、万兴喵影、达芬奇等视频软件已可支持av1硬件加速编/解码功能。接下来笔者利用剪映这款软件,将一部h264编码的mp4视频,导出为一部av1编码的mp4视频。
显而易见,在rtx40系列显卡av1视频编码加速的助力之下,转换时间比单用处理器转换大幅缩短,加速效果相当显著。
(二) vsr功能测试
nvidia在近期推出了一项重磅更新——rtx video super resolution,这一项功能翻译过来就是视频超分辨率技术,简称vsr。它可以允许用户在播放视频时,以gpu配备的tensor core以及强悍的ai算力来进行内容的计算,从而提升画面分辨率,带来至高4k分辨率视频输出,为用户带来视频观感的提升。
vsr功能目前可在30/40系列显卡上进行开启,用户能在英伟达控制面板内开启这一项功能的使用,其在70级别以上显卡提供了4档的vsr增强选项可供调整。这一项vsr功能可在google chrome(110.0.5481.105版本以上)或者microsoft edge(110.0.1587.56版本以上)播放视频时进行调用。
我们也采用rtx4070显卡对英伟达推出的vsr功能进行了实际的体验,首先选取的是在网页上播放480p的经典动画《猫和老鼠》,这一动画由于成片年代较早,因此画面在4k分辨率屏幕上的播放存在许多瑕疵。而通过开启vsr进行增强后,画面的细节有了明显的改善,并且画面的噪点有了明显的降低。在这里我们也通过截取同一帧画面,通过英伟达icat进行画面对比,方便各位感受到vsr带来的画面效果提升。
△左480p原生画面,右 480p rtx vsr 4x画面
△左480p原生画面,右 480p rtx vsr 4x画面
除了在网页端可以进行vsr的调用外,英伟达也是在和不少的本地播放器进行合作,让用户在本地播放器也可以体验到vsr功能带来的提升。
根据了解到的信息,知名的开源播放软件vlc将会提供到vsr的功能支持,而我们也是提前拿到了vlc的内部测试版本进行了本地vsr播放的体验。
在通过vlc本地播放《少女与战车》720p画面时,没开启vsr的情况下,整体画面在4k的显示器中显示并不是很清晰,而在开启vsr功能后,其在4k分辨率显示器的播放中也是显示出了更好的画面观感,对于观看体验有所提升。
笔者也是截取到了vlc本地播放《少女与战车》720p视频时,关闭与开启vsr功能的画面,通过icat进行了a/b画面对比。从对比中可看到,在vlc播放时开启vsr功能后,画面的噪点被进行了明显的压制,并且画面的线条整体更为锐利清晰,对于观感加成不少。
△左720p原生画面,右 720p rtx vsr 4x画面
△左720p原生画面,右 720p vsr 4x画面
从画面的对比上,我们可以看到vsr功能带来了更好的画面观感,对于用户的体验是有明显的加分的。而有朋友会好奇,开启vsr后gpu会进行相关的内容计算,这部分计算会不会带来更高的功耗?因此我们也是针对这一问题进行了功耗测试。
在4k分辨率屏幕下通过网页端播放1080p《某科学的超电磁炮》时,rtx 4070在不同的vsr档位设置中的功耗区间如下:
在4k分辨率屏幕下通过本地vlc播放器播放720p《少女与战车》时,rtx 4070在不同vsr档位设置中的功耗区间如下:
从功耗来看,rtx 4070在开启vsr功能后,其功耗的增长并不大,但是却可以带来更好的画面观感,因此推荐用户开启这一项功能。因为vsr 4档增强可以带来更好的画面效果,所以在1档和4档vsr增强功耗差距并不大的情况下,我们更为推荐用户开启到4档的vsr画面增强。
散热器测试
(注:笔者所处的室温维持在26℃)
利用furmark,笔者将对映众rtx4070曜夜显卡进行压力测试。
通过10分钟的烤机,默认频率下满载时gpu温度稳定在约67℃,gpu频率稳定在约2760mhz左右,散热设计可靠,同时静音效果也令笔者比较满意。
全文总结
作为第四款登场的rtx40系列台式机显卡,rtx4070的性能依旧很不错,在大多数游戏当中均可实现2k 100fps的性能水准。特别是在dlss 3技术的加持下,即使面对大量4k游戏,rtx4070依旧也是可以畅玩的。因此对于这款显卡的性能,主流用户们大可放心。笔者认为,rtx4070显卡开售之后,rtx3070ti和rtx3080那些4、5千元的上一代显卡已没必要购买了。
总的来看,对于rtx4070的综合表现,笔者认为很不错,相信会有大量用户入坑的。作为本文的主角映众rtx4070曜夜,它小巧轻薄,堪称性能小钢炮,再加上4799元的首发价,性价比很高,值得笔者力推。
好了,此次首发评测就到这里,希望大家喜欢!