耕升geforce rtx 4060 追风评测:畅玩光追的新一代甜点短卡
对于不少的玩家朋友来说,60级别的甜点级显卡一直是进行装机的首选。在英伟达推出rtx 40系列60级别家族的rtx 4060 ti之后,玩家也对于rtx 4060家族另一产品的rtx 4060非常关注。那么在6月28日,rtx 4060得以正式解禁,价格更低的全新甜点——rtx 4060表现如何?我们将以耕升旗下的耕升geforce rtx 4060 追风为例进行实测,带各位读者一起了解rtx 4060显卡。
ada lovelace架构与geforce rtx 4060
耕升geforce rtx 4060 追风采用的是rtx 40系列显卡所配备的新一代ada lovelace架构核心,其相比较于上一代核心拥有多方面的升级,并且加入了多种特性的支持。这部分内容在此前的评测中我们已经有所提及,不过为了让更多的读者朋友们有所了解,在这里笔者也将简单展开进行相关的介绍。
01/ada lovelace架构的升级
ada lovelace架构核心配备了全新的第三代rt core(光线追踪核心)、第四代tensor core(张量核心)以及sm(流式多处理器)。而其sm(流式多处理器)可带来至多两倍的性能提升,并且结合全新的tsmc 4n工艺加持,带来至多两倍的能效提升。
△ ada lovelace架构核心 sm结构图
ada lovelace架构核心在第三代的rt core上引入了两个全新硬件单元——opacity micro-map引擎和displaced micro-mesh引擎,其可以带来光追计算效率的提升,从而带来更为真实的全景光线追踪等效果实现。
第四代tensor core则引入了来自专业级h100数据中心gpu的 fp8 transformer 引擎,从而实现了更为强力的算力提升,对ai计算提供了更为强悍的算力,使得新一代的rtx 40系列显卡可以运用其算力实现dlss 3技术以及aigc创作的更好表现。
ada lovelace架构核心相比较于上一代产品很大的一个升级点就是配备了更大的die上l2缓存容量,根据nvidia 官方的解释,大容量的l2缓存可以提升数据命中率,减少对于vram的访问次数,带来运算效率上的提升,为ai以及光线追踪等相关场景带来加成。
在以上的变化之外,ada lovelace架构核心还引入了shader execution reordering(ser/着色器执行重排序)技术来更好的对于着色器的工作进行调度排序。这一技术在已经接入这一项功能接口的应用中,可根据使用过程中的不同负载进行执行渲染,将负载较为统一的画面进行集中处理以提升效率,降低画面渲染的工作资源开销。
一系列的变化提升,使得nvidia在ada lovelace架构核心产品上引入了dlss 3这一全新的技术。dlss 3由dlss 2(dlss 超分辨率技术) dlss 帧生成技术 nvidia reflex这三方面所共同组成。其原理是通过ada lovelace架构核心的独立光流处理器以及tensor core,以光流加速技术(optical flow acceleration,简称为ofa)以及tensor core所提供的ai算力来演算画面内容以及进行画面的优化,从而实现帧数上的提升。
在实际的表现上,dlss 3帧生成技术可直接生成游戏第1帧3/4的像素以及整个游戏第2帧,相当于使用1/8的算力,就完成了整个计算过程。而通过这一个流程的循环,可在提升帧数的同时节省资源开销。在进行帧生成的过程中,由于可能带来延迟的增加,因此dlss 3中帧生成技术的开启需要整合nvidia reflex来进行配合,以此降低游戏生成的延迟,带来接近原生甚至是超越原生的渲染延迟优化。
而对于影视创作者来说,ada lovelace架构核心配备有全新的第八代nvenc硬件编解码器,这一全新的第八代nvenc硬件编解码器在支持传统的h.265等格式之外,整合了对av1视频编码格式的支持,可有效提升在视频内容创作方面的生产力表现。
02/rtx 4060
此次我们实测的耕升geforce rtx 4060 追风采用了全新的ad 107-400核心,由tsmc 4n工艺进行制造,芯片的面积为146平方毫米,拥有189 颗亿晶体管。
通过下方的核心架构切片图来看,rtx 4060具备有3组gpc(图形处理集群) ,每个gpc内建有4组tpc (纹理处理集群) ,组成合计12个tpc,每组tpc内具备有两个sm单元(图形处理集群) ,组成了共计24组sm单元。除此之外,我们还可以看到其配备了ofa(光流加速器)以及1个nvenc 1个nvdec和4个32bit 合计128 bit的显存控制器。
△rtx 4060 核心架构切片图
在具体的配置上,rtx 4060配备了3072个cuda核心、128 bit的的显存位宽以及8gb gddr6显存,其显存速率为17 gbp,可总计带来272 gb/s的显存带宽。
从显存带宽的数据来看,其相比较于上一代rtx 3060 12gb的360gb/s有所降低,但是根据nvidia 官方的解释,由于rtx 4060在核心的die上配备了24mb的大容量l2缓存,相比较于rtx 3060 12gb的3mb l2缓存拥有八倍的提升。大容量l2缓存的配置可以使得数据命中率有着大幅度的提升,核心无需频繁访问vram,从而有效减少了对于显存带宽的依赖,起到效率提升并且节省vram能耗的效果。
△英伟达官方示例,小容量l2缓存需频繁调度vram
△英伟达官方示例,大容量l2缓存可减少调度vram的次数
nvidia 官方表示,其rtx 4060通过配备大容量的l2缓存,实现了等效453 gb/s显存位宽,可支持其完成1080p定位下的全高画质加光线追踪加dlss 3的高帧率游戏体验。
笔者制作了相关的图表,大家可以通过图表来查看耕升geforce rtx 4060 追风和上一代rtx 3060 12gb fe版本以及rtx 4060 ti 8gb fe版本的规格差距。
外观&拆解
耕升geforce rtx 4060 追风是一款两槽位的两风扇短卡,在主体外观方面采用了经典的红黑配色进行搭配,辅以一定的折线棱角勾勒,带来了简洁且硬朗的外观呈现。
在具体长度方面,耕升geforce rtx 4060 追风的三围为218*126.5*42mm,就算是对于体积要求更为严苛的itx机箱上,也可以非常轻松的放入其中。
耕升geforce rtx 4060 追风采用了无灯的外观配置,其在显卡的顶部只有非常简洁的 nvidia 核心aic之一“耕升”的英文名称以及“geforce rtx”字样。除此之外还有一个8 pin的pcie供电接口。
此款显卡的背面则是加入了一块塑料背板,背板可起到加固显卡pcb的作用,不易造成pcb弯折的情况出现。而其背板外观还进行了红黑配色的经典搭配,为显卡的整体外观颜值带来了相对应的点缀效果。
耕升geforce rtx 4060 追风是一张标准的双槽显卡,输出接口方面配备有三个dp 1.4a接口以及一个hdmi 2.1接口。
耕升geforce rtx 4060 追风在散热方面采用了两把92mm经过耕升进行优化的「炫风之刃」风扇,风扇的正中心还加入了“风”字元素进行了相关点缀。这两把经过优化的风扇可以在降低噪声的情况下带来更好的进风量加成,实现更好的散热效果。
耕升geforce rtx 4060 追风在散热器方面采用了大面积紧密散热鳍片,并且通过两根6mm的复合式镀镍热管直触核心芯片来加强导热能力。其显卡的整体散热能力通过大面积的鳍片 高效导热热管 散热风扇进行保障。
耕升geforce rtx 4060 追风采用了短pcb的设计,其pcb中心为ad 107-400核心。在其核心的周围,则是四颗来自sk海力士的gddr6显存,每颗2gb容量,组成总计8gb显存。
耕升geforce rtx 4060 追风配置的是4 1相的供电,其中的四相为核心供电,一相为显存供电。
耕升geforce rtx 4060 追风的用户可以通过升级版gw-soul调控软件,实现性能监控、超频设置等相关等相关的操作。
实际测试及体验
为了更好的模拟日常用户的配置情况,笔者将以耕升geforce rtx 4060 追风与英特尔13代酷睿i5-13600k为基础,进行相关的测试以及体验,具体配置可看下方图表。
通过gpu-z我们可以看到耕升geforce rtx 4060 追风的相关显卡信息,其tgp设定仅为115w,可以说是相当节能了。
而为了让各位读者更直观的了解到rtx 4060相比较与上一代rtx 3060 12gb fe的提升,笔者在相关的测试以及体验环节也是加入了上一代的rtx 3060 12gb显卡进行对比。
01/理论测试
在3d mark的理论测试中 ,耕升 geforce rtx 4060 追风相比较于上一代的甜点级产品rtx 3060 综合下来拥有近18%左右的理论性能提升。
在dlss 表现的理论测试上,我们可以看到在同为dlss 2的场景中,耕升 geforce rtx 4060 追风已经是占优势。而在开启了dlss 3之后,其相比较于上一代的rtx 3060 12gb拉开了进一步的帧数差距。
02/ 游戏测试
在热门的电竞游戏《彩虹六号:围攻》中,耕升 geforce rtx 4060 追风的在1080p以及1440p下都比上一代的rtx 3060更具优势,并且可以实现144帧以上的高帧率表现。
在另一款热门电竞游戏《cod 19:战区2》上,由于其性能要求的进一步增强,所以我们可以看到耕升 geforce rtx 4060 追风在1080p的情况下距离144帧的高刷新率表现还有一丝差距,但是其表现已经比起rtx 3060 12gb好了不少。
在几款发布已经有一段时间的3a单机大作上,耕升 geforce rtx 4060 追风可以在没有dlss 3的加成下,在开启光线追踪的游戏上,实现1080p的全高画质高帧率游玩体验。而在分辨率进一步拉升到1440p的情况下,除《看门狗:军团》以外,其余的3a大作都可以实现60帧以上的流畅表现。耕升 geforce rtx 4060 追风相比较于上一代的rtx 3060 12gb,在这几款游戏的1080p以及1440p分辨率下,都拥有综合近18%的帧数差距,和理论差距基本上一致。
根据笔者了解到的信息,随着英伟达越来越多的游戏开发者进行合作,后续推出的游戏中会有越来越多产品支持dlss 3。而目前,已经有包括《f1 22》、《赛博朋克 2077》、《巫师三:狂猎 重制版》等一系列游戏加入了dlss 3的支持,正在开发中的不少大作也是官宣了其支持计划。
耕升 geforce rtx 4060 追风在几款支持到dlss 3的游戏中,相比较于上一代的rtx 3060 12gb则是进一步拉开了差距,其帧数基本为翻倍的提升。而在dlss 3的加成下,即使是对性能要求非常高的《赛博朋克2077》也可以在1440p全开画质加上光线追踪的情况下跑到接近60帧的平均帧,如果将分辨率设置为1080p时,则是拥有近百帧的高帧率体验。不过《巫师三:狂猎 重制版》对于显卡的压力并不小,像是rtx 4060 这一类端甜点卡想要挑战1440p的全高画质加上光追来说比较有压力,建议是降低画质或者降低分辨率进行游玩来获得更好的体验。从游戏的实测来看,dlss 3对于耕升 geforce rtx 4060 追风这一“甜点级”显卡来说,所带来的加成提升还是不小的。
有朋友可能会对dlss 3是否会对游戏画面以及游戏延迟产生劣化影响,因此笔者也是对其进行了实际的测试。
在同样的游戏画面中通过osb截取开启dlss 3和关闭dlss的画面可以看到,开启dlss 3模式的画质(下图左半部分),比原生分辨率(下图右半部分)甚至拥有更为锐利的画面表现。因此玩家基本上无需担心开启dlss 3后会有游戏画面劣化的问题。
而耕升 geforce rtx 4060 追风在开启了dlss 3之后,游戏不仅是在帧数方面有所提升,并且也可以因为nvidia reflex的介入以及平均帧数的提升,带来更低的游戏延迟。
笔者也是对比了两代显卡游戏运行中的功耗情况,rtx 4060的平均功耗相比较于上一代rtx 3060 12gb少了近50w,结合上文我们在游戏方面的帧数对比来说,以耕升 geforce rtx 4060 追风为代表的新一代的rtx 4060显卡能耗比表现是非常亮眼了。
03/生产力及创作测试
在游戏之外,不少用户也会使用显卡进行相关的生产以及创作,那么全新的rtx 4060在这方面的表现如何?相比较于rtx 3060 12gb有何差距?笔者也是采用了耕升 geforce rtx 4060 追风进行了实际的对比测试。
在视频内容的转码方面,笔者采用两张显卡对同一段10分钟的1080p素材进行到处。导出为h.265格式时,耕升 geforce rtx 4060 追风相比较于rtx 3060 12gb速度更快。而如果是导出为av1格式的情况下,由于rtx 3060 12gb并不支持到av1格式的编解码,所以只能依赖于cpu进行软件编解码,效率大幅度下降。耕升 geforce rtx 4060 追风则是因为配备第八代nvenc硬件编解码器原生支持到av1格式的缘故,因此获得了效率上相比的大幅度提升。
在图形渲染能力方面,笔者采用到了v-ray5 benchmark 以及blender benchmark来进行对比。从对比中可以看到,耕升 geforce rtx 4060 追风相比较于上一代的rtx 3060 12gb还是提升了不少的,譬如在blender benchmark的一些项目中,就有接近47%的大幅度提升。
在集成了众多工业软件基准测试的specviewperf 2020中,耕升 geforce rtx 4060 追风相比于rtx 3060 12gb在3ds max项目上有些劣势,但是在其他的几款软件上的表现均有所提升。
在近段时间,有关显卡在aigc领域创作的应用也是非常广泛的。不少用户在使用显卡玩游戏之余,也会采用显卡进行相关的aigc创作。因此,笔者也在本地部署了热门的stable diffusion,对耕升 geforce rtx 4060 追风以及rtx 3060 12gb的绘图能力进行对比。
在相同的环境以及变量下,笔者同样选择了20张768*768图片的输出,在这一个过程中,耕升 geforce rtx 4060 追风耗时为256.09秒,rtx 3060 12gb耗时为288.93秒。经过换算后,耕升 geforce rtx 4060 追风每分钟生成的图像为4.6875张,rtx 3060 12gb每分钟生成的图像为4.1532张。rtx 4060在stable diffusion的应用上,相比较于上一代rtx 3060 12gb拥有 12.86%的提升。
而在国产的渲染器——d5渲染器上,其近期更新了dlss 3的预览支持,可以让用户在复杂渲染模型的预览场景中获得更为流畅的使用反馈,为用户提供更高帧率的显示。笔者也通过耕升 geforce rtx 4060 追风进行了d5渲染器 场景列车中环境非常复杂的《木构建筑》预览体验,并记录开启以及关闭dlss 3进行预览的帧数变化。
从帧数表现可以看到,这一个渲染预览场景对于性能要求非常高,在未开启dlss 3的情况下,预览帧数仅有6帧,不过在开启dlss 3进行预览之后,帧数有提升到11帧左右,虽然还是不太流畅,但是拥有了近乎翻倍的预览视觉效果提升。而渲染器支持dlss 3的功能,对于有更为专业需求且配备有更高级别rtx 40系列显卡的用户来说无疑是一大利好。
04/vsr 体验
英伟达在此前发布了 video super resolution这一功能的支持,这一项功能翻译过来就是视频超分辨率技术,简称vsr。它可以允许用户在播放视频时,以gpu配备的tensor core以及强悍的ai算力来进行内容的计算,从而提升画面分辨率,带来至多4k分辨率视频输出,为用户带来视频观感的提升。
vsr功能目前可在30/40系列显卡上进行开启,用户能在英伟达控制面板内开启这一项功能的使用。这一项vsr功能可在google chrome(110.0.5481.105版本以上)或者microsoft edge(110.0.1587.56版本以上)播放视频时进行调用,并且vlc这一个免费开源的本地播放器也是进行了对vsr的支持。
笔者采用耕升 geforce rtx 4060 追风进行了网页端《猫和老鼠》这一经典动画的播放,并且使用英伟达的icat工具对开启和关闭vsr功能的播放画面进行对比。可以看到,在开启了vsr功能后,画面的噪点以及线条都有了更好的表现,对于观感有所提升。
▲左480p原生画面,右 480p rtx vsr 4x画面
▲左480p原生画面,右 480p rtx vsr 4x画面
除了网页端以外,笔者也选取了720p的《少女与战车》在vlc中进行本地播放,从相关的画面对比可以看到。在开启了vsr进行播放后,画面整体的观感都有所提升,特别是在一些线条以及画面的噪点上,更是有非常明显的差距。
▲左720p原生画面,右 720p rtx vsr 4x画面
▲左720p原生画面,右 720p vsr 4x画面
05/散热测试
在环境室温25±1摄氏度,采用开放式测试台的情况下,笔者对耕升 geforce rtx 4060 追风进行了散热表现的测试。
在使用furmark烤机测试30分钟后,耕升 geforce rtx 4060 追风的核心温度稳定在63摄氏度附近,此时的风扇转速为2150转左右,显卡整卡功耗在115w左右。从表现来看,耕升 geforce rtx 4060 追风的散热表现是没有问题的,温度保持的非常稳定。
总结
在近百瓦的功耗上为玩家带来1080p甚至是1440p的全高画质 光追 高帧率游戏体验,这应该是rtx 4060为大部分玩家所带来的惊喜,其对于非发烧级级别的玩家来说,提供了更低价位也还有不错游戏表现的一个选择。而在后续的游戏中,随着dlss 3技术的进一步普及,像是耕升 geforce rtx 4060 追风这一类rtx 4060显卡的体验相比较于rtx 3060甚至是rtx 3060 ti都将会有更好的体验。
耕升 geforce rtx 4060 追风采用了双槽双风扇的短卡设计以及8 pin供电接口,对于用户的装机兼容性来说非常友好。如果是要组建高性能itx方案的用户,耕升 geforce rtx 4060 追风是一个值得考虑的选项。