RTX 40系主力战舰登场! NVIDIA GeForce RTX 4080 FoundersEdition首发测评
来源:jbo竞博电竞官网 发布时间:2024-10-05 06:27:57采用NVIDIA Ada Lovelace架构的RTX 4090显卡慢慢的开始在市场中销售,其空前强大的性能获得了发烧级玩家的一致追捧。而在9月20日与RTX 4090同时发布的RTX 4080,也在约定的时间正式登场。作为RTX 40系列目前的次旗舰,RTX 4080也具备Ada Lovelace架构的一系列新特性与黑科技,如第三代RT Cores与第四代Tensor Cores,当然也包括可以让游戏的视觉效果与帧率大幅度的提高的DLSS 3,而价格这一块则相对更甜品一些。因此,RTX 4080也受到了游戏玩家与高性能用户的广泛关注,而11月15日RTX 4080也正式迎来了性能解禁。本次测试个人会使用的是来自NVIDIA的GeForce RTX 4080 Founders Edition(以下简称RTX 4080 FE),想知道这款原厂信仰级神器到底实力如何?那就和我们一睹为快吧。
之前我们对NVIDIA Ada Lovelace架构进行过全面的解析,这里先简单概括一下它的技术亮点。
●NVIDIA Ada Lovelace架构中全新设计的流式多处理器具有最高 83 TFLOPS 的着色能力,吞吐量超过上代产品2倍。
●支持着色器执行重排序(SER),通过即时重新安排着色器负载来提高执行效率。SER可为光线倍的性能提升,整体游戏性能可最高提升 25%。
●新增Ada光流加速器带来2倍的性能提升,使DLSS 3能够预测场景中帧和帧之间的运动变化,让神经网络能够在保持图像质量的同时提高帧率。
●架构进行大幅改进,采用TSMC定制4N工艺,此工艺专为GPU优化,实现高达2倍的能效飞跃。
●12GB显存及以上型号提供双NVIDIA编码器(NVENC),可最多缩短一半的视频导出时间,并提供了对AV1的硬件编码支持。
GPU在完成大量并行计算的时候效率最高,而随着游戏中光追效果越来越复杂,着色器面临的可能就是大量发散的、无序的低效率工作任务,进而影响了渲染效率。SER技术的出现,就可以把这些杂乱的工作任务进行分类,动态重组为更高效的任务,从而提升着色器的执行效率。从NVIDIA官方数据分析来看,SER技术大约会带来2倍的着色器性能提升。
另外,NVIDIA Turing和Ampere 架构GPU中的RT Core包括了用于加速边界体积层次(BVH)数据结构遍历的加速单元,并执行射线三角形和光线边界框相交测试计算。Ampere的RT Cores中,BVH遍历由Box Intersection Engine进行加速,射线三角形相交测试由三角形相交引擎进行加速,这已经被证明是迄今为止处理光追工作负载最高效的引擎。而在Ada GPU的第三代RT Cores中,除了以上两个功能外,还引入了称为“微映射透明度引擎”(OMM)和“微网格置换引擎”(DMM)。
微映射透明度引擎的作用是优化光线追踪渲染,大幅度降低着色器的工作负载,这对于处理复杂物体光追特性来讲提升是很大的。具体的原理是将光线追踪特性烘焙到不透明的蒙版中,让那些不规则的形状与半透明的对象都能更快更精准地被渲染出来。
微网格置换引擎则可以将面数非常多的复杂图形做简化,创造出更简单的模型,以此来实现用基本三角形渲染复杂几何图形的目的,大幅度减少了计算量和对显存的占用。从官方数据分析来看,微网格置换引擎可以让光线追踪的BVH速度最多提升15倍以上,而显存占用最多可降低到原先的1/20,总之就是越复杂的模型,微网格置换引擎的优化效果越突出。
DLSS技术作为RTX系列显卡提升画质与帧率的专用黑科技,到RTX 40这一代进化到了DLSS 3,跨度之大证明其改进是革命性的,NVIDIA官方称其代表了“神经网络渲染新时代”。
和之前的DLSS不同,DLSS 3在原有的超分辨率功能基础上进一步引入了光学多帧生成技术,简单来说就应该通过AI计算生成新的帧,而不像之前那样只是生成像素。而这个帧生成的工作,这个帧生成的工作是在Ada架构中新的光流加速器完成的,当然这就从另一方面代表着DLSS 3中的“光学帧生成”功能是RTX 40独享的。
光流加速器可以在DLSS 2的基础上计算两帧之间的光流场,捕捉游戏画面中从第1帧到第2帧之间变化的方向与速度,包含粒子、光线照射、反射等像素信息,通过计算运动矢量和光流场来精确重建画面。
总的来说,DLSS 2做的是通过AI计算出画面上剩余的像素,而DLSS 3则在此基础上还能计算出下一帧完整的画面,这样算下来DLSS 3等于是完全重建了实际显示画面7/8的像素,也能说是重建了相当于实际渲染像素7倍的像素。此外,由于DLSS 3的“帧生成”在GPU中后处理,所以即便是CPU性能出现瓶颈,也能提升游戏帧率。
按照官方数据,DLSS 3最多可带来4倍的游戏性能提升。DLSS 3包含了“光学多帧生成”、“超分辨率”和“NVIDIA Reflex”三大部分,开发者只要整合DLSS 3,就可默认支持DLSS 2。目前DLSS 3已经得到了游戏开发者与游戏引擎的广泛支持,在后面的详细测试中我们会进一步介绍DLSS 3游戏的情况。
在生产力方面,NVIDIA GPU打造的CUDA生态圈已经是业界无可匹敌的存在,RTX显卡也是设计师们优先考虑的高效工具,因此RTX 40系列在NVIDIA Studio方面的优化配合NVIDIA Studio驱动也将会为内容创作者们提供更加出色的选择。总的来说,目前RTX 可以加速 100 多款主流创意应用,此外,SDK的提供使这些应用更加高效,并提供独家的功能,例如Optix、DLSS和Maxine。NVIDIA Studio 还提供了全套创意应用,包括 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。
AV1相比H.264等编码方式可以在同码率下提供更加清晰的视频画面,而且AV1还支持一些更先进的编码特性,例如HDR与低延迟。RTX 40的编码器(显存12GB以上的RTX 40系列,当然包括RTX 4080,都提供了NVENC A V1双编码器)提供了对AV1硬件编码的支持,而OBS和Discord等推流软件都将在不久之后提供对NVENC AV1的支持,让玩家享受到更加精美而流畅的直播视频画面。解码方面,RTX 40的NVENC也继承了RTX 30上的第5代硬件解码器,支持MPEG-2、VC-1、H.264(AVCHD)、H.265(HEVC)、VP8/9以及AV1的硬件解码。AI直播部分,NVIDIA在直播应用技术上的更新有:面部表情预估,眼神追踪(让你看起来像是在看摄像头),以及虚拟绿幕的质量改进,而开发者可以很容易地在自己的APP中集成NVIDIA Broadcast SDK的这些功能。
那么RTX 4080作为RTX 40系列的次旗舰,规格如何呢?RTX 4080采用了AD103芯片,AD103相对AD102进行了一些削减,GPC为7组,另外其中1个GPC还缩减了2组TPC只有4组。而RTX 4080在此基础上进一步减少了两组TPC,总共拥有38组TPC。
此外,细心的玩家也许注意到RTX 4080的RT Cores/Tensor Cores/TUs数量甚至要比RTX 3080 Ti少一些,显存位宽也要低一些,那它是怎么做到性能反而更高的呢?前面已经说过了,RTX 4080的SM单元经过了进一步优化且支持SER技术,同时RT Cores与Tensor Cores都要高出一代,效率自然不可同日而语,此外GPU的二级缓存是RTX 3080 Ti的10.7倍,核心频率更是高出50%以上,综合这些因素,RTX 4080最终的性能其实是远远超过RTX 3080 Ti的。而在TGP方面,RTX 4080设定为320 W,比RTX 3080 Ti还低30 W,可见其先进的制程确实带来了极高的能效比。
NVIDIA的Founders Edition一直以来都是N饭心目中的信仰神器,在工业设计方面能够说是独居特色,除了性能强悍之外也具备极高的收藏价值,而且在电气性能方面也是众多AIC厂商的参考标杆。
RTX 4080 FE的外观造型与RTX 4090 FE完全相同,银色与黑色的搭配相得益彰,显卡中央的X造型尽显科技与信仰的力量。散热器正面有一只轴流风扇负责推风,另一只轴流风扇位于显卡背面负责拉风,从而在机箱中制造出更为高效的散热风道,提升整体的散热效果。
RTX 4080 FE散热器也搭载了新的散热鳍片和气流设计,相比上代旗舰的FE散热器,RTX 4080 FE可产生的最大气流高出20%,在同噪音等级情况下,气流可以高出15%,从而提供更高的散热效率。
和RTX 4090 FE一样,RTX 4080 FE的厚度已经达到了3.5槽,重量接近2.2KG,散热器的体积相当的夸张,旗舰的霸气感十足。辅助电源接口当然也是12Pin+4pin,包装盒也附送了一条12Pin+4Pin转4×8Pin的转接线 FE的侧面,配备了GEFEORCE RTX信仰灯,通电后会亮起白光,信仰感爆棚。显卡尾部设计了一个磁吸盖板,打开后会露出机架安装孔位,方便在服务器机柜中安装。
RTX 4080 FE和上代FE一样采用了异形PCB设计,整体布局和RTX 4090 FE在细节上有些不同,总供电相数为18,强大的供电设计可以提供更平稳的高负载输出曲线 GPU稳定发挥全部性能。
接下来,就是大家最关心的性能测试部分,让我们一起看看RTX 4080 FE的真正实力吧!
测试中我们解锁处理器功耗墙,并开启BIOS中的Resize BAR选项。内存选择XMP DDR5 6000模式,分频设定为自动。此外,还选用了RTX 3080 Ti与RTX 4090进行对比。
DLSS部分,RTX 4080也保持了巨大的优势,在DLSS 2模式下,也领先RTX 3080 Ti大约45%。在DLSS 3项目中,RTX 3080 Ti不支持光学多帧生成,所以只相当于运行DLSS 2的4K测试,而内置光流加速器、完整支持DLSS 3的RTX 4080自然效率更加高,领先RTX 3080 Ti大约128%!可谓是飞跃式的升级了。同时,我们也能够正常的看到,RTX 4080的基准性能大约为RTX 4090的70%~77%,和它的芯片规模是比较符合的。
光栅化游戏部分,《古墓丽影:暗影》在2K分辨率下,RTX 4080比3080Ti多出了75 fps,提升幅度为44%,在4K分辨率下多出了37 fps,提升达到了39%。和RTX 4090相比,4K下的性能大约为它的67%。
《COD 19》中,RTX 4080无论是在2K还是4K下相对3080Ti都有接近40%的帧率提升,在4K下则大约有RTX 4090的73%,相比《古墓丽影:暗影》表现要好一些。
《荒野大镖客:救赎2》算得上是比较公平的游戏,RTX 4080相对RTX 3080 Ti无论在2K还是4K下的提升都超过了30%,4K下的提升略高一点达到了38%。它在4K下的帧率大约为RTX 4090的76%,差距不算太大。
再看一下育碧系的游戏,先是《刺客信条:英灵殿》,RTX 4080相对于RTX 3080 Ti同样在2K和4K下都有30%出头的优势,而在这里它只比RTX 4090低了15%左右。
《孤岛惊魂6》对旗舰显卡的优化也不是很到位,2K下RTX 4080和RTX 4090只有5%的差距,有可能是在处理器方面出现瓶颈问题了。而到了4K下,差距就拉大到了21%。RTX 4080在4K下比RTX 3080 Ti的帧率也高出了30%左右。
优化超好的3A大作《毁灭战士:永恒》中,RTX 4080在4K下能超过240 fps,虽然RTX 3080 Ti帧率也不低,但是RTX 4080的提升已经接近50%了,增幅非常可观。
同样有这么大性能差距的游戏还有《杀手3》,RTX 4080在2K和4K下相对RTX 3080 Ti的帧率优势都超过了45%。
赛车游戏《极限竞速:地平线低了18%。2K下的帧率和RTX 4090比较接近,显然是处理器又出现了瓶颈。
再来看几款电竞网游。玩《绝地求生》的线K下比RTX 3080 Ti高了33%,比RTX 4090低了31%,正好在中间位置。
从这这些主流游戏的光栅化性能测试结果来看,2K下RTX 4080相对于RTX 3080 Ti的提升在24%~50%之间,平均为36%。4K下提升在28%~46%之间,平均也是36%。相比RTX 4090,2K下的平均差距为15%,4K下大约有25%。
当然,光追和DLSS才是RTX显卡真正的精髓,我们当然要用极限画质下的光追游戏来考验RTX 4080的强悍性能。
同样先来看看《古墓丽影:暗影》。之前在4K下不开光追,RTX 4080比RTX 3080 Ti的提升有39%,开启光追后,提升进一步加大到了43%,虽然光追核心不如RTX 3080 Ti多,但RTX 4080的光追单元毕竟高出一代,同时频率也高很多,所以性能大幅度的提高也是情理之中。
《看门狗:军团》的硬件要求也比较高,也是同样的情况,RTX 3080 Ti在开启DLSS的情况下才能勉强达到4K/60 fps,RTX 4080在4K下有接近40%的优势,开启DLSS更是可以跑到79 fps。
《Control》中的表现也没什么意外,不过在这里RTX 4080相对于RTX 3080 Ti的优势稍微小一些,4K下提升为26%,开启DLSS后提升为31%。
《孤岛惊魂6》再次展现了它对旗舰显卡的优化不足,游戏中2K分辨率下RTX 4080和RTX 4090的帧率居然是一样的。不过4K下的表现就比较正常了,RTX 4080比RTX 3080 Ti高了27%。
硬件杀手游戏《我的世界》RTX版里,DLSS默认就是和光追绑定的,开光追默认就开DLSS,如果手动关掉的线 fps了,不过RTX 4080还是能接近60 fps,提升达到了50%,如果开启DLSS的线 Ti的提升同样在30%以上,自己则落后RTX 4090大约25%。
此外,我们还测试了《光明记忆:无限》《毁灭战士:永恒》《生化危机8》,在这3款游戏中,开启光追后RTX 4080相对于RTX 3080 Ti在4K下的提升也都在40%以上。
我们知道,DLSS 3是RTX 40系列的重头戏,它由DLSS 2超分辨率+帧生成+REFLEX三
大部分组成。从RTX 4090发布到现在支持DLSS 3的游戏 几乎每月都在递增,这次我们选取了其中几款进行了测试(使用NVIDIA FramView工具监测帧率与PCL延迟)。
《赛博朋克2077》在4K超级光追预设下,RTX 4080开启DLSS 3性能模式后,帧数从30 fps暴增至114 fps,如果和RTX 3080 Ti开DLSS 2性能模式相比,则提升了近一倍。
《生死轮回》中RTX 4080开启DLSS 3后能提高近100 fps,RTX 3080 Ti开DLSS 2的线优势还是比较明显。
《瘟疫传说:安魂曲》原生4K最高画质下RTX 4080能跑到接近60 fps,开DLSS 3后暴增至160 fps,接近原生的2.8倍。对比RTX 3080 Ti开DLSS 2的表现,则是1.7倍。
二次元游戏《幻塔》这次在新技术的支持上终于还是走到了老对头米哈游前面,新版将加入光追和DLSS 3。从测试来看,开启DLSS 3后RTX 4080的帧率是不开的3.3倍,对比RTX 3080 Ti开DLSS 2则是1.6倍。这种游戏画风开DLSS对画质的影响其实很小,加入DLSS是个不错的选择。
《光明记忆:无限》开启DLSS 3后,RTX 4080能跑到原生4K约2.5倍的帧率,约是RTX 3080 Ti开DLSS 2的1.5倍。
《微软模拟飞行2020》在最新的UPDATE11更新后,性能表现变得更好。测试选用重庆到成都的航线 fps,开启DLSS 3性能模式后能提高到172 fps,大概是原生的2.3倍。
延迟方面,由于RTX 40系自带光流加速器,通过DLSS 3的光学多帧生成实现了更高的帧率,并通过Reflex大大降低了延迟,所以我们可以看
此外,在RTX 40系列发布之后,众多DLSS 3游戏也陆续到来。当11月15日GeForce RTX 4080发布时,已有10款DLSS 3游戏发布,包括《瘟疫传说:安魂曲》、《光明记忆:无限》、《毁灭全人类2:重新探测》、《暗影火炬城》、《F1 2022》、《逆水寒》、《生死轮回》、《漫威蜘蛛侠:重制版》、《微软模拟飞行》和《超级人类》。此外《WRC Generations》、《极品飞车:不羁》和《战锤40K:暗潮》在RTX 4080推出后不久就会发布,圣诞节前玩家就可畅玩这些DLSS 3游戏。
SPEC包含了大量的工业软件测试项目,在最新的2020V3.1版本中,RTX 4080相对于RTX 3080 Ti的提升还是显而易见的。其中Energy能源测试集的提升最大,是RTX 3080 Ti的2.1倍。其实RTX 4080的表现甚至比RTX 3090 Ti还好。
RTX 4080在V-Ray中的表现也还可以,无论是使用RTX还是CUDA相对于RTX 3080 Ti都能实现50%的渲染效率提升。而OC渲染器中的性能提升则高达35%以上。
视频剪辑方面,从PR2022来看,RTX 4080依旧要强过RTX 3080Ti的,这还是在PR不支持双编码器的情况下。
至于达芬奇的话,做MagicMask魔法遮罩的效率提升也很明显,RTX 3080 Ti需要31秒完成的工作RTX 4080只要20秒就可以搞定。
至于新的AV1编码,我们简单看看达芬奇的输出效率,RTX 4080和RTX 4090在输出时间上的区别非常小,但是双编码器相对RTX 3080 Ti来说确实做到了成倍的效率提升。
此外,如果不考虑显存容量线的单卡生产力性能甚至比RTX 3090 Ti还好一点。
总而言之,RTX 4080能够说是RTX 4090之下最强的消费级生产力GPU,3D渲染方面的综合性能超越RTX 3080 Ti接近50%,视频编码性能更是成倍的提升,再考虑到CUDA与NVIDIA STUDIO生态圈在业界无可匹敌的地位,RTX 4080确实很值得设计师用户选择。
温度方面其实绝对没什么可担心的,毕竟RTX 4080 FE采用了和RTX 4090 FE一样大的散热器,既然这套散热器搞定RTX 4090都没问题,那应付TGP 320W的RTX 4080就更没问题了。
说到功耗,这里就必须多说几句了,从RTX 4090发布到现在RTX 4080上市,很多玩家可能看到这一代的旗舰和次旗舰的标称TGP功耗都不算低。对于TGP功耗而言,其实它是GPU运行在Boost状态下的上限限制,用更容易理解的话来说,它其实是功耗墙上限。而作为功耗上限,并不是指GPU在日常使用和游戏中必须会达到的功耗。
由于采用了新的TSMC 4N NVIDIA定制工艺,使得RTX 40系列GPU有着更好的能耗比,在实现相同甚至更高的性能时,功耗更低。
而在上一代Ampere架构的GPU上,通常就需要跑到极限功耗才能完成最高性能释放。从而造成了为什么RTX 40系列GPU总是跑不满功耗的错觉,实际上这是因为能耗比提升,无需更高功耗。
我们使用NVIDIA FramView工具监测了一些RTX 4080 FE在一些游戏4K分辨率下的功耗表现,能够正常的看到在这些游戏中的平均功耗都未达到320W的TGP功耗。但是作为对比的上代对位的RTX 3080 Ti,几乎都是顶着350W的上限在跑。
如果我们简单计算一下,以《微软模拟飞行2020》(原生4K最高画质下)为例,在该游戏中RTX 4080的帧速是RTX 3080 Ti的1.32倍左右,但功耗只有后者的73%。这样做才能够计算出在该游戏中RTX 4080的能耗比达到了RTX 3080 Ti的1.7倍以上,能够说是表现很出色了。
作为测试传统,我们同样也跑了一下3DMark Speedway的循环考机,并使用NVIDIA FramView工具监测功耗,能够正常的看到,在该测试中,RTX 4080 FE的功耗为308W,GPU最高温度也只有60℃,节点温度也就70℃,GPU最高频率跑到了2820MHz。新的TSMC 4N NVIDIA 定制工艺带来的能效比提升确实是相当可观的。
NVIDIA Ada Lovelace GPU架构为RTX 40系列带来了革命性的进步,除了从TSMC 4N NVIDIA定制工艺获得的超大芯片规模与高频率增益之外,第三代RT Cores和第四代Tensor Cores也大显神威,特别是全新加入的光流加速器,让DLSS 3技术的光学多帧生成得以实现,从而大幅度的增加了游戏帧率并降低了延迟。
RTX 4080作为RTX 40系列的次旗舰,从实测来看在DLSS的加持下也能让主流游戏以4K极致光追设定高帧率流畅运行,在支持DLSS 3的游戏中帧率提升更是惊人,算得上是发烧级玩家的甜品级旗舰。
此外,从前面的生产力测试也能够正常的看到,具备16GB大显存的RTX 4080在3D渲染输出与视频剪辑方面相对RTX 3080 Ti也有巨幅的性能增幅,特别是视频编码性能甚至做到了翻倍,对生产力应用来讲也可以可以称为很实用的高效工具。
在性能大幅度的提高的同时,RTX 4080的能耗比表现同样非常不错的。大部分游戏中的实际功耗都在300W以下,在提供高性能的同时,也能更好的缓解玩家的功耗焦虑。
因此,对于追求发烧级游戏体验的玩家和追求高效率的设计师用户来讲,RTX 4080绝对算得上是当前的“甜品旗舰”选择。而GeForce RTX 4080 Founders Edition作为来自NVIDIA原厂的信仰级游戏神器,不但能提供4K光追游戏极致体验和出色的生产力性能,还拥有极高的收藏价值,很值得N饭第一时间入手!
苹果发布watchOS 11.0.1更新 对设备的潜在问题进行了两大修复
售价提升50%!Intel 128核至强6980P创下17800美元价格记录
闪送成功登陆纳斯达克,开盘涨超23%,中国最大的独立按需专送快递服务商
《编码物候》展览开幕 北京时代美术馆以科学艺术解读数字与生物交织的宇宙节律
上一篇:卫生间排气扇原理
下一篇:参考文苑在有限生命中享受时间的馈赠