您的位置：首页 > 新闻中心

RTX 40系主力战舰登场! NVIDIA GeForce RTX 4080 FoundersEdition首发测评

来源：jbo竞博电竞官网发布时间：2024-10-05 06:27:57

采用NVIDIA Ada Lovelace架构的RTX 4090显卡慢慢的开始在市场中销售，其空前强大的性能获得了发烧级玩家的一致追捧。而在9月20日与RTX 4090同时发布的RTX 4080，也在约定的时间正式登场。作为RTX 40系列目前的次旗舰，RTX 4080也具备Ada Lovelace架构的一系列新特性与黑科技，如第三代RT Cores与第四代Tensor Cores，当然也包括可以让游戏的视觉效果与帧率大幅度的提高的DLSS 3，而价格这一块则相对更甜品一些。因此，RTX 4080也受到了游戏玩家与高性能用户的广泛关注，而11月15日RTX 4080也正式迎来了性能解禁。本次测试个人会使用的是来自NVIDIA的GeForce RTX 4080 Founders Edition（以下简称RTX 4080 FE），想知道这款原厂信仰级神器到底实力如何？那就和我们一睹为快吧。

之前我们对NVIDIA Ada Lovelace架构进行过全面的解析，这里先简单概括一下它的技术亮点。

●NVIDIA Ada Lovelace架构中全新设计的流式多处理器具有最高 83 TFLOPS 的着色能力，吞吐量超过上代产品2倍。

●支持着色器执行重排序（SER），通过即时重新安排着色器负载来提高执行效率。SER可为光线倍的性能提升，整体游戏性能可最高提升 25%。

●新增Ada光流加速器带来2倍的性能提升，使DLSS 3能够预测场景中帧和帧之间的运动变化，让神经网络能够在保持图像质量的同时提高帧率。

●架构进行大幅改进，采用TSMC定制4N工艺，此工艺专为GPU优化，实现高达2倍的能效飞跃。

●12GB显存及以上型号提供双NVIDIA编码器（NVENC），可最多缩短一半的视频导出时间，并提供了对AV1的硬件编码支持。

GPU在完成大量并行计算的时候效率最高，而随着游戏中光追效果越来越复杂，着色器面临的可能就是大量发散的、无序的低效率工作任务，进而影响了渲染效率。SER技术的出现，就可以把这些杂乱的工作任务进行分类，动态重组为更高效的任务，从而提升着色器的执行效率。从NVIDIA官方数据分析来看，SER技术大约会带来2倍的着色器性能提升。

另外，NVIDIA Turing和Ampere 架构GPU中的RT Core包括了用于加速边界体积层次（BVH）数据结构遍历的加速单元，并执行射线三角形和光线边界框相交测试计算。Ampere的RT Cores中，BVH遍历由Box Intersection Engine进行加速，射线三角形相交测试由三角形相交引擎进行加速，这已经被证明是迄今为止处理光追工作负载最高效的引擎。而在Ada GPU的第三代RT Cores中，除了以上两个功能外，还引入了称为“微映射透明度引擎”（OMM）和“微网格置换引擎”（DMM）。

微映射透明度引擎的作用是优化光线追踪渲染，大幅度降低着色器的工作负载，这对于处理复杂物体光追特性来讲提升是很大的。具体的原理是将光线追踪特性烘焙到不透明的蒙版中，让那些不规则的形状与半透明的对象都能更快更精准地被渲染出来。

微网格置换引擎则可以将面数非常多的复杂图形做简化，创造出更简单的模型，以此来实现用基本三角形渲染复杂几何图形的目的，大幅度减少了计算量和对显存的占用。从官方数据分析来看，微网格置换引擎可以让光线追踪的BVH速度最多提升15倍以上，而显存占用最多可降低到原先的1/20，总之就是越复杂的模型，微网格置换引擎的优化效果越突出。

DLSS技术作为RTX系列显卡提升画质与帧率的专用黑科技，到RTX 40这一代进化到了DLSS 3，跨度之大证明其改进是革命性的，NVIDIA官方称其代表了“神经网络渲染新时代”。

和之前的DLSS不同，DLSS 3在原有的超分辨率功能基础上进一步引入了光学多帧生成技术，简单来说就应该通过AI计算生成新的帧，而不像之前那样只是生成像素。而这个帧生成的工作，这个帧生成的工作是在Ada架构中新的光流加速器完成的，当然这就从另一方面代表着DLSS 3中的“光学帧生成”功能是RTX 40独享的。

光流加速器可以在DLSS 2的基础上计算两帧之间的光流场，捕捉游戏画面中从第1帧到第2帧之间变化的方向与速度，包含粒子、光线照射、反射等像素信息，通过计算运动矢量和光流场来精确重建画面。

总的来说，DLSS 2做的是通过AI计算出画面上剩余的像素，而DLSS 3则在此基础上还能计算出下一帧完整的画面，这样算下来DLSS 3等于是完全重建了实际显示画面7/8的像素，也能说是重建了相当于实际渲染像素7倍的像素。此外，由于DLSS 3的“帧生成”在GPU中后处理，所以即便是CPU性能出现瓶颈，也能提升游戏帧率。

按照官方数据，DLSS 3最多可带来4倍的游戏性能提升。DLSS 3包含了“光学多帧生成”、“超分辨率”和“NVIDIA Reflex”三大部分，开发者只要整合DLSS 3，就可默认支持DLSS 2。目前DLSS 3已经得到了游戏开发者与游戏引擎的广泛支持，在后面的详细测试中我们会进一步介绍DLSS 3游戏的情况。

在生产力方面，NVIDIA GPU打造的CUDA生态圈已经是业界无可匹敌的存在，RTX显卡也是设计师们优先考虑的高效工具，因此RTX 40系列在NVIDIA Studio方面的优化配合NVIDIA Studio驱动也将会为内容创作者们提供更加出色的选择。总的来说，目前RTX 可以加速 100 多款主流创意应用，此外，SDK的提供使这些应用更加高效，并提供独家的功能，例如Optix、DLSS和Maxine。NVIDIA Studio 还提供了全套创意应用，包括 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。

AV1相比H.264等编码方式可以在同码率下提供更加清晰的视频画面，而且AV1还支持一些更先进的编码特性，例如HDR与低延迟。RTX 40的编码器（显存12GB以上的RTX 40系列，当然包括RTX 4080，都提供了NVENC A V1双编码器）提供了对AV1硬件编码的支持，而OBS和Discord等推流软件都将在不久之后提供对NVENC AV1的支持，让玩家享受到更加精美而流畅的直播视频画面。解码方面，RTX 40的NVENC也继承了RTX 30上的第5代硬件解码器，支持MPEG-2、VC-1、H.264（AVCHD）、H.265（HEVC）、VP8/9以及AV1的硬件解码。AI直播部分，NVIDIA在直播应用技术上的更新有：面部表情预估，眼神追踪（让你看起来像是在看摄像头），以及虚拟绿幕的质量改进，而开发者可以很容易地在自己的APP中集成NVIDIA Broadcast SDK的这些功能。

那么RTX 4080作为RTX 40系列的次旗舰，规格如何呢？RTX 4080采用了AD103芯片，AD103相对AD102进行了一些削减，GPC为7组，另外其中1个GPC还缩减了2组TPC只有4组。而RTX 4080在此基础上进一步减少了两组TPC，总共拥有38组TPC。

此外，细心的玩家也许注意到RTX 4080的RT Cores/Tensor Cores/TUs数量甚至要比RTX 3080 Ti少一些，显存位宽也要低一些，那它是怎么做到性能反而更高的呢？前面已经说过了，RTX 4080的SM单元经过了进一步优化且支持SER技术，同时RT Cores与Tensor Cores都要高出一代，效率自然不可同日而语，此外GPU的二级缓存是RTX 3080 Ti的10.7倍，核心频率更是高出50%以上，综合这些因素，RTX 4080最终的性能其实是远远超过RTX 3080 Ti的。而在TGP方面，RTX 4080设定为320 W，比RTX 3080 Ti还低30 W，可见其先进的制程确实带来了极高的能效比。

NVIDIA的Founders Edition一直以来都是N饭心目中的信仰神器，在工业设计方面能够说是独居特色，除了性能强悍之外也具备极高的收藏价值，而且在电气性能方面也是众多AIC厂商的参考标杆。

RTX 4080 FE的外观造型与RTX 4090 FE完全相同，银色与黑色的搭配相得益彰，显卡中央的X造型尽显科技与信仰的力量。散热器正面有一只轴流风扇负责推风，另一只轴流风扇位于显卡背面负责拉风，从而在机箱中制造出更为高效的散热风道，提升整体的散热效果。

RTX 4080 FE散热器也搭载了新的散热鳍片和气流设计，相比上代旗舰的FE散热器，RTX 4080 FE可产生的最大气流高出20%，在同噪音等级情况下，气流可以高出15%，从而提供更高的散热效率。

和RTX 4090 FE一样，RTX 4080 FE的厚度已经达到了3.5槽，重量接近2.2KG，散热器的体积相当的夸张，旗舰的霸气感十足。辅助电源接口当然也是12Pin+4pin，包装盒也附送了一条12Pin+4Pin转4×8Pin的转接线 FE的侧面，配备了GEFEORCE RTX信仰灯，通电后会亮起白光，信仰感爆棚。显卡尾部设计了一个磁吸盖板，打开后会露出机架安装孔位，方便在服务器机柜中安装。

RTX 4080 FE和上代FE一样采用了异形PCB设计，整体布局和RTX 4090 FE在细节上有些不同，总供电相数为18，强大的供电设计可以提供更平稳的高负载输出曲线 GPU稳定发挥全部性能。

接下来，就是大家最关心的性能测试部分，让我们一起看看RTX 4080 FE的真正实力吧！

测试中我们解锁处理器功耗墙，并开启BIOS中的Resize BAR选项。内存选择XMP DDR5 6000模式，分频设定为自动。此外，还选用了RTX 3080 Ti与RTX 4090进行对比。

DLSS部分，RTX 4080也保持了巨大的优势，在DLSS 2模式下，也领先RTX 3080 Ti大约45%。在DLSS 3项目中，RTX 3080 Ti不支持光学多帧生成，所以只相当于运行DLSS 2的4K测试，而内置光流加速器、完整支持DLSS 3的RTX 4080自然效率更加高，领先RTX 3080 Ti大约128%！可谓是飞跃式的升级了。同时，我们也能够正常的看到，RTX 4080的基准性能大约为RTX 4090的70%~77%，和它的芯片规模是比较符合的。

光栅化游戏部分，《古墓丽影：暗影》在2K分辨率下，RTX 4080比3080Ti多出了75 fps，提升幅度为44%，在4K分辨率下多出了37 fps，提升达到了39%。和RTX 4090相比，4K下的性能大约为它的67%。

《COD 19》中，RTX 4080无论是在2K还是4K下相对3080Ti都有接近40%的帧率提升，在4K下则大约有RTX 4090的73%，相比《古墓丽影：暗影》表现要好一些。

《荒野大镖客：救赎2》算得上是比较公平的游戏，RTX 4080相对RTX 3080 Ti无论在2K还是4K下的提升都超过了30%，4K下的提升略高一点达到了38%。它在4K下的帧率大约为RTX 4090的76%，差距不算太大。

再看一下育碧系的游戏，先是《刺客信条：英灵殿》，RTX 4080相对于RTX 3080 Ti同样在2K和4K下都有30%出头的优势，而在这里它只比RTX 4090低了15%左右。

《孤岛惊魂6》对旗舰显卡的优化也不是很到位，2K下RTX 4080和RTX 4090只有5%的差距，有可能是在处理器方面出现瓶颈问题了。而到了4K下，差距就拉大到了21%。RTX 4080在4K下比RTX 3080 Ti的帧率也高出了30%左右。

优化超好的3A大作《毁灭战士：永恒》中，RTX 4080在4K下能超过240 fps，虽然RTX 3080 Ti帧率也不低，但是RTX 4080的提升已经接近50%了，增幅非常可观。

同样有这么大性能差距的游戏还有《杀手3》，RTX 4080在2K和4K下相对RTX 3080 Ti的帧率优势都超过了45%。

赛车游戏《极限竞速：地平线低了18%。2K下的帧率和RTX 4090比较接近，显然是处理器又出现了瓶颈。

再来看几款电竞网游。玩《绝地求生》的线K下比RTX 3080 Ti高了33%，比RTX 4090低了31%，正好在中间位置。

从这这些主流游戏的光栅化性能测试结果来看，2K下RTX 4080相对于RTX 3080 Ti的提升在24%~50%之间，平均为36%。4K下提升在28%~46%之间，平均也是36%。相比RTX 4090，2K下的平均差距为15%，4K下大约有25%。

当然，光追和DLSS才是RTX显卡真正的精髓，我们当然要用极限画质下的光追游戏来考验RTX 4080的强悍性能。

同样先来看看《古墓丽影：暗影》。之前在4K下不开光追，RTX 4080比RTX 3080 Ti的提升有39%，开启光追后，提升进一步加大到了43%，虽然光追核心不如RTX 3080 Ti多，但RTX 4080的光追单元毕竟高出一代，同时频率也高很多，所以性能大幅度的提高也是情理之中。

《看门狗：军团》的硬件要求也比较高，也是同样的情况，RTX 3080 Ti在开启DLSS的情况下才能勉强达到4K/60 fps，RTX 4080在4K下有接近40%的优势，开启DLSS更是可以跑到79 fps。

《Control》中的表现也没什么意外，不过在这里RTX 4080相对于RTX 3080 Ti的优势稍微小一些，4K下提升为26%，开启DLSS后提升为31%。

《孤岛惊魂6》再次展现了它对旗舰显卡的优化不足，游戏中2K分辨率下RTX 4080和RTX 4090的帧率居然是一样的。不过4K下的表现就比较正常了，RTX 4080比RTX 3080 Ti高了27%。

硬件杀手游戏《我的世界》RTX版里，DLSS默认就是和光追绑定的，开光追默认就开DLSS，如果手动关掉的线 fps了，不过RTX 4080还是能接近60 fps，提升达到了50%，如果开启DLSS的线 Ti的提升同样在30%以上，自己则落后RTX 4090大约25%。

此外，我们还测试了《光明记忆：无限》《毁灭战士：永恒》《生化危机8》，在这3款游戏中，开启光追后RTX 4080相对于RTX 3080 Ti在4K下的提升也都在40%以上。

我们知道，DLSS 3是RTX 40系列的重头戏，它由DLSS 2超分辨率+帧生成+REFLEX三

大部分组成。从RTX 4090发布到现在支持DLSS 3的游戏几乎每月都在递增，这次我们选取了其中几款进行了测试（使用NVIDIA FramView工具监测帧率与PCL延迟）。

《赛博朋克2077》在4K超级光追预设下，RTX 4080开启DLSS 3性能模式后，帧数从30 fps暴增至114 fps，如果和RTX 3080 Ti开DLSS 2性能模式相比，则提升了近一倍。

《生死轮回》中RTX 4080开启DLSS 3后能提高近100 fps，RTX 3080 Ti开DLSS 2的线优势还是比较明显。

《瘟疫传说：安魂曲》原生4K最高画质下RTX 4080能跑到接近60 fps，开DLSS 3后暴增至160 fps，接近原生的2.8倍。对比RTX 3080 Ti开DLSS 2的表现，则是1.7倍。

二次元游戏《幻塔》这次在新技术的支持上终于还是走到了老对头米哈游前面，新版将加入光追和DLSS 3。从测试来看，开启DLSS 3后RTX 4080的帧率是不开的3.3倍，对比RTX 3080 Ti开DLSS 2则是1.6倍。这种游戏画风开DLSS对画质的影响其实很小，加入DLSS是个不错的选择。

《光明记忆：无限》开启DLSS 3后，RTX 4080能跑到原生4K约2.5倍的帧率，约是RTX 3080 Ti开DLSS 2的1.5倍。

《微软模拟飞行2020》在最新的UPDATE11更新后，性能表现变得更好。测试选用重庆到成都的航线 fps，开启DLSS 3性能模式后能提高到172 fps，大概是原生的2.3倍。

延迟方面，由于RTX 40系自带光流加速器，通过DLSS 3的光学多帧生成实现了更高的帧率，并通过Reflex大大降低了延迟，所以我们可以看

此外，在RTX 40系列发布之后，众多DLSS 3游戏也陆续到来。当11月15日GeForce RTX 4080发布时，已有10款DLSS 3游戏发布，包括《瘟疫传说：安魂曲》、《光明记忆：无限》、《毁灭全人类2：重新探测》、《暗影火炬城》、《F1 2022》、《逆水寒》、《生死轮回》、《漫威蜘蛛侠：重制版》、《微软模拟飞行》和《超级人类》。此外《WRC Generations》、《极品飞车:不羁》和《战锤40K：暗潮》在RTX 4080推出后不久就会发布，圣诞节前玩家就可畅玩这些DLSS 3游戏。

SPEC包含了大量的工业软件测试项目，在最新的2020V3.1版本中，RTX 4080相对于RTX 3080 Ti的提升还是显而易见的。其中Energy能源测试集的提升最大，是RTX 3080 Ti的2.1倍。其实RTX 4080的表现甚至比RTX 3090 Ti还好。

RTX 4080在V-Ray中的表现也还可以，无论是使用RTX还是CUDA相对于RTX 3080 Ti都能实现50%的渲染效率提升。而OC渲染器中的性能提升则高达35%以上。

视频剪辑方面，从PR2022来看，RTX 4080依旧要强过RTX 3080Ti的，这还是在PR不支持双编码器的情况下。

至于达芬奇的话，做MagicMask魔法遮罩的效率提升也很明显，RTX 3080 Ti需要31秒完成的工作RTX 4080只要20秒就可以搞定。

至于新的AV1编码，我们简单看看达芬奇的输出效率，RTX 4080和RTX 4090在输出时间上的区别非常小，但是双编码器相对RTX 3080 Ti来说确实做到了成倍的效率提升。

此外，如果不考虑显存容量线的单卡生产力性能甚至比RTX 3090 Ti还好一点。

总而言之，RTX 4080能够说是RTX 4090之下最强的消费级生产力GPU，3D渲染方面的综合性能超越RTX 3080 Ti接近50%，视频编码性能更是成倍的提升，再考虑到CUDA与NVIDIA STUDIO生态圈在业界无可匹敌的地位，RTX 4080确实很值得设计师用户选择。

温度方面其实绝对没什么可担心的，毕竟RTX 4080 FE采用了和RTX 4090 FE一样大的散热器，既然这套散热器搞定RTX 4090都没问题，那应付TGP 320W的RTX 4080就更没问题了。

说到功耗，这里就必须多说几句了，从RTX 4090发布到现在RTX 4080上市，很多玩家可能看到这一代的旗舰和次旗舰的标称TGP功耗都不算低。对于TGP功耗而言，其实它是GPU运行在Boost状态下的上限限制，用更容易理解的话来说，它其实是功耗墙上限。而作为功耗上限，并不是指GPU在日常使用和游戏中必须会达到的功耗。

由于采用了新的TSMC 4N NVIDIA定制工艺，使得RTX 40系列GPU有着更好的能耗比，在实现相同甚至更高的性能时，功耗更低。

而在上一代Ampere架构的GPU上，通常就需要跑到极限功耗才能完成最高性能释放。从而造成了为什么RTX 40系列GPU总是跑不满功耗的错觉，实际上这是因为能耗比提升，无需更高功耗。

我们使用NVIDIA FramView工具监测了一些RTX 4080 FE在一些游戏4K分辨率下的功耗表现，能够正常的看到在这些游戏中的平均功耗都未达到320W的TGP功耗。但是作为对比的上代对位的RTX 3080 Ti，几乎都是顶着350W的上限在跑。

如果我们简单计算一下，以《微软模拟飞行2020》（原生4K最高画质下）为例，在该游戏中RTX 4080的帧速是RTX 3080 Ti的1.32倍左右，但功耗只有后者的73%。这样做才能够计算出在该游戏中RTX 4080的能耗比达到了RTX 3080 Ti的1.7倍以上，能够说是表现很出色了。

作为测试传统，我们同样也跑了一下3DMark Speedway的循环考机，并使用NVIDIA FramView工具监测功耗，能够正常的看到，在该测试中，RTX 4080 FE的功耗为308W，GPU最高温度也只有60℃，节点温度也就70℃，GPU最高频率跑到了2820MHz。新的TSMC 4N NVIDIA 定制工艺带来的能效比提升确实是相当可观的。

NVIDIA Ada Lovelace GPU架构为RTX 40系列带来了革命性的进步，除了从TSMC 4N NVIDIA定制工艺获得的超大芯片规模与高频率增益之外，第三代RT Cores和第四代Tensor Cores也大显神威，特别是全新加入的光流加速器，让DLSS 3技术的光学多帧生成得以实现，从而大幅度的增加了游戏帧率并降低了延迟。

RTX 4080作为RTX 40系列的次旗舰，从实测来看在DLSS的加持下也能让主流游戏以4K极致光追设定高帧率流畅运行，在支持DLSS 3的游戏中帧率提升更是惊人，算得上是发烧级玩家的甜品级旗舰。

此外，从前面的生产力测试也能够正常的看到，具备16GB大显存的RTX 4080在3D渲染输出与视频剪辑方面相对RTX 3080 Ti也有巨幅的性能增幅，特别是视频编码性能甚至做到了翻倍，对生产力应用来讲也可以可以称为很实用的高效工具。

在性能大幅度的提高的同时，RTX 4080的能耗比表现同样非常不错的。大部分游戏中的实际功耗都在300W以下，在提供高性能的同时，也能更好的缓解玩家的功耗焦虑。

因此，对于追求发烧级游戏体验的玩家和追求高效率的设计师用户来讲，RTX 4080绝对算得上是当前的“甜品旗舰”选择。而GeForce RTX 4080 Founders Edition作为来自NVIDIA原厂的信仰级游戏神器，不但能提供4K光追游戏极致体验和出色的生产力性能，还拥有极高的收藏价值，很值得N饭第一时间入手！

苹果发布watchOS 11.0.1更新对设备的潜在问题进行了两大修复

售价提升50%！Intel 128核至强6980P创下17800美元价格记录

闪送成功登陆纳斯达克，开盘涨超23%，中国最大的独立按需专送快递服务商

《编码物候》展览开幕北京时代美术馆以科学艺术解读数字与生物交织的宇宙节律

上一篇:卫生间排气扇原理

下一篇:特朗普改口称“不确定能否完毕俄乌抵触”美媒：与他的竞选许诺构成鲜明对比

新闻中心

大唐海口天然气发电项目1号机组并网发电【48812】我国首台集装箱式燃机发电机组研发成功经过检验【48812】水发胜动集团尼日利亚项目第一批6台1000kW集装箱式天然气发电机【48812】国内天然气发电单机容量最大机组投产每年削减55%二氧化碳排放量大唐海口天然气发电项目1号机组并网发电一次成功【48812】外贸无界2022年烟台跨境电子商务烟台跨境电子商务外贸企业事例订单状况之轴流风机【48812】“驭电逐光”！同济全新DRe23来袭逾越未来！【48812】山东黄金集团2024年（山东黄金集团）有限公司烟台区域矿用轴流风机（七）收购项目投标