新闻  |   论坛  |   博客  |   在线研讨会
卡住万元显卡天花板!RTX 4080首发体验:4K游戏帧数飙升,温控亮了
芯东西 | 2022-11-16 20:21:48    阅读:307   发布文章

英伟达试图用AI技术让4K游戏“大众化”。

编译 |  云鹏
编辑 |  心缘
芯东西11月15日晚间消息,刚刚,英伟达新一代RTX 40系显卡的次旗舰GeForce RTX 4080显卡正式解禁,并将于明天开售,国行售价为9499元。

图片

英伟达这样的定价也比较明确了,RTX 4080的对标对象就是发售价为8999元的上代RTX 30系显卡RTX 3080Ti。

图片

此前在10月的RTX 40系显卡的发布会上,英伟达曾分别推出了两种规格的RTX 4080显卡,其配置和定价存在一定争议。后来英伟达取消了RTX 4080 12GB版本的发布,后续大概率会重新调整产品命名。相比售价12999元的旗舰显卡RTX 4090,RTX 4080的玩家受众群体会更加广泛,并且新一代Ada架构的核心升级、DLSS 3等关键游戏特性以及对于AV1编解码的支持在RTX 4080上均有体现。

图片

值得注意的是,就在本月初,另一家芯片巨头AMD也秀出了旗舰显卡新品RX 7000系列,其中RX 7900 XTX 7999元的定价、官称70%的4K性能提升,势必会令其成为RTX 4080的有力竞争对手。这次英伟达给RTX 4080的定位是“最高画质畅玩4K游戏”,要知道,哪怕是上代发售价11999元的卡皇RTX 3090都无法在4K最高画质下以高帧率运行大部分4K 3A大作。如果英伟达所言属实,那么RTX 4080的确可以说在“性价比”上大幅提升了。芯东西也作为少数业内媒体,提前拿到了RTX 4080公版并进行了几天的深度测试体验。先说结论,RTX 4080在游戏、生产力场景中相比RTX 3080Ti最高都有着翻倍式的提升,而且功耗更低、能效比更高。

接下来,芯东西将带你详细了解RTX 4080的新特性,以及其在游戏、生产力两个核心方面的提升情况。在当前消费电子遇冷、芯片行业承压的大背景下,英伟达、AMD接连抛出重磅旗舰显卡,而两者的新品能否在逆势下得到市场认可,给业务注入增长动力,其实际性能表现将至关重要。
01.“体型”看齐4090老大哥温度表现值得期待


在具体了解特性前,我们不妨先来看一下RTX 4080的外观。其实此前英伟达的公版显卡在国内市场并不方便购买,但这次国内电商平台京东会售卖国行版RTX 40系公版显卡,国内消费者终于有机会接触到公版显卡,因此我们也才有谈论公版显卡外观的必要。这次RTX 4080的外观设计基本与RTX 4090老大哥保持一致,甚至在散热模具的尺寸上都基本相同,这样的散热模具,也能够充分保证RTX 4080的散热效果,这一点在后文的测试中我们会进一步聊到。

图片

RTX 4080这次的厚度还是标准的三槽位,电源供电接口采用了16pin供电,包装内附赠了16pin转三个8pin的供电转接线。当然,公版显卡的长度并没有显著增加,实际放在中等甚至较小尺寸的ATX机箱中都可以很好兼容。

图片

▲RTX 4080背部接口及整体厚度情况

图片

▲RTX 4080装在中尺寸ATX机箱中

不过根据现有信息,非公版的RTX 4080长度和厚度仍然都有比较明显增加,玩家在选择时需要提前看好尺寸。值得一提的是,此前RTX 4090的散热能力已经有些“富裕”,游戏温度经常在60度左右,这次RTX 4080散热规格基本相同,功耗更低,其温度表现更加令人期待。

图片

▲RTX 4080(下)与RTX 3080Ti(上)的厚度对比

整体来说,英伟达RTX 40系列家族式的硬朗、科技感十足的设计和配色,一直令其相较一众非公版显卡更加“不俗”。不知道这次京东的供货情况如何,如果货量稳定,必然会成为不少玩家的首选。
02.Ada架构秀各种“黑科技”CUDA核心配置留有“余地”


接下来,我们深入RTX 4080的内部,这次在架构的升级方面,RTX 40系显卡还是有不少亮点值得一提。当然,大部分新特性,我们在RTX 4090上就已经看到了,并不陌生了,而且RTX 4080基本上继承了老大哥RTX 4090的全部优势项目。

图片

▲RTX 4080支持的部分新特性一览

比如我们熟悉的台积电定制版4nm工艺、SER着色器执行重排序技术、第三代光追核心、DLSS 3“帧生成”功能以及当下在生产力视频渲染领域大火的AV1编解码支持。不论是SER还是Ada光流加速器等新技术,如果用比较通俗的话来讲,就是让这些核心在处理跟以前相同的任务时,变得效率更高。同样时间内,“以前搬一块砖,现在能搬三块了”。根据英伟达官方数据,SER能够让游戏在光线追踪下的性能提升3倍,而Ada光流加速器则可以带来DLSS方面2倍的性能提升。

图片

此外,芯片工艺制程的进步一直是推动芯片能效比提升的核心驱动力之一,这次的RTX 40系列也深受台积电4nm工艺优势的赋能。在核心配置方面,RTX 4080上配备了9728个CUDA核心,相比RTX 4090的16384个,减少幅度还是略大的,可以预见,在RTX 4080和RTX 4090之间,很可能还会有类似“RTX 4080Ti”这样的新型号。

图片

毕竟,老黄的“刀法”,已经十分娴熟。
03.4K游戏帧数暴涨90%DLSS 3兼顾性能和延迟


俗话说,是骡子是马,还要拉出来溜溜。作为顶级显卡,能不能真的像英伟达所说,4K最高画质玩游戏,是此次体验RTX 4080的过程中我最为关注的一点。其实目前大部分主流网游对于配置的要求并不高,比如《英雄联盟》和《CS:GO》这样的游戏,都可以轻松跑到4K 360帧以上,而一些稍微吃一点配置的电竞类网游,比如《PUBG》、《永劫无间》、《守望先锋2》,则很少会有玩家用4K显示器来玩。对于大部分射击类电竞网游,为了流畅度,绝大部分玩家会选择1080P或者2K分辨率显示器。这次我的目标是要看RTX 4080在4K分辨率下的表现,因此我们的重点就放在了单机大作上面,包括一些刚上市的3A单机游戏。

图片

▲部分参测游戏

在这些测试中,我们并没有特别关注传统光栅渲染性能,也就是关闭DLSS后的帧数,这里有必要说明一下。实际上,目前英伟达DLSS技术经过多轮迭代,如今在最新版本中,画质的损失已经基本可以忽略不计,开启DLSS功能基本上已经等于“获得免费性能提升”,而且这种提升往往是翻倍式的,因此普通玩家没有不开启的理由。最主要的是,得益于英伟达的强大的生态号召力,如今几乎所有新发售的主流PC游戏均已支持DLSS技术,尤其是近年来的国产单机游戏,对于DLSS技术的支持都十分积极,比如《暗影火炬城》、《光明记忆:无限》、《生死轮回》等游戏甚至已经支持了最新的DLSS 3。

图片

到11月15日,已经有十余款游戏支持了DLSS 3,而首批宣布支持DLSS 3的游戏已经超过了35款,生态推进速度十分可观。可以说,DLSS不仅好用,而且是一个绝大部分用户都可以用到,在游戏中真正用起来的功能,而不支持DLSS的游戏,往往本身帧数已经很高了,例如一些电竞网游。因此我们这次的测试均在开启DLSS的模式下进行,RTX 4080可以开启最新的DLSS 3,而作为对比的RTX 3080Ti则开启DLSS 2,具体DLSS 2的版本根据游戏可能会有所不同。不过为了满足大家的好奇,在测试DLSS游戏前,我还是先跑了一下传统的3DMark测试软件中的Time Spy Extreme测试,这个项目测试的是显卡在4K下的传统光栅渲染性能,根据最终成绩,RTX 4080大约领先RTX 3080Ti 41%左右。

图片

▲3DMark TSE测试,左:RTX 4080,右:RTX 3080Ti

回到DLSS游戏表现,最新的DLSS 3是我此次体验的重点,核心就是要看,帧数提升幅度有多少,而画面是否会因为帧是“生成”的而有劣化现象,或者不真实的效果出现。提到DLSS 3,《赛博朋克2077》基本上属于PC端的“原神”,是每个显卡的传统必测项目,在这个游戏中,RTX 4080的提升幅度超过了90%,接近翻倍。

图片

▲开启DLSS后帧数对比

游戏帧数直接从RTX 3080Ti的60帧“可玩”水平,变成了RTX 4080的115帧“电竞”水平。在游戏内的流畅度提升感知是非常明显的,这种感觉就像从60Hz的手机换到120Hz手机时带来的流畅度提升。并且值得注意的是,在仔细对比开启DLSS 3和普通DLSS 2两种模式下画面时,我并没有发现明显不同,或者更准确的说,如果盲测,我是完全分辨不出来两者之间的差别的。

图片

▲《赛博朋克2077》,左:DLSS 3,右:DLSS 2

图片

▲《赛博朋克2077》,左:DLSS 3,右:DLSS 2

可以说,DLSS 3在带来大幅帧数提升的基础上,并没有牺牲画质。在3DMark软件中针对性的DLSS性能测试中,RTX 4080相比RTX 3080Ti的提升幅度超过了80%,这一成绩也可作为DLSS 3在游戏中能够带来的平均帧数提升的参考值。

图片

▲3D Mark DLSS测试

还有一点是不少人都关心的延迟问题,因为画面中的帧是“生成”的,因此会不会有更大延迟呢?实际上,DLSS 3功能开启后,系统中我们还可以开启英伟达独有的Reflex延迟优化功能,而DLSS 3与Reflex功能是深度绑定的,在游戏中只要开启DLSS 3,就会自动打开Reflex功能。在实际游戏过程中,DLSS 3+Reflex模式下,游戏的延迟甚至比普通关闭Reflex模式下的延迟更低。也就是说,DLSS 3配合Reflex功能,实现了帧数提升和延迟降低的兼顾。

图片

▲几款测试游戏中开关Reflex延迟(毫秒)对比

可以说是“鱼和熊掌兼得”,这一点还是比较令我惊喜的。

图片

▲3DMark DLSS测试画面对比,左:DLSS 3,右:DLSS 2

图片

▲《瘟疫传说:安魂曲》DLSS画面对比,左:DLSS 3,右:DLSS 2

值得一提的是,在《暗影火炬城》游戏中,DLSS 3画面给人的第一观感反而更“纯净”,相比之下DLSS 2画面噪点更多,部分物体边缘“毛刺感”稍明显。

图片

▲《暗影火炬城》DLSS画面对比,左:DLSS 3,右:DLSS 2

回到游戏帧数的提升,在最新的3A大作《瘟疫传说:安魂曲》中,RTX 4080的提升幅度也来到了76%,提升幅度比较明显。

图片

▲《瘟疫传说:安魂曲》游戏画面

另外,在《幻塔》、《生死轮回》、《光明记忆:无限》等几款单机游戏中,RTX 4080的帧数提升幅度在40%-60%左右。在测试游戏中,《毁灭全人类2》和《暗影火炬城》提升幅度分别为26%和28%。

图片

▲均开启DLSS功能

虽然提升幅度没有其他游戏大,但实际上,这两款游戏的实际游戏帧数已经达到了170帧、180帧左右,已经可以完全满足主流4K 144显示器“满帧”运行。另外值得一提的是,除了游戏平均帧数的提升,在1%最低帧方面,RTX 4080的提升更加明显,比如在《赛博朋克2077》中,1%最低帧从RTX 3080Ti的48帧直接提升到了99帧,翻了一倍还多。这样的翻倍式1%最低帧提升,在《瘟疫传说:安魂曲》、《光明记忆:无限》、《幻塔》、《生死轮回》等游戏中均有体现。

图片

其实在实际游戏中,1%最低帧是非常影响游戏体验的,偶发性的帧数降低,反映在实际游戏中就是突发的“卡顿”。在这次的实际游戏体验中,最直观的一个感受就是,RTX 4080发生偶发性卡顿的次数要远远少于RTX 3080Ti。比如《幻塔》这款游戏,其首发在手机、平板端,近期适配PC,优化时间较短,并且PC端支持光追等特效,画面效果较为绚丽,因此对PC硬件性能也有不低的需求,在这类游戏中,RTX 4080的偶发性卡顿要明显少于RTX 3080Ti。

图片

▲《幻塔》

RTX 4080的游戏流畅度体验要明显优于RTX 3080Ti,提升还是比较明显的,这种平均帧与1%最低帧的同步大幅提升,可以真正给游戏体验带来“质变”,这一点是RTX 4080在游戏方面最有价值的提升之一。

图片

▲RTX 4080在4K最高画质开启DLSS 3后的游戏帧数表现

综合来看,英伟达RTX 4080的确兑现了“最高画质畅玩4K游戏”的承诺,几款游戏的平均帧都来到了155左右,可以完全“跑满”4K 144Hz高端电竞显示器,即使是最低帧也来到了平均114帧左右。说实话,这样的性能提升幅度,我们只有在RTX 4090和RTX 3090Ti的对比中看到过。
04.视频渲染效率翻倍,支持最新AV1编解码


聊完了核心的游戏场景,生产力场景也是不能少的,毕竟,RTX 4080、RTX 4090这种旗舰、次旗舰级别的显卡都配备了大容量显存,这对于视频渲染等场景来说都是不可或缺的。这次在RTX 40系显卡上,英伟达也加入了最新的AV1编解码支持,简单理解,AV1编解码已经逐渐应用于各大主流视频平台,最直观的效果就是用更少的数据量传输更高质量的视频,因此支持这一技术的意义不言而喻。我也重点测试了AV1和H.265两种编解码的视频导出渲染。在实际测试中,同样导出一段大小12GB、时长2分钟的4K 30帧视频,在H.265格式下,RTX 4080的用时为15分钟,而RTX 3080Ti用时则为34分钟,提升幅度达到一倍以上。

图片

而同样一段视频,RTX 4080在AV1格式下的导出时间仅为14秒,速度同样很快。

图片

▲达芬奇视频AV1编解码导出渲染测试

当视频分辨率来到8K时,同样一段视频,H.265格式下RTX 3080Ti的导出时间为126秒,而RTX 4080仅有54秒,提升幅度依然保持在一倍以上。可以说,针对核心的生产力场景,RTX 4080的发挥空间很大,尤其是在视频渲染等场景中,对于效率的提升是非常明显的。
05.能效比成“杀手锏”,功耗温度控制亮眼


整体看下来,RTX 4080在游戏和生产力场景中的表现都令人惊喜,那么现在问题来了,这样的性能提升,需要有什么牺牲呢?是功耗还是温度?要知道,如今谈及芯片,大家最关心的三个字莫过于“能效比”,只要功耗高,性能再强都会显得“黯然失色”。不过RTX 4080这次着实没有令人失望。在游戏实际测试中,RTX 4080的平均功耗仅有260W左右,甚至没有一款游戏会达到300W功耗。但相比之下,跑同样的几款游戏,RTX 3080Ti的功耗却在340W左右。

图片

▲游戏功耗数据,单位:瓦

也就是说,在性能提升一半以上的同时,RTX 4080的功耗还平均下降了四分之一左右,能效比提升十分明显。即使在3DMark的Time Spy Extreme循环压力测试中,显卡在100%占用的满载状态下,也仅出现了313W左右的功耗。

图片

▲3DMark Time Spy Extreme循环压力测试功耗表现

在GPU-Z中我们可以看到,RTX 4080公版的默认功耗为320W,功耗最大值仅为355W,与RTX 3080Ti默认功耗350W基本相同。

图片

▲GPU-Z默认功耗对比

在功耗如此低的基础上,显卡温度自然也控制的比较优秀,在游戏测试的全过程中,RTX 4080几乎都在60度以下,大部分游戏的温度都在55到57度左右,显卡外壳即使用手触摸都只能感觉到“温热”。

图片

▲游戏温度表现,单位:摄氏度

相比之下,RTX 3080Ti的温度则基本在70度以上,大多在72到75度左右浮动,温度也不算高,但相比RTX 4080出色的能效比、高规格散热模块所带来的温度表现,还是要逊色不少。可以说,RTX 4080的温度表现令人惊喜。最后来到超频环节,其实目前旗舰级显卡的性能基本上已经在出厂时就已经被厂商调整至能效比最优的状态,因此超频的空间并不大,而超频很可能带来功耗和温度的大幅上涨,但游戏帧数却提升有限,有些得不偿失。因此我这次只模拟了普通玩家进行入门级简单超频,在Afterburner软件中,我将显卡功耗和温度拉满,将频率拉高了50MHz,显存频率拉高了100MHz。

图片

▲Afterburner调整值

这样一番最基础的调整后,显卡在3DMark的Time Spy Extreme测试中的成绩从13838分提升至14146分,提升2%左右。不过值得注意的是,显卡在小幅超频后,温度几乎没有明显提升。

图片

▲小幅超频后RTX 4080的TSE测试成绩

可以想象,在看齐RTX 4090的旗舰级散热规格、更低的功耗基础上,RTX 4080应该有一定的超频空间,对于喜欢折腾的玩家,应该还会有更多可玩性。
06.结语:英伟达用AI让4K游戏“大众化”


综合看下来,RTX 4080在相比同价位段RTX 3080Ti性能翻倍的基础上,价格却几乎相同,能效比更为出色,同时对最新Ada架构的众多新特性都予以支持,可以说,这款次旗舰显卡,几乎已经实现了4K游戏的“通吃”。而在这样的游戏体验背后,基于AI的DLSS 3功能是关键技术,AI的融入,让游戏显卡开始有能力主动“生成”游戏画面帧,仿佛让显卡拥有了“思考”的能力,这一点难能可贵,也不由得令我们感叹AI技术对各领域赋能的潜力之高。正如英伟达CEO黄仁勋所说,英伟达是一家人工智能公司,此言非虚。另一边,AMD在两周前发布了RX 7000系列显卡,旗舰款RX 7900 XTX 7999元的定价,显然会使其成为RTX 4080强有力的竞争对手,届时“红绿”两队的较量会有怎样的结果,也必然成为业内关注的焦点。但无论如何,在消费电子市场遇冷的大背景下,PC销量下滑,英伟达必然将会面临不小的挑战,RTX 40系列能否对游戏业务起到很好的提振作用,还有待市场检验。


*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。

参与讨论
登录后参与讨论
推荐文章
最近访客