显卡市场近一年可谓跌宕起伏,玩家经历了最初发布时的狂喜,受矿潮影响又经历了天价显卡和全球无货的局面。不过好在NVIDIA官方及时出面,除GeForce RTX 3090外,已经推出及后续要推出的显卡将全部限制哈希率,也就是以太坊算力,来限制疯狂的挖矿行为。今天给大家带来的是时隔半年推出的又一款旗舰级显卡——iGame GeForce RTX 3080 Ti Vulcan OC。
七彩虹iGame GeForce RTX 3080 Ti Vulcan OC
电商报价¥13999
在这里先说明一下,此次评测的iGame GeForce RTX 3080 Ti Vulcan OC在包装上不会有任何限制算力的标注,“Lite Hash Rate”或者“LHR”的说明只针对已经发售的显卡,后续为了方便区分才会在包装上进行标注。
iGame GeForce RTX 3080 Ti Vulcan OC
对于目前挖矿热潮,不光NVIDIA大力出手,政府也开始重点监管,在5月25日“挖矿重灾区”内蒙古已经颁布了八项措施严厉打击挖矿,相关文章可以翻看我们之前的消息,这里不过多讲解了:内蒙古八大措施禁止挖矿 警惕矿卡回流。另外我们也有相关文章来教大家如何简单鉴别矿卡:矿难来临时矿卡能买么? 警惕妹子自用显卡。
iGame GeForce RTX 3080 Ti Vulcan OC
下面我们回到本次评测的iGame GeForce RTX 3080 Ti Vulcan OC显卡,Vulcan(火神)系列是iGame家族的旗舰产品,在做工用料以及性能上,都能表现出其高端定位,在测试开始前,笔者先将这款显卡的特点列出方便大家阅读:
超强性能 性能测试优于公版GeForce RTX 3090
显示效果出色地LCD侧显示屏
一键超频按钮方便快捷
赛博朋克风格外甲设计
总的来说,iGame GeForce RTX 3080 Ti Vulcan OC这款显卡在公版的基础上性能有很大提升,甚至超越了公版GeForce RTX 3090,不过售价却更便宜。关于这款卡的定位,通过6月1日的发布会我们也能清楚了解到,就是旗舰游戏卡。相比GeForce RTX 3090最大的差别就是少了12GB显存,不过对于游戏来说12GB显存在4K分辨率下也已经足够。如果你是游戏发烧友,在6月3日的显卡发售日,不妨试试手气。
01 旗舰核心GA102
下面我们先来看看在架构上有哪些改动,官方白皮书上对比的对象为GeForce RTX 2080 Ti,相较于上一代的NVIDIA Turing架构,NVIDIA Ampere架构下的GeForce RTX 3080 Ti每个时钟执行2次着色器运算,而Turing为1次,GeForce RTX 3080 Ti的着色器性能达到34 TFLOPS单精度性能,而Turing为14 TFLOPS。
第一代NVIDIA RTX架构 Turing下的RTX 2080 Ti
第二代NVIDIA RTX架构 Ampere下的RTX 3080 Ti
NVIDIA Ampere架构翻倍了光线与三角形的相交吞吐量,RT Core达到67 RT TFLOPS,而Turing为43 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。
第三代Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达273 Tensor TFLOPS,而Turing为114 Tensor TFLOPS。
GeForce RTX 3080 Ti仍然采用了GA102核心,与GeForce RTX 3080/3090相同,下面我们来看一看GeForce RTX 3080 Ti在GA102中做了哪些改动。
完整的GA102核心
完整的GA102 GPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器)组成,而GeForce RTX 3080 Ti的CUDA数量是10240个,所以可以推断GeForce RTX 3080 Ti屏蔽了两组TPC,所以只有80个SM单元,而完整GA102核心的CUDA数量应该是10752个。
为了查询方便,笔者将这几款显卡的核心参数列出,可以看到GeForce RTX 3080 Ti与GeForce RTX 3090的核心参数非常接近。相差的两个SM单元,也就是1组TPC,256个CUDA,其实在实际应用中来讲差距并不是很大,最大差别是GeForce RTX 3090相比GeForce RTX 3080 Ti多了12GB的显存;而相比RTX 3080来说提升就非常大了。
关于这张卡的定位,更多的还是旗舰游戏,它从参数来看相比GeForce RTX 3080提升很多,非常接近GeForce RTX 3090,仅是显存相差12GB,而大显存对于软件渲染来说又是至关重要的,正如GeForce RTX 3090在发布之初的定位,就是专注于内容创作者。
渲染8K素材占用了17GB显存(点击查看大图)
如图我们使用Keyshot9做测试,渲染8K或4K素材的显存占用率非常高,能达到17GB甚至更高,这对于只有12GB显存的RTX 3080 Ti就完全不够了,爆显存的危害想必大家也知道,可以导致游戏或软件崩溃,从而进程丢失。
02 NVIDIA Ampere架构GA102解析
GeForce RTX 3080 Ti采用了GA102核心,拥有280亿(28000 million)个晶体管,628平方毫米的面积,基于三星的8nm NVIDIA定制工艺,来自Micron的GDDR6X显存。
本次NVIDIA Ampere架构的SM在Turing架构基础上增加了一倍的FP32运算单元,这使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。
而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。
GeForce RTX 3080 Ti共有10240个CUDA,其实它有5120个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了10240的CUDA数量。
而这样粗暴的提升CUDA数量对于游戏其实有着非常大的帮助,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。
在去年与GeForce RTX 30系显卡一同发布的还有一项新技术——RTX IO。目前很多游戏动辄几十G甚至百G的安装空间,对于存储空间的负担暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,需要先由CPU从硬盘中读取压缩过的数据,经过解压缩再发送到显存中。
虽然随着NVMe SSD的推出,读取速度相较机械硬盘能够快20倍,但受制于传统I/O限制,NVMe高达7GB/秒的高速读写对于CPU是极大的负担。
传统的数据交换
在这个过程中,会占用多个CPU核心,压力急剧增大,占用较多的内存,而此时其实GPU是处于闲置状态的。RTX IO的作用就是越过CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经过压缩的数据,并且完成无损GPU解压,降低CPU占用,变向提升了性能。
RTX IO可以极大解放CPU负担
当然这项技术作为系统底层的运行方式改变,还需要借助微软发布的DirectStorage来实现,对于目前容量的游戏来说,RTX IO的改善效果有限,但假以时日等游戏容量上百G成为常态的时候,这项技术将会发挥巨大的功效。
同时搭配新增的HDMI 2.1接口,可以支持单线8K的视频输出,而上一代HDMI 2.0仅支持4K 98Hz的视频输出,如果想要连接8K电视,则需要更多的线缆支持。
03 iGame GeForce RTX 3080 Ti Vulcan OC外观
在GeForce RTX 30系列中,iGame的Vulcan系列将外甲重新设计,原本GeForce RTX 20系的甲胄式设计,改变为赛博朋克风格的科技感设计。“赛博朋克”这个词近年来出现频率极高,不止因为《赛博朋克2077》这款游戏,整个赛博朋克文化也正在愈演愈烈。
典型的赛博朋克风格
所以,究竟什么是“赛博朋克”?它是一种世界观,还是美学?我们经常听过那么一句话“遇事不决 量子力学;不懂配色 赛博朋克”,这个词给人更多的似乎在传达一种画面感。
其实赛博朋克是两个词语的结合,“赛博”和“朋克”,赛博(Cyber)即计算机网络或控制论,朋克(Punk)则是一种非主流反叛的亚文化,后来指那些叛逆的另类青年,跟主流社会格格不入。
《攻壳机动队》的设定也是赛博朋克世界
在赛博朋克的世界中,一切都受到高度控制,所有东西都自动化运作,富人、社会名流、精英享受着美好生活;底层的大量贫民生活条件恶劣,没钱消费,没办法把握自己的命运,内心苦闷,不知出路何在,非常迷茫,行为和价值观完全是叛逆的。精神萎靡,沉迷于各种娱乐,寻求麻醉和逃避。可以说自诞生起,赛博朋克就有着天然的反资本主义气息。
《银翼杀手2049》
“高科技、地生活”可以很好地概括赛博朋克世界中的人们,如表现赛博朋克的一部经典电影《银翼杀手2049》,在影片中经常伴随着雨雪交加。霓虹闪烁的夜空下,潮湿的路面变成了反光源,衬托出都市畸形的繁华,整个城市充满故障和错位感。
特斯拉充满未来感的皮卡
此前特斯拉发布的一款皮卡就非常具有赛博朋克未来感,硬朗的线条,冰冷的金属配色,充分体现了机械亦有灵的理念。而iGame GeForce RTX 3080 Ti Vulcan OC的外甲也借鉴了特斯拉皮卡的设计,暗冷色调搭配内敛的LED灯,给人十足的赛博朋克风格。
iGame GeForce RTX 3080 Ti Vulcan OC
说回今天显卡的主题,iGame GeForce RTX 3080 Ti Vulcan OC在外甲设计部分已经讲了很多,另外在显卡导流罩边缘部分也增加了科技感纹理,整体棱角分明,在光线经过产品表面时会有明显的明暗变化,科技感十足。
iGame GeForce RTX 3080 Ti Vulcan OC
并且由于这款显卡更是定位旗舰游戏,在散热方面也更加下功夫,三个主动散热风扇均采用了13叶边缘折角的“捕风手”风扇,可将气旋压入散热器内实现风压及进风量的进一步提升。
另外一个细节就是,iGame GeForce RTX 3080 Ti Vulcan OC三个风扇中央的logo牌均采用双层处理,上面的一层可手动旋转角度,不会随着风扇启动而旋转。
iGame GeForce RTX 3080 Ti Vulcan OC背板展示
iGame GeForce RTX 3080 Ti Vulcan OC的金属背板从远处看非常具有视觉冲击力,“三角形”的视觉符号从嵌入的LED灯呈放射状发散开,立体感十足。
iGame GeForce RTX 3080 Ti Vulcan OC
在显卡侧面,最引人注意的就是全新的LCD侧显示屏——“维”,打开包装后屏幕默认贴合显卡,适合正常装机的用户;另外这个LCD屏还可翻转90°,适合竖装显卡的用户,后面我们会单独结合iGame Center来讲这块屏幕,我们接着往下看。
iGame GeForce RTX 3080 Ti Vulcan OC显卡尾部的接口
在iGame GeForce RTX 3080 Ti Vulcan OC显卡的尾部有两个接口,左侧白色的为主板灯光同步接口,右侧的为LCD侧显示屏上传图片的数据线接口,数据线的另一头需要接在主板上的USB 9针插槽上,注意不要接到开机跳线的9针上,两个针口非常相似。
iGame GeForce RTX 3080 Ti Vulcan OC供电接口
iGame GeForce RTX 3080 Ti Vulcan OC由于定位于游戏旗舰,性能目前仅次于GeForce RTX 3090,在功耗上也比较大,一键超频后能达到370W,所以供电接口采用了8pin*3的设计,玩家在购买前需要注意电源是否支持。
iGame GeForce RTX 3080 Ti Vulcan OC视频输出接口
视频输出接口依旧采用了DP1.4a*3 HDMI 2.1的四接口设计,另外由于新的HDMI 2.1协议,最高已可支持单线8K的视频输出。在接口上方为一键超频按钮,新版的启动之后会有蓝色指示灯,更方便更直观。
04 iGame Center软件及LCD屏
想要玩转iGame GeForce RTX 3080 Ti Vulcan OC一定要下载iGame Center这款官方软件,LCD屏幕的自定义功能及各种数据的显示都要靠它来完成。
首先iGame Center软件的第一栏会显示电脑的基本信息,包括CPU、GPU、内存、网络、风扇等,做到实时监控。
第二栏会详细展示显卡的功能设置,在主页面中可进行手动超频及风扇散热调整。这里注意,如果没有超频经验的用户切勿随意拖动数值,尤其是大部分用户见到这种数值条喜欢直接拉满……
在屏幕设置中,用户可以自定义屏幕显示内容,这里可以实时显示显卡数据、自定义文字以及自定义图案,如果用户想上传图片或GIF,这块屏幕的尺寸为480×128px,可在其他软件截取后上传。
这块LCD侧屏的显示素质非常好,我们将Marbles图片上传后发现几乎和显示器所显示的效果一模一样,但通过相机拍摄始终会有摩尔纹,无法体验到最直观的效果。
如此精美的一块屏幕只显示图片多少有些浪费,笔者上传了一段《暗黑破坏神》手游的GIF图,可以看到显示效果也非常流畅。
软件的第三栏可以自定义调节灯光,具体的种类就不在这里介绍了,除了灯光模式,还支持调节亮度、速度以及流动方向。
最后一栏则是各种硬件的详细参数,这里相较第一栏的硬件整体状态更加细分,包括各个风扇的转速、GPU使用率、显存使用率、显存使用情况等等。
05 3DMARK 理论性能测试
首先介绍一下测试平台,为了保证此次评测能够发挥iGame GeForce RTX 3080 Ti Vulcan OC显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。
在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。
GPU-Z参数
首先看一下GPU-Z的参数,iGame GeForce RTX 3080 Ti Vulcan OC采用GA102核心,三星8nm工艺,芯片面积628平方毫米,拥有10240个CUDA,Boost频率达到1710MHz,相较公版的1665MHz有很大提升。采用12GB GDDR6X显存,位宽为384bit,显存带宽达到了912.4 GB/s,光栅单元和纹理单元为112和320。
下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下(所有测试项均为一键超频后1710MHz测试结果):
3D MARK FS套装测试
在针对显卡DX11性能的3DMARK FS套装测试中,我们选择了上代和本代的4张显卡进行分值对比,以便能更好的反应iGame GeForce RTX 3080 Ti Vulcan OC的性能水平。
在该测试中可以发现显卡性能出现了越级的情况,iGame GeForce RTX 3080 Ti Vulcan OC甚至超越了GeForce RTX 3090的测试分数,这也印证了笔者在公版测试中的观点。
综合超越虽然只有3%,但两款下卡本就不在一个系列上,价格也有一定差距,所以这次发布的Ti型号可以说非常划算了。
3D MARK TS套装测试
而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,iGame GeForce RTX 3080 Ti Vulcan OC的分数与GeForce RTX 3090的分数基本持平。对比GeForce RTX 3080的分数要高出7%左右;对比上一代GeForce RTX 2080 Ti的分数要高出43%左右。
3D MARK 光追测试
PortRoyal是3DMARK中专门针对光追性能的测试项,在这组测试中iGame GeForce RTX 3080 Ti Vulcan OC再次超越GeForce RTX 3090,分数领先2%;对比GeForce RTX 3080的分数提升约为15%;对比上一代GeForce RTX 2080 Ti的分数提升则非常大,约为66%。
06 游戏性能测试
在游戏性能测试中,我们选择了《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:英灵殿》、《无主之地》,国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。
另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。
《刺客信条:英灵殿》游戏测试
尽管在理论测试环节中iGame GeForce RTX 3080 Ti Vulcan OC在各个环节都小幅领先GeForce RTX 3090,但实际游戏中的差距并不明显,但这也可能和游戏本身的优化有关,后面我们再看更多测试。
在《刺客信条:英灵殿》中iGame GeForce RTX 3080 Ti Vulcan OC和GeForce RTX 3090的大部分分数相同,仅有1帧的差距。同时GeForce RTX 3080的分数差距在1080P和2K分辨率下也并不大,主要是4K分辨率会有10%左右的差距。
《德军总部新血脉》游戏测试
《德军总部新血脉》并且由于自带两个benchmark,所以我们的数据取跑分均值,另外这款游戏几乎每更新一次驱动或者游戏版本升级都会导致分数的巨大差异,在本次重新测试中,iGame GeForce RTX 3080 Ti Vulcan OC再次领先GeForce RTX 3090,而相比GeForce RTX 3080的提升约为5%左右。
《孤岛惊魂5》游戏测试
《孤岛惊魂5》同样算是优化比较到位的3A大作,但在benchmark的帧数测试中经常会不稳定,在本次测试中iGame GeForce RTX 3080 Ti Vulcan OC在2K和4K分辨率下要优于GeForce RTX 3090,其中4K分辨率下的成绩要领先GeForce RTX 3080 20%左右。
《无主之地3》游戏测试
《无主之地3》是一款采用了卡通渲染风格的游戏,它对于性能要求的下限很低而上限又很高,另外我们注意到,在本次测试中大部分游戏1080P分辨率的成绩基本没有差距,这也是因为如此高性能的GPU在1080P分辨率下已经绰绰有余,开始受制于CPU的性能。
《光明记忆:无限》游戏测试
《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,目前还没有游戏提供试玩,不过benchmark的跑分软件官方已经提供,玩家可以在steam上自行下载。另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX 最高/DLSS 质量”模式下进行。iGame GeForce RTX 3080 Ti Vulcan OC整体以微弱的优势胜出,但看得出在整体性能趋同的情况下,三款显卡的分数差距并不大。
《边境》游戏测试
在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。
07 功耗及温度测试
功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。
功耗测试(点击查看大图)
iGame GeForce RTX 3080 Ti Vulcan OC经过我们的实测在满载状态下单卡功耗为370W(一键超频后)左右,作为目前整体性能与GeForce RTX 3090相仿的情况下,建议搭配750W及以上电源。
温度方面,本次的iGame GeForce RTX 3080 Ti Vulcan OC经过15分钟左右的拷机,温度稳定为69℃左右,在更高频率的情况下比GeForce RTX 3080 Ti低了6℃左右,并且频率稳定无降频情况。
08 部分游戏光追及DLSS效果展示
上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。
《赛博朋克2077》RTX ON(点击查看大图)
《赛博朋克2077》RTX OFF(点击查看大图)
在《赛博朋克2077》中,光追效果随处可见,而在游戏中也运用到了不同的光追效果,包括最常见的光追反射、阴影,还有环境光遮蔽、漫反射照明以及全局光照等比较高级的效果。
RTX ON(点击图片查看大图)
RTX OFF(点击图片查看大图)
在网游《逆水寒》中,由于光追效果正处于试验阶段,并没有如宣传片一样的水面反射。但画面整体的阴影更加真实,如头顶树木的阴影,以及水面上荷叶的效果。而且由于光追效果较少,在打开该功能后帧数并没有明显下降。
《堡垒之夜》RTX ON(点击查看大图)
《堡垒之夜》RTX OFF(点击查看大图)
堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。
《魔兽世界9.0》RTX ON(点击查看大图)
《魔兽世界9.0》RTX OFF(点击查看大图)
《魔兽世界9.0》同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。
《控制》RTX ON(点击查看大图)
《控制》RTX OFF(点击查看大图)
《控制》这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。
《赛博朋克2077》DLSS模式对比
DLSS的对比测试我们选择《赛博朋克2077》这款游戏,2K/RTX ON/DLSS关闭 原生画质下作为标准,在打开DLSS质量模式后可以看到整体画面几乎没有任何变化,广告牌的字样边缘依然很清晰。在DLSS平衡和DLSS性能模式中依然有着不错的状态,整体相较原生画质并无二致。
《逆水寒》DLSS模式对比
画质说明
在《逆水寒》的DLSS测试中,我们将画面设置为4K分辨率,画质为预设最高。通过关闭、快速、超级性能,3种不同模式来进行帧数以及画面的对比。
首先在关闭DLSS中,游戏帧数为26帧原生画质,打开DLSS快速模式后为41帧,而打开DLSS超级性能模式后为57帧。通过放大图片不难发现原生画质和DLSS快速模式的区别很小,而DLSS超级性能模式中角色背后的装饰会变模糊,以及木条箱的纹理边界会有较明显变化。但帧数提升却非常明显。
09 软硬兼施 铸就Ampere
好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家关注。
NVIDIA Reflex
以往我们关注延迟大多从显示器上了解到几毫秒极速响应,但那只是作为最终端的显示输出效果,你是否想过从系统内部到实际看到的画面有多大延迟?
NVIDIA Reflex
在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技术。
以往如果想测量系统延迟需要高速相机以及定制的LED鼠标电路。而使用带有NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张GeForce RTX系列的显卡即可。
宠物派对直播
这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的工作原理是利用AI算法通过DGX超级计算机深度学习而来。
NVENC编码
同时RTX 30系显卡拥有目前最好的硬件解码器,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%左右,而基于GPU的NVENC解码可以极大地减轻CPU负担。
NVIDIA Studio
对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着连接创作软件和显卡功能的关键。
NVIDIA Studio
NVIDIA Studio驱动经过更新与优化,对于最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用NVIDIA CUDA技术,GPU加速特效可实现更快的实时视频编辑并加速渲染输出,并让原本只能进行软件编码输出的视频轻松得到硬件的支持。另外在AI计算方面的优势,包括自动标记片段、特效追踪和人脸识别等功能,都有显著的速度提升。
以GPU渲染为14.98秒 而CPU渲染为11分钟
当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Blender、D5等专业软件中都有非常亮眼的表现。不仅能提供强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。
10 越级提升 超越GeForce RTX 3090
奇迹,又一个性能奇迹。在同一代显卡越级的情况并不多见,而且还是在两款显卡均在售的情况下。本次iGame GeForce RTX 3080 Ti Vulcan OC在频率提升后频繁超越GeForce RTX 3090,但精明如NVIDIA不会想不到非公版显卡推出后的情况,难道真的是这一刀失手了吗?
iGame GeForce RTX 3080 Ti Vulcan OC
首先外观部分,iGame GeForce RTX 3080 Ti Vulcan OC依旧延续了此前的赛博朋克风格,并且LCD屏幕依旧精致,你甚至可以上传一段精彩的GIF动图来播放。
在性能上,iGame GeForce RTX 3080 Ti Vulcan OC的Boost频率为1710MHz,通过实测我们也看到大部分分数均超越了GeForce RTX 3090,这也印证了笔者在公版首测中的观点,另外我们也有理由怀疑公版GeForce RTX 3080 Ti是否故意压低了频率不让这张卡太出风头。
iGame GeForce RTX 3080 Ti Vulcan OC
关于这张卡的定位,笔者认为GeForce RTX 3080 Ti为游戏旗舰。坦白来说两组SM单元对性能影响并不大,但12GB显存在特定的时候却能发挥大作用。
对于游戏用户来讲24GB确实有些浪费了,而对于生产力工具来说,在4K/8K素材渲染时,往往能占用12GB甚至更多,爆显存对于软件渲染来说是非常致命的,轻则报错无法渲染,重则软件崩溃进程丢失。所以这两款显卡在细分领域来说还是有所区别,GeForce RTX 3080 Ti更注重游戏。
iGame GeForce RTX 3080 Ti Vulcan OC
价格方面,NVIDIA公版的GeForce RTX 3080 Ti已经公布价格为8999元,根据现在显卡的行情来看着实有性价比。不过非公版尚未公布价格,按照Vulcan系列以往的定位预估在1W-1.2W之间。虽然本次的发布的显卡限制了挖矿,但具体出货量尚不清楚,极有可能还是一卡难求,手气好的小伙伴不妨在首发试试运气。
如果问近期什么游戏最火,相信大部分玩家都会说《永劫无间》,这款由网易旗下“24 Entertainment工作室”开发的多人动作竞技游戏在内测期间火遍大江南北,正式推出后也迅速占领各大游戏媒体头条,众多搞笑表情包,如“想想办法振他一刀”应运而生。今天为大家带来的,则是影驰GeForce RTX 3070 Ti 星曜OC 永劫无间版显卡评测。
影驰GeForce RTX 3070 Ti 星曜 OC 永劫无间版
电商报价¥7299¥7299
前不久影驰宣布了与永劫无间达成战略合作关系,成为永劫无间唯一的显卡合作品牌。双方围绕IP授权,在游戏、产品、赛事等开展多方面合作,其中就包括了推出极具游戏感的星曜永劫无间定制版显卡。
该系列显卡进行了深度化的元素定制,得益于星曜系列显卡的纯白底色,使得星曜在图案定制上更为自由,其中显卡正面采用了游戏中“彼岸花”的元素,而背板采用游戏人物“宁红夜”,并且3060/60Ti与3070/70Ti定制版分别采用不同的定制图案,产品外观更为丰富,不同型号之间更具有辨识度。
另外播报一则消息,本次评测的影驰GeForce RTX 3070 Ti 星曜OC 永劫无间版显卡已于9月10号正式发售,同步开启预售和发售的还有影驰RTX 3070 星曜OC 永劫无间版[FG]、影驰RTX 3060 Ti 星曜 OC 永劫无间版[FG]、影驰RTX 3060 星曜MAX OC 永劫无间版[FG],总共四个型号。
影驰(Galaxy)GeForce RTX 3070 Ti 星曜 OC
京东商城
7699元
进入购买
影驰(Galaxy)GeForce RTX 3070 星曜 OC 永劫无间版[FG]
京东商城
7199元
进入购买
另外除京东平台之外,游戏官方专题页也将会开启账号绑定抽取定制显卡必购码活动。
说明:凡购买所有型号永劫无间版定制显卡的玩家,均可凭借SN码前往影驰机友会微信公众号进行注册抽奖,《永劫无间》游戏本体、角色外观、武器皮肤、古币兑换码等海量礼品免费赠送。
关于RTX 3070 Ti想必笔者不用多说,大家早已了解其定位和性能,影驰此次推出的这款永劫无间版星曜,更多则是在于联名与定制。老规矩,在评测开始前,笔者先将这款显卡的特点列出方便大家阅读:
1.永劫无间定制外观
2.图案喷涂细致,还原度高
3.非常具有收藏(理财)价值
总的来说,影驰GeForce RTX 3070 Ti 星曜OC 永劫无间版显卡进行了高度定制,让星曜系列终于发挥出真正的实力了,也让原本纯白色的显卡看起来更丰满。对于喜欢《永劫无间》的玩家来说,倍感亲切。当然,这款显卡除了观赏和实用价值外,还具有更高的收藏价值。性能方面RTX 3070 Ti在2K分辨率下,足以应对目前任何3A游戏。
在核心架构上,GeForce RTX 3070 Ti是采用GA104核心的第二张卡,官方白皮书上对比的对象为GeForce RTX 2070 SUPER,相较于上一代的NVIDIA Turing架构,NVIDIA Ampere架构下的GeForce RTX 3070 Ti每个时钟执行2次着色器运算,而Turing为1次,RTX 3070 Ti的着色器性能达到22 TFLOPS单精度性能,而Turing为9 TFLOPS。
新老两代显卡算力对比
NVIDIA Ampere架构翻倍了光线与三角形的相交吞吐量,RT Core达到42 RT TFLOPS,而Turing为24 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。
第三代Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达174 Tensor TFLOPS,而Turing为72 Tensor TFLOPS。
GeForce RTX 3070 Ti采用了GA104核心,与GeForce RTX 3070相同,不过NVIDIA官方并没有给出GA104核心架构图,我们仍以GA102来做讲解。
完整的GA102核心
完整的GA102 GPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器)组成,而GeForce RTX 3070 Ti的CUDA数量是6144个,共有48个SM单元,也就是3个GPC 24个TPC,而刚刚发布的GeForce RTX 3080 Ti共有40个TPC 80个SM单元,这也是两款芯片的差距所在。
公版显卡参数表
为了查询方便,笔者将这几款显卡的核心参数列出,可以看到GeForce RTX 3070与GeForce RTX 3070 Ti的差距不大,相差的两个SM单元,和GeForce RTX 3080 Ti情况基本相同,也就是1组TPC,256个CUDA。只不过GeForce RTX 3080 Ti更接近GeForce RTX 3090,而根据参数来看GeForce RTX 3070 Ti与GeForce RTX 3080还有一定差距。
GDDR6X
另外GeForce RTX 3070 Ti的显存虽然依旧是8GB,但已经由GDDR6更换为GDDR6X,两者的区别主要在于频率和带宽上,同频下实现更高的显存带宽可以降低成本和功耗,另外在相同时间内GDDR6X可以比GDDR6传输多2倍的数据。这对于需要大量数据负载的工作尤为重要,如光线追踪的游戏、AI学习和8K视频渲染。
首先来看这款显卡的外观,影驰GeForce RTX 3070 Ti 星曜OC 永劫无间版进行了高度定制,《永劫无间》的元素不仅在显卡上有体现,在包装上也非常引人注目。
影驰GeForce RTX 3070 Ti 星曜OC 永劫无间版,以星曜系列的外形为底,导流罩采用了返魂花元素,背板部分则以宁红夜为主题。
影驰GeForce RTX 3070 Ti 星曜OC 永劫无间版显卡的整体尺寸为316×132×53mm(不含挡板)。搭载星卓II散热系统,三个风扇全部采用90mm的11叶静霜扇叶,并搭载智能启停技术。所有风扇均采用三折设计,工作时可有效增加风压,输送更强劲的气流。
影驰GeForce RTX 3070 Ti 星曜OC 永劫无间版显卡TGP为310W,搭载了8 8pin的合金加固供电接口,推荐电源为750W。从侧面可以看到一体式的透明水晶外壳延伸至侧面,形成钻石切割质感。
在背板上,影驰GeForce RTX 3070 Ti 星曜OC 永劫无间版显卡采用一体成型金属背板,背板尾部采用大量蜂窝镂空处理,增加热空气流动性,散热效果更强。整体采用《永劫无间》中宁红夜定制主题,喷涂细腻,发丝清晰可见,还原度非常高。
视频输出接口采用DP1.4a*3 HDMI 2.1*1的四接口设计,另外由于新的HDMI 2.1协议,最高已可支持单线8K的视频输出。
首先介绍一下测试平台,为了保证此次评测能够发挥影驰GeForce RTX 3070 Ti 星曜OC 永劫无间版显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下:
在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。
GPU-Z参数
首先看一下GPU-Z的参数,影驰GeForce RTX 3070 Ti 星曜OC 永劫无间版采用GA104核心,三星8nm工艺,芯片面积392平方毫米,拥有6144个CUDA,1830MHz频率。采用8GB GDDR6X显存,位宽为256bit,显存带宽达到了608.3 GB/s,光栅单元和纹理单元为96和192。
下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
3D MARK FS套装测试
在针对显卡DX11性能的3DMARK FS套装测试中,我们选择了上代和本代的4张显卡进行分值对比,以便能更好的反应参测显卡的性能水平。
可以看到影驰GeForce RTX 3070 Ti 星曜OC 永劫无间版的性能更接近GeForce RTX 3070,对比提升8%左右;对比GeForce RTX 3080的差距为18%左右;相比上一代的GeForce RTX 2070 SUPER提升44%左右。
3D MARK TS套装测试
而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,影驰GeForce RTX 3070 Ti 星曜OC 永劫无间版的分数相比GeForce RTX 3070提升8%左右。而对比GeForce RTX 3080的分数差距为21%左右;对比上一代GeForce RTX 2070 SUPER的分数要高出51%左右。
3D MARK 光追测试
PortRoyal是3DMARK中专门针对光追性能的测试项,在这组测试中影驰GeForce RTX 3070 Ti 星曜OC 永劫无间版的表现更贴近GeForce RTX 3070,分数提升为7%左右;对比GeForce RTX 3080的分数差距为29%左右;对比上一代GeForce RTX 2070 SUPER的分数提升则非常大,约为53%。
在游戏性能测试中,我们选择了《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:英灵殿》、《无主之地》,国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。
另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。
《刺客信条:英灵殿》游戏测试
在游戏实测中可以看到影驰GeForce RTX 3070 Ti 星曜OC 永劫无间版和GeForce RTX 3070的帧数差距并不明显,差距不超过3帧。而对比GeForce RTX 3080的分数则相差较大。
《德军总部新血脉》游戏测试
《德军总部新血脉》并且由于自带两个benchmark,所以我们的数据取跑分均值,另外这款游戏几乎每更新一次驱动或者游戏版本升级都会导致分数的巨大差异,在本次重新测试中,不难发现在1080P分辨率下三款显卡差距并不大,其实在低分辨率下CPU已经限制了显卡的发挥,而在4K分辨率下GeForce RTX 3080能领先影驰GeForce RTX 3070 Ti 星曜OC 永劫无间版约21%的帧数。
《无主之地3》游戏测试
《无主之地3》是一款采用了卡通渲染风格的游戏,它对于性能要求的下限很低而上限又很高,并且这款游戏的跑分也很符合三款显卡的性能规律,其中影驰GeForce RTX 3070 Ti 星曜OC 永劫无间版在1080P分辨率下,相比GeForce RTX 3070成绩提升不大,但在高分辨率下提升明显。
《光明记忆:无限》游戏测试
《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,目前还没有游戏提供试玩,不过benchmark的跑分软件官方已经提供,玩家可以在steam上自行下载。
另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX 最高/DLSS 质量”模式下进行。
《边境》游戏测试
在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。
《孤岛惊魂5》游戏测试
《孤岛惊魂5》同样算是优化比较到位的3A大作,在这款游戏中CPU的瓶颈更加明显,1080P分辨率下影驰GeForce RTX 3070 Ti 星曜OC 永劫无间版与GeForce RTX 3080分数相同,在2K和4K分辨率下比较能反应真实水平。
功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。
功耗测试(点击查看大图)
影驰GeForce RTX 3070 Ti 星曜OC 永劫无间版经过我们的实测在满载状态下单卡功耗为310W左右,建议搭配750W及以上电源。
温度测试
温度方面,本次的影驰GeForce RTX 3070 Ti 星曜OC 永劫无间版经过40分钟左右的拷机,温度稳定为69℃左右,显存温度处正常水平,为82℃左右。
影驰的星曜系列终于发挥出真正的实力了,本次永劫无间定制化外观让原本朴素的一张显卡,瞬间充满游戏风格,也让纯白色的显卡看起来更丰满。对于喜欢《永劫无间》的玩家来说,倍感亲切。
当然,不足我认为还是有的。就是过于遵循原画设定了,显卡背板部分的宁红夜角色很好,但导流罩一侧的返魂花还是让人有些难以分辨,如果能够对整体的布局和比例进行改动(如果授权方允许的话),似乎会更有味道一些。
在性能上影驰GeForce RTX 3070 Ti 星曜OC 永劫无间版无需多言,在2K分辨率下几乎可以通吃任何游戏,即便是对配置要求苛刻的3A大作,对画面稍作降低也可以达到流畅标准。
售价方面,这款显卡的预售价为7699元,不过100元定金可抵200元,相当于7599元,属于目前显卡市场“正常”行情。
另外笔者发现影驰目前采用了类似实名制的限购措施,即在半年内,同一用户PIN/同一下单IP/同一下单手机号,限购1片。虽然并不能完全杜绝JS和矿工,但无疑加大了他们的采购难度,对于玩家来说,是真正的利好消息。
如果你是《永劫无间》的忠实玩家,这款影驰GeForce RTX 3070 Ti 星曜OC 永劫无间版一定不要错过,非常具有纪念意义。而如果你仅是需求显卡的话,这款定制版产品同样值得一抢,根据以往经验来看定制版产品通常限量,后续极有可能成为绝版,理财产品更加名副其实。
上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。
《赛博朋克2077》RTX ON(点击查看大图)
《赛博朋克2077》RTX OFF(点击查看大图)
在《赛博朋克2077》中,光追效果随处可见,而在游戏中也运用到了不同的光追效果,包括最常见的光追反射、阴影,还有环境光遮蔽、漫反射照明以及全局光照等比较高级的效果。
RTX ON(点击图片查看大图)
RTX OFF(点击图片查看大图)
在网游《逆水寒》中,由于光追效果正处于试验阶段,并没有如宣传片一样的水面反射。但画面整体的阴影更加真实,如头顶树木的阴影,以及水面上荷叶的效果。而且由于光追效果较少,在打开该功能后帧数并没有明显下降。
《堡垒之夜》RTX ON(点击查看大图)
《堡垒之夜》RTX OFF(点击查看大图)
堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。
《魔兽世界9.0》RTX ON(点击查看大图)
《魔兽世界9.0》RTX OFF(点击查看大图)
《魔兽世界9.0》同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。
《控制》RTX ON(点击查看大图)
《控制》RTX OFF(点击查看大图)
《控制》这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。
《赛博朋克2077》DLSS模式对比
DLSS的对比测试我们选择《赛博朋克2077》这款游戏,2K/RTX ON/DLSS关闭 原生画质下作为标准,在打开DLSS质量模式后可以看到整体画面几乎没有任何变化,广告牌的字样边缘依然很清晰。在DLSS平衡和DLSS性能模式中依然有着不错的状态,整体相较原生画质并无二致。
《逆水寒》DLSS模式对比
画质说明
在《逆水寒》的DLSS测试中,我们将画面设置为4K分辨率,画质为预设最高。通过关闭、快速、超级性能,3种不同模式来进行帧数以及画面的对比。
首先在关闭DLSS中,游戏帧数为26帧原生画质,打开DLSS快速模式后为41帧,而打开DLSS超级性能模式后为57帧。通过放大图片不难发现原生画质和DLSS快速模式的区别很小,而DLSS超级性能模式中角色背后的装饰会变模糊,以及木条箱的纹理边界会有较明显变化。但帧数提升却非常明显。
《永劫无间》DLSS模式对比
在《永劫无间》的DLSS对比中,原生画质大家可以注意角色发带的编制质感,每一根发丝边缘都较为清晰,同时肩部的服装花纹也有较为明显的凹凸感。在DLSS打开后,由于其工作原理就是缩放后,再由AI算法放大进行边缘重建,所以在质量模式中,发丝就会丢失部分细节,但如果不细看很难发现,同时发带的细节也保留的相当完好。
而在DLSS性能模式中,头发的质感则更差一些,并且发带的编织感有明显下降,另外腰间的配置边缘也会变模糊。最后在DLSS超级性能模式中,角色整体则会较糊,无论是头发还是服饰,所以如果不是非常追求高帧数的玩家,不建议开启DLSS超级性能模式。
好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家关注。
NVIDIA Reflex
以往我们关注延迟大多从显示器上了解到几毫秒极速响应,但那只是作为最终端的显示输出效果,你是否想过从系统内部到实际看到的画面有多大延迟?
NVIDIA Reflex
在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技术。
以往如果想测量系统延迟需要高速相机以及定制的LED鼠标电路。而使用带有NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张GeForce RTX系列的显卡即可。
宠物派对直播
这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的工作原理是利用AI算法通过DGX超级计算机深度学习而来。
NVENC编码
同时RTX 30系显卡拥有目前最好的硬件解码器,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%左右,而基于GPU的NVENC解码可以极大地减轻CPU负担。
NVIDIA Studio
对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着连接创作软件和显卡功能的关键。
NVIDIA Studio
NVIDIA Studio驱动经过更新与优化,对于最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用NVIDIA CUDA技术,GPU加速特效可实现更快的实时视频编辑并加速渲染输出,并让原本只能进行软件编码输出的视频轻松得到硬件的支持。另外在AI计算方面的优势,包括自动标记片段、特效追踪和人脸识别等功能,都有显著的速度提升。
以GPU渲染为14.98秒 而CPU渲染为11分钟
当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Blender、D5等专业软件中都有非常亮眼的表现。不仅能提供强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。